Shell脚本学习:快速理解正则表达式之grep篇

2014-11-24 09:50:14 · 作者: · 浏览: 1

shell脚本是Linux的核心之一,而正则表达式是shell脚本的核心之一,理解正则表达式可以快速匹配需要查找的内容,对以后的shell脚本编程打下一个坚实的基础。


接触正则表达式一般从grep命令开始,例如:


grep "^#[:space:]*" /etc/inittab


这个命令中“^#[:space:]*”就是正则表达式的内容,它的意思是“以#开头后跟任意个空格”,结合grep命令,就是显示/etc/inittab文件里“以#开头后跟任意个空格”的内容。


grep命令的作用是查找匹配的内容并打印出来


grep [option] 正则表达式 要查抄的文件


-i 不区分大小写


-color 以高亮显示匹配的文本内容


-E 使用扩展的元字符


-v 取反


那么正则表达式分有哪些?


——————————————————————


在shell里,正则表达式分为,标准元字符、扩展元字符


标准元字符: ^ $ . * [] [x-y] [^] \ \< \> \(...)\ x\{m\n}


扩展元字符: ^ $ . * [] [^] + a|b ()


#可在上面的链接里查到各自的意思


另外一个重要的知识:posix方括号字符集


[:alnum:] [:lower:] [:xdigit:]


[:alpha:] [:print:] [:blank:]


[:blank:] [:punct:]


[:cntrl:] [:space:]


[:graph:] [::upper:]


上面的例子grep "^#[:space:]*" /etc/inittab 里[:space:]代表空白字符,posix字符集和正则表达式配合使用可以产生很强大的功能,许多时候我们都可以借助它来实现自己的目的。


例如:显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行


grep "^[[:space:]]\{1,\}" /boot/grub/grub.conf


这个命令里注意 ^和[]的使用,通常^[]用来匹配开头是某个字符,^[[:space:]]因为要求匹配的是开头是空白字符,所以用[[:space:]]而不是[:space:],如果错误的写成^[:space:]那么就锚定[]里的内容,现在知道[]的作用了吧:锚定某个字符,多个代表多个可能


下面几个难度稍高一点的练习来学习理解正则表达式


1.显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
2.ifconfig命令可以显示当前主机的IP地址相关的信息等,如果使用grep等文本处理命令取出本机的各IP地址,要求不包括127.0.0.1;
3.显示/etc/sysconfig/network-scripts/ifcfg-eth0文件中的包含了类似IP地址点分十进制数字格式的行;


##答案:


1. grep "^\([0-9]\).*\1$" /etc/inittab


2. ifcofig | grep "inet addr" | grep -v '127.0.0.1' | cut -d: -f2 | cut -d "" f1


3. grep -E "([0-9]{1,3}\.){3}\.[0-9]{1,3}" /etc/sysconfig/network-scripts/ifcfg-eth0


grep "[0-9]\{1,3\}\.\"{3\}\.[0-9]\{1,3\} /etc/sysconfig/network-scripts/ifcfg-eth0


##解析


1. ^[0-9]锚定开头的数字 使用\(...\) \1 将^[0-9]传递给\1 $用来锚定结尾


2. 首先grep提出去含有inet addr的内容,-v取出‘127.0.0.1’使用cut命令 -d 来截取第一个字段


3. 使用-E解法 ([0-9])\{1,3} [0-9]的数字至少出现1次,至多出现3次 \. 转义 . 符号 {3} 显示三次前面()的内容\.[0-9]{1,3}匹配后面的3位数字


##grep解法可以自己琢磨下