未加星标

详解Linux中正则表达式的应用

字体大小 | |
[开发(php) 所属分类 开发(php) | 发布者 店小二05 | 时间 | 作者 红领巾 ] 0人收藏点击收藏
1、组成
普通字符:普通字符串,没有特殊含义
特殊字符:在正则表达式中具有特殊的含义
正则表达式中常见的meta字符【特殊字符】
2、POSIX BRE【基本】与ERE【扩展】中都有的meta字符
\ :通常用于打开或关闭后续字符的特殊含义,如(...)【\是转义字符,去掉符号的特殊意义,()、{}等在shell中都有特殊的意义】
.和以及.的区别:
[[email protected] ~]# cat -n test.txt
     1  gd
     2  god
     3
     4  good
     5  goood
     6  goad
     7
     8  gboad

2.1、. :匹配任意单个字符(除null,即不能为空)

[[email protected] ~]# grep -n "." test.txt      
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
[[email protected] ~]# grep -n "go.d" test.txt
4:good
6:goad

2.2、 :匹配其前字符任意次,如o,可以是没有o或者一个o,也可以是多个o

[[email protected] ~]# grep -n "*" test.txt
[[email protected] ~]# grep -n "o*" test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
[[email protected] ~]# echo "gbad" >>test.txt
[[email protected] ~]# echo "pbad" >>test.txt
[[email protected] ~]# echo "kgbad" >>test.txt
[[email protected] ~]# echo "poad" >>test.txt  
[[email protected] ~]# grep -n "go*" test.txt 【o可以没有,o前面的g一定要匹配】
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
9:gbad
11:kgbad

*2.3、. :匹配任意字符(匹配所有),可以为空**

[[email protected] ~]# grep -n ".*" test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
9:gbad
10:pbad
11:kgbad
12:poad
[[email protected] ~]# grep -n "go.*" test.txt
2:god
4:good
5:goood
6:goad
[[email protected] ~]# grep -n "po.*" test.txt 
12:poad
[[email protected] ~]# echo "pgoad" >>test.txt   
[[email protected] ~]# grep -n "go.*" test.txt  【匹配go后存在任意字符,可为空】
2:god
4:good
5:goood
6:goad
13:pgoad
[[email protected] ~]#
[[email protected] ~]# grep -n "o.*" test.txt 
2:god
4:good
5:goood
6:goad
8:gboad
12:poad

2.4、^ :匹配紧接着后面的正则表达式,以...为开头

[[email protected] tmp]# grep "^root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
[[email protected] tmp]#
2.5、$ :匹配紧接着前面的正则表达式,以...结尾
[[email protected] tmp]# grep "bash$" /etc/passwd | head -1
root:x:0:0:root:/root:/bin/bash
[[email protected] tmp]#
^$:表示是空行的意思
“#|^$”:匹配以#号开头的注释行和空行
2.6、[] :匹配方括号里的任一字符
(如[sS],匹配s或匹配S),其中可用连字符(-)指定连字符的范围(如[(0-9)],匹配0-9任一字符);[^0-9]如果^符号出现在方括号的第一个位置,则表示匹配不在列表中的任一字符。
[[email protected] tmp]# cat hosts
192.168.200.1
192.168.200.3
a.b.123.5
23.c.56.1
1456.1.2.4
12.4.5.6.8
[[email protected] tmp]# grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' hosts  
192.168.200.1
192.168.200.3
1456.1.2.4
12.4.5.6.8
[[email protected] tmp]# grep -E '^([0-9]{1,3}\.){3}[0-9]{1,3}$' hosts
192.168.200.1
192.168.200.3
[[email protected] tmp]#

2.7、? :匹配前面字符的零次或多次

[[email protected] ~]# grep -E "go?d" test.txt  
gd
god
[[email protected] ~]#
[[email protected] tmp]# cat test
do
does
doxy
[[email protected] tmp]# grep -E "do(es)?" test
do
does
doxy
[[email protected] tmp]#
3、POSIX BRE(基本正则)中才有的字符
{n,m} :区间表达式,匹配在它前面的单个字符重现【重复,紧接着的单个字符如https{0,1},即重复s 0-1次。{n}指匹配n次;{n,m}指匹配n至m次,{n,}指匹配至少n次,{,m}匹配至多m次。【\转义字符】
4、POSIX ERE(扩展正则)中才有的字符

4.1、{n,m} :与BRE的{n,m}功能相同

[[email protected] tmp]# grep -E '^([0-9]{1,3}\.){3}[0-9]{1,3}$' hosts
192.168.200.1
192.168.200.3

4.2、+ :匹配前面正则表达式的一次或多次

[[email protected] ~]# egrep "go+d" test.txt
god
good
goood
[[email protected] ~]#
4.3、| :表示匹配多个字符串【或的关系】
[[email protected] ~]# grep -E "3306|1521" /etc/services
mysql           3306/tcp                        # MySQL
mysql           3306/udp                        # MySQL
ncube-lm        1521/tcp                # nCube License Manager
ncube-lm        1521/udp                # nCube License Manager
[[email protected] ~]#

4.4、( ) :分组过滤,后向引用

分组过滤   
[[email protected] ~]# echo "glad" >> test.txt
[[email protected] ~]# egrep "(la|oo)" test.txt
good
goood
glad
()后向引用;当前面匹配部分用小括号的时候,第一个括号的内容可以在后面部分用\1输出;以此类推。
 [[email protected] tmp]# ifconfig |sed -rn 's#.*addr:(.*)(B.*)$#\1#gp'
192.168.4.27 
5、正则表达式的元字符

5.1、\b :匹配一个单词边界

[[email protected] tmp]# cat test       
do
does
doxy
agdoeg
[[email protected] tmp]# grep "do\b" test
do
[[email protected] tmp]# grep "\bdo" test       
do
does
doxy
[[email protected] tmp]# grep "\bdoes" test         
does
[[email protected] tmp]# grep "\bdo\b" test 
do
[[email protected] tmp]#

5.2、\B :匹配非单词边界,与\b相反

[[email protected] tmp]# grep "do\B" test   
does
doxy
agdoeg
[[email protected] tmp]# grep "do\b" test
do
[[email protected] tmp]#
5.3、\d :匹配一个数字字符,等价于[0-9]
5.4、\D :匹配一个非数字字符,等价于[^0-9]
5.5、\w :匹配字母、数字、下划线,等价于[A-Za-z0-9_]

还有很多元字符,这里就不一一罗列出来

案例:开机精简
[[email protected] ~]# chkconfig --list| egrep -v "crond|network|rsyslog|sshd|sysstat" | awk '{print "chkconfig",$1,"off"}'|bash
您可能感兴趣的文章:linux 正则表达式详解linux grep正则表达式与grep用法详解linux 正则表达式深度解析linux正则表达式awk详解使用Linux正则表达式灵活搜索文件中的文本linux下的通配符与正则表达式linux shell 路径截取正则表达式浅谈Linux grep与正则表达式linux shell 正则表达式(BREs,EREs,PREs)差异比较

本文开发(php)相关术语:php代码审计工具 php开发工程师 移动开发者大会 移动互联网开发 web开发工程师 软件开发流程 软件开发工程师

主题: LinuxSQLMySQL
分页:12
转载请注明
本文标题:详解Linux中正则表达式的应用
本站链接:http://www.codesec.net/view/577058.html
分享请点击:


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 开发(php) | 评论(0) | 阅读(108)