未加星标

正则表达式教程之子表达式用法分析

字体大小 | |
[开发(php) 所属分类 开发(php) | 发布者 店小二05 | 时间 | 作者 红领巾 ] 0人收藏点击收藏

本文实例讲述了正则表达式教程之子表达式用法。分享给大家供大家参考,具体如下:

注:在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过。

一、问题引入

首先来看一个例子,有的短语如windows 2000虽然是多个单词组成,但其实是一个整体,HTML页面中可以使用非换行空格( 即non-breaking space)让它在浏览器中显示在一行上,现在来匹配多个这样的空格:

文本:Your operation systemis Windows   2000.

正则表达式:nbsp;{2,}

结果:Your operation systemis Windows   2000.

分析:这里使用模式想匹配2个或2个以上的非换行空格,但是从结果可以看出,没有匹配到任何东西,因为nbsp;{2,}这个模式只能匹配到像nbsp;;;;;;;这样以nbsp开头,2个或2个以上连续分号的文本。

因为前面说过的重复匹配都是紧挨着重复匹配元字符之前的那个字符的多次重复,但是,如果我们想对一个字符串进行多次匹配,又该怎么做呢?

二、子表达式

从上面我们引出子表达式。子表达式是一个大的表达式的一部分,把一个表达式划分为多个子表达式的目的是为了把那些子表达式当作一个独立的元素来使用。子表达式必须用(和)括起来。所以,前面的例子中正则表达式应该写成(nbsp;){2,}。

来看一个匹配有效年份的正则:

文本:1988-11-13

正则表达式:(19|20)\d{2}

结果:【1988】-11-13

分析:这个例子中,为了排除没有意义的年份,把年份的前两位数字限定为19或20,|是正则表达式里的或操作符。这里必须把19|20放到一个子表达式里,即(19|20),否则只能匹配到以20开头的年份,

三、子表达式的嵌套

子表达式允许嵌套,而且允许多层嵌套,嵌套层次在理论上没有限制。

在表达式 ((A)(B(C))) 中,存在以下几个子表达式:

1   ((A)(B(C)))

2   (A)

3   (B(C))

4   (C)

共4个,第0个始终代表整个表达式。在后面的回溯引用中会介绍到通过\n(n是子表式的编号)来引用子表达式。

子表达式嵌套的例子可参看后面匹配IPV4地址的正则表达式。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

javascript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家正则表达式学习有所帮助。

本文开发(php)相关术语:php代码审计工具 php开发工程师 移动开发者大会 移动互联网开发 web开发工程师 软件开发流程 软件开发工程师

主题: WindowsJavaScriptHTMLJava浏览器其实
分页:12
转载请注明
本文标题:正则表达式教程之子表达式用法分析
本站链接:http://www.codesec.net/view/523638.html
分享请点击:


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 开发(php) | 评论(0) | 阅读(55)