Rss订阅

首页 »编程综合 » 正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐 »正文

正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐

来源: 发布时间:星期一, 2009年11月30日浏览:0次评论:0

正则表达式可以:
•测试

串

某个模式

例如

可以对

个输入

串进行测试

看在该

串是否存在

个电话号码模式或

个信用卡号码模式

这称为数据有效性验证
•替换文本

可以在文档中使用

个正则表达式来标识特定文字

然后可以全部将其删除

或者替换为别

文字
•根据模式匹配从

串中提取

个子

串

可以用来在文本或输入字段中查找特定文字
正则表达式语法

个正则表达式就是由普通

(例如

a 到 z)以及特殊

(称为元

)组成

文字模式

该模式描述在查找文字主体时待匹配

个或多个

串

正则表达式作为

个模板

将某个

模式和所搜索

串进行匹配

创建正则表达式
Js代码
复制代码代码如下:

var re =

RegExp

;//RegExp是

个对象,和A

.gif' />

样
//但这样没有任何效果,需要将正则表达式

内容作为

串传递进去
re =

RegExp("a");//最简单

正则表达式,将匹配字母a
re=

RegExp("a","i");//第 2个参数,表示匹配时不分大小写

RegExp构造

第

个参数为正则表达式

文本内容,而第

个参数则为可选项标志.标志可以组合使用
•g (全文查找)
•i (忽略大小写)
•m (多行查找)
Js代码
复制代码代码如下:

var re =

RegExp("a","gi");//匹配所有

a或A

正则表达式还有另

种正则表达式字面量

声明方式
Js代码
复制代码代码如下:

var re = /a/gi;

和正则表达式相关思路方法和属性
正则表达式对象

思路方法
•test,返回

个 Boolean 值

它指出在被查找

串中是否存在模式

如果存在则返回 true

否则就返回 false

•exec,用正则表达式模式在

串中运行查找

并返回包<script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/themes/advanced/langs/zh.js"></script><script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js"></script>含该查找结果

个

•compile,把正则表达式编译为内部格式

从而执行得更快

正则表达式对象

属性
•source,返回正则表达式模式

文本

复本

只读

•lastIndex,返回

位置

它是被查找

串中下

次成功匹配

开始位置

•$1...$9,返回 9个在模式匹配期间找到

、最近保存

部分

只读

•input ($_),返回执行规范标准表述查找

串

只读

•lastMatch ($&),返回任何正则表达式搜索过程中

最后匹配

只读

•lastParen ($+),如果有

话

返回任何正则表达式查找过程中最后括

子匹配

只读

•leftContext ($`),返回被查找

串中从

串开始位置到最后匹配的前

位置的间

只读

•rightContext ($'),返回被搜索

串中从最后

个匹配位置开始到

串结尾的间

只读

String对象

些和正则表达式相关

思路方法
•match,找到

个或多个正则表达式

匹配

•replace,替换和正则表达式匹配

子串

•search,检索和正则表达式相匹配

值

•split,把

串分割为

串

测试正则表达式是如何工作

!
复制代码代码如下:

//test思路方法,测试

串,符合模式时返回true,否则返回false
var re = /he/;//最简单

正则表达式,将匹配he这个单词
var str = "he";
alert(re.test(str));//true
str = "we";
alert(re.test(str));//false
str = "HE";
alert(re.test(str));//false,大写,如果要大小写都匹配可以指定i标志(i是ignoreCase或

-insensitive

表示)
re = /he/i;
alert(re.test(str));//true
str = "Certainly!He loves her!";
alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它

,则可使用^和$
re = /^he/i;//脱

(^)代表

开始位置
alert(re.test(str));//false,

he不在str最开始
str = "He is a good boy!";
alert(re.test(str));//true,He是

开始位置,还需要使用$
re = /^he$/i;//$表示

结束位置
alert(re.test(str));//false
str = "He";
alert(re.test(str));//true
//当然,这样不能发现正则表达式有多强大,

我们完全可以在上面

例子中使用

或indexOf
re = /\s/;// \s匹配任何空白

包括空格、制表符、换页符等等
str= "user Name";//用户名包含空格
alert(re.test(str));//true
str = "user Name";//用户名包含制表符
alert(re.test(str));//true
re=/^[a-z]/i;//

匹配指定范围内

任意

,这里将匹配英文字母,不区分大小写
str="variableName";//变量名必须以字母开头
alert(re.test(str));//true
str="123abc";
alert(re.test(str));//false

当然,仅仅知道了

串是否匹配模式还不够,我们还需要知道哪些

匹配了模式
复制代码代码如下:

var osVersion = "Ubuntu 8";//其中

8表示系统主版本号
var re = /^[a-z]+\s+\d+$/i; //+号表示

至少要出现1次,\s表示空白

,\d表示

个数字
alert(re.test(osVersion));//true,但我们想知道主版本号
//另

个思路方法exec,返回

个

第

个元素为完整

匹配内容
re=/^[a-z]+\s+\d+$/i;
arr = re.exec(osVersion);
alert(arr[0]);//将osVersion完整输出,

整个

串刚好匹配re
//我只需要取出数字
re=/\d+/;
var arr = re.exec(osVersion);
alert(arr[0]);//8

更复杂

使用方法,使用子匹配
复制代码代码如下:

//exec返回

第1到n元素中包含

是匹配中出现

任意

个子匹配
re=/^[a-z]+\s+(\d+)$/i;//用

来创建子匹配
arr =re.exec(osVersion);
alert(arr[0]);//整个osVersion,也就是正则表达式

完整匹配
alert(arr[1]);//8,第

个子匹配,事实也可以这样取出主版本号
alert(arr.length);//2
osVersion = "Ubuntu 8.10";//取出主版本号和次版本号
re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是正则表达式元

的

,若要用它

字面意义须转义
arr = re.exec(osVersion);
alert(arr[0]);//完整

osVersion
alert(arr[1]);//8
alert(arr[2]);//10

注意,当

串不匹配re时,exec思路方法将返回null
String对象

些和正则表达式有关

思路方法
点击运行可以看到效果:

//replace思路方法,用于替换<img src='/icons/3014zifu.gif' />串 
var str ="some money"; 
alert(str.replace("some","much"));//much money 
//replace<img src='/icons/3014de.gif' />第<img src='/icons/3014yi.gif' />个参数可以为正则表达式 
var re = /\s/;//空白<img src='/icons/3014zifu.gif' /> 
alert(str.replace(re,"%"));//some%money 
//在不知道<img src='/icons/3014zifu.gif' />串中有多少空白<img src='/icons/3014zifu.gif' />时,正则表达式极为方便 
str ="some some \tsome\t\f"; 
re = /\s+/; 
alert(str.replace(re,"#"));//但这样只会将第<img src='/icons/3014yi.gif' />次出现<img src='/icons/3014de.gif' /><img src='/icons/3014yi.gif' />堆空白<img src='/icons/3014zifu.gif' />替换掉 
//<img src='/icons/3014yinwei.gif' /><img src='/icons/3014yi.gif' />个正则表达式只能进行<img src='/icons/3014yi.gif' />次匹配,\s+匹配了第<img src='/icons/3014yi.gif' />个空格后就退出了 
re = /\s+/g;//g,全局标志,将使正则表达式匹配整个<img src='/icons/3014zifu.gif' />串 
alert(str.replace(re,"@"));//some@some@some@ 
//另<img src='/icons/3014yi.gif' />个和的相似<img src='/icons/3014de.gif' />是split 
var str = "a-bd-c"; 
var arr = str.split("-");//返回["a","bd","c"] 
//如果str是用户输入<img src='/icons/3014de.gif' />,他可能输入a-bd-c也可能输入a bd c或a_bd_c,但不会是abdc(这样就说他输错了) 
str = "a_db-c";//用户以他喜欢<img src='/icons/3014de.gif' />方式加分隔符s 
re=/[^a-z]/i;//前面我们说^表示<img src='/icons/3014zifu.gif' />开始,但在<img src='/icons/3014zhk2.gif' />里它表示<img src='/icons/3014yi.gif' />个负<img src='/icons/3014zifu.gif' />集 
//匹配任何不在指定范围内<img src='/icons/3014de.gif' />任意<img src='/icons/3014zifu.gif' />,这里将匹配除字母处<img src='/icons/3014de.gif' />所有<img src='/icons/3014zifu.gif' /> 
arr = str.split(re);//仍返回["a","bd","c"]; 
//在<img src='/icons/3014zifu.gif' />串中查找时我们常用indexOf,和的对应用于正则查找<img src='/icons/3014de.gif' />思路方法是search 
str = "My age is 18.Golden age!";//年龄不是<img src='/icons/3014yi.gif' />定<img src='/icons/3014de.gif' />,我们用indexOf不能查找它<img src='/icons/3014de.gif' />位置 
re = /\d+/; 
alert(str.search(re));//返回查找到<img src='/icons/3014de.gif' /><img src='/icons/3014zifu.gif' />串开始下标10 
//注意,<img src='/icons/3014yinwei.gif' />查找本身就是出现第<img src='/icons/3014yi.gif' />次就立即返回,所以无需在search时使用g标志 
//下面<img src='/icons/3014de.gif' />代码虽然不出错,但g标志是多余<img src='/icons/3014de.gif' /> 
re=/\d+/g; 
alert(str.search(re));//仍然是10

[Ctrl+A 全选提示:你可先修改部分代码,再按运行]

注意,当search思路方法没有找到匹配时,将返回-1
类似于exec思路方法,String对象

match思路方法也用于将

串和正则表达式进行匹配并返回结果

复制代码代码如下:

var str = "My name is CJ.Hello everyone!";
var re = /[A-Z]/;//匹配所有大写字母
var arr = str.match(re);//返回

alert(arr);//

中只会包含

个M,

我们没有使用全局匹配
re = /[A-Z]/g;
arr = str.match(re);
alert(arr);//M,C,J,H
//从

串中抽取单词
re = /\b[a-z]\b/i;//\b表示单词边界
str = "one two three four";
alert(str.match(re));//one,two,three,four

RegExp对象例子

些属性
Js代码
复制代码代码如下:

var re = /[a-z]/i;
alert(re.source);//将[a-z]

串输出
//请注意,直接alert(re)会将正则表达式连同前向斜线和标志输出,这是re.toString思路方法定义

每个RegExp对象

例子具有lastIndex属性,它是被查找

串中下

次成功匹配

开始位置,默认值是-1

lastIndex 属性被 RegExp 对象

exec 和 test 思路方法修改.并且它是可写

.
复制代码代码如下:

var re = /[A-Z]/;
//exec思路方法执行后,修改了re

lastIndex属性,
var str = "Hello,World!!!";
var arr = re.exec(str);
alert(re.lastIndex);//0,

没有设置全局标志
re = /[A-Z]/g;
arr = re.exec(str);
alert(re.lastIndex);//1
arr = re.exec(str);
alert(re.lastIndex);//7

当匹配失败(后面没有匹配)

或lastIndex值大于

串长度时

再执行exec等思路方法会将lastIndex设为0(开始位置)
复制代码代码如下:

var re = /[A-Z]/;
var str = "Hello,World!!!";
re.lastIndex = 120;
var arr = re.exec(str);
alert(re.lastIndex);//0

RegExp对象

静态属性
复制代码代码如下:

//input 最后用于匹配

串(传递给test,exec思路方法

串)
var re = /[A-Z]/;
var str = "Hello,World!!!";
var arr = re.exec(str);
alert(RegExp.input);//Hello,World!!!
re.exec("tempstr");
alert(RegExp.input);//仍然是Hello,World!!!,

tempstr不匹配
//lastMatch 最后匹配

re = /[a-z]/g;
str = "hi";
re.test(str);
alert(RegExp.lastMatch);//h
re.test(str);
alert(RegExp["$&"]);//i ,$&是lastMatch

短名字

但由于它不是合法变量名

所以要

//lastParen 最后匹配

分组
re = /[a-z](\d+)/gi;
str = "Class1 Class2 Class3";
re.test(str);
alert(RegExp.lastParen);//1
re.test(str);
alert(RegExp["$+"]);//2
//leftContext 返回被查找

串中从

串开始位置到最后匹配的前

位置的间

//rigthContext 返回被搜索

串中从最后

个匹配位置开始到

串结尾的间

re = /[A-Z]/g;
str = "123ABC456";
re.test(str);
alert(RegExp.leftContext);//123
alert(RegExp.rightContext);//BC456
re.test(str);
alert(RegExp["$`"]);//123A
alert(RegExp["$'"]);//C456

multiline属性返回正则表达式是否使用多行模式,这个属性不针对某个正则表达式例子

而是针对所有正则表达式

并且这个属性可写.(IE和Opera不支持这个属性)
复制代码代码如下:

alert(RegExp.multiline);
//

Opera不支持这个属性

所以最好还是单独指定
var re = /\w+/m;
alert(re.multiline);
alert(RegExp["$*"]);//RegExp对象

静态属性不会

给RegExp某个对象例子指定了m标志而改变
RegExp.multiline = true;//这将打开所有正则表达式例子

多行匹配模式
alert(RegExp.multiline);

使用元

注意事项:元

是正则表达式

部分

当我们要匹配正则表达式本身时

必须对这些元

转义.下面是正则表达式用到

所有元

( [ { \ ^ $ | ) ? * + .
复制代码代码如下:

var str = "?";
var re = /?/;
alert(re.test(str));//出错

？是元

必须转义
re = /\?/;
alert(re.test(str));//true

使用RegExp构造

和使用正则表达式字面量创建正则表达式注意点
复制代码代码如下:

var str = "\?";
alert(str);//只会输出?
var re = /\?/;//将匹配?
alert(re.test(str));//true
re =

RegExp("\?");//出错,

这相当于re = /\?/
re =

RegExp("\\?");//正确

将匹配？
alert(re.test(str));//true

既然双重转义这么不友好

所以还是用正则表达式字面量

声明方式
如何在正则表达式中使用特殊

？
复制代码代码如下:

//ASCII方式用十 6进制数来表示特殊

var re = /^\x43\x4A$/;//将匹配CJ
alert(re.test("CJ"));//true
//也可使用 8进制方式
re = /^\103\112$/;//将匹配CJ
alert(re.test("CJ"));//true
//还可以使用Unicode编码
re =/^\u0043\u004A$/;//使用 Unicode

必须使用u开头

接着是

编码

4位16进制表现形式
alert(re.test("CJ"));

另处

还有

些其它

预定义特殊

如下表所示:

描述
\n 换行符
\r 回车符
\t 制表符
\f 换页符(Tab)
\cX 和X对应

控制

\b 退格符(BackSpace)
\v 垂直制表符
\0 空

("")

类 ---〉简单类

反向类

范围类

组合类

预定义类
复制代码代码如下:

//简单类
var re = /[abc123]/;//将匹配abc123这6个

中

个
//负向类
re = /[^abc]/;//将匹配除abc的外

个

//范围类
re = /[a-b]/;//将匹配小写a-b 26个字母
re = /[^0-9]/;//将匹配除0-9 10个

的处

个

//组合类
re = /[a-b0-9A-Z_]/;//将匹配字母

数字和下划线

下面是正则表达式中

预定义类
代码等同于匹配
. IE下[^\n]

其它[^\n\r] 匹配除换行符的外

任何

个

\d [0-9] 匹配数字
\D [^0-9] 匹配非数字

\s [ \n\r\t\f\x0B] 匹配

个空白

\S [^ \n\r\t\f\x0B] 匹配

个非空白

\w [a-zA-Z0-9_] 匹配字母数字和下划线
\W [^a-zA-Z0-9_] 匹配除字母数字下划线的外

量词(下表量词单个出现时皆是贪婪量词)
代码描述
* 匹配前面

子表达式零次或多次

例如

zo* 能匹配 "z" 以及 "zoo"

* 等价于{0,}

+ 匹配前面

子表达式

次或多次

例如

'zo+' 能匹配 "zo" 以及 "zoo"

但不能匹配 "z"

+ 等价于 {1,}

? 匹配前面

子表达式零次或

次

例如

"do(es)?" 可以匹配 "do" 或 "does" 中

"do"

? 等价于 {0,1}

{n} n 是

个非负整数

匹配确定

n 次

例如

'o{2}' 不能匹配 "Bob" 中

'o'

但是能匹配 "food" 中

两个 o

{n,} n 是

个非负整数

至少匹配n 次

例如

'o{2,}' 不能匹配 "Bob" 中

'o'

但能匹配 "foooood" 中

所有 o

'o{1,}' 等价于 'o+'

'o{0,}' 则等价于 'o*'

{n,m} m 和 n 均为非负整数

其中n <= m

最少匹配 n 次且最多匹配 m 次

刘

"o{1,3}" 将匹配 "fooooood" 中

前 3个 o

'o{0,1}' 等价于 'o?'

请注意在逗号和两个数的间不能有空格

贪婪量词和惰性量词
•用贪婪量词进行匹配时

它首先会将整会

串当成

个匹配

如果匹配

话就退出

如果不匹配

就截去最后

个

进行匹配

如果不匹配

继续将最后

个

截去进行匹配

直到有匹配为止

直到现在我们遇到

量词都是贪婪量词
•用贪婪量词进行匹配时

它首先将第

个

当成

个匹配

如果成功则退出

如果失败

则测试前两个

依些增加

直到遇到合适

匹配为止
惰性量词仅仅在贪婪量词后面加个"?"而已,如"a+"是贪婪匹配

,"a+?"则是惰性

复制代码代码如下:

var str = "abc";
var re = /\w+/;//将匹配abc
re = /\w+?/;//将匹配a

多行模式
复制代码代码如下:

var re = /[a-z]$/;
var str = "ab\ncdef";
alert(str.replace(re,"#"));//ab\ncde#
re =/[a-z]$/m;
alert(str.replace(re,"#"));//a#\ncde#

分组和非捕获性分组
复制代码代码如下:

re = /abc{2}/;//将匹配abcc
re = /(abc){2}/;//将匹配abcabc
//上面

分组都是捕获性分组
str = "abcabc ###";
arr = re.exec(str);
alert(arr[1]);//abc
//非捕获性分组 (?:)
re = /(?:abc){2}/;
arr = re.exec(str);
alert(arr[1]);//un

d

候选(也就是所说

“或”)
复制代码代码如下:

re = /^a|bc$/;//将匹配开始位置

a或结束位置

bc
str ="add";
alert(re.test(str));//true
re = /^(a|bc)$/;//将匹配a或bc
str ="bc";
alert(re.test(str));//true

当包含分组

正则表达式进行过test,match,search这些思路方法的后

每个分组都被放在

个特殊

地方以备将来使用

这些存储是分组中

特殊值

我们称的为反向引用
复制代码代码如下:

var re = /(A?(B?(C?)))/;
/*上面

正则表达式将依次产生 3个分组
(A?(B?(C?))) 最外面

(B?(C?))
(C?)*/
str = "ABC";
re.test(str);//反向引用被存储在RegExp对象

静态属性$1—$9中
alert(RegExp.$1+"\n"+RegExp.$2+"\n"+RegExp.$3);
//反向引用也可以在正则表达式中使用\1 ,\2...这类

形式使用
re = /\d+(\D)\d+\1\d+/;
str = "2008-1-1";
alert(re.test(str));//true
str = "2008-4_3";
alert(re.test(str));//false

使用反向引用可以要求

串中某几个位置上

必须相同.另外

在replace这类思路方法中可用特殊

序列来表示反向引用
Js代码
复制代码代码如下:

re = /(\d)\s(\d)/;
str = "1234 5678";
alert(str.replace(re,"$2 $1"));//在这个里面$1表示第

个分组1234,$2则表示5678

其它——〉正向前瞻,用来捕获出现在特定

的前

,只有当

后面跟着某个特定

才去捕获它

和正向前瞻对应

有负向前瞻

它用匹配只有当

后面不跟着某个特定

时才去匹配它

在执行前瞻和负向前瞻的类

运算时

正则表达式引擎会留意

串后面

部分

然而却不移动index
复制代码代码如下:

//正向前瞻
re = /([a-z]+(?=\d))/i;
//我们要匹配后面跟

个数字

单词

然后将单词返回

而不要返回数字
str = "abc every1 abc";
alert(re.test(str));//true
alert(RegExp.$1);//every
alert(re.lastIndex);//使用前瞻

好处是,前瞻

内容(?=\d)并不会当成

次匹配

下次匹配仍从它开始
//负向前瞻(?!)
re = /([a-z](?!\d))/;i
//将匹配后面不包含数字

字母,并且不会返回(?!\d)中

内容
str = "abc1 _disibledevent=>正则表达式

电子邮箱地址有效性要求(我们姑且这样定义):用户名只能包含字母数字以及下划线

最少

位

最多25位

用户名后面紧跟@

后面是域名

域名名称要求只能包含字母数字和减号(-)

并且不能以减号开头或结尾

然后后面是域名后缀(可以有多个)

域名后缀必须是点号连上2-4位英文字母
复制代码代码如下:

var re = /^\w{1,15}(?:@(?!-))(?:(?:[a-z0-9-]*)(?:[a-z0-9](?!-))(?:\.(?!-)))+[a-z]{2,4}$/;

好像漏了些,比如,replace思路方法第 2个参数作为

情况
恰巧上次在某君博客里看到

个面试题,读取

个文本文件中

串,统计其中

"9"出现

次数,用JS写个也很简单(不包含打开文件

代码,打开文件可以用ActiveXObject等浏览器提供

对象弄)
复制代码代码如下:

var str="ADF9DF9DF9",//那个文本文件中

串;
re=/9/gi,//匹配9
counter=0;//计数器
str.replace(re,function

{
counter

;//每出现

次匹配,

就被执行

次,

返回值用来替换原值

"#";
});
//最后str 变成 ADF#DF#DF#"

至于传递给replace思路方法

接收

参数....楼下继续
你说

那个问题:
$&是lastMatch

短名字
还有,不知道为什么你

正则表达式中没有对{}两个特殊

转义
提到JS

兼容性问题,这里要提

是RegExp对象例子

compile 思路方法
compile思路方法用来将正则表达式编译为内部格式以使其执行

更快
Js代码
复制代码代码如下:

var re =

RegExp

;
re.compile("[0-9]\\n");//注意要对斜杠多转义

次,compile思路方法返回值为re这个对象(编译后

)

但经测试,这个思路方法在Safari及Chrome类似

浏览器,compile思路方法始终返回un

d,不可用

标签：正则表达式数字

下载文章的 PDF文档电子版离线看

我顶

专注于互联网--专注于架构

首页 »编程综合 » 正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐 »正文

正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章

专注于互联网--专注于架构

首页 »编程综合 » 正则表达式数字:精通 JavaScript中的正则表达式手机整理 推荐 »正文

正则表达式数字:精通 JavaScript中的正则表达式手机整理 推荐

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章

首页 »编程综合 » 正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐 »正文

正则表达式数字:精通 JavaScript中的正则表达式手机整理推荐