JavaScript中常用的正则表达式日常整理(全)

时间：2021-05-26

//校验是否全由数字组成

function isDigit(s) { var patrn=/^[0-9]{1,20}$/; if (!patrn.exec(s)) return false return true }

匹配中文字符的正则表达式： [u4e00-u9fa5]

评注：匹配中文还真是个头疼的事，有了这个表达式就好办了

匹配双字节字符(包括汉字在内)：[^x00-xff]

评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

匹配空白行的正则表达式：ns*r

评注：可以用来删除空白行

匹配HTML标记的正则表达式：< (S*?)[^>]*>.*?|< .*? />

评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式：^s*|s*$

评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

评注：表单验证时很实用

匹配网址URL的正则表达式：[a-zA-z]+://[^s]*

评注：网上流传的版本功能很有限，上面这个基本可以满足需求

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$

评注：表单验证时很实用

匹配国内电话号码：d{3}-d{8}|d{4}-d{7}

评注：匹配形式如 0511-4405222 或 021-87888822

匹配腾讯QQ号：[1-9][0-9]{4,}

评注：腾讯QQ号从10000开始

匹配中国邮政编码：[1-9]d{5}(?!d)

评注：中国邮政编码为6位数字

匹配身份证：d{15}|d{18}

评注：中国的身份证为15位或18位

匹配ip地址：d+.d+.d+.d+

评注：提取ip地址时有用

匹配特定数字：

^[1-9]d*$　　 //匹配正整数
^-[1-9]d*$ 　 //匹配负整数
^-?[1-9]d*$　　 //匹配整数
^[1-9]d*|0$　 //匹配非负整数（正整数 + 0）
^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0）
^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非负浮点数（正浮点数 + 0）
^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮点数（负浮点数 + 0）

评注：处理大量数据时有用，具体应用时注意修正

匹配特定字符串：

^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串
^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串
^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串
^w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串

在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:

只能输入数字：“^[0-9]*$”
只能输入n位的数字：“^d{n}$”
只能输入至少n位数字：“^d{n,}$”
只能输入m-n位的数字：“^d{m,n}$”
只能输入零和非零开头的数字：“^(0|[1-9][0-9]*)$”
只能输入有两位小数的正实数：“^[0-9]+(.[0-9]{2})?$”
只能输入有1-3位小数的正实数：“^[0-9]+(.[0-9]{1,3})?$”
只能输入非零的正整数：“^+?[1-9][0-9]*$”
只能输入非零的负整数：“^-[1-9][0-9]*$”
只能输入长度为3的字符：“^.{3}$”
只能输入由26个英文字母组成的字符串：“^[A-Za-z]+$”
只能输入由26个大写英文字母组成的字符串：“^[A-Z]+$”
只能输入由26个小写英文字母组成的字符串：“^[a-z]+$”
只能输入由数字和26个英文字母组成的字符串：“^[A-Za-z0-9]+$”
只能输入由数字、26个英文字母或者下划线组成的字符串：“^w+$”

验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为：以字母开头，长度在6-18之间，
只能包含字符、数字和下划线。

验证是否含有^%&',;=?$”等字符：“[^%&',;=?$x22]+”
只能输入汉字：“^[u4e00-u9fa5],{0,}$”

验证Email地址：“^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”

验证InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”

验证电话号码：“^((d{3,4})|d{3,4}-)?d{7,8}$”

正确格式为：“XXXX-XXXXXXX”，“XXXX-XXXXXXXX”，“XXX-XXXXXXX”，
“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。

验证身份证号（15位或18位数字）：“^d{15}|d{}18$”

验证一年的12个月：“^(0?[1-9]|1[0-2])$”正确格式为：“01”-“09”和“1”“12”

验证一个月的31天：“^((0?[1-9])|((1|2)[0-9])|30|31)$”

正确格式为：“01”“09”和“1”“31”。

匹配中文字符的正则表达式： [u4e00-u9fa5]

匹配双字节字符(包括汉字在内)：[^x00-xff]

匹配空行的正则表达式：n[s| ]*r

匹配HTML标记的正则表达式：/< (.*)>.*|< (.*) />/

匹配首尾空格的正则表达式：(^s*)|(s*$)

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*

匹配网址URL的正则表达式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

(1)应用：计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

String.prototype.len=function(){return this.replace([^x00-xff]/g,”aa”).length;}

(2)应用：javascript中没有像vbscript那样的trim函数，我们就可以利用这个表达式来实现

String.prototype.trim = function(){return this.replace(/(^s*)|(s*$)/g, “”);}

(3)应用：利用正则表达式分解和转换IP地址

function IP2V(ip) //IP地址转换成对应数值{re=/(d+).(d+).(d+).(d+)/g //匹配IP地址的正则表达式if(re.test(ip)){return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1}else{throw new Error(”Not a valid IP address!”)}}

(4)应用：从URL地址中提取文件名的javascript程序

s=”http:///shockwave/download/index.cgi?\P1_Prod_Version=ShockwaveFlash type=application/x-shockwave-flash \width=255 height=250></embed></object>'; document.write(replaceReg(reg,str)+'<br />'); </script>

给属性添加双引号

来源：请教正则表达式高手

给HTML标签中的属性添加双引号。

LeXRus的第一个正则如下：

/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig 第一个括号没看明白，JS应该是不支持。所以我擅自给删掉了，剩下的正则如下：

/(\s+\w+)\=([^>\"\s]+)/ig 第一个括号里的\s+\w+匹配的是属性名。

然后是=，不用转义。

第二个括号里的[^>\"\s]+匹配属性值。不匹配>”和空格。这里的引号不用转义。在意思不改变的情况下，稍微改了改，正则如下：

/(\s+\w+)=([^>"\s]+)/ig 需要注意的是这个正则不匹配=两边有空格的属性，例如href = xxx。相匹配的话就改成：

/(\s+\w+)\s*=\s*([^>"\s]+)/ig 代码：

str=str.replace(/(?!\<\w+)(\s+\w+)\=([^>\"\s]+)/ig,'$1="$2"'); 其中'$1=”$2”'就实现了给属性值添加上双引号。不过ncs指出了这个正则替换的几个问题，一是上面的空格问题，二是如果非标签内部有等号，且前面又恰巧有空白字符的话，它将会被误识别为属性，例如：

<a href=xxx target=yyy title = asdfasf> test=sd

里面的test=sd也会被匹配。三是如果属性原来使用了单引号，会被再包上一层双引号……

来看看LeXRus前辈的新正则替换方法：

str=str.replace(/(?!<\w+)(\s+\w+)\s*=\s*([^>\"\s]+)(?=[^>]*>)/ig,'$1="$2"').replace(/\"\'([^\'\"]+)\'\"/ig,'\"$1\"');

先来看第一个正则：

/ (\s+\w+)\s*=\s*([^>"\s]+)(?=[^>]*>)/ig 结尾新添的(?=[^>]*>)意在解决普通文本中有等号被误识别为属性的问题：

<a href=xxx target=yyy title = asdfasf> test=sd

就没问题了，但是

<a href=xxx target=yyy title = asdfasf> test=sd<tag>又一个标签</tag>

中的test=sd<tag>又会被识别为属性。

我觉得改成下面的正则就没问题了：

/(\s+\w+)\s*=\s*([^<>"\s]+)(?=[^<>]*>)/ig 分别在第二个括号的字符集合和最后的反向预查的字符集合中添加了一个<。

下面再来分析第二个正则，

/\"\'([^\'\"]+)\'\"/ig 这个正则用于匹配双引号，单引号多层嵌套的情况，同样，不用转义，修改正则如下：

/"'([^'"]*)'"/ig

这样基本任务就完成了。测试代码如下：

原帖里LeXRus又提出了新问题：

hint=i am lexrus

这样的属性会有问题，不过我感觉不加引号的话，属性值里就不可能有空格，否则会被识别为多个属性了。不过看到最后ncs的回帖我就哭了：

onclick=if(document.forms.length>0)

这样的属性怎么办？大于号会被识别为标签结束……还是分离行为与文档吧。补充一下，其实修补一下正则也可以解决，只要改成如下正则即可：

/(\s+\w+)\s*=\s*([^"\s]+)(?=[^<>]*>)/ig 就是去掉第二个括号内字符集合里的<>。最后这个问题也解决。

给table加上tbody

来源：通过正则表达式快速在后加上

有若干table，但是没有tbody。现在需要用正则批量加上。

匹配table结束标签</table>比较简单，在前面加上一个</tbody>就行了。

但是，匹配table的起始标签有点难度，因为可能有属性。不过之前匹配过链接了，这个也大同小异。

实例table代码如下：

正则：

/<table\s(\s*\w*?\s*=\s*".+?")*?\s*?>/g 匹配一个<table，在匹配若干个属性，最后只要再找到>就代表标签结束。

之后再replace一下，加上<tbody>就可以了。

去掉标签的所有属性
来源：正则表达式(Dreamweaver8)

变成没有任何属性的

思路：非捕获匹配属性，捕获匹配标签，使用捕获结果替换掉字符串。正则如下：

/(<td)\s(?:\s*\w*?\s*=\s*".+?")*?\s*?(>)/ 首先，td匹配掉了标签，后面可以用$1引用，后面的若干属性被(?:)匹配掉，而最后匹配的>则可以在后面用$2引用。

示意代码：

str = str.replace(reg,'$1$2');

正则替换特定单词
来源：正则表达式,拒绝几个单词的输入该怎样表达?

要求禁止输入某几个单词，如果拒绝red,yellow,white。这个帖子到时不难，但是让我弄清楚了好几个概念。

第一个，小心字符集合里的“或”

/[^red|yellow|white]/ 这个正则里的所有或都没有意义，等同于：

/[^redyellowwhite]/ 意思就是不能含有以下列出的所有字母。

正解：

/red|yellow|white/第二个概念：

只要整个正则匹配成功，无论子正则表达式是否匹配成功，括号都会捕捉。例如

/(red)|(yellow)|(white)/ 会捕捉到三个结果，尽管实际上最多只可能有一个括号匹配成功。但是只要有一个匹配到了，两外两个也会记录空串。

指定文字高亮显示
来源：如何用正则把网页中的指定的字高亮显示

请教正则表达式：如何替换搜索结果中的关键字为高亮显示？

不劳而获一次，这个子虚乌有前辈已经给出了非常好的解决方案：我直接把代码贴出来了：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN""http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> <META name="Author" content="Sheneyan" /> <script type="text/javascript"> function encode(s){ return s.replace(/&/g,"&").replace(/</g,"<").replace(/>/g,">").replace(/([\\\.\*\[\]\$\^])/g,"\\$1"); } function decode(s){ return s.replace(/\$[\\\.\*\[\]\($\$\^])/g,"$1").replace(/>/g,">").replace(/</g,"<").replace(/&/g,"&"); } function highlight(s){ if (s.length==0){ alert('搜索关键词未填写！'); return false; } s=encode(s); var obj=document.getElementsByTagName("body")[0]; var t=obj.innerHTML.replace(/<span\s+class=.?highlight.?>([^<>]*)<\/span>/gi,"$1"); obj.innerHTML=t; var cnt=loopSearch(s,obj); t=obj.innerHTML var r=/{searchHL}(({(?!\/searchHL})|[^{])*){\/searchHL}/g t=t.replace(r,"<span class='highlight'>$1</span>"); obj.innerHTML=t; alert("搜索到关键词"+cnt+"处") } function loopSearch(s,obj){ var cnt=0; if (obj.nodeType==3){ cnt=replace(s,obj); return cnt; } for (var i=0,c;c=obj.childNodes[i];i++){ if (!c.className||c.className!="highlight") cnt+=loopSearch(s,c); } return cnt; } function replace(s,dest){ var r=new RegExp(s,"g"); var tm=null; var t=dest.nodeValue; var cnt=0; if (tm=t.match(r)){ cnt=tm.length; t=t.replace(r,"{searchHL}"+decode(s)+"{/searchHL}") dest.nodeValue=t; } return cnt; } </script> <style type="text/css"> .highlight{background:green;font-weight:bold;color:white;} </style> </head> <body> <form onsubmit="highlight(this.s.value);return false;"> <p><input name="s" id="s" title="搜索内容："/><input type="submit" value="搜索"/></p> </form> <div id="content"> 测试高亮的代码。很长很长的代码…………………… </div> </body> </html>

删除标签

来源：如何使用正则表达式去除大部分HTML标记？

删除除了<img>、<br>、<p>之外所有的标签。子虚乌有给出代码中关键的一句：

o.innerHTML.replace(/(<\/?(?!br|p|img)[^>\/]*)\/?>/gi,''); 刚开始没反应过来，后来才想起来，这个正则不用区分起始和结束标签。

<\/?(?!br|p|img)

匹配除了保护标签外标签的起始标签或者是结束标签的一部分。

[^>\/]*

匹配到>或者/就结束。

\/?>

起始标签或者结束标签的结尾。

JavaScript中常用的正则表达式日常整理(全)

相关文章

JavaScript中的正则表达式解析

Perl中的正则表达式介绍

最常用的15个前端表单验证JS正则表达式

正则表达式 学习资料整理

python使用正则表达式替换匹配成功的组

正则表达式学习资料整理