正则表达式详解

时间：2021-05-02

正则表达式，又称正规表示法、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些符合某个模式的文本。

正则表达式可以干嘛？

1、数据有效性验证，可以对一个字符串进行测试，看该字符串是否符合某种规定。

2、替换文本，可以在文档中将指定的文字删除，或替换为其他文字。

3、根据字符串提取一个子字符串，用来在文本或输入字段中查找特定文字。

正则表达式语法

一个正则表达式是由普通字符（a-z）和特殊字符（元字符）组成的文字模式，该模式作为一个模版，将某个字符模式与所搜索的字符串进行匹配。

元字符

具有特殊意义的专用字符。

基本元字符

. 匹配除换行以外的任意字符，例如正则表达式 r.t 能够匹配 “rat、rut、r t”，但是不能匹配root

[] 匹配匹配一个出现在[]中的字符

| 或敏感词 ab|cd|ed|df

() 提高优先级 a(bc) 实现分组

限定元字符

* 重复零次或多次

+ 重复一次或多次

? 重复零次或一次

{n} 重复n次

{n,} 重复n次或多次

{n,m} 重复n到m次

首尾元字符

^ 匹配字符串开始例如正则表达式 ^when 能够匹配到 ”when in the“ 的开始，但不能匹配到 ”what and when in the“

$ 匹配字符串结束例如正则表达式 food$ 能够匹配到 “he's food” 的末尾

简写形式

\b 单词的开始或结束

\d 匹配0-9的数字 \D非数字

\s 任意的空白符包括tab和换行符 \S大写非空白之外的所有字符

\w 匹配字母、数字或下划线 \W 非字母、数字下划线

转义字符

如果想查找元字符本身的话，比如想查找.或者*就会出现问题，因为会解释成其他意思。这时就需要使用\来取消这些字符的特殊意义。

因此需要使用\. \* 查找\本身应该写\\

在javascript中使用正则表达式

创建正则表达式

? 1 2 3 4 //字面值 var reg = /\d+/; //构造函数 var regx = new RegExp(<a href="file://\\d+">\\d+</a>);

匹配

? 1 2 3 4 5 6 7 8 9 if(reg.test("45646515")) { alert("OK"); } if(regx.test("sd")) { alert("ok") }

提取

? 1 2 3 4 5 6 7 8 var str="853020304@qq.com"; var reg = /([a-zA-Z0-9]+)@([a-zA-Z0-9]+(\.[a-zA-Z0-9]+)+)/; var match = reg.exec(str); alert(match[0]); //853020304@qq.com 匹配到的对象 alert(match[1]); //853020304 [1][2]分别是各个组 alert(match[2]); //qq.com alert(match[3]); //.com

循环提取

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 var str = "12345"; var r = /\d\d/g; //g global 全局匹配 var m = r.exec(str); //12 alert(m); m = r.exec(str); //34 alert(m); m = r.exec(str); //null 没有了返回null alert(m); var arr = []; var m = null; while((m=r.exec(str)) != null) //如果不等于null 继续循环 { arr.push(m); //添加到数组 } alert(arr.length); //[0]=12 [1]=34

替换

? 1 2 3 4 5 6 7 8 9 string str = <string>.replace(正则表达式或字符串,替换为某字符串); var str = "ab--c--d--e--f-g"; var result = str.replace(/-+/g,','); //如果不写g 则只替换第一个 alert(result); //ab,c,d,e,f,g var date = "2015年8月24日"; var result = date.replace(/(\d+)年(\d+)月(\d+)日/,"$1-$2-$3"); alert(result);//2015-8-24

在c#中使用正则表达式

? 1 2 3 4 5 var regx = "^[a-zA-Z0-9]{6,20}$"; if ( ! Regex.IsMatch("abcdef;sd123",regex) { //长度必须6-20，字母和数字 }

常用表达式

匹配身份证：\d{15}|\d{18}

匹配中国邮政编码：[1-9]\d{5}(?!\d)

匹配腾讯QQ号：[1-9][0-9]{4,}

匹配国内电话号码：\d{3}-\d{8}|\d{4}-\d{7}

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$

匹配网址URL的正则表达式：[a-zA-z]+://[^\s]*

匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配首尾空白字符的正则表达式：^\s*|\s*$

匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?</\1>|<.*? />

匹配中文字符的正则表达式： [\u4e00-\u9fa5]

限制网页表单里的文本框输入内容

只能输入中文：

? 1 <input type="text" onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" />

只能输入数字：

? 1 <input type="text" onkeyup="value=value.replace(/[^\d]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" />

只能输入数字和英文：

? 1 <input type="text" onkeyup="value=value.replace(/[\W]/g,'') " onbeforepaste="clipboardData.setData('text',clipboardData.getData('text).replace(/[^\d]/g,''))" />

以上内容就是本文对正则表达式做的详解，希望大家喜欢

正则表达式详解

相关文章

Java 正则表达式详解

ruby 正则表达式详解及示例代码

Java API学习教程之正则表达式详解

比较全面的C 、Java、JavaScript中的正则表达式详解

Linux 正则表达式详解