时间:2021-05-18
正则表达式:
官方定义:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
什么是正则表达式: 一套规则 - 匹配字符串的
谈到正则,就只和字符串相关了。我们要考虑的是在同一个位置上可以出现的字符的范围。
正则表达式能做什么:
•1.检测一个输入的字符串是否合法 -- web开发项目 表单验证 ◦用户输入一个内容的时候,我们要提前做检测
◦能够提高程序的效率并且减轻服务器的压力
•2.从一个大文件中找到所有符合规则的内容 -- 日志分析\爬虫 ◦能够高效的从一大段文字中快速找到符合规则的内容
字符组 : [字符组]
在同一个位置可能出现的各种字符组成了一个字符组,在正则表达式中用[]表示。一个中括号只表示一个字符位置
字符分为很多类,比如数字、字母、标点等等。假如你现在要求一个位置"只能出现一个数字",那么这个位置上的字符只能是0、1、2...9这10个数之一。
字符组 描述的是一个位置上能出现的所有可能性
# 接受范围,可以描述多个范围,连着写就可以了
# [abc] 一个中括号只表示一个字符位置,匹配a或者b或者c
# [0-9] 匹配数字0-9,根据ASCII进行范围的比对
# [a-z] 匹配所有的小写字母
# [A-Z] 匹配所有的大写字母
# [a-zA-Z] 匹配所有的大小写字母
# [0-9a-z]
# [0-9a-zA-Z_]
元字符:
字符:
元字符 匹配内容的规则
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线
\s 匹配任意的空白符
\d 匹配数字
\n 匹配一个换行符
\t 匹配一个制表符
\b 匹配一个单词的结尾
^ 匹配一个字符串的开始
$ 匹配一个字符串的结尾
\W 匹配非字母或数字或下划线
\D 匹配非数字
\S 匹配非空白符
a|b 匹配字符a或字符b
a表达式|b表达式 匹配a或者b表达式中的内容,如果匹配a成功了,不会继续和b匹配, 所以,如果两个规则有重叠部分,总是把长的放在前面
() 分组,匹配括号内的表达式,也表示一个组。约束某一个元字符的作用范围,只在()内生效
[] 字符组,匹配字符组中的字符
[^] 非字符组,匹配除了字符组中字符的所有字符
在正则表达式中能够帮助我们表示匹配的内容的符号都是正则中的 元字符
# [0-9] --> \d 表示匹配一位任意数字 digit
# [0-9a-zA-Z_] --> \w 表示匹配数字字母下划线 word
# 空格 -->
# tab --> \t
# enter回车 --> \n
# 空格,tab和回车 --> \s 表示所有空白 包括空格 tab和回车
# [\d] \d 表示匹配数字
# [\d\D] [\w\W] [\s\S] 表示匹配所有
# [^\d] 匹配所有的非数字
# [^1] 匹配除数字1以外的所有
# [1-9]\d 匹配两位整数
# [1357]\d 匹配1,3,5,7,开头的两位整数
例1:匹配多个网址:
/top250?start=0&filter=') print(ret.content.decode('utf-8'))
总结
以上所述是小编给大家介绍的深入浅析正则表达式re模块(部分),希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
前言在re的正则表达式模块里,可以通过模块的方式来访问正则表达式,但是如果重复多次地使用正则表达式,最好是使用compile函数把正则表达式编译成对象Regex
1)正则表达式的使用。复制代码代码如下:#正则表达式的模块importre#正则表达式rePattern='.*[0-9]{4}'pattern=re.comp
re正则表达式模块还包括一些有用的操作正则表达式的函数。下面主要介绍compile函数。定义:compile(pattern[,flags])根据包含正则表达式
python正则表达式模块简介Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。Python1.5之前版本则是通过regex模块提供
python正则表达式模块简介Python自1.5版本起增加了re模块,它提供Perl风格的正则表达式模式。Python1.5之前版本则是通过regex模块提供