时间:2021-05-22
很多时候我们需要过滤掉标点符号等特殊字符,网上虽然有一堆的方法,但是都没有找到一个非常满意的,有些过滤不了中文的标点符号,有些过滤不了英文的标点符号,有些过滤不全。
最后通过查看正则表达式文档,发现一个高效的办法,一行代码就能搞定:
def replace_all_blank(value): """ 去除value中的所有非字母内容,包括标点符号、空格、换行、下划线等 :param value: 需要处理的内容 :return: 返回处理后的内容 """ # \W 表示匹配非数字字母下划线 result = re.sub('\W+', '', value).replace("_", '') print(result) return result其中用到了 Python 的 re 模块, re 模块里面包含了所有的正则表达式的应用。代码里面有几个点:
\W
测试一下:
replace_all_blank("Powe, on;the 2333, 。哈哈 !!看看可以吗?一行代码就可以了!^_^")输出结果:
Poweonthe2333哈哈看看可以吗一行代码就可以了
一行代码搞定!Perfect!
最后推荐大家官网 re 模块的正则表达式文档地址:
https://docs.python.org/zh-cn/3.6/library/re.html
知识点扩展:
python过滤中英文标点符号
import re# 过滤不了\\ \ 中文()还有————r1 = u'[a-zA-Z0-9'!"#$%&\'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\\]^_`{|}~]+'#用户也可以在此进行自定义过滤字符# 者中规则也过滤不完全r2 = "[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+"# \\\可以过滤掉反向单杠和双杠,/可以过滤掉正向单杠和双杠,第一个中括号里放的是英文符号,第二个中括号里放的是中文符号,第二个中括号前不能少|,否则过滤不完全r3 = "[.!//_,$&%^*()<>+\"'?@#-|:~{}]+|[——!\\\\,。=?、:“”‘'《》【】¥……()]+"# 去掉括号和括号内的所有内容r4 = "\\【.*?】+|\\《.*?》+|\\#.*?#+|[.!/_,$&%^*()<>+""'?@|:~{}#]+|[——!\\\,。=?、:“”‘'¥……()《》【】]"text = "\崔芸,\\我爱=+你!【我//""们】~————结/婚'吧::!这.!!_#??()个‘'“”¥$主|意()不错......!"print(re.sub(r1, , '', text))总结
以上所述是小编给大家介绍的一行代码Python过滤标点符号等特殊字符,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
php过滤英文标点符号过滤中文标点符号代码复制代码代码如下:functionfilter_mark($text){if(trim($text)=='')retu
JavaScript字符串字符串是一系列字符的集合,包括英文字母、标点符号、特殊符号、汉字等。在JavaScript中,字符串可以使用双引号("")或单引号('
网上看到的python去掉字符串中的标点符号的方法,大多是基于python2的,不适用python3,调整后代码如下:代码lower_case_document
使用电脑编辑文章,需要用到一些特殊符号和标点符号,很多使用电脑的新朋友,对输入特殊符号和标点符号还不是那么明白输入的方法。下面就为大家带来电脑键盘上特殊符号和标
元字符^$.*+?=!:|\/()[]{}在使用这些符号时需要用“\”来进行转移。如果记不清楚那些标点符号需要转移,可以在使用标点符号时都使用反斜杠“\”简单匹