python去除删除数据中\u0000\u0001等unicode字符串的代码

时间:2021-05-22

py文件为utf-8格式

#!/usr/bin/env python# -*- coding:utf-8 -*- a = "system\u0000" b = re.sub(u'\u0000', "", a) print(b) ## b="system"

补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符

【背景】

类似于:

\u3232\u6674 的字符串,转换为对应的unicode字符。

【解决过程】

对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。

完整的python代码演示为:

#!/usr/bin/python #coding: utf-8slashUStr = "\\u0063\\u0072\\u0069\\u0066\\u0061\\u006E\\u0020\\u5728\\u8DEF\\u4E0A"; #crifan 在路上 decodedUniChars = slashUStr.decode("unicode-escape") print "decodedUniChars=",decodedUniChars; #decodedUniChars= crifan 在路上

以上这篇python去除删除数据中\u0000\u0001等unicode字符串的代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章