时间:2021-05-22
起步
对于一些字符,python2和python3的md5加密出来是不一样的.
# python2.7pwd = "xxx" + chr(163) + "fj"checkcode = hashlib.md5(pwd).hexdigest()print checkcode # ea25a328180680aab82b2ef8c456b4ce# python3.6pwd = "xxx" + chr(163) + "fj"checkcode = hashlib.md5(pwd.encode("utf-8")).hexdigest()print(checkcode) # b517e074034d1913b706829a1b9d1b67按代码差异来将,就是在python3中需要对字符串进行 encode 操作,如果没有则会报错:
checkcode = hashlib.md5(pwd).hexdigest()TypeError: Unicode-objects must be encoded before hashing这是因为加密时需要将字符串转化为 bytes 类型,3默认编码是 utf-8 .所以我用utf-8进行解码.
分析
如果字符串中没有chr(163),那么两个版本结果是一致的,也就是说问题出在这个chr(163)中:
# python2.7>>> chr(163)'\xa3'# python3.6>>> chr(163)'\xa3'在这里说明通过 chr 得到的结果是一致的, 将它转为 bytes 类型看看:
# python2.7>>> bytes(chr(163))'\xa3'# python3.6>>> chr(163).encode()b'\xc2\xa3'python3中,在 num<128 的时候,使用 chr(num).encode('utf-8') 得到的是 一个 字符的ascii十六进制,而 num>128 的时候,使用 chr(num).encode('utf-8') 得到的是 两个 字节的ascii十六进制.
解决
改用 latin1 编码进行解码:
额外
为什么是 latin1 编码呢.答案还是挺有意思的.
先说chr函数,通过 help(chr) 可以查看:
chr(...) chr(i) -> Unicode character Return a Unicode string of one character with ordinal i; 0 <= i <= 0x10ffff.意思是它返回Unicode编码中指定位置的一个字符.python3内部也是用Unicode表示左右字符,即str类型.而通过encode后会编码成 bytes 类型.
ascii编码中每个字符编码是一个byte,但只有1-127. 超过的部分128-255则属于 Extended ASCII ,python3 中默认的ascii中不包含这部分,所以如果执行 chr(163).encode("ascii") 就会报错 'ascii' codec can't encode character '\xa3' in position 3: ordinal not in range(128)
因此需要一个含有128-255中的部分字符的编码,且采用1个Byte固定大小编码,比如ISO 8859-1,也就是 latin1.当然还有其他编码如cp1252也包含这些字符的.
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
详解PythonMD5加密Python3下MD5加密#由于MD5模块在python3中被移除#在python3中使用hashlib模块进行md5操作import
python之hashlib模块:主要提供字符加密功能,python3中将md5和sha模块整合到了hashlib模块,支持md5,sha1,sha224,sh
Python实现文件的全备份和差异备份之前有写利用md5方式来做差异备份,但是这种md5方式来写存在以下问题:md5sum获取有些软连接的MD5值存在问题不支持
Python加密的实例详解hashlib支持md5,sha1,sha256,sha384,sha512,用法和md5一样importhashlib#hashli
想学习Python的人都会有一个困惑,那就是Python目前有两个版本Python2和Python3,Python2与Python3有何区别,两个版本该学习哪个