时间:2021-05-23
bit: 位,计算机最小的表示单位
bytes:字节,最小的存储单位,1bytes=8bit,1bytes简写成1B
1KB = 1024B
1MB = 1024KB
1GB = 1024MB
1TB = 1024GB
......
ASCII编码是基于拉丁字母一套编码,主要是显示现代英语和其西欧语言,是最早通用的单字节编码系统,具体ASCII对照表如下:
在对照表中需要记住的是大写字母A的编码是65,小写字母a的编码的97即可。
在python中可以使用chr和ord方法进行转换:
# 将数字类型转换成ASCII对应的字符print(chr(97)) # a# 将数字转换成对应的数据print(ord("A")) # 65# 或者使用但随着事件的发展,ASCII编码扩展到了256个字符,编码 对照表如下:
其中后128个字符称为扩展ASCII码
由于ASCII编码只能由256个字符组成,然只能由1个字节来表示中文是不可能的,因此制定了GB2312编码,用来表示中文的对照表
为了解决各个国家编码冲突的问题,Unicode编码就因此而生,Unicode把所有语言都统一到一套编码里面,就会避免冲突,产生乱码。
Unicodeb标准在不断发展,最常用的是用两个字节表示一个字符,也有的字符是4个字节,但是中文是占两个字节。如果统一成Unicode编码,在存储和传输上就不划算
为了解决Unicode编码存储过大的问题,就推出了可变长编码UTF-8,UTF-8编码把一个Unicode字符依据不同的数据大小编程1~6个字节,其中中文就占3个字节
可以通过encode进行编码,其中语法如下:
对字符串进行ASCII编码(只能转换数字,英文字母和一些符号)
# 方式1: 通过bytes方法bytes('a', 'ASCII')# 方式2: 通过encode方法进行'a'.encode('ASCII')将字符串转换成gbk编码格式
# 方式1: 通过encode方法进行print('你好'.encode('GBK')) # 编码之后的结果为:b'\xc4\xe3\xba\xc3'# 方式2: 通过bytes类型print(bytes('我爱你', 'GBK')) # 编码之后的结果为:b'\xce\xd2\xb0\xae\xc4\xe3'将字符串转换成Unicode编码格式
# 方式1: 通过encode方法进行print('你好'.encode('unicode_escape')) # 编码之后的结果为:b'\\u4f60\\u597d'# 方式2: 通过bytes类型print(bytes('我爱你', 'unicode_escape')) # 编码之后的结果为:b'\\u6211\\u7231\\u4f60'将字符串转换成UTF-8编码格式
# 方式1: 通过encode方法进行print('你好'.encode('utf-8')) # 编码之后的结果为:b'\xe4\xbd\xa0\xe5\xa5\xbd'# 方式2: 通过bytes类型print(bytes('我爱你', 'utf-8')) # 编码之后的结果为:b'\xe6\x88\x91\xe7\x88\xb1\xe4\xbd\xa0'将GBK编码格式转换成字符串
# 通过decode方法解码print(b'\xc4\xe3\xba\xc3\xce\xd2\xb0\xae\xc4\xe3'.decode('GBK')) # 解码之后结果为:你好我爱你将UTF-8编码格式转换成字符串
# 通过decode方法解码print(b'\xe4\xbd\xa0\xe5\xa5\xbd\xe6\x88\x91\xe7\x88\xb1\xe4\xbd\xa0'.decode('utf-8')) # 解码之后结果为:你好我爱你将Uniconde编码格式转换成字符串
# 通过decode方法解码print(b'\\u4f60\\u597d\\u6211\\u7231\\u4f60'.decode('GBK')) # 解码之后结果为:你好我爱你到此这篇关于python中字符串的编码与解码的文章就介绍到这了,更多相关python字符串的编码与解码内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
在最新的Python3版本中,字符串是以Unicode编码的,即Python的字符串支持多语言编码和解码 字符串在内存中以Unicode表示,在操作字符串时,
一、简介在python中url,对于中文等非ascii码字符,需要进行参数的编码与解码。二、关键代码1、url编码对字符串编码用urllib.parse包下的q
字符串在Python内部的表示是Unicode编码,因此,在做编码转换时,通常需要以Unicode作为中间编码,即先将其他编码的字符串解码(decode)成Un
java转换字符串编码格式(解码错误,重新解码)字符集概念:规定了某个文字对应的二进制数字存放方式(编码)和某串二进制数值代表了哪个文字(解码)的转换关系。我们
在编程时,有时需要对字符串进行escape编码,在java中可以使用下面的方法对字符串进行escape编码/***对字符串escape编码**@paramsrc