时间:2021-05-23
中文的gbk(GB2312)编码: 一个汉字对应两组%xx,即%xx%xx
中文的UTF-8编码: 一个汉字对应三组%xx,即%xx%xx%xx
可以利用百度进行URL编码解码 默认gbk
https:///s?wd=中国
实例中我们使用到了urllib模块和urllib.unquote()函数
import urllibrawurl=xxxurl=urllib.unquote(rawurl)所用模块:urllib
所用函数:urllib.unquote()
案例
import urllibrawurl = "%E6%B2%B3%E6%BA%90"url = urllib.unquote(rawurl)print url输出
河源
urllib.unquote()目的是对url编码进行解码,与该函数对应的是编码函数urllib.quote()
>>> import urllib>>> urllib.quote("河源")'%E6%B2%B3%E6%BA%90URL为何要编码、解码?
通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据。对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。
例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。
又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。
更多关于Python使用urllib模块对URL编码与解码实例请查看下面的相关链接
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
一、简介在python中url,对于中文等非ascii码字符,需要进行参数的编码与解码。二、关键代码1、url编码对字符串编码用urllib.parse包下的q
python中使用requests模块http请求时,发现中文参数不会自动的URL编码,并且没有找到类似urllib(python3)模块中urllib.par
发现问题Python中的urllib模块用来处理url相关的操作,unquote方法对应javascript中的urldecode方法,它对url进行解码,把类
本文实例讲述了python通过urllib2获取带有中文参数url内容的方法。分享给大家供大家参考。具体如下:对于中文的参数如果不进行编码的话,python的u
获取带有中文参数的url内容对于中文的参数如果不进行编码的话,python的urllib2直接处理会报错,我们可以先将中文转换成utf-8编码,然后使用urll