时间:2021-05-22
首先,Python 标准库中的 urllib2 模块提供了你所需要的大多数 HTTP 功能,但是它的 API 不友好。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务,所以学习reuqests模块,比较简洁好用(以后慢慢会学习scapy,更强大的库),安装就不用说了
1 导入模块
>>> import requests
2 直观感受一下发送请求的简洁
>>> r = requests.get('your url')
>>> r = requests.post('your url')
#put delete head options方法也是这种用法
3 为url传递参数
>>> url_params = {'key':'value'} #字典传递参数,如果值为None的键不会被添加到url中
>>> r = requests.get('your url',params = url_params)
>>> print(r.url)
your url?key=value
4 响应的内容
>>> r.encoding #获取当前的编码
>>> r.encoding = 'utf-8' #设置编码
>>> r.text #以encoding解析返回内容
>>> r.content #以字节形式(二进制)返回
>>> r.json() #以json形式返回,前提返回的内容确保是json格式的,不然解析出错会抛异常
5 定制头和coookie信息
>>> header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0'}
>>> cookie = {'key':'value'}
>>> r = requests.get/post('your url',headers=header,cookies=cookie)
6 发送post数据请求
>>> send = {'key':'value'}
>>> r = requests.post('your url',data = send) # 如果你传递一个 string 而不是一个dict ,那么数据会被直接发布出去,这个也可以上传文件
7 响应状态码
>>> r.status_code #如果不是200,可以使用 r.raise_for_status() 抛出异常
8 响应
>>> r.headers #返回字典类型,头信息
# r.requests.headers 返回发送到服务器的头信息
>>> r.cookies #返回cookie
>>> r.history #返回重定向信息,当然可以在请求是加上allow_redirects = false 阻止重定向
9 超时
>>> r = requests.get('url',timeout=1)#设置秒数超时,仅对于连接有效
10 会话对象,让你能够跨请求保持某些参数
>>> s = requests.Session()
>>> s.auth = ('auth','passwd')
>>> s.headers = {'key':'value'}
>>> r = s.get('url')
>>> r1 = s.get('url1')
11 代理
>>> proxies = {'http':'ip1','https':'ip2' }
>>> requests.get('url',proxies=proxies)
推荐阅读:
Python Requests安装与简单运用
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
Requests是使用Apache2Licensed许可证的基于Python开发的HTTP库,其在Python内置模块的基础上进行了高度的封装,从而使得Pyth
昨天带伙伴萌学习python爬虫,准备了几个简单的入门实例涉及主要知识点:web是如何交互的requests库的get、post函数的应用response对象的
在python中我们可以使用requests模块来实现调用远程接口一:安装requests模块pipinstallrequests二:使用requests模块实
本文研究的主要是Python使用requests及BeautifulSoup构建一个网络爬虫,具体步骤如下。功能说明在Python下面可使用requests模块
1、Requests模块说明Requests是使用Apache2Licensed许可证的HTTP库。用Python编写,真正的为人类着想。Python标准库中的