好资源导航 » 文章资讯 » 浅析Python requests 模块

浅析Python requests 模块

2023-07-14 06:22:03 72

Pythonrequests模块

requests模块是我们使用的python爬虫模块可以完成市场进80%的爬虫需求。

安装

pipinstallrequests

使用

requests模块代码编写的流程：

-指定url
-发起请求
-获取响应对象中的数据
-持久化存储

-------------案例-------------------------
importrequests
#指定url
url="https://www.sogou.com/"
#发起请求
response=requests.get(url)
#获取响应对象中的数据
page_text=response.text
#持久化存储
withopen('./sogou.html','w',encoding='utf-8')asfp:
fp.write()
-------------------------------------------

参数

#post数据
response=requests.post(url=url,data=data,headers=headers)

#get数据
response=requests.get(url=url,data=data,headers=headers)

#返回二进制数据
response.content

#返回字符串数据
response.text

#返回json对象
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL，可通过浏览器自带抓包功能。

#浏览器抓取Ajax请求
F12-->Network-->XHR-->Name-->Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制：UA检测-->UA伪装

3、下面是http我们爬包是常用的请求头参数

-accept:浏览器通过这个头告诉服务器，他所支持的数据类型
-Accept-Charset：浏览器通过这个头告诉服务器，它支持那种字符集
-Accept-Encoding：浏览器通过这个头告诉服务器，支持的压缩格式
-Accept-Language：浏览器通过这个头告诉服务器，他的语言环境
-Host：浏览器同过这个头告诉服务器，想访问哪台主机
-If-ModifiedSince：浏览器通过这个头告诉服务器，缓存数据的时间
-Heferer：浏览器通过这个头告诉服务器，客户及时那个页面来的，防盗链
-Connection：浏览器通过这个头告诉服务器，请求完后是断开链接还是保持链接
-X-Requested-With：XMLHttpRequest代表通过ajax方式进行访问
-User-Agent：请求载体的身份标识

以上就是浅析Pythonrequests模块的详细内容，更多关于Pythonrequests模块的资料请关注毛票票其它相关文章！

返回顶部
514930285
czq8825@qq.com

浅析Python requests 模块

热门推荐

随机推荐