国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

淺析Python requests 模塊

瀏覽:3日期:2022-07-08 18:11:47

Python requests 模塊

requests 模塊是我們使用的 python爬蟲 模塊 可以完成市場進80%的爬蟲需求。

安裝

pip install requests

使用

requests模塊代碼編寫的流程:

- 指定url - 發起請求 - 獲取響應對象中的數據 - 持久化存儲

-------------案例-------------------------import requests# 指定urlurl='https://www.sogou.com/'# 發起請求response = requests.get(url)# 獲取響應對象中的數據page_text = response.text# 持久化存儲with open(’./sogou.html’,’w’,encoding=’utf-8’) as fp: fp.write()-------------------------------------------

參數

# post 數據response = requests.post(url=url,data=data,headers=headers)# get 數據response = requests.get(url=url,data=data,headers=headers)# 返回二進制數據response.content # 返回字符串數據 response.text # 返回json對象 response.json()

其他了解

1、該模塊實現爬取數據前需要查找需要爬取數據的指定URL,可通過瀏覽器自帶抓包功能。

# 瀏覽器抓取 Ajax 請求F12 --> Network --> XHR --> Name --> Response

2、上面的headers參數是進行UA偽裝為了反反爬

反爬機制:UA檢測 --> UA偽裝

3、下面是http我們爬包是常用的請求頭參數

- accept: 瀏覽器通過這個頭告訴服務器,他所支持的數據類型- Accept-Charset:瀏覽器通過這個頭告訴服務器,它支持那種字符集- Accept-Encoding:瀏覽器通過這個頭告訴服務器,支持的壓縮格式- Accept-Language:瀏覽器通過這個頭告訴服務器,他的語言環境- Host:瀏覽器同過這個頭告訴服務器,想訪問哪臺主機- If-ModifiedSince:瀏覽器通過這個頭告訴服務器,緩存數據的時間- Heferer:瀏覽器通過這個頭告訴服務器,客戶及時那個頁面來的,防盜鏈- Connection:瀏覽器通過這個頭告訴服務器,請求完后是斷開鏈接還是保持鏈接- X-Requested-With:XMLHttpRequest 代表通過ajax方式進行訪問- User-Agent:請求載體的身份標識

以上就是淺析Python requests 模塊的詳細內容,更多關于Python requests 模塊的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 乌拉特后旗| 措勤县| 盐山县| 清水河县| 石棉县| 新丰县| 色达县| 武川县| 扶沟县| 台东县| 曲阜市| 隆尧县| 长白| 涪陵区| 莎车县| 平乐县| 靖宇县| 桓仁| 平阳县| 利川市| 贺州市| 灵寿县| 通江县| 南昌县| 新源县| 花莲市| 扎赉特旗| 墨脱县| 左权县| 遂昌县| 澳门| 万荣县| 吉安市| 太原市| 武乡县| 南昌市| 自治县| 河北区| 晋宁县| 司法| 阿克陶县|