淺析Python requests 模塊
Python requests 模塊
requests 模塊是我們使用的 python爬蟲(chóng) 模塊 可以完成市場(chǎng)進(jìn)80%的爬蟲(chóng)需求。
安裝
pip install requests
使用
requests模塊代碼編寫的流程:
- 指定url - 發(fā)起請(qǐng)求 - 獲取響應(yīng)對(duì)象中的數(shù)據(jù) - 持久化存儲(chǔ)-------------案例-------------------------import requests# 指定urlurl='https://www.sogou.com/'# 發(fā)起請(qǐng)求response = requests.get(url)# 獲取響應(yīng)對(duì)象中的數(shù)據(jù)page_text = response.text# 持久化存儲(chǔ)with open(’./sogou.html’,’w’,encoding=’utf-8’) as fp: fp.write()-------------------------------------------
參數(shù)
# post 數(shù)據(jù)response = requests.post(url=url,data=data,headers=headers)# get 數(shù)據(jù)response = requests.get(url=url,data=data,headers=headers)# 返回二進(jìn)制數(shù)據(jù)response.content # 返回字符串?dāng)?shù)據(jù) response.text # 返回json對(duì)象 response.json()
其他了解
1、該模塊實(shí)現(xiàn)爬取數(shù)據(jù)前需要查找需要爬取數(shù)據(jù)的指定URL,可通過(guò)瀏覽器自帶抓包功能。
# 瀏覽器抓取 Ajax 請(qǐng)求F12 --> Network --> XHR --> Name --> Response
2、上面的headers參數(shù)是進(jìn)行UA偽裝為了反反爬
反爬機(jī)制:UA檢測(cè) --> UA偽裝
3、下面是http我們爬包是常用的請(qǐng)求頭參數(shù)
- accept: 瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,他所支持的數(shù)據(jù)類型- Accept-Charset:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,它支持那種字符集- Accept-Encoding:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,支持的壓縮格式- Accept-Language:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,他的語(yǔ)言環(huán)境- Host:瀏覽器同過(guò)這個(gè)頭告訴服務(wù)器,想訪問(wèn)哪臺(tái)主機(jī)- If-ModifiedSince:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,緩存數(shù)據(jù)的時(shí)間- Heferer:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,客戶及時(shí)那個(gè)頁(yè)面來(lái)的,防盜鏈- Connection:瀏覽器通過(guò)這個(gè)頭告訴服務(wù)器,請(qǐng)求完后是斷開(kāi)鏈接還是保持鏈接- X-Requested-With:XMLHttpRequest 代表通過(guò)ajax方式進(jìn)行訪問(wèn)- User-Agent:請(qǐng)求載體的身份標(biāo)識(shí)
以上就是淺析Python requests 模塊的詳細(xì)內(nèi)容,更多關(guān)于Python requests 模塊的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. django filters實(shí)現(xiàn)數(shù)據(jù)過(guò)濾的示例代碼2. IntelliJ IDEA設(shè)置自動(dòng)提示功能快捷鍵的方法3. Docker容器如何更新打包并上傳到阿里云4. Python pip 常用命令匯總5. Spring boot應(yīng)用啟動(dòng)后首次訪問(wèn)很慢的解決方案6. docker安裝java環(huán)境的實(shí)現(xiàn)步驟7. python 使用cx-freeze打包程序的實(shí)現(xiàn)8. 使用AJAX(包含正則表達(dá)式)驗(yàn)證用戶登錄的步驟9. AJAX實(shí)現(xiàn)數(shù)據(jù)的增刪改查操作詳解【java后臺(tái)】10. AJAX實(shí)現(xiàn)JSON與XML數(shù)據(jù)交換方法詳解

網(wǎng)公網(wǎng)安備