文章詳情頁

linux - python 抓取公眾號文章遇到驗證問題

瀏覽：108日期：2022-06-25 14:22:41

問題描述

linux 下抓取微信公眾號文章遇到驗證問題！！！！！！！！

這是我要抓取的人民日報鏈接：http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1：首先瀏覽器上訪問是正常的。2：linux下訪問提示需要驗證，以下是簡單的代碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

訪問的結果如下： linux - python 抓取公眾號文章遇到驗證問題

補充說明下公眾號鏈接的獲取方式：1：先訪問鏈接：http://weixin.sogou.com/weixi...2：再獲取人民日報公眾號的鏈接進行跳轉。

問題解答

回答1：

都不模擬header請求頭的，就能抓取嗎，建議先模擬request header再試一下

回答2：

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3：

linux - python 抓取公眾號文章遇到驗證問題

現在在請求中加了header后，返回的錯誤是這樣的。請各位大神麻煩再支下招

回答4：用request可以,本地環境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)內容在紅色框那一行

linux - python 抓取公眾號文章遇到驗證問題

Python 編程

上一條：python - linux 下用wsgifunc 運行web.py該如何修改代碼下一條：linux - python 安裝 Anaconda 環境變量問題請教

相關文章：

1. 數組按鍵值封裝！2. java - 阿里的開發手冊中為什么禁用map來作為查詢的接受類?3. docker不顯示端口映射呢？4. html5 - 使用echarts中的圖表一個頁面導入了好幾個js圖表實現echarts圖表隨著瀏覽器窗口變化而變化時出現了問題5. javascript - 使用vue官方腳手架進行單元測試，如何覆蓋到watch里的變量？6. python - django 使用 redirect 跳轉網頁，怎么傳遞 referer 給目標網頁7. python 3.4 error: Microsoft Visual C++ 10.0 is required8. python - 如何找第三方編譯好的模塊？9. python - SQLAlchemy 向對應的id插入數據怎么操作？10. javascript - 為什么創建多行多列的表格最后只有一行內有表格

排行榜

					
					數組按鍵值封裝！
docker不顯示端口映射呢？
java - 阿里的開發手冊中為什么禁用map來作為查詢的接受類?
Docker for Mac 創建的dnsmasq容器連不上/不工作的問題
nginx - 關于 用 ab 測試 docker 和 本機引發的問題
angular.js - 如何用gulp打包ionic應用，項目JS腳本是使用 require.js 來組織的
python - django 使用 redirect 跳轉網頁，怎么傳遞 referer 給目標網頁
angular.js - 請問ng-click="alterCheck()"和ng-click="check=true"有什么不同？
node.js - node啟動本地服務失效但是瀏覽器卻能打開localhost的原因是什么
python 3.4 error: Microsoft Visual C++ 10.0 is required
java - Hibernate如何處理參數數量不定的實體類
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

linux - python 抓取公眾號文章遇到驗證問題