python - 爬取微信公眾號文章需要輸入驗證碼問題
問題描述
一開始請求是正常的,請求多了就返回這個網(wǎng)頁,提示要驗證。現(xiàn)在加了代理,加了header也都是返回這個。不知道有沒有什么辦法能繞過這個驗證,或者后臺可以模擬驗證?有沒有大神遇到類似的問題?簡單貼下請求的代碼
url = 'https://mp.weixin.qq.com/profile?src=3×tamp=1498555925&ver=1&signature=mFCwcLO9hTwe*Js7TGQ457olpvr1d85gJSnVLyFgtYkX072FzolMsfonBR6Av2BOSe2kJ8z-m25ecftpvQ-edw==' req = urllib2.Request(url) proxy='218.56.132.155:8080'//嘗試了各種代理ip,這邊先寫死 opener = urllib2.build_opener(urllib2.ProxyHandler({’http’:proxy})) urllib2.install_opener(opener) req.add_header('User-Agent', 'Mozilla/5.0') req.add_header('Accept-Language', 'zh-cn,zh;q=0.5') req.add_header(’Accept-encoding’, ’gzip,deflate’) resp = urllib2.urlopen(req) content = resp.read() print content
問題解答
回答1:去搜狗搜索去爬微信吧
回答2:沒爬過微信,不過建議使用 requests 推薦參考下wechatsogou
相關(guān)文章:
1. javascript - JS設(shè)置Video視頻對象的currentTime時出現(xiàn)了問題,IE,Edge,火狐,都可以設(shè)置,反而chrom卻...2. java固定鍵值轉(zhuǎn)換,使用枚舉實現(xiàn)字典?3. 如何為每個應(yīng)用程序配置tomcat 6的logs / catalina.out。(為sys.out,sys.err配置Web應(yīng)用程序特定的日志文件)4. css - ionic中的柵格布局如何讓文字內(nèi)容多少不同的每一列中的內(nèi)容都能垂直居中?5. php自學(xué)從哪里開始?6. phpstady在win10上運行7. java - 我設(shè)置了cookie的max age,但是cookie依然在關(guān)閉游覽器后消失了8. vim - win10無法打開markdown編輯器9. 這是什么情況???10. javascript - 用jsonp抓取qq音樂總是說回調(diào)函數(shù)沒有定義
