文章詳情頁
java - QQ空間爬蟲總是被封號
瀏覽:135日期:2022-09-24 17:58:56
問題描述
抓取QQ空間說說但是 總是被封號 可以給提出一些解決方案嗎?如何既可以快速 又可以不封號!謝謝啦!
代碼在github上地址https://github.com/20100507/Q...
問題解答
回答1:反爬蟲策略:
1、識別請求頭,判斷是否是爬蟲2、記錄請求頻率、路徑和訪問ip,判斷是否是爬蟲3、請求參數(shù)中進(jìn)行加密或復(fù)雜加密,增加爬蟲開發(fā)的難度(如淘寶的ua算法)4、復(fù)雜驗(yàn)證碼
應(yīng)對反爬蟲策略:
1、在爬取過程中,適當(dāng)切換代理ip2、適當(dāng)降低請求頻率3、請求頭模擬成瀏覽器的請求,也就是用戶正常訪問的請求
你的問題,主要可以通過定時(shí)切換ip,或一旦被封再切換ip,來解決,可以考慮去“站大爺”等代理ip網(wǎng)站付費(fèi)獲取,或者去多用幾個電信賬號,用ASDL撥號來切換ip。
標(biāo)簽:
qq
上一條:有用ruby抓取新浪微博內(nèi)容的源代碼可共享嗎?下一條:javascript - 為什么公司很少用node做后臺,對比java,php,python傳統(tǒng)后臺, node的優(yōu)勢在哪里,適合做什么
相關(guān)文章:
1. 管理員信息修改時(shí)的密碼問題2. html5 - 為什么使使用vue cli 腳手架,post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢?3. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?4. android - RxJava 中有根據(jù)條件執(zhí)行不同函數(shù)的操作符嗎?5. javascript - 如何使用nodejs 將.html 文件轉(zhuǎn)化成canvas6. java如何生成token?7. javascript - 后臺管理系統(tǒng)左側(cè)折疊導(dǎo)航欄數(shù)據(jù)較多,怎么樣直接通過搜索去定位到具體某一個菜單項(xiàng)位置,并展開當(dāng)前菜單8. javascript - html5的data屬性怎么指定一個function函數(shù)呢?9. 如何解決docker宿主機(jī)無法訪問容器中的服務(wù)?10. mysql - 電商如何存儲營業(yè)額數(shù)據(jù)
排行榜

熱門標(biāo)簽