国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - 用scrapy寫爬蟲,發送請求后,服務器全都直接返回202,該怎么辦呢?

瀏覽:148日期:2022-06-27 13:36:39

問題描述

我爬取的是中國裁判文書網,之前還是好好的,我發送請求,服務器返回200,然后我處理body中的數據

但是一個星期之前,突然所有的請求都返回202,然后response body里也是空的,完全拿不到數據,我在回調函數中阻塞等待while(response.status == 202)就sleep也沒用,status并不會變化

該怎么辦呢?

我使用了crwalera的ip代理服務,之前有段時間也是202,但是過了一天就好了,但這次已經持續了一個星期了,很奇怪

我覺得就是目標網站負載太大,所以采用異步的方式發送數據,但是我在scrapy里有怎么正確地收到他的數據呢?

問題解答

回答1:

這種情況通常是違規抓取,服務端進行了防抓取限制。如果是合法抓取的話,可以和內容方面溝通,看看是不是有誤傷,如果是非法抓取,還建議不要這樣做了,嚴重的話可能有被起訴的風險

回答2:

被防采集了,可以試試換ip或尋找防采的限制漏洞

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 松滋市| 遂平县| 洪泽县| 忻城县| 渭南市| 西丰县| 宜昌市| 银川市| 屯门区| 金湖县| 华容县| 土默特左旗| 阳新县| 信宜市| 谷城县| 清苑县| 宜城市| 黑山县| 祁阳县| 乌拉特后旗| 高州市| 安丘市| 如皋市| 西青区| 安龙县| 灌阳县| 江阴市| 长武县| 云浮市| 高雄县| 瑞昌市| 新兴县| 郎溪县| 天门市| 铅山县| 曲麻莱县| 西乡县| 法库县| 香港 | 巴东县| 扎赉特旗|