文章詳情頁

python - scrapy 爬取pages比實際進入items的多得多？

瀏覽：102日期：2022-07-23 10:55:26

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)

為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么？

問題解答

回答1：

重定向了，你看到了吧，重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。

Python 編程

上一條：算法 - python ahocorasick 從本地文件讀取文本，進行關鍵字匹配，匹配失敗下一條：運行python程序時出現“應用程序發生異常”的內存錯誤？

相關文章：

1. 致命錯誤: Class ’appfacadeTest’ not found2. html5 - 如何實現帶陰影的不規則容器？3. objective-c - iOS開發支付寶和微信支付完成為什么跳轉到了之前開發的一個app?4. css - 移動端字體設置問題5. python - 管道符和ssh傳文件6. javascript - 循環嵌套多個promise應該如何實現？7. mysql優化 - 關于mysql分區8. 請教各位大佬，瀏覽器點提交實例為什么沒有反應9. 前端 - IE9 css兼容問題10. javascript - ionic2 input autofocus 電腦成功，iOS手機鍵盤不彈出

排行榜

					
					docker綁定了nginx端口 外部訪問不到
objective-c - iOS開發支付寶和微信支付完成為什么跳轉到了之前開發的一個app?
請教各位大佬，瀏覽器點 提交實例為什么沒有反應
致命錯誤: Class ’appfacadeTest’ not found
java - C語言算法題-韓信點兵  求解？
vue.js - vue 打包后 nginx 服務端API請求跨域問題無法解決。
mysql優化 - 關于mysql分區
javascript - 循環嵌套多個promise應該如何實現？
python - 管道符和ssh傳文件
java - Atom中文問題
java - MySQL中，使用聚合函數+for update會鎖表嗎？
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

python - scrapy 爬取pages比實際進入items的多得多？