文章詳情頁
python - pyspider 定時爬取問題
瀏覽:149日期:2022-07-14 10:37:31
問題描述
在寫爬蟲的時候,發現 在代碼中設置了 every 之后,21號爬取了一次之后,今天看 result 沒有更新,那個 lastcrawltime 依舊是 21號的。請問是不是我的參數設置的不正確?
問題解答
回答1:你貼的這個 task 的圖,是什么任務的?
貼的是 detail_page 的任務的
題主給 index_page 設置了小于 cronjob 間隔的時間。然而沒有給 detail_page 設置。這樣 detail_page 是不會被重新調度的
project 隊列狀態,最近活動任務是怎樣的?
回答2:有可能是 every 和 age 不匹配。如果 age 沒問題的話,說實話這屬于疑難雜癥了,我也經常遇到,我都是去 taskdb 把相應的表清空,然后重啟 pyspider 重新運行項目
相關文章:
1. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?2. javascript - 后臺管理系統左側折疊導航欄數據較多,怎么樣直接通過搜索去定位到具體某一個菜單項位置,并展開當前菜單3. 如何解決docker宿主機無法訪問容器中的服務?4. javascript - Web微信聊天輸入框解決方案5. javascript - 如何使用nodejs 將.html 文件轉化成canvas6. python - Scrapy存在內存泄漏的問題。7. 如何用筆記本上的apache做微信開發的服務器8. CSS3 畫如下圖形9. angular.js - $stateChangeSuccess事件在狀態跳轉的時候不執行?10. android - rxjava merge 返回Object對象數據如何緩存
排行榜
