文章詳情頁
如何提高python查詢速度?
瀏覽:175日期:2022-06-29 18:39:57
問題描述
最近在爬股票的相關(guān)新聞,一開始設(shè)想的是,當(dāng)有新的新聞動態(tài)發(fā)布,程序通過郵件發(fā)送最新內(nèi)容到郵箱。
所以我想把新聞標(biāo)題,內(nèi)容存到數(shù)據(jù)庫里,當(dāng)內(nèi)容更新時(shí),把新的內(nèi)容和數(shù)據(jù)庫的標(biāo)題列表對比,看是不是已存在的,如果已存在,那就不發(fā)送,如果沒有,那發(fā)送到郵箱。
但數(shù)量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?
問題解答
回答1:爬蟲任務(wù)去重
抓過的鏈接存到一個(gè)set中,檢查新鏈接是否在集合中即可。
回答2:去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內(nèi)存,提升效率
上一條:python - 如何使用requests模塊在一個(gè)post中提交含有多個(gè)相同名稱的數(shù)據(jù)?下一條:python - scrapy獲取網(wǎng)頁指定內(nèi)容,后翻到下一頁繼續(xù),固定循環(huán)次數(shù)。。問題
相關(guān)文章:
1. html5 - 有可以一次性把所有 css外部樣式轉(zhuǎn)為html標(biāo)簽內(nèi)style=" "的方法嗎?2. sql語句 - mysql中關(guān)聯(lián)表查詢問題3. javascript - [js]為什么畫布里不出現(xiàn)圖片呢?在線等4. javascript - 如何將一個(gè)div始終固定在某個(gè)位置;無論屏幕和分辨率怎么變化;div位置始終不變5. javascript - vscode alt+shift+f 格式化js代碼,通不過eslint的代碼風(fēng)格檢查怎么辦。。。6. html - vue項(xiàng)目中用到了elementUI問題7. javascript - 有什么比較好的網(wǎng)頁版shell前端組件?8. javascript - iframe 為什么加載網(wǎng)頁的時(shí)候滾動條這樣顯示?9. javascript - 這不是對象字面量函數(shù)嗎?為什么要new初始化?10. javascript - 原生canvas中如何獲取到觸摸事件的canvas內(nèi)坐標(biāo)?
排行榜

熱門標(biāo)簽