国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

如何提高python查詢速度?

瀏覽:175日期:2022-06-29 18:39:57

問題描述

最近在爬股票的相關(guān)新聞,一開始設(shè)想的是,當(dāng)有新的新聞動態(tài)發(fā)布,程序通過郵件發(fā)送最新內(nèi)容到郵箱。

所以我想把新聞標(biāo)題,內(nèi)容存到數(shù)據(jù)庫里,當(dāng)內(nèi)容更新時(shí),把新的內(nèi)容和數(shù)據(jù)庫的標(biāo)題列表對比,看是不是已存在的,如果已存在,那就不發(fā)送,如果沒有,那發(fā)送到郵箱。

但數(shù)量大了以后,列表查詢速度就會變慢,請問各位還有什么方法可以傳授下嗎?

問題解答

回答1:

爬蟲任務(wù)去重

抓過的鏈接存到一個(gè)set中,檢查新鏈接是否在集合中即可。

回答2:

去重有很多方法,比如樓上的set或者布隆過濾器都可以有效的使用內(nèi)存,提升效率

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 阿图什市| 清水河县| 察隅县| 桦甸市| 会宁县| 三都| 齐齐哈尔市| 视频| 新乡县| 曲阜市| 嫩江县| 尉氏县| 新沂市| 丹巴县| 贵港市| 凤山市| 永川市| 荆门市| 肇州县| 丹棱县| 临猗县| 湘潭县| 延吉市| 当涂县| 湘阴县| 师宗县| 大名县| 九江县| 文昌市| SHOW| 军事| 新安县| 临高县| 东海县| 栖霞市| 津市市| 麟游县| 衡阳市| 洮南市| 无棣县| 仁布县|