国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - scrapy 處理 文章 分頁的內容

瀏覽:119日期:2022-08-03 16:15:10

問題描述

如一篇文章有2-3頁,然后想把這些內容頁爬下來,拼接成一頁,然后再放入數據庫。文章url如:article_1.html,article_2.htmlitem有:item[’title’],item[’content’]而item[’content’]就是拼接成一頁的內容。大概怎么寫呢?

問題解答

回答1:

找到分頁接口url

回答2:

找到那個下一頁的鏈接,加入到爬取url列表中

回答3:

可以在rules里面寫正則自動掃描符合的url

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 高唐县| 绥宁县| 简阳市| 垦利县| 彭水| 湛江市| 玉树县| 都江堰市| 萍乡市| 拜泉县| 抚顺市| 东兰县| 曲水县| 双流县| 诏安县| 乌拉特后旗| 错那县| 建阳市| 通海县| 辽阳市| 资阳市| 吴旗县| 砀山县| 淮安市| 广州市| 翁牛特旗| 比如县| 沙洋县| 贵定县| 呼玛县| 永嘉县| 南通市| 新源县| 旬阳县| 五华县| 安吉县| 吉安市| 视频| 乌兰浩特市| 黄大仙区| 蒲城县|