文章詳情頁

python - scrapy 再次請求的問題

瀏覽：146日期：2022-08-17 18:54:48

問題描述

如：item[’url’]=response.xpath(’a/@href’)分析出一個鏈接，然后想從這個鏈接里的網頁再獲取一些元素，放入item[’other’]。應該怎么寫，謝謝。

問題解答

回答1：

def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True，callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item

最后附上官方文檔https://doc.scrapy.org/en/lat...中文翻譯版http://scrapy-chs.readthedocs...

Python 編程

上一條：python - django模板 include模板的數據問題下一條：Pycharm中文輸出亂碼怎么辦？win10，Pycharm3.2,Python3.5

相關文章：

1. javascript - 使用form進行頁面跳轉，但是很慢，如何加一個Loading？2. javascript - ES6規范下 repeat 函數報錯 Invalid count value3. python 計算兩個時間相差的分鐘數，超過一天時計算不對4. angular.js - angularjs 注入模塊報錯很怪異... 求解惑5. javascript - JS 里面的 delete object.key 到底刪除了什么？6. angular.js - 輸入郵箱地址之后，如何使其自動在末尾添加分號？7. mysql - 電商如何存儲營業額數據8. java如何生成token？9. html5 - 為什么使使用vue cli 腳手架，post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢？10. javascript - html5的data屬性怎么指定一個function函數呢？

排行榜

					
					python 計算兩個時間相差的分鐘數，超過一天時計算不對
javascript - 使用form進行頁面跳轉，但是很慢，如何加一個Loading？
javascript - ES6規范下 repeat 函數報錯 Invalid count value
angular.js - 輸入郵箱地址之后， 如何使其自動在末尾添加分號？
angular.js - angularjs 注入模塊報錯 很怪異... 求解惑
javascript - JS 里面的 delete object.key 到底刪除了什么？
docker-machine添加一個已有的docker主機問題
docker-compose中volumes的問題
javascript - 后臺管理系統左側折疊導航欄數據較多，怎么樣直接通過搜索去定位到具體某一個菜單項位置，并展開當前菜單
javascript - html5的data屬性怎么指定一個function函數呢？
html5 - 為什么使使用vue cli 腳手架，post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢？
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

python - scrapy 再次請求的問題