文章詳情頁
python - scrapy 再次請求的問題
瀏覽:146日期:2022-08-17 18:54:48
問題描述
如:item[’url’]=response.xpath(’a/@href’)分析出一個鏈接,然后想從這個鏈接里的網頁再獲取一些元素,放入item[’other’]。應該怎么寫,謝謝。
問題解答
回答1:def parse_page1(self, response): for url in urls:item = MyItem()item[’url’] = urlrequest = scrapy.Request(url,callback=self.parse_page2)# request = scrapy.Request('http://www.example.com/some_page.html',dont_filter=True,callback=self.parse_page2)request.meta[’item’] = itemyield requestdef parse_page2(self, response): item = response.meta[’item’] item[’other’] = response.xpath(’/other’) yield item
最后附上官方文檔https://doc.scrapy.org/en/lat...中文翻譯版http://scrapy-chs.readthedocs...
相關文章:
1. javascript - 使用form進行頁面跳轉,但是很慢,如何加一個Loading?2. javascript - ES6規范下 repeat 函數報錯 Invalid count value3. python 計算兩個時間相差的分鐘數,超過一天時計算不對4. angular.js - angularjs 注入模塊報錯 很怪異... 求解惑5. javascript - JS 里面的 delete object.key 到底刪除了什么?6. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?7. mysql - 電商如何存儲營業額數據8. java如何生成token?9. html5 - 為什么使使用vue cli 腳手架,post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢?10. javascript - html5的data屬性怎么指定一個function函數呢?
排行榜
