国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

瀏覽:157日期:2022-09-17 10:49:15

問題描述

用scrapy爬了圖書館書籍的書名和評論,用Chrome的檢查拔下來的Xpath,但是運行爬蟲返回的是空元素,請問各位哪里出了問題,謝謝大家。截圖:

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

附上我的Scrapy源碼,請大家多指教,謝謝!

from scrapy import Spiderfrom scrapy.selector import Selectorfrom CommentCrawl.items import CommentcrawlItemclass commentcrawl(Spider): name = 'commentcrawl' allowed_domains = ['http://opac.lib.bnu.edu.cn:8080'] start_urls = ['http://opac.lib.bnu.edu.cn:8080/F/S9Q2QIQV5D9R9HBHPI2KNN8JH11TRIRSIEPKYQLTAQQ17LA6B6-16834?func=full-set-set&set_number=010408&set_entry=000001&format=999', ] def parse(self,response):item = CommentcrawlItem()item[’name’] = Selector(response).xpath(’//*[@id='details2']/table/tbody/tr[1]/td[2]/a/text()’).extract()item[’comment’] = Selector(response).xpath(’//*[@id='localreview']/text()’).extract()yield item

問題解答

回答1:

頁面需要登錄才能訪問,缺少登錄操作。

回答2:

網頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

頁面被登錄攔截了。

回答3:

你把你實際獲得的內容打印或者保存完了,看看是什么內容。估計是返回的內容跟你的 Xpath 匹配不上,該登錄的登錄啊。

標簽: Python 編程
主站蜘蛛池模板: 敦化市| 马尔康县| 石城县| 图片| 保靖县| 浦城县| 泽州县| 衡南县| 台山市| 蓬莱市| 绍兴市| 卓资县| 鹿泉市| 安溪县| 永新县| 思南县| 固镇县| 南召县| 忻州市| 什邡市| 清原| 锡林浩特市| 开远市| 桐庐县| 禄劝| 五常市| 自贡市| 庆元县| 鹤壁市| 佛冈县| 菏泽市| 苍山县| 焦作市| 贵州省| 江达县| 都兰县| 石屏县| 祁连县| 吉安市| 巨鹿县| 类乌齐县|