国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

網(wǎng)頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

瀏覽:129日期:2022-09-17 10:49:15

問題描述

用scrapy爬了圖書館書籍的書名和評論,用Chrome的檢查拔下來的Xpath,但是運(yùn)行爬蟲返回的是空元素,請問各位哪里出了問題,謝謝大家。截圖:

網(wǎng)頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

附上我的Scrapy源碼,請大家多指教,謝謝!

from scrapy import Spiderfrom scrapy.selector import Selectorfrom CommentCrawl.items import CommentcrawlItemclass commentcrawl(Spider): name = 'commentcrawl' allowed_domains = ['http://opac.lib.bnu.edu.cn:8080'] start_urls = ['http://opac.lib.bnu.edu.cn:8080/F/S9Q2QIQV5D9R9HBHPI2KNN8JH11TRIRSIEPKYQLTAQQ17LA6B6-16834?func=full-set-set&set_number=010408&set_entry=000001&format=999', ] def parse(self,response):item = CommentcrawlItem()item[’name’] = Selector(response).xpath(’//*[@id='details2']/table/tbody/tr[1]/td[2]/a/text()’).extract()item[’comment’] = Selector(response).xpath(’//*[@id='localreview']/text()’).extract()yield item

問題解答

回答1:

頁面需要登錄才能訪問,缺少登錄操作。

回答2:

網(wǎng)頁爬蟲 - Python小白用Scrapy爬蟲返回的是空元素,請問各位大神哪里出了問題?

頁面被登錄攔截了。

回答3:

你把你實(shí)際獲得的內(nèi)容打印或者保存完了,看看是什么內(nèi)容。估計(jì)是返回的內(nèi)容跟你的 Xpath 匹配不上,該登錄的登錄啊。

標(biāo)簽: Python 編程
主站蜘蛛池模板: 长兴县| 乾安县| 邵阳市| 平武县| 新丰县| 台前县| 岐山县| 柳河县| 银川市| 祥云县| 横峰县| 板桥市| 安康市| 宾川县| 都安| 永福县| 太仆寺旗| 滨海县| 梓潼县| 甘孜县| 浙江省| 藁城市| 河源市| 辉县市| 休宁县| 水富县| 莱阳市| 新建县| 英超| 麦盖提县| 清镇市| 玉龙| 南充市| 民权县| 深水埗区| 玉环县| 红原县| 泰和县| 绵竹市| 庆阳市| 玛沁县|