国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python爬取鏈家二手房的數據

瀏覽:20日期:2022-06-18 17:08:08
目錄一、查找數據所在位置:二、確定數據存放位置:三、獲取html數據:四、解析html,提取有用數據:一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python爬取鏈家二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python爬取鏈家二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息url = ’https://nj.lianjia.com/ershoufang/pg{}/’.format(page)# 請求urlresp = requests.get(url, headers=headers, timeout=10)四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, ’lxml’)# 篩選全部的li標簽sellListContent = soup.select(’.sellListContent li.LOGCLICKDATA’)# 循環遍歷for sell in sellListContent: # 標題 title = sell.select(’div.title a’)[0].string # 先抓取全部的div信息,再針對每一條進行提取 houseInfo = list(sell.select(’div.houseInfo’)[0].stripped_strings) # 樓盤名字 loupan = houseInfo[0] # 對樓盤的信息進行分割 info = houseInfo[0].split(’|’) # 房子類型 house_type = info[1].strip() # 面積大小 area = info[2].strip() # 房間朝向 toward = info[3].strip() # 裝修類型 renovation = info[4].strip() # 房屋地址 positionInfo = ’’.join(list(sell.select(’div.positionInfo’)[0].stripped_strings)) # 房屋總價 totalPrice = ’’.join(list(sell.select(’div.totalPrice’)[0].stripped_strings)) # 房屋單價 unitPrice = list(sell.select(’div.unitPrice’)[0].stripped_strings)[0]

以上就是我的分享,如果有什么不足之處請指出,多交流,謝謝!

以上就是python爬取鏈家二手房的數據的詳細內容,更多關于python爬取鏈家二手房的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 思南县| 益阳市| 淮滨县| 呼和浩特市| 松桃| 芒康县| 荆州市| 新营市| 东至县| 贵德县| 新闻| 日喀则市| 凌源市| 察雅县| 自贡市| 晴隆县| 龙门县| 萨嘎县| 伊川县| 汤原县| 漾濞| 弥渡县| 兖州市| 朝阳市| 阿巴嘎旗| 安新县| 桐梓县| 敖汉旗| 宁陵县| 米林县| 六安市| 岳普湖县| 衡山县| 和顺县| 景泰县| 鄂托克旗| 沈阳市| 泸西县| 礼泉县| 陵水| 隆化县|