文章詳情頁

Python獲取百度熱搜的完整代碼

瀏覽：19日期：2022-06-23 10:18:44

好久沒寫了，就把上課做的一個小東西拿出來分享一下吧。百度網頁截圖如下 ↓↓↓

Python獲取百度熱搜的完整代碼

程序運行輸出結果截圖 ↓↓↓

Python獲取百度熱搜的完整代碼

上代碼 ↓↓↓

from lxml import etreefrom lxml import htmlimport requestsheaders={’User-Agent’:’Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.63 Safari/537.36’}page = requests.get('https://www.baidu.com',headers=headers)html = page.text#print(source1)# 從字符串解析element = etree.HTML(html)# 元素列表，獲取的方式列出了如下兩種# ps = element.xpath(’//*[@id='hotsearch-content-wrapper']/li/a/span[2]’)ps = element.xpath(’//*[@class='title-content-title']’)#熱搜文本內容text = []if len(ps) > 0: for p in ps: #輸出節點的文本 text1 = p.text text.append(text1)else: print('空') x = element.xpath(’//*[@class='s-hotsearch-content']/li’)#熱搜文本對應的排名index = []for x1 in x: #獲取節點的屬性 index1 = x1.get('data-index') index.append(index1)print(text) print(index)#定義一個對文本和排名進行匹配的函數，返回一個字典型數據def PP(index_array,text_array): x = {} i = 0 for index_a in index_array: #index_a = int(index_a)x[index_a] = text_array[i] i = i + 1 return xre_text = PP(index,text)#對字典性數據按key進行排序，即key=lambda re:re[0]，排序完成后再轉換為字典型數據last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此這篇關于Python獲取百度熱搜的完整代碼的文章就介紹到這了,更多相關Python 百度熱搜內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

百度 Python

上一條：Python 把兩層列表展開平鋪成一層(5種實現方式)下一條：詳解Python小數據池和代碼塊緩存機制

相關文章：

1. 資深程序員：給Python軟件開發測試的25個忠告！2. notepad++運行java的方法步驟3. vue項目如何監聽localStorage或sessionStorage的變化4. JS 實現10進制轉換36進制的示例代碼5. PHP中Too few arguments to function的問題及解決6. 一張圖告訴你：Android系統哪代強？7. Asp.net Core項目配置HTTPS支持8. 詳解Java中的不可變對象9. jsp 使用request為頁面添加靜態數據的實例10. vs code運行vue項目的方法步驟

排行榜

					
					資深程序員：給Python軟件開發測試的25個忠告！
Asp.net Core項目配置HTTPS支持
jsp 使用request為頁面添加靜態數據的實例
PHP中Too few arguments to function的問題及解決
IntelliJ IDEA設置背景圖片的方法步驟
詳解Java中的不可變對象
談談JAVA中的調用方式
JS 實現10進制轉換36進制的示例代碼
Python獲取百度熱搜的完整代碼
在Java中動態執行類的靜態方法
vue項目如何監聽localStorage或sessionStorage的變化