文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽：157日期：2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數(shù)據(jù)

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執(zhí)行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調(diào)了 js里的 click() 方法,并沒有觸發(fā) target 怎么辦3)我不知道是先渲染page_source, 還是應該先 click, 假設執(zhí)行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1：

說的是什么意思？百思不得其解啊。。。

selenium自動化，click能模仿用戶點擊，就跟你自己在頁面上點擊一樣，一切都在虛擬瀏覽器驅(qū)動中進行。

看你的業(yè)務邏輯啊。。。比如有些數(shù)據(jù)要點擊后才有，那就先click再獲取源代碼。

Python 編程

上一條：Python從URL中提取域名下一條：python - sklearn如何訓練大規(guī)模數(shù)據(jù)集

相關文章：

1. javascript - 這不是對象字面量函數(shù)嗎？為什么要new初始化？2. sql語句 - mysql中關聯(lián)表查詢問題3. javascript - 如何將一個div始終固定在某個位置；無論屏幕和分辨率怎么變化；div位置始終不變4. html5 - 有可以一次性把所有 css外部樣式轉(zhuǎn)為html標簽內(nèi)style=" "的方法嗎?5. javascript - vscode alt+shift+f 格式化js代碼，通不過eslint的代碼風格檢查怎么辦。。。6. html - vue項目中用到了elementUI問題7. javascript - 有什么比較好的網(wǎng)頁版shell前端組件？8. javascript - iframe 為什么加載網(wǎng)頁的時候滾動條這樣顯示？9. javascript - [js]為什么畫布里不出現(xiàn)圖片呢？在線等10. javascript - 原生canvas中如何獲取到觸摸事件的canvas內(nèi)坐標?

排行榜

					
					docker gitlab 如何git clone？
debian - docker依賴的aufs-tools源碼哪里可以找到啊？
docker內(nèi)創(chuàng)建jenkins訪問另一個容器下的服務器問題
golang - 用IDE看docker源碼時的小問題
如何解決Centos下Docker服務啟動無響應，且輸入docker命令無響應？
javascript - 求解答：實例對象調(diào)用constructor，此時constructor內(nèi)的this的指向？
javascript - vscode alt+shift+f 格式化js代碼，通不過eslint的代碼風格檢查怎么辦。。。
angular.js - Angular-Strap  模態(tài)框(Modal) 報錯
java - 如何寫一個intellij-idea插件，實現(xiàn)編譯時修改源代碼的目的
IntelliJ IDEA無法解析導入javax.servlet。*;
javascript - iframe 為什么加載網(wǎng)頁的時候滾動條這樣顯示？
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

selenium - 請教一下 Python 爬蟲工具