国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:131日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數據

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調了 js里的 click() 方法,并沒有觸發 target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅動中進行。

看你的業務邏輯啊。。。比如有些數據要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 界首市| 黔江区| 兰溪市| 驻马店市| 寿宁县| 彩票| 台东市| 怀来县| 读书| 旺苍县| 革吉县| 葫芦岛市| 泾川县| 永福县| 玛纳斯县| 翁牛特旗| 浪卡子县| 封丘县| 子长县| 安新县| 华蓥市| 淳化县| 古浪县| 收藏| 溧水县| 太谷县| 安义县| 辽宁省| 原阳县| 马公市| 儋州市| 河南省| 射阳县| 永清县| 靖西县| 阿巴嘎旗| 临沭县| 龙州县| 田东县| 云南省| 改则县|