国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

selenium - 請教一下 Python 爬蟲工具

瀏覽:157日期:2022-06-27 16:46:59

問題描述

1)我要抓的是 Instagram 某明星的粉絲2)Instagram pc 站使用了大量的 js 渲染3)沒寫過爬蟲,老板明天就要數(shù)據(jù)

我目前使用的是BeautifulSoup, selenium 和phantomjs

代碼 demo 大概是

driver = webdriver.PhantomJS(self.browser)driver.get(self.url)driver.implicitly_wait(3)element = driver.find_element_by_class_name('_s53mj')element.click()html = driver.page_sourcesoup = BeautifulSoup(html)

問題是:1) 我不知道click 有沒有執(zhí)行成功, click 的元素對不對, driver 好像沒有返回值給我參考2) 即使 click 成功了, 但是他是不是只調(diào)了 js里的 click() 方法,并沒有觸發(fā) target 怎么辦3)我不知道是先渲染page_source, 還是 應該先 click, 假設執(zhí)行成功了 click, 是不是也不會再 source 里返回了

啊, 謝各位爬蟲大佬了

問題解答

回答1:

說的是什么意思?百思不得其解啊。。。

selenium自動化,click能模仿用戶點擊,就跟你自己在頁面上點擊一樣,一切都在虛擬瀏覽器驅(qū)動中進行。

看你的業(yè)務邏輯啊。。。比如有些數(shù)據(jù)要點擊后才有,那就先click再獲取源代碼。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 遵义市| 伊吾县| 莆田市| 通城县| 广东省| 康平县| 顺昌县| 黄骅市| 古田县| 临朐县| 宝坻区| 东莞市| 北安市| 玛纳斯县| 上林县| 武宁县| 蛟河市| 太原市| 鹿邑县| 伊宁县| 吴堡县| 苗栗市| 湘阴县| 五河县| 新郑市| 胶南市| 大埔区| 乌恰县| 教育| 平南县| 汾西县| 宽城| 黎城县| 上高县| 筠连县| 亳州市| 桃源县| 佛冈县| 洛隆县| 博白县| 多伦县|