国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

javascript - Python 爬蟲 Ajax 頁面直接request獲取居然速度比selenium慢。

瀏覽:80日期:2022-08-04 16:42:25

問題描述

因為在爬取的網(wǎng)站需要賬號登陸,不方便公開。因此我只能這樣大致性的咨詢,實在抱歉。

我需要爬一個目標網(wǎng)站的數(shù)據(jù),發(fā)現(xiàn)在點擊下一頁時候,網(wǎng)址并沒有改變.通過源碼確定是使用了js外加ajax的樣子.通過chrome的控制臺,捕獲到點擊下一頁時候,向指定地址發(fā)送了一條帶多個參數(shù)的get指令。

原先采用selenium+phantomjs的方式暴力無腦方式爬取,一個頁面大概5S左右就能獲取,實際用瀏覽器打開也是這個速度。為了爬取大量的數(shù)據(jù),準備改用多線程+直接requests.get目標地址的方式來采集,但是發(fā)現(xiàn)采集速度非常的慢,從5S降到的20s左右。

請教下,出現(xiàn)這樣現(xiàn)象的原因可能是什么?我該如何解決?請指教

問題解答

回答1:

抱歉 浪費了各位的時間- -是我開始測試的時候,周圍有人再下迅雷,網(wǎng)絡炸了。抱歉 抱歉

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 阿瓦提县| 大化| 呼玛县| 若尔盖县| 崇义县| 阳谷县| 晴隆县| 潜山县| 广昌县| 吕梁市| 凤翔县| 襄樊市| 毕节市| 平乐县| 晋宁县| 东平县| 淮阳县| 绥宁县| 隆回县| 鸡西市| 安丘市| 梧州市| 邳州市| 镇赉县| 宁河县| 临沧市| 阜宁县| 定兴县| 蒲城县| 虹口区| 平谷区| 文成县| 左权县| 三亚市| 黄平县| 正蓝旗| 亚东县| 关岭| 武定县| 交口县| 门源|