国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - 除了代理ip,香港的服務器爬取國內網站還有更好的方法嗎?

瀏覽:112日期:2022-09-22 11:38:38

問題描述

我在做一只淘寶的爬蟲,但是用的是香港的服務器,但是比較困惑:因為每次爬淘寶的首頁時候,就自動給我跳轉到香港淘寶~~導致源代碼和內容都不一樣~請問如果遇到這種情況要怎么處理呢?

簡單來說,比如采集58同城如果我是泉州的,我想采集北京的,要怎么采集?

因為我用我的ip打開會總跳轉到北京,但是直接想采集58首頁的

python - 除了代理ip,香港的服務器爬取國內網站還有更好的方法嗎??![圖片上傳中...]

問題解答

回答1:

禁止重定向,以requests為例子:

r = requests.get(’http://github.com/’, allow_redirects=False)r.status_code # 302r.url # http://github.com, not https.r.headers[’Location’] # https://github.com/ -- the redirect destination回答2:

如果是想采集的北京的,就去打子城名,不過有PGTID保護

http://bj.58.com/?PGTID=0d000...

建義使用selenium

回答3:

有時候服務器會根據你的ip對應的地理位置信息作重定向的,這個你除了找代理應該沒有別的方法了。。

標簽: Python 編程
主站蜘蛛池模板: 金湖县| 阳谷县| 启东市| 神池县| 宣汉县| 淳化县| 嘉义县| 化德县| 咸阳市| 咸宁市| 二连浩特市| 剑河县| 濉溪县| 海原县| 宿迁市| 临高县| 桐庐县| 江达县| 仪征市| 保康县| 云南省| 项城市| 定西市| 柞水县| 治多县| 贡觉县| 平和县| 荥阳市| 宝应县| 永平县| 县级市| 三原县| 公主岭市| 南皮县| 新邵县| 城固县| 崇明县| 措勤县| 游戏| 新巴尔虎左旗| 葫芦岛市|