国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

瀏覽:202日期:2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接,如下圖紅色小框:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

發現抓下來的xls只有報錯信息:

python - 用urllib抓取網頁上的下載鏈接,目標文件是xls形式,但發現抓下來的xls是空表,里面只有一句報錯信息,求幫助。

請問要怎樣才能把有內容的xls抓下來?

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1:

可以在標紅線的url上看到返回的公司信息,剩下的就是模擬瀏覽器請求這個url了,request header中的refer一定不能省略,不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2:

查看cookie,referer

標簽: Python 編程
主站蜘蛛池模板: 寻乌县| 藁城市| 武乡县| 渝中区| 新丰县| 大冶市| 尉氏县| 襄城县| 金沙县| 建阳市| 周至县| 加查县| 山东| 安丘市| 延长县| 西吉县| 宜宾县| 梓潼县| 西盟| 武川县| 巫山县| 明溪县| 寿宁县| 黎川县| 武陟县| 连云港市| 清苑县| 柘城县| 贺兰县| 外汇| 晋江市| 延吉市| 普陀区| 安阳县| 台江县| 伊金霍洛旗| 突泉县| 扎赉特旗| 泰来县| 永宁县| 河津市|