文章詳情頁

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

瀏覽：202日期：2022-07-24 08:56:37

問題描述

想用urllib抓取上交所股票列表的xls下載鏈接，如下圖紅色小框：

發現抓下來的xls只有報錯信息：

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。

請問要怎樣才能把有內容的xls抓下來？

代碼如下

from urllib import requestfrom datetime import datetime# -*- coding:utf-8 -*-url = ’http://query.sse.com.cn/security/stock/downloadStockListFile.do?’ ’csrcCode=&stockCode=&areaName=&stockType=1’myheaders = [(’User - Agent’, ’Mozilla/5.0 (Windows; U; Windows NT 5.2) AppleWebKit/525.13’ ’ (KHTML, like Gecko) Version/3.1 Safari/525.13’),]opener = request.build_opener()opener.addheaders = myheadersrequest.install_opener(opener)local = '/Users/Mty/Downloads/data/' + str(datetime.now().date()) + ' .xls'request.urlretrieve(url, local)

問題解答

回答1：

可以在標紅線的url上看到返回的公司信息，剩下的就是模擬瀏覽器請求這個url了，request header中的refer一定不能省略，不然會報403

記住要模擬 refer 這一項的值。

http://blog.csdn.net/ssshen14...這個是已有的解決方案

回答2：

查看cookie,referer

Python 編程

上一條：python - 關于樹模型是否需要對離散型變量作onehot？下一條：cookies - python用cookie登錄網站失敗

排行榜

					
					docker start -a dockername 老是卡住，什么情況？
python中merge后文件莫名變得非常大
css3 - [CSS] 動畫效果 3D翻轉bug
css3 - 純css實現點擊特效
希望講講異常處理
javascript - 關于<a>元素與<input>元素的JS事件運行問題
mysql - 記得以前在哪里看過一個估算時間的網站
docker內創建jenkins訪問另一個容器下的服務器問題
java - 為什么第一個線程已經釋放了鎖，第二個線程卻不行？
在windows下安裝docker  Toolbox 啟動Docker Quickstart Terminal 失敗！
docker gitlab 如何git clone？
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

python - 用urllib抓取網頁上的下載鏈接，目標文件是xls形式，但發現抓下來的xls是空表，里面只有一句報錯信息，求幫助。