網(wǎng)頁爬蟲 - 關(guān)于python3.x 編寫爬蟲異常問題請各位大神幫忙!
問題描述
這段代碼一直出現(xiàn)異常,但只要把導(dǎo)入的庫稍加更改在python2.x中運(yùn)行是沒有問題的,請問大神問題出在哪?出現(xiàn)的異常也總變,小弟初學(xué)爬蟲,請賜教!
import urllib.errorimport urllib.requestimport urllib.parseurl = ’http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=https://www.baidu.com/link HTTP/1.1’data = {}data[’type’]= ’AUTO’data[’i’] = ’I am fine !’data[’doctype’] = ’json’data[’xmlVersion’] = ’1.8’data[’keyfrom’] = ’fanyi.web’data[’ue’] = ’UTF-8’data[’action’] = ’FY_BY_CLICKBUTTON’data[’typoResult’] = ’true’head = {}head[’User-Agent’]= ’Mozilla/5.0 (Windows NT 6.1; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’ try: data = urllib.parse.urlencode(data).encode(’utf-8’) req = urllib.request.Request(url,data,head) response = urllib.request.urlopen(req) html = response.read().decode(’utf-8’) print(html)except urllib.error.HTTPError as e: print (’Error code : ’,e.code)except urllib.error.URLError as e: print (’The reason: ’,e.reason)
昨天是這樣的:
今天運(yùn)行就這樣了:
問題解答
回答1:刪掉url后面 HTTP/1.1,url后面加它干嘛。。
Python3不用解碼和編碼啦,還有些模塊的用法不一樣了,自己看一下Python3的文檔吧
回答3:相關(guān)文章:
1. javascript - vscode alt+shift+f 格式化js代碼,通不過eslint的代碼風(fēng)格檢查怎么辦。。。2. javascript - [js]為什么畫布里不出現(xiàn)圖片呢?在線等3. python - 如何判斷爬蟲已經(jīng)成功登陸?4. html - vue項(xiàng)目中用到了elementUI問題5. html5 - 有可以一次性把所有 css外部樣式轉(zhuǎn)為html標(biāo)簽內(nèi)style=" "的方法嗎?6. javascript - 如何將一個div始終固定在某個位置;無論屏幕和分辨率怎么變化;div位置始終不變7. javascript - 原生canvas中如何獲取到觸摸事件的canvas內(nèi)坐標(biāo)?8. javascript - 有什么比較好的網(wǎng)頁版shell前端組件?9. javascript - 這不是對象字面量函數(shù)嗎?為什么要new初始化?10. javascript - 求解答:實(shí)例對象調(diào)用constructor,此時constructor內(nèi)的this的指向?
