python - Notepad2與PyCharm區別
問題描述
同樣的代碼在 Notepad 環境(測試過記事本)過不了,在 Pycharm 可以過( Python3.5 )代碼:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
這條語句,兩個環境都可以過
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 顯示爬出的網頁,在 cmd 窗口顯示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必須去除無效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
這樣可以過,求解釋
問題解答
回答1:你遇到的可能和我一樣是python編碼問題,或者使用的terminal的編碼支持問題。看看下面的問題。
【python編碼問題?】分享自@SegmentFault,傳送門:/q/10...
相關文章:
1. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?2. javascript - 后臺管理系統左側折疊導航欄數據較多,怎么樣直接通過搜索去定位到具體某一個菜單項位置,并展開當前菜單3. 如何解決docker宿主機無法訪問容器中的服務?4. javascript - Web微信聊天輸入框解決方案5. javascript - 如何使用nodejs 將.html 文件轉化成canvas6. python - Scrapy存在內存泄漏的問題。7. 如何用筆記本上的apache做微信開發的服務器8. CSS3 畫如下圖形9. angular.js - $stateChangeSuccess事件在狀態跳轉的時候不執行?10. android - rxjava merge 返回Object對象數據如何緩存
