国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python - ulipad爬網(wǎng)頁(yè)時(shí)中文為何是16進(jìn)制?

瀏覽:106日期:2022-08-15 18:33:50

問(wèn)題描述

#! /usr/bin/env python#coding=utf-8import urlliburl = 'http://www.tust.edu.cn'content = urllib.urlopen(url).read()print content

python初學(xué)者,也是編程初學(xué)者。上面是代碼,用python2.7編譯的時(shí)候網(wǎng)頁(yè)上的中文可以正常顯示,但是用ulipad編譯的時(shí)候,網(wǎng)頁(yè)中的文字就是以16進(jìn)制的方式顯示的。請(qǐng)問(wèn)這個(gè)是什么問(wèn)題?

我搜索的時(shí)候,看到有的回答說(shuō)是在代碼后面加上encode

然而我在content后面接encode(’utf-8’)或者encode(’gb2312’)的時(shí)候都會(huì)提示報(bào)錯(cuò)

ascii codec can’t decode byte 0Xef in position 0:ordinal not in range

我查了一下,找到了下面這個(gè)網(wǎng)址

http://blog.csdn.net/qian_f/a...

好像是說(shuō)是字符編碼不統(tǒng)一的問(wèn)題。緊接著我查了一下read返回的好像就是byte string呀....

求各位大神解答...

問(wèn)題解答

回答1:

個(gè)人理解,應(yīng)該是read()默認(rèn)的編碼無(wú)法解析網(wǎng)頁(yè)內(nèi)容,查下資料,嘗試在read的括號(hào)內(nèi)指定編碼,應(yīng)該沒(méi)有必要用encode的

回答2:

unicode.encode(content,’utf-8’);

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 盘山县| 罗定市| 班戈县| 镇赉县| 普格县| 宁明县| 准格尔旗| 十堰市| 汾阳市| 图木舒克市| 桐梓县| 望谟县| 钦州市| 乌拉特中旗| 广元市| 外汇| 南阳市| 壤塘县| 白银市| 孝昌县| 咸阳市| 武清区| 天台县| 尼勒克县| 克什克腾旗| 抚州市| 望奎县| 延边| 儋州市| 甘肃省| 黄浦区| 夏津县| 霍林郭勒市| 平南县| 武川县| 台中县| 乐都县| 庆阳市| 多伦县| 奉贤区| 碌曲县|