国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python:爬蟲的中文編碼問題?

瀏覽:151日期:2022-08-26 10:56:16

問題描述

爬取中文網頁后正則匹配出中文,得打UTF-8的編碼字符網頁爬蟲 - Python:爬蟲的中文編碼問題?

將其輸出為.csv文件網頁爬蟲 - Python:爬蟲的中文編碼問題?

在.CSV中顯示為亂碼網頁爬蟲 - Python:爬蟲的中文編碼問題?

用記事本打開.csv又可以正常顯示為中文網頁爬蟲 - Python:爬蟲的中文編碼問題?

有沒有大神指點是怎么一回事?怎樣才能在Excel里直接看到中文?

問題解答

回答1:

簡單地方法是用pandas的to_excel方法轉化成.xlsx文件,因為.xlsx默認編碼是默認支持Excel的,區別當然是無法用記事本打開。

import pandas as pda = pd.read_csv(’./test.csv’)a.to_excel(’./test_output.xlsx’, index=False)a.to_excel(’./test_output.csv’, index=False)

我這里沒有windows可以測試,可以嘗試寫入編碼為gb2312或者gbk試試。

表格文件類I/O的話其實pandas更方便一點。

回答2:

abs1=abs1.decode().encode(’gbk’)

回答3:

excel默認使用的是GBK編碼。

回答4:

新建一個excel文件,然后點 數據 自文本,導入csv文件

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 青川县| 临澧县| 濮阳县| 麻江县| 浏阳市| 南木林县| 洛扎县| 营山县| 保定市| 宜昌市| 夏邑县| 汝阳县| 上杭县| 广德县| 额尔古纳市| 大悟县| 昭通市| 萝北县| 西贡区| 灵宝市| 恭城| 公主岭市| 南华县| 封丘县| 安徽省| 辰溪县| 新民市| 桐乡市| 灌南县| 图木舒克市| 五大连池市| 芮城县| 鄂托克旗| 博乐市| 吴旗县| 固阳县| 炎陵县| 禹城市| 泸州市| 九龙坡区| 娱乐|