国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python:爬蟲的中文編碼問題?

瀏覽:179日期:2022-08-26 10:56:16

問題描述

爬取中文網頁后正則匹配出中文,得打UTF-8的編碼字符網頁爬蟲 - Python:爬蟲的中文編碼問題?

將其輸出為.csv文件網頁爬蟲 - Python:爬蟲的中文編碼問題?

在.CSV中顯示為亂碼網頁爬蟲 - Python:爬蟲的中文編碼問題?

用記事本打開.csv又可以正常顯示為中文網頁爬蟲 - Python:爬蟲的中文編碼問題?

有沒有大神指點是怎么一回事?怎樣才能在Excel里直接看到中文?

問題解答

回答1:

簡單地方法是用pandas的to_excel方法轉化成.xlsx文件,因為.xlsx默認編碼是默認支持Excel的,區別當然是無法用記事本打開。

import pandas as pda = pd.read_csv(’./test.csv’)a.to_excel(’./test_output.xlsx’, index=False)a.to_excel(’./test_output.csv’, index=False)

我這里沒有windows可以測試,可以嘗試寫入編碼為gb2312或者gbk試試。

表格文件類I/O的話其實pandas更方便一點。

回答2:

abs1=abs1.decode().encode(’gbk’)

回答3:

excel默認使用的是GBK編碼。

回答4:

新建一個excel文件,然后點 數據 自文本,導入csv文件

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 丰镇市| 舟山市| 南溪县| 句容市| 文水县| 柳河县| 田东县| 浦县| 新宾| 韩城市| 黑水县| 中宁县| 金阳县| 吕梁市| 星子县| 罗山县| 齐河县| 汉中市| 固安县| 仪陇县| 库伦旗| 堆龙德庆县| 贡觉县| 临泉县| 库伦旗| 泰兴市| 乌兰县| 晋城| 龙海市| 樟树市| 七台河市| 志丹县| 鹿泉市| 海原县| 阳泉市| 武冈市| 双江| 黎川县| 新密市| 利川市| 华安县|