国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python基于wordcloud及jieba實(shí)現(xiàn)中國(guó)地圖詞云圖

瀏覽:7日期:2022-07-21 17:58:44

熱詞圖很酷炫,也非常適合熱點(diǎn)事件,抓住重點(diǎn),以圖文結(jié)合的方式表現(xiàn)出來(lái),很有沖擊力。下面這段代碼是制作熱詞圖的,用到了以下技術(shù):

jieba,把文本分詞

wordcloud,制作熱圖

chardet,辨別文件的編碼格式,其中中文統(tǒng)一為GB18030,更加的兼容

imageio,提取圖片的形狀

其他:自動(dòng)識(shí)別文件編碼,自動(dòng)識(shí)別txt文件,圖片文件名與txt文件一致,使用的是四大名著的文本(自行百度),部分中國(guó)地圖

上代碼:

import osimport jiebaimport wordcloudimport chardetimport imageio directory = 'D:'mask = imageio.imread(r'D:map.jpg') # 用于最后圖像圖形 directory_lists = os.scandir(directory)for directory_list in directory_lists: if directory_list.is_dir() or directory_list.path.split(’.’)[-1] != 'txt': continue with open(directory_list.path, ’rb’) as fd: coding = chardet.detect(fd.read()[:1000])[’encoding’] if coding.upper() == ’GB2312’ or coding == ’GBK’: coding = ’GB18030’ file = open(directory_list.path, ’r’, encoding=coding) text = file.read() file.close() jieba_text = ’ ’.join(jieba.lcut(text)) w = wordcloud.WordCloud(height=800, width=1600, font_path=’msyh.ttc’, background_color=’white’, stopwords={’Page’}, mask=mask) w.generate(jieba_text) w.to_file(’{}.png’.format(directory_list.path.split(’.’)[0]))

輸出:

水滸傳的如下

Python基于wordcloud及jieba實(shí)現(xiàn)中國(guó)地圖詞云圖

西游記的如下

Python基于wordcloud及jieba實(shí)現(xiàn)中國(guó)地圖詞云圖

仔細(xì)看輸出的內(nèi)容,還是挺有意思的,哈哈哈。

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: python
相關(guān)文章:
主站蜘蛛池模板: 枞阳县| 沭阳县| 红安县| 克什克腾旗| 秦安县| 南昌县| 顺平县| 穆棱市| 清涧县| 绍兴县| 曲阳县| 南昌县| 托克逊县| 牡丹江市| 罗平县| 海原县| 信宜市| 惠水县| 高淳县| 泗洪县| 余庆县| 洪雅县| 新郑市| 皋兰县| 海晏县| 电白县| 淳安县| 光泽县| 天水市| 天柱县| 屯门区| 扎赉特旗| 闻喜县| 阜平县| 通江县| 海淀区| 木里| 含山县| 新建县| 定日县| 辽源市|