python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analysetext=’安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開’Key=jieba.analyse.extract_tags(text,topK=3)print(Key)
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 第一個參數(shù):待提取關(guān)鍵詞的文本 第二個參數(shù):返回關(guān)鍵詞的數(shù)量,重要性從高到低排序 第三個參數(shù):是否同時返回每個關(guān)鍵詞的權(quán)重 第四個參數(shù):詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關(guān)鍵詞
代碼如下:
#!/usr/bin/env python# -*- coding: utf-8 -*-# @File : jieba.analyse.py# @Author: 趙路倉# @Date : 2020/3/14# @Desc : 提取關(guān)鍵字# @Contact : 398333404@qq.comimport jieba.analyse# 字符串前面加u表示使用unicode編碼content = u’安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發(fā)技術(shù),我們預(yù)先開展了水深1500米管道式油氣水分離器的概念設(shè)計。通過該研究,提出適合海洋環(huán)境的體積小、重量輕、分離效率高、便于操作和維護(hù)的新型油氣水三相分離器,使其成為海洋深水油氣田開’keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())# 訪問提取結(jié)果for item in keywords: # 分別為關(guān)鍵詞和相應(yīng)的權(quán)重 print(item[0], item[1])
以上就是python 利用jieba.analyse進(jìn)行 關(guān)鍵詞提取的詳細(xì)內(nèi)容,更多關(guān)于python 關(guān)鍵詞提取的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向2. windows服務(wù)器使用IIS時thinkphp搜索中文無效問題3. PHP設(shè)計模式中工廠模式深入詳解4. 淺談python出錯時traceback的解讀5. .NET中l(wèi)ambda表達(dá)式合并問題及解決方法6. Python importlib動態(tài)導(dǎo)入模塊實現(xiàn)代碼7. python matplotlib:plt.scatter() 大小和顏色參數(shù)詳解8. Ajax實現(xiàn)表格中信息不刷新頁面進(jìn)行更新數(shù)據(jù)9. 利用promise及參數(shù)解構(gòu)封裝ajax請求的方法10. JSP數(shù)據(jù)交互實現(xiàn)過程解析
