国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

python 已知一個字符,在一個list中找出近似值或相似值實現(xiàn)模糊匹配

瀏覽:3日期:2022-08-05 09:28:15

已知一個元素,在一個list中找出相似的元素

使用場景:

已知一個其它來源的字符串, 它有可能是不完全與我數(shù)據(jù)庫中相應(yīng)的字符串匹配的,因此,我需要將其轉(zhuǎn)為適合我數(shù)據(jù)庫中的字符串

使用場景太繞了, 直接舉例來說吧

隨便舉例:

按青島城市的城區(qū)來說,

我數(shù)據(jù)庫中存儲的城區(qū)是個list:[’市北區(qū)’, ’市南區(qū)’, ’萊州市’, ’四方區(qū)’]等

從其它的數(shù)據(jù)來源得到一個城區(qū)是:市北

我怎么得到與市北相似相近的市北區(qū)

解決方案:

In [1]: import difflibIn [2]: cityarea_list = [’市北區(qū)’, ’市南區(qū)’, ’萊州市’, ’四方區(qū)’]# 正常情況下,我是這么用的In [3]: a = difflib.get_close_matches(’市北’,cityarea_list,1, cutoff=0.7)In [4]: aOut[4]: [’市北區(qū)’]# 測試關(guān)鍵字改為市區(qū),且要求返回相似度最高的兩個元素In [5]: a = difflib.get_close_matches(’市區(qū)’,cityarea_list,2, cutoff=0.7)In [6]: aOut[6]: [’市南區(qū)’, ’市北區(qū)’]# 測試關(guān)鍵字改為市區(qū), 要求返回相似度最高的一個元素In [7]: a = difflib.get_close_matches(’市區(qū)’,cityarea_list,1, cutoff=0.7)In [8]: aOut[8]: [’市南區(qū)’]

詳解:

difflib是python 自帶的一個方法

返回的結(jié)果是個list

返回的list元素數(shù)量是可控的,

cutoff參數(shù)是0到1的浮點數(shù), 可以調(diào)試模糊匹配的精度,一般為0.6就可以了, 1為精確匹配,

補充拓展:python列表進行模糊查詢

先看一下代碼

a=[’時間1’, ’時間2’, ’時間3’, ’ab’,’asds’]dd = [i for i,x in enumerate(a) if x.find(’s’)!=-1]print(dd)

需要注意的是這個方法只適合與都是字符串的,因為find是字符串重的方法, 如果list中有數(shù)字和None,都是不行的

以上這篇python 已知一個字符,在一個list中找出近似值或相似值實現(xiàn)模糊匹配就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。

標簽: Python 編程
主站蜘蛛池模板: 罗源县| 宁蒗| 祁连县| 高邑县| 襄垣县| 托里县| 清徐县| 札达县| 罗源县| 含山县| 简阳市| 伊宁市| 丰顺县| 金川县| 黄骅市| 理塘县| 新和县| 鹤岗市| 碌曲县| 松原市| 澳门| 东乡族自治县| 汽车| 汉中市| 凤山县| 大姚县| 重庆市| 股票| 明溪县| 霍林郭勒市| 嘉黎县| 巫溪县| 老河口市| 高安市| 宁远县| 云霄县| 陇南市| 连平县| 黔西| 阿鲁科尔沁旗| 涟源市|