国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

正則表達式 - 請問用 Python 如何匹配漢語拼音?

瀏覽:162日期:2022-06-30 09:24:43

問題描述

比如用正則表達式匹配出 shá 這個拼音。 ps:之前說的可能不明確,我用了 “ 比如 ” 兩字哈,就是待處理文本里有拼音,但是不知道具體拼音是什么,需要找出這些拼音,待處理文本會有 中文、拼音、符號(,。:之類的),所以請不要回答諸如re.search(u’shá’,text) 要正則哈,不是簡單固定的字符串。。。

問題解答

回答1:

import reregex = re.compile(r’b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńň?ɑɡ]+[a-z]*b’)text = 'Thǐs ís à pìnyin abóut shá'm = regex.findall(text)print(m)

匹配結果:[’ís’, ’à’, ’pìnyin’, ’abóut’, ’shá’]沒有匹配第一個Thǐs,因為默認拼音都是小寫,排除了大寫。

回答2:

你是要匹配所有合法的拼音嗎?

如果是,你去找個字典的拼音索引,把里邊的所有拼音全部 | 到一起就可以了。也只能這樣,因為拼音不是根據正則,或者其它某種機械的規則定義出來的。你想不漏又不多就只能這樣了,反正也沒多少個。

回答3:

>>> import re>>> d=’shá’>>> data=’This is a pinyin about shá’>>> re.search(d,data)<_sre.SRE_Match at 0x404e308>

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 黎城县| 贡嘎县| 乌兰浩特市| 财经| 平武县| 桐柏县| 郎溪县| 宜丰县| 祁东县| 巩义市| 乌苏市| 平泉县| 荥经县| 长宁区| 松原市| 海口市| 尉氏县| 舟山市| 方城县| 甘德县| 拉孜县| 通化县| 剑川县| 商丘市| 孝昌县| 彰武县| 惠东县| 肃南| 仁怀市| 西乌珠穆沁旗| 台州市| 休宁县| 阿勒泰市| 凌云县| 会东县| 昭觉县| 哈尔滨市| 乐平市| 内黄县| 仙居县| 资溪县|