国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python常用的正則表達(dá)式處理函數(shù)詳解

瀏覽:2日期:2022-08-03 13:39:49

正則表達(dá)式是一個(gè)特殊的字符序列,用于簡(jiǎn)潔表達(dá)一組字符串特征,檢查一個(gè)字符串是否與某種模式匹配,使用起來(lái)十分方便。

在Python中,我們通過(guò)調(diào)用re庫(kù)來(lái)使用re模塊:

import re

正則表達(dá)式語(yǔ)法模式和操作符詳見(jiàn):https://www.runoob.com/python/python-reg-expressions.html#flags

下面介紹Python常用的正則表達(dá)式處理函數(shù)。

re.match函數(shù)

re.match 函數(shù)從字符串的起始位置匹配正則表達(dá)式,返回match對(duì)象,如果不是起始位置匹配成功的話,match()就返回None。

re.match(pattern, string, flags=0)

pattern:匹配的正則表達(dá)式。

string:待匹配的字符串。

flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。具體參數(shù)為:

re.I:忽略大小寫。

re.L:表示特殊字符集 w, W, b, B, s, S 依賴于當(dāng)前環(huán)境。

re.M:多行模式。

re.S:即 . ,并且包括換行符在內(nèi)的任意字符(. 不包括換行符)。

re.U:表示特殊字符集 w, W, b, B, d, D, s, S 依賴于 Unicode 字符屬性數(shù)據(jù)庫(kù)。

re.X:為了增加可讀性,忽略空格和 # 后面的注釋。

import re#從起始位置匹配r1=re.match(’abc’,’abcdefghi’)print(r1)#不從起始位置匹配r2=re.match(’def’,’abcdefghi’)print(r2)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

其中,span表示匹配成功的整個(gè)子串的索引。

使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。

group(num):匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups():返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。

import res=’This is a demo’r1=re.match(r’(.*) is (.*)’,s)r2=re.match(r’(.*) is (.*?)’,s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

上述代碼中的(.*)和(.*?)表示正則表達(dá)式的貪婪匹配與非貪婪匹配,詳情見(jiàn)此:https://www.jb51.net/article/31491.htm

re.search函數(shù)

re.search函數(shù)掃描整個(gè)字符串并返回第一個(gè)成功的匹配,如果匹配成功則返回match對(duì)象,否則返回None。

re.search(pattern, string, flags=0)

pattern:匹配的正則表達(dá)式。

string:待匹配的字符串。

flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等等。

import re#從起始位置匹配r1=re.search(’abc’,’abcdefghi’)print(r1)#不從起始位置匹配r2=re.search(’def’,’abcdefghi’)print(r2)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

使用group(num) 或 groups() 匹配對(duì)象函數(shù)來(lái)獲取匹配表達(dá)式。

group(num=0):匹配的整個(gè)表達(dá)式的字符串,group() 可以一次輸入多個(gè)組號(hào),這時(shí)它將返回一個(gè)包含那些組所對(duì)應(yīng)值的元組。

groups():返回一個(gè)包含所有小組字符串的元組,從 1 到 所含的小組號(hào)。

import res=’This is a demo’r1=re.search(r’(.*) is (.*)’,s)r2=re.search(r’(.*) is (.*?)’,s)print(r1.group())print(r1.group(1))print(r1.group(2))print(r1.groups())print()print(r2.group())print(r2.group(1))print(r2.group(2))print(r2.groups())

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

從上面不難發(fā)現(xiàn)re.match與re.search的區(qū)別:re.match只匹配字符串的起始位置,只要起始位置不符合正則表達(dá)式就匹配失敗,而re.search是匹配整個(gè)字符串,直到找到一個(gè)匹配為止。

re.compile 函數(shù)

compile 函數(shù)用于編譯正則表達(dá)式,生成一個(gè)正則表達(dá)式對(duì)象,供 match() 和 search() 這兩個(gè)函數(shù)使用。

re.compile(pattern[, flags])

pattern:一個(gè)字符串形式的正則表達(dá)式。

flags:可選,表示匹配模式,比如忽略大小寫,多行模式等。

import re#匹配數(shù)字r=re.compile(r’d+’) r1=r.match(’This is a demo’)r2=r.match(’This is 111 and That is 222’,0,27)r3=r.match(’This is 111 and That is 222’,8,27) print(r1)print(r2)print(r3)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

findall函數(shù)

搜索字符串,以列表形式返回正則表達(dá)式匹配的所有子串,如果沒(méi)有找到匹配的,則返回空列表。

需要注意的是,match 和 search 是匹配一次,而findall 匹配所有。

findall(string[, pos[, endpos]])

string:待匹配的字符串。

pos:可選參數(shù),指定字符串的起始位置,默認(rèn)為0。

endpos:可選參數(shù),指定字符串的結(jié)束位置,默認(rèn)為字符串的長(zhǎng)度。

import re#匹配數(shù)字r=re.compile(r’d+’) r1=r.findall(’This is a demo’)r2=r.findall(’This is 111 and That is 222’,0,11)r3=r.findall(’This is 111 and That is 222’,0,27) print(r1)print(r2)print(r3)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

re.finditer函數(shù)

和 findall 類似,在字符串中找到正則表達(dá)式所匹配的所有子串,并把它們作為一個(gè)迭代器返回。

re.finditer(pattern, string, flags=0)

pattern:匹配的正則表達(dá)式。

string:待匹配的字符串。

flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如是否區(qū)分大小寫,多行匹配等。

import re r=re.finditer(r’d+’,’This is 111 and That is 222’)for i in r: print (i.group())

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

re.split函數(shù)

將一個(gè)字符串按照正則表達(dá)式匹配的子串進(jìn)行分割后,以列表形式返回。

re.split(pattern, string[, maxsplit=0, flags=0])

pattern:匹配的正則表達(dá)式。

string:待匹配的字符串。

maxsplit:分割次數(shù),maxsplit=1分割一次,默認(rèn)為0,不限次數(shù)。

flags:標(biāo)志位,用于控制正則表達(dá)式的匹配方式,如:是否區(qū)分大小寫,多行匹配等。

import re r1=re.split(’W+’,’This is 111 and That is 222’) r2=re.split(’W+’,’This is 111 and That is 222’,maxsplit=1) r3=re.split(’d+’,’This is 111 and That is 222’) r4=re.split(’d+’,’This is 111 and That is 222’,maxsplit=1) print(r1)print(r2)print(r3)print(r4)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

re.sub函數(shù)

re.sub函數(shù)用于替換字符串中的匹配項(xiàng)。

re.sub(pattern, repl, string, count=0, flags=0)

pattern:正則中的模式字符串。

repl:替換的字符串,也可為一個(gè)函數(shù)。

string:要被查找替換的原始字符串。

count:模式匹配后替換的最大次數(shù),默認(rèn)0表示替換所有的匹配。

import re r=’This is 111 and That is 222’# 刪除字符串中的數(shù)字r1=re.sub(r’d+’,’’,r)print(r1)# 刪除非數(shù)字的字符串 r2=re.sub(r’D’,’’,r)print(r2)

運(yùn)行結(jié)果:

Python常用的正則表達(dá)式處理函數(shù)詳解

參考資料:

https://www.runoob.com/python/python-reg-expressions.html#flags

到此這篇關(guān)于Python常用的正則表達(dá)式處理函數(shù)詳解的文章就介紹到這了,更多相關(guān)python 正則表達(dá)式處理函數(shù)內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 新绛县| 开远市| 昆明市| 玉树县| 孟州市| 新宾| 寻甸| 双桥区| 铜梁县| 福泉市| 滕州市| 乐陵市| 英超| 浦东新区| 淳安县| 博罗县| 鄂托克旗| 隆安县| 察隅县| 大连市| 五原县| 密山市| 鹤峰县| 额尔古纳市| 陆川县| 古丈县| 永泰县| 九台市| 安国市| 吉木乃县| 霍林郭勒市| 旬邑县| 汝州市| 册亨县| 霍林郭勒市| 广元市| 隆德县| 马边| 黑龙江省| 佛山市| 商城县|