国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

淺析Python 多行匹配模式

瀏覽:5日期:2022-07-16 13:14:06

問題

你正在試著使用正則表達式去匹配一大塊的文本,而你需要跨越多行去匹配。

解決方案

這個問題很典型的出現在當你用點(.)去匹配任意字符的時候,忘記了點(.)不能匹配換行符的事實。比如,假設你想試著去匹配C語言分割的注釋:

>>> comment = re.compile(r’/*(.*?)*/’)>>> text1 = ’/* this is a comment */’>>> text2 = ’’’/* this is a... multiline comment */... ’’’>>>>>> comment.findall(text1)[’ this is a comment ’]>>> comment.findall(text2)[]>>>

為了修正這個問題,你可以修改模式字符串,增加對換行的支持。比如:

>>> comment = re.compile(r’/*((?:.|n)*?)*/’)>>> comment.findall(text2)[’ this is an multiline comment ’]>>>

在這個模式中,(?:.|n) 指定了一個非捕獲組(也就是它定義了一個僅僅用來做匹配,而不能通過單獨捕獲或者編號的組)。

討論

re.compile() 函數接受一個標志參數叫 re.DOTALL ,在這里非常有用。它可以讓正則表達式中的.匹配包括換行符在內的任意字符。比如:

>>> comment = re.compile(r’/*(.*?)*/’, re.DOTALL)>>> comment.findall(text2)[’ this is an multiline comment ’]

對于簡單的情況使用 re.DOTALL 標記參數工作的很好,但是如果模式非常復雜或者是為了構造字符串令牌而將多個模式合并起來(2.18節有詳細描述),這時候使用這個標記參數就可能出現一些問題。如果讓你選擇的話,最好還是定義自己的正則表達式模式,這樣它可以在不需要額外的標記參數下也能工作的很好。

以上就是淺析Python 多行匹配模式的詳細內容,更多關于Python 多行匹配模式的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 阳原县| 乐陵市| 卓资县| 凤冈县| 马山县| 旬阳县| 平潭县| 宜昌市| 澄迈县| 怀来县| 天祝| 军事| 阿合奇县| 鄂温| 红安县| 建水县| 吴江市| 玉龙| 宁南县| 海淀区| 含山县| 固阳县| 蒙城县| 兴和县| 建昌县| 周宁县| 德江县| 海口市| 武川县| 赫章县| 新蔡县| 钟祥市| 博湖县| 乃东县| 曲靖市| 靖边县| 郎溪县| 岳池县| 扶风县| 霸州市| 明光市|