淺析Python 多行匹配模式
問題
你正在試著使用正則表達(dá)式去匹配一大塊的文本,而你需要跨越多行去匹配。
解決方案
這個問題很典型的出現(xiàn)在當(dāng)你用點(.)去匹配任意字符的時候,忘記了點(.)不能匹配換行符的事實。比如,假設(shè)你想試著去匹配C語言分割的注釋:
>>> comment = re.compile(r’/*(.*?)*/’)>>> text1 = ’/* this is a comment */’>>> text2 = ’’’/* this is a... multiline comment */... ’’’>>>>>> comment.findall(text1)[’ this is a comment ’]>>> comment.findall(text2)[]>>>
為了修正這個問題,你可以修改模式字符串,增加對換行的支持。比如:
>>> comment = re.compile(r’/*((?:.|n)*?)*/’)>>> comment.findall(text2)[’ this is an multiline comment ’]>>>
在這個模式中,(?:.|n) 指定了一個非捕獲組(也就是它定義了一個僅僅用來做匹配,而不能通過單獨捕獲或者編號的組)。
討論
re.compile() 函數(shù)接受一個標(biāo)志參數(shù)叫 re.DOTALL ,在這里非常有用。它可以讓正則表達(dá)式中的.匹配包括換行符在內(nèi)的任意字符。比如:
>>> comment = re.compile(r’/*(.*?)*/’, re.DOTALL)>>> comment.findall(text2)[’ this is an multiline comment ’]
對于簡單的情況使用 re.DOTALL 標(biāo)記參數(shù)工作的很好,但是如果模式非常復(fù)雜或者是為了構(gòu)造字符串令牌而將多個模式合并起來(2.18節(jié)有詳細(xì)描述),這時候使用這個標(biāo)記參數(shù)就可能出現(xiàn)一些問題。如果讓你選擇的話,最好還是定義自己的正則表達(dá)式模式,這樣它可以在不需要額外的標(biāo)記參數(shù)下也能工作的很好。
以上就是淺析Python 多行匹配模式的詳細(xì)內(nèi)容,更多關(guān)于Python 多行匹配模式的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. php使用正則驗證密碼字段的復(fù)雜強(qiáng)度原理詳細(xì)講解 原創(chuàng)2. Jsp+Servlet實現(xiàn)文件上傳下載 文件列表展示(二)3. 基于PHP做個圖片防盜鏈4. XML在語音合成中的應(yīng)用5. Jsp servlet驗證碼工具類分享6. HTML5實戰(zhàn)與剖析之觸摸事件(touchstart、touchmove和touchend)7. 基于javaweb+jsp實現(xiàn)企業(yè)車輛管理系統(tǒng)8. ASP將數(shù)字轉(zhuǎn)中文數(shù)字(大寫金額)的函數(shù)9. asp.net core 認(rèn)證和授權(quán)實例詳解10. jscript與vbscript 操作XML元素屬性的代碼
