Java正則表達(dá)式API詳解
Java中正則表達(dá)式相關(guān)的類都在java.util.regex之內(nèi),一般來說,主要用到的是這兩個類:java.util.regex.Pattern和java.util.regex.Matcher。Pattern對應(yīng)正則表達(dá)式,一個Pattern與一個String對象關(guān)聯(lián),生成一個Matcher,它對應(yīng)Pattern在String中的一次匹配; 調(diào)用Matcher對象的find()方法,Matcher對象就會更新為下一次匹配的匹配信息。示例:
Pattern pattern = Pattern.compile('d{4}-d{2}-]]d{2}');String string = '2010-12-20 2011-02-14';Matcher matcher = pattern.matcher(string);while(matcher.find()) { System.out.println(matcher.group(0));}
Pattern
Pattern是Java語言中的正則表達(dá)式對象。要使用正則表達(dá)式,首先必須從字符串“編譯”出Pattern對象,這需要用到Pattern.compile(String regex)方法。
Pattern pattern = Pattern.compile('a.b+');
如果要指定匹配模式,可以在表達(dá)式中使用(?modifier)修飾符指定,也可以使用預(yù)定義常量。下面的兩個Pattern對象的生成方法不同,結(jié)果卻是等價的。
Pattern pattern = Pattern.compile('(?i)a.b+');Pattern pattern = Pattern.compile('a.b+',Pattern.CASE_INSENSITIVE);
如果要同時指定多種模式,可以連寫模式修飾符,也可以直接用|運(yùn)算符將預(yù)定義常量連接起來,以下兩個Pattern對象也是等價的。
Pattern pattern = Pattern.compile('(?is)a.b+');Pattern pattern = Pattern.compile('a.b+',Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
下面介紹Pattern的主要成員方法:
1. static boolean matches(String regex.CharSequence input)
這個方法可以檢驗(yàn)字符串input能否由正則表達(dá)式regex匹配,因?yàn)槭庆o態(tài)方法,所以不需要編譯生成各個對象,方便隨手使用。要注意的是,它檢驗(yàn)的是“整個字符串能否由表達(dá)式匹配”,而不是“表達(dá)式能否在字符串中找到匹配”。你可以認(rèn)為regex的首尾自動加上了匹配字符串起始和結(jié)束位置的錨點(diǎn) A和z 。
Pattern.matches('d{6}','a123456'); //falsePattern.matches('d{6}','123456'); //true
2. String[] split(CharSequence text)
通常,Pattern對象需要配合下面將要介紹的Matcher一起完成正則操作。如果只用正則表達(dá)式來切分字符串,只用Pattern的這個方法也可以。
這個方法接收的參數(shù)類型是CharSequence它可能有點(diǎn)陌生,其實(shí)它是String的父類,其他子類還有CharBuffer,StringBuffer,StringBuilder,因而可以應(yīng)對常見的各種表示“字符串”的類。下面的代碼僅以String為例:
String s = '2010-12-20';Pattern pattern = Pattern.compile('s+');for(String part : pattern.split(s)){ System.out.println(part);}
3. String[] split(CharSequence text,int limit)
這個方法與上面的方法很相似,只是多了一個參數(shù)limit,它用來限定返回的String數(shù)組的最大長度。也就是說,它規(guī)定了字符串至多只能“切”limit-1次。如果不需要對字符串比較大,進(jìn)行盡可能多的切分,使用這個方法。
String s = ' 2010-12-20 ';Pattern pattern = Pattern.compile('s+');for(String part : Pattern.split(s,2)){ System.out.println(part);}
既然limit是一個int類型,那么它自然可以設(shè)定為各種值,下表總結(jié)了limit在各個取值區(qū)間對結(jié)果的影響(未指定limit時,最終返回包含n個元素的數(shù)組,實(shí)際能切分的次數(shù)是 n-1 ):
取值 結(jié)果limit < 0等于未設(shè)定limit時,保留末尾的空字符串limit = 0 等于未設(shè)定limit時,切分n-1次,忽略末尾的空字符串0 < limit < n返回數(shù)組包含limit個元素,切分limit-1次,最后一個元素是第limit-1次切分后,右側(cè)剩下的所有文本limit >= n等于未指定limit時4. static String quote(String text)
這個方法用來取消字符串text中所有轉(zhuǎn)義字符的特殊含義,實(shí)質(zhì)就是在字符串首尾添加 Q 和 E。通常,如果需要把某個字符串作為沒有任何特殊意義的正則表達(dá)式(比如從外界讀入的字符串,用在某個復(fù)雜的正則表達(dá)式中),就可以使用這個方法:
'aacb'.matches('a*.b'); //true'a*.b'.matches('a*.b'); //false'a*.b'.matches('a*.b'); //false'a*.b'.matches(Pattern.quote('a*.b'));//true
Matcher
Matcher可以理解為“某次具體匹配的結(jié)果對象”:把編譯好的Pattern對象“應(yīng)用”到某個String對象上,就獲得了作為“本次匹配結(jié)果”的Matcher對象。之后,就可以通過它獲得關(guān)于匹配的信息。
Pattern pattern = Pattern.compile('d{4}-d{2}-d{2}');Matcher matcher = pattern.matcher('2010-12-20 2011-02-14');while(matcher.find()){ System.out.println(matcher.group());}
對編譯好的Pattern對象調(diào)用matcher(String text)方法,傳入要匹配的字符串text,就得到了Matcher對象,每次調(diào)用一次find()方法,如果返回true,就表示“找到一個匹配”,此時可以通過下面的若干方法獲得關(guān)于本次匹配的信息。
1. String group(int n)
返回當(dāng)前匹配中第n對捕獲括號捕獲的文本,如果n為0,則取匹配的全部內(nèi)容;如果n小于0或者大于最大分組編號數(shù),則報錯。
2. String group()
返回當(dāng)前匹配的全部文本,相當(dāng)于group(0)。
3. int groupCount()
返回此Matcher對應(yīng)Pattern對象中包含的捕獲分組數(shù)目,編號為0的默認(rèn)分組不計在內(nèi)。
4. int start(n)
返回當(dāng)前匹配中第n對捕獲括號匹配的文本在原字符串中的起始位置。
5. int start()
返回當(dāng)前匹配的文本在原字符串中的起始位置,相當(dāng)于start(0)。
6. int end(n)
返回當(dāng)前匹配中第n對捕獲括號匹配的文本在原字符串中的結(jié)束位置。
7. int end()
返回當(dāng)前匹配的文本在原字符串中的結(jié)果位置,相當(dāng)于end(0)。
8. String replaceAll(String replacement)
如果進(jìn)行正則表達(dá)式替換,一般用到的是Matcher的replaceAll()方法,它會將原有文本中正則表達(dá)式能匹配的所有文本替換為replaceement字符串。
String
許多時候只需要臨時使用某個正則表達(dá)式,而不需要重復(fù)使用,這時候每次都生成Pattern對象和Matcher對象再操作顯得很煩瑣。所以,Java的String類提供了正則表達(dá)式操作的靜態(tài)成員方法,只需要String對象就可以執(zhí)行正則表達(dá)式操作。
1. boolean matches(String regex)
這個方法判斷當(dāng)前的string對象能否由正則表達(dá)式regex匹配。請注意,這里的“匹配”指的并不是regex能否在String內(nèi)找到匹配,而是指regex匹配整個String對象,因此非常適合用來做數(shù)據(jù)校驗(yàn)。
'123456'.matches('d{6}'); //true'a123456'.matches('d{6}'); //true
2. String replaceFirst(String regex,String replacement)
這個方法用來替換正則表達(dá)式regex在字符串中第一次能匹配的文本,可以在replacement字符串中用$num引用regex中對應(yīng)捕獲分組匹配的文本。
'2010-12-20 2011-02-14'.replaceFirst('(d{4})-(d{2})-(d{2})','$2/$3/$1');
3. String replaceAll(String regex,String replacement)
這個方法用來進(jìn)行所有的替換,它的結(jié)果等同于Matcher類的replaceAll()方法,replacement字符串中也可以用$num的表示法引用regex中對應(yīng)捕獲分組匹配的文本。
'2010-12-20 2011-02-14'.replaceAll('(d{4})-(d{2})-(d{2})','$2/$3/$1');
4. String[] split(String regex)
這個方法等價于Pattern中對應(yīng)的split()方法,此處不再贅述。
5. String[] split(String regex,int limit)
這個方法等價于Pattern中對應(yīng)的split()方法,此處不再贅述。來自:http://my.oschina.net/fhd/blog/370833
相關(guān)文章:
1. idea設(shè)置提示不區(qū)分大小寫的方法2. 使用AJAX(包含正則表達(dá)式)驗(yàn)證用戶登錄的步驟3. Java PreparedStatement用法詳解4. Java實(shí)現(xiàn)的迷宮游戲5. django queryset相加和篩選教程6. IDEA 2020.1.2 安裝教程附破解教程詳解7. Java利用TCP協(xié)議實(shí)現(xiàn)客戶端與服務(wù)器通信(附通信源碼)8. JS圖片懶加載庫VueLazyLoad詳解9. 利用ajax+php實(shí)現(xiàn)商品價格計算10. Spring如何集成ibatis項目并實(shí)現(xiàn)dao層基類封裝

網(wǎng)公網(wǎng)安備