Java中Pattern.compile函数的使用详解

目录 Java Pattern测试数据pile函数的使用 Pattern类的compile()方法还有另一个版本： flag来自以下Pattern类中的常量：我们可以通过[或]( | )操作组合多个标记的功能使用Pattern.COMMENTS(?x)的例子： Pattern测试数据pile函数的相关解释 flag的取值范围如下：

Java Pattern测试数据pile函数的使用

除了Pattern Pattern测试数据pile(String regex),

Pattern类的compile()方法还有另一个版本：

Pattern Pattern测试数据plie(String regex,int flag)，它接受一个标记参数flag，以调整匹配的行为。

flag来自以下Pattern类中的常量：

编译标记效果

Pattern.CANON_EQ	两个字符当且仅当它们的完全规范分解相匹配时，就认为它们是匹配的，例如，如果我们指定这个标记，表达式a\u030A就会匹配字符串？。在默认的情况下，匹配不考虑规范的等价性
Pattern.CASE_INSENSITIVE(?i)	默认情况下，大小写不敏感的匹配假定只有US-ASCII字符集中的字符才能进行。这个标记允许模式匹配不必考虑大小写（大写或小写）。通过指定UNICODE_CASE标记及结合此标记，基于Unicode的大小写不敏感的匹配就可以开启了,也可以使用嵌入的标记表达式?i开启，下同
Pattern.COMMENTS(?x)	在这种模式下，表达式中的空格(不是指\s,单纯指空格)将被忽略掉，并且以#开始直到行末的注释也会被忽略掉。通过嵌入的标记表达式也可以开启Unix的行模式
Pattern.DOTALL(?s)	在dotall模式中，表达式[.]匹配所有字符，包括行终结符。默认情况下，[.]表达式不匹配行终结符
Pattern.MULTLINE(?m)	在多行模式下，表达式^和$分别匹配一行或输入字符串的开始和结束。默认情况下，这些表达式仅匹配输入的完整字符串的开始和结束
Pattern.UNICODE_CASE(?u)	当指定这个标记，并且开启CASE_INSENSITIVE时，大小写不敏感的匹配将按照与Unicode标准相一致的方式进行。默认情况下，大小写不敏感的匹配假定只能在US-ASCII字符集中的字符才能进行
Pattern.UNIX_LINES(?d)	在这种模式下，在.、^和$行为中，只识别行终结符\n

在这些标记中 Pattern.CASE_INSENSITIVE(?i) ，Pattern.MULTLINE(?m)，==Pattern.COMMENTS(?x)==中特别有用。

使用示例如下：

我们可以通过[或]( | )操作组合多个标记的功能

								
									 import   java.util.regex.Matcher; 

									 import   java.util.regex.Pattern; 

									 public   class   ReFlags { 

									    public   static   void   main(String[] args) {   

									     Pattern p=Pattern测试数据pile(  "^java"  ,Pattern.CASE_INSENSITIVE|Pattern.MULTILINE); 

									     /* 

									      * 使用Pattern.CASE_INSENSITIVE（大小写不敏感的匹配）和Pattern.MULTILINE（多行模式）标记，忽略大小写地匹配所有以java开头的行 

									      */ 

									     Matcher m=p.matcher(  "java has regex\nJava has regex\n" 

									       +   "JAVA has pretty good regular expression\n" 

									       +   "Regular expressions are in JavA"  ); 

									     while   (m.find()) {  

									      System.out.println(m.group());  //输出已匹配的部分   

									     } 

									    } 

									 }

输出结果：

java

Java

JAVA

使用Pattern.COMMENTS(?x)的例子：

								
									 import   java.util.regex.Matcher; 

									 import   java.util.regex.Pattern; 

									 public   class   ReFlags_Comments { 

									    public   static   void   main(String[] args) { 

									     /* 

									      * 不使用Pattern.COMMENTS(不启动注释) 

									      */ 

									            String s="123"; 

									            Pattern p1=Pattern测试数据pile(" (\\d+)+#test comments"); 

									            Matcher m1=p1.matcher(s); 

									            System.out.println(m1.matches());//false 

									            /* 

									                       * 正则表达式中使用启动注释的标记 

									             */ 

									            Pattern p2=Pattern测试数据pile("(?x) (\\d+)+#test comments"); 

									            Matcher m2=p2.matcher(s); 

									            System.out.println(m2.matches());//true 

									            /* 

									                  * 参数中使用Pattern.COMMENTS以启动注释 

									             */ 

									            Pattern p3=Pattern测试数据pile(  "  (\\d+)+#test comments"  ,Pattern.COMMENTS); 

									            Matcher m3=p3.matcher(s); 

									            System.out.println(m3.matches());  //true  

									    } 

									 }

运行结果：

false

true

Pattern测试数据pile函数的相关解释

Pattern测试数据pile函数：

1	Pattern Pattern测试数据pile(String regex, int flag)

flag的取值范围如下：

Pattern.CANON_EQ ：当且仅当两个字符的"正规分解(canonical decomposition)"都完全相同的情况下，才认定匹配。比如用了这个标志之后，表达式"a\u030A"会匹配"?"。默认情况下，不考虑"规范相等性(canonical equivalence)"。 Pattern.CASE_INSENSITIVE ：默认情况下，大小写不敏感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹配，只要将UNICODE_CASE与这个标志合起来就行了。 Pattern.COMMENTS ：在这种模式下，匹配时会忽略(正则表达式里的)空格字符(不是指表达式里的"\\s"，而是指表达式里的空格，tab，回车之类)。注释从#开始，一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。 Pattern.DOTALL ：在这种模式下，表达式'.'可以匹配任意字符，包括表示一行的结束符。默认情况下，表达式'.'不匹配行的结束符。 Pattern.MULTILINE ：在这种模式下，'^'和'$'分别匹配一行的开始和结束。此外，'^'仍然匹配字符串的开始，'$'也匹配字符串的结束。默认情况下，这两个表达式仅仅匹配字符串的开始和结束。 Pattern.UNICODE_CASE ：在这个模式下，如果你还启用了CASE_INSENSITIVE标志，那么它会对Unicode字符进行大小写不明感的匹配。默认情况下，大小写不敏感的匹配只适用于US-ASCII字符集。 Pattern.UNIX_LINES(?d) 在这个模式下，只有'\n'才被认作一行的中止，并且与'.'，'^'，以及'$'进行匹配。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

原文链接：https://blog.csdn.net/huangjhai/article/details/104096183

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did213120

更新时间：2023-05-04 阅读：34次