java正则使用 - JAVA - 编程开发网

a)这个是非捕获组的意思，最后一个是a而且还不把这个a取出来！！( =a)这个要是写在前面就不一样了 Matcher m8 = p8.matcher("ab4add5"); while(m8.find()){ p("后面不能是a的"+m8.group()); } p8 = Pattern.compile("( !a).{3}");//( !a)前面不能是a的 m8 = p8.matcher("abbsab89"); while(m8.find()){ p("前面不能是a的"+m8.group()); } //( <号匹配"); Pattern p9 = Pattern.compile("( !>).+( =<)"); Matcher m9 = p9.matcher(">编程中国<"); while(m9.find()){ p(m9.group()); } p("------------------向前引用"); Pattern p10 = Pattern.compile("(\\d\\d)\\1");//这里面的1是向前引用，12是第一匹配到的，下一次在匹配出来12和前面相同所以是true Matcher m10 = p10.matcher("1212"); p(m10.matches()); p("------------------忽略大小写，正则内嵌");//( i)非捕获组里面这个表示忽略大小写 p("java".matches("( i)JAVA")); } public static void p(Object o){ System.out.println(o); } }

 
字符   
x 字符 x   
\\ 反斜线字符   
\0n 带有八进制值 0 的字符 n (0 <= n <= 7)   
\0nn 带有八进制值 0 的字符 nn (0 <= n <= 7)   
\0mnn 带有八进制值 0 的字符 mnn（0 <= m <= 3、0 <= n <= 7）   
\xhh 带有十六进制值 0x 的字符 hh   
\uhhhh 带有十六进制值 0x 的字符 hhhh   
\t 制表符 ('\u0009')   
\n 新行（换行）符 ('\u000A')   
\r 回车符 ('\u000D')   
\f 换页符 ('\u000C')   
\a 报警 (bell) 符 ('\u0007')   
\e 转义符 ('\u001B')   
\cx 对应于 x 的控制符   
    
字符类   
[abc] a、b 或 c（简单类）   
[^abc] 任何字符，除了 a、b 或 c（否定）   
[a-zA-Z] a 到 z 或 A 到 Z，两头的字母包括在内（范围）   
[a-d[m-p]] a 到 d 或 m 到 p：[a-dm-p]（并集）   
[a-z&&[def]] d、e 或 f（交集）   
[a-z&&[^bc]] a 到 z，除了 b 和 c：[ad-z]（减去）   
[a-z&&[^m-p]] a 到 z，而非 m 到 p：[a-lq-z]（减去）   
    
预定义字符类   
. 任何字符（与行结束符可能匹配也可能不匹配）   
\d 数字：[0-9]   
\D 非数字： [^0-9]   
\s 空白字符：[ \t\n\x0B\f\r]   
\S 非空白字符：[^\s]   
\w 单词字符：[a-zA-Z_0-9]   
\W 非单词字符：[^\w]   
    
POSIX 字符类（仅 US-ASCII）   
\p{Lower} 小写字母字符：[a-z]   
\p{Upper} 大写字母字符：[A-Z]   
\p{ASCII} 所有 ASCII：[\x00-\x7F]   
\p{Alpha} 字母字符：[\p{Lower}\p{Upper}]   
\p{Digit} 十进制数字：[0-9]   
\p{Alnum} 字母数字字符：[\p{Alpha}\p{Digit}]   
\p{Punct} 标点符号：!"#$%&'()*+,-./:;<=>




 @[\]^_`{|}~   
\p{Graph} 可见字符：[\p{Alnum}\p{Punct}]   
\p{Print} 可打印字符：[\p{Graph}\x20]   
\p{Blank} 空格或制表符：[ \t]   
\p{Cntrl} 控制字符：[\x00-\x1F\x7F]   
\p{XDigit} 十六进制数字：[0-9a-fA-F]   
\p{Space} 空白字符：[ \t\n\x0B\f\r]   
    
java.lang.Character 类（简单的 java 字符类型）   
\p{javaLowerCase} 等效于 java.lang.Character.isLowerCase()   
\p{javaUpperCase} 等效于 java.lang.Character.isUpperCase()   
\p{javaWhitespace} 等效于 java.lang.Character.isWhitespace()   
\p{javaMirrored} 等效于 java.lang.Character.isMirrored()   
    
Unicode 块和类别的类   
\p{InGreek} Greek 块（简单块）中的字符   
\p{Lu} 大写字母（简单类别）   
\p{Sc} 货币符号   
\P{InGreek} 所有字符，Greek 块中的除外（否定）   
[\p{L}&&[^\p{Lu}]]  所有字母，大写字母除外（减去）   
    
边界匹配器   
^ 行的开头   
$ 行的结尾   
\b 单词边界   
\B 非单词边界   
\A 输入的开头   
\G 上一个匹配的结尾   
\Z 输入的结尾，仅用于最后的结束符（如果有的话）   
\z 输入的结尾   
    
Greedy 数量词   
X  X，一次或一次也没有   
X* X，零次或多次   
X+ X，一次或多次   
X{n} X，恰好 n 次   
X{n,} X，至少 n 次   
X{n,m} X，至少 n 次，但是不超过 m 次   
    
Reluctant 数量词   
X   X，一次或一次也没有   
X*  X，零次或多次   
X+  X，一次或多次   
X{n}  X，恰好 n 次   
X{n,}  X，至少 n 次   
X{n,m}  X，至少 n 次，但是不超过 m 次   
    
Possessive 数量词   
X + X，一次或一次也没有   
X*+ X，零次或多次   
X++ X，一次或多次   
X{n}+ X，恰好 n 次   
X{n,}+ X，至少 n 次   
X{n,m}+ X，至少 n 次，但是不超过 m 次   
    
Logical 运算符   
XY X 后跟 Y   
X|Y X 或 Y   
(X) X，作为捕获组   
    
Back 引用   
\n 任何匹配的 nth 捕获组   
    
引用   
\ Nothing，但是引用以下字符   
\Q Nothing，但是引用所有字符，直到 \E   
\E Nothing，但是结束从 \Q 开始的引用   
    
特殊构造（非捕获）   
( :X) X，作为非捕获组   
( idmsux-idmsux)  Nothing，但是将匹配标志i d m s u x on - off   
( idmsux-idmsux:X)   X，作为带有给定标志 i d m s u x on - off   
的非捕获组  ( =X) X，通过零宽度的正 lookahead   
( !X) X，通过零宽度的负 lookahead   
( <=X) X，通过零宽度的正 lookbehind   
( X) X，作为独立的非捕获组

java正则使用(二)