文本浏览器

Java正则表达式(简单理解)

发布者 : 管理员-Adler | 发布时间 : 2019-01-17 19:12:03
文章号 : 29 | 阅读量 : 5+1 | AAW值(?) : 0.00 (仅供参考)

字符串匹配 (用来检查字符串是否匹配表达式)

public static void main (String[] args) {

    //Scanner接收用户从控制台输入的字符串     Scanner sn = new Scanner(System.in);

    System.out.print("输入字符串: ");

    String get = sn.nextLine();

    //设置正则表达式     String regEx = "[0-9]{1,3}@666.";

    //表示 第1-3位是0-9的数字 下一位是@666.

    //开始匹配正则表达式     Pattern pt = Pattern.compile(regEx);

    // 忽略大小写的写法     // Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);

    Matcher mc = pt.matcher(get);

    boolean res = mc.matches();

    System.out.println(res); }

字符串查找 (在字符串中查找符合规则的子串)

public static void main(String[] args) {
    
//要验证的字符串
    
String str = "这是一个正则表达式字符串查找的示例12345,正则表达式45678";
    
//正则表达式规则
    
String regEx = "\\d+";
    
//编译正则表达式
    
Pattern pattern = Pattern.compile(regEx);
    
//忽略大小写的写法
    
// Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    
Matcher matcher = pattern.matcher(str);
    
//查找字符串中是否有匹配正则表达式的字符/字符串
    
while(matcher.find()) {
        System.
out.println(matcher.group());
    
}
}

常用正则表达式

规则

正则表达式语法

汉字(包含符号)

[\\u0391-\\uFFE5]+

汉字(不包含符号)

[\\u4e00-\\u9fa5]+

邮箱

[a-zA-Z_]{0,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\.){1,3}[a-zA-z\-]{1,}

邮编

[1-9]\\d{5}

账号

[A-Za-z][A-Za-z0-9_-]+

手机号

1\\d{10}

Excel文件

.*\.xls(x)?$

18位身份证

\\d{6}(18|19|20)\\d{2}[01]\\d[0123]\\d\\d{3}[0-9xX]{1}

语法API

元字符

描述

\

将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。

^

匹配输入字行首。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。

$

匹配输入行尾。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。

*

匹配前面的子表达式任意次。例如,zo能匹配“z”,也能匹配“zo”以及“zoo”。等价于o{0,}

+

匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}

?

匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“do”或“does”中的“do”。?等价于{0,1}。 当该字符紧跟在任何一个其他限制符(*,+,?{n}{n,}{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串,而默认的贪婪模式则尽可能多地匹配所搜索的字符串。例如,对于字符串“oooo”,“o+”将尽可能多地匹配“o”,得到结果[oooo],而“o+?”将尽可能少地匹配“o”,得到结果 ['o', 'o', 'o', 'o']

{n}

n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o

{n,}

n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”。

{n,m}

mn均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个o为一组,后三个o为一组。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。

.

匹配除“\n”之外的任何单个字符。要匹配包括“\n”在内的任何字符,请使用像“[\s\S]”的模式。 (pattern)匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0$9属性。要匹配圆括号字符,请使用“\(”或“\)”。

(pattern)

匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到。要匹配圆括号字符,请使用“\(”或“\)”。

x|y

匹配xy。例如,“z|food”能匹配“z”或“food(此处请谨慎)。“[zf]ood”则匹配“zood”或“food”。

[xyz]

字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”。

[^xyz]

负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。

[a-z]

字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。 注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围如果出字符组的开头,则只能表示连字符本身.

[^a-z]

负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]”可以匹配任何不在“a”到“z”范围内的任意字符。

\d

匹配一个数字字符。等价于[0-9]grep 要加上-Pperl正则支持

\D

匹配一个非数字字符。等价于[^0-9]grep要加上-Pperl正则支持

\f

匹配一个换页符。等价于\x0c\cL

\n

匹配一个换行符。等价于\x0a\cJ

\r

匹配一个回车符。等价于\x0d\cM

\s

匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]

\S

匹配任何可见字符。等价于[^ \f\n\r\t\v]

\t

匹配一个制表符。等价于\x09\cI

\v

匹配一个垂直制表符。等价于\x0b\cK

\w

匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集。

\W

匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。






评论加载中...

+ 参与讨论