java怎么用正则表达式匹配字符串 使用正则表达式处理文本匹配与提取

答案:Java中通过Pattern和Matcher类实现正则匹配与提取,支持全匹配、查找、分组提取等操作。1. 使用Pattern.compile()编译正则,matcher.matches()判断全匹配,matcher.find()查找子串,group()获取结果;2. 用括号()定义捕获组提取特定内容,如日志中的时间、IP;3. String的matches()方法可快捷进行全匹配校验;4. 常用符号包括^、$、\d、\w、\s、*、+、?、{n,m}等,正确使用可处理多数文本需求,需注意边界测试。

在Java中使用正则表达式进行字符串匹配和提取,主要依赖于java.util.regex包中的两个核心类:PatternMatcher。通过它们可以实现文本的匹配、查找、替换和分割等操作。

1. 基本用法:Pattern 和 Matcher

要使用正则表达式,首先需要将正则模式编译成一个Pattern对象,然后通过该对象创建一个Matcher,用于对目标字符串进行匹配操作。

  • Pattern.compile(regex):编译正则表达式字符串为Pattern对象。
  • pattern.matcher(input):创建Matcher对象,用于匹配输入字符串。
  • matcher.matches():判断整个字符串是否完全匹配正则。
  • matcher.find():查找字符串中是否有子串匹配正则(常用于提取)。
  • matcher.group():获取匹配到的内容。

示例:判断手机号是否合法

String phone = "13812345678";
String regex = "^1[3-9]\\d{9}$"; // 匹配以1开头,第二位是3-9,共11位数字
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(phone);

if (matcher.matches()) {
    System.out.println("手机号格式正确");
} else {
    System.out.println("手机号格式错误");
}

2. 提取信息:使用分组(group)

正则表达式可以通过括号()定义“捕获组”,用于提取字符串中的特定部分。

示例:从日志中提取时间与IP地址

String log = "2025-10-05 14:23:11 [INFO] User login from 192.168.1.100";
String regex = "(\\d{4}-\\d{2}-\\d{2})\\s(\\d{2}:\\d{2}:\\d{2}).*?(\\d+\\.\\d+\\.\\d+\\.\\d+)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(log);

if (matcher.find()) {
    String date = matcher.group(1); // 日期
    String time = matcher.group(2); // 时间
    String ip = matcher.group(3);   // IP地址
    System.out.println("日期:" + date);
    System.out.println("时间:" + time);
    System.out.println("IP:" + ip);
}

3. 快捷方式:String 类的 matches() 方法

对于简单的全匹配场景,可以直接使用字符串的matches()方法,它内部会自动编译并匹配。

String email = "user@example.com";
boolean isValid = email.matches("\\w+@\\w+\\.\\w+");
System.out.println(isValid ? "邮箱格式正确" : "邮箱格式错误");

注意:此方法只能做全匹配,不能提取内容。

4. 常见正则符号说明

  • ^:行开始
  • $:行结束
  • \\d:数字(0-9)
  • \\w:字母、数字、下划线
  • \\s:空白字符(空格、制表符等)
  • *:前一项出现0次或多次
  • +:前一项出现1次或多次
  • ?:前一项出现0次或1次
  • {n,m}:前一项出现n到m次
  • (...):捕获组,用于提取

基本上就这些。掌握Pattern、Matcher配合分组使用,就能应对大多数文本处理需求。正则写好后建议多测试边界情况,避免误匹配。不复杂但容易忽略细节。