Java中Pattern与Matcher正则匹配的基本用法

Pattern和Matcher用于Java正则操作:1. Pattern.compile()编译正则;2. matcher()创建Matcher;3. matches()或find()执行匹配;4. group()提取结果。

在Java中,PatternMatcher 是正则表达式操作的核心类,位于 java.util.regex 包中。它们配合使用可以实现字符串的匹配、查找、替换和分割等操作。

Pattern:编译正则表达式

Pattern 类表示一个已编译的正则表达式。它不能通过构造函数实例化,而是通过静态方法 compile() 创建实例。

常用方法:

  • Pattern.compile(String regex):将字符串形式的正则表达式编译为 Pattern 对象。
  • pattern():返回原始的正则表达式字符串。

示例:

Pattern pattern = Pattern.compile("\\d+"); // 匹配一个或多个数字

Matcher:执行匹配操作

Matcher 是一个引擎,用于对输入字符串执行匹配操作。通过 Pattern 的 matcher(CharSequence input) 方法创建 Matcher 实例。

常用方法:

  • boolean matches():判断整个输入字符串是否完全匹配正则表达式。
  • boolean find():从输入字符串中查找下一个匹配子串,成功返回 true。
  • String group():返回当前匹配到的子串(需在 find() 或 matches() 返回 true 后调用)。
  • int start()int end():返回当前匹配的起始和结束位置(不包含结束位置)。
  • boolean replaceAll(String replacement):结合 appendReplacement()appendTail() 可实现替换。

示例:

Matcher matcher = pattern.matcher("abc123def456");
while (matcher.find()) {
    System.out.println("匹配到: " + matcher.group());
    System.out.println("位置: " + matcher.start() + "-" + matcher.end());
}
// 输出:
// 匹配到: 123
// 位置: 3-6
// 匹配到: 456
// 位置: 9-12

常见使用场景

实际开发中

,可以根据需求选择不同的匹配方式:

  • 验证格式:如手机号、邮箱等,使用 matches() 判断是否完全匹配。
  • 提取信息:如从日志中提取IP地址、时间等,使用 find() 配合 group() 提取内容。
  • 分组捕获:使用括号 () 定义捕获组,通过 group(int) 获取对应组内容。

分组示例:

Pattern p = Pattern.compile("(\\d{4})-(\\d{2})-(\\d{2})");
Matcher m = p.matcher("今天是2025-04-05");
if (m.find()) {
    System.out.println("年: " + m.group(1)); // 2025
    System.out.println("月: " + m.group(2)); // 04
    System.out.println("日: " + m.group(3)); // 05
}

简化写法与注意事项

对于简单的一次性匹配,可以直接使用 Pattern 的静态方法:

boolean isMatch = Pattern.matches("\\d+", "12345"); // true

但频繁使用时建议复用 Pattern 实例,因为编译正则有开销,Pattern 是线程安全的,可被多个线程共享;而 Matcher 不是线程安全的,每次使用应单独创建。

基本上就这些。掌握 Pattern 和 Matcher 的基本流程——编译、匹配、查找、提取——就能应对大多数文本处理任务。