在Java中使用正則表達式提取字符串內容,主要通過java.util.regex
包中的Pattern
和Matcher
類實現。以下是詳細步驟和示例:
1. 基礎流程
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexExample {public static void main(String[] args) {String text = "訂單號:ABC123,日期:2023-08-20,金額:¥500.00";// 1. 定義正則表達式String regex = "([A-Z]{3}\\d{3})|(\\d{4}-\\d{2}-\\d{2})|(¥\\d+\\.\\d{2})";// 2. 編譯正則表達式Pattern pattern = Pattern.compile(regex);// 3. 創建Matcher對象Matcher matcher = pattern.matcher(text);// 4. 遍歷所有匹配項while (matcher.find()) {// 5. 提取完整匹配內容System.out.println("完整匹配: " + matcher.group(0));// 6. 提取分組內容(如果有分組)for (int i=1; i<=matcher.groupCount(); i++) {if (matcher.group(i) != null) {System.out.println("分組 " + i + ": " + matcher.group(i));}}}}
}
2. 關鍵方法說明
-
Pattern.compile(regex)
將正則表達式字符串編譯為Pattern
對象,可復用。 -
matcher.find()
查找下一個匹配的子序列,返回布爾值。 -
matcher.group(n)
group(0)
:返回完整匹配的字符串group(1)
~group(n)
:返回第n個分組捕獲的內容
3. 常見場景示例
場景1:提取所有數字
String text = "蘋果5個,香蕉3.5公斤";
Pattern pattern = Pattern.compile("\\d+(\\.\\d+)?");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group()); // 輸出 5, 3.5
}
場景2:提取郵箱地址
String text = "聯系郵箱:support@example.com 或 admin@test.org";
Pattern pattern = Pattern.compile("\\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\\.[A-Z|a-z]{2,}\\b");
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group()); // 輸出 support@example.com, admin@test.org
}
4. 高級技巧
使用命名分組(Java 7+)
String text = "姓名:張三,年齡:25";
String regex = "姓名:(?<name>\\w+),年齡:(?<age>\\d+)";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(text);
if (matcher.find()) {System.out.println(matcher.group("name")); // 張三System.out.println(matcher.group("age")); // 25
}
非貪婪匹配
String text = "<div>內容1</div><div>內容2</div>";
Pattern pattern = Pattern.compile("<div>(.*?)</div>"); // 使用 ? 實現非貪婪匹配
Matcher matcher = pattern.matcher(text);
while (matcher.find()) {System.out.println(matcher.group(1)); // 輸出 內容1, 內容2
}
5. 注意事項
-
特殊字符轉義
如.
、*
、+
等需用\\
轉義(如\\.
表示匹配字面量點號)。 -
性能優化
頻繁使用的正則表達式應緩存Pattern
對象,避免重復編譯。 -
異常處理
無效正則表達式會拋出PatternSyntaxException
,建議用try-catch
處理。 -
空匹配檢查
使用matcher.find()
前需確保有匹配結果,否則matcher.group()
會拋出IllegalStateException
。
通過以上方法,您可以靈活提取字符串中的結構化內容。如果需要更復雜的匹配邏輯,可以結合正則表達式語法(如正向預查、負向預查等)實現。