正則表達式(Regular Expression),簡稱為"正則",是一種用于描述、匹配、搜索文本的方式。正則表達式通常由符號和字符組成,可以用于匹配和搜索特定模式的文本。
以下是一些常用的正則表達式元字符及其用法:
^(脫字符)匹配開頭位置。
$(美元符號)匹配結尾位置。
.(點號)匹配除了換行符外的任何單個字符。
*(星號)匹配前面的表達式0次或多次。
+(加號)匹配前面的表達式1次或多次。
?(問號)匹配前面的表達式0次或1次。
{n} 匹配前面的表達式恰好n次。
{n,} 匹配前面的表達式至少n次。
{n,m} 匹配前面的表達式至少n次,但不超過m次。
[](方括號)用于指定一組字符或下級表達式。
|(豎線)用于指定多個模式中的其中一個匹配。
()(圓括號)用于定義子表達式。
下面是一些正則表達式示例:
\d 匹配任意數字字符,等價于[0-9]。
\w 匹配任意字母、數字或下劃線字符,等價于[A-Za-z0-9_]。
\s 匹配任意空白字符(包括空格、制表符和換行符)。
\b 匹配單詞邊界。
\D 匹配任意非數字字符,等價于[^0-9]。
\W 匹配任意非字母、數字或下劃線字符,等價于[^A-Za-z0-9_]。
\S 匹配任意非空白字符。
例如,如果要匹配一個電子郵件地址,可以使用如下正則表達式:
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
這個正則表達式用于匹配一個電子郵件地址,其中:
^ 表示字符串開始位置。
[a-zA-Z0-9._%±]+ 表示匹配一個或多個字母、數字、點號、下劃線、百分號、加號或減號。
@ 表示匹配一個字符"@"。
[a-zA-Z0-9.-]+ 表示匹配一個或多個字母、數字、點號或減號。
. 表示匹配一個字符"."。
[a-zA-Z]{2,} 表示匹配兩個或更多個字母。
正則表達式是一個強大而靈活的工具,用于處理文本匹配模式。掌握正則表達式對于計算機編程、文本處理和數據分析都是非常重要的。