MySQL中正則表達式通常被用來檢索或替換符合某個模式的文本內容,根據指定的匹配模式匹配文中符合要求的特殊字符串。
例如,從一個文件中提取電話號碼,查找一篇文章中重復的單詞或替換用戶輸入的敏感語匯等,這些地方都可以使用正則表達式。正則表達式強大而且靈活,常用于復雜的查詢。
MySQL 中使用 REGEXP 關鍵字指定正則表達式的字符匹配模式,下表列出了 REGEXP 操作符中常用的匹配列表。
選項
說明
例子
匹配值示例
^
匹配文本的開始字符
'^b' 匹配以字母 b 開頭 的字符串
book、big、banana、?bike
$
匹配文本的結束字符
'st$’ 匹配以 st 結尾的字 符串
test、resist、persist
.
匹配任何單個字符
'b.t’ 匹配任何?b 和 t 之間有一個字符
bit、bat、but、bite
*
匹配零個或多個在它前面的字 符
'f*n’ 匹配字符 n 前面有 任意個字符 f
fn、fan、faan、abcn
+
匹配前面的字符 1 次或多次
'ba+’ 匹配以 b 開頭,后 面至少緊跟一個 a
ba、bay、bare、battle
匹配包含指定字符的文本
'fa’
fan、afa、faad
[字符集合]
匹配字符集合中的任何一個字 符
'[xz]'匹配 x 或者 z
dizzy、zebra、x-ray、?extra
[^]
匹配不在括號中的任何字符
'[^abc]’ 匹配任何不包 含 a、b 或 c 的字符串
desk、fox、f8ke
字符串{n,}
匹配前面的字符串至少 n 次
b{2}?匹配 2 個或更多 的 b
bbb、?bbbb、?bbbbbbb
字符串
{n,m}
匹配前面的字符串至少 n 次, 至多 m 次
b{2,4}?匹配最少 2 個, 最多 4 個 b
bbb、?bbbb
查詢以特定字符或字符串開頭的記錄
字符“^”匹配以特定字符或者字符串開頭的文本。
【實例 1】在 tb_departments 表中,查詢 dept_name 字段以字母“C”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。
tb_departments表原始查詢如下:
正則表達查詢如下:
【實例 2】在 tb_departments 表中,查詢 dept_name 字段以“Ch”開頭的記錄,輸入的 SQL 語句和執行結果如下所示。
只有 Chinese 是以“Ch”開頭的,所以查詢結果中只有 1 條記錄。
查詢以特定字符或字符串結尾的記錄
字符“$”匹配以特定字符或者字符串結尾的文本。
【實例 3】在 tb_departments 表中,查詢 dept_name 字段以字母“y”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
在 tb_departments 表中有兩條記錄的 dept_name 字段值是以字母 y 結尾的,返回結果有 2 條記錄。
【實例 4】在 tb_departments 表中,查詢 dept_name 字段以“my”結尾的記錄,輸入的 SQL 語句和執行結果如下所示。
只有 Economy 是以“my”結尾的,所以查詢結果中只有 1 條記錄。
用符號“.”代替字符串中的任意一個字符
【實例 5】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”與字母“y”,且兩個字母之間只有一個字母的記錄,輸入的 SQL 語句和執行結果如下所示。
查詢語句中“o.y”指定匹配字符中要有字母 o 和 y,且兩個字母之間包含單個字符,并不限定匹配的字符的位置和所在查詢字符串的總長度,因此 Economy 和 History 都符合匹配條件。
使用“*”和“+”來匹配多個字符
星號“*”匹配前面的字符任意多次,包括 0 次。加號“+”匹配前面的字符至少一次。
【實例 6】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”的記錄,輸入的 SQL 語句和執行結果如下所示。
星號“*”可以匹配任意多個字符,Computer 、Economy、Music中字母 C(MySQL默認不區分大小寫,所以查詢條件中的寫的'C',但是結果中會包含出現大寫'C'和小寫'c'的結果) 后面并沒有出現字母 h,但是也滿足匹配條件。
【實例 7】在 tb_departments 表中,查詢 dept_name 字段值包含字母“C”,且“C”后面出現字母“h”至少一次的記錄,輸入的 SQL 語句和執行結果如下所示。
h+”匹配字母“h”至少一次,只有 Chinese 滿足匹配條件。
匹配指定字符串
正則表達式可以匹配指定字符串,只要這個字符串在查詢文本中即可,若要匹配多個字符串,則多個字符串之間使用分隔符“|”隔開。
【實例 8】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”的記錄,輸入的 SQL 語句和執行結果如下所示。
可以看到,dept_name 字段的 Chinese 中包含字符串“in”,滿足匹配條件。
【實例 9】在 tb_departments 表中,查詢 dept_name 字段值包含字符串“in”或者“on”的記錄,輸入的 SQL 語句和執行結果如下所示。
可以看到,dept_name 字段的 Chinese 中包含字符串“in”,Economy 中包含字符串“on”,滿足匹配條件。
提示:LIKE 運算符也可以匹配指定的字符串,但與 REGEXP 不同,LIKE 匹配的字符串如果在文本中間出現,就找不到它,相應的行也不會返回。而 REGEXP 在文本內進行匹配,如果被匹配的字符串在文本中出現,REGEXP 將會找到它,相應的行也會被返回。
匹配指定字符串中的任意一個
方括號“[]”指定一個字符集合,只匹配其中任何一個字符,即為所查找的文本。
【實例 10】在 tb_departments 表中,查詢 dept_name 字段值包含字母“o”或者“e”的記錄,輸入的 SQL 語句和執行結果如下所示。
從查詢結果可以看到,所有返回的記錄的 dept_name 字段的值中都包含字母 o 或者 e,或者兩個都有。
方括號“[]”還可以指定數值集合。
【實例 11】在 tb_departments 表中,查詢 dept_call 字段值中包含 1、2 或者 3 的記錄,輸入的 SQL 語句和執行結果如下所示。
查詢結果中,dept_call 字段值中有 1、2、3 三個數字中的一個即為匹配記錄字段。
匹配集合“[123]”也可以寫成“[1-3]”,即指定集合區間。例如,“[a-z]”表示集合區間為a~z的字母,“[0-9]”表示集合區間為所有數字。
匹配指定字符以外的字符
“[^字符集合]”匹配不在指定集合中的任何字符。
【實例 12】在 tb_departments 表中,查詢 dept_name 字段值包含字母 a~t 以外的字符的記錄,輸入的 SQL 語句和執行結果如下所示。
返回記錄中的 dept_name 字段值中包含了指定字母和數字以外的值,如 u、y 等,這些字母均不在 a~t 中,滿足匹配條件。