DB version: 5.7.25-log 和 8.0.18
一、MySQL5.7中正則表達式
1.RLIKE()
為REGEXP同義詞,見下
2.REGEXP()
完整表達式 expr REGEXP pat
> 如果字符串expr與模式pat指定的正則表達式匹配,則返回1,否則返回0。
> 如果expr或pat為NULL,則返回值為NULL。
> 正則表達式規則明細及使用案例見下方。
3.NOT REGEXP()
完整表達式 expr NOT REGEXP pat
或者expr NOT RLIKE pat
。
與NOT (expr REGEXP pat)
相同。
正則表達式規則
^ 匹配字符串的開始
mysql> SELECT 'fo\nfo' REGEXP '^fo','ffo\nfo' REGEXP '^fo';
+-----------------------+------------------------+
| 'fo\nfo' REGEXP '^fo' | 'ffo\nfo' REGEXP '^fo' |
+-----------------------+------------------------+
| 1 | 0 |
+-----------------------+------------------------+
$ 匹配字符串的結尾
mysql> SELECT 'fo\nfoo' REGEXP 'fo$','ffo\nfo' REGEXP 'fo$';
+------------------------+------------------------+
| 'fo\nfoo' REGEXP 'fo$' | 'ffo\nfo' REGEXP 'fo$' |
+------------------------+------------------------+
| 0 | 1 |
+------------------------+------------------------+
. 匹配任何字符(包括回車和換行符)
mysql> SELECT 'fo\nfo' REGEXP 'fo.f','fo\nfo' REGEXP 'fo.o';
+------------------------+------------------------+
| 'fo\nfo' REGEXP 'fo.f' | 'fo\nfo' REGEXP 'fo.o' |
+------------------------+------------------------+
| 1 | 0 |
+------------------------+------------------------+
o* 匹配字符o出現0次或多次
mysql> SELECT 'fo\nfo' REGEXP 'fo*','fo\nfo' REGEXP 'fo*f','fo\nfo' REGEXP 'fo*o';
+-----------------------+------------------------+------------------------+
| 'fo\nfo' REGEXP 'fo*' | 'fo\nfo' REGEXP 'fo*f' | 'fo\nfo' REGEXP 'fo*o' |
+-----------------------+------------------------+------------------------+
| 1 | 0 | 1 |
+-----------------------+------------------------+------------------------+
o+ 匹配字符o出現1次或多次
mysql> SELECT 'fo\nfo' REGEXP 'fo+','fo\nfo' REGEXP 'fo+f','fo\nfo' REGEXP 'fo+o';
+----------------------+------------------------+------------------------+
| 'fo\nfo' REGEXP 'fo+' | 'fo\nfo' REGEXP 'fo+f' | 'fo\nfo' REGEXP 'fo+o' |
+----------------------+------------------------+------------------------+
| 1 | 0 | 0 |
+----------------------+------------------------+------------------------+
o? 匹配字符o出現0次或1次
mysql> SELECT 'fo\nfo' REGEXP 'fo?','fo\nfo' REGEXP 'fo?f','fo\nfo' REGEXP 'fo?o';
+-----------------------+------------------------+------------------------+
| 'fo\nfo' REGEXP 'fo?' | 'fo\nfo' REGEXP 'fo?f' | 'fo\nfo' REGEXP 'fo?o' |
+-----------------------+------------------------+------------------------+
| 1 | 0 | 1 |
+-----------------------+------------------------+------------------------+
de|abc 匹配字符串 de 或者 abc,可結合上面的 ^ $ * + ? 等使用
mysql> SELECT 'finded' REGEXP 'de|abc','dest' REGEXP '^(de|abc)','dabcabc' REGEXP '(de|abc)?','rest' REGEXP 'de|abc';
+--------------------------+---------------------------+------------------------------+------------------------+
| 'finded' REGEXP 'de|abc' | 'dest' REGEXP '^(de|abc)' | 'dabcabc' REGEXP '(de|abc)?' | 'rest' REGEXP 'de|abc' |
+--------------------------+---------------------------+------------------------------+------------------------+
| 1 | 1 | 1 | 0 |
+--------------------------+---------------------------+------------------------------+------------------------+
(abc)* 匹配字符串abc出現0次或多次,同上 o*
mysql> SELECT 'abcabc' REGEXP '(abc)*','abcab' REGEXP '(abc)*','e' REGEXP '(abcd)*';
+--------------------------+-------------------------+----------------------+
| 'abcabc' REGEXP '(abc)*' | 'abcab' REGEXP '(abc)*' | 'e' REGEXP '(abcd)*' |
+--------------------------+-------------------------+----------------------+
| 1 | 1 | 1 |
+--------------------------+-------------------------+----------------------+
{1}, {2,3} {n}和{m,n}符號提供了一種更通用的方式來編寫正則表達式,以匹配模式的前一個原子(或“塊”)的多次出現。m和n是整數,在0 到 255 之間,且 m <= n 。
如以下形式:
o* 可以被改寫 成 o{0,}
o+ 可以被改寫 成 o{1,}
o? 可以被改寫 成 o{0,1}
mysql> SELECT 'abcde' REGEXP 'a[bcd]{2}e' , 'abcde' REGEXP 'a[bcd]{3}e' ,'abbbe' REGEXP 'a[bcd]{3}e' , 'abcde' REGEXP 'a[bcd]{1,5}e','abcde' REGEXP 'a[bcd]{4,5}e' ;
+-----------------------------+-----------------------------+-----------------------------+-------------------------------+-------------------------------+
| 'abcde' REGEXP 'a[bcd]{2}e' | 'abcde' REGEXP 'a[bcd]{3}e' | 'abbbe' REGEXP 'a[bcd]{3}e' | 'abcde' REGEXP 'a[bcd]{1,5}e' | 'abcde' REGEXP 'a[bcd]{4,5}e' |
+-----------------------------+-----------------------------+-----------------------------+-------------------------------+-------------------------------+
| 0 | 1 | 1 | 1 | 0 |
+-----------------------------+-----------------------------+-----------------------------+-------------------------------+-------------------------------+
[abc]{3} 表示匹配 a、b、c三個字符任意一個或多個出現三次,如 aaa、aab、abc、ccc等均符合。
[bcd]{1,5} 表示匹配 a、b、c三個字符任意一個或多個出現1次到5次,如 a、ab、aaa、aab、abcc、aaaaa、bbccd等均符合。
[0-9X] 匹配0-9的數字或X;
[a-dX] 匹配a-d的所有字母(即 a,b,c,d)或X;
[^a-dX] 匹配非a-d、非X的字母。
mysql> SELECT 'aXbc' REGEXP '[a-dXYZ]','aXbc' REGEXP '^[a-dXYZ]$','aXbc' REGEXP '^[a-dXYZ]{4}$','aXbc' REGEXP '^[a-dXYZ]+$','aXbc' REGEXP '^[^a-dXYZ]+$','google' REGEXP '^[^a-dXYZ]+$' ;
+--------------------------+----------------------------+-------------------------------+-----------------------------+------------------------------+--------------------------------+
| 'aXbc' REGEXP '[a-dXYZ]' | 'aXbc' REGEXP '^[a-dXYZ]$' | 'aXbc' REGEXP '^[a-dXYZ]{4}$' | 'aXbc' REGEXP '^[a-dXYZ]+$' | 'aXbc' REGEXP '^[^a-dXYZ]+$' | 'google' REGEXP '^[^a-dXYZ]+$' |
+--------------------------+----------------------------+-------------------------------+-----------------------------+------------------------------+--------------------------------+
| 1 | 0 | 1 | 1 | 0 | 1 |
+--------------------------+----------------------------+-------------------------------+-----------------------------+------------------------------+--------------------------------+
[.characters.] 在方括號表達式(使用 '[' 和 ']' 編寫)中,匹配該整理元素的字符序列。 字符可以是單個字符,也可以是字符名稱,例如newline。
附錄1 列出了允許的字符名稱。
mysql> SELECT '~' REGEXP '[[.~.]]','~' REGEXP '[[.tilde.]]';
+----------------------+--------------------------+
| '~' REGEXP '[[.~.]]' | '~' REGEXP '[[.tilde.]]' |
+----------------------+--------------------------+
| 1 | 1 |
+----------------------+--------------------------+
[=character_class=] 在方括號表達式(使用 '[' 和 ']' 編寫)中,[= character_class =]表示等價類。
它匹配所有具有相同歸類值的字符,包括自身。
例如,如果 o 和(+)是等價類的成員,則[[= o =]],[[=(+)=]]和[o(+)]都是同義詞。
等效類不能用作范圍的末尾。
[:character_class:] 在方括號表達式(使用 '[' 和 ']' 編寫)中,[:character_class:]表示與屬于該類的所有字符匹配的字符類。
附錄2 列出了允許的字符類名稱。
mysql> SELECT 'justalnums' REGEXP '[[:alnum:]]+' , '012345' REGEXP '[[:digit:]]+' , 'abc' REGEXP '[[:digit:]]+';
+------------------------------------+--------------------------------+-----------------------------+
| 'justalnums' REGEXP '[[:alnum:]]+' | '012345' REGEXP '[[:digit:]]+' | 'abc' REGEXP '[[:digit:]]+' |
+------------------------------------+--------------------------------+-----------------------------+
| 1 | 1 | 0 |
+------------------------------------+--------------------------------+-----------------------------+
[[:<:]], [[:>:]] 這些標記代表單詞邊界,它們分別匹配單詞的開頭和結尾。
mysql> SELECT 'asd asd word dasda ads ' REGEXP '[[:<:]]word[[:>:]]','我是 一句 完整的 話' REGEXP '[[:<:]]完整的[[:>:]]','我是 一句 完整的 話' REGEXP '[[:<:]]完整[[:>:]]';
+---------------------------------------------------------+-----------------------------------------------------+---------------------------------------------------+
| 'asd asd word dasda ads ' REGEXP '[[:<:]]word[[:>:]]' | '我是 一句 完整的 話' REGEXP '[[:<:]]完整的[[:>:]]' | '我是 一句 完整的 話' REGEXP '[[:<:]]完整[[:>:]]' |
+---------------------------------------------------------+-----------------------------------------------------+---------------------------------------------------+
| 1 | 1 | 0 |
+---------------------------------------------------------+-----------------------------------------------------+---------------------------------------------------+
二、MySQL8 新增正則表達式
1.REGEXP_LIKE()
REGEXP 和 RLIKE 是 REGEXP_LIKE() 的同義詞。
使用明細見上面5.7版本 '正則表達式規則'
2.REGEXP_INSTR()
完整表達式 REGEXP_INSTR(expr, pat[, pos[, occurrence[, return_option[, match_type]]]])
> 返回與模式 pat 指定的正則表達式匹配的字符串 expr 的子字符串的起始索引,如果沒有匹配則為0。
> 如果 expr 或 pat 為NULL,則返回值為NULL。字符索引從1開始。
完整表達式各參數含義:
pos
: 從expr
的pos
位置開始搜索,默認為1;
occurrence
: 返回第occurrence
個匹配的子字符串,默認為1;
return_option
: 返回類型,如果為0,則返回匹配到的子字符串的第一個字符的位置,如果為1,則返回匹配到的子字符串最后一個字符的位置+1,默認為0;
match_type
: 匹配類型,包含以下值,可同時使用一個或多個;
如果在match_type中指定了矛盾選項的字符,則以最右邊的字符為準。
c
: 匹配時區分大小寫
i
: 匹配時不區分大小寫
m
: 多行模式。在字符串內識別行結束符。默認行為是只在字符串表達式的開始和結束處匹配行結束符。
n
: 字符.
匹配行結束,默認.
匹配到行結尾停止。
u
: 僅使用unix上的行結束符。只有換行符被識別為行結束,能夠被.
^
和$
匹配。
m
n
u
三個參數不知如何舉例。
mysql> SELECT REGEXP_INSTR('dog cat dog pig', 'dog'),REGEXP_INSTR('dog cat dog pig', 'dog',2,1,0),REGEXP_INSTR('dog cat dog pig', 'dog',2,1,1),REGEXP_INSTR('dog cat dog pig', 'Dog',2,1,1,'c'),REGEXP_INSTR('aa aaa aaaa', 'a{4}');
+----------------------------------------+----------------------------------------------+----------------------------------------------+--------------------------------------------------+-------------------------------------+
| REGEXP_INSTR('dog cat dog pig', 'dog') | REGEXP_INSTR('dog cat dog pig', 'dog',2,1,0) | REGEXP_INSTR('dog cat dog pig', 'dog',2,1,1) | REGEXP_INSTR('dog cat dog pig', 'Dog',2,1,1,'c') | REGEXP_INSTR('aa aaa aaaa', 'a{4}') |
+----------------------------------------+----------------------------------------------+----------------------------------------------+--------------------------------------------------+-------------------------------------+
| 1 | 9 | 12 | 0 | 8 |
+----------------------------------------+----------------------------------------------+----------------------------------------------+--------------------------------------------------+-------------------------------------+
3.REGEXP_REPLACE()
完整表達式 REGEXP_REPLACE(expr, pat, repl[, pos[, occurrence[, match_type]]])
> 用替換字符串repl
替換字符串expr
中與模式pat
指定的正則表達式匹配的匹配項,并返回結果字符串。
> 如果expr,pat或repl為NULL,則返回值為NULL
pos
,occurrence
,match_type
參數含義見REGEXP_INSTR()
mysql> SELECT REGEXP_REPLACE('a b c', 'b', 'X'),REGEXP_REPLACE('abc def ghi', '[a-z]+', 'X', 1, 3), REGEXP_REPLACE('abc def ghi', 'def', 'X', 2,1);
+-----------------------------------+----------------------------------------------------+------------------------------------------------+
| REGEXP_REPLACE('a b c', 'b', 'X') | REGEXP_REPLACE('abc def ghi', '[a-z]+', 'X', 1, 3) | REGEXP_REPLACE('abc def ghi', 'def', 'X', 2,1) |
+-----------------------------------+----------------------------------------------------+------------------------------------------------+
| a X c | abc def X | abc X ghi |
+-----------------------------------+----------------------------------------------------+------------------------------------------------+
4.REGEXP_SUBSTR()
完整表達式 REGEXP_SUBSTR(expr, pat[, pos[, occurrence[, match_type]]])
> 返回與模式pat
指定的正則表達式匹配的字符串expr
的子字符串;如果不匹配,則返回NULL。
> 如果expr或pat為NULL,則返回值為NULL。
pos
,occurrence
,match_type
參數含義見REGEXP_INSTR()
mysql> SELECT REGEXP_SUBSTR('abc def ghi', '[a-z]+'),REGEXP_SUBSTR('abc def ghi', '[a-z]+', 1, 3),REGEXP_SUBSTR('abc def ghi', '[a-z]+', 4, 2);
+----------------------------------------+----------------------------------------------+----------------------------------------------+
| REGEXP_SUBSTR('abc def ghi', '[a-z]+') | REGEXP_SUBSTR('abc def ghi', '[a-z]+', 1, 3) | REGEXP_SUBSTR('abc def ghi', '[a-z]+', 4, 2) |
+----------------------------------------+----------------------------------------------+----------------------------------------------+
| abc | ghi | ghi |
+----------------------------------------+----------------------------------------------+----------------------------------------------+