ES6 正則的擴展

RegExp構造函數

如果RegExp構造函數第一個參數是一個正則對象，那么可以使用第二個參數指定修飾符。而且，返回的正則表達式會忽略原有的正則表達式的修飾符，只使用新指定的修飾符。
下面代碼中，原有正則對象的修飾符是ig，它會被第二個參數i覆蓋。

new RegExp(/abc/ig, 'i').flags
// "i"

字符串的正則方法

字符串對象共有4個方法，可以使用正則表達式：match()、replace()、search()和split()。
ES6將這4個方法，在語言內部全部調用RegExp的實例方法，從而做到所有與正則相關的方法，全都定義在RegExp對象上。

String.prototype.match 調用 RegExp.prototype[Symbol.match]
String.prototype.replace 調用 RegExp.prototype[Symbol.replace]
String.prototype.search 調用 RegExp.prototype[Symbol.search]
String.prototype.split 調用 RegExp.prototype[Symbol.split]

u修飾符

ES6對正則表達式添加了u修飾符，含義為“Unicode模式”，用來正確處理大于\uFFFF的Unicode字符。即會正確處理四個字節的UTF-16編碼。
下面代碼中，\uD83D\uDC2A是一個四個字節的UTF-16編碼，代表一個字符。但是，ES5不支持四個字節的UTF-16編碼，會將其識別為兩個字符，導致第二行代碼結果為true。加了u修飾符以后，ES6就會識別其為一個字符，所以第一行代碼結果為false。

/^\uD83D/u.test('\uD83D\uDC2A')
// false
/^\uD83D/.test('\uD83D\uDC2A')
// true

一旦加上u修飾符號，就會修改下面這些正則表達式的行為。
1.點字符
點（.）字符在正則表達式中，含義是除了換行符以外的任意單個字符。對于碼點大于0xFFFF的Unicode字符，點字符不能識別，必須加上u修飾符。
下面代碼表示，如果不添加u修飾符，正則表達式就會認為字符串為兩個字符，從而匹配失敗。

var s = '??';
/^.$/.test(s) // false
/^.$/u.test(s) // true

2.Unicode字符表示法
ES6新增了使用大括號表示Unicode字符，這種表示法在正則表達式中必須加上u修飾符，才能識別。
下面代碼表示，如果不加u修飾符，正則表達式無法識別\u{61}這種表示法，只會認為這匹配61個連續的u。

/\u{61}/.test('a') // false
/\u{61}/u.test('a') // true
/\u{20BB7}/u.test('??') // true

3.量詞
使用u修飾符后，所有量詞都會正確識別碼點大于0xFFFF的Unicode字符。

/a{2}/.test('aa') // true
/a{2}/u.test('aa') // true
/??{2}/.test('????') // false
/??{2}/u.test('????') // true

另外，只有在使用u修飾符的情況下，Unicode表達式當中的大括號才會被正確解讀，否則會被解讀為量詞。
下面代碼中，由于正則表達式沒有u修飾符，所以大括號被解讀為量詞。加上u修飾符，就會被解讀為Unicode表達式。

/^\u{3}$/.test('uuu') // true

4.預定義模式
u修飾符也影響到預定義模式，能否正確識別碼點大于0xFFFF的Unicode字符。
下面代碼的\S是預定義模式，匹配所有不是空格的字符。只有加了u修飾符，它才能正確匹配碼點大于0xFFFF的Unicode字符。

/^\S$/.test('??') // false
/^\S$/u.test('??') // true

5.i修飾符
有些Unicode字符的編碼不同，但是字型很相近，比如，\u004B與\u212A都是大寫的K。
下面代碼中，不加u修飾符，就無法識別非規范的K字符。

/[a-z]/i.test('\u212A') // false
/[a-z]/iu.test('\u212A') // true

y修飾符

除了u修飾符，ES6還為正則表達式添加了y修飾符，叫做“粘連”（sticky）修飾符。
y修飾符的作用與g修飾符類似，也是全局匹配，后一次匹配都從上一次匹配成功的下一個位置開始。不同之處在于，g修飾符只要剩余位置中存在匹配就可，而y修飾符確保匹配必須從剩余的第一個位置開始，這也就是“粘連”的涵義。

var s = 'aaa_aa_a';
var r1 = /a+/g;
var r2 = /a+/y;
r1.exec(s) // ["aaa"]
r2.exec(s) // ["aaa"]
r1.exec(s) // ["aa"]
r2.exec(s) // null

上面代碼有兩個正則表達式，一個使用g修飾符，另一個使用y修飾符。這兩個正則表達式各執行了兩次，第一次執行的時候，兩者行為相同，剩余字符串都是_aa_a。由于g修飾沒有位置要求，所以第二次執行會返回結果，而y修飾符要求匹配必須從頭部開始，所以返回null。
如果改一下正則表達式，保證每次都能頭部匹配，y修飾符就會返回結果了。
下面代碼每次匹配，都是從剩余字符串的頭部開始。

var s = 'aaa_aa_a';
var r = /a+_/y;
r.exec(s) // ["aaa_"]
r.exec(s) // ["aa_"]

sticky屬性

與y修飾符相匹配，ES6的正則對象多了sticky屬性，表示是否設置了y修飾符。

var r = /hello\d/y;
r.sticky // true

flags屬性

ES6為正則表達式新增了flags屬性，會返回正則表達式的修飾符。

// ES5的source屬性
// 返回正則表達式的正文
/abc/ig.source
// "abc"
// ES6的flags屬性
// 返回正則表達式的修飾符
/abc/ig.flags
// 'gi'

RegExp.escape()

字符串必須轉義，才能作為正則模式。

function escapeRegExp(str) {
  return str.replace(/[\-\[\]\/\{\}\(\)\*\+\?\.\\\^\$\|]/g, '\\$&');
}
let str = '/path/to/resource.html?search=query';
escapeRegExp(str)
// "\/path\/to\/resource\.html\?search=query"

上面代碼中，str是一個正常字符串，必須使用反斜杠對其中的特殊字符轉義，才能用來作為一個正則匹配的模式。
已經有提議將這個需求標準化，作為RegExp對象的靜態方法RegExp.escape()，放入ES7。2015年7月31日，TC39認為，這個方法有安全風險，又不愿這個方法變得過于復雜，沒有同意將其列入ES7，但這不失為一個真實的需求。

RegExp.escape('The Quick Brown Fox');
// "The Quick Brown Fox"
RegExp.escape('Buy it. use it. break it. fix it.');
// "Buy it\. use it\. break it\. fix it\."
RegExp.escape('(*.*)');
// "\(\*\.\*\)"

字符串轉義以后，可以使用RegExp構造函數生成正則模式。

var str = 'hello. how are you?';
var regex = new RegExp(RegExp.escape(str), 'g');
assert.equal(String(regex), '/hello\. how are you\?/g');

s修飾符：dotAll 模式

正則表達式中，點（.）是一個特殊字符，代表任意的單個字符，但是行終止符（line terminator character）除外。
以下四個字符屬于”行終止符“。
1.U+000A 換行符（\n）
2.U+000D 回車符（\r）
3.U+2028 行分隔符（line separator）
4.U+2029 段分隔符（paragraph separator）
下面代碼中，因為.不匹配\n，所以正則表達式返回false。

/foo.bar/.test('foo\nbar')
// false

但是，很多時候我們希望匹配的是任意單個字符，這時有一種變通的寫法，引入/s修飾符，使得.可以匹配任意單個字符。

/foo.bar/s.test('foo\nbar') // true

這被稱為dotAll模式，即點（dot）代表一切字符。所以，正則表達式還引入了一個dotAll屬性，返回一個布爾值，表示該正則表達式是否處在dotAll模式。
/s修飾符和多行修飾符/m不沖突，兩者一起使用的情況下，.匹配所有字符，而^和$匹配每一行的行首和行尾。

const re = /foo.bar/s;
// 另一種寫法
// const re = new RegExp('foo.bar', 's');
re.test('foo\nbar') // true
re.dotAll // true
re.flags // 's'

后行斷言

JavaScript語言的正則表達式，只支持先行斷言（lookahead）和先行否定斷言（negative lookahead），不支持后行斷言（lookbehind）和后行否定斷言（negative lookbehind）。
目前，有一個提案，在ES7加入后行斷言。V8引擎4.9版已經支持，Chrome瀏覽器49版打開”experimental JavaScript features“開關（地址欄鍵入about:flags），就可以使用這項功能。
”先行斷言“指的是，x只有在y前面才匹配，必須寫成/x(?=y)/。比如，只匹配百分號之前的數字，要寫成/\d+(?=%)/。”先行否定斷言“指的是，x只有不在y前面才匹配，必須寫成/x(?!y)/。比如，只匹配不在百分號之前的數字，要寫成/\d+(?!%)/。

/\d+(?=%)/.exec('100% of US presidents have been male')  // ["100"]
/\d+(?!%)/.exec('that’s all 44 of them')                 // ["44"]

上面兩個字符串，如果互換正則表達式，就會匹配失敗。另外，還可以看到，”先行斷言“括號之中的部分（(?=%)），是不計入返回結果的。
"后行斷言"正好與"先行斷言"相反，x只有在y后面才匹配，必須寫成/(?<=y)x/。比如，只匹配美元符號之后的數字，要寫成/(?<=$)\d+/?！焙笮蟹穸〝嘌浴皠t與”先行否定斷言“相反，x只有不在y后面才匹配，必須寫成/(?<!y)x/。比如，只匹配不在美元符號后面的數字，要寫成/(?<!$)\d+/。

/(?<=\$)\d+/.exec('Benjamin Franklin is on the $100 bill')  // ["100"]
/(?<!\$)\d+/.exec('it’s is worth about €90')                // ["90"]

上面的例子中，"后行斷言"的括號之中的部分（(?<=$)），也是不計入返回結果。

Unicode屬性類

目前，有一個提案，引入了一種新的類的寫法\p{...}和\P{...}，允許正則表達式匹配符合Unicode某種屬性的所有字符。

const regexGreekSymbol = /\p{Script=Greek}/u;
regexGreekSymbol.test('π') // u

上面代碼中，\p{Script=Greek}指定匹配一個希臘文字母，所以匹配π成功。
Unicode屬性類要指定屬性名和屬性值。

\p{UnicodePropertyName=UnicodePropertyValue}

對于某些屬性，可以只寫屬性名。

\p{UnicodePropertyName}

\P{…}是\p{…}的反向匹配，即匹配不滿足條件的字符。
注意，這兩種類只對Unicode有效，所以使用的時候一定要加上u修飾符。如果不加u修飾符，正則表達式使用\p和\P會報錯，ECMAScript預留了這兩個類。

最后編輯于：2019.06.04 00:29:14

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 230,321評論 6贊 543
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 99,559評論 3贊 429
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 178,442評論 0贊 383
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,835評論 1贊 317
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 72,581評論 6贊 412
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,922評論 1贊 328
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,931評論 3贊 447
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 43,096評論 0贊 290
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,639評論 1贊 336
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 41,374評論 3贊 358
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,591評論 1贊 374
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 39,104評論 5贊 364
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,789評論 3贊 349
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,196評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,524評論 1贊 295
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,322評論 3贊 400
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,554評論 2贊 379

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

ES6 正則的擴展

ES6 正則的擴展

RegExp構造函數

字符串的正則方法

u修飾符

y修飾符

sticky屬性

flags屬性

RegExp.escape()

s修飾符：dotAll 模式

后行斷言

Unicode屬性類

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

ES6 正則的擴展

RegExp構造函數

字符串的正則方法

u修飾符

y修飾符

sticky屬性

flags屬性

RegExp.escape()

s修飾符：dotAll 模式

后行斷言

Unicode屬性類

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频