es6正則擴展

RegExp構造函數

es5中，RegExp構造函數有兩種參數

第一個參數為字符串，第二個參數為正則表達式的修飾符（flag）。
參數為正則表達式。es5此時不允許使用第二個參數，否則報錯。
ES6 改變了這種行為。如果RegExp構造函數第一個參數是一個正則對象，那么可以使用第二個參數指定修飾符。若指定了第二個參數，則返回的正則表達式忽略原有修飾符，只會使用第二個參數的修飾符。

字符串的正則方法

字符串對象共有4個方法可以使用正則方法，match,split,search,replace
ES6 將這 4 個方法，在語言內部全部調用RegExp的實例方法，從而做到所有與正則相關的方法，全都定義在RegExp對象上。

String.prototype.match 調用 RegExp.prototype[Symbol.match]
String.prototype.replace 調用 RegExp.prototype[Symbol.replace]
String.prototype.search 調用 RegExp.prototype[Symbol.search]
String.prototype.split 調用 RegExp.prototype[Symbol.split]

u修飾符（unicoded模式）

ES6 對正則表達式添加了u修飾符，含義為“Unicode 模式”，用來正確處理大于\uFFFF的 Unicode 字符，正確處理四個字節的編碼utf-16。

RegExp.prototype.unicode 屬性

正則實例對象新增unicode屬性，表示是否設置了u修飾符。

const r1 = /hello/;
const r2 = /hello/u;

r1.unicode // false
r2.unicode // true

上面代碼中，正則表達式是否設置了u修飾符，可以從unicode屬性看出來。

/^\uD83D/u.test('\uD83D\uDC2A') // false
/^\uD83D/.test('\uD83D\uDC2A') // true

上面代碼中，\uD83D\uDC2A是一個四個字節的 UTF-16 編碼，代表一個字符。但是，ES5 不支持四個字節的 UTF-16 編碼，會將其識別為兩個字符，導致第二行代碼結果為true。加了u修飾符以后，ES6 就會識別其為一個字符，所以第一行代碼結果為false。
一旦加上u修飾符號，就會修改下面這些正則表達式的行為。

（1）點字符

點（.）字符在正則表達式中，含義是除了換行符以外的任意單個字符。對于碼點大于0xFFFF的 Unicode 字符，點字符不能識別，必須加上u修飾符。

var s = '??';

/^.$/.test(s) // false
/^.$/u.test(s) // true

上面代碼表示，如果不添加u修飾符，正則表達式就會認為字符串為兩個字符，從而匹配失敗。

（2）Unicode 字符表示法

ES6 新增了使用大括號表示 Unicode 字符，這種表示法在正則表達式中必須加上u修飾符，才能識別當中的大括號，否則會被解讀為量詞。

/\u{61}/.test('a') // false
/\u{61}/u.test('a') // true
/\u{20BB7}/u.test('??') // true

上面代碼表示，如果不加u修飾符，正則表達式無法識別\u{61}這種表示法，只會認為這匹配 61 個連續的u。

（3）量詞(匹配個數)

使用u修飾符后，所有量詞都會正確識別碼點大于0xFFFF的 Unicode 字符。

/a{2}/.test('aa') // true
/a{2}/u.test('aa') // true
/??{2}/.test('????') // false
/??{2}/u.test('????') // true

（4）預定義模式

u修飾符也影響到預定義模式，能否正確識別碼點大于0xFFFF的 Unicode 字符。

/^\S$/.test('??') // false
/^\S$/u.test('??') // true

上面代碼的\S是預定義模式，匹配所有非空白字符。只有加了u修飾符，它才能正確匹配碼點大于0xFFFF的 Unicode 字符。
（5）i 修飾符

有些 Unicode 字符的編碼不同，但是字型很相近，比如，\u004B與\u212A都是大寫的K。

/[a-z]/i.test('\u212A') // false
/[a-z]/iu.test('\u212A') // true

上面代碼中，不加u修飾符，就無法識別非規范的K字符。

y修飾符（粘連修飾符）

實際上，y修飾符號隱含了頭部匹配的標志^。
es6新增y修飾符，與g修飾符類似，后一次匹配均從上一次匹配的下一位開始匹配，而g修飾符只要剩余字符串中含有就可以，y修飾符必須從剩余的第一位開始匹配。

RegExp.prototype.sticky 屬性

與y修飾符相匹配，ES6 的正則實例對象多了sticky屬性，表示是否設置了y修飾符。

var r = /hello\d/y;
r.sticky // true

var s = 'aaa_aa_a';
var r1 = /a+/g;
var r2 = /a+/y;

r1.exec(s) // ["aaa"]
r2.exec(s) // ["aaa"]

r1.exec(s) // ["aa"]
r2.exec(s) // null

實際exec返回（匹配到的字符串，開始匹配到的下標，輸入字符串，groups）
[ 'aaa', index: 0, input: 'aaa_aa_a', groups: undefined ]
[ 'aaa', index: 0, input: 'aaa_aa_a', groups: undefined ]
[ 'aa', index: 4, input: 'aaa_aa_a', groups: undefined ]
null

由于g修飾沒有位置要求，所以第二次執行會返回結果，而y修飾符要求匹配必須從頭部開始，所以返回null。
lastIndex指定每次開始的位置

const REGEX = /a/g;

// 指定從2號位置（y）開始匹配
REGEX.lastIndex = 2;

// 匹配成功
const match = REGEX.exec('xaya');

// 在3號位置匹配成功
match.index // 3

// 下一次匹配從4號位開始
REGEX.lastIndex // 4

// 4號位開始匹配失敗
REGEX.exec('xaya') // null
> 上面代碼中，lastIndex屬性指定每次搜索的開始位置，g修飾符從這個位置開始向后搜索，直到發現匹配為止。

> y修飾符同樣遵守lastIndex屬性，但是要求必須在lastIndex指定的位置發現匹配。

const REGEX = /a/y;

// 指定從2號位置開始匹配
REGEX.lastIndex = 2;

// 不是粘連，匹配失敗
REGEX.exec('xaya') // null

// 指定從3號位置開始匹配
REGEX.lastIndex = 3;

// 3號位置是粘連，匹配成功
const match = REGEX.exec('xaya');
match.index // 3
REGEX.lastIndex // 4

下面代碼，最后一個a并沒有出現在下一次匹配的頭部，所以未被替換。

const REGEX = /a/gy;
'aaxa'.replace(REGEX, '-') // '--xa'

單單一個y修飾符對match方法，只能返回第一個匹配，必須與g修飾符聯用，才能返回所有匹配。

'a1a2a3'.match(/a\d/y) // ["a1"]
'a1a2a3'.match(/a\d/gy) // ["a1", "a2", "a3"]

RegExp.prototype.flags 屬性（返回正則表達式的修飾符）

**es5的source返回正則表達式的正文,es6的flags返回正則表達式的修飾符。

/abc/ig.source
// "abc"

/abc/ig.flags
// 'gi'

s修飾符：dotAll模式(使得.可以匹配任意單個字符)

/foo.bar/.test('foo\nbar')
// false

上面代碼中，因為.不匹配\n，所以正則表達式返回false。

但是，很多時候我們希望匹配的是任意單個字符，這時有一種變通的寫法[^]。

/foo[^]bar/.test('foo\nbar')
// true

這種解決方案畢竟不太符合直覺，ES2018 [引入]s修飾符，使得.可以匹配任意單個字符。

/foo.bar/s.test('foo\nbar') // true

這被稱為dotAll模式，即點（dot）代表一切字符。所以，正則表達式還引入了一個

`dotAll`屬性，返回一個布爾值，表示該正則表達式是否處在`dotAll`模式。

const re = /foo.bar/s;
// 另一種寫法
// const re = new RegExp('foo.bar', 's');

re.test('foo\nbar') // true
re.dotAll // true
re.flags // 's'

后行斷言

”先行斷言“指的是，x只有在y前面才匹配，必須寫成/x(?=y)/。比如，只匹配百分號之前的數字，要寫成/\d+(?=%)/。”先行否定斷言“指的是，x只有不在y前面才匹配，必須寫成/x(?!y)/。比如，只匹配不在百分號之前的數字，要寫成/\d+(?!%)/。

/\d+(?=%)/.exec('100% of US presidents have been male')  // ["100"]
/\d+(?!%)/.exec('that’s all 44 of them')                 // ["44"]

”先行斷言“括號之中的部分（(?=%)），是不計入返回結果的。

“后行斷言”正好與“先行斷言”相反，x只有在y后面才匹配，必須寫成/(?<=y)x/。比如，只匹配美元符號之后的數字，要寫成/(?<=$)\d+/。”后行否定斷言“則與”先行否定斷言“相反，x只有不在y后面才匹配，必須寫成/(?<!y)x/。比如，只匹配不在美元符號后面的數字，要寫成/(?<!$)\d+/。

/(?<=\$)\d+/.exec('Benjamin Franklin is on the $100 bill')  // ["100"]
/(?<!\$)\d+/.exec('it’s is worth about €90')                // ["90"]

上面的例子中，“后行斷言”的括號之中的部分（(?<=$)），也是不計入返回結果。

“后行斷言”的實現，需要先匹配/(?<=y)x/的x，然后再回到左邊，匹配y的部分。這種“先右后左”的執行順序，與所有其他正則操作相反，導致了一些不符合預期的行為。

首先，后行斷言的組匹配，與正常情況下結果是不一樣的。

/(?<=(\d+)(\d+))$/.exec('1053') // ["", "1", "053"]
/^(\d+)(\d+)$/.exec('1053') // ["1053", "105", "3"]

上面代碼中，需要捕捉兩個組匹配。

沒有“后行斷言”時，第一個括號是貪婪模式，第二個括號只能捕獲一個字符，所以結果是105和3。
而“后行斷言”時，由于執行順序是從右到左，第二個括號是貪婪模式，第一個括號只能捕獲一個字符，所以結果是1和053。

其次，“后行斷言”的反斜杠引用，也與通常的順序相反，必須放在對應的那個括號之前。

/(?<=(o)d\1)r/.exec('hodor')  // null
/(?<=\1d(o))r/.exec('hodor')  // ["r", "o"]

上面代碼中，如果后行斷言的反斜杠引用（\1）放在括號的后面，就不會得到匹配結果，必須放在前面才可以。
因為后行斷言是先從左到右掃描，發現匹配以后再回過頭，從右到左完成反斜杠引用。

Unicode 屬性類

ES2018了一種新的類的寫法\p{...}和\P{...}，允許正則表達式匹配符合 Unicode 某種屬性的所有字符。

uncoded屬性類要指定屬性名和屬性值。
有些屬性，只需指定屬性名或者屬性值。
\P{...}是\p{...}的反向匹配，即匹配不符合條件的字符。
注意這倆種類只對unicode有效，使用時一定要加上u修飾符,否則使用他們會報錯。

const regexGreekSymbol = /\p{Script=Greek}/u;
regexGreekSymbol.test('π') // true

\p{Script=Greek}指定匹配一個希臘文字母
/^\p{Decimal_Number}+$/u;指定匹配所有的十進制字符。
\p{Number}甚至能匹配羅馬數字。

// 匹配所有空格
\p{White_Space}

// 匹配各種文字的所有字母，等同于 Unicode 版的 \w
[\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Connector_Punctuation}\p{Join_Control}]

// 匹配各種文字的所有非字母的字符，等同于 Unicode 版的 \W
[^\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Connector_Punctuation}\p{Join_Control}]

// 匹配 Emoji
/\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F/gu

// 匹配所有的箭頭字符
const regexArrows = /^\p{Block=Arrows}+$/u;
regexArrows.test('←↑→↓??↖↗↘↙?????????????') // true

具名組匹配

ES2018 引入了[具名組匹配，允許為每一個組匹配指定一個名字，既便于閱讀代碼，又便于引用。

const RE_DATE = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/;

const matchObj = RE_DATE.exec('1999-12-31');
const year = matchObj.groups.year; // 1999
const month = matchObj.groups.month; // 12
const day = matchObj.groups.day; // 31

上面代碼中，“具名組匹配”在圓括號內部，模式的頭部添加“問號 + 尖括號 + 組名” （?<year>），然后就可以在exec方法返回結果的groups屬性上引用該組名。同時，數字序號（matchObj[1]）依然有效。

如果具名組沒有匹配，那么對應的groups對象屬性會是undefined。

const RE_OPT_A = /^(?<as>a+)?$/;
const matchObj = RE_OPT_A.exec('');

matchObj.groups.as // undefined
'as' in matchObj.groups // true

上面代碼中，具名組as沒有找到匹配，那么matchObj.groups.as屬性值就是undefined，并且as這個鍵名在groups是始終存在的。

解構賦值和替換

有了具名組匹配以后，可以使用解構賦值直接從匹配結果上為變量賦值。

let {groups: {one, two}} = /^(?<one>.*):(?<two>.*)$/u.exec('foo:bar');
one  // foo
two  // bar

字符串替換時，使用$<組名>引用具名組。

let re = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u;

'2015-01-02'.replace(re, '$<day>/$<month>/$<year>')
// '02/01/2015'

上面代碼中，replace方法的第二個參數是一個字符串，而不是正則表達式。

replace方法的第二個參數也可以是函數，該函數的參數序列如下。

'2015-01-02'.replace(re, (
   matched, // 整個匹配結果 2015-01-02
   capture1, // 第一個組匹配 2015
   capture2, // 第二個組匹配 01
   capture3, // 第三個組匹配 02
   position, // 匹配開始的位置 0
   S, // 原字符串 2015-01-02
   groups // 具名組構成的一個對象 {year, month, day}
 ) => {
 let {day, month, year} = args[args.length - 1];
 return `${day}/${month}/${year}`;
});

具名組匹配在原來的基礎上，新增了最后一個函數參數：具名組構成的一個對象。函數內部可以直接對這個對象進行解構賦值。

如果要在正則表達式內部引用某個“具名組匹配”，可以使用\k<組名>的寫法。

const RE_TWICE = /^(?<word>[a-z]+)!\k<word>$/;
RE_TWICE.test('abc!abc') // true
RE_TWICE.test('abc!ab') // false

數字引用（\1）依然有效。

const RE_TWICE = /^(?<word>[a-z]+)!\1$/;
RE_TWICE.test('abc!abc') // true
RE_TWICE.test('abc!ab') // false

const RE_TWICE = /^(?<word>[a-z]+)!\k<word>!\1$/;
RE_TWICE.test('abc!abc!abc') // true
RE_TWICE.test('abc!abc!ab') // false

String.prototype.matchAll

如果一個正則表達式在字符串里面有多個匹配，現在一般使用g修飾符或y修飾符，在循環里面逐一取出。

var regex = /t(e)(st(\d?))/g;
var string = 'test1test2test3';

var matches = [];
var match;
while (match = regex.exec(string)) {
  matches.push(match);
}

matches
// [
//   ["test1", "e", "st1", "1", index: 0, input: "test1test2test3"],
//   ["test2", "e", "st2", "2", index: 5, input: "test1test2test3"],
//   ["test3", "e", "st3", "3", index: 10, input: "test1test2test3"]
// ]

上面代碼中，while循環取出每一輪的正則匹配，一共三輪。

目前有一個提案,增加了String.prototype.matchAll方法，可以一次性取出所有匹配。不過，它返回的是一個遍歷器（Iterator），而不是數組。

const string = 'test1test2test3';

// g 修飾符加不加都可以
const regex = /t(e)(st(\d?))/g;

for (const match of string.matchAll(regex)) {
  console.log(match);
}
// ["test1", "e", "st1", "1", index: 0, input: "test1test2test3"]
// ["test2", "e", "st2", "2", index: 5, input: "test1test2test3"]
// ["test3", "e", "st3", "3", index: 10, input: "test1test2test3"]

上面代碼中，由于string.matchAll(regex)返回的是遍歷器，所以可以用for...of循環取出。相對于返回數組，返回遍歷器的好處在于，如果匹配結果是一個很大的數組，那么遍歷器比較節省資源。

遍歷器轉為數組是非常簡單的，使用...運算符或者Array.from方法就可以了。

// 轉為數組方法一
[...string.matchAll(regex)]

// 轉為數組方法二
Array.from(string.matchAll(regex));

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 230,362評論 6贊 544
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 99,577評論 3贊 429
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 178,486評論 0贊 383
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,852評論 1贊 317
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 72,600評論 6贊 412
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 55,944評論 1贊 328
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,944評論 3贊 447
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 43,108評論 0贊 290
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 49,652評論 1贊 336
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 41,385評論 3贊 358
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,616評論 1贊 374
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 39,111評論 5贊 364
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,798評論 3贊 350
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 35,205評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,537評論 1贊 295
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,334評論 3贊 400
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 48,570評論 2贊 379

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

es6正則擴展

es6正則擴展

RegExp構造函數

字符串的正則方法

u修飾符（unicoded模式）

RegExp.prototype.unicode 屬性

y修飾符（粘連修飾符）

RegExp.prototype.sticky 屬性

RegExp.prototype.flags 屬性（返回正則表達式的修飾符）

s修飾符：dotAll模式(使得.可以匹配任意單個字符)

`dotAll`屬性，返回一個布爾值，表示該正則表達式是否處在`dotAll`模式。

后行斷言

Unicode 屬性類

具名組匹配

解構賦值和替換

String.prototype.matchAll

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

es6正則擴展

RegExp構造函數

字符串的正則方法

u修飾符（unicoded模式）

RegExp.prototype.unicode 屬性

y修飾符（粘連修飾符）

RegExp.prototype.sticky 屬性

RegExp.prototype.flags 屬性（返回正則表達式的修飾符）

s修飾符：dotAll模式(使得.可以匹配任意單個字符)

dotAll屬性，返回一個布爾值，表示該正則表達式是否處在dotAll模式。

后行斷言

Unicode 屬性類

具名組匹配

解構賦值和替換

String.prototype.matchAll

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

`dotAll`屬性，返回一個布爾值，表示該正則表達式是否處在`dotAll`模式。