ES6中在正則表達式中,新增了許多新的特性和一些新的API
一、RegExp構(gòu)造函數(shù)? ??
????????1.在 ES5 中,RegExp構(gòu)造函數(shù)的參數(shù)有兩種情況。
????????????1.1 第一種情況是,第一個參數(shù)是字符串,第二個參數(shù)是表示正則表達式的修飾符(flag)
????????????1.2 第二種情況是,參數(shù)是一個正則表示式,這時會返回一個原有正則表達式的拷貝。
RegExp構(gòu)造函數(shù)的參數(shù)是一個正則表達式的時候,ES5 不允許此時使用第二個參數(shù)添加修飾符,否則會報錯。
????????2. ES6 改變了這種行為(第一個參數(shù)是正則表達式的情況)。在ES6中,RegExp構(gòu)造函數(shù)第一個參數(shù)是一個正則對象,那么可以使用第二個參數(shù)指定修飾符。而且,返回的正則表達式會忽略原有的正則表達式的修飾符,只使用新指定的修飾符。
二、U修飾符
? ??????ES6 對正則表達式添加了u修飾符,含義為“Unicode 模式”,用來正確處理大于\uFFFF的 Unicode 字符。也就是說,會正確處理四個字節(jié)的 UTF-16 編碼。
????????上面代碼中,\uD83D\uDC2A是一個四個字節(jié)的 UTF-16 編碼,代表一個字符。但是,ES5 不支持四個字節(jié)的 UTF-16 編碼,會將其識別為兩個字符,導(dǎo)致第二行代碼結(jié)果為true。加了u修飾符以后,ES6 就會識別其為一個字符,所以第一行代碼結(jié)果為false。
????????一旦加上u修飾符號,就會修改下面這些正則表達式的行為。
? ? ? ?2.1?點字符?
? ??????點(.)字符在正則表達式中,含義是除了換行符以外的任意單個字符。對于碼點大于0xFFFF的 Unicode 字符,點字符不能識別,必須加上u修飾符。
? ??????2.2?Unicode 字符表示法
? ??????ES6 新增了使用大括號表示 Unicode 字符,這種表示法在正則表達式中必須加上u修飾符,才能識別當中的大括號,否則會被解讀為量詞。
? ??????2.3量詞
????????使用u修飾符后,所有量詞都會正確識別碼點大于0xFFFF的 Unicode 字符。
? ??????2.4? U修飾符可以正確返回字符串的長度
? ? ? ?2-4-1? ?length屬性讀取長度是每兩個字節(jié)當做長度1,所以在默認情況下,對于大于\uFFFF的Unicode字符會識別為長度2,這顯然不符合我們的條件。
? ? ? ?2-4-2? 在u修飾符下,對于大于\uFFFF的Unicode字符會正確識別為長度1,符合我們預(yù)期的要求
三、 y 修飾符(“粘連”修飾符)
????????3.1? ES6 還為正則表達式添加了y修飾符,叫做“粘連”(sticky)修飾符。
? ??????3.2? y修飾符的作用與g修飾符類似,也是全局匹配,后一次匹配都從上一次匹配成功的下一個位置開始。不同之處在于,g修飾符只要剩余位置中存在匹配就可,而y修飾符確保匹配必須從剩余的第一個位置開始,這也就是“粘連”的涵義。
? ? ? ? 上面代碼有兩個正則表達式,一個使用g修飾符,另一個使用y修飾符。這兩個正則表達式各執(zhí)行了兩次,第一次執(zhí)行的時候,兩者行為相同,剩余字符串都是_aa_a。由于g修飾沒有位置要求,所以第二次執(zhí)行會返回結(jié)果,而y修飾符要求匹配必須從頭部開始,所以返回null。
? ??????3.3 使用lastIndex屬性,可以更好地說明y修飾符
? ? ? ? ????3.3.1 改變lastIndex屬性的值,對于正則修飾符g的影響。
? ? ? ??? ??3.3.2 改變lastIndex屬性的值,對于正則修飾符y的影響。
? ? ? ? ????3.3.3? 總結(jié)一下:其實y修飾符號隱含了頭部匹配的標志^。y修飾符的設(shè)計本意,就是讓頭部匹配的標志^在全局匹配中都有效。
? ? ? ? 3.4? y修飾符與正則的replace()方法
????????????3.4.1 y修飾符和其他修飾符一起作用正則表達式的時候,修飾符的順序?qū)Y(jié)果無影響
? ? ? ? ????3.4.2? 在replace()方法中,y修飾符在g修飾符下可以匹配所有的結(jié)果
? ? ? ? 3.5? y修飾符與match()方法
? ??????單單一個y修飾符對match方法,只能返回第一個匹配,必須與g修飾符聯(lián)用,才能返回所有匹配。
? ??????3.6? y修飾符與split()方法
? ??????3.7 y修飾符的一個應(yīng)用,是從字符串提取 token(詞元),y修飾符確保了匹配之間不會有漏掉的字符。
? ??????
????????上面代碼中,如果字符串里面沒有非法字符,y修飾符與g修飾符的提取結(jié)果是一樣的。但是,一旦出現(xiàn)非法字符,兩者的行為就不一樣了。
? ??上面代碼中,g修飾符會忽略非法字符,而y修飾符不會,這樣就很容易發(fā)現(xiàn)錯誤。
? ??????四、s修飾符:dotAll 模式 提案階段
? ??????正則表達式中,點(.)是一個特殊字符,代表任意的單個字符,但是行終止符(line terminator character)除外。以下四個字符屬于”行終止符“。
????????1.U+000A 換行符(\n)
????????2.U+000D 回車符(\r)
????????3.U+2028 行分隔符(line separator)
????????4.U+2029 段分隔符(paragraph separator)
? ? ? ? 例如:
????????但是,很多時候我們希望匹配的是任意單個字符,這時有幾種變通的寫法。
????????s修飾符相當于是給.這個特殊的字符增加‘功力’的,讓他能夠匹配到任意的單個字符,但是目前還屬于提案階段。
? ? ? ? s修飾符還引入了一個dotAll屬性,返回布爾值,驗證該正則表達式是否處在dotAll模式。
? ??????五、sticky屬性
? ??????ES6 的正則對象多了sticky屬性,表示是否設(shè)置了y修飾符。
? ??????六、flags屬性
? ??????ES6 為正則表達式新增了flags屬性,會返回正則表達式的修飾符。
ES6關(guān)于正則的擴展其實還有一些其他的新特性,例如具名組匹配,后行斷言,但由于都還處于提案中,因此就不細說下去