9.2.3 正則表達式中的原子1
原子是正則表達式的最基本的組成單元,而且在每個模式中最少要少包含一個原子。原子是由所有那些未顯示指定為元字符的打印和非打印字符組成,具體分為5類。
1. 普通字符作為原子: 如 az、AZ、0~9 等
2. 一些特殊字符和轉義后元字符作為原子:
所有標點符號,但語句特殊意義的符號需要轉義后才可作為原子,如:\” \’ * + ? . 等
3. 一些非打印字符作為原子: 如:\f \n \r \t \v \cx
4. 使用“通用字符類型”作為原子:如:\d \D \w \W \s \S。
5. 自定義原子表([])作為原子:如:’/[apj]sp/’ ’/[^apj]sp/’
01.png
02.png
test.php
<?php
/*
* 原子:
*
* 1. 打印字符(a-z A-Z 0-9 !@#$%^&*()_+) 和非打印字符
*
*
*
* \ 轉義字符
*
* 一、 可以將有意義的字符轉成沒有意義的原子字符 (將有意義變成原子)
* 二、 可以將沒有意義的字符轉成有意義的原子
* 三、 a-z A-Z 0-9 _ 所有沒有意義的字符, 加上轉義也沒有意義的, \@ 都是可加可不加的
*
*
*
*/
$str = "thics \9 is @ a ^ tes t.<br>";
$reg = '/9/';
if(preg_match($reg, $str, $arr) ) {
echo "正則表達式 <b>{$reg}</b> 和字符串 <b>{$str}</b> 匹配成功!<br>";
print_r($arr);
} else {
echo "沒有匹配上<br>";
}