PHP源碼分析:empty()和is_array()的實現

事情起因于我昨天提交的這樣一段代碼:

$subwayInfo = \MsServiceApi::call('Service_Data_Fang_SubwayInfo.getSubwayMap', $houseInfo['xiaoqu_id'], $houseInfo['city'], $houseInfo['latlng']);

$retInfo['have_line'] = 0;

if(is_array($subwayInfo) && !empty($subwayInfo)){
    if(isset($subwayInfo['panshi_subway_line']) && !empty($subwayInfo['panshi_subway_line'])){
        $subwayLines = str_replace(' ', ',', trim($subwayInfo['panshi_subway_line']));
        $retInfo['subway_line'] = $subwayLines;
        $retInfo['have_line'] = 1;
    }else{

問題代碼:

if(is_array($subwayInfo) && !empty($subwayInfo)){

leader認為應該先empty()判斷,再is_array()判斷,這種寫法也更為多見。而我還是覺得其實差不多。群里討論之后,也沒有確定性的結論,究竟哪一種更好。于是乎,我去看了兩者的源碼實現。

先看更為簡單的is_array()實現:

is_array()是php內置函數,通過擴展方式實現的。打開php源碼,ext/standard/目錄下

[bodeMacBook-Pro:standard bo$ pwd
/Users/bo/web/php-7.1.5/ext/standard
[bodeMacBook-Pro:standard bo$ grep -r 'PHP_FUNCTION(is_array)' *
php_type.h:PHP_FUNCTION(is_array);
type.c:PHP_FUNCTION(is_array)

可見is_array這個函數的實現在type.c文件,打開后看到其實現:

/* {{{ proto bool is_array(mixed var)
   Returns true if variable is an array
   Warning: This function is special-cased by zend_compile.c and so is usually bypassed 
 */
PHP_FUNCTION(is_array)
{
    php_is_type(INTERNAL_FUNCTION_PARAM_PASSTHRU, IS_ARRAY);
}
/* }}} */

可見是調用php_is_type函數實現。通過注釋及函數名,可以猜測:是通過獲取php的變量類型是否為數組來實現的。

php變量zval結構如下:

typedef struct _zval_struct {
    zvalue_value value;
    zend_uint refcount;
    zend_uchar type;
    zend_uchar is_ref;
  } zval;

以下是php_is_type函數的具體實現:

static inline void php_is_type(INTERNAL_FUNCTION_PARAMETERS, int type)
{
    zval *arg;

    ZEND_PARSE_PARAMETERS_START(1, 1)
        Z_PARAM_ZVAL_DEREF(arg)
    ZEND_PARSE_PARAMETERS_END_EX(RETURN_FALSE);

    if (Z_TYPE_P(arg) == type) {
        if (type == IS_OBJECT) {
            zend_class_entry *ce = Z_OBJCE_P(arg);
            if (ZSTR_LEN(ce->name) == sizeof(INCOMPLETE_CLASS) - 1
                    && !memcmp(ZSTR_VAL(ce->name), INCOMPLETE_CLASS, sizeof(INCOMPLETE_CLASS) - 1)) {
                RETURN_FALSE;
            }
        } else if (type == IS_RESOURCE) {
            const char *type_name = zend_rsrc_list_get_rsrc_type(Z_RES_P(arg));
            if (!type_name) {
                RETURN_FALSE;
            }
        }
        RETURN_TRUE;
    } else {
        RETURN_FALSE;
    }
}

可以看到和猜測的一樣:通過Z_TYPE_P宏獲取變量類型,判斷是否為IS_ARRAY返回。

再看更為復雜的empty()實現原理:

empty不是一個函數,而是一個語言結構。語言結構是在PHP程序運行前編譯好的,因此不能像之前那樣簡單地搜索PHP_FUNCTION empty或ZEND_FUNCTION empty查看其源碼。要想看empty等語言結構的源碼,先要理解PHP代碼執行的機制。

PHP執行代碼會經過4個步驟,其流程圖如下所示:


php代碼執行流程

在第一個階段,即Scanning階段,程序會掃描zend_language_scanner.l文件將代碼文件轉換成語言片段。

打開zend_language_scanner.l文件:

1409 <ST_IN_SCRIPTING>"empty" {
1410     RETURN_TOKEN(T_EMPTY);
1411 }

可見 empty 生成對應的token為 T_EMPTY

接下來就到了Parsing階段,這個階段,程序將T_EMPTY等Tokens轉換成有意義的表達式,此時會做語法分析,Tokens的yacc保存在zend_language_parser.y文件中。

可以找到T_EMPTY的定義:

1257 internal_functions_in_yacc:
1258         T_ISSET '(' isset_variables ')' { $$ = $3; }
1259     |   T_EMPTY '(' expr ')' { $$ = zend_ast_create(ZEND_AST_EMPTY, $3); }
1260     |   T_INCLUDE expr
1261             { $$ = zend_ast_create_ex(ZEND_AST_INCLUDE_OR_EVAL, ZEND_INCLUD     E, $2); }
1262     |   T_INCLUDE_ONCE expr
1263             { $$ = zend_ast_create_ex(ZEND_AST_INCLUDE_OR_EVAL, ZEND_INCLUD     E_ONCE, $2); }

第三階段,將表達式編譯成opcodes,可見empty對應的opcodes為ZEND_AST_EMPTY。打開zend_compile.c文件:

7978         case ZEND_AST_ISSET:
7979         case ZEND_AST_EMPTY:
7980             zend_compile_isset_or_empty(result, ast);
7981             return;
7982         case ZEND_AST_SILENCE:
7983             zend_compile_silence(result, ast);
7984             return;

可見opcode執行的函數為zend_compile_isset_or_empty

void zend_compile_isset_or_empty(znode *result, zend_ast *ast) /* {{{ */
{
    zend_ast *var_ast = ast->child[0];

    znode var_node;
    zend_op *opline = NULL;

    ZEND_ASSERT(ast->kind == ZEND_AST_ISSET || ast->kind == ZEND_AST_EMPTY);

    if (!zend_is_variable(var_ast) || zend_is_call(var_ast)) {
        if (ast->kind == ZEND_AST_EMPTY) { 
            /* empty(expr) can be transformed to !expr */
            zend_ast *not_ast = zend_ast_create_ex(ZEND_AST_UNARY_OP, ZEND_BOOL_NOT, var_ast);   
            zend_compile_expr(result, not_ast);
            return;
        } else { 
            zend_error_noreturn(E_COMPILE_ERROR,
                "Cannot use isset() on the result of an expression "
                "(you can use \"null !== expression\" instead)");
        }            
    }        

    switch (var_ast->kind) {
        case ZEND_AST_VAR:
    .
    .
    .
    result->op_type = opline->result_type = IS_TMP_VAR;
    opline->extended_value |= ast->kind == ZEND_AST_ISSET ? ZEND_ISSET : ZEND_ISEMPTY;
}
/* }}} */

從這個函數最后一行可以看出,最終執行的還是ZEND_ISEMPTY。
第四步,執行opcodes,zend_vm_execute.h

6981 is_static_prop_return:
6982     if (opline->extended_value & ZEND_ISSET) {
6983         result = value && Z_TYPE_P(value) > IS_NULL &&
6984             (!Z_ISREF_P(value) || Z_TYPE_P(Z_REFVAL_P(value)) != IS_NULL);
6985     } else /* if (opline->extended_value & ZEND_ISEMPTY) */ {
6986         result = !value || !i_zend_is_true(value);
6987     }

可見,ZEND_ISEMPTY執行的是 i_zend_is_true函數。

[bodeMacBook-Pro:Zend bo$ grep -r 'i_zend_is_true' *
zend_operators.h:static zend_always_inline int i_zend_is_true(zval *op)

打開zend_operators.h,查看其實現:

static zend_always_inline int i_zend_is_true(zval *op)
{
    int result = 0;

again:
    switch (Z_TYPE_P(op)) {
        case IS_TRUE:
            result = 1;
            break;
        case IS_LONG:
            if (Z_LVAL_P(op)) {
                result = 1;
            }
            break;
        case IS_DOUBLE:
            if (Z_DVAL_P(op)) {
                result = 1;
            }
            break;
        case IS_STRING:
            if (Z_STRLEN_P(op) > 1 || (Z_STRLEN_P(op) && Z_STRVAL_P(op)[0] != '0')) {
                result = 1;
            }
            break;
        case IS_ARRAY:
            if (zend_hash_num_elements(Z_ARRVAL_P(op))) {
                result = 1;
            }
            break;
        case IS_OBJECT:
            result = zend_object_is_true(op);
            break;
        case IS_RESOURCE:
            if (EXPECTED(Z_RES_HANDLE_P(op))) {
                result = 1;
            }
            break;
        case IS_REFERENCE:
            op = Z_REFVAL_P(op);
            goto again;
            break;
        default:
            break;
    }
    return result;
}

可見,empty的最終實現也是通過 Z_TYPE_P 獲取變量類型,然后再進行判斷的。
當$var為數組時,判斷是否為空數組。至此,終于弄明白empty()和is_array()的原理。

回到最初的問題,就那個使用場景而言,is_array()判斷是多余的。另外我的結論是:大部分使用場景下,應該用empty()先做判斷。因為底層原理都是通過zval結構體實現的,但empty是語法結構,而is_array()等是函數,調用開銷是要小的。

ps:歡迎指正 :-)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 內存是計算機非常關鍵的部件之一,是暫時存儲程序以及數據的空間,CPU只有有限的寄存器可以用于 存儲計算數據,而大部...
    dreamer_lk閱讀 1,226評論 2 10
  • 在閱讀下面的內容之前,我假定已看到的人已經對 PHP 7 基本的數據結構都有大致的了解了,這是下面內容閱讀的前提。...
    優才學院閱讀 2,478評論 0 3
  • 昨天和凱哥學咖啡時,凱哥趁我不注意時翻看了我的手機相冊,當我再一次將手機拿到自己手里時才發現。 下班回家的路上我仔...
    青青米粉閱讀 183評論 0 0
  • 動態色彩流動的登錄頁面 看了QQ 9.0 的登錄頁面,感覺還可以,自己也嘗試去山寨一個~ 最后實現的效果 用js+...
    程序魚閱讀 847評論 4 9
  • 老子有云:“道法自然。”處于紛擾紅塵間的我們卻鮮有感受自然。皎月之明,山水之靜,草木之盈,無不讓我感受自然這...
    依之夢盈閱讀 255評論 0 6