深入解析PHP中foreach语句控制数组循环

深入解析PHP中foreach语句控制数组循环的用法,是PHP入门学习中的基础知识,需要的朋友可以参考下。

深入解析PHP中foreach语句控制数组循环

  foreach是PHP中很常用的一个用作数组循环的控制语句

因为它的方便和易用,自然也就在后端隐藏着很复杂的具体实现方式(对用户透明)

今天,我们就来一起分析分析,foreach是如何实现数组(对象)的遍历的。

我们知道PHP是一个脚本语言,也就是说,用户编写的PHP代码最终都是会被PHP解释器解释执行,

特别的,对于PHP来说,所有的用户编写的PHP代码,都会被翻译成PHP的虚拟机ZE的虚拟指令(OPCODES)来执行,不论细节的话,就是说,我们所编写的任何PHP脚本,都会最终被翻译成一条条的指令,从而根据指令,由相应的C编写的函数来执行。

那么foreach会被翻译成什么样子呢?

foreach($arr as $key => $val){

echo $key . '=>' . $val . " ";

}

在词法分析阶段,foreach会被识别为一个TOKEN:T_FOREACH,

在语法分析阶段,会被规则:

unticked_statement: //没有被绑定ticks的语句

//有省略

| T_FOREACH '(' variable T_AS

{ zend_do_foreach_begin(&$1, &$2, &$3, &$4, 1 TSRMLS_CC); }

foreach_variable foreach_optional_arg ')' { zend_do_foreach_cont(&$1, &$2, &$4, &$6, &$7 TSRMLS_CC); }

foreach_statement { zend_do_foreach_end(&$1, &$4 TSRMLS_CC); }

| T_FOREACH '(' expr_without_variable T_AS

{ zend_do_foreach_begin(&$1, &$2, &$3, &$4, 0 TSRMLS_CC); }

variable foreach_optional_arg ')' { zend_check_writable_variable(&$6); zend_do_foreach_cont(&$1, &$2, &$4, &$6, &$7 TSRMLS_CC); }

foreach_statement { zend_do_foreach_end(&$1, &$4 TSRMLS_CC); }

//有省略

;

仔细分析这段语法规则,我们可以发现,对于:

foreach($arr as $key => $val){

echo $key . ‘=>' . $val .” ”;

}

会被分析为:

T_FOREACH '(' variable T_AS { zend_do_foreach_begin('foreach', '(', $arr, 'as', 1 TSRMLS_CC); }

foreach_variable foreach_optional_arg(T_DOUBLE_ARROW foreach_variable) ')' { zend_do_foreach_cont('foreach', '(', 'as', $key, $val TSRMLS_CC); }

foreach_satement {zend_do_foreach_end('foreach', 'as');}

然后,让我们来看看foreach_statement:

它其实就是一个代码块,体现了我们的 echo $key . ‘=>' . $val .” ”;

T_ECHO expr;

显然,实现foreach的核心就是如下3个函数:

zend_do_foreach_begin

zend_do_foreach_cont

zend_do_foreach_end

其中,zend_do_foreach_begin (代码太长,直接写伪码) 主要做了:

1. 记录当前的opline行数(为以后跳转而记录)

2. 对数组进行RESET(讲内部指针指向第一个元素)

3. 获取临时变量 ($val)

4. 设置获取变量的OPCODE FE_FETCH,结果存第3步的临时变量

4. 记录获取变量的OPCODES的行数

而对于 zend_do_foreach_cont来说:

1. 根据foreach_variable的来判断是否引用

2. 根据是否引用来调整zend_do_foreach_begin中生成的FE_FETCH方式

3. 根据zend_do_foreach_begin中记录的取变量的OPCODES的行数,来初始化循环(主要处理在循环内部的循环:do_begin_loop)

最后zend_do_foreach_end:

1. 根据zend_do_foreach_begin中记录的行数信息,设置ZEND_JMP OPCODES

2. 根据当前行数,设置循环体下一条opline, 用以跳出循环

3. 结束循环(处理循环内循环:do_end_loop)

4. 清理临时变量

当然, 在zend_do_foreach_cont 和 zend_do_foreach_end之间 会在语法分析阶段被填充foreach_satement的语句代码。

这样,就实现了foreach的OPCODES line。

比如对于我们开头的实例代码,最终生成的OPCODES是:

filename: /home/huixinchen/

function name: (null)

number of ops: 17

compiled vars: !0 = $arr, !1 = $key, !2 = $val

line # op fetch ext return operands

-------------------------------------------------------------------------------

2 0 SEND_VAL 1

1 SEND_VAL 100

2 DO_FCALL 2 'range'

3 ASSIGN !0, $0

3 4 FE_RESET $2 !0, ->14

5 FE_FETCH $3 $2, ->14

6 ZEND_OP_DATA ~5

7 ASSIGN !2, $3

8 ASSIGN !1, ~5

4 9 CONCAT ~7 !1, '-'

10 CONCAT ~8 ~7, !2

11 CONCAT ~9 ~8, '%0A'

12 ECHO ~9

5 13 JMP ->5

14 SWITCH_FREE $2

7 15 RETURN 1

16* ZEND_HANDLE_EXCEPTION

我们注意到FE_FETCH的op2的操作数是14,也就是JMP后一条opline,也就是说,在获取完最后一个数组元素以后,FE_FETCH失败的情况下,会跳到第14行opline,从而实现了循环的结束。

而15行opline的op1的操作数是指向了FE_FETCH,也就是无条件跳转到第5行opline,从而实现了循环。

附录:

void zend_do_foreach_begin(znode *foreach_token, znode *open_brackets_token, znode *array, znode *as_token, int variable TSRMLS_DC)

{

zend_op *opline;

zend_bool is_variable;

zend_bool push_container = 0;

zend_op dummy_opline;

if (variable) {

//是否是匿名数组

if (zend_is_function_or_method_call(array)) {

//是否是函数返回值

is_variable = 0;

} else {

is_variable = 1;

}

/* 使用括号记录FE_RESET的opline行数 */

open_brackets_token->ne_num = get_next_op_number(CG(active_op_array));

zend_do_end_variable_parse(BP_VAR_W, 0 TSRMLS_CC); //获取数组/对象和zend_do_begin_variable_parse对应

if (CG(active_op_array)->last > 0 &&

CG(active_op_array)->opcodes[CG(active_op_array)->last-1]de == ZEND_FETCH_OBJ_W) {

/* Only lock the container if we are fetching from a real container and not $this */

if (CG(active_op_array)->opcodes[CG(active_op_array)->last-1]_type == IS_VAR) {

CG(active_op_array)->opcodes[CG(active_op_array)->last-1]nded_value |= ZEND_FETCH_ADD_LOCK;

push_container = 1;

}

}

} else {

is_variable = 0;