PHP的foreach中使用引用时需要注意的一个问题和解决方法
一、问题
先看一个例子:
<?php
$ar=array(1,2,3);
var_dump($ar);
foreach($aras&$v){}
foreach($aras$v){}
var_dump($ar);
?>
输出为:
array(3){
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
array(3){
[0]=>
int(1)
[1]=>
int(2)
[2]=>
&int(2)
}
???为什么没有进行赋值操作,数组最后一个元素的值却发生了改变呢?
我早就发现了这个问题,一开始以为是PHP的bug,就扔着没管它,foreach中不使用引用就没事,用foreach$k=>$v然后$ar[$k]来改变原始数组,略微损失点效率。
二、分析
今天花了点时间,看了参考中的文章,算是稍微明白一点了,原来是这个样子的:
在执行第一个使用引用的foreach时,一开始,$v指向$ar[0]的存储空间,空间内存储着1,foreach结束时,$v指向$ar[2]的存储空间,空间内存储着3。下面要开始执行第二个foreach了,注意和第一个foreach不同,第二个foreach没有使用引用,那么就是赋值方式,即将$ar的值依次赋值给$v。进行到第一个元素时,要将$ar[0]赋值给$v。问题就在这里,由于刚刚执行完第一个foreach,$v不是一个新变量,而是已经存在的、指向$ar[2]的那个引用,如此一来,对$v进行赋值的时候,就将$ar[0]=1写入了$ar[2]的实际存储空间,相当于对$ar[2]进行赋值。依此类推,第二个foreach执行的结果,就是数组的最后一个元素变成了倒数第二个元素的值。参考文章2中有详细的示意图。
如果说这是一个错误,那么错误的原因就在于对引用变量的使用。当引用变量指向和其他变量时,改变引用变量的值当然会影响到他指向的其他变量。单独说谁都明白,但在这个foreach例子中,凑巧了,同一个变量两次被使用,前一次是引用的身份,后一次是普通变量身份,就产生了意料之外的效果。PHP的开发者也认为,这种情况属于语言特性造成的,不是bug。的确,如果要修复这个问题,一种方法是对foreach进行特殊处理之外,另外一种就是限制foreach中$v的作用域,这两种方式都与目前PHP的语言特性不符,开发人员不愿改,但还是在官方文档中用Warning进行了说明。
三、解决方法
简单,但谈不上完美,就是在使用了引用的foreach之后,unset掉$v,开始的例子改为:
<?php
$ar=array(1,2,3);
var_dump($ar);
foreach($aras&$v){}
unset($v);
foreach($aras$v){}
var_dump($ar);
?>
运行结果:
array(3){
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
array(3){
[0]=>
int(1)
[1]=>
int(2)
[2]=>
int(3)
}
参考
Bug#29992foreachbyreferencecorruptsthearray:https://bugs.php.net/bug.php?id=29992
Referencesandforeach:http://schlueters.de/blog/archives/141-References-and-foreach.html