Laravel中的chunk组块结果集处理与注意问题
前言
如果你需要处理成千上万个Eloquent结果,可以使用chunk命令。chunk方法会获取一个“组块”的Eloquent模型,并将其填充到给定闭包进行处理。使用chunk方法能够在处理大量数据集合时能够有效减少内存消耗:
Flight::chunk(200,function($flights){ foreach($flightsas$flight){ // } }); $all_ark=Arkvolume::chunk(50000,function($flights){ foreach($flightsas$flight){ $GLOBALS['something'][]=$flight['id']; } }); var_dump($GLOBALS['something']);exit;
这段代码是执行一个100条的数据进行更新,当执行完成后继续后面的另一百条数据……
也就是说他每次操作的是一个数据块而不是整个数据库。
需要注意的是:当使用带筛选的条件的chunk时,如果是自更新,那么你会漏掉一些数据,接着看代码:
User::where('approved',0)->chunk(100,function($users){ foreach($usersas$user){ $user->update(['approved'=>1]); } });
如果要运行上面的代码,并不会有报错,但是where条件是筛选approved为0的user然后将approved的值跟新为1。
在这个过程中,档第一数据库的数据被修改后,下一个数据块的数据将是在被修改后的数据中选出来的,这个时候数据变了,而page也加了1。所以执行结束后,只对数据中一半的数据进行了更新操作。
如果没有明白的话,我们来看一下chunk的底层实现。还以上面的代码为例,假如一共有400条数据,数据被按照100条进行分块处理。
page=1:最开始的时候page为1,选取1-100条数据进行处理;
page=2:这时候前一百数据的approved值全部为1,那么在次筛选的时候数据将从第101条开始,而这个时候的page=2,那么处理的数据将是第200-300之前的数据
之后依旧。
publicfunctionchunk($count,callable$callback) { $results=$this->forPage($page=1,$count)->get(); while(count($results)>0){ //Oneachchunkresultset,wewillpassthemtothecallbackandthenletthe //developertakecareofeverythingwithinthecallback,whichallowsusto //keepthememorylowforspinningthroughlargeresultsetsforworking. if(call_user_func($callback,$results)===false){ returnfalse; } $page++; $results=$this->forPage($page,$count)->get(); } returntrue; }
Laravelchunk使用注意的问题
使用Laravel的chunk可以用来优化大结果集的查询,提供分块处理数据的方法,但是如下的例子就会有问题:
User::where('approved',0)->chunk(100,function($users){ foreach($usersas$user){ $user->update(['approved'=>1]); } });
原因在于第一次查询:
select*fromuserswhereapproved=0limit100offset0;
update这一批数据的approved为1之后,
再看第二次查询:
select*fromuserswhereapproved=0limit100offset100;
这个时候因为有whereapproved=0条件并且偏移量从100开始,这样其实就漏掉了100条approved为0的数据。
所以,我们要避免使用chunk的时候,更改和过滤条件的字段的值。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对毛票票的支持。