在Python的Django框架中用流响应生成CSV文件的教程
在Django里,流式响应StreamingHttpResponse是个好东西,可以快速、节省内存地产生一个大型文件。
目前项目里用于流式响应的一个是Eventsource,用于改善跨系统通讯时用户产生的慢速的感觉。这个不细说了。
还有一个就是生成一个大的csv文件。
当Django进程处于gunicorn或者uwsgi等web容器中时,如果响应超过一定时间没有返回,就会被web容器终止掉,虽然我们可以通过加长web容器的超时时间来绕过这个问题,但是毕竟还是治标不治本。要根本上解决这个问题,Python的生成器、Django框架提供的StreamingHttpResponse这个流式响应很有帮助
而在csv中,中文的处理也至关重要,要保证用excel打开csv不乱码什么的。。为了节约空间,我就把所有代码贴到一起了。。实际使用按照项目的规划放置哈
上代码:
from__future__importabsolute_import importcsv importcodecs importcStringIO classEcho(object): defwrite(self,value): returnvalue classUnicodeWriter: """ ACSVwriterwhichwillwriterowstoCSVfile"f", whichisencodedinthegivenencoding. """ def__init__(self,f,dialect=csv.excel,encoding="utf-8",**kwds): #Redirectoutputtoaqueue self.queue=cStringIO.StringIO() self.writer=csv.writer(self.queue,dialect=dialect,**kwds) self.stream=f self.encoder=codecs.getincrementalencoder(encoding)() defwriterow(self,row): self.writer.writerow([handle_column(s)forsinrow]) #FetchUTF-8outputfromthequeue... data=self.queue.getvalue() data=data.decode("utf-8") #...andreencodeitintothetargetencoding data=self.encoder.encode(data) #writetothetargetstream value=self.stream.write(data) #emptyqueue self.queue.truncate(0) returnvalue defwriterows(self,rows): forrowinrows: self.writerow(row)
fromdjango.views.genericimportView fromdjango.http.responseimportStreamingHttpResponse classExampleView(View): headers=['一些','表头'] defget(self,request): result=[['第一行','数据1'], ['第二行','数据2']] echoer=Echo() writer=UnicodeWriter(echoer) defcsv_itertor(): yieldcodecs.BOM_UTF8 yieldwriter.writerow(self.headers) forcolumninresult: yieldwriter.writerow(column) response=StreamingHttpResponse( (rowforrowincsv_itertor()), content_type="text/csv;charset=utf-8") response['Content-Disposition' ]='attachment;filename="example.csv"' returnresponse