Java避免UTF-8的csv文件打开中文出现乱码的方法
本文实例讲述了Java避免UTF-8的csv文件打开中文出现乱码的方法。分享给大家供大家参考,具体如下:
最近又遇到了需要提供csv下载功能的需求,不同的时需要用java来实现,心想简单,就把以前php的版本重写了一遍,然后生成一份csv,用excel2007打开一看,里面的中文都是乱码,一下就懵了,以前好好的功能怎么突然不行了??以前也一直用2007的啊!于是开始了漫长的google之旅。
看来看去,说的都是输出utf-8格式的csv需要在文件头先输出BOM(BOM不懂的可以google了),即0xEF0xBB0xBF三个字节,这样更摸不着头脑了,明明是对的,偏偏不成功,直到发现一个帖子:http://stackoverflow.com/a/9337150/1794493 ,里面提到2007需要装sp3才能识别BOM,shit!原来是这回事!里面同时又提到,用utf-16le编码输出貌似更通用,经测试确实如此,但是utf-16le的BOM是0xFF0xFE,帖子里面说错了!下面是一个简单的测试结果:
excel版本
附加包
编码
测试结果
2007
sp3
utf-8
yes
2007
无
utf-8
no
2007
sp3
utf-16le
yes
2007
无
utf-16le
yes
2011
无
utf-8
no
2011
无
utf-16le
yes
因为条件有限,只测试了这几个版本,可见utf-16le是更通用的编码格式。下面附上java代码,main方法中采用utf-16le编码,最后调用了utf8编码的方法,最后会输出两种编码格式的csv文件:
importjava.io.*; /** *Createdbyzhaozhion15-5-29. */ publicclassTestCSV{ publicstaticStringjoin(String[]strArr,Stringdelim){ StringBuildersb=newStringBuilder(); for(Strings:strArr){ sb.append(s); sb.append(delim); } Stringret; if(strArr.length>1){ ret=sb.substring(0,sb.length()-1); } else{ ret=sb.toString(); } returnret; } publicstaticvoidmain(String[]args)throwsException{ String[]heads={"日期","产品","订单数"}; String[][]rows={ {"20150228","安卓","23"}, {"20150301","web","34"} }; byte[]bom={(byte)0xFF,(byte)0xFE}; Stringfname="d:\\utf-16le.csv"; BufferedOutputStreambo=newBufferedOutputStream(newFileOutputStream(fname)); bo.write(bom); bo.write(join(heads,"\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); for(String[]row:rows){ bo.write(join(row,"\t").getBytes("utf-16le")); bo.write("\n".getBytes("utf-16le")); } bo.close(); UTF8(); } publicstaticvoidUTF8()throwsIOException{ Stringline="中文,标题,23"; OutputStreamos=newFileOutputStream("d:/utf-8.csv"); os.write(239);//0xEF os.write(187);//0xBB os.write(191);//0xBF PrintWriterw=newPrintWriter(newOutputStreamWriter(os,"UTF-8")); w.print(line); w.flush(); w.close(); } }
更多关于java相关内容感兴趣的读者可查看本站专题:《Java编码操作技巧总结》、《Java数学运算技巧总结》、《Java数据结构与算法教程》、《Java字符与字符串操作技巧总结》、《Java操作DOM节点技巧总结》和《Java缓存操作技巧汇总》
希望本文所述对大家java程序设计有所帮助。