java中导出csv文件时出现乱码的解决方法

发布时间：2020-06-19 10:26:49 来源：亿速云阅读：514 作者：Leah 栏目：编程语言

这篇文章将为大家详细讲解有关java中导出csv文件时出现乱码的解决方法，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

一、问题

将查询的数据以xls文件导出时（UTF-8编码），数据正常；但以CSV文件导出时，文件中的中文乱码，同样是UTF-8编码，改成GBK编码导出时，中文显示正常。

本以为问题解决，后面导出含拉丁字符（如ÀÆÊàÌ）的数据时，以xls文件导出数据正常显示，以CSV文件导出时，文件中的拉丁字符显示为“？”号。

二、解决方法

以CSV方式导出的文件中默认不含BOM信息，通过给将要输出的内容设置BOM标识(以 EF BB BF 开头的字节流)即可解决该问题。

具体方法如下：

...
OutputStreamWriter outputStreamWriter = new OutputStreamWriter(response.getOutputStream(), "UTF-8");  
// 要输出的内容  
result = (String)contentMap.get(RESPONSE_RESULT);  
response.setHeader("Content-Disposition", "attachment;filename=test.csv");  
outputStreamWriter.write(new String(new byte[]{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF}));  
outputStreamWriter.write(result);  
outputStreamWriter.flush();

如果是以OutputStream流实现的，参数可以按如下修改：

out = response.getOutputStream();     
//加上UTF-8文件的标识字符      
out.write(new byte []{(byte) 0xEF, (byte) 0xBB, (byte) 0xBF});

注：

BOM： Byte Order Mark，字节顺序标记（以下摘自百度百科）

在UCS 编码中有一个叫做 “Zero Width No-Break Space” ，中文译名作“零宽无间断间隔”的字符，它的编码是 FEFF。而 FFFE 在 UCS 中是不存在的字符，所以不应该出现在实际传输中。

UCS 规范建议我们在传输字节流前，先传输字符 “Zero Width No-Break Space”，这样如果接收者收到 FEFF，就表明这个字节流是 Big-Endian 的；如果收到FFFE，就表明这个字节流是 Little- Endian 的。

因此字符 “Zero Width No-Break Space（零宽无间断间隔）” 又被称作 BOM。

UTF-8 不需要 BOM 来表明字节顺序，但可以用 BOM 来表明编码方式。字符 “Zero Width No-Break Space” 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流，就知道这是 UTF-8编码了。

Windows 就是使用 BOM 来标记文本文件的编码方式的。

关于java中导出csv文件时出现乱码的解决方法就分享到这里了，希望以上内容可以对大家有一定的帮助，可以学到更多知识。如果觉得文章不错，可以把它分享出去让更多的人看到。

向AI问一下细节

java中导出csv文件时出现乱码的解决方法

猜你喜欢

最新资讯

相关推荐

相关标签