您的位置：首页 > 编程语言 > Java开发

java 下载文件名乱码解决方案+上传时文件名乱码

2014-12-25 14:36 246 查看

response.setHeader(...)下载中文文件名乱码问题

关于中文文件下载的问题，网上的咨询和答疑已经很多，我原来处理下载的代码如下：

Java代码

response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));

response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));

下载的程序里有了这句，一般在IE6的下载提示框上将正确显示文件的名字，无论是简体中文，还是日文。不过当时确实没有仔细测试文件名很长的中文文件名。先如今经过仔细测试，发现文字只要超过17个字，就不能下载了。经过好一番google和反复测试，总算对这个问题有了系统的认识，分列如下：

一. 通过我原来的方式，也就是先用URLEncoder编码，当中文文字超过17个时，IE6 无法下载文件。这是IE的bug，参见微软的知识库文章 KB816868 。原因可能是因为ie在处理 Response Header 的时候，对header的长度限制在150字节左右。而一个汉字编码成UTF-8是9个字节，那么17个字便是153个字节，所以便会报错。微软提供了一个补丁，可以从这里下载。这个补丁需要先安装ie6 sp1。因为我平时勤打补丁，我的IE6版本号是 6.0.2800.1106.xpsp2_xxxxx。所以我可能已经安装过了补丁，从而可以下载，但仍然出现文件名被截断的现象。微软让我们等待IE下一个service
pack的发布。我今天也上网看到了好消息，迫于firefox的压力，IE7可能在年中发布。另外，Firefox 不支持这样的方式，将把编码后的%xx%xx直接作为文件名显示。

二. 我尝试使用 javamail 的MimeUtility.encode()方法来编码文件名，也就是编码成 =?gb2312?B?xxxxxxxx?= 这样的形式，并从 RFC1522 中找到对应的标准支持。不过很遗憾，IE6并不支持这一个标准。我试了一下，Firefox是支持的。

三. 按网上很多人提供的解决方案：将文件名编码成ISO8859-1似乎是有效的解决方案，代码如下：

Java代码

response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );

response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );

在确保附件文件名都是简体中文字的情况下，那么这个办法确实是最有效的，不用让客户逐个的升级IE。如果台湾同胞用，把gb2312改成big5就行。但现在的系统通常都加入了国际化的支持，普遍使用UTF-8。如果文件名中又有简体中文字，又有繁体中文，还有日文。那么乱码便产生了。另外，在我的电脑上Firefox(v1.0-en)下载也是乱码。

折中考虑，我结合了一、三的方式，代码片断如下：

Java代码

String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/
if (fileName.length() > 150) {
String guessCharset = xxxx /*根据request的locale 得出可能的编码，中文操作系统通常是gb2312*/
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);

String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
        /*
         * see http://support.microsoft.com/default.aspx?kbid=816868          */
        if (fileName.length() > 150) {
            String guessCharset = xxxx /*根据request的locale 得出可能的编码，中文操作系统通常是gb2312*/
            fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1"); 
        }
        response.setHeader("Content-Disposition", "attachment; filename=" + fileName);

暂且不考虑 Firefox 是因为它目前似乎还没有有力侵食到IE的企业用户市场。影响客户买单的常常是进度，而不是兼容度。

通常，在涉及到中文的ＪＳＰ页面中，要根据不同的情形进行相应的编码变换：

要使ＪＳＰ页面能正确显示中文，在ＪＳＰ页面中加入：

　　<%@ page contentType="text/html;charset=GB2312"%>

要使JSP页面正确接收来自上一个页面提交的含中文信息的表单,以及从数据库或是文件中正确读出中文信息,就需要将得到的字符串进行代码转换如:

String str=new String(str.getBytes("ISO-8859-1"),"GBK");

而当JSP向数据库或文件中写入中文字符时,就要用相反的方式转换,如:

String str=new String(str.getBytes("GBK"),"ISO-8859-1");

PS:这里的"GBK"要根据你JSP页面的charset内容而定，不可盲目照搬。

jsp中的编码转换

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

java 下载文件名乱码解决方案+上传时 文件名乱码

java 下载文件名乱码解决方案+上传时文件名乱码