http://blog.csdn.net/ai_33/archive/2008/06/10/2529096.aspx
關于中文文件下載的問題,網上的咨詢和答疑已經很多,我原來處理下載的代碼如下:
response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));
下載的程序里有了這句,一般在IE6的下載提示框上將正確顯示文件的名字,無論是簡體中文,還是日文。不過當時確實沒有仔細測試文件名很長的中文文件名。先如今經過仔細測試,發現文字只要超過17個字,就不能下載了。經過好一番google和反復測試,總算對這個問題有了系統的認識,分列如下:
一. 通過我原來的方式,也就是先用URLEncoder編碼,當中文文字超過17個時,IE6 無法下載文件。這是IE的bug,參見微軟的知識庫文章 KB816868 。原因可能是因為ie在處理 Response Header 的時候,對header的長度限制在150字節左右。而一個漢字編碼成UTF-8是9個字節,那么17個字便是153個字節,所以便會報錯。微軟提供了一個補丁,可以從 這里 下載。這個補丁需要先安裝ie6 sp1。因為我平時勤打補丁,我的IE6版本號是 6.0.2800.1106.xpsp2_xxxxx。所以我可能已經安裝過了補丁,從而可以下載,但仍然出現文件名被截斷的現象。微軟讓我們等待IE下一個service pack的發布。我今天也上網看到了好消息,迫于firefox的壓力,IE7可能在年中發布。另外,Firefox 不支持這樣的方式,將把編碼后的%xx%xx直接作為文件名顯示。
二. 我嘗試使用 javamail 的MimeUtility.encode()方法來編碼文件名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,并從 RFC1522 中找到對應的標準支持。不過很遺憾,IE6并不支持這一個標準。我試了一下,Firefox是支持的。
三. 按網上很多人提供的解決方案:將文件名編碼成ISO8859-1似乎是有效的解決方案,代碼如下:
response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在確保附件文件名都是簡體中文字的情況下,那么這個辦法確實是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現在的系統通常都加入了國際化的支持,普遍使用UTF-8。如果文件名中又有簡體中文字,又有繁體中文,還有日文。那么亂碼便產生了。另外,在我的電腦上Firefox(v1.0-en)下載也是亂碼。
折中考慮,我結合了一、三的方式,代碼片斷如下:
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/
if (fileName.length() > 150) {
String guessCharset = xxxx /*根據request的locale 得出可能的編碼,中文操作系統通常是gb2312*/
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
暫且不考慮 Firefox 是因為它目前似乎還沒有有力侵食到IE的企業用戶市場。影響客戶買單的常常是進度,而不是兼容度。
posted on 2009-05-08 17:30
temper 閱讀(1359)
評論(0) 編輯 收藏