自從接觸Java和JSP以來(lái),就不斷與Java的中文亂碼問(wèn)題打交道,現(xiàn)在終于得到了徹底的解決,現(xiàn)將我們的解決心得與大家共享。
一、Java中文問(wèn)題的由來(lái)
Java的內(nèi)核和class文件是基于unicode的,這使Java程序具有良好的跨平臺(tái)性,但也帶來(lái)了一些中文亂碼問(wèn)題的麻煩。原因主要有兩方面,Java和JSP文件本身編譯時(shí)產(chǎn)生的亂碼問(wèn)題和Java程序于其他媒介交互產(chǎn)生的亂碼問(wèn)題。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字節(jié)流的,如果Java和JSP編譯成class文件過(guò)程中,使用的編碼方式與源文件的編碼不一致,就會(huì)出現(xiàn)亂碼。基于這種亂碼,建議在Java文件中盡量不要寫(xiě)中文(注釋部分不參與編譯,寫(xiě)中文沒(méi)關(guān)系),如果必須寫(xiě)的話,盡量手動(dòng)帶參數(shù)-ecoding GBK或-ecoding gb2312編譯;對(duì)于JSP,在文件頭加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解決這類(lèi)亂碼問(wèn)題。
本文要重點(diǎn)討論的是第二類(lèi)亂碼,即Java程序與其他存儲(chǔ)媒介交互時(shí)產(chǎn)生的亂碼。很多存儲(chǔ)媒介,如數(shù)據(jù)庫(kù),文件,流等的存儲(chǔ)方式都是基于字節(jié)流的,Java程序與這些媒介交互時(shí)就會(huì)發(fā)生字符(char)與字節(jié)(byte)之間的轉(zhuǎn)換,例如從頁(yè)面提交表單中提交的數(shù)據(jù)在Java程序里顯示亂碼等情況。
如果在以上轉(zhuǎn)換過(guò)程中使用的編碼方式與字節(jié)原有的編碼不一致,很可能就會(huì)出現(xiàn)亂碼。
二、解決方法
對(duì)于流行的Tomcat來(lái)說(shuō),有以下兩種解決方法:
1) 更改 D:\Tomcat\conf\server.xml,指定瀏覽器的編碼格式為“簡(jiǎn)體中文”:
方法是找到 server.xml 中的
<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
enableLookups="false" redirectPort="8443" acceptCount="100"
connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' />
標(biāo)記,粗體字是我添加的。
可以這樣驗(yàn)證你的更改是否成功:在更改前,在你出現(xiàn)亂碼的頁(yè)面的IE瀏覽器,點(diǎn)擊菜單“查看|編碼”,會(huì)發(fā)現(xiàn)“西歐(ISO)”處于選中狀態(tài)。而更改后,點(diǎn)擊菜單“查看|編碼”,會(huì)發(fā)現(xiàn)“簡(jiǎn)體中文(GB2312)”處于選中狀態(tài)。
b)更該 Java 程序,我的程序是這樣的:
public class ThreeParams extends HttpServlet {
public void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
response.setContentType("text/html; charset=GBK");
...
}
}
粗體字是必需要有的,它的作用是讓瀏覽器把Unicode字符轉(zhuǎn)換為GBK字符。這樣頁(yè)面的內(nèi)容和瀏覽器的顯示模式都設(shè)成了GBK,就不會(huì)亂碼了。
原創(chuàng)文章如轉(zhuǎn)載,請(qǐng)注明:轉(zhuǎn)載自月光博客 [ http://www.williamlong.info/ ]
posted on 2008-11-22 20:39
xzc 閱讀(712)
評(píng)論(0) 編輯 收藏 所屬分類(lèi):
Java