pageEncoding是.jsp文件本身編碼
,contentType里面的charset是指服務(wù)器吐出的內(nèi)容的編碼
,也就是客戶瀏覽器所得到的內(nèi)容的編碼。
.jsp文件不像.java,.java在被編譯器讀入的時(shí)候默
認(rèn)采用的是操作系統(tǒng)所設(shè)定的locale所對(duì)應(yīng)的編碼
,比如中國(guó)大陸就是GBK,臺(tái)灣就是BIG5或者M(jìn)S950
。而一般我們不管是在記事本還是在ue中寫(xiě)代碼,如果沒(méi)有經(jīng)過(guò)特
別轉(zhuǎn)碼的話,寫(xiě)出來(lái)的都是本地編碼格式的內(nèi)容。所以編譯器采用的
方法剛好可以讓虛擬機(jī)得到正確的資料。
但是jsp文件不是這樣,它沒(méi)有這個(gè)默認(rèn)轉(zhuǎn)碼過(guò)程
,但是指定了pageEncoding就可以實(shí)現(xiàn)正確轉(zhuǎn)碼了。
舉個(gè)例子:
12
<%@ page contentType="text/html;charset
=utf-8" %>
你好嗎?
大都會(huì)打印出亂碼,因?yàn)槲逸斎氲?quot;你好嗎"是gbk的
,但是服務(wù)器是否正確抓到"你好嗎"不得而知。
但是如果更改為
12
<%@ page contentType="text/html;charset
=utf-8" pageEncoding="GBK"%>
你好嗎?
這樣就服務(wù)器一定會(huì)是正確抓到"你好嗎"了。
------------------------------------------------------------------------
關(guān)於 contentType 和 pageEncoding 的差異 和 中文JSP頁(yè)的設(shè)定技巧:
contentType -- 指定的是JSP頁(yè)最終 Browser(客戶端)所見(jiàn)到的網(wǎng)頁(yè)內(nèi)容的編碼.
就是 Mozilla的 Character encoding, 或者是 IE6的 encoding. 例如 JSPtw Forum
用的contentType就是 Big5.
pageEncoding -- 指定JSP編寫(xiě)時(shí)所用的編碼
如果你的是 WIN98, 或 ME 的NOTEPAD記事本編寫(xiě)JSP, 就一定是常用的是Big5 或 gb2312, 如果是用 WIN2k
winXP的NOTEPAD時(shí), SAVE時(shí)就可以選擇不同的編,碼, 包括 ANSI(BIG5/GB2312)或 UTF-8 或
UNIONCODE(估是 UCS 16).
因?yàn)?JSP要經(jīng)過(guò) 兩次的"編碼", 第一階段會(huì)用 pageEncoding, 第二階段會(huì)用 utf-8 至utf-8,
第三階段就是由TOMCAT出來(lái)的網(wǎng)頁(yè), 用的是contentType.
階段一是 JSPC的 JSP至JAVA(.java)原碼的"翻譯", 它會(huì)跟據(jù) pageEncoding 的設(shè)定讀取JSP. 結(jié)果是
由指定的 pageEncoding(utf-8,Big5,gb2312)的JSP 翻譯成統(tǒng)一的utf-8 JAVA原碼(.java).
如果pageEncoding設(shè)定錯(cuò)了, 或沒(méi)設(shè)定(預(yù)設(shè) ISO8859-1), 出來(lái)的 在這個(gè)階段 就已是中文亂碼.
階段二是由 JAVAC的JAVA原碼至JAVA BYTECODE的編譯.
不論JSP的編寫(xiě)時(shí)是用(utf-8,Big5,gb2312),經(jīng)過(guò)階段一的結(jié)果全都是utf-8的ENCODING的JAVA原碼.
JAVAC用 utf-8的ENCODING讀取AVA原碼, 編譯成字串是 utf-8 ENCODING的二進(jìn)制碼(.class). 這是
JAVA VIRTUAL MACNHINE 對(duì)常數(shù)字串在 二進(jìn)制碼(JAVA BYTECODE)內(nèi)表逹的規(guī)範(fàn).
階段三是TOMCAT(或其的application container)載入和執(zhí)行 階段二得來(lái)的JAVA二進(jìn)制碼, 輸出的結(jié)果(
也就是BROWSER(客戶端)) 見(jiàn)到的. 這時(shí)一早隱藏在階段一和二的參數(shù)contentType, 就發(fā)揮了功效. (見(jiàn) 階段一的 1
response.setContentType("text/html; charset=utf-8");
).
出來(lái)的可以是 utf-8, Big5, gb2312, 看的就是JSP 1
<%@ page session="false" pageEncoding="big5" contentType="text/html;
charset=utf-8" %>
? contentType的設(shè)定.
**還有, pageEncoding 和contentType的預(yù)設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個(gè),
另一個(gè)就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對(duì), 看的各自JSPC的處理方式.
而pageEncoding不等於contentType, 更有利亞洲區(qū)的文字 CJKV系JSP網(wǎng)頁(yè)的開(kāi)發(fā)和展示,
(例pageEncoding=Big5 不等於 contentType=utf-8).