pageEncoding是.jsp文件本身編碼,contentType里面的charset是指服務(wù)器吐出的內(nèi)容的編碼,也就是客戶瀏覽器所得到的內(nèi)容的編碼。
.jsp文件不像.java,.java在被編譯器讀入的時(shí)候默認(rèn)采用的是操作系統(tǒng)所設(shè)定的locale所對應(yīng)的編碼,比如中國大陸就是GBK,臺灣就是BIG5或者M(jìn)S950。而一般我們不管是在記事本還是在ue中寫代碼,如果沒有經(jīng)過特別轉(zhuǎn)碼的話,寫出來的都是本地編碼格式的內(nèi)容。所以編譯器采用的方法剛好可以讓虛擬機(jī)得到正確的資料。
但是jsp文件不是這樣,它沒有這個(gè)默認(rèn)轉(zhuǎn)碼過程,但是指定了pageEncoding就可以實(shí)現(xiàn)正確轉(zhuǎn)碼了。
舉個(gè)例子:
12
 <%@ page contentType="text/html;charset=utf-8" %>
你好嗎?




大都會打印出亂碼,因?yàn)槲逸斎氲?quot;你好嗎"是gbk的,但是服務(wù)器是否正確抓到"你好嗎"不得而知。
但是如果更改為
12
 <%@ page contentType="text/html;charset=utf-8" pageEncoding="GBK"%>
你好嗎?




這樣就服務(wù)器一定會是正確抓到"你好嗎"了。
------------------------------------------------------------------------
關(guān)於 contentType 和 pageEncoding 的差異 和 中文JSP頁的設(shè)定技巧:

contentType -- 指定的是JSP頁最終 Browser(客戶端)所見到的網(wǎng)頁內(nèi)容的編碼.
就是 Mozilla的 Character encoding, 或者是 IE6的 encoding. 例如 JSPtw Forum
用的contentType就是 Big5.

pageEncoding -- 指定JSP編寫時(shí)所用的編碼
如果你的是 WIN98, 或 ME 的NOTEPAD記事本編寫JSP, 就一定是常用的是Big5 或 gb2312, 如果是用 WIN2k
winXP的NOTEPAD時(shí), SAVE時(shí)就可以選擇不同的編,碼, 包括 ANSI(BIG5/GB2312)或 UTF-8 或
UNIONCODE(估是 UCS 16).

因?yàn)?JSP要經(jīng)過 兩次的"編碼", 第一階段會用 pageEncoding, 第二階段會用 utf-8 至utf-8,
第三階段就是由TOMCAT出來的網(wǎng)頁, 用的是contentType.

階段一是 JSPC的 JSP至JAVA(.java)原碼的"翻譯", 它會跟據(jù) pageEncoding 的設(shè)定讀取JSP. 結(jié)果是
由指定的 pageEncoding(utf-8,Big5,gb2312)的JSP 翻譯成統(tǒng)一的utf-8 JAVA原碼(.java).
如果pageEncoding設(shè)定錯(cuò)了, 或沒設(shè)定(預(yù)設(shè) ISO8859-1), 出來的 在這個(gè)階段 就已是中文亂碼.

階段二是由 JAVAC的JAVA原碼至JAVA BYTECODE的編譯.
不論JSP的編寫時(shí)是用(utf-8,Big5,gb2312),經(jīng)過階段一的結(jié)果全都是utf-8的ENCODING的JAVA原碼.
JAVAC用 utf-8的ENCODING讀取AVA原碼, 編譯成字串是 utf-8 ENCODING的二進(jìn)制碼(.class). 這是
JAVA VIRTUAL MACNHINE 對常數(shù)字串在 二進(jìn)制碼(JAVA BYTECODE)內(nèi)表逹的規(guī)範(fàn).

階段三是TOMCAT(或其的application container)載入和執(zhí)行 階段二得來的JAVA二進(jìn)制碼, 輸出的結(jié)果(
也就是BROWSER(客戶端)) 見到的. 這時(shí)一早隱藏在階段一和二的參數(shù)contentType, 就發(fā)揮了功效. (見 階段一的 1
 response.setContentType("text/html; charset=utf-8");


).
出來的可以是 utf-8, Big5, gb2312, 看的就是JSP 1
 <%@ page session="false" pageEncoding="big5" contentType="text/html;
charset=utf-8" %>


? contentType的設(shè)定.

**還有, pageEncoding 和contentType的預(yù)設(shè)都是 ISO8859-1. 而隨便設(shè)定了其中一個(gè),
另一個(gè)就跟著一樣了(TOMCAT4.1.27是如此). 但這不是絕對, 看的各自JSPC的處理方式.
而pageEncoding不等於contentType, 更有利亞洲區(qū)的文字 CJKV系JSP網(wǎng)頁的開發(fā)和展示,
(例pageEncoding=Big5 不等於 contentType=utf-8).