Tomcat在處理GET和POST請求時產(chǎn)生的亂碼問題
本文為原創(chuàng),如需轉載,請注明作者和出處,謝謝
有個朋友寫JSP程序時,在Servlet中取請求參數(shù)時出現(xiàn)了亂碼,當然,這種亂碼問題再簡單不過了。由于在JSP中使用了GBK作用頁面的編碼,那么提交的中文信息自然也會被按著GBK進行編碼,為%xx格式的GBK編碼。
要解決這個問題可以說是方法多多。最簡單的就是使用request.setCharacterEncoding方法設置編碼格式,如下面的代碼所示:
request.setCharacterEncoding("GBK");
在設置完編碼格式之后,就可以直接通過request.getParameter方法來獲得請求參數(shù)中的中文信息了。當然,為了方便,還可以在過濾器中加入上面的語句,這樣所有的Servlet都可以直接使用 request.getParameter方法來獲得請求參數(shù)中的中文信息了。 除了這兩種方法,還可以不使用request.setCharacterEncoding("GBK"),而使用下面的語言來轉換編碼:
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
但為了更快解決這個問題,我就直接告訴這位朋友使用了setCharacterEncoding方法來設置編碼。但是說來奇怪,還是出現(xiàn)亂碼,沒有任何解決問題的跡象。 最郁悶的事就是使用了自己認為100%能解決問題的方法,而這種方法卻一點都沒起作用。
最后又讓朋友試了最后一種方法,說來奇怪,竟然好使了。當然,這也沒什么可奇怪的,本來就應該好使,但奇就奇在setCharacterEncoding方法并沒有去掉,也就是說,同時使用了下面兩條語句,竟然得到了正常的中文請求參數(shù)值:
按著常理來說,這是不可能的,既然使用了setCharacterEncoding方法設置成了GBK,再使用new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK")來轉換,得到的應該是?????,不可能是正常的中文,只有將setCharacterEncoding方法去了,以ISO-8859-1格式保存的字符串才可以用ISO-8859-1格式還原,再用GBK重新保存成Java字符串(這一步實際上就是GBK轉Unicode)。
但經(jīng)過仔細思考后,決定看下JSP代碼是如何寫的。不看不知道,一看嚇一跳,原來<form>在提交時使用的是GET,而未用POST,這當然沒什么了不起的,用什么都可以,但對編碼就有問題了。自從Tomcat5.x開始,GET和POST方法提交的信息,Tomcat采用了不同的方式來處理編碼,對于POST請求,Tomcat會仍然使用request.setCharacterEncoding方法所設置的編碼來處理,如果未設置,則使用默認的iso-8859-1編碼。而GET請求則不同,Tomcat對于GET請求并不會考慮使用request.setCharacterEncoding方法設置的編碼,而會永遠使用iso-8859-1編碼,而這位朋友使用的正好是GET請求,因此,tomcat將會使用iso-8859-1將提交的字節(jié)轉換成字符串。
解決的方法有兩個:
1. 將GET請求改成POST請求,然后就可以使用request.setCharacterEncoding方法設置編碼,并使用request.getParameter方法直接獲得中文請求參數(shù)了。
2. 不用改GET請求,在Servlet中使用如下的代碼來得到中文請求參數(shù)。
綜上所述,如果使用了GET請求,則setCharacterEncoding方法不起作用,只能使用上面的代碼來解決,而使用POST請求,盡管setCharacterEncoding方法起作用,但使用上面的代碼仍然好使(在這時不能使用setCharacterEncoding方法將編碼格式設置成非iso-8859-1格式)。因此,如果想讓Servlet可以同時處理GET和POST請求中的中文信息,除了判斷這兩種方法外,還可以使用上面的代碼來同時處理這兩種請求的中文信息。
筆者建議使用如下的代碼來獲得中文請求參數(shù):
因為上面的代碼是利用了Java的編碼能力,對于所有的Web服務器都會有效,而setCharacterEncoding方法是通過Web服務器支持的,并不是所有的Web服務器都會對該方法有很好的支持。
新浪微博:http://t.sina.com.cn/androidguy 昵稱:李寧_Lining
有個朋友寫JSP程序時,在Servlet中取請求參數(shù)時出現(xiàn)了亂碼,當然,這種亂碼問題再簡單不過了。由于在JSP中使用了GBK作用頁面的編碼,那么提交的中文信息自然也會被按著GBK進行編碼,為%xx格式的GBK編碼。
要解決這個問題可以說是方法多多。最簡單的就是使用request.setCharacterEncoding方法設置編碼格式,如下面的代碼所示:
request.setCharacterEncoding("GBK");
在設置完編碼格式之后,就可以直接通過request.getParameter方法來獲得請求參數(shù)中的中文信息了。當然,為了方便,還可以在過濾器中加入上面的語句,這樣所有的Servlet都可以直接使用 request.getParameter方法來獲得請求參數(shù)中的中文信息了。 除了這兩種方法,還可以不使用request.setCharacterEncoding("GBK"),而使用下面的語言來轉換編碼:
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
但為了更快解決這個問題,我就直接告訴這位朋友使用了setCharacterEncoding方法來設置編碼。但是說來奇怪,還是出現(xiàn)亂碼,沒有任何解決問題的跡象。 最郁悶的事就是使用了自己認為100%能解決問題的方法,而這種方法卻一點都沒起作用。
最后又讓朋友試了最后一種方法,說來奇怪,竟然好使了。當然,這也沒什么可奇怪的,本來就應該好使,但奇就奇在setCharacterEncoding方法并沒有去掉,也就是說,同時使用了下面兩條語句,竟然得到了正常的中文請求參數(shù)值:
request.setCharacterEncoding("GBK");
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
System.out.println(name); // 正常輸出中文請求參數(shù)
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
System.out.println(name); // 正常輸出中文請求參數(shù)
按著常理來說,這是不可能的,既然使用了setCharacterEncoding方法設置成了GBK,再使用new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK")來轉換,得到的應該是?????,不可能是正常的中文,只有將setCharacterEncoding方法去了,以ISO-8859-1格式保存的字符串才可以用ISO-8859-1格式還原,再用GBK重新保存成Java字符串(這一步實際上就是GBK轉Unicode)。
但經(jīng)過仔細思考后,決定看下JSP代碼是如何寫的。不看不知道,一看嚇一跳,原來<form>在提交時使用的是GET,而未用POST,這當然沒什么了不起的,用什么都可以,但對編碼就有問題了。自從Tomcat5.x開始,GET和POST方法提交的信息,Tomcat采用了不同的方式來處理編碼,對于POST請求,Tomcat會仍然使用request.setCharacterEncoding方法所設置的編碼來處理,如果未設置,則使用默認的iso-8859-1編碼。而GET請求則不同,Tomcat對于GET請求并不會考慮使用request.setCharacterEncoding方法設置的編碼,而會永遠使用iso-8859-1編碼,而這位朋友使用的正好是GET請求,因此,tomcat將會使用iso-8859-1將提交的字節(jié)轉換成字符串。
解決的方法有兩個:
1. 將GET請求改成POST請求,然后就可以使用request.setCharacterEncoding方法設置編碼,并使用request.getParameter方法直接獲得中文請求參數(shù)了。
2. 不用改GET請求,在Servlet中使用如下的代碼來得到中文請求參數(shù)。
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
綜上所述,如果使用了GET請求,則setCharacterEncoding方法不起作用,只能使用上面的代碼來解決,而使用POST請求,盡管setCharacterEncoding方法起作用,但使用上面的代碼仍然好使(在這時不能使用setCharacterEncoding方法將編碼格式設置成非iso-8859-1格式)。因此,如果想讓Servlet可以同時處理GET和POST請求中的中文信息,除了判斷這兩種方法外,還可以使用上面的代碼來同時處理這兩種請求的中文信息。
筆者建議使用如下的代碼來獲得中文請求參數(shù):
String name = new String(request.getParameter("name").getBytes("ISO-8859-1"), "GBK");
因為上面的代碼是利用了Java的編碼能力,對于所有的Web服務器都會有效,而setCharacterEncoding方法是通過Web服務器支持的,并不是所有的Web服務器都會對該方法有很好的支持。
《Android高薪之路:Android程序員面試寶典 》http://book.360buy.com/10970314.html
新浪微博:http://t.sina.com.cn/androidguy 昵稱:李寧_Lining
posted on 2008-09-05 15:48 銀河使者 閱讀(3063) 評論(8) 編輯 收藏 所屬分類: java 、web 、 原創(chuàng)