??? html parser 在處理 一些網頁的時候,會出現亂碼'3f3f' .
??? 問題在于 頁面的charset=gb2312 ,而 頁面中有gbk 的碼 ,比如 'fb9c'.
??? 代碼可以驗證,
? ? ??? byte[] gbchar = new byte[2];
??? ??? gbchar[0]=(byte) 0xfb;
??? ??? gbchar[1]=(byte) 0x9c;
??? ??? System.out.print(new String(gbchar,"gbk"));
??? ??? System.out.print(new String(gbchar,"gb2312"));

??? 不過,我并沒有解決這個問題。



西津渡