GBK的文字編碼是雙字節來表示的,即不論中、英文字符均使用雙字節來表示,只不過為區分中文,將其最高位都定成1。
至于UTF-8編碼則是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24位(三個字節)來編碼。對于英文字符較多的論壇則用UTF-8節省空間。
GBK包含全部中文字符,
UTF-8則包含全世界所有國家需要用到的字符。
GBK是在國家標準GB2312基礎上擴容后兼容GB2312的標準(好像還不是國家標準)
UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。
所以,對于英文比較多的論壇 ,使用GBK則每個字符占用2個字節,而使用UTF-8英文卻只占一個字節。
posted on 2007-11-21 17:35
xzc 閱讀(294)
評論(0) 編輯 收藏 所屬分類:
Java