<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 33, comments - 46, trackbacks - 0, articles - 2

    中文編碼相關

    Posted on 2012-01-14 16:16 在路上... 閱讀(322) 評論(0)  編輯  收藏

    碰到中文亂碼的時候,可以考慮使用一個熟悉的中心字符串入手進行調試跟蹤轉換過程的變化,這里記錄一下“中文”漢字的編碼變化過程

    UNICODE編碼:4e2d 6587
    通常在JAVA的內置處理機制中是這樣存儲的,不同的環境中返回的byte[]不一樣,例如windows環境,使用getBytes()返回的是getBytes(“GBK”),linux環境,通常如果設置LANG=zh_CN.UTF-8,這相當于getBytes(“utf-8”).

    GBK編碼:d6d0 cec4,byte[]={-42,-48,-50,-60}

    UTF8編碼:e4 b8 ad e6 96 87,byte[]={-28,-72,-83,-26,-106,-121}

    ISO8859-1編碼:如果試圖將byte[]={-42,-48,-50,-60}采用new String(byte[],”iso8859-1”)讀取,由于不能正確轉換,所以是2個問號byte[]={63,63}
    但是從存儲的角度看,gbk和iso8859-1有類似之處,GBK采用char(2),而iso8859-1采用byte[4],拆分為{-42,-48,-50,-60}

    Javascript:可以使用var str=”\u4E2D\u6587”;來表示

    HTML中,可以使用&#20013;&#25991,相當于吧16進制轉換為10進制,再加上轉義控制&#和;結尾。

    如果需要從utf byte[]和GBK byte[]之間互相轉換,在支持unicode的java平臺,可以使用下面的轉換規則

    byte[] utf8={-28,-72,-83,-26,-106,-121};
    String str=new String(utf8,”utf-8”);//轉換為正確的中文
    byte[] gbk=str.getBytes(“GBK”);

    或者:

    byte[] gbk={-42,-48,-50,-60};
    String str=new String(utf8,"GBK");//轉換為正確的中文
    byte[] utf8=str.getBytes("utf-8")

    注意上面的byte[]為java的,與.net不一樣,需要轉換


    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 99ri精品国产亚洲| 亚洲午夜精品久久久久久人妖| 亚洲一级片在线播放| 99久久精品免费视频| 亚洲A∨无码无在线观看| 无码av免费一区二区三区| 亚洲AV日韩AV永久无码免下载| a毛片免费全部在线播放**| 亚洲AV无码国产精品麻豆天美| 免费人成毛片动漫在线播放| 久久综合图区亚洲综合图区 | 亚洲熟妇丰满多毛XXXX| 亚洲乱码一区二区三区国产精品| 4hu四虎最新免费地址| 亚洲一区二区三区精品视频| 毛片免费视频在线观看| 亚洲精品无码久久| 亚洲精品线路一在线观看| 一级特黄录像免费播放肥| 无码乱人伦一区二区亚洲一| 日韩视频在线精品视频免费观看 | 免费久久精品国产片香蕉| 一级做a爰黑人又硬又粗免费看51社区国产精品视 | 国产福利电影一区二区三区,亚洲国模精品一区| 久久水蜜桃亚洲AV无码精品| 亚洲午夜福利精品无码| 一区二区三区四区免费视频 | 97久久精品亚洲中文字幕无码| 免费A级毛片无码视频| 亚洲久悠悠色悠在线播放| 免费**毛片在线播放直播| 中文字幕在线视频免费| 久久亚洲春色中文字幕久久久| 歪歪漫画在线观看官网免费阅读| 日韩色视频一区二区三区亚洲| 日批日出水久久亚洲精品tv| 亚洲高清在线视频| 精品福利一区二区三区免费视频 | 国产精品亚洲一区二区麻豆| 亚洲精品乱码久久久久久蜜桃| 国产午夜无码精品免费看动漫|