<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    jinfeng_wang

    G-G-S,D-D-U!

    BlogJava 首頁 新隨筆 聯系 聚合 管理
      400 Posts :: 0 Stories :: 296 Comments :: 0 Trackbacks

    關于編碼

        所謂編碼,是以固定的順序排列字符,并以此做為記錄、存貯、傳遞、交換的統一內部特征,這個字符排列順序被稱為“編碼”。

        字庫的編碼是字庫組織的依據,也是文字處理的基礎。不同國家和地區有不同的編碼標準,和中文字庫有關的常見編碼有:
    單字節編碼GB2312-80GB12345-90GBKUnicode編碼ISO10646 / Unicode字符集GB18030-2000BIG5編碼方正748編碼,下面簡要介紹一下:

      單字節編碼

        • MS Windows:Windows Latin 1(ANSI)
        • MS-DOS:MS-DOS Latin US
        • Macintosh:Macintosh Roman

    GB2312-80

        全稱是GB2312-80《信息交換用漢字編碼字符集 基本集》,1980年發布,是中文信息處理的國家標準,在大陸及海外使用簡體中文的地區(如新加坡等)是強制使用的唯一中文編碼。P-Windows3.2和蘋果OS就是以GB2312為基本漢字編碼, Windows 95/98則以GBK為基本漢字編碼、但兼容支持GB2312。

        • 雙字節編碼
        • 范圍:A1A1~FEFE
        • A1-A9:符號區,包含682個符號
        • B0-F7:漢字區,包含6763個漢字


         GB碼共收錄6763個簡體漢字、682個符號,其中漢字部分:一級字3755,以拼音排序,二級字3008,以偏旁排序。該標準的制定和應用為規范、推動中文信息化進程起了很大作用。

    GB12345-90

       1990年制定了繁體字的編碼標準GB12345-90《信息交換用漢字編碼字符集 第一輔助集》,目的在于規范必須使用繁體字的各種場合,以及古籍整理等。該標準共收錄6866個漢字(比GB2312多103個字,其它廠商的字庫大多不包括這些字),純繁體的字大概有2200余個。

        • 雙字節編碼
        • 范圍:A1A1~FEFE
        • A1-A9:符號區,增加豎排符號
        • B0-F9:漢字區,包含6866個漢字

    Unicode編碼(Universal Multiple Octet Coded Character Set)

        國際標準組織于1984年4月成立ISO/IEC JTC1/SC2/WG2工作組,針對各國文字、符號進行統一性編碼。1991年美國跨國公司成立Unicode Consortium,并于1991年10月與WG2達成協議,采用同一編碼字集。目前Unicode是采用16位編碼體系,其字符集內容與ISO10646的BMP(Basic Multilingual Plane)相同。Unicode于1992年6月通過DIS(Draf International Standard),目前版本V2.0于1996公布,內容包含符號6811個,漢字20902個,韓文拼音11172個,造字區6400個,保留20249個,共計65534個。

    ISO10646 / Unicode字符集

    全球可以共享的編碼字符集。

        • UCS-4:組八位 平面八位 行八位 字位八位
        • UCS-2:00組中的00平面是基本多文種平面(BMP),4E00~9FFF 中日韓文字
        • Ext A(CJK):3400~4DB7,共6584字
        • Ext B(CJK):42,807個漢字,在第2平面的0100~A836


    GBK編碼(Chinese Internal Code Specification)

        GBK編碼是中國大陸制訂的、等同于UCS的新的中文編碼擴展國家標準。GBK工作小組于1995年10月,同年12月完成GBK規范。該編碼標準兼容GB2312,共收錄漢字21003個、符號883個,并提供1894個造字碼位,簡、繁體字融于一庫。
    Windows95/98簡體中文版的字庫表層編碼就采用的是GBK,通過GBK與UCS之間一一對應的碼表與底層字庫聯系。

        • 英文名:Chinese Internal Code Specification
        • 中文名:漢字內碼擴展規范1.0版
        • 雙字節編碼,GB2312-80的擴充,在碼位上和GB2312-80兼容
        • 范圍:8140~FEFE(剔除xx7F)共23940個碼位
        • 包含21003個漢字,包含了ISO/IEC 10646-1中的全部中日韓漢字


    GB18030-2000

        • 英文名:Chinese Internal Code Specification
        • 中文名:信息技術 信息交換用漢字編碼字符集
        • 基本集的擴充( 2000-03-17發布和實施)
        • 單字節、雙字節、四字節編碼
        • 向下與國家標準GB 2312信息處理交換碼所對應的事實上的內碼標準兼容。
        • 在字匯上支持GB 13000.1的全部中、日、韓(CJK)統一漢字字符和全部CJK統一漢字擴充A的字符。

    BIG5編碼

        是目前臺灣、香港地區普遍使用的一種繁體漢字的編碼標準,包括440個符號,一級漢字5401個、二級漢字7652個,共計13060個漢字。

    方正748編碼

        所謂748編碼,是指方正系統在長期應用過程中實施、制定的簡、繁體字庫編碼方式,簡體兼容GB2312且有所擴展,共7156字;繁體兼容GB12345并擴展全部BIG-5漢字,計14943字。此外,方正748編碼還含有豐富的符號庫。748編碼僅用于方正軟件和系統。 

    posted on 2006-01-18 17:54 jinfeng_wang 閱讀(1110) 評論(1)  編輯  收藏 所屬分類: ZZ

    評論

    # re: 關于漢字編碼 2006-11-05 12:20 何彬
    查找性名代碼  回復  更多評論
      

    主站蜘蛛池模板: 日日摸日日碰夜夜爽亚洲| 亚洲色图古典武侠| 羞羞漫画页面免费入口欢迎你| 久久久久久久91精品免费观看| 亚洲大片免费观看| 台湾一级毛片永久免费| 亚洲成人网在线观看| 国产1024精品视频专区免费| 国产亚洲精aa在线看| 女人被男人桶得好爽免费视频| 亚洲AV综合永久无码精品天堂 | 国产午夜不卡AV免费| 久久精品夜色噜噜亚洲A∨| 羞羞视频免费网站在线看| 国产偷国产偷亚洲清高动态图 | sss日本免费完整版在线观看| 亚洲?v无码国产在丝袜线观看| 四虎精品免费永久免费视频| 亚洲人成网站18禁止一区| jizz18免费视频| 亚洲国产精品无码专区影院| 2020因为爱你带字幕免费观看全集| 亚洲成a人片在线观看精品| 黄a大片av永久免费| 日韩一区二区三区免费播放| 亚洲色成人网站WWW永久| 污视频在线观看免费| 亚洲人成网站在线观看播放青青| 成年男女男精品免费视频网站| 久久水蜜桃亚洲AV无码精品 | 亚洲国产日韩在线成人蜜芽 | 国内成人精品亚洲日本语音| 亚洲精品456播放| 30岁的女人韩剧免费观看| 亚洲国产精品免费观看| 亚洲国产精品一区二区三区久久| 久久狠狠躁免费观看| 亚洲国产精品无码第一区二区三区| 久久久久亚洲av成人无码电影| 日韩欧毛片免费视频| fc2免费人成在线|