<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    jinfeng_wang

    G-G-S,D-D-U!

    BlogJava 首頁 新隨筆 聯系 聚合 管理
      400 Posts :: 0 Stories :: 296 Comments :: 0 Trackbacks
    /etc/sysconfig/i18n

    locale 是國際化與本土化過程中的一個非常重要的概念,個人認為,對于中文用戶來說,通常會涉及到的國際化或者本土化,大致包含三個方面:看中文,寫中文,與 window中文系統的兼容和通信。從實際經驗上看來,locale的設定與看中文關系不大,但是與寫中文,及window分區的掛載方式有很密切的關系。本人認為就像一個純英文的Windows能夠瀏覽中文,日文或者意大利文網頁一樣,你不需要設定locale就可以看中文。那么,為什么要設定 locale呢?什么時候會用到locale呢?

    Tags: locale 設定 原因 解釋

    一、為什么要設定locale 正如前面我所講的,設定locale與你能否瀏覽中文的網頁沒有直接的關系,即便你把locale設置成 en_US.ISO-8859-1這樣一個標準的英文locale你照樣可以瀏覽中文的網頁,只要你的系統里面有相應的字符集(這個都不一定需要)和合適的字體(如simsun),瀏覽器就可以把網頁翻譯成中文給你看。具體的過程是網絡把網頁傳送到你的機器上之后,瀏覽器會判斷相應的編碼的字符集,根據網頁采用的字符集,去字體庫里面找合適的字體,然后由文字渲染工具把相應的文字在屏幕上顯示出來。

    在下文本人會偶爾把字符集比喻成密碼本,個人覺得對于一些東西比較容易理解,假如你不習慣的話,把全文copy到任何文本編輯器,用字符集替換密碼本即可。

    那有時候網頁顯示亂碼或者都是方框是怎么回事呢?個人認為,顯示亂碼是因為設定的字符集不對(或者沒有相應的字符集),例如網頁是用UTF-8編碼的,你非要用GB2312去看,而系統根據GB2312去找字體,然后在屏幕上顯示,當然是一堆的亂碼,也就是說你用一個錯誤的密碼本去翻譯發給你的電報,當然內容那叫一個亂;至于有些時候瀏覽的網頁能顯示一部分漢字,但有很多的地方是方框,能夠顯示漢字說明瀏覽器已經正確的判斷出了網頁的編碼,并在字體庫里面找到了相應的文字,但是并不是每個字體庫都包含某個字符集全部的字體的緣故,有些時候會顯示不完全,找一個比較全的支持較多字符集的字體就可以了。

    既然我能夠瀏覽中文網頁,那為什么我還要設定locale呢?

    其實你有沒有想過這么一個問題,為什么gentoo官方論壇上中文論壇的網頁是用UTF-8編碼的(雖然大家一直強烈建議用GB2312編碼),但是新浪網就是用GB2312編碼的呢?而Xorg的官方網頁竟然是ISO-8859-15編碼的,我沒有設定這個locale怎么一樣的能瀏覽呢?這個問題就像是你有所有的密碼本,不論某個網站是用什么字符集編碼的,你都可以用你手里的密碼本把他們翻譯過來,但問題是雖然你能瀏覽中文網頁,但是在整個操作系統里面流動的還是英文字符。所以,就像你能聽懂英語,也能聽懂中文。 最根本的問題是:你不可以寫中文。

    當你決定要寫什么東西的時候,首先要決定的一件事情是用那種語言,對于計算機來說就是你要是用哪一種字符集,你就必須告訴你的linux系統,你想用那一本密碼本去寫你想要寫的東西。知道為什么需要用GB2312字符集去瀏覽新浪了吧,因為新浪的網頁是用GB2312寫的。

    為了讓你的Linux能夠輸入中文,就需要把系統的locale設定成中文的(嚴格說來是locale中的語言類別LC_CTYPE ),例如 zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白這些古里古怪的表達方式。這個外星表達式規定了什么東西呢?這個問題稍后詳述,現在只需要知道,這是locale的表達方式就可以了。

    locale這個單詞中文翻譯成地區或者地域,其實這個單詞包含的意義要寬泛很多。Locale是根據計算機用戶所使用的語言,所在國家或者地區,以及當地的文化傳統所定義的一個軟件運行時的語言環境。

    [oracle@game ~]$ locale
    LANG=en_US.UTF-8
    LC_CTYPE="en_US.UTF-8"
    LC_NUMERIC="en_US.UTF-8"
    LC_TIME="en_US.UTF-8"
    LC_COLLATE="en_US.UTF-8"
    LC_MONETARY="en_US.UTF-8"
    LC_MESSAGES="en_US.UTF-8"
    LC_PAPER="en_US.UTF-8"
    LC_NAME="en_US.UTF-8"
    LC_ADDRESS="en_US.UTF-8"
    LC_TELEPHONE="en_US.UTF-8"
    LC_MEASUREMENT="en_US.UTF-8"
    LC_IDENTIFICATION="en_US.UTF-8"
    LC_ALL=en_US.UTF-8
    [oracle@game ~]$

    locale把按照所涉及到的文化傳統的各個方面分成12個大類,這12個大類分別是:

    1、語言符號及其分類(LC_CTYPE)
    2、數字(LC_NUMERIC)
    3、比較和排序習慣(LC_COLLATE)
    4、時間顯示格式(LC_TIME)
    5、貨幣單位(LC_MONETARY)
    6、信息主要是提示信息,錯誤信息,狀態信息,標題,標簽,按鈕和菜單等(LC_MESSAGES)
    7、姓名書寫方式(LC_NAME)
    8、地址書寫方式(LC_ADDRESS)
    9、電話號碼書寫方式(LC_TELEPHONE)
    10、度量衡表達方式 (LC_MEASUREMENT)
    11、默認紙張尺寸大小(LC_PAPER)
    12、對locale自身包含信息的概述(LC_IDENTIFICATION)。


    所以說,locale就是某一個地域內的人們的語言習慣和文化傳統和生活習慣。一個地區的locale就是根據這幾大類的習慣定義的,這些locale定義文件放在/usr/share/i18n/locales目錄下面,例如en_US, zh_CN and de_DE@euro都是locale的定義文件,這些文件都是用文本格式書寫的,你可以用寫字板打開,看看里邊的內容,當然出了有限的注釋以外,大部分東西可能你都看不懂,因為是用的Unicode的字符索引方式。

    [oracle@game ~]$ cd /usr/share/i18n/locales
    [oracle@game locales]$ ls
    aa_DJ        ar_YE       el_GR       es_ES       fr_CH           iso14651_t1 ne_NP       so_ET                  translit_hangul
    aa_ER        az_AZ       el_GR@euro es_ES@euro fr_FR           it_CH        nl_BE       so_KE                  translit_narrow
    aa_ER@saaho be_BY       en_AU       es_GT       fr_FR@euro      it_IT        nl_BE@euro so_SO                  translit_neutral
    aa_ET        bg_BG       en_BW       es_HN       fr_LU           it_IT@euro   nl_NL       sq_AL                  translit_small
    af_ZA        bn_BD       en_CA       es_MX       fr_LU@euro      iw_IL        nl_NL@euro sr_CS                  translit_wide
    am_ET        bn_IN       en_DK       es_NI       ga_IE           ja_JP        nn_NO       st_ZA                  tr_TR
    an_ES        br_FR       en_GB       es_PA       ga_IE@euro      ka_GE        no_NO       sv_FI                  tt_RU
    ar_AE        br_FR@euro en_HK       es_PE       gd_GB           kk_KZ        oc_FR       sv_FI@euro             uk_UA
    ar_BH        bs_BA       en_IE       es_PR       gez_ER          kl_GL        om_ET       sv_SE                  ur_PK
    ar_DZ        byn_ER      en_IE@euro es_PY       gez_ER@abegede kn_IN        om_KE       ta_IN                  uz_UZ
    ar_EG        ca_ES       en_IN       es_SV       gez_ET          ko_KR        pa_IN       te_IN                  uz_UZ@cyrillic
    ar_IN        ca_ES@euro en_NZ       es_US       gez_ET@abegede kw_GB        pl_PL       tg_TJ                  vi_VN
    ar_IQ        cs_CZ       en_PH       es_UY       gl_ES           lg_UG        POSIX       th_TH                  wa_BE
    ar_JO        cy_GB       en_SG       es_VE       gl_ES@euro      lo_LA        pt_BR       ti_ER                  wa_BE@euro
    ar_KW        da_DK       en_US       et_EE       gu_IN           lt_LT        pt_PT       ti_ET                  wal_ET
    ar_LB        de_AT       en_ZA       eu_ES       gv_GB           lv_LV        pt_PT@euro tig_ER                 xh_ZA
    ar_LY        de_AT@euro en_ZW       eu_ES@euro he_IL           mi_NZ        ro_RO       tl_PH                  yi_US
    ar_MA        de_BE       es_AR       fa_IR       hi_IN           mk_MK        ru_RU       translit_circle        zh_CN
    ar_OM        de_BE@euro es_BO       fi_FI       hr_HR           ml_IN        ru_UA       translit_cjk_compat    zh_HK
    ar_QA        de_CH       es_CL       fi_FI@euro hu_HU           mn_MN        se_NO       translit_cjk_variants zh_SG
    ar_SA        de_DE       es_CO       fo_FO       hy_AM           mr_IN        sid_ET      translit_combining     zh_TW
    ar_SD        de_DE@euro es_CR       fr_BE       i18n            ms_MY        sk_SK       translit_compat        zu_ZA
    ar_SY        de_LU       es_DO       fr_BE@euro id_ID           mt_MT        sl_SI       translit_font
    ar_TN        de_LU@euro es_EC       fr_CA       is_IS           nb_NO        so_DJ       translit_fraction
    [oracle@game locales]$

    對于de_DE@euro的一點說明,@后邊是修正項,也就是說你可以看到兩個德國的locale:/usr/share/i18n/locales /de_DE@euro和/usr/share/i18n/locales/de_DE。打開這兩個locale定義,你就會知道它們的差別在于 de_DE@euro使用的是歐洲的排序、比較和縮進習慣,而de_DE用的是德國的標準習慣。

    上面我們說到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用戶都知道是系統采用的字符集。


    zh_CN.GB2312到底是在說什么? Locale是軟件在運行時的語言環境, 它包括語言(Language), 地域 (Territory) 和字符集(Codeset)。一個locale的書寫格式為: 語言[_地域[.字符集]]。所以說呢,locale總是和一定的字符集相聯系的。下面舉幾個例子:

    1、我說中文,身處中華人民共和國,使用國標2312字符集來表達字符。zh_CN.GB2312=中文_中華人民共和國+國標2312字符集。

    2、我說中文,身處中華人民共和國,使用國標18030字符集來表達字符。zh_CN.GB18030=中文_中華人民共和國+國標18030字符集。

    3、我說中文,身處中華人民共和國臺灣省,使用國標Big5字符集來表達字符。zh_TW.BIG5=中文_臺灣.大五碼字符集

    4、我說英文,身處大不列顛,使用ISO-8859-1字符集來表達字符。 en_GB.ISO-8859-1=英文_大不列顛.ISO-8859-1字符集

    5、我說德語,身處德國,使用UTF-8字符集,習慣了歐洲風格。
    de_DE.UTF-8@euro=德語_德國.UTF-8字符集@按照歐洲習慣加以修正,注意不是de_DE@euro.UTF-8,所以完全的locale表達方式是 [語言[_地域][.字符集] [@修正值]。

    其中,與中文輸入關系最密切的就是LC_CTYPE,LC_CTYPE規定了系統內有效的字符以及這些字符的分類,諸如什么是大寫字母,小寫字母,大小寫轉換,標點符號、可打印字符和其他的字符屬性等方面。而locale定義zh_CN中最最重要的一項就是定義了漢字(Class“hanzi”)這一個大類,當然也是用Unicode描述的,這就讓中文字符在Linux系統中成為合法的有效字符,而且不論它們是用什么字符集編碼的。

    怎樣設定locale呢?

    設定locale就是設定12大類的locale分類屬性,即12個LC_*。除了這12個變量可以設定以外,為了簡便起見,還有兩個變量:LC_ALL和LANG。它們之間有一個優先級的關系:LC_ALL > LC_* >LANG可以這么說,LC_ALL是最上級設定或者強制設定,而LANG是默認設定值。

    1、如果你設定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG設定成什么值,它們都會被強制服從LC_ALL的設定,成為 zh_CN.UTF-8。

    2、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,并且沒有設定LC_ALL的話,那么系統的locale設定以LC_*=en_US.UTF-8。

    3、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未設定的話,系統會將LC_*設定成默認值,也就是LANG的值zh_CN.UTF-8。

    4、假如你設定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未設定的話,那么系統的locale設定將是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均會采用默認值,也就是 LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。

    所以,locale是這樣設定的:

    1、如果你需要一個純中文的系統的話,設定LC_ALL= zh_CN.XXXX,或者LANG=zh_CN.XXXX都可以,當然你可以兩個都設定,但正如上面所講,LC_ALL的值將覆蓋所有其他的locale設定,不要作無用功。

    2、如果你只想要一個可以輸入中文的環境,而保持菜單、標題,系統信息等等為英文界面,那么只需要設定 LC_CTYPE=zh_CN.XXXX,LANG=en_US.XXXX就可以了。這樣LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。

    3、假如你高興的話,可以把12個LC_*一一設定成你需要的值,打造一個古靈精怪的系統: LC_CTYPE=zh_CN.GBK/GBK(使用中文編碼內碼GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列顛的數字系統) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德國的度量衡使用ISO-8859-15字符集) 羅馬的地址書寫方式,美國的紙張設定……。估計沒人這么干吧。

    4、假如你什么也不做的話,也就是LC_ALL,LANG和LC_*均不指定特定值的話,系統將采用POSIX作為lcoale,也就是C locale。


    另外LANG和LANGUAGE有什么區別呢?

    LANG - Specifies the default locale for all unset locale variables
    LANGUAGE - Most programs use this for the language of its interface
    LANGUAGE是設置應用程序的界面語言。而LANG是優先級很低的一個變量,它指定所有與locale有關的變量的默認值,

    posted on 2009-05-18 22:48 jinfeng_wang 閱讀(1462) 評論(0)  編輯  收藏 所屬分類: ZZLinux
    主站蜘蛛池模板: 一级毛片一级毛片免费毛片| 色多多免费视频观看区一区| 久久久高清日本道免费观看| 亚洲日韩国产精品乱| 免费的黄网站男人的天堂 | 美女内射毛片在线看免费人动物| 亚洲国产成人精品无码区在线观看| 国产黄色片免费看| 亚洲中文字幕无码中文字在线| 国产视频精品免费视频| 亚洲熟女一区二区三区| 国产成人AV免费观看| 亚洲av无码成人黄网站在线观看| 无码一区二区三区免费| 亚洲免费电影网站| 成人免费视频观看无遮挡| 亚洲国产精品无码观看久久| 免费在线观看黄色毛片| 久久成人18免费网站| 亚洲精品高清视频| 毛片免费视频在线观看| 羞羞漫画登录页面免费 | 亚洲卡一卡2卡三卡4卡无卡三 | 大学生高清一级毛片免费| 国产成人高清亚洲一区久久| 亚洲人AV永久一区二区三区久久| 黄页免费在线观看 | 成人浮力影院免费看| 久久亚洲精品国产精品婷婷| 亚洲国产成人久久综合一区77| a级片免费在线观看| 亚洲人成毛片线播放| 四虎国产精品免费久久影院| 日本道免费精品一区二区| 亚洲av无码久久忘忧草| 亚洲无码精品浪潮| 91香蕉成人免费网站| 污污污视频在线免费观看| 久久久亚洲AV波多野结衣| 又粗又大又硬又爽的免费视频| 免费国产黄网站在线观看 |