<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    happyfish

    BlogJava 首頁 新隨筆 聯(lián)系 聚合 管理
      38 Posts :: 1 Stories :: 62 Comments :: 0 Trackbacks

    PDF檔案格式中文嵌入現(xiàn)況與問題探討

    作者 clhhome
    發(fā)帖于: 2004-05-05 23:53    


     

    摘要

    在目前的狀況來說,英文PDF檔案格式在網(wǎng)路上、與文件交換的應(yīng)用上已經(jīng)可以說非常成熟了,但是中文方面的應(yīng)用還比其他亞洲國家存在著更多的問題,以致於其應(yīng)用的范圍無法普及。本文的主旨在於探討PDF檔案格式的組成、制作以及制作後的檔案特性,是以一種測試及探討的方式來制作的。
     


     


    壹、前言


     

    由Adobe公司所開發(fā)的PDF檔案格式,打著"跨文字、跨語言、跨平臺、跨媒體、跨軟體、跨世紀的電子文件交換格式",以及"這就是未來"的口號出現(xiàn)在我們眼前,這樣的一種文件,它到底有何特別之處,有什麼能耐呢?
     


     


    貳、何謂PDF檔案


     

    所謂「PDF可攜式文件格式」是一種開放式電子文件格式(符合美國Adobe公司Acrobat 之PDF標準),不論使用何種電腦平臺或應(yīng)用軟體編輯的文件,幾乎都可轉(zhuǎn)換成「PDF」格式互通使用。除了在螢?zāi)簧蠟g覽與印刷效果(文字、圖型、影像)完全相同的式樣外,更提供多種注記工具讓使用者更有效率地閱讀文件。


     

    通常我們會把Acrobat及PDF看作是同一件事,PDF是「Portable Document Format」的縮寫,它主要目的就是要在各種不同的電腦平臺上創(chuàng)造出一個共通的文件格式。換句話說,就是希望不管在那一種電腦上制作的文件,只要能轉(zhuǎn)成PDF格式,拿到另一種電腦上就能毫無困難地打開閱讀,更能維持制作當(dāng)時的格式與版面,看起來跟原來的格式一模一樣。


     

    這個問題是在不同電腦平臺之間長期以來所存在的,常常在PC上制作的文件拿到MAC上,如果沒有對等的軟體或版本,即使有同樣的軟體,版本不同或中、英文版不同可能都沒辦法互相打開對方的檔案,因而造成相當(dāng)大的不便。如PDF格式的出現(xiàn),就能使一個文件在不同平臺上暢行無阻,而且看到的樣子都一樣,在也不用再花力氣把檔案格式轉(zhuǎn)來轉(zhuǎn)去。


     


     
    叁、PDF檔案格式介紹


     

    Portable Document Format可攜帶文件格式是將難以處理的PostScript碼精化成一個頁面與物件的資料庫。它包含字型、影像及經(jīng)壓縮的向量物件,它是高度精簡的文件格式。正如其名-可攜帶文件格式-它為統(tǒng)一可預(yù)測的高品質(zhì)輸出及可轉(zhuǎn)用於多媒體用途作最佳化處理。PDF具有設(shè)備及媒介獨立的特性,它支援CMYK、特殊色及合并的色域定義。PDF是一個支援補漏白、拼大版及可轉(zhuǎn)換之頁面取向的檔案,一般人可以利用免費的Acrobat Reader軟體在麥金塔電腦、視窗環(huán)境、Unix及網(wǎng)際網(wǎng)路瀏覽器瀏覽。


     

    制作PDF的程序有許多種,可以制作出許多不同性質(zhì)及不同用途的PDF檔。例如其中一種方法叫做"蒸餾",利用Adobe Acrobat Distiller軟體,可以將PostScript檔案轉(zhuǎn)換成PDF檔案;另外也可以利用一種可選擇周邊設(shè)備的工具叫Adobe PDF Writer,利用它可自動將文件儲在成PostScript檔案,再自動轉(zhuǎn)換成PDF檔案,或者利用程序巨集或其他自動功能也可以將單獨或多個PostScript檔案轉(zhuǎn)換成PDF檔案。


     

    在以往的印前工作流程里客戶若需作最後一刻修改,則需回原編輯應(yīng)用程式修改,再重新列印一次,而在PDF工作流程中,只需使用Acrobat 直接修改PDF檔,無需再重回原編輯應(yīng)用程式修改列印。


     

    一、PDF檔案組成

    1.第一層包含文件的文字與圖像。
    2.第二層包含增效部份,例如書簽,超文字連結(jié)、導(dǎo)覽等。
    3.第叁層包含檔案的基本資訊,例如字形資訊和交換參考表。


     

    二、PDF檔案格式的特點

    PDF為PostScript純化過後的檔案,它已經(jīng)去除了PostScript在解譯時所可能發(fā)生的不確定性,所以成功的轉(zhuǎn)換成PDF檔後,也就確保在後續(xù)的工作流程中能順利的進行。您可以將任何應(yīng)用軟體產(chǎn)生的頁面轉(zhuǎn)換成PDF檔案,完整的將原文件之文字、圖形、影像、聲音及鏈結(jié)嵌入PDF檔案之中,讓你可以在最後一刻做編輯修改而無須重回應(yīng)用程式修改列印。


     

    在轉(zhuǎn)換時可以選擇將文字包入PDF文件之中,即使一個中文PDF檔案亦可在無安裝中文字型的純英文系統(tǒng)中正確的開啟列印,真正的達到檔案交換網(wǎng)路無國界。PDF亦可轉(zhuǎn)換成內(nèi)含字型的EPS檔案,而轉(zhuǎn)換成的EPS檔案可以再組版或其他軟體匯入再使用。


     

    (一)高壓縮


     

    PDF檔案使用多種方法來達到縮減原PostScript文件的目的,在圖片壓縮的部分亦可支援述種格式壓縮,一般檔案通??梢詨嚎s至原來的數(shù)十到數(shù)百分之一。尤其當(dāng)使用者要在網(wǎng)路上發(fā)行電子文件時,為了速度的考慮,高壓縮比就顯得特別重要。


     

    1.JPEG: Joint Photographic Expert Group專業(yè)攝影聯(lián)合組織,所推廣的是一種減損性的靜態(tài)影像壓縮演算,為一種破壞性的壓縮方法來壓縮影像品質(zhì),其應(yīng)用范圍對於彩色的連續(xù)調(diào)圖片較為適合。


     

    2.Zip 是用Jean-loup Gailly Mark Adler的Zlib套裝軟體的延伸開發(fā)而成,壓縮方式是適臺有花紋、底紋或大片重復(fù)影像圖檔。Acrobat 1.0分別提供了4bit及8bit的不同壓縮比的演算,具取樣方法是以重復(fù)的資料為主。


     

    3.CCITT Group1.CCITT Group4 是國際電話電信組織(International Coordinating Committee for Telephony & Telegraphy)所訂定的壓縮標準,用來壓縮黑白影像繪圖軟體所繪制的圖檔,或單色掃描圖檔以及線條稿。Acrobat 1.0提供這兩種壓縮方式適合單色調(diào)線條稿,如傳真品質(zhì)的檔案。


     

    4.Run length 是針對單色線條稿的壓縮,尤具有大區(qū)域的單色色塊圖檔。


     

    5.Compress text & Line Art 文字及線條都可以加以壓縮。 <注一>


     

    (二)設(shè)備獨立

    一般 PostScript檔案中包含了多種可能的合法程式碼,在某些條件下 可能無法運行。例如那些依賴某些特殊字體結(jié)構(gòu)、或輸出設(shè)備的程式碼。相反的,PDF格式不含任何程式結(jié)構(gòu),因而使得它更加安全,也更適合 以電子資料形式儲存或傳輸。PDF是為整合多種輸出選項的網(wǎng)路所設(shè)計的,它是標準化及設(shè)備獨立最佳化輸出格式。 對中文PDF文檔之要求,不采用中文系統(tǒng)時,仍可獨立顯示中文;采用中文系統(tǒng)時,則可搜尋中文詞匯。


     

    (三)各頁獨立


     

    PostScript文件的各頁間是相互關(guān)聯(lián)的。這意味著你在跳到某頁之前必 須把它前面所有的頁都處理過。而PDF格式并沒有這個限制。你可以直接 閱讀PDF檔案的任何一頁,無須考慮其他頁。


     

    (四)注記


     

    PDF檔案可以包含各種各樣的注記--例如書簽,縮影,鏈接,備注,文串,標識和媒體盒。你可以用這些“注記”以提高檔案的質(zhì)量及可讀性。這些“注記”更可以有效的協(xié)助檔案管理工作--例如制作、發(fā)送、 簽注、修正、完稿、以及出版發(fā)行。


     

    (五)檔案保護

    PDF檔案可容許設(shè)定密碼和其他多種保護方式,以防止非法使用。例如 必須使用密碼才允許閱讀、允許或不允許列印、復(fù)制、簽注、或修改。



     

     
    肆、中文PDF檔案制作流程


     


    一、網(wǎng)頁格式轉(zhuǎn)存PDF檔案格式:

    PDF檔案在英文字型的產(chǎn)生方面,已可輕而易舉的制作,但在中文部分入前尚無法輕易地將網(wǎng)頁直接轉(zhuǎn)為PDF檔,而必須間接的*一些轉(zhuǎn)換才能將網(wǎng)頁轉(zhuǎn)為PDF檔。在目前的情況來說呢,在Acrobat1.0中以開啟網(wǎng)頁的功能只能用在英文網(wǎng)頁上,只需使用Web Capture輸入URL即可將英文網(wǎng)頁轉(zhuǎn)成PDF檔,且可保留其超連結(jié)部分的格式。但在中文網(wǎng)頁部分,中文字體則會變成亂碼,所以必須藉助Acrobat writer以及Distiller來列印PDF檔案,雖然無法保留其超連結(jié)的格式,但可設(shè)定列印超連結(jié)表。


     

    二、排版軟體轉(zhuǎn)存PDF檔案格式:

    目前常見的排版軟體對於PDF檔案格式直接的支援程度并不高,大部分的排版軟體無法直接轉(zhuǎn)存PDF檔,而必須*列印的方式來產(chǎn)生。對於支援直接轉(zhuǎn)存PDF檔案的軟體來說,Microsoft Office系列算是最完整的了,基本上只需要將Acrobat 1.0在Office之後安裝,即可在工具列產(chǎn)生一個Icon,使用者只需直接點選即可啟動一名為PDF Maker的程式,輕易的將文件轉(zhuǎn)為PDF檔。其他如Page Maker、Quark Xpress或Illustrator則必須加裝外掛程式才可以直接轉(zhuǎn)存PDF檔?;旧细鞣N軟體所產(chǎn)生含中文字體的PDF檔案,大致上可分為以"Acrobat Writer″、"Acrobat Distiller″以及"曲線″叁種產(chǎn)生方式,其中檔案容量最大的是轉(zhuǎn)為曲線的方式,其次為Distiller產(chǎn)生,最小的是以Acrobat Writer產(chǎn)生。當(dāng)以相同的格式產(chǎn)生,使用的軟體不同時,其檔案大小會因為內(nèi)含資訊的不同而有些少許的出入,但其檔案的特性卻是相同的。
    其大致上的制作流程如下: *********


     


    三、PDF檔案格式在於輸出時的作業(yè)流程:


     

    PDF檔案在專業(yè)輸出時需搭配PostScript 3之RIP方能發(fā)揮最大生產(chǎn)效能,因為PostScript 3直接支援PDF檔案格式,當(dāng)檔案列印至PostScript 3 RIP時,RIP只需進行處理過網(wǎng),所以處理速度相對提升,且列印品質(zhì)較佳(如漸層)。而若您原有的RIP只支援PostScript Level 2,則在列印PDF檔案時會需要多一個轉(zhuǎn)換成PostScript Level 2的流程。
    前端在Mac平臺上的排版軟體使用CID ATM字型顯示及編輯,產(chǎn)生PDF檔案;後端再使用Postscript字型或相容輸出機輸出。
     

    伍、亞洲字型嵌入現(xiàn)況


    一、字型編碼說明:

    亞洲字型要嵌入PDF檔案,比英文字型的嵌入需要更多的軟體,以及更復(fù)雜的技術(shù)。在此之前我們必須說明亞洲字型以及英文型的差異點,以及其在不同平臺上的差異點。在亞太地區(qū),雖然都有使用漢字,但每個國家或地區(qū)所使用的內(nèi)碼都不相同,茲就各地區(qū)的編碼介紹如下

    (一)臺灣地區(qū)
    1.Big 5:俗稱大五碼
    2.Big 5 plus:Big 5擴編碼
    3.CNS11643:中文標準交換碼

    (二)中國大陸
    1.GB2312-80:通稱國標碼
    2.GBK :漢字內(nèi)碼擴展規(guī)范

    (三)日本
    1.Shift JIS
    2.EUC-JIS

    (四)韓國
    1.KSC 5601

    (五)其他


    二、編碼原則:

    1.文字之選擇及字體悉依"國字標準字體表"為基準

    2.以2個位元組(byte)為中文碼編碼單位,并以16進位制之文數(shù)字表示之

    3.符合CNS 5205及CNS7654之通信定則

    4.依字之使用頻率而編排於各不同的字面

    5.每字面按先筆劃後部首的排列順序來編訂字碼


    三、CID 字型與TrueType字型,PostScript字型的關(guān)系:

    CID是取自於Character ID的縮寫,此字元辨識碼的功用在於幫助檢索及取用字元,大量改進了其使用效能,此種方法最適合用於龐大的字體集如東方雙位元文字-中文、日文、韓文等。Acrobat并非一定需要使用CID字型,亦可以使用TrueType字型,但在使用TrueType字型時若在印表機驅(qū)動程式字型選項中若選擇將字型傳送為Type 1時,則嵌入於PDF中的中文字無法再做增字的動作,而選擇將字型傳送為Type 42時,則嵌入於PDF中的中文字可修改增減(修改時系統(tǒng)中需有相同的字型)。中文PostScript字型目前尚無法適用於PDF檔案格式。


    內(nèi)嵌字型的最大優(yōu)點便在解決文件產(chǎn)生者與輸出者之間字型不同或?qū)?yīng)錯誤的問題,現(xiàn)在PS流程是用字碼對應(yīng),且必須是同一家字型公司的同一系列版本才可對應(yīng),字型內(nèi)嵌可將此問題一勞永逸的解決。


    四、Acrobat Reader 能顯示包含 CJK 文字的 PDF 檔案的方式:

    要顯示 CJK 文字,有兩種方式。一是在建立 PDF 檔案時,作者可以嵌入所有文件中使用到的字體,包含 CJK 字體,只要字體可以被嵌入就行。任何語言版本的 Acrobat Reader 都可以用嵌入的 CJK 字體來顯示 PDF 檔案。但是因為嵌入字體的 PDF 檔案可能會占太多空間,所以作者可能在建立檔案時選擇不嵌入文件中使用的所有字體,這是第二種方式;如果在這種情況下,Acrobat 或 Acrobat Reader 的使用者若要查看該 PDF 檔案,就必須使用正確的亞洲文字字體集。


    五、目前亞洲字體集中所包含的字體:

    目前有四個亞洲字體集 (繁體中文、簡體中文、日文與韓文)中,每個都包括有 serif 與 sans-serif 字體。 而 PDF 檔案中嵌入的亞洲字體的類型,在Windows 平臺上可嵌入 TrueType 字體,而在 Macintosh 與 Windows 平臺上可以嵌入 CID 格式的 Adobe PostScript 字體。較舊的 OCF 格式的 PostScript 字體不能嵌入,此外,文件中的字體必須容許嵌入。 <注叁>


    嵌入字體使PDF檔案大小改變的因素取決於文件所包含的字體數(shù)量及字元多少。大體而言,一般文件中每嵌入一個 C、J 或 K 字體,PDF 檔案的大小就會增加 2 MB 到 3 MB 。

    Macintosh 版 Acrobat 1.0 中的「MakeCID 」可將 TrueType 字體與較舊的 OCF 格式的 PostScript 字體轉(zhuǎn)換成「Width-Only」(僅具寬度資訊) 的 CID 字體。這些 CID 字體僅包含 TrueType 或 OCF 字體中使用的羅馬字元的寬度資訊,Distiller 在建立參考原始 TrueType 或 OCF 字體的 PDF 檔案時,需要用到這種字形。

    如需更多資訊,請參閱「MakeCID」公用程式資料夾中的文件。如需在羅馬語言的作業(yè)系統(tǒng)中建立包含 CJK 文字的 PDF 檔案,僅具寬度資訊的 CID 字體就可派上用場。 對於在羅馬語言的系統(tǒng)上建立包含 CJK 文字的 PDF來說,Acrobat 中的 PDF Writer是不能在羅馬語言的作業(yè)系統(tǒng)上建立包含 CJK 文字的 PDF 檔案的。然而,如果 Distiller 可以使用它所要制作的 PostScript 檔案中所參考的字體,那麼 Distiller 就能建立含有 CJK 文字的 PDF 檔案。如果 PostScript 檔案含有嵌入的 TrueType 字體,您就可以在任何平臺上制作此 PostScript 檔。

    此外,針對目前 Adobe Type Library 中的所有 CJK 字體,以及 Macintosh 或 Windows 系統(tǒng)中常見的 TrueType 字體,Distiller 都附有「Width-Only」的 CID 字體。有了這些字體資訊,Distiller 將可以在任何平臺上均可成功制作 PostScript 檔案。此外,如果制作的 PostScript 檔案中有其他的字體需要轉(zhuǎn)換,還可以用「MakeCID」公用程式建立僅具寬度資訊的 CID 字體。


    陸、中文繁體字嵌入現(xiàn)況以及其所面臨的問題

    目前來說,支援中文PDF檔案字型內(nèi)嵌的字集在Mac上只有文鼎的CID ATM字型;在PC上有文鼎的CID PostScript字型,以目前面臨的問題來說,第一就是檔案大小,第二就是目前在網(wǎng)路上使用的USER并未普遍在個人PC上安裝相關(guān)的瀏覽軟體。特別是亞洲字型,除了瀏覽軟體外,還必須加裝亞洲文字字集方可開啟嵌入亞洲字型的PDF檔案。此外在印刷業(yè)上尚未能使用PDF檔輸出的做法。

    柒、未來解決方案

    PDF檔案是一種非常具有發(fā)展?jié)摿Φ臋n案格式,舉凡各種格式的圖文檔案,皆可轉(zhuǎn)成PDF檔,未來無論是Microsoft系列的軟體、Corel系列、Adobe系列,都將支援PDF檔案格式的產(chǎn)生、修改、編輯以及輸出。但就目前來說,除了Adobe Acrobat系列有完整的功能以外,其他軟體的功能都還尚未健全,而且其他相關(guān)應(yīng)用軟體的種類太過繁雜,有待相關(guān)的軟體開發(fā)公司開發(fā)出更具整合性的應(yīng)用軟體。 而檔案大小的問題,只有兩個方法,治標的方法為將PDF以更高的比例壓縮,以利傳輸;而治本的方法還是必須一方面開發(fā)更寬頻的網(wǎng)路;一方面使之更普及,以利大量的資料在網(wǎng)路上傳輸。


    捌、結(jié)論

    PDF檔案格式并非Acrobat特有的檔案格式,例如華康的DynaDoc檔案格式亦為可攜式文件的一種,其大致上的特性與Acrobat的PDF檔案格式相近,只是功能上有些許的出入。但基本上的目的、用途、產(chǎn)生方式以及瀏覽方式是非常相近的。

    PDF檔案尚有相當(dāng)大的研發(fā)以及應(yīng)用空間,例如在電子報方面,就是一個非常好的PDF檔案應(yīng)用實例,因為一般的電子報大多只有大量的文字,缺少圖片以及活潑的版面,使得閱讀者在瀏覽電子資訊時,會覺得面對滿版僵硬的文字,而降低閱讀的意愿;如果能將電子報編排成一般報紙的版面,以PDF檔的格式表現(xiàn)在讀者面前,如此有了活潑的版面以及圖片,一定會增加使用者閱讀的意愿;另外,PDF檔第二層的超連結(jié)功能亦可讓使用者從頭條標題上直接連結(jié),將頁面導(dǎo)引到報紙的內(nèi)文中,而省去了逐頁瀏覽的時間。當(dāng)然了,這部分的構(gòu)想還得等使用者習(xí)慣於以Acrobat Reader閱讀檔案,以及各種問題解決後,才能進入實驗及應(yīng)用階段,這將是另一個網(wǎng)路出版的新出路。

    玖、附注

    【注一】Acrobat4.0電子文件新世紀P59~60

    【注二】圖片取自文鼎公司網(wǎng)站

    【注叁】針對目前可支援Distiller作嵌入的文鼎字型來說,只要為合法的原版字型,文鼎就允許使用者嵌入。

    【注四】使用Distiller將字形嵌入之文字,因失去文字特性,故無法做搜尋及復(fù)制。


     
    名詞解釋


    (一)PostScript:
    PostScript為美國Adobe(http://www.adobe.com)公司於1985年所發(fā)表的文件描述技術(shù), Adobe并利用這個技術(shù), 創(chuàng)造著名合乎PostScript技術(shù)的字型, 并從而改變正個印刷工業(yè).

    PostScript可以精確的描述平面繪制任何文字及圖形. 現(xiàn)今PostScript的技術(shù)已經(jīng)非常普遍的使用在印刷領(lǐng)域, 包括螢?zāi)伙@示(Display), 雷射印表機(Laser Printer), 輸出機(Imagesetter), 數(shù)位印刷機(Digital Printing)..等等輸出設(shè)備. 而與PostScript技術(shù)搭配最重要的是PostScript字型, 使用者可以透過PostScript技術(shù)調(diào)整抹些參數(shù), 而改變字型的大小, 陰影/立體/空心/粗細等特殊效果. 由於PostScript在印刷方面卓越表現(xiàn), 目前世界上主要的文獻幾乎多是以PostScript的形式出現(xiàn). Adobe1997年4月發(fā)表了更進步的PostScript 3 強調(diào)增進品質(zhì)及彩色能力及網(wǎng)際網(wǎng)路列印功能.

    (二)TrueType:
    TrueType字型格式為美國Apple及Microsoft所共同制定. 最先使用於Apple的Macintosh系列及Microsoft Windows 3.1, 而目前Apple的OS 8.0及Microsoft Windows 95/NT也都使用TrueType作為字型格式 基本上TrueType和PostScript一樣, 都是使用貝茲曲線(Bezier Curve)來描述的外框字. 字型可以作任意尺寸的放大縮小, 或作其他屬性的變化.不過由於Apple及Microsoft的作業(yè)系統(tǒng)都直接支援此字型格式. 所以并不需要如PostScript一樣, 外掛(Adobe)Type Manager之類的程式.

    (叁)ATM:
    ATM(Adobe Type Manager)的功用在於管理Type 1字型的使用,ATM會自動將Type 1外框字點陣化以用於螢?zāi)伙@示或印表機列印,若所欲列印的印表機為PostScript印表機,則ATM會將字型下載至印表機,由印表機做點陣化外框字。而欲列印的印表機為一般非PostScript印表機時,則ATM會自動將Type 1外框字型點陣化再傳送至印表機。

    (四)CID:
    CID是取自於Character ID的縮寫,此字元辨識碼的功用在於幫助檢索及取用字元,大量改進了其使用效能,此種方法最適合用於龐大的字體集如東方雙位元文字-中文、日文、韓文等。

    (五)Unicode編碼:
    (Unicode編碼)即為ISO 10646國際編碼標準,完全符合Microsoft Office 2000及Windows 2000之字型編碼規(guī)格,在單一作業(yè)系統(tǒng)下即可輸入多國文字,使跨國文件的制作變得很輕松

    1.Unicode :
    Big 5:為目前在臺灣普遍所使用的業(yè)界標準,Big 5碼包括第一字面5401個漢字,第二字面7652個漢字及440個符號,目前支援Big 5的軟硬體包含Windows 95/NT,Apple OS,倚天中文系統(tǒng),點陣印表機,噴墨印表機,雷射印表機,等等軟硬體設(shè)備都支持此內(nèi)碼,但由於臺灣的特殊環(huán)境,所以并非只使用Big 5碼為唯一的內(nèi)碼,其他尚包括如金資碼,財稅碼,電信碼,海關(guān)碼,IBM 5550碼,戶政碼,IBM主機碼,公會碼(TCA),王安碼,等等,都分別使用於各種應(yīng)用領(lǐng)域。

    2.Big 5 Plus:
    雖然Big 5字集為臺灣最普遍使用的字集,但由於Big 5所定義的字集只有13053個漢字,并無法滿足,專業(yè)使用者的需要,尤其是政府部門,更無法滿足現(xiàn)階段文件交換的需要,所以在"財團法人中文電腦推廣基金會"的主持下完成對Big 5碼的擴編,詳細資料可參考"財團法人中文電腦推廣基金會"網(wǎng)站(http://www/cmex,org,tw),包括緣由,碼本,…等等相關(guān)資訊。

    3..CNS11643 中文標準交換碼:
    CNS11643 中文標準交換碼,一般簡稱 CNS 碼或 CNS11643 ,因中央標準局公布及修訂之先後而有二個版本,一般稱為 CNS11643-1986 版(1986公告版)及 CNS11643-1992 版(1992年修訂版),此二個版本之差異僅在於其所編定之字數(shù)不同。75 年公告之 CNS11643定義 11.051個漢字,81 年修訂版擴編為48,027 個漢字。 75 年公告之 CNS11643 名稱為「通用漢字標準交換碼」,於 81 年擴充後修訂 CNS11643 名稱為「中文標準交換碼」。兩個電腦系統(tǒng)要交換資料時,以兩方皆認可之碼傳輸,此稱為交換碼,交換碼之設(shè)計須符合國際標準。因此一般在電腦內(nèi)部處理時使用內(nèi)碼,而在傳輸時,再轉(zhuǎn)換為標準交換碼。

    4.GB2312-80:
    GB2312-80為中國大陸最為普遍使用的內(nèi)碼,不論在電腦作業(yè)系統(tǒng)如Apple Machitosh或Microsoft中文Windows簡體版,都是以GB2312-80為內(nèi)碼,至於其他周邊裝置,如印表機,軟體,標簽印字機,及其他各種軟硬體也都是以GB2312-80為內(nèi)碼,即使中文Windows 95雖以GBK為內(nèi)碼,但仍與GB2312-80相容 GB2312-80共規(guī)范了6763個漢字及682個符號,內(nèi)容主要也都是簡體化過的漢字,與Gb2312-80相對應(yīng)的為GB12345-90,基本上GB12345-90仍保留原來繁體字的樣子,但碼序與GB2312-80相同,另外增加了100多個多對一的漢字

    5.GBK:
    漢字內(nèi)碼擴展規(guī)范,簡稱GBK,Chinese Internal Code Specification GBK工作小組於1995年10月成立,并於1995年12月完成GBK規(guī)范,基本上采用了原來GB2312-80所有的漢字及碼位,并涵蓋了原Unicode中所有的漢字20901.總共收錄了883個符號,21003個漢字及提供了1894個造字碼位

    由於GBK的編碼,在與GB2312-80的部分采用了GB-2312完全相同的碼序與字樣,所以市面上所有的合乎GB2312-80的文件,檔案及程式都可以在合乎GBK規(guī)范的系統(tǒng)上正常運行,目前Microsoft簡體版中文Windows 95就是以GBK為內(nèi)碼,又由於GBK同時也涵蓋了Unicode所有CJK漢字,所以也可以和Unicode做一一對應(yīng), Unicode(http://www,Unicode,com) :(Universal Multiple Octet Coded Character Set) 國際標準組織於1984年4月成立IOS/IEC JTC1/SC2/WG2工作組,針對各國文字,符號進行統(tǒng)一性編碼,1991年美國跨國公司成立Unicode Consortium,并於1991年10月與WG2達成協(xié)議,采用同一編碼字集,目前Unicode是采用16 bit之編碼架構(gòu),其字集內(nèi)容與ISO 10646之BMP(Basic Multilingual Plane)相同,Unicode (Unicode Consortium)并於1992年6月通過DIS(Draft International Standard),目前版本為Unicode v1.0於1996年公布,內(nèi)容包含符號6811.漢字20901.韓文拼音11171.造字區(qū)6400,保留20249共65534個碼位。


     
    參考資料
    1.Publishing & Production
    2.http://www.agfahome.com.tw/ (臺灣Agfa首頁)
    3.http://www.adobe.com (Adobe公司首頁)
    4.http://www.arphic.com.tw/ (文鼎公司首頁)
    5.http://www.dynalab.com.tw/ (華康公司賞頁)
    6.Acrobat 4.0電子文件新世紀  


    posted on 2005-04-22 20:25 小魚兒 閱讀(571) 評論(0)  編輯  收藏 所屬分類: pdfencoding
    主站蜘蛛池模板: 巨胸喷奶水www永久免费| 亚洲永久在线观看| 日韩亚洲翔田千里在线| 免费精品无码AV片在线观看| 亚洲日韩中文字幕日韩在线| 亚洲Av永久无码精品黑人| 国产免费爽爽视频在线观看 | 久久久www成人免费毛片| 亚洲videos| 成人免费午夜无码视频| 亚洲综合国产成人丁香五月激情| 免费国产黄线在线观看| 亚洲中文字幕久久久一区| 暖暖免费高清日本中文| 视频一区在线免费观看| 久久久久亚洲AV综合波多野结衣 | 毛片a级三毛片免费播放| 亚洲综合中文字幕无线码| 免费黄色app网站| 农村寡妇一级毛片免费看视频| 久久久久国产成人精品亚洲午夜| 中文字幕久精品免费视频| 亚洲欧洲国产综合| 四虎影库久免费视频| a级毛片视频免费观看| 久久久无码精品亚洲日韩京东传媒| 免费观看的毛片大全| 羞羞的视频在线免费观看| 亚洲国产另类久久久精品黑人| 57pao一国产成视频永久免费| 亚洲成年网站在线观看| 亚洲精品成人网久久久久久| 国产精品免费看久久久| 亚洲欧洲专线一区| 亚洲精品成人网站在线观看| 国产成人精品免费视频大全麻豆| 国产成人va亚洲电影| 亚洲av不卡一区二区三区| 青青青国产免费一夜七次郎| 国产午夜不卡AV免费| 亚洲乱码在线观看|