PDF檔案格式中文嵌入現(xiàn)況與問(wèn)題探討
作者 clhhome
發(fā)帖于: 2004-05-05 23:53
摘要
在目前的狀況來(lái)說(shuō),英文PDF檔案格式在網(wǎng)路上、與文件交換的應(yīng)用上已經(jīng)可以說(shuō)非常成熟了,但是中文方面的應(yīng)用還比其他亞洲國(guó)家存在著更多的問(wèn)題,以致於其應(yīng)用的范圍無(wú)法普及。本文的主旨在於探討PDF檔案格式的組成、制作以及制作後的檔案特性,是以一種測(cè)試及探討的方式來(lái)制作的。
壹、前言
由Adobe公司所開(kāi)發(fā)的PDF檔案格式,打著"跨文字、跨語(yǔ)言、跨平臺(tái)、跨媒體、跨軟體、跨世紀(jì)的電子文件交換格式",以及"這就是未來(lái)"的口號(hào)出現(xiàn)在我們眼前,這樣的一種文件,它到底有何特別之處,有什麼能耐呢?
貳、何謂PDF檔案
所謂「PDF可攜式文件格式」是一種開(kāi)放式電子文件格式(符合美國(guó)Adobe公司Acrobat 之PDF標(biāo)準(zhǔn)),不論使用何種電腦平臺(tái)或應(yīng)用軟體編輯的文件,幾乎都可轉(zhuǎn)換成「PDF」格式互通使用。除了在螢?zāi)簧蠟g覽與印刷效果(文字、圖型、影像)完全相同的式樣外,更提供多種注記工具讓使用者更有效率地閱讀文件。
通常我們會(huì)把Acrobat及PDF看作是同一件事,PDF是「Portable Document Format」的縮寫(xiě),它主要目的就是要在各種不同的電腦平臺(tái)上創(chuàng)造出一個(gè)共通的文件格式。換句話說(shuō),就是希望不管在那一種電腦上制作的文件,只要能轉(zhuǎn)成PDF格式,拿到另一種電腦上就能毫無(wú)困難地打開(kāi)閱讀,更能維持制作當(dāng)時(shí)的格式與版面,看起來(lái)跟原來(lái)的格式一模一樣。
這個(gè)問(wèn)題是在不同電腦平臺(tái)之間長(zhǎng)期以來(lái)所存在的,常常在PC上制作的文件拿到MAC上,如果沒(méi)有對(duì)等的軟體或版本,即使有同樣的軟體,版本不同或中、英文版不同可能都沒(méi)辦法互相打開(kāi)對(duì)方的檔案,因而造成相當(dāng)大的不便。如PDF格式的出現(xiàn),就能使一個(gè)文件在不同平臺(tái)上暢行無(wú)阻,而且看到的樣子都一樣,在也不用再花力氣把檔案格式轉(zhuǎn)來(lái)轉(zhuǎn)去。
叁、PDF檔案格式介紹
Portable Document Format可攜帶文件格式是將難以處理的PostScript碼精化成一個(gè)頁(yè)面與物件的資料庫(kù)。它包含字型、影像及經(jīng)壓縮的向量物件,它是高度精簡(jiǎn)的文件格式。正如其名-可攜帶文件格式-它為統(tǒng)一可預(yù)測(cè)的高品質(zhì)輸出及可轉(zhuǎn)用於多媒體用途作最佳化處理。PDF具有設(shè)備及媒介獨(dú)立的特性,它支援CMYK、特殊色及合并的色域定義。PDF是一個(gè)支援補(bǔ)漏白、拼大版及可轉(zhuǎn)換之頁(yè)面取向的檔案,一般人可以利用免費(fèi)的Acrobat Reader軟體在麥金塔電腦、視窗環(huán)境、Unix及網(wǎng)際網(wǎng)路瀏覽器瀏覽。
制作PDF的程序有許多種,可以制作出許多不同性質(zhì)及不同用途的PDF檔。例如其中一種方法叫做"蒸餾",利用Adobe Acrobat Distiller軟體,可以將PostScript檔案轉(zhuǎn)換成PDF檔案;另外也可以利用一種可選擇周邊設(shè)備的工具叫Adobe PDF Writer,利用它可自動(dòng)將文件儲(chǔ)在成PostScript檔案,再自動(dòng)轉(zhuǎn)換成PDF檔案,或者利用程序巨集或其他自動(dòng)功能也可以將單獨(dú)或多個(gè)PostScript檔案轉(zhuǎn)換成PDF檔案。
在以往的印前工作流程里客戶若需作最後一刻修改,則需回原編輯應(yīng)用程式修改,再重新列印一次,而在PDF工作流程中,只需使用Acrobat 直接修改PDF檔,無(wú)需再重回原編輯應(yīng)用程式修改列印。
一、PDF檔案組成
1.第一層包含文件的文字與圖像。
2.第二層包含增效部份,例如書(shū)簽,超文字連結(jié)、導(dǎo)覽等。
3.第叁層包含檔案的基本資訊,例如字形資訊和交換參考表。
二、PDF檔案格式的特點(diǎn)
PDF為PostScript純化過(guò)後的檔案,它已經(jīng)去除了PostScript在解譯時(shí)所可能發(fā)生的不確定性,所以成功的轉(zhuǎn)換成PDF檔後,也就確保在後續(xù)的工作流程中能順利的進(jìn)行。您可以將任何應(yīng)用軟體產(chǎn)生的頁(yè)面轉(zhuǎn)換成PDF檔案,完整的將原文件之文字、圖形、影像、聲音及鏈結(jié)嵌入PDF檔案之中,讓你可以在最後一刻做編輯修改而無(wú)須重回應(yīng)用程式修改列印。
在轉(zhuǎn)換時(shí)可以選擇將文字包入PDF文件之中,即使一個(gè)中文PDF檔案亦可在無(wú)安裝中文字型的純英文系統(tǒng)中正確的開(kāi)啟列印,真正的達(dá)到檔案交換網(wǎng)路無(wú)國(guó)界。PDF亦可轉(zhuǎn)換成內(nèi)含字型的EPS檔案,而轉(zhuǎn)換成的EPS檔案可以再組版或其他軟體匯入再使用。
(一)高壓縮
PDF檔案使用多種方法來(lái)達(dá)到縮減原PostScript文件的目的,在圖片壓縮的部分亦可支援述種格式壓縮,一般檔案通常可以壓縮至原來(lái)的數(shù)十到數(shù)百分之一。尤其當(dāng)使用者要在網(wǎng)路上發(fā)行電子文件時(shí),為了速度的考慮,高壓縮比就顯得特別重要。
1.JPEG: Joint Photographic Expert Group專(zhuān)業(yè)攝影聯(lián)合組織,所推廣的是一種減損性的靜態(tài)影像壓縮演算,為一種破壞性的壓縮方法來(lái)壓縮影像品質(zhì),其應(yīng)用范圍對(duì)於彩色的連續(xù)調(diào)圖片較為適合。
2.Zip 是用Jean-loup Gailly Mark Adler的Zlib套裝軟體的延伸開(kāi)發(fā)而成,壓縮方式是適臺(tái)有花紋、底紋或大片重復(fù)影像圖檔。Acrobat 1.0分別提供了4bit及8bit的不同壓縮比的演算,具取樣方法是以重復(fù)的資料為主。
3.CCITT Group1.CCITT Group4 是國(guó)際電話電信組織(International Coordinating Committee for Telephony & Telegraphy)所訂定的壓縮標(biāo)準(zhǔn),用來(lái)壓縮黑白影像繪圖軟體所繪制的圖檔,或單色掃描圖檔以及線條稿。Acrobat 1.0提供這兩種壓縮方式適合單色調(diào)線條稿,如傳真品質(zhì)的檔案。
4.Run length 是針對(duì)單色線條稿的壓縮,尤具有大區(qū)域的單色色塊圖檔。
5.Compress text & Line Art 文字及線條都可以加以壓縮。 <注一>
(二)設(shè)備獨(dú)立
一般 PostScript檔案中包含了多種可能的合法程式碼,在某些條件下 可能無(wú)法運(yùn)行。例如那些依賴(lài)某些特殊字體結(jié)構(gòu)、或輸出設(shè)備的程式碼。相反的,PDF格式不含任何程式結(jié)構(gòu),因而使得它更加安全,也更適合 以電子資料形式儲(chǔ)存或傳輸。PDF是為整合多種輸出選項(xiàng)的網(wǎng)路所設(shè)計(jì)的,它是標(biāo)準(zhǔn)化及設(shè)備獨(dú)立最佳化輸出格式。 對(duì)中文PDF文檔之要求,不采用中文系統(tǒng)時(shí),仍可獨(dú)立顯示中文;采用中文系統(tǒng)時(shí),則可搜尋中文詞匯。
(三)各頁(yè)獨(dú)立
PostScript文件的各頁(yè)間是相互關(guān)聯(lián)的。這意味著你在跳到某頁(yè)之前必 須把它前面所有的頁(yè)都處理過(guò)。而PDF格式并沒(méi)有這個(gè)限制。你可以直接 閱讀PDF檔案的任何一頁(yè),無(wú)須考慮其他頁(yè)。
(四)注記
PDF檔案可以包含各種各樣的注記--例如書(shū)簽,縮影,鏈接,備注,文串,標(biāo)識(shí)和媒體盒。你可以用這些“注記”以提高檔案的質(zhì)量及可讀性。這些“注記”更可以有效的協(xié)助檔案管理工作--例如制作、發(fā)送、 簽注、修正、完稿、以及出版發(fā)行。
(五)檔案保護(hù)
PDF檔案可容許設(shè)定密碼和其他多種保護(hù)方式,以防止非法使用。例如 必須使用密碼才允許閱讀、允許或不允許列印、復(fù)制、簽注、或修改。
肆、中文PDF檔案制作流程
一、網(wǎng)頁(yè)格式轉(zhuǎn)存PDF檔案格式:
PDF檔案在英文字型的產(chǎn)生方面,已可輕而易舉的制作,但在中文部分入前尚無(wú)法輕易地將網(wǎng)頁(yè)直接轉(zhuǎn)為PDF檔,而必須間接的*一些轉(zhuǎn)換才能將網(wǎng)頁(yè)轉(zhuǎn)為PDF檔。在目前的情況來(lái)說(shuō)呢,在Acrobat1.0中以開(kāi)啟網(wǎng)頁(yè)的功能只能用在英文網(wǎng)頁(yè)上,只需使用Web Capture輸入U(xiǎn)RL即可將英文網(wǎng)頁(yè)轉(zhuǎn)成PDF檔,且可保留其超連結(jié)部分的格式。但在中文網(wǎng)頁(yè)部分,中文字體則會(huì)變成亂碼,所以必須藉助Acrobat writer以及Distiller來(lái)列印PDF檔案,雖然無(wú)法保留其超連結(jié)的格式,但可設(shè)定列印超連結(jié)表。
二、排版軟體轉(zhuǎn)存PDF檔案格式:
目前常見(jiàn)的排版軟體對(duì)於PDF檔案格式直接的支援程度并不高,大部分的排版軟體無(wú)法直接轉(zhuǎn)存PDF檔,而必須*列印的方式來(lái)產(chǎn)生。對(duì)於支援直接轉(zhuǎn)存PDF檔案的軟體來(lái)說(shuō),Microsoft Office系列算是最完整的了,基本上只需要將Acrobat 1.0在Office之後安裝,即可在工具列產(chǎn)生一個(gè)Icon,使用者只需直接點(diǎn)選即可啟動(dòng)一名為PDF Maker的程式,輕易的將文件轉(zhuǎn)為PDF檔。其他如Page Maker、Quark Xpress或Illustrator則必須加裝外掛程式才可以直接轉(zhuǎn)存PDF檔。基本上各種軟體所產(chǎn)生含中文字體的PDF檔案,大致上可分為以"Acrobat Writer″、"Acrobat Distiller″以及"曲線″叁種產(chǎn)生方式,其中檔案容量最大的是轉(zhuǎn)為曲線的方式,其次為Distiller產(chǎn)生,最小的是以Acrobat Writer產(chǎn)生。當(dāng)以相同的格式產(chǎn)生,使用的軟體不同時(shí),其檔案大小會(huì)因?yàn)閮?nèi)含資訊的不同而有些少許的出入,但其檔案的特性卻是相同的。
其大致上的制作流程如下: *********
三、PDF檔案格式在於輸出時(shí)的作業(yè)流程:
PDF檔案在專(zhuān)業(yè)輸出時(shí)需搭配PostScript 3之RIP方能發(fā)揮最大生產(chǎn)效能,因?yàn)镻ostScript 3直接支援PDF檔案格式,當(dāng)檔案列印至PostScript 3 RIP時(shí),RIP只需進(jìn)行處理過(guò)網(wǎng),所以處理速度相對(duì)提升,且列印品質(zhì)較佳(如漸層)。而若您原有的RIP只支援PostScript Level 2,則在列印PDF檔案時(shí)會(huì)需要多一個(gè)轉(zhuǎn)換成PostScript Level 2的流程。
前端在Mac平臺(tái)上的排版軟體使用CID ATM字型顯示及編輯,產(chǎn)生PDF檔案;後端再使用Postscript字型或相容輸出機(jī)輸出。
伍、亞洲字型嵌入現(xiàn)況
一、字型編碼說(shuō)明:
亞洲字型要嵌入PDF檔案,比英文字型的嵌入需要更多的軟體,以及更復(fù)雜的技術(shù)。在此之前我們必須說(shuō)明亞洲字型以及英文型的差異點(diǎn),以及其在不同平臺(tái)上的差異點(diǎn)。在亞太地區(qū),雖然都有使用漢字,但每個(gè)國(guó)家或地區(qū)所使用的內(nèi)碼都不相同,茲就各地區(qū)的編碼介紹如下
(一)臺(tái)灣地區(qū)
1.Big 5:俗稱(chēng)大五碼
2.Big 5 plus:Big 5擴(kuò)編碼
3.CNS11643:中文標(biāo)準(zhǔn)交換碼
(二)中國(guó)大陸
1.GB2312-80:通稱(chēng)國(guó)標(biāo)碼
2.GBK :漢字內(nèi)碼擴(kuò)展規(guī)范
(三)日本
1.Shift JIS
2.EUC-JIS
(四)韓國(guó)
1.KSC 5601
(五)其他:
二、編碼原則:
1.文字之選擇及字體悉依"國(guó)字標(biāo)準(zhǔn)字體表"為基準(zhǔn)
2.以2個(gè)位元組(byte)為中文碼編碼單位,并以16進(jìn)位制之文數(shù)字表示之
3.符合CNS 5205及CNS7654之通信定則
4.依字之使用頻率而編排於各不同的字面
5.每字面按先筆劃後部首的排列順序來(lái)編訂字碼
三、CID 字型與TrueType字型,PostScript字型的關(guān)系:
CID是取自於Character ID的縮寫(xiě),此字元辨識(shí)碼的功用在於幫助檢索及取用字元,大量改進(jìn)了其使用效能,此種方法最適合用於龐大的字體集如東方雙位元文字-中文、日文、韓文等。Acrobat并非一定需要使用CID字型,亦可以使用TrueType字型,但在使用TrueType字型時(shí)若在印表機(jī)驅(qū)動(dòng)程式字型選項(xiàng)中若選擇將字型傳送為T(mén)ype 1時(shí),則嵌入於PDF中的中文字無(wú)法再做增字的動(dòng)作,而選擇將字型傳送為T(mén)ype 42時(shí),則嵌入於PDF中的中文字可修改增減(修改時(shí)系統(tǒng)中需有相同的字型)。中文PostScript字型目前尚無(wú)法適用於PDF檔案格式。
內(nèi)嵌字型的最大優(yōu)點(diǎn)便在解決文件產(chǎn)生者與輸出者之間字型不同或?qū)?yīng)錯(cuò)誤的問(wèn)題,現(xiàn)在PS流程是用字碼對(duì)應(yīng),且必須是同一家字型公司的同一系列版本才可對(duì)應(yīng),字型內(nèi)嵌可將此問(wèn)題一勞永逸的解決。
四、Acrobat Reader 能顯示包含 CJK 文字的 PDF 檔案的方式:
要顯示 CJK 文字,有兩種方式。一是在建立 PDF 檔案時(shí),作者可以嵌入所有文件中使用到的字體,包含 CJK 字體,只要字體可以被嵌入就行。任何語(yǔ)言版本的 Acrobat Reader 都可以用嵌入的 CJK 字體來(lái)顯示 PDF 檔案。但是因?yàn)榍度胱煮w的 PDF 檔案可能會(huì)占太多空間,所以作者可能在建立檔案時(shí)選擇不嵌入文件中使用的所有字體,這是第二種方式;如果在這種情況下,Acrobat 或 Acrobat Reader 的使用者若要查看該 PDF 檔案,就必須使用正確的亞洲文字字體集。
五、目前亞洲字體集中所包含的字體:
目前有四個(gè)亞洲字體集 (繁體中文、簡(jiǎn)體中文、日文與韓文)中,每個(gè)都包括有 serif 與 sans-serif 字體。 而 PDF 檔案中嵌入的亞洲字體的類(lèi)型,在Windows 平臺(tái)上可嵌入 TrueType 字體,而在 Macintosh 與 Windows 平臺(tái)上可以嵌入 CID 格式的 Adobe PostScript 字體。較舊的 OCF 格式的 PostScript 字體不能嵌入,此外,文件中的字體必須容許嵌入。 <注叁>
嵌入字體使PDF檔案大小改變的因素取決於文件所包含的字體數(shù)量及字元多少。大體而言,一般文件中每嵌入一個(gè) C、J 或 K 字體,PDF 檔案的大小就會(huì)增加 2 MB 到 3 MB 。
Macintosh 版 Acrobat 1.0 中的「MakeCID 」可將 TrueType 字體與較舊的 OCF 格式的 PostScript 字體轉(zhuǎn)換成「Width-Only」(僅具寬度資訊) 的 CID 字體。這些 CID 字體僅包含 TrueType 或 OCF 字體中使用的羅馬字元的寬度資訊,Distiller 在建立參考原始 TrueType 或 OCF 字體的 PDF 檔案時(shí),需要用到這種字形。
如需更多資訊,請(qǐng)參閱「MakeCID」公用程式資料夾中的文件。如需在羅馬語(yǔ)言的作業(yè)系統(tǒng)中建立包含 CJK 文字的 PDF 檔案,僅具寬度資訊的 CID 字體就可派上用場(chǎng)。 對(duì)於在羅馬語(yǔ)言的系統(tǒng)上建立包含 CJK 文字的 PDF來(lái)說(shuō),Acrobat 中的 PDF Writer是不能在羅馬語(yǔ)言的作業(yè)系統(tǒng)上建立包含 CJK 文字的 PDF 檔案的。然而,如果 Distiller 可以使用它所要制作的 PostScript 檔案中所參考的字體,那麼 Distiller 就能建立含有 CJK 文字的 PDF 檔案。如果 PostScript 檔案含有嵌入的 TrueType 字體,您就可以在任何平臺(tái)上制作此 PostScript 檔。
此外,針對(duì)目前 Adobe Type Library 中的所有 CJK 字體,以及 Macintosh 或 Windows 系統(tǒng)中常見(jiàn)的 TrueType 字體,Distiller 都附有「Width-Only」的 CID 字體。有了這些字體資訊,Distiller 將可以在任何平臺(tái)上均可成功制作 PostScript 檔案。此外,如果制作的 PostScript 檔案中有其他的字體需要轉(zhuǎn)換,還可以用「MakeCID」公用程式建立僅具寬度資訊的 CID 字體。
陸、中文繁體字嵌入現(xiàn)況以及其所面臨的問(wèn)題
目前來(lái)說(shuō),支援中文PDF檔案字型內(nèi)嵌的字集在Mac上只有文鼎的CID ATM字型;在PC上有文鼎的CID PostScript字型,以目前面臨的問(wèn)題來(lái)說(shuō),第一就是檔案大小,第二就是目前在網(wǎng)路上使用的USER并未普遍在個(gè)人PC上安裝相關(guān)的瀏覽軟體。特別是亞洲字型,除了瀏覽軟體外,還必須加裝亞洲文字字集方可開(kāi)啟嵌入亞洲字型的PDF檔案。此外在印刷業(yè)上尚未能使用PDF檔輸出的做法。
柒、未來(lái)解決方案
PDF檔案是一種非常具有發(fā)展?jié)摿Φ臋n案格式,舉凡各種格式的圖文檔案,皆可轉(zhuǎn)成PDF檔,未來(lái)無(wú)論是Microsoft系列的軟體、Corel系列、Adobe系列,都將支援PDF檔案格式的產(chǎn)生、修改、編輯以及輸出。但就目前來(lái)說(shuō),除了Adobe Acrobat系列有完整的功能以外,其他軟體的功能都還尚未健全,而且其他相關(guān)應(yīng)用軟體的種類(lèi)太過(guò)繁雜,有待相關(guān)的軟體開(kāi)發(fā)公司開(kāi)發(fā)出更具整合性的應(yīng)用軟體。 而檔案大小的問(wèn)題,只有兩個(gè)方法,治標(biāo)的方法為將PDF以更高的比例壓縮,以利傳輸;而治本的方法還是必須一方面開(kāi)發(fā)更寬頻的網(wǎng)路;一方面使之更普及,以利大量的資料在網(wǎng)路上傳輸。
捌、結(jié)論
PDF檔案格式并非Acrobat特有的檔案格式,例如華康的DynaDoc檔案格式亦為可攜式文件的一種,其大致上的特性與Acrobat的PDF檔案格式相近,只是功能上有些許的出入。但基本上的目的、用途、產(chǎn)生方式以及瀏覽方式是非常相近的。
PDF檔案尚有相當(dāng)大的研發(fā)以及應(yīng)用空間,例如在電子報(bào)方面,就是一個(gè)非常好的PDF檔案應(yīng)用實(shí)例,因?yàn)橐话愕碾娮訄?bào)大多只有大量的文字,缺少圖片以及活潑的版面,使得閱讀者在瀏覽電子資訊時(shí),會(huì)覺(jué)得面對(duì)滿版僵硬的文字,而降低閱讀的意愿;如果能將電子報(bào)編排成一般報(bào)紙的版面,以PDF檔的格式表現(xiàn)在讀者面前,如此有了活潑的版面以及圖片,一定會(huì)增加使用者閱讀的意愿;另外,PDF檔第二層的超連結(jié)功能亦可讓使用者從頭條標(biāo)題上直接連結(jié),將頁(yè)面導(dǎo)引到報(bào)紙的內(nèi)文中,而省去了逐頁(yè)瀏覽的時(shí)間。當(dāng)然了,這部分的構(gòu)想還得等使用者習(xí)慣於以Acrobat Reader閱讀檔案,以及各種問(wèn)題解決後,才能進(jìn)入實(shí)驗(yàn)及應(yīng)用階段,這將是另一個(gè)網(wǎng)路出版的新出路。
玖、附注
【注一】Acrobat4.0電子文件新世紀(jì)P59~60
【注二】圖片取自文鼎公司網(wǎng)站
【注叁】針對(duì)目前可支援Distiller作嵌入的文鼎字型來(lái)說(shuō),只要為合法的原版字型,文鼎就允許使用者嵌入。
【注四】使用Distiller將字形嵌入之文字,因失去文字特性,故無(wú)法做搜尋及復(fù)制。
名詞解釋
(一)PostScript:
PostScript為美國(guó)Adobe(http://www.adobe.com)公司於1985年所發(fā)表的文件描述技術(shù), Adobe并利用這個(gè)技術(shù), 創(chuàng)造著名合乎PostScript技術(shù)的字型, 并從而改變正個(gè)印刷工業(yè).
PostScript可以精確的描述平面繪制任何文字及圖形. 現(xiàn)今PostScript的技術(shù)已經(jīng)非常普遍的使用在印刷領(lǐng)域, 包括螢?zāi)伙@示(Display), 雷射印表機(jī)(Laser Printer), 輸出機(jī)(Imagesetter), 數(shù)位印刷機(jī)(Digital Printing)..等等輸出設(shè)備. 而與PostScript技術(shù)搭配最重要的是PostScript字型, 使用者可以透過(guò)PostScript技術(shù)調(diào)整抹些參數(shù), 而改變字型的大小, 陰影/立體/空心/粗細(xì)等特殊效果. 由於PostScript在印刷方面卓越表現(xiàn), 目前世界上主要的文獻(xiàn)幾乎多是以PostScript的形式出現(xiàn). Adobe1997年4月發(fā)表了更進(jìn)步的PostScript 3 強(qiáng)調(diào)增進(jìn)品質(zhì)及彩色能力及網(wǎng)際網(wǎng)路列印功能.
(二)TrueType:
TrueType字型格式為美國(guó)Apple及Microsoft所共同制定. 最先使用於Apple的Macintosh系列及Microsoft Windows 3.1, 而目前Apple的OS 8.0及Microsoft Windows 95/NT也都使用TrueType作為字型格式 基本上TrueType和PostScript一樣, 都是使用貝茲曲線(Bezier Curve)來(lái)描述的外框字. 字型可以作任意尺寸的放大縮小, 或作其他屬性的變化.不過(guò)由於Apple及Microsoft的作業(yè)系統(tǒng)都直接支援此字型格式. 所以并不需要如PostScript一樣, 外掛(Adobe)Type Manager之類(lèi)的程式.
(叁)ATM:
ATM(Adobe Type Manager)的功用在於管理Type 1字型的使用,ATM會(huì)自動(dòng)將Type 1外框字點(diǎn)陣化以用於螢?zāi)伙@示或印表機(jī)列印,若所欲列印的印表機(jī)為PostScript印表機(jī),則ATM會(huì)將字型下載至印表機(jī),由印表機(jī)做點(diǎn)陣化外框字。而欲列印的印表機(jī)為一般非PostScript印表機(jī)時(shí),則ATM會(huì)自動(dòng)將Type 1外框字型點(diǎn)陣化再傳送至印表機(jī)。
(四)CID:
CID是取自於Character ID的縮寫(xiě),此字元辨識(shí)碼的功用在於幫助檢索及取用字元,大量改進(jìn)了其使用效能,此種方法最適合用於龐大的字體集如東方雙位元文字-中文、日文、韓文等。
(五)Unicode編碼:
(Unicode編碼)即為ISO 10646國(guó)際編碼標(biāo)準(zhǔn),完全符合Microsoft Office 2000及Windows 2000之字型編碼規(guī)格,在單一作業(yè)系統(tǒng)下即可輸入多國(guó)文字,使跨國(guó)文件的制作變得很輕松
1.Unicode :
Big 5:為目前在臺(tái)灣普遍所使用的業(yè)界標(biāo)準(zhǔn),Big 5碼包括第一字面5401個(gè)漢字,第二字面7652個(gè)漢字及440個(gè)符號(hào),目前支援Big 5的軟硬體包含Windows 95/NT,Apple OS,倚天中文系統(tǒng),點(diǎn)陣印表機(jī),噴墨印表機(jī),雷射印表機(jī),等等軟硬體設(shè)備都支持此內(nèi)碼,但由於臺(tái)灣的特殊環(huán)境,所以并非只使用Big 5碼為唯一的內(nèi)碼,其他尚包括如金資碼,財(cái)稅碼,電信碼,海關(guān)碼,IBM 5550碼,戶政碼,IBM主機(jī)碼,公會(huì)碼(TCA),王安碼,等等,都分別使用於各種應(yīng)用領(lǐng)域。
2.Big 5 Plus:
雖然Big 5字集為臺(tái)灣最普遍使用的字集,但由於Big 5所定義的字集只有13053個(gè)漢字,并無(wú)法滿足,專(zhuān)業(yè)使用者的需要,尤其是政府部門(mén),更無(wú)法滿足現(xiàn)階段文件交換的需要,所以在"財(cái)團(tuán)法人中文電腦推廣基金會(huì)"的主持下完成對(duì)Big 5碼的擴(kuò)編,詳細(xì)資料可參考"財(cái)團(tuán)法人中文電腦推廣基金會(huì)"網(wǎng)站(http://www/cmex,org,tw),包括緣由,碼本,…等等相關(guān)資訊。
3..CNS11643 中文標(biāo)準(zhǔn)交換碼:
CNS11643 中文標(biāo)準(zhǔn)交換碼,一般簡(jiǎn)稱(chēng) CNS 碼或 CNS11643 ,因中央標(biāo)準(zhǔn)局公布及修訂之先後而有二個(gè)版本,一般稱(chēng)為 CNS11643-1986 版(1986公告版)及 CNS11643-1992 版(1992年修訂版),此二個(gè)版本之差異僅在於其所編定之字?jǐn)?shù)不同。75 年公告之 CNS11643定義 11.051個(gè)漢字,81 年修訂版擴(kuò)編為48,027 個(gè)漢字。 75 年公告之 CNS11643 名稱(chēng)為「通用漢字標(biāo)準(zhǔn)交換碼」,於 81 年擴(kuò)充後修訂 CNS11643 名稱(chēng)為「中文標(biāo)準(zhǔn)交換碼」。兩個(gè)電腦系統(tǒng)要交換資料時(shí),以兩方皆認(rèn)可之碼傳輸,此稱(chēng)為交換碼,交換碼之設(shè)計(jì)須符合國(guó)際標(biāo)準(zhǔn)。因此一般在電腦內(nèi)部處理時(shí)使用內(nèi)碼,而在傳輸時(shí),再轉(zhuǎn)換為標(biāo)準(zhǔn)交換碼。
4.GB2312-80:
GB2312-80為中國(guó)大陸最為普遍使用的內(nèi)碼,不論在電腦作業(yè)系統(tǒng)如Apple Machitosh或Microsoft中文Windows簡(jiǎn)體版,都是以GB2312-80為內(nèi)碼,至於其他周邊裝置,如印表機(jī),軟體,標(biāo)簽印字機(jī),及其他各種軟硬體也都是以GB2312-80為內(nèi)碼,即使中文Windows 95雖以GBK為內(nèi)碼,但仍與GB2312-80相容 GB2312-80共規(guī)范了6763個(gè)漢字及682個(gè)符號(hào),內(nèi)容主要也都是簡(jiǎn)體化過(guò)的漢字,與Gb2312-80相對(duì)應(yīng)的為GB12345-90,基本上GB12345-90仍保留原來(lái)繁體字的樣子,但碼序與GB2312-80相同,另外增加了100多個(gè)多對(duì)一的漢字
5.GBK:
漢字內(nèi)碼擴(kuò)展規(guī)范,簡(jiǎn)稱(chēng)GBK,Chinese Internal Code Specification GBK工作小組於1995年10月成立,并於1995年12月完成GBK規(guī)范,基本上采用了原來(lái)GB2312-80所有的漢字及碼位,并涵蓋了原Unicode中所有的漢字20901.總共收錄了883個(gè)符號(hào),21003個(gè)漢字及提供了1894個(gè)造字碼位
由於GBK的編碼,在與GB2312-80的部分采用了GB-2312完全相同的碼序與字樣,所以市面上所有的合乎GB2312-80的文件,檔案及程式都可以在合乎GBK規(guī)范的系統(tǒng)上正常運(yùn)行,目前Microsoft簡(jiǎn)體版中文Windows 95就是以GBK為內(nèi)碼,又由於GBK同時(shí)也涵蓋了Unicode所有CJK漢字,所以也可以和Unicode做一一對(duì)應(yīng), Unicode(http://www,Unicode,com) :(Universal Multiple Octet Coded Character Set) 國(guó)際標(biāo)準(zhǔn)組織於1984年4月成立IOS/IEC JTC1/SC2/WG2工作組,針對(duì)各國(guó)文字,符號(hào)進(jìn)行統(tǒng)一性編碼,1991年美國(guó)跨國(guó)公司成立Unicode Consortium,并於1991年10月與WG2達(dá)成協(xié)議,采用同一編碼字集,目前Unicode是采用16 bit之編碼架構(gòu),其字集內(nèi)容與ISO 10646之BMP(Basic Multilingual Plane)相同,Unicode (Unicode Consortium)并於1992年6月通過(guò)DIS(Draft International Standard),目前版本為Unicode v1.0於1996年公布,內(nèi)容包含符號(hào)6811.漢字20901.韓文拼音11171.造字區(qū)6400,保留20249共65534個(gè)碼位。
參考資料
1.Publishing & Production
2.http://www.agfahome.com.tw/ (臺(tái)灣Agfa首頁(yè))
3.http://www.adobe.com (Adobe公司首頁(yè))
4.http://www.arphic.com.tw/ (文鼎公司首頁(yè))
5.http://www.dynalab.com.tw/ (華康公司賞頁(yè))
6.Acrobat 4.0電子文件新世紀(jì)