在軟件系統(tǒng)中,由于存在著各種各樣的字符編碼問題,比如另我們非常頭痛的中文問題。因此,現(xiàn)在趨向于使用UTF-8編碼作為軟件中通過編碼格式,從而可以避免大多數(shù)字符編碼的問題。本文跟
《80前》一文一樣,以Spring項目無關(guān),請“
春迷”們自重、沒事勿擾,文中不足之處歡迎大家批評指教。
在Java開發(fā)中,我們經(jīng)常使用Ant來編譯及打包項目。默認(rèn)情況下Ant會去調(diào)用一個名為build.xml文件,文件中定義了相關(guān)的單元及任務(wù)等,可以根據(jù)用戶命令執(zhí)行相應(yīng)的任務(wù)單元。
比如,在很多開源項目如Spring、webwork、EasyJWeb、EasyDBO等,其根目錄下都有一個build.xml文件。
在國外的開源項目中,build.xml文件中的內(nèi)容全部是英文字符,因此build.xml使用普通的ANSI或UTF-8或GBK都沒問題,也不會遇到字符編碼問題。而對于國產(chǎn)的開源項目EasyJWeb、EasyDBO來說,為了方便國內(nèi)的用戶,肯定在文件會包含一些中文說明。而默認(rèn)情況下包括中文字符,格式為ANSI的build.xml文件是無法正確運行的,這應(yīng)該跟本人所寫的Dom4j的原因類似。
此時,我們需要把build.xml文件改成UTF-8格式,并指定xml文件的格式為utf-8。如下面是EasyJWeb開源項目中build.xml文件的部分內(nèi)容:
<?xml version="1.0" encoding="UTF-8"?>
<project name="EasyJF" default="usage" basedir="." xmlns:artifact="urn:maven-artifact-ant">
?<property file="easyjfbuild.properties" />
?<!--目錄定義-->
?<property name="main.src.dir" value="${basedir}/src/main" />
?<property name="test.src.dir" value="${basedir}/src/test" />
?<property name="lib.dir" value="${basedir}/lib" />
?<property name="env.lib.dir" value="${lib.dir}/build/" />
?<property name="doc.dir" value="${basedir}/doc" />
?<property name="build.dir" value="${basedir}/build" />
?<property name="release.dir" value="${basedir}/release" />
?<property name="web.dir" value="${basedir}/webapps" />
?<property name="ide.dir" value="${basedir}/misc/ide" />
?<!--項目屬性-->
?<property name="project.provider.name" value="easyjf" />
?<property name="project.name" value="jweb" />
?<property name="project.author" value="
?<property name="project.version" value="0.6" />
?<!--發(fā)布文件名-->
….
這里的問題是如何建一個UTF-8格式的build.xml文件。
錯誤的習(xí)慣: 在通常情況下,我們習(xí)慣于使用windows下的記事本等工具直接編碼xml文件內(nèi)容,并另存為UTF-8格式,如下圖所示:
?

這種方式建立的build.xml文件是不正確的,最讓人煩惱的是具有非常的不穩(wěn)定性。這個不穩(wěn)定性表現(xiàn)在一些系統(tǒng)下能正確使用,而一些系統(tǒng)下會出現(xiàn)類似如下的錯誤:
D:\EasyJF\wlhy\bin>build.bat
Buildfile: ..\build.xml
BUILD FAILED
D:\EasyJF\wlhy\build.xml:1: 缺少文件根組件
Total time: 0 seconds
請按任意鍵繼續(xù). . .
?
正確的方法:
前面說了,用記事本建立UTF-8格式的xml文件是不正確的,經(jīng)過我們多次實踐,正確的方法之一是使用Eclipse來建這個xml文件,在建立工程的時候需要把整個工程的字符集設(shè)置成為UTF-8,然后直接建立一個build.xml文件,默認(rèn)情況下該文件以UTF-8的格式保存。
這樣建立起來的腳本文件,使用Ant的時候,不管build.xml中包含什么中文字符,都能正常運行。當(dāng)然,應(yīng)該還可以用其它的開發(fā)工具建立UTF-8格式的文件,還請大家來試驗。另外也可以用JAVA自己寫一個小程序來把ANSI格式的文件轉(zhuǎn)成UTF-8文件,這樣也沒問題。
?
小結(jié):
之所以很多開源項目的build過程中不會存在問題,是因為他的腳本文件中沒有包含中文字符或其它字符。面在國產(chǎn)開源項目中,由于存在中文注釋、說明等,所以在建立build.xml文件的時候需要作一些特殊的處理,使用UTF-8格式的文件。當(dāng)然,本文還重點提出了兩種建立UTF-8文件的方法,其中用記事本是不穩(wěn)定的,錯誤的;而用專業(yè)Java開發(fā)工具或JDK建立的腳本才是正確、穩(wěn)定的。
posted on 2006-08-21 11:44
簡易java框架 閱讀(1662)
評論(4) 編輯 收藏