如果你有一個utf-8編碼的文件,但是你想要一個其他編碼的文件,比如GB2312,GBK,GB18030等等,如何轉換呢?
通常的方法有一下兩種:
[1]用文本編輯器,打開文件,再選擇編碼另存,就可以了
?你可以用ultraedit,可以用textpad,可以用gedit,等等編輯工具
[2]用iconv工具
在linux下面,可以用
iconv工具來實現
比如我的文件
sample500.txt的編碼是UTF-8
內容如下:
address
北京市東城區三眼井胡同乙68號
北京市東城區東中街22號
北京市東城區東中街29號東環廣場B1層
北京市東城區東中街46號同廠子胡同46號
北京市東城區東交民巷
北京市東城區東交民巷1號
北京市東城區東交民巷2號北京新僑諾富特飯店
北京市東城區東內大街201號
轉碼 UTF-8 -> GB2312
$ head -10 sample500.txt | iconv -f UTF-8 -t GB2312? > sample.gb2312.txt
之后的文件內容是:
address
?????ж???????????????68?
?????ж????????н?22?
?????ж????????н?29???????B1?
?????ж????????н?46?????????46?
?????ж????????????
?????ж?????????????1?
?????ж?????????????2????????????????
?????ж????????????201?
?????ж?????????????????23?
我的系統是亂碼,是因為我的系統沒有添加GB2312支持。
同樣的道理,你也可以用這種方法來實現從一種編碼到另一種編碼的自由轉換。
-f 是源文件的編碼
-t是目標編碼
詳細的內容你可以參考iconv的幫助
注:我用的是debian 5.0 系統。
|----------------------------------------------------------------------------------------|
版權聲明 版權所有 @zhyiwww
引用請注明來源 http://www.tkk7.com/zhyiwww
|----------------------------------------------------------------------------------------|
posted on 2009-06-19 17:40
zhyiwww 閱讀(1337)
評論(0) 編輯 收藏 所屬分類:
j2ee 、
debian