經(jīng)過嘗試,發(fā)現(xiàn)可以利用 Office 2003 中的 Microsoft Office Document Imaging 組件來實(shí)現(xiàn)PDF轉(zhuǎn)WORD文檔,也就是說利用WORD來完成該任務(wù)。方法如下:
用Adobe Reader 打開想轉(zhuǎn)換的PDF文件 ,接下來 選擇 “文件→打印”菜單,在打開的“打印”窗口中將 “打印機(jī)”欄中的名稱設(shè)置為 “Microsoft Office Document Image Writer”,確認(rèn)后將該P(yáng)DF文 件輸出為 MDI格式的虛擬打印文件 。
注: 如果沒有找到“Microsoft Office Document Image Writer”項(xiàng),使用Office 2003安裝光盤中的“添加/刪除組件”更新安裝該組件,選中“Office 工具 Microsoft DRAW轉(zhuǎn)換器”。
然后, 運(yùn)行 “Microsoft Office Document Imaging”,并利用它來 打開 剛才保存的MDI文件,選擇“工具→ 將文本發(fā)送到Word ”菜單,在彈出的窗口中選中“ 在輸出時(shí)保持圖片版式不變 ”,確認(rèn)后系統(tǒng)會(huì)提示“必須在執(zhí)行此操作前重新運(yùn)行 OCR 。這可能需要一些時(shí)間”,不管它, 確認(rèn) 即可。
注: 對(duì)PDF轉(zhuǎn)DOC的識(shí)別率不是特別完美,轉(zhuǎn)換后會(huì)丟失原來的排版格式,所以轉(zhuǎn)換后還需要手工對(duì)其進(jìn)行排版和校對(duì)工作。
以上僅在 word2003 中可用,其他版本沒有Microsoft Office Document Image Writer。
posted on 2006-05-10 11:25
小小程序程序員混口飯吃 閱讀(384)
評(píng)論(0) 編輯 收藏 所屬分類:
java