引用:lisenbao 的
电脑知识 用OFFICE 2003把pdf文件转换成可编辑的word文件很多人都希望把一些网上得来的PDF文件转换为可编辑的文本进行再加工利用,但是由于PDF自身的限制,通常很难实现,一些英文的转换软件又不支持中文。迫不得已有人(偶从前就是)把PDF文件打印然后通过OCR软件再进行识别转换,费时费力。
现在通过Office2003就可以轻松实现这个过程,可将大部分PDF直接转化为可编辑的Word文档。
当然,这个过程仍然是有要求的。那就是你需要转化的PDF文件必须允许打印,不过好在通常这一权限都是开放的。OK,Let''s go...
首先打开一个PDF文件,这里我打开了一个《Windows XP控制台主要命令解释》的文件。
按打印按钮,会弹出打印对话框。将打印机选择为“Microsoft Office Document Image Writer”,然后确定。
这时会出现一个另存为对话窗口,要求你选择位置保存“Mdi”文件,这里是“Windows XP控制台主要命令解释.mdi”,按保存。
接着会自动启动“Microsoft Office Document Imaging”并打开你刚刚保存的“mdi”文件。在“工具”菜单中选择“将文本发送到 Word(T)”,如果你没有安装“Microsoft Office Document Imaging”此时Windows会自动提醒你放入Office安装光盘,只需根据提示操作即可。
弹出“将文本发送到 Word”对话窗口,直接确定。
OCR识别根据不同的机器配置以及文章长短,所需时间也都不同。确定。
识别过程,等待......
完成后,Word会自动打开识别好的文本内容。
转换完毕的文本保存在“我的文档”,文件名与源文件名相同,类型为Word文档。
Microsoft Office Document Imaging识别率还可以接受,毕竟是在没有专业识别引擎的情况下,并且不经过打印扫描等过程的情况下。尤其是中文支持非常好,有需要的朋友可以试试。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报。