先用知网文件浏览器CAJViewer ,打印成PDF,再PDF转WORD,这是流程。
推荐用下面软件转换:
(1)页数比较少的用 CAJviewer (带OCR组件完整版) ,支持直接打开PDF文件,识别文字。
(2)页数比较多的可以用 Readiris Corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文) 。
(3)页数比较多的还可以用 ABBYY finereader 9或者9以上版本(有简体中文版)进行识别转换。
.PDF 转换成.DOC 格式是可行的,网上有很多转换软件,下载即可。那么怎么将.CAJ、.NH、.KDH 等文件转换成.DOC 格式文件呢?有三个方法可以参考: (1)方法一: 首先到中国知网下载CAJViewer 阅读器,安装CAJViewer 阅读器软件。运行CAJViewer 阅读器并点击“文件”打开.CAJ、.NH、.KDH 等格式文 件。接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将.CAJ、.NH、.KDH 等格式文件输出为MDI 格式的虚拟打印文件。 PS:如果 你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003 的时候没有安装该组件,请使用Office 2003 安装光盘中的“添加/删除组件”更新安装该组件。 运行 Microsoft Office Document Imaging,并利用它来打开刚才保存的 MDI 文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不用管它,点确认即可。 不过,目前转换后的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。 大功告成!补充一下,PDF 格式文件也可以按照上面的方法转换成DOC 格式文件。 (2)方法二: 首先用 版本阅读器打开nh 文件,在你当前打开页的左上方有个保存为图片的按钮, 把当前页面保存为图片。然后下载安装一个汉王,安装好后打开。注意,此软件安装好后没有快捷方式,需要按照下面的步骤打开:开始--程序--汉王 汉王. 打开后按照下面的操作就可以识别图片,转换成文字。文件--打开图像--识别--开始识别-- 输出--到指定格式文件,保存为txt 文件就可以了 (3)方法三: 首先,启动CAJViewer 浏览器程序,用 打开刚才保存的CAJ 格式的文件,然后在每页的左右两边分区域选取文字,再在选取区域内,单击右键“文字识别”,这时会出现“文字识别结果”对话框,单击“复制到剪贴板”或“发送到Word”,即可大功告成。 不足:就是不能对整篇、整页文档进行识别。
具体操作步骤如下:
1、首先,使用Ctrl -键缩小页面并将纸张缩小到适当的尺寸。 如下图所示,然后进入下一步。
2、其次,单击菜单栏中的【文字识别】,如下图所示,然后进入下一步。
3、接着,使用鼠标调整由文字识别的虚拟框架,以构造后文本框架,如下图所示,然后进入下一步。
4、然后,等待几秒钟,将弹出一个文本识别框,点击【复制到剪贴板】,如下图所示,然后进入下一步。
5、最后,将复制的文本粘贴到word文档中并保存即可,如下图所示。这样,问题就解决了。
219 浏览 2 回答
183 浏览 3 回答
348 浏览 5 回答
229 浏览 4 回答
105 浏览 4 回答
187 浏览 5 回答
135 浏览 2 回答
137 浏览 3 回答
113 浏览 2 回答
212 浏览 5 回答
249 浏览 5 回答
215 浏览 4 回答
199 浏览 5 回答
174 浏览 2 回答
227 浏览 3 回答
349 浏览 3 回答
233 浏览 3 回答
112 浏览 5 回答
246 浏览 3 回答
323 浏览 3 回答
93 浏览 3 回答
331 浏览 5 回答
302 浏览 8 回答
278 浏览 2 回答
225 浏览 6 回答