需要将pdf转换成word,再进行提取。
具体操作如下:
方法一:复制粘贴法
首先我们新建一个空白文档,然后将pdf文件的内容点击复制,再粘贴到空白文档中,所有内容都复制粘贴完以后,点击保存即可。复制粘贴法简单直接,但是只能复制pdf文件的纯文本内容,图片是不能提取的。并且格式需要自己重新排列。
方法二:PDF转换器
我们可以借助专业的PDF转换器来实现pdf转word,不仅可以提取文件内容,还不用担心文件格式被打乱,更不用花大量时间逐个操作。
首先打开嗨格式PDF转换器,选择主页面的“PDF转文件”。
选择页面上方的“pdf转word”,以直接拖拽或打开文件批量添加的形式上传需要转换的pdf文件。
如果文件是纯图片形式,可以勾选OCR文字识别来识别文字。确认文件页数是否缺失,以及输出格式、目录。点击“开始转换”。
页面显示“转换完成”后,点击“打开文件”查看转换成功的word文档即可。