如何把扫描件改成word文档的格式?
1.如何把扫描件改成word文档的格式?
方法一:可以利用office 2003中的microsoft office document imaging组件来实现pdf转word文档,也就是说利用word来完成该任务。方法如下:
用adobe reader打开想转换的pdf文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“microsoft office document image writer”,确认后将该pdf文件输出为mdi格式的虚拟打印文件。
注:如果没有找到“microsoft office document image writer”项,使用office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office 工具 microsoft draw转换器”。
然后,运行“microsoft office document imaging”,并利用它来打开刚才保存的mdi文件,选择“工具→将文本发送到word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行ocr。这可能需要一些时间”,不管它,确认即可。
注:对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
方法二:打开WORD文档,在工具栏上右击“显示出图片工具栏”,然后点击“图片工具栏”上的“插入图片”选项,可以将您扫描出来的图片插入到WORD文档中来,点击保存就可以把文档保存为WORD文件格式了。
方法三:到网上去下载个OCR软件就可以了,使用OFFICE 2003中的一个名叫Microsoft Office Picture Manager 的工具,将图片格式改为,jpg后,在使用OCR软件处理就可以了。一般扫描仪附带软件中应该有这个OCR软件的。
2.如何将扫描仪里的文件变成word模式
如何把扫描文件转换成WORD方式 办法一 运用WORD自带的组件Microsoft Office Document Imaging功用。
一、把打印稿或文件放到扫描仪扫到电脑上去。
二、运转Microsoft Office Document Imaging 这个组件。挑选菜单“文件”下“扫描新文档”——>;弹出对话框中挑选“是非形式”,挑选你当时的扫描机器,点击“扫描” ——>;弹出对方框中选“是非照片或文字”,点击扫描。
三、看到扫描文件了,挑选菜单栏“东西”下“将文本发送到Word(T)”。挑选寄存目录。点击“断定”。
四、翻开寄存的那个文件。你把里边的内容复制到一个新的Word中就能够修改、排版了。
3.怎么把扫描的图片转换成Word的形式
你可以使用OCR软件,就是光学字符识别,你可以试试国产比较不错的清华紫光OCR: 清华紫光 OCR支持Windows环境下的GB、BIG5、JIS和Shift-JIS等多种内码。在印刷体汉字识别中还加入了MMX优化技术,使识别速度得到了很大提高。我们用它识别一页A4大小的印刷体中英文混排的纯文本文件,只用了几秒钟。而且识别率非常高,只有极个别的字出现了差错。在这个版本中新增了表格识别功能。选择了识别表格的选项后,它会自动将表格的框线先识别出来,再对表格中的文字进行识别。文字全部识别出来之后会将文字按原样恢复到表格中。在这项测试中识别率也很不错。但是在测试中我们的工程师发现,当文字与表格的框线距离较近时,它的识别效果就没有那么理想了。如果用户想对一个图文混排的文件进行识别,则清华紫光 OCR还具有版面自动分析功能。它自动对扫描的版面进行分析,把应识别的文字区域划分出来,之后进行识别。对于被划分区域内的文字有很高的识别率,而且速度同样很快。不过遗憾的是,在这个版本中没有提供版面自动恢复的功能,因此如果想把文件恢复成原来的版面,则还需要重新手动排版。它的导出功能可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。它还可以将扫描进来的图像格式转换成TIFF、BMP或PCZ等格式,具有很大的灵活性。它的批量识别功能可以让用户一次把多页文稿全部扫描之后再进行识别,避免了扫描一页识别一页带来的麻烦。这一版本最多可实现10000页的批量识别。该版本还增加了一项非常实用的功能,就是手写体的识别。有了这一功能,许多以前手写的信件或文件就可以扫描到计算机中,识别出来后用电子文档的方式进行保存了。不过目前的手写体识别功能还不够完全成熟,它对书写有很高的要求,如每个字之间要有一定的间隔,不能有连笔的情况等。尽管如此,手写体识别这一功能还是能够在一定程度上减轻文字录入工作的负担。该OCR还具有自学习功能,当遇到有生僻字时,可以通过键盘输入进行学习。有了这一功能,用户就可以自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的识别字符集。清华紫光这一款专业版的OCR软件,不仅可以对纯文本文件进行识别,而且可以进行复杂的图文混排和图表文档的识别,最大限度地把人们从繁杂的文字再录入的工作中解脱出来。
4.怎样把扫描文件转换成WORD形式
1.装一下WORD自带的组件,03和07的都行。点开始-程序-控制面板-添加/删除程序,找到Office-修改 找到Microsoft Office Document Imaging 这个组件,Microsoft Office Document Imaging Writer 点在本机上运行,安装就可以了。
2.你得先把这些打印稿或文件通过扫描仪扫到电脑上去。由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。这里也要设置为“黑白模式”,建议分辨率为300dpi。
3.之后将扫描好的图片文档另存为“BMP”文档,再将此BMP模式的文档另存为“TIFF”文档。
4.将此TIFF文档在“Microsoft Office Document Imaging”中打开。 点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中 了。
