- ·上一篇:自家电脑怎么word文档
- ·下一篇:推荐表怎么插到word表格里
ios14扫描怎么转word
1.怎样将扫描文字转换为word文档?
巧用Office 2003实现OCR文字输入 为了迎接市里的工作验收,领导拿来了许多存档文件,要求小王在三天内摘录并形成汇报文档。
看着厚厚的材料小王发愁了,这时有人提醒:你的笔记本电脑不是刚装上Office 2003吗,里面的Microsoft Office Document Imaging不错。它是一个光学字符识别(OCR)软件,可以用扫描仪扫入纸文档中的汉字,用它,摘录文件的速度可快多了。
○ 操作准备 局里只有一台比较旧的F1210扫描仪,小王把它连接到笔记本电脑的并口,接通电源以后安装扫描仪驱动程序。单击“开始”-->“所有程序”-->“Microsoft Office工具”中的“Microsoft Office Document Imaging”,将纸文档放入扫描仪,准备将其中的汉字输入Word。
○ 扫描设置 打开Microsoft Office Document Imaging窗口以后,单击工具栏中的“扫描新文档”按钮,即可看到如图1所示的对话框。首先单击其中的“扫描仪”按钮打开选择扫描仪对话框,查看当前扫描仪的型号是否在里面。
如果对话框或下拉列表中没有当前扫描仪,就要检查驱动程序安装和电源连接是否正确。 接下来要根据文档的特点选择扫描预设。
如果是彩色纸张上的黑色或彩色文本,或者是白色纸张上的彩色文本,可以选择“将彩色页面扫描为黑白图片”;对常见的白色纸张上的黑色文本而言,可以选择“黑白模式”或“灰度模式”。 Microsoft Office Document Imaging提供的扫描预设功能可以满足大多数文档的要求。
如果文档使用的字体太小,或者由于纸张等缘故导致文字不太清楚,就得适当调整扫描预设中的分辨率。用户只要选中要调整的某种扫描预设,单击图1中的“预设选项”按钮打开菜单,选择其中的“编辑所选预设”,就可以看到“预设选项”对话框的“常规”选项卡。
单击其中的“高级”按钮打开如图2所示的对话框,可将默认的分辨率(DPI)值由200修改为300。当扫描文档中的文字是彩色或具有彩色背景时,选中图2中的“自动设置对比度,保存为单色”,让扫描的图像具有较高的对比度,这样可以获得更好的文字识别效果。
除此之外,“预设选项”对话框还有三个选项卡。其中“页面”选项卡设置扫描仪的幅面,常见的A4扫描仪应该选择“A4”(默认);“输出”选项卡可以设置扫描文件的保存位置,还可以设置扫描文件的命名方式,可以根据自己的需要进行调整;“处理”选项卡控制OCR的工作设置,一般采用其中的默认值就可以了。
○ 扫描文档 文档放入扫描仪以后,根据其特点选择图1中的某一个扫描预设方式,单击“扫描”按钮开始扫描文档。与大多数OCR软件不同,Microsoft Office Document Imaging扫描结束即开始文字识别,完成后即可在窗口中显示结果。
该窗口分为“缩略图窗格”和“页面窗格”左右两部分。如果用户连续扫描了多页文档,缩略图窗格显示各页的缩略图,页面窗格显示当前文档的图像。
如果用户有多页文档需要扫描和识别,可以在一页扫描结束后再次扫描下一页,完成后会弹出一个对话框。单击“继续”按钮可以放入下一页文档,继续进行扫描,但不识别和保存当前文档;单击“完成”按钮则停止扫描,执行识别并保存文件。
再次扫描新文档时只要将它放入扫描仪,单击图1中的“扫描”按钮即可;单击“取消”按钮会停止扫描,不进行识别也不保存文件。 建议把“换页提示”也勾选上,这样可以一次用扫描仪扫描完诺干张纸质文件,然后统一识别转化成word文档,提高工作效率 小提示 Microsoft Office Document Imaging具有自动旋转功能,文档放入扫描仪时无论位置正、倒都可以,软件在扫描过程中会自动识别并旋转到正确的方位。
○ 获取文本 从表面上看,页面窗格显示的是文档图像。其实不然,被识别的文本已经被隐藏在层中了(与文档图像分离)。
我们可以采取两种方法获取该层中的文本。 如果需要某页文档中的部分文字,只要按下工具栏中的“选择”按钮,拖动光标选中页面窗格中需要的文本,单击鼠标右键选择快捷菜单中的“复制”,就可以将这部分文本放入剪贴板,再粘贴到汇报文档中编辑了。
如果单击工具栏中的“将文本发送到Word”按钮,软件就会自动新建一个Word文档,将所选中的识别文字放入其中。以上操作完成后,在页面窗格中的任意位置单击鼠标,就可以取消已经选中的文本,再次获取其它位置的文本了。
(页面中既有文字又有图片,或者既有文字也有表格边框,识别效果可能会受到影响,建议先选中文字,再识别) 当需要某页或几页文档中的所有文本时,可以直接打开工具栏中的“将文本发送到Word”按钮,选择添加到Word的文本范围以及输出版式和保存位置。完成后单击“确定”按钮,即可在指定位置自动保存一个htm文档。
使用“文件”菜单下的“另存为”命令,很容易将它转存为doc文档。 小提示 Microsoft Office Document Imaging能保留原文档的段落结构,这给小王的文档编辑工作带来了很多方便。
后记:OCR软件的种类非常多,例如紫光、尚书、汉王等等。不过Microsoft Office Document Imaging具有良好的易用性,并和Word 2003紧密结合,大家不妨体验一下。
2.有没有一个软件能将扫描内容转为一个文档?被请告知怎样用?
你说的软件应该叫做OCR,可以将扫描的文字转换为文档,解决了很多打字压力问题。
试试功能优化后更加人性化便捷的尚书7文字识别 软件介绍: 本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。 目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。
本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。 ●识别字符 简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
●识别字体种类 能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。 ●识别字号 初号 小六号字体。
●表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。 ●可支持繁体WINDOWS系统 使用方法: 首先,尚书七号将整个OCR的过程明确化了,通过程序的菜单,我们就能够知道整个OCR的过程,主要分为:“文件”、“编辑”、“识别”、“输出”等步骤。
在文件菜单中,您可以调用扫描仪,或者选择将已经扫描好的图像文件打开。得到图像文件后,用户的工作,就是“编辑“菜单里面所提示的“图像页面的处理”,其中包括图像页的倾斜校正(提供自动和手动实现方法)及旋转等功能。
处理完毕后,就可以进入“识别过程”,该过程核心是“版面分析”。 现在尚书七号的自动版面分析功能很强,面对报纸杂志等复杂情况的版面,也能保持很高的分析正确率。
不再需要以往尚书六号里面那样的建议手工划识别范围。也正是这点,大大降低了使用者的工作量。
为了方便用户的使用,在“识别”菜单下,也提供了用户在自动版面分析后,通过修改识别范围框的属性,来决定需要识别否的功能。 当然,用户还是可以习惯的按尚书六号那样,自己来设定识别区域。
当用户设置好后,就可以直接点击“开始识别”的按钮进行文字识别了。 自动识别完毕,识别结果的“文本窗口”都会弹出,这个窗口能够提供识别结果的校对,为了校对的方便,尚书七号增加了光标跟随显示原图像行的校对方法。
这样提供校对的方法,一眼就能够看到图像原文和识别出文本的差别,方便了用户,降低了用户校对的工作疲劳感。当检查过后确认没有错误,用户就可以选择识别结果的“输出”了,指定的文件格式有:RTF、HTML、XLS、TXT,用户这里可以根据自己的需要选择对应的格式。
如果用户是想得到类似原文的识别结果,请选择RTF格式。 把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。
识别结束后,存为RTF格式保存,过上面的正确使用习惯,我们便可利用尚书七号或其他OCR软件大幅度提高工作的效率。 此外,多数OCR软件同尚书七号一样,均提供有多图像页面的处理功能。
用户就可以放心的将好几页的文章,统一进行版面处理(只要选择“识别”菜单下的“选择全部文件”就可以做到批处理),识别的结果输出在同一个文件当中,更便于管理和保存。 另外根据笔者较长时间的使用经验,总结得出的一个技巧与各位分享,希望能对各位有所帮助。
如无特殊需求,一般用户只要在扫描驱动软件中,设定分辨率是300dpi,不管是彩色、256阶灰度还是黑白两值,尚书七号或其他OCR软件都可以轻松的识别,且效果最为理想。同时,如果用户只是需要黑白文档,在彩色、256阶灰度方式的扫描,尚书七号也可以自动的转化成黑白两值图做识别,这样的识别效果会更好。
(这个还真不错,虽然是帮你,但是也给我找到了一个好的扫描文字软件,呵呵。)
3.怎么把扫描版的东西转换成word
扫描的文档一般都很难识别出来的,即使识别出来后,也要在复制到WORD里后注意检查错误(OCR文本识别并不是完全能正确的),推荐按照以下步骤来操作:
1、扫描文件。扫描的文件一般就是个图片格式,比如JPG PNG等格式,如果你还可以再扫描的话,就尽量打高点分辨率(文件会很大,可能达到几十MB,但比较容易识别)
2、转化文件为PDF格式。(也可能你的文件已经定了,不能再扫描,那就直接用),将文件转化为PDF格式,你必须用个PDF编辑器打开,这里我推荐用大名鼎鼎的Adobe Acrobat 8.0 Professional,迅雷上下载大概是400MB左右的安装文件。一旦你安装好之后,直接在扫描文件上右键,可以看到转化为“PDF格式”,自己保存为一个名字就可以了。
3、用Adobe Acrobat 8 Professional打开你的要转化的文件,然后点选菜单栏里的“文档---OCR文本识别---OCR识别”,会问你需要识别几页的文字,你自己确认就可以了,然后是一个识别过程,1页大概20秒时间吧。参考附带图片。
4、识别后,就可以选中你要的文字部分,单击右键--选择“复制”,再随便新建个WORD文档,把内容粘贴到WORD里保存就可以了,记得自己校对。
其实楼上的说的也对,只是没说明具体步骤而已,尚书7号也是OCR识别软件,很专业的,但程序本身也很大,OCR识别的程序都很大。楼上说明了软件名称其实就等于说出了答案啊,这叫要求电脑使用者只要有电脑应用意识都可以自己搞定的了。自己去搜索软件下载--按照常规编辑操作。这是应用意识,是意识!!!
其他专业识别软件也大概都是这样的过程:下载软件并安装---用此软件打开要识别的文件---选择OCR识别---复制---粘贴到WORD里。OK。
还有问题没?