- ·上一篇:分类汇总功能怎么操作word
- ·下一篇:word怎么对齐上下标
扫描的文字怎么导入到word
1.怎么把扫描进电脑的文章弄到word文档里去
如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。
它能够将扫描的文字直接导入到WORD中进行编辑。
Pdf转化word
1. 第一步:先用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
2. 情况一:如果pdf文档本身就是用pagemaker或word转换而来的(文字非常清晰锐利,很容易识别),那你就方便了。你可以先用acrobat打开,然后点文件——>;另存为——>;把他保存成rtf文档,这样将把所有的pdf页保存成rtf文档,在用word打开。注意最好保存成rtf文档,要不很有可能产生乱码。小技巧:如果你只想识别pdf文件中的其中几页,那你可以现把那几页另存为新的pdf文档,再进行识别。Ny1
情况二:如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>;另存为——>;把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。
2.扫描的文字如何处理成WORD?在网上找到
文本的OCR识别是用户使用扫描仪产品最常见的应用之一,目前几乎所有的扫描仪产品都附带了OCR识别软件。
但我们在使用中发现,即使同一个OCR软件识别正确率的差距也较大。实际上,OCR识别正确率不仅与OCR软件本身有关,与使用方法的正确与否也有很大关系。
根据笔者平时积累的经验,做OCR识别应从以下几个方面入手。这里以MICROTEK扫描仪配备的《尚书六号》OCR为例。
一、扫描操作及注意点 扫描仪联机 在确定 MICROTEK扫描仪能够在被“Scanner Test”找到的条件下运行《尚书六号》OCR软件。 然后点击“扫描”按扭。
片刻之后,扫描仪的控制窗口出现,在保证 “黑白两值”300 dpi的条件下,进行图像预览。以上步骤也可以通过MICROTEK扫描仪上的“OCR快捷键”实现。
目前,市场上的绝大部分MICOTEK扫描仪都配备了方便用户的快捷键。 放大预览及调节图像的清晰度 为了达到最佳的识别效果,对输入稿件在扫描时的最低要求是清晰。
为此,我们可以通过“放大预览”对文稿中的几个文字进行取样扫描,从而对图像的亮度进行更为细致的调节。调节的工具是扫描仪工具内的“阀值”。
以下是不同阀值下的扫描结果。 调节到适当的阀值后,就可以选择“扫描”按扭了。
扫描的结果会传递到OCR软件内,同时扫描仪的控制窗口会自动消失。 二、辨识前所需的注意事项 当以上事项完成以后,我们所要做的就是在OCR软件中的实际操作了。
注意文字的倾斜校正 由于OCR的辨识原理是采用字模的方式进行的,所以一定要注意稿件是否水平。 具体实施过程中,可以采用图像倾斜校正按扭来解决。
对稿件进行识别的预先处理 由于原稿的情况差异万千,所以我们在识别前,需做一些预先的处理。首先应该去除原稿中的杂点和图像。
文稿中如含有图像,OCR是不能识别的,图像的存在,会影响OCR的文字切分。 操作中,可使用“图像的块擦拭”工具将文档中的图像去除,同时文稿中的一些杂点,也应尽量地去除。
针对文档中出现分栏的情况,建议您手动设定辨识范围,最好不要采用“自动切分”,只有这样才能保证辨识结果的连贯性。 采用适当的辨识方式 在具体的辨识中,还应注意您的稿件是横排还是竖排,由此选择正确的编排格式按扭,以保持对应。
目前的《尚书六号》OCR软件为用户提供了简体、繁体、英文等不同的识别方式,其选择是在窗口上的下拉菜单,而非按扭菜单。按扭中的简体、繁体、ENGLISH是《尚书六号》在不同的操作系统上获得正确显示的显示模式,千万不要搞混。
确认以上的步骤后,此时就可按下“识别”按扭,识别完毕后,系统进入“文稿校对界面”。 三、文稿校对 通常而言,OCR对不能完全确定的文字,会显示出兰色,请用户确认。
但值得注意的是,在没有提示出错的地方,也有可能出错,尤其是中文文本的英文单词,OCR一般会将其做中文识别,错误率几乎是百分之百。所以我们在校对时,可以先通读一遍,以此提高文字校对的效果。
我们可以在此界面内,通过操作系统提供的文字输入方法,添加您所需要的文字。 OCR提供选择使用外部编辑器的功能,我们可以选择WORD编辑器。
最后建议您在WORD内进行整个的文稿校对,并重新排版,以达到使用OCR的最佳效果。
3.如何将扫描的图片的文字变成Word的文字
——文字扫描。
首先,安装Microsoft office 2003
(仅以office 2003为例。其它版本office均可)
安装完成后,打开“开始→Microsoft
office→Microsoft office工具→Microsoft office
Document
Imaging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击
[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中
“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。
然后单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,然后在
“输出大小”中选择600*480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳
效果,点击[捕获]按钮即可得到图片画面,该图片会显示在“图例”框中,然后选中该图片,点击[发送]
按钮会开始扫描该图片中的文字,扫描完成后点[完成]按钮,然后系统会自动打开识别程序
Microsoft Office Document
Imaging,用该文件就可以识别了。完成后可以选中全文,鼠标右击后选中
“将文本发送到Word”项,则所选内容便会被Word打开并可以进行编辑了。
4.怎样把扫描好的户口页打印出实际大小
使用Photoshop软件可以把扫描好的户口页打印出实际大小,按照以下步骤即可:
1、在photoshop中打开此照片,双击图层解锁,快捷键Ctrl+R调出标尺栏。
2、将照片摆正,消除透视,从上方标尺栏拉出一条参考线到相片接缝处。快捷键Ctrl+T调出变形工具,旋转照片,接缝与参考线基本重合即可。
3、再从上方标尺栏拉出一条参考线到照片下端,从左方标尺栏拉出两条参考线到照片左右两侧。
4、快捷键Ctrl+T调出变形工具,再按住Ctrl键,拉变形框的四个角点,直到户口本页面四个角点与参考线四个角点重合。按参考线围成的方框裁剪照片。
5、新建:长143mm,高105mm(户口本内页尺寸),分辨率300像素,颜色模式CMYK。
6、将户口本页面复制到新建图片上,快捷键Ctrl+T调出变形工具,拉户口本页面右下角,直到户口本页面与新建白色图片重合,回车键确定。
7、最后将图片保存为JPG格式,打印即可。
5.怎样把扫描文件变成电子档案
首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去,一般单位都有扫描仪,如果没有也没关系,用数码相机拍也行,拍成图片放到WORD里面去,不过在些 之前,你还得装一下WORD自带的组件,03和07的都行。
点开始-程序-控制面板-添加/删除程序,找到Office-修改 找到Microsoft Office Document Imaging 这个组件,Microsoft Office Document Imaging Writer 点在本机上运行,安装就可以了。首先将扫描仪安装好,接下来从开始菜单启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。
提示:Office 2003默认安装中并没有这个组件,如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。 由于是文字扫描通常我们选择“黑白模式”,点击扫描,开始调用扫描仪自带的驱动进行扫描。
这里也要设置为“黑白模式”,建议分辨率为300dpi。扫 描完毕后回将图片自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。
点击工具栏中的“使用OCR识别文字”按键,就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。
如果你要获取部分文字,只需要用鼠标框选所需文字,然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中 了。 此软件还有一小技巧:通过改变选项里的OCR语言,可以更准确的提取文字。
例如图片里为全英文,把OCR语言改为“英语”可以确保其准确率,而如果是“默认”则最终出现的可能是乱码~ 还有: 应该说,PDF文档的规范性使得浏览者在阅读上方便了许多,但倘若要从里面提取些资料,实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译,痛苦的要命,竟然傻到用Print Screen截取画面到画图板,再回粘到word中,够白了:(最近连做几份商务标书,从Honeywell本部获取的业绩资料全部是英文版的PDF,为了不再被折磨,花费了一个晚上的时间研究PDF和Word文件的转换,找到下面2种方法,出于无产阶级所谓的同甘共苦之心,共享下:) 1、实现工具:Office 2003中自带的Microsoft Office Document Imaging 应用情景:目前国外很多软件的支持信息都使用PDF方式进行发布,如果没有Adobe Reader,无法查看其内容,如果没有相关的编辑软件又无法编辑PDF文件。
转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为DOC的工作,但很多都不支持中文,我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。
使用方法: 第一步:首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。 编辑提示:如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。
第二步:运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
编辑提示:目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。 2、实现工具:Solid Converter PDF 应用情景:利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换,但是对于很多“不规则”的PDF文档来说,利用上面的方法转换出来的Word文档中常常是乱码一片。
为了恢复PDF的原貌,推荐的这种软件可以很好地实现版式的完全保留,无需调整,而且可以调整成需要的样板形式。 使用方法: 1、下载安装文件Solid Converter PDF,点击安装。
编辑提示:安装前有个下载安装插件的过程,因此需要保证网络连接通畅。 2、运行软件,按工具栏要求选择需要转换的PDF文档,点击右下的“转换”(Convert)按扭,选择自己需要的版式,根据提示完成转换..。
