扫描的文字怎么导入到word

2025-10-01 09:47:57

1.怎么把扫描进电脑的文章弄到word文档里去

如果你有扫描仪的话，就需要一款汉王OCR软件，如6800。如果没有扫描仪的话，需要购进一款汉王6800（或更高的级别的）扫描仪，随机赠送OCR软件。

它能够将扫描的文字直接导入到WORD中进行编辑。

Pdf转化word

1. 第一步：先用Adobe Reader打开想转换的PDF文件，接下来选择“文件→打印”菜单，在打开的“打印”窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”，确认后将该PDF文件输出为MDI格式的虚拟打印文件。

第二步：运行Microsoft Office Document Imaging，并利用它来打开刚才保存的MDI文件，选择“工具→将文本发送到Word”菜单，在弹出的窗口中选中“在输出时保持图片版式不变”，确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”，不管它，确认即可。

2. 情况一：如果pdf文档本身就是用pagemaker或word转换而来的（文字非常清晰锐利，很容易识别），那你就方便了。你可以先用acrobat打开，然后点文件——>；另存为——>；把他保存成rtf文档，这样将把所有的pdf页保存成rtf文档，在用word打开。注意最好保存成rtf文档，要不很有可能产生乱码。小技巧：如果你只想识别pdf文件中的其中几页，那你可以现把那几页另存为新的pdf文档，再进行识别。Ny1

情况二：如果你所得到的pdf文档是用扫描仪扫进去的图片转换的，那么就麻烦了，不过还是比手输入快多了，所以继续往下看。首先你用acrobat把pdf文件打开，然后点文件——>；另存为——>；把他保存成图片格式*.tiff（这是无压缩图片格式，以便识别），然后到网上下载文字识别软件，建议用尚书六号（现在好像出到七号了，很有名，随处都可以下到），安装好后，打开转换好的tiff图片，点击识别，看，文字出来了吧，尚书系列文字识别软件功能十分强大，你可以在里面把文字都编辑好了，再保存成rtf或txt文件，然后粘贴到word里就可以使用了，注意过滤回车符。

2.扫描的文字如何处理成WORD?在网上找到

文本的OCR识别是用户使用扫描仪产品最常见的应用之一，目前几乎所有的扫描仪产品都附带了OCR识别软件。

但我们在使用中发现，即使同一个OCR软件识别正确率的差距也较大。实际上，OCR识别正确率不仅与OCR软件本身有关，与使用方法的正确与否也有很大关系。

根据笔者平时积累的经验，做OCR识别应从以下几个方面入手。这里以MICROTEK扫描仪配备的《尚书六号》OCR为例。

一、扫描操作及注意点扫描仪联机在确定 MICROTEK扫描仪能够在被“Scanner Test”找到的条件下运行《尚书六号》OCR软件。然后点击“扫描”按扭。

片刻之后，扫描仪的控制窗口出现，在保证 “黑白两值”300 dpi的条件下，进行图像预览。以上步骤也可以通过MICROTEK扫描仪上的“OCR快捷键”实现。

目前，市场上的绝大部分MICOTEK扫描仪都配备了方便用户的快捷键。放大预览及调节图像的清晰度为了达到最佳的识别效果，对输入稿件在扫描时的最低要求是清晰。

为此，我们可以通过“放大预览”对文稿中的几个文字进行取样扫描，从而对图像的亮度进行更为细致的调节。调节的工具是扫描仪工具内的“阀值”。

以下是不同阀值下的扫描结果。调节到适当的阀值后，就可以选择“扫描”按扭了。

扫描的结果会传递到OCR软件内，同时扫描仪的控制窗口会自动消失。二、辨识前所需的注意事项当以上事项完成以后，我们所要做的就是在OCR软件中的实际操作了。

注意文字的倾斜校正由于OCR的辨识原理是采用字模的方式进行的，所以一定要注意稿件是否水平。具体实施过程中，可以采用图像倾斜校正按扭来解决。

对稿件进行识别的预先处理由于原稿的情况差异万千，所以我们在识别前，需做一些预先的处理。首先应该去除原稿中的杂点和图像。

文稿中如含有图像，OCR是不能识别的，图像的存在，会影响OCR的文字切分。操作中，可使用“图像的块擦拭”工具将文档中的图像去除，同时文稿中的一些杂点，也应尽量地去除。

针对文档中出现分栏的情况，建议您手动设定辨识范围，最好不要采用“自动切分”，只有这样才能保证辨识结果的连贯性。采用适当的辨识方式在具体的辨识中，还应注意您的稿件是横排还是竖排，由此选择正确的编排格式按扭，以保持对应。

目前的《尚书六号》OCR软件为用户提供了简体、繁体、英文等不同的识别方式，其选择是在窗口上的下拉菜单，而非按扭菜单。按扭中的简体、繁体、ENGLISH是《尚书六号》在不同的操作系统上获得正确显示的显示模式，千万不要搞混。

确认以上的步骤后，此时就可按下“识别”按扭，识别完毕后，系统进入“文稿校对界面”。三、文稿校对通常而言，OCR对不能完全确定的文字，会显示出兰色，请用户确认。

但值得注意的是，在没有提示出错的地方，也有可能出错，尤其是中文文本的英文单词，OCR一般会将其做中文识别，错误率几乎是百分之百。所以我们在校对时，可以先通读一遍，以此提高文字校对的效果。

我们可以在此界面内，通过操作系统提供的文字输入方法，添加您所需要的文字。 OCR提供选择使用外部编辑器的功能，我们可以选择WORD编辑器。

最后建议您在WORD内进行整个的文稿校对，并重新排版，以达到使用OCR的最佳效果。

3.如何将扫描的图片的文字变成Word的文字

——文字扫描。

首先，安装Microsoft office 2003

（仅以office 2003为例。其它版本office均可）

安装完成后，打开“开始→Microsoft

office→Microsoft office工具→Microsoft office

Document

Imaging”，如果该项未安装，系统则会自动安装。此时会弹出扫描新文件对话框，单击

[扫描仪]按钮，在弹出的对话框中选中摄像头，并选中“在扫描前显示扫描仪驱动”复选框，再选中

“黑白模式”，并选中“换页提示”和“扫描后查看文件”两项。

然后单击[扫描]按钮即可进行扫描，在扫描过程中会弹出一个对话框，选中[格式]按钮，然后在

“输出大小”中选择600*480分辨率，然后将文稿放平，反复调节摄像头的焦距和位置，使画面达到最佳

效果，点击[捕获]按钮即可得到图片画面，该图片会显示在“图例”框中，然后选中该图片，点击[发送]

按钮会开始扫描该图片中的文字，扫描完成后点[完成]按钮，然后系统会自动打开识别程序

Microsoft Office Document

Imaging，用该文件就可以识别了。完成后可以选中全文，鼠标右击后选中

“将文本发送到Word”项，则所选内容便会被Word打开并可以进行编辑了。

4.怎样把扫描好的户口页打印出实际大小

使用Photoshop软件可以把扫描好的户口页打印出实际大小，按照以下步骤即可：

1、在photoshop中打开此照片，双击图层解锁，快捷键Ctrl+R调出标尺栏。

2、将照片摆正，消除透视，从上方标尺栏拉出一条参考线到相片接缝处。快捷键Ctrl+T调出变形工具，旋转照片，接缝与参考线基本重合即可。

3、再从上方标尺栏拉出一条参考线到照片下端，从左方标尺栏拉出两条参考线到照片左右两侧。

4、快捷键Ctrl+T调出变形工具，再按住Ctrl键，拉变形框的四个角点，直到户口本页面四个角点与参考线四个角点重合。按参考线围成的方框裁剪照片。

5、新建：长143mm，高105mm（户口本内页尺寸），分辨率300像素，颜色模式CMYK。

6、将户口本页面复制到新建图片上，快捷键Ctrl+T调出变形工具，拉户口本页面右下角，直到户口本页面与新建白色图片重合，回车键确定。

7、最后将图片保存为JPG格式，打印即可。

5.怎样把扫描文件变成电子档案

首先你得先把这些打印稿或文件通过扫描仪扫到电脑上去，一般单位都有扫描仪，如果没有也没关系，用数码相机拍也行，拍成图片放到WORD里面去，不过在些之前，你还得装一下WORD自带的组件，03和07的都行。

点开始-程序-控制面板-添加/删除程序，找到Office-修改找到Microsoft Office Document Imaging 这个组件，Microsoft Office Document Imaging Writer 点在本机上运行，安装就可以了。首先将扫描仪安装好，接下来从开始菜单启动“Microsoft Office/ Microsoft Office 工具/Microsoft Office Document Scanning”即可开始扫描。

提示：Office 2003默认安装中并没有这个组件，如果你第一次使用这个功能可能会要求你插入Office2003的光盘进行安装。由于是文字扫描通常我们选择“黑白模式”，点击扫描，开始调用扫描仪自带的驱动进行扫描。

这里也要设置为“黑白模式”，建议分辨率为300dpi。扫描完毕后回将图片自动调入Office 2003种另外一个组件“Microsoft Office Document Imaging”中。

点击工具栏中的“使用OCR识别文字”按键，就开始对刚才扫描的文件进行识别了。按下“将文本发送到Word”按键即可将识别出来的文字转换到 Word中去了。

如果你要获取部分文字，只需要用鼠标框选所需文字，然后点击鼠标右键选择“将文本发送到Word”就将选中区域的文字发送到Word中了。此软件还有一小技巧：通过改变选项里的OCR语言，可以更准确的提取文字。

例如图片里为全英文，把OCR语言改为“英语”可以确保其准确率，而如果是“默认”则最终出现的可能是乱码~ 还有：应该说，PDF文档的规范性使得浏览者在阅读上方便了许多，但倘若要从里面提取些资料，实在是麻烦的可以。回忆起当初做毕业设计时规定的英文翻译，痛苦的要命，竟然傻到用Print Screen截取画面到画图板，再回粘到word中，够白了：（最近连做几份商务标书，从Honeywell本部获取的业绩资料全部是英文版的PDF，为了不再被折磨，花费了一个晚上的时间研究PDF和Word文件的转换，找到下面2种方法，出于无产阶级所谓的同甘共苦之心，共享下：） 1、实现工具：Office 2003中自带的Microsoft Office Document Imaging 应用情景：目前国外很多软件的支持信息都使用PDF方式进行发布，如果没有Adobe Reader，无法查看其内容，如果没有相关的编辑软件又无法编辑PDF文件。

转换为DOC格式则可以实现编辑功能。尽管有些软件也可以完成PDF转换为DOC的工作，但很多都不支持中文，我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。

使用方法：第一步：首先使用Adobe Reader打开待转换的PDF文件，接下来选择“文件→打印”菜单，在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”，确认后将该PDF文件输出为MDI格式的虚拟打印文件。编辑提示：如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项，那证明你在安装Office 2003的时候没有安装该组件，请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。

第二步：运行Microsoft Office Document Imaging，并利用它来打开刚才保存的MDI文件，选择“工具→将文本发送到Word”菜单，并在弹出的窗口中勾选“在输出时保持图片版式不变”，确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”，不管它，确认即可。

编辑提示：目前，包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美，而且转换后会丢失原来的排版格式，所以大家在转换后还需要手工对其进行后期排版和校对工作。 2、实现工具：Solid Converter PDF 应用情景：利用Office 2003中的Microsoft Office Document Imaging组件来实现PDF转Word文档在一定程度上的确可以实现PDF文档到Word文档的转换，但是对于很多“不规则”的PDF文档来说，利用上面的方法转换出来的Word文档中常常是乱码一片。

为了恢复PDF的原貌，推荐的这种软件可以很好地实现版式的完全保留，无需调整，而且可以调整成需要的样板形式。使用方法： 1、下载安装文件Solid Converter PDF，点击安装。

编辑提示：安装前有个下载安装插件的过程，因此需要保证网络连接通畅。 2、运行软件，按工具栏要求选择需要转换的PDF文档，点击右下的“转换”（Convert）按扭，选择自己需要的版式，根据提示完成转换..。