Сканирование документа в word. Как вставить отсканированный текст или изображения в Word. Как конвертировать отсканированный документ в формат Microsoft Word

При работе с текстовыми документами очень часто возникает необходимость набирать текст с уже распечатанного документа. Подобная работа не очень приятная и отнимает много времени.

К счастью, сейчас существуют программы, которые позволяют значительно упростить и ускорить решения подобных задач. С помощью этих программ можно быстро перевести отсканированный документ в формат текстового редактора Word и избежать рутинной работы по набору текста.

В данной статье мы продемонстрируем, как это делается на примере программы ABBY Finereader 12 Professional. Если у вас нет именно такой программы, то вы можете заменить ее другой версией ABBY Finereader либо совершенно другой программой от другого разработчика. Например, вы можете использовать программы CuneiForm, Free OCR, Readiris Pro или SimpleOCR.

Шаг № 1. Запускаем ABBY Finereader и открываем отсканированный документ.

Первым делом нужно запустить программу ABBY Finereader. После запуска программы нужно нажать на кнопку «Открыть» на панели инструментов.

После этого появится окно для открытия отсканированного документа. Выберите изображение или несколько изображений и нажмите на кнопку «Открыть».

Кроме этого, вместо использования кнопки «Открыть» вы можете просто перетащить отсканированные изображения в программу ABBY Finereader.

Шаг № 2. Ждем пока ABBY Finereader проанализирует выбранные изображение.

Дальше нужно подождать, пока программа ABBY Finereader проанализирует выбранные вами изображение и распознает на них текст. Время необходимое на анализ зависит от количества выбранных изображений и производительности вашего компьютера.

Когда анализ изображений будет завершен, появится сообщение с кнопкой «Закрыть».

Нажмите на кнопку «Закрыть» и переходите к следующему шагу.

Шаг № 3. Переведите отсканированный документ в формат Word.

После завершения анализа, отсканированный документ можно перевести в формат Word. Для этого в программе ABBY Finereader есть кнопка «Сохранить».

После нажатия на кнопку «Сохранить» появится окно для сохранения отсканированного документа в текстовом формате. При этом вы можете выбрать один из множества текстовых форматов (DOC, DOCX, RTF, ODT, PDF, HTM, TXT, XLS, XLSX, PPTX, CSV, FB2, EPUB, DJVU). Для того чтобы без проблем отредактировать документ в редакторе Word выберите формат «Документ Microsoft Word 97-2003 (*.doc)» либо формат «Документ Microsoft Word (*.docx)».

После сохранения документа в формате Word откроется текстовый редактор, и вы сможете начать редактировать отсканированный документ.

Что делать если нет возможности установить программу?

Если у вас нет возможности установить описанные выше программы, то вы можете воспользоваться онлайн аналогами. Наиболее продвинутым онлайн сервисом такого рода является . Данный сервис позволяет перевести отсканированный документ в формат Word, а также в другие популярные текстовые форматы.

К недостаткам ABBY Finereader Online можно отнести то, что данный онлайн сервис требует регистрации и бесплатно обрабатывает только 10 страниц отсканированного текста. Для обработки большего количества страниц нужно покупать подписку, которая стоит от 5 долларов в месяц.

Те люди, которые активно работают с документами и прочей текстовой информацией, однозначно видят необходимость в сканировании различных материалов. Важно помнить о том, что для получения качественных документов наличие сканера и вовсе не обсуждается. Однако в определенных ситуациях может сгодиться и фотография необходимого текста, однако снимок также должен отличаться высоким качеством.

Как отсканировать документ в Word

  • В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
  • Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
  • Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
  • Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
  • Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
  • В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
  • Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.


В итоге документ можно свободно редактировать прямо в офисном пакете MS Office. Важно отметить, что при распознавании документа прямо в Word, форматирование происходит еще проще, так как функционал единый, как для исходных документов, так и для распознаваемых.

Что касается распознавания с фотографий или других материалов, то здесь не так уж просто получить высокое качество распознавания, так как речь идет о смещенных полях, отступах и прочих деталях документов, на исправление которых придется потратить немало времени.

Мы так делать не будем.:-)

Мы
напишем простой макрос для сканирования,
сделаем кнопку для него и, мало того,
еще и подпишем наш макрос цифровой подписью!

Даже те, кто не знает, что это такое, быстро все усвоят. Вперед!

1Пишем макрос.

  • Итак, открываем Word, заходим в " Файл- > Параметры -> Настройки ленты"
  • Включаем вкладку "Разработчик" в окне справа, поставив галку
  • Закрываем настройки ленты. В появившейся вкладке "Разработчик" жмем кнопку "Макросы" (слева вторая), откроется мастер добавления нового макроса
  • Внизу в окне " Макросы из: " выбираем макросы из Normal.dot (общего шаблона) для того чтобы и в других документах он был
  • Жмем "Создать" , откроется редактор VisualBasic
  • Заменяем этим кодом все строчки

Для Word 2010 код такой:


Sub InsertFromScanner()
On Error Resume Next
WordBasic.InsertImagerScan
End Sub

Для Word 2013,2016 код такой (для 64х см. комментарий в начале ):


" Scan for Word 2013
"

" ----------------------
" For 64-bit app need declare with
PtrSafe key:
" Private Declare PtrSafe Function GetTempPath Lib "kernel32"....

Private Declare Function GetTempPath Lib "kernel32" Alias "GetTempPathA" (ByVal nBufferLength As Long, ByVal lpBuffer As String) As Long

Private Function TempPath() As String
Const MaxPathLen = 256 " Max path length
Dim FolderName As String " Folder name
Dim ReturnVar As Long " Return Value
FolderName = String(MaxPathLen, 0)
ReturnVar = GetTempPath(MaxPathLen, FolderName)
If ReturnVar <> 0 Then
TempPath = Left(FolderName, InStr(FolderName, Chr(0)) - 1)
Else
TempPath = vbNullString
End If
End Function

Sub Scan()
"
" Scan Macro, to be invoked in Word
"
On Error Resume Next
Dim objCommonDialog As WIA.CommonDialog
Dim objImage As WIA.ImageFile
Dim strDateiname
" instantiate Scan WIA objects
Set objCommonDialog = New WIA.CommonDialog
Set objImage = objCommonDialog.ShowAcquireImage
strDateiname = TempPath & "Scan.jpg" " set temporary file
If Not objImage Is Nothing Then
Kill strDateiname
objImage.SaveFile strDateiname " save into temp file
Selection.InlineShapes.AddPicture strDateiname " insert in doc
Set objImage = Nothing
End If
Set objCommonDialog = Nothing
" MsgBox strDateiname " test output
End Sub

Что бы избежать ошибки при компиляции, нужно подключить библиотеку Microsoft WIA (в меню: Tools/Preferences), выделенная строка на рисунке ниже:


  • Заходим снова в настройки ленты, жмем кнопку "Создать вкладку" , и жмем кнопку "Создать группу". Можете переименовать их по своему выбору, у меня -"Разное".
  • В левой панели "Выбрать команды:" ищем "макросы" и добавляем наш созданный макрос в новую пользовательскую группу.

Все. Жмем ок . Теперь при открытии вкладки "Разное" у вас есть вот такая кнопка:


Теперь кнопка может работать. Но может и ругнуться, если у вас отключены макрос ы в политике безопасности. Откройте "Разработчик->Безопасность макрос ов" и можете включить макрос ы как на рис. (стрелка 3.)
Все, "Кнопка" работает!
Но так оставлять не рекомендуется!
А для тех кому немного важна безопасность, следующий пункт.

3. Сертифицируем для локального пользователя.
Но пойдем дальше и отключим "все макросы, кроме макросов с цифровой подписью"!
Приступим:
Опять открываем "Разработчик->Visual Basic" , в меню ищем "Tools->Digital signature.." , откроется окошко "Цифровая подпись" , как видите там пусто.


Нажав выбор, видим:

Это потому, что на компьютере нет пользовательских сертификатов для VBA проектов MS Office.
Надо бы сделать…
Запускаем "Средство создания цифровых сертификатов для проектов VBA" из пакета программ MS Office. Запускаем и создаем сертификат, я его назвал "Local VBA cert" .
(Примечание: если данное средство недоступно, воспользуйтесь программой
"C:\Program Files\Microsoft Office\Office15\SELFCERT.EXE " или
"C:\Program Files\Microsoft Office\root\Office16\SELFCERT.EXE")

В меню "Tools->Digital signature..", в окошке "Цифровая подпись" жмем кнопку "Выбрать".

Вуаля, найдется наш сертификат:


Казалось бы все, но нет! Жмем "подробности" в окне "Цифровая подпись" и убеждаемся, что доверия к сертификату пока нет:
Будем делать так, как подсказывает наша совесть - доверять. Жмем Win+R и запускаем оснастку управления сертификатами "certmgr.msc" .
Открываем "Личное->Сертификаты" , находим наш "Local VBA cert" и копируем его в два места:
"Доверенные корневые центры сертификации" и в "Доверенные издатели" .

Теперь закрываем оснастку управления сертификатами.
Откройте "Разработчик->Безопасность макросов".
Сертификат будет виден в надежных издателях.

Можете "отключить все макросы, кроме макросов с цифровой подписью" как на рис. в пункте 2 ., если конечно уже это не сделали. :-)
Перезапускаем Word.

Все готово!

PS: если меняете что-то в коде макроса, не забывайте обновить созданную кнопку.

16.02.2018

Как правильно организовать переезд?

25.12.2017

Как установить пластиковые окна своими руками

06.09.2017

Электронную версию бумажного документа можно получить путем его сканирования. Формат сканированных документов может быть различным, но наиболее распространенным считается pdf. Файлы, записанные в этом формате, легко открыть с помощью любого редактора для просмотра изображений, однако изменить полученный документ невозможно. Сканировать документ в pdf можно с помощью любого офисного или профессионального устройства, предназначенного для перевода бумажных копий в электронный вид. Как правило, настройки сканера, выставленные по умолчанию, предполагают сохранения копии именно в этом формате. Полученный файл имеет небольшой объем, его легко можно передать по электронной почте, записать на флешку или CD диск.

Формат сканированных документов pdf: история развития

Впервые формат появился в 1993 году и на начальном этапе не имел широкого распространения. Программы, с помощью которых можно было работать с документами pdf, были платными, вследствие чего тормозилось дальнейшее развитие формата. С течением времени появились платформы для бесплатной работы с файлами pdf и постепенно формату удалось получить заслуженное признание и распространение. Сегодня pdf формат сканированных документов является самым распространенным в мире.

Сканировать документы в ворд: что делать, когда pdf не подходит

Однако не всегда сканировать документ в pdf удобно. Если требуется не только получить электронную копию документа для просмотра, но также отредактировать ее или внести изменения и правки, данный формат не подходит. В этом случае гораздо удобнее сканировать документ в ворд - текстовый редактор, с помощью которого можно легко выполнить все необходимые действия с исходником.

Получить электронную версию бумажного документа, доступную для редактирования, можно в два этапа:

  • сканировать документ в pdf,
  • с помощью специальных программ перевести полученный файл в ворд.

Такой способ является оптимальным и простым, именно им чаще всего пользуются в копировальных центрах, когда требуется сканировать документ в ворд .

Как перевести документ из pdf в ворд

В настоящее время существует ряд онлайн сервисов для конвертации документа из pdf в word, однако работа с ними не всегда удобна, есть ограничения по количеству бесплатных операций, при распознавании текста велик процент ошибок.

Лучшим вариантом программы для перевода файлов из pdf в word является стационарная бесплатная программа FineReader. С ее помощью можно легко перевести любой отсканированный файл в текстовый формат. Однако, несмотря на то, что данный программный продукт хорошо распознает текст, полученный документ нужно обязательно проверить на предмет возможных ошибок.

Сканирование широкоформатных документов в копировальном центре

Документы формата А4 могут быть переведены в электронный вид с последующей конвертацией в формат doc с помощью обычного офисного сканера и компьютера. Чертежи и проектные документы отсканировать можно только на специальном оборудовании в копировальном центре. Здесь же можно выполнить оцифровку чертежей, в результате которой технические документы переводятся в доступный для редактирования формат и в них также можно вносить изменения. Обращаться в копировальный центр имеет смысл и при больших объемах сканирования документов стандартного формата А4. Специалисты сделают все быстро и без ошибок.

Перед тем, как передать документы для сканирования в копицентр, их необходимо подготовить: удалить все скрепки, пружины и другие посторонние предметы, которые могут помешать сканированию. Если делать это самостоятельно времени нет, можно заказать соответствующую услугу в копировальном центре.

Сканировать можно не только черно-белые документы, но и цветные. При этом качество профессионального скана всегда будет выше, чем сделанного с помощью обычного офисного оборудования.

В копицентре заказчику доступен полный комплекс услуг печати и обработки документов любых форматов.

С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

Узнать все этапы проведения данной процедуры можно в представленной статье.

Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

Работа с документом в FineReader

FineReader – наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

Ее преимуществами также можно назвать:


Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

Загрузка и сканирование

Самым первым этапом работы в FineReader является загрузка и сканирование файла.

Для запуска процесса:



Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.
Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

Удаление форматирования из документа

Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

Видео: Как изображение перевести в Microsoft Word

Редактирование

Чтобы выделить какую-либо область требуется выполнить следующие действия:

  1. кликнуть мышью по кнопке «Выделить область Текст»;
  2. нажатой левой кнопкой обвести границы текстового блока в рамку.

А чтобы выделить картинку или таблицу потребуется:

  • выбрать кнопку «Выделить область Картинка» или же «Выделить область Таблица»;
  • точно также обвести границы блока также левой кнопкой мыши.

Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

Конвертирование в формат Word

После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

Завершающее редактирование отсканированного документа в Ворде

После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.

Программа FineReader позволяет пользователям существенно экономить свое время при обработке текста, таблиц или картинок с бумажного носителя. Для того чтобы действительно оценить все преимущества работы с ней, можно скачать бесплатную пробную версию программы на пятнадцать дней на официальном сайте.

>
КАТЕГОРИИ

ПОПУЛЯРНЫЕ СТАТЬИ

© 2024 «minomin.ru» — Сайт о компьютерах, и работе в интернете