Глазурь и кофе

Новости со всего света

Редактировать отсканированные документы

by adminon 14.11.201814.11.2018

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке.

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.

Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования нам, конечно же, потребуется сканер. Его не обязательно покупать. Можно, например, на время взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканнер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла .jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование:

– запускаем драйвер сканера: Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

– открываем крышку сканера и кладем книгу, журнал или их копию текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Здесь очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом;

– выполним необходимые установки в драйвере сканнера. Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Предлагаю посмотреть на скриншот установок моего принтера:

Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый”, ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д. Выходной размер изображения – обязательно “А4”. Теперь можно смело жать на кнопку “Сканировать”. Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этап – распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader. . Пароль к архиву – diplomguide.ru. Предложенная мной версия не требует установки (portable). В папке с программой будет множество разных файлов, но Вам нужен только один – FineReader.exe. Двойной клик на этом файле запустит программу на Вашем компьютере.

Эта версия программы достаточно старая. Все скриншоты ниже я делал используя именно её. Если эта версия FineReader у вас не запускается — выберите более новую .

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть.

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно Мастер сохранения результатов. В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе.

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК. Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

Как отсканировать документ и распознать его в MS Word Рейтинг статьи: 4.23


Создание книжных изданий и журналов в цифровом формате для чтения возможно благодаря PDF-редакторам. Такое ПО превращает бумажные страницы в файл PDF. Представленные ниже программные продукты позволяют выполнить поставленную задачу. Применяя последние технологии, программы помогут получить отсканированное изображение с последующей цветокоррекцией или отображением текста из листа и его редактированием.

Adobe Acrobat

Продукт компании Adobe, предназначенный для создания PDF документов. Существует три версии программы, которые в определенной степени отличаются. К примеру, преобразование в формат для работы с Autodesk AutoCAD, создание цифровой подписи и совместный доступ с другими пользователями есть в премиум-версии, но отсутствуют в стандартной. Все инструменты группируются в конкретных рубриках меню, а сам интерфейс выдержан и минималистичен. Непосредственно в рабочей области вы сможете конвертировать PDF в DOCX и XLSX, а также сохранять веб-страницы как PDF-объект. Благодаря всему этому собрать собственное портфолио и настроить готовые рабочие шаблоны не составит проблем.

Читайте также: Программы для создания портфолио

ABBYY FineReader

Одно из самых известных приложений по распознаванию текста, которое позволяет сохранять его как PDF-документ. Программа распознает содержимое в PNG, JPG, PCX, DJVU, а сама оцифровка происходит сразу после открытия файла. Здесь можно редактировать документ и сохранить его в популярных форматах, к тому же, поддерживаются таблицы XLSX. Непосредственно из рабочей области FineReader подключаются принтеры для печати и сканеры для работы с бумагами и последующей их оцифровки. Софт универсальный и позволяет полностью обработать файл от бумажного листа до цифрового варианта.

Скан Корректор А4

Простая программа по коррекции отсканированных листов и изображений. В параметрах предоставляется изменение яркости, контрастности и цветового тона. К особенностям относится запоминание до десяти последовательно введенных изображений без сохранения их на компьютере. В рабочей области настраиваются границы формата А4, чтобы полностью отсканировать бумажный лист. Русскоязычный интерфейс программы будет легким в восприятии неопытными пользователями. ПО не устанавливается в систему, что позволяет использовать его, как портативную версию.

Итак, рассматриваемый софт дает возможность эффективно оцифровать фото для хранения на ПК или изменения цветового тона, а сканирование текста позволит конвертировать его из бумажного в электронный формат. Таким образом, программные продукты пригодятся в самых разных рабочих моментах.

Мы рады, что смогли помочь Вам в решении проблемы.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Статьи
0

Свежие записи

  • Вырастить сливу из косточки
  • Отключить мелодию гудка МТС
  • Навигатор как пользоваться
  • Фонд оплаты труда
  • Таблицы эксель с формулами
  • Манка в мультиварке
  • Как удалить фото фейсбук
  • Прозрачность в кореле 7
  • Фасоль замочить на ночь
  • Ссылка в контакте

Архивы

  • Март 2019
  • Февраль 2019
  • Январь 2019
  • Декабрь 2018
  • Ноябрь 2018
  • Октябрь 2018
  • Сентябрь 2018
  • Август 2018
  • Июль 2018
  • Июнь 2018
  • Май 2018
  • Апрель 2018
  • Март 2018
© Copyright 2019 Глазурь и кофе. All Rights Reserved. The Ultralight by Raratheme. Powered by WordPress .