Хелпикс

Главная

Контакты

Случайная статья





Этапы сканирования и распознавание текста



Этапы сканирования и распознавание текста

Опуская процесс подготовки оригиналов, сам процесс сканирования и распознавания можно разделить на следующие этапы.

1. Выбор режима сканирования. Текстовый черно-белый документ, не содержащий картинок и иллюстраций, или же эти элементы так же черно-белые, достаточно выбрать режим черно-белого сканирования или в градациях серого. Однако если текст не черно-белый, присутствуют цветные элементы, картинки, графики, схемы, и нам нужно получить точную копию, режим сканирования должен быть соответствующим, то есть цветным. Если цветность копии не принципиальна, то можно ограничиться режимом сканирования в градациях серого.

2. Далее приступаем к распознаванию текста. Для начала с помощью специализированных программ анализируется структура документов. На этом этапе важен контроль специалиста, так как возможные ошибки на этом этапе потребуют серьезных усилий по их устранению в последствии.

Следующий этап - непосредственное распознавание текста. Этот процесс так же доверяем компьютерным программам. Однако для успешного распознавания и минимизации ошибок, специалист должен, прежде всего, правильно подготовить документ для распознавания, настроить оборудование для получения максимально качественной цифровой копии оригинала.

Свежеотпечатанный на принтере текст и старая газета с выцветшим шрифтом и пожелтевшей бумаге требуют к себе разного подхода на всех этапах сканирования и распознавания. Однако профессиональные опытные специалисты с помощью новейших программно-аппаратных средств отлично справляются с любыми задачами такого рода.

3. Проверка результата и устранение ошибок. После окончания процесса распознавания, не смотря на постоянно совершенствующееся программное обеспечение, получившийся результат необходимо проверить и откорректировать вручную. Чем хуже состояние оригинала, тем больше возникает ошибок и только человек может провести коррекцию и исправить все недочеты.

Далее происходит проверка на предмет синтаксических и орфографических ошибок, расставляются, по необходимости, знаки препинания и специальные символы.

4. И последний этап это форматирование документа. Проверяется и если нужно корректируется размер шрифта, стили заголовков и текста, разбивается на абзацы, главы, проверяется нумерация страниц и оглавление документа. Также проверяется общая структура документа и верстка. Графические элементы, картинки, графики, схемы и другие иллюстрации так же проходят проверку на предмет соответствия.

После проведения всех вышеописанных процедур, мы получаем точную и самое главное редактируемую копию оригинала. Теперь мы с легкостью можем вносить изменения, копировать и делится этим документом, получить необходимое количество твердых копий. На основании этого документа можно создавать свои собственные документы. При этом документ будет храниться, без риска быть испорченным, потерянным или украденным.

Отсканировав и распознав все свои документы, переведя в цифровой вид свою библиотеку, можно создать электронный архив, удобство использования которого трудно переоценить.

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.