|
|||
Этапы сканирования и распознавание текста ⇐ ПредыдущаяСтр 2 из 2 Этапы сканирования и распознавание текста Опуская процесс подготовки оригиналов, сам процесс сканирования и распознавания можно разделить на следующие этапы. 1. Выбор режима сканирования. Текстовый черно-белый документ, не содержащий картинок и иллюстраций, или же эти элементы так же черно-белые, достаточно выбрать режим черно-белого сканирования или в градациях серого. Однако если текст не черно-белый, присутствуют цветные элементы, картинки, графики, схемы, и нам нужно получить точную копию, режим сканирования должен быть соответствующим, то есть цветным. Если цветность копии не принципиальна, то можно ограничиться режимом сканирования в градациях серого. 2. Далее приступаем к распознаванию текста. Для начала с помощью специализированных программ анализируется структура документов. На этом этапе важен контроль специалиста, так как возможные ошибки на этом этапе потребуют серьезных усилий по их устранению в последствии. Следующий этап - непосредственное распознавание текста. Этот процесс так же доверяем компьютерным программам. Однако для успешного распознавания и минимизации ошибок, специалист должен, прежде всего, правильно подготовить документ для распознавания, настроить оборудование для получения максимально качественной цифровой копии оригинала. Свежеотпечатанный на принтере текст и старая газета с выцветшим шрифтом и пожелтевшей бумаге требуют к себе разного подхода на всех этапах сканирования и распознавания. Однако профессиональные опытные специалисты с помощью новейших программно-аппаратных средств отлично справляются с любыми задачами такого рода. 3. Проверка результата и устранение ошибок. После окончания процесса распознавания, не смотря на постоянно совершенствующееся программное обеспечение, получившийся результат необходимо проверить и откорректировать вручную. Чем хуже состояние оригинала, тем больше возникает ошибок и только человек может провести коррекцию и исправить все недочеты. Далее происходит проверка на предмет синтаксических и орфографических ошибок, расставляются, по необходимости, знаки препинания и специальные символы. 4. И последний этап это форматирование документа. Проверяется и если нужно корректируется размер шрифта, стили заголовков и текста, разбивается на абзацы, главы, проверяется нумерация страниц и оглавление документа. Также проверяется общая структура документа и верстка. Графические элементы, картинки, графики, схемы и другие иллюстрации так же проходят проверку на предмет соответствия. После проведения всех вышеописанных процедур, мы получаем точную и самое главное редактируемую копию оригинала. Теперь мы с легкостью можем вносить изменения, копировать и делится этим документом, получить необходимое количество твердых копий. На основании этого документа можно создавать свои собственные документы. При этом документ будет храниться, без риска быть испорченным, потерянным или украденным. Отсканировав и распознав все свои документы, переведя в цифровой вид свою библиотеку, можно создать электронный архив, удобство использования которого трудно переоценить.
|
|||
|