Хелпикс

Главная

Контакты

Случайная статья





Практическое занятие № 11 «Обработка и анализ информации с применением программных средств и вычислительной техники»



Практическое занятие № 11 «Обработка и анализ информации с применением программных средств и вычислительной техники»

Цели занятия: 1. Овладеть приемами сканирования и распознавания текста с помощью он-лайн систем оптического распознавания символов.

2. Освоить технологию компьютерного перевода текста

 

Ход занятия

1. Изучите теоретическую часть

2. Выполните практическое задание

3. Оформите отчет о выполнении практического занятия.

4. Ответьте на контрольные вопросы

Теоретическая часть

Сканирование — аналого-цифровое преобразование плоского изображения в цифровую растровую форму с помощью сканера.

Сканером называют механическое устройство, позволяющее преобразовывать различные объекты (текст, изображение, фото, документы) в цифровой формат (точнее, в картинку) с последующим их сохранением в памяти компьютерного устройства.

Слово «сканер» пришло к нам из английского языка: scanner — от scan, что можно перевести как «пристально разглядывать, рассматривать».

Оптическое распознавание символов (англ.optical character recognition, OCR) механический или электронный перевод изображений рукописного,машинописного

или печатного текста в текстовые данные, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь.

Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом.

В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие не текстовые компоненты.

Бесплатные он-лайн сервисы по распознаванию сканированного текста можно найти по следующим адресам:

http://www.newocr.com/

http://www.ocrconvert.com/

http://www.onlineocr.net/

http://www.free-ocr.com/

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.