|
|||
Практическое занятие № 11 «Обработка и анализ информации с применением программных средств и вычислительной техники»Стр 1 из 2Следующая ⇒ Практическое занятие № 11 «Обработка и анализ информации с применением программных средств и вычислительной техники» Цели занятия: 1. Овладеть приемами сканирования и распознавания текста с помощью он-лайн систем оптического распознавания символов. 2. Освоить технологию компьютерного перевода текста
Ход занятия 1. Изучите теоретическую часть 2. Выполните практическое задание 3. Оформите отчет о выполнении практического занятия. 4. Ответьте на контрольные вопросы Теоретическая часть Сканирование — аналого-цифровое преобразование плоского изображения в цифровую растровую форму с помощью сканера. Сканером называют механическое устройство, позволяющее преобразовывать различные объекты (текст, изображение, фото, документы) в цифровой формат (точнее, в картинку) с последующим их сохранением в памяти компьютерного устройства. Слово «сканер» пришло к нам из английского языка: scanner — от scan, что можно перевести как «пристально разглядывать, рассматривать». Оптическое распознавание символов (англ.optical character recognition, OCR) механический или электронный перевод изображений рукописного,машинописного или печатного текста в текстовые данные, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь.Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие не текстовые компоненты. Бесплатные он-лайн сервисы по распознаванию сканированного текста можно найти по следующим адресам: http://www.newocr.com/ http://www.ocrconvert.com/ http://www.onlineocr.net/ http://www.free-ocr.com/
|
|||
|