Технология распознавания текста

Выполненные задания отправлять на электронную почту chikisheva@i.ua,
или страницу ВКонтакте https://vk.com/chikisheva1989,

Индивидуальные консультации, оценивание устных ответов по тел. 0721297530, 0669911714. Чикишева Наталья Николаевна

Дата	01 февраля 2021 г.
№ занятия по расписанию
Группа	2 жз
Учебная дисциплина	Технология электронной верстки текста
№ занятия по плану
Тема	Технология распознавания текста
Домашнее задание. Форма выполнения. Источник информации	Прочитать теоретические сведения по теме, законспектировать
Срок предоставления выполненного задания	05 февраля 2021 г.

Теоретические сведения по теме

Технология распознавания текста

Сложность машинного распознавания текстов заключается в том, что его невозможно построить по жесткому алгоритму хотя бы потому, что для написания одной д той же буквы существует множество вариантов написания. Значит, чтобы компьютер корректно прочитал символы, он должен их «осмыслить». Иными словами, для распознавания текста требуется моделирование рассуждений человека в подобной ситуации, а это принято обозначать термином «искусственный интеллект». Впервые они были сформулированы и применены на практике в конце 80-х гг. XX в. А. Шамисом в системе распознавания «Графит».

Исходя из принципа целостности распознаваемое изображение рассматривается как единый объект, состоящий из частей, связанных между собой пространственными соотношениями.

По принципу целенаправленности распознавание строится как процесс выдвижения и целенаправленной проверки гипотез об объекте, а принцип адаптивности подразумевает способность системы к самообучению. Каким образом строится распознавание символов? Для выдвижения гипотез о том, что может представлять собой изображение, применяются так называемые признаковые классификаторы. Они используют ряд признаков, на основе которых программа вычисляет степень близости распознаваемого изображения и известных ей классов изображений, после чего выдает список подходящих классов, т. е. гипотезу о принадлежности объекта к тому или иному классу. Кроме того, признаковые классификаторы применяются также и для повышения точности распознавания изображений с дефектами. Полученный набор классов последовательно проверяется структурным классификатором, анализирующим каждый символ. Скажем, если FineReader полагает, что на странице изображена буква «Ф», он специально проверяет те признаки, которые должны быть именно у буквы «Ф», а не у какой-либо другой, сравнивая этот символ со структурным эталоном. Структурный эталон описывает символ как комбинацию структурных элементов (отрезок, дуга, кольцо, точка), находящихся в определенных отношениях между собой.

Процесс распознавания делится на этапы выделения структурных элементов в изображении и сопоставлении их с эталоном. Если в окончательный список попало более одной гипотезы, они попарно сравниваются с помощью дифференциальных классификаторов. Если структурный классификатор при распознавании символов не может однозначно выбрать одну из двух букв с похожим написанием, то между этими конкурирующими гипотезами делается дифференциальный выбор. Например, есть две гипотезы: распознаваемый символ представляет собой строчную букву «твердый знак» или «мягкий знак». Чтобы сделать выбор, FineReader целенаправленно проанализирует левый верхний угол буквы, где имеется единственная отличительная деталь между этими буквами.

С завершением работы дифференциального классификатора заканчивается распознавание и начинается этап проверки итогового списка гипотез. Окончательная стадия распознавания осуществляется системой контекста — при наличии некоторого количества распознанных букв из слова программа, используя словарь, может «догадаться», что это за слово. Базовые принципы целостности, целенаправленности и адаптации остаются неизменными от версии к версии программы FineReader, ведь именно они позволяют компьютеру приблизиться к логике мышления человека.

Обработка изображения системой ABBYY FineReader включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы (определение областей распознавания, таблиц, картинок, выделение в тексте строк и отдельных символов) и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.

Распознавание изображения осуществляется на основе технологии «целостного целенаправленного адаптивного распознавания».

· целостность – объект описывается как целое с помощью значимых элементов и отношений между ними;

· целенаправленность – распознавание строится как процесс выдвижения и целенаправленной проверки гипотез;

· адаптивность – способность OCR-системы к самообучению.