Хелпикс

Главная

Контакты

Случайная статья





Лекция. Информационно-поисковые системы.



Лекция. Информационно-поисковые системы.

Введение.

Последние три десятилетия в области разработки информационных систем сформировалась новая информационная технология - технология БД. Она включает в себя методы, средства, способы и практические рекомендации применения БД в качестве основного компонента в различных информационных системах (ИС). Существуют разновидности информационных систем, использующие технологию БД: документальные (ДС) и фактографические (ФС).

Документальные системы предназначены для работы с документами на естественном языке: книги, тезисы, статьи... Наиболее распространенным видом ДС явлюется информационно-поисковые системы (ИПС), которые предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят: программные средства, поисковый массив документов и средства поддержки информационного языка этой системы.

Программные средства ИПС служат для организации ввода и хранения информации, а также обр аботки пользовательских запросов на поиск документов. Поисковый массив документов обычно называютБД, и он не содержит текстов, а включает только библиографические сведения: рефераты и аннотации. При выполнении поиска документа используютпоисковые образы, отражающие содержание документа. Эти образы строятся путем индексирования документов и являются ключевыми словами поискового документа.

Информационные языки (ИЯ) в ИПС строятся на базе ограниченных естественных языков. Это приводит к неоднозначной интерпретации смысла запросов. Для решения этой проблемы вводятся словари - тезаурусы. Они описывают лексические единицы языка и смысловые связи между ними. Наибольшим распространением для реализации таких ИЯ получили языкидескрипторного типа, которые в качестве лексических единиц или дескрипторов используют слова или словосочетания, соответствующие основным понятиям предметной области. Дескрипторы заносятся в тезаурус ИПС.

Информационный запрос формируется на таком ИЯ, затем преобразуется впоисковый образ запроса (ПОЗ), ПОЗ сопоставляется с поисковыми образами документов по критерию смыслового соответствия, и в результате выдаются все документы, которые оказались релевантными этому запросу.

Характерной особенностью фактографических систем является то, что они работают не с текстом, а с фактическими сведениями, которые представлены в виде записей.Основные компоненты ФС - это сами БД и системы управления БД (СУБД). На базе ФС создаются справочники, системы анализа и управления предприятиями, бухгалтерские системы.

В дальнейшем будем рассматривать фактографические системы.

СУБД должна предоставлять доступ к данным любым категориям пользователей, включая и тех, которые практически не имеют или не хотят иметь представления:

- о физическом размещении в памяти данных и их описаний;

- о механизмах поиска запрашиваемых данных;

- о проблемах, возникающих при одновременном запросе одних и тех же данных многими пользователями (прикладными программами);

- о способах обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа;

- о поддержании баз данных в актуальном состоянии и множестве других функций СУБД.



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.