|
|||
Лекция. Информационно-поисковые системы.Стр 1 из 5Следующая ⇒ Лекция. Информационно-поисковые системы. Введение. Последние три десятилетия в области разработки информационных систем сформировалась новая информационная технология - технология БД. Она включает в себя методы, средства, способы и практические рекомендации применения БД в качестве основного компонента в различных информационных системах (ИС). Существуют разновидности информационных систем, использующие технологию БД: документальные (ДС) и фактографические (ФС). Документальные системы предназначены для работы с документами на естественном языке: книги, тезисы, статьи... Наиболее распространенным видом ДС явлюется информационно-поисковые системы (ИПС), которые предназначены для накопления и поиска по различным критериям документов. В состав ИПС входят: программные средства, поисковый массив документов и средства поддержки информационного языка этой системы. Программные средства ИПС служат для организации ввода и хранения информации, а также обр аботки пользовательских запросов на поиск документов. Поисковый массив документов обычно называютБД, и он не содержит текстов, а включает только библиографические сведения: рефераты и аннотации. При выполнении поиска документа используютпоисковые образы, отражающие содержание документа. Эти образы строятся путем индексирования документов и являются ключевыми словами поискового документа. Информационные языки (ИЯ) в ИПС строятся на базе ограниченных естественных языков. Это приводит к неоднозначной интерпретации смысла запросов. Для решения этой проблемы вводятся словари - тезаурусы. Они описывают лексические единицы языка и смысловые связи между ними. Наибольшим распространением для реализации таких ИЯ получили языкидескрипторного типа, которые в качестве лексических единиц или дескрипторов используют слова или словосочетания, соответствующие основным понятиям предметной области. Дескрипторы заносятся в тезаурус ИПС. Информационный запрос формируется на таком ИЯ, затем преобразуется впоисковый образ запроса (ПОЗ), ПОЗ сопоставляется с поисковыми образами документов по критерию смыслового соответствия, и в результате выдаются все документы, которые оказались релевантными этому запросу. Характерной особенностью фактографических систем является то, что они работают не с текстом, а с фактическими сведениями, которые представлены в виде записей.Основные компоненты ФС - это сами БД и системы управления БД (СУБД). На базе ФС создаются справочники, системы анализа и управления предприятиями, бухгалтерские системы. В дальнейшем будем рассматривать фактографические системы. СУБД должна предоставлять доступ к данным любым категориям пользователей, включая и тех, которые практически не имеют или не хотят иметь представления: - о физическом размещении в памяти данных и их описаний; - о механизмах поиска запрашиваемых данных; - о проблемах, возникающих при одновременном запросе одних и тех же данных многими пользователями (прикладными программами); - о способах обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа; - о поддержании баз данных в актуальном состоянии и множестве других функций СУБД.
|
|||
|