|
|||
Особенности современного этапа развития автоматизированных ИПСОсобенности современного этапа развития автоматизированных ИПС Особенности поисковых систем интернета: w индексирование глубинного web (invisible web – информация, лежащая в сети и записанная в виде СУБД, а не HTML/XML кодом; формирует выдаваемые HTML-документы). w поиск по документам в специальном формате (doc, pdf, xls и др.). w учет языков (первоначальные ИПС были англоязычными; современные ИПС учитывают режимы работы на разных языках). на современном этапе появилась новая задача ИПС – морфологическая нормализация языков. w нетекстовые методы ранжирования документов (н-р, PageRank). w учет специфики сайта o справочные, энциклопедические сайты обычно помещаются на первые строки выдачи. w интеллектуализация поисковых систем (тезаурусы, онтологии, методы кластеризации и др.). w развитие языков запросов в сторону их упрощения (пользователь не использует дополнительные параметры расширенного поиска, поэтому часто определенные параметры установлены по умолчанию внутри данной ИПС). w попытка строить профиль пользователя. w 2 параллельные тенденции: o глобализация (внутри типичной ИПС можно найти практически любой документ) o специализация/локализация ИПС (н-р, поиск по типам).
Стратегии поиска w работа с запросами. w понимание задачи, которую решаешь. w понимание других ограничений (хронологических, языковых и др.). w понимание тематики запроса/ понимание вида информации (библиографическая/полнотекстовая/аналитическая). w поиск, направленный на полноту (синонимичность, отсутствие конкретики) и точность (узкий поиск/конкретные, специфические термины).
|
|||
|