Хелпикс

Главная

Контакты

Случайная статья





Особенности современного этапа развития автоматизированных ИПС



Особенности современного этапа развития автоматизированных ИПС

Особенности поисковых систем интернета:

w индексирование глубинного web (invisible web – информация, лежащая в сети и записанная в виде СУБД, а не HTML/XML кодом; формирует выдаваемые HTML-документы).

w поиск по документам в специальном формате (doc, pdf, xls и др.).

w учет языков (первоначальные ИПС были англоязычными; современные ИПС учитывают режимы работы на разных языках).

на современном этапе появилась новая задача ИПС – морфологическая нормализация языков.

w нетекстовые методы ранжирования документов (н-р, PageRank).

w учет специфики сайта

o справочные, энциклопедические сайты обычно помещаются на первые строки выдачи.

w интеллектуализация поисковых систем (тезаурусы, онтологии, методы кластеризации и др.).

w развитие языков запросов в сторону их упрощения (пользователь не использует дополнительные параметры расширенного поиска, поэтому часто определенные параметры установлены по умолчанию внутри данной ИПС).

w попытка строить профиль пользователя.

w 2 параллельные тенденции:

o глобализация (внутри типичной ИПС можно найти практически любой документ)

o специализация/локализация ИПС (н-р, поиск по типам).

 

Стратегии поиска

w работа с запросами.

w понимание задачи, которую решаешь.

w понимание других ограничений (хронологических, языковых и др.).

w понимание тематики запроса/ понимание вида информации (библиографическая/полнотекстовая/аналитическая).

w поиск, направленный на полноту (синонимичность, отсутствие конкретики) и точность (узкий поиск/конкретные, специфические термины).



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.