|
||||||||||||||||||||||||||||||
Семинар 10Семинар 10 Вопросы для обсуждения 1. Назовите и кратко охарактеризуйте уровни естественного языка, релевантныедля морфологического анализа и синтеза текста. 2. Дайте определения основным понятиям автоматического анализа текста:слово, словоформа, лемма, машинная основа, стемминг, частеречный тэгинг, парсер, тест Тьюринга. 3. Назовите и дайте краткую характеристику этапам автоматического анализа текста. 4. Назовите и дайте краткую характеристику этапам автоматического синтеза текста. 5. Охарактеризуйте системы компьютерного моделирования диалогов, в том числе роботы-автоответчики. Как происходит обучение роботов? Как распознать робот-автоответчик? Рекомендуемая литература 1. Автоматическая обработка текстов на естественном языке и компьютернаялингвистика: учеб.пособие. М.: МИЭМ, 2011. С. 91—97, 106—111. 2. Баранов А.Н. Введение в прикладную лингвистику: учеб.пособие. 3-е изд.М.: ЛКИ, 2007. С. 20—25. 3. Всеволодова А.В. Компьютерная обработка лингвистических данных: учеб.пособие. 2-е изд., испр. М.: Флинта: Наука, 2007. С. 50—51, 66—67. 4. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике:учеб.пособие. М.: Академия, 2004. С. 33—34. Упражнения 1. Определите машинные основы следующих слов:
2. Приведите примеры совпадения машинных основ для слов русского языкаи запишите их ниже: • основе лож# соответствуют типовые парадигмы для описания словложь и ложиться: 3) Определите исходную форму выделенных словоформ в примере ниже. Какиевиды омонимии иллюстрирует данный текст? Я траву косил косой. Дождик вдруг пошел косой. Бросил я тогда косить И на Стешу стал косить. Ну а Стеша, ох, краса, Какогонъ её коса! (www.stihi.ru/2011/06/03/8515) 4) Выберите текст одного из СМИ на иностранном языке объемом до 1 страницыи составьте список слов для словаря словоформ. Укажите частотностьпоявления каждой словоформы в проанализированном тексте. 5) Опишите через элементарные семантические смыслы «сам», «кто-то»,«иметь», «заставлять», «переставать», «начинать» и «не» слова русскогоязыка: приобретать, утрачивать, сохранять, лишать. 6) Определите, какие фразы во фрагменте диалога ниже — собеседника Аили Б — смоделированы машиной. Приведите аргументы в пользу вашеговыбора. АГоворите! БМеня волнует погода. АКак давно вас волнует погода? БС тех пор, как умерла моя мать. АРасскажите больше о Вашей семье. БОни все в области компьютеров. А Машины пугают вас. БНет [пример цит. по: 4, 22].
|
||||||||||||||||||||||||||||||
|