Хелпикс

Главная

Контакты

Случайная статья





Семинар 10



Семинар 10

Вопросы для обсуждения

1. Назовите и кратко охарактеризуйте уровни естественного языка, релевантныедля морфологического анализа и синтеза текста.

2. Дайте определения основным понятиям автоматического анализа текста:слово, словоформа, лемма, машинная основа, стемминг, частеречный тэгинг, парсер, тест Тьюринга.

3. Назовите и дайте краткую характеристику этапам автоматического анализа текста.

4. Назовите и дайте краткую характеристику этапам автоматического синтеза текста.

5. Охарактеризуйте системы компьютерного моделирования диалогов, в том числе роботы-автоответчики. Как происходит обучение роботов? Как распознать робот-автоответчик?

Рекомендуемая литература

1. Автоматическая обработка текстов на естественном языке и компьютернаялингвистика: учеб.пособие. М.: МИЭМ, 2011. С. 91—97, 106—111.

2. Баранов А.Н. Введение в прикладную лингвистику: учеб.пособие. 3-е изд.М.: ЛКИ, 2007. С. 20—25.

3. Всеволодова А.В. Компьютерная обработка лингвистических данных: учеб.пособие. 2-е изд., испр. М.: Флинта: Наука, 2007. С. 50—51, 66—67.

4. Зубов А.В., Зубова И.И. Информационные технологии в лингвистике:учеб.пособие. М.: Академия, 2004. С. 33—34.

Упражнения

1. Определите машинные основы следующих слов:

Слово Машинная основа Слово Машинная основа
семья окружать
весна сидеть
дело друг
пианино ты
стремительный желтый
развивать петь

2. Приведите примеры совпадения машинных основ для слов русского языкаи запишите их ниже:

• основе лож# соответствуют типовые парадигмы для описания словложь и ложиться:

3) Определите исходную форму выделенных словоформ в примере ниже. Какиевиды омонимии иллюстрирует данный текст?

Я траву косил косой.

Дождик вдруг пошел косой.

Бросил я тогда косить

И на Стешу стал косить.

Ну а Стеша, ох, краса,

Какогонъ её коса! (www.stihi.ru/2011/06/03/8515)

4) Выберите текст одного из СМИ на иностранном языке объемом до 1 страницыи составьте список слов для словаря словоформ. Укажите частотностьпоявления каждой словоформы в проанализированном тексте.

5) Опишите через элементарные семантические смыслы «сам», «кто-то»,«иметь», «заставлять», «переставать», «начинать» и «не» слова русскогоязыка: приобретать, утрачивать, сохранять, лишать.

6) Определите, какие фразы во фрагменте диалога ниже — собеседника Аили Б — смоделированы машиной. Приведите аргументы в пользу вашеговыбора.

АГоворите!

БМеня волнует погода.

АКак давно вас волнует погода?

БС тех пор, как умерла моя мать.

АРасскажите больше о Вашей семье.

БОни все в области компьютеров.

А Машины пугают вас.

БНет [пример цит. по: 4, 22].



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.