Лингвистические исследования. Использование корпусов
Лингвистические исследования. Использование корпусов
Корпусная лингвистика
Пользователи корпусов
Пользователей корпусов, как правило, интересует не содержание конкретных текстов, а их метатекстовая информация и примеры (контексты) употребления тех или иных языковых элементов и конструкций.
- Лингвисты-теоретики: корпусы как экспериментальная база для проверки гипотез и доказательства теорий.
- Прикладные лингвисты различного профиля.
- Лексикографы.
- Преподаватели: корпусы как база при обучении языкам.
- Компьютерные лингвисты: выявление статистических и других закономерностей для создания и отладки компьютерных моделей языка.
- Другие специалисты по языку (литературоведы, редакторы, специалисты по рекламе).
- Специалисты по общественным наукам (историки, социологи и др.).
Корпусы дают
- реальные контексты;
- реальные статистические данные (на больших объемах текстов);
- сочетаемость (коллокации);
- категоризацию языкового материала;
- проекции языка на различные подъязыки.
Корпусы как средство изучения языка и развития лингвистической теории
- Фонетика и фонология (корпуса устной речи);
- морфология;
- словообразование;
- словоизменение;
- лексикология;
- фразеология;
- парадигматика в широком смысле;
- синтагматика (коллокации, словосочетания);
- синтаксис;
- синтаксис связного текста;
- семантика;
- стилистика;
- прагматика.
Прикладные задачи
- Лексикография;
- подготовка учебной литературы;
- преподавание языков;
- самостоятельное изучение языков;
- справки по правописанию;
- языковая политика;
- сохранение языкового наследия;
- машинный перевод;
- информационный поиск;
- распознавание речи;
- распознавание текста;
- тестирование и отладка систем автоматизированной обработки текста (NLP).
Примеры решения лингвистических задач на базе корпусов (1)
|