Хелпикс

Главная

Контакты

Случайная статья





МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ



МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Севастопольский государственный университет

Институт общественных наук и международных отношений

Кафедра Теория и практика перевода

 

Реферат

По дисциплине «Теория языкознания»

 

Тема: «Реконструкция слов и их значений»

 

Студентка группы Л/б-19-2-о

Кафедры Теория и практика перевода

Сокольских Диана Денисовна

Проверила доктор филологических наук, профессор кафедры «Теория и практика перевода» Комуцци Л.В.

 

Севастополь - 2020

Содержание

 

 

Введение. Основные сведения об авторе                                            3

Глава 1. Некоторые проблемы современной лингвистики           5

1.1 Первая проблема.                                                                              5

1.2 Вторая проблема.                                                                              7

1.3 Третья проблема.                                                                               8

1.4 Четвертая проблема.                                                                          9

1.5 Пятая проблема.                                                                              11

1.6 Шестая проблема.                                                                            13

1.7 Седьмая проблема.                                                                          14

Глава 2. Реконструкция слов и их значений.                                   18

2.1 Введение.                                                                                          18

2.2 Статическая концепция семантики                                                  19

2.3 Противоположные понимания в литературе                                 20

2.4 Этимологическое значение слова                                                   23

Заключение                                                                                                25

Список литературы                                                                                  26


Введение. Основные сведения об авторе

 

     Олег Николаевич Трубачёв — советский и российский лингвист-славист, исследователь этимологии славянских языков и славянской ономастики; специалист в области сравнительно-исторического языкознания, лексикограф. Доктор филологических наук, член-корреспондент АН СССР (1972), академик РАН (1992). 1947 —1952 — студент филологического факультета Днепропетровского университета. Кафедра русского языка, научный руководитель — Я. А. Спринчак, специалист по русскому историческому синтаксису. В дипломе О. Трубачёва проставлена специальность «филолог (русский язык и литература)», он оканчивал университет уже славистом, представив две дипломные работы: основную — «Общеславянская лексика в основном словарном фонде русского языка» и дополнительную — о болгарском возрождении (Христо Ботев, Иван Вазов).

     По окончании Днепропетровского университета О. Трубачёва пригласили в Москву, в иностранный отдел газеты «Комсомольская правда» и в Антифашистский комитет советской молодёжи. Будучи сотрудником молодёжной газеты и Антифашистского комитета, он в качестве переводчика принял участие во Всемирном фестивале молодёжи и студентов в Австрии. В то время на Пречистенке, рядом с Антифашистским комитетом, располагался и Институт славяноведения АН СССР, и Олег Николаевич поступил туда в аспирантуру (вначале — заочную), начав заниматься научными проблемами. 1952—1953 — референт Антифашистского комитета советской молодёжи. 1953 — аспирантура в Институте славяноведения, с этого времени этимология становится доминирующим направлением деятельности О. Н. Трубачёва — и в качестве цели, и одновременно в качестве основного инструментария исследования. Будучи сотрудником московской редакции «Комсомольской правды», он числился в заочной аспирантуре.

     Олег Николаевич проходил аспирантуру, а затем до 1961 года работал под руководством проф. С. Б. Бернштейна — крупного слависта и опытного педагога. В период послевоенного подъёма сравнительно-исторического языкознания, в том числе славянского, в советской лингвистике, Трубачёв встал в ряд таких признанных специалистов в славистике, балтистике и индоевропеистике, как В. Н. Топоров, Вяч. Вс. Иванов, Н. И. Толстой, В. М. Иллич-Свитыч, В. А. Дыбо, А. А. Зализняк. О. Н. Трубачёва отличали работоспособность, пунктуальность и знание многих языков: уже в молодости он говорил на основных европейских и славянских языках, знал на уровне текста и сравнительной грамматики практически все древние индоевропейские языки, строил свои исследования, привлекая огромное количество фактического материала и научной литературы. 1958 — кандидат филологических наук, диссертация «История славянских терминов родства и некоторых древнейших терминов общественного строя». С 1958 года принимал участие во всех международных съездах славистов.

     С 1960 — член Советского комитета славистов; в 1996—2002 годах председатель Национального комитета славистов России. С 1963 — ответственный редактор непериодической серии «Этимология». 1966 — доктор филологических наук, диссертация «Ремесленная терминология в славянских языках». В 1966 году избран членом Международного комитета ономастических наук; назначен заместителем директора Института русского языка АН СССР, заведующий сектором этимологии и ономастики. 1970 — награждён медалью «За доблестный труд. В ознаменование 100-летия со дня рождения Владимира Ильича Ленина». С 28 ноября 1972 года член-корреспондент АН СССР по Отделению литературы и языка (языкознание). 1975 — награждён орденом «Знак Почёта».

     1980 — избран членом-корреспондентом Финно-угорского общества Финляндия. 1983 — избран членом-корреспондентом Академии наук и искусств Загреб, Югославия. С 1987 — член Научного совета по проблемам русской культуры АН СССР (РАН). 11 июня 1992 года — избран академиком РАН по Отделению литературы и языка. 1994 — награждён золотой медалью им. В. И. Даля РАН «за фундаментальный лексикографический труд „Этимологический словарь славянских языков (праславянский лексический фонд)“». 2001 — стал лауреатом премии имени А. С. Пушкина РАН «за работу „Этногенез и культура древнейших славян. Лингвистические исследования“». 2002 — Умер 9 марта, похоронен на Троекуровском кладбище. Супруга — лексикограф Г. А. Богатова (род. 1930).


 

Глава 1. Некоторые проблемы современной лингвистики

 

1.1 Первая проблема.

 

     Формальное описание языковой интуиции человека. Каждый человек, владеющий хотя бы одним родным языком, интуитивно знаком с общими особенностями, присущими любому языку. Поэтому он часто может понять неточные и неясные формулировки обычных описаний языков; эти описания строятся в расчете на интуицию (чутье) человека. Но такой интуиции нет у технических средств связи, передающих речевые сообщения, и у машин, которые должны, например, переводить с одного языка на другой или распознавать звуки речи.

     Отсюда возникает задача исследования основных исходных предпосылок и общих правил операций над языком, обычно остающихся неосознанными у человека (в том числе и у лингвиста). Ни один человек не помнит времени, когда он обучался родному языку, т. е. когда в нем начала формироваться основная программа, которая автоматически определила его поведение по отношению к языку на протяжении всей его жизни. И перед лингвистикой стоит задача — исследовать элементарные составные части и общее устройство бессознательных программ поведения.

     В качестве примера точного исследования языковой интуиции человека можно указать на предложенные Ιί. Шенноном 1 и A. H. Колмогоровым 1 2 методы оценки энтропии речи * при помощи опытов по угадыванию текста. Эти методы основаны на том, что всякий человек, владеющий языком, тем самым обладает бессознательными сведениями об устройстве языка. Поскольку эти сведения являются бессознательными, их нельзя выявить прямыми вопросами. Но человеку можно задавать косвенные вопросы, предлагая ему угадать N-ю букву текста, сообщив предварительно N — 1 предшествующих букв. В результате обработки достаточного числа этих естественнонаучных экспериментов можно получить такие объективные оценки статистических особенностей языка и языковых текстов, которые не связаны с психологическими характеристиками испытуемых.

     Аналогичным образом данные, полученные с помощью языковой интуиции, можно использовать для грамматической классификации форм слов языка. Исследователь, изучающий родной язык, может обычно интуитивно определить, какие предложения родного языка являются грамматически правильными, какие — неправильными 3. При этом грамматически правильные предложения могут быть осмысленными (напр., Гора родила мышь) или бессмысленными, заумными (напр., Гора читала слона). Но деление на бессмысленные и осмысленные предложения для грамматической классификации не имеет значения. Поэтому такие заумные тексты встречаются в детской литературе (например, стихи из \Алисы в стране чудес ]). В речи взрослых такие грамматически правильные бессмысленные предложения регулярно встречаются в патологических случаях — при некоторых поражениях лобной доли мозга, но такие предложения достаточно распространены и у нормальных людей, в том числе в наукообразной литературе.

     Опираясь на языковую иптуицито человека, исследующего родной язык, можно производить следующие эксперименты: возьмем грамматически правильное предложение, например, Гора читает слона и заменим слово слона на другое слово, скажем кота\ получим опять грамматически правильное предложение Гора читает кота. Если же слова кота или слона в этих предложениях заменить на слово земля, то получится грамматически неправильное предложение Гора читает земля. На основании достаточно большого количества подобных экспериментов можно подразделить все исследуемые формы слов языка на классы эквивалентных форм. При этом выяснится, что некоторые замены можно производить только в одном направлении: так, форму слона или кота можно заменить на форму окно (предложение Гора читает окно будет правильным), но форму окно нельзя заменить на форму слона или кота (предложение Окно занимается гимнастикой является грамматически правильным, тогда как предложение Слона занимается гимнастикой или Кота занимается гимнастикой является грамматически неправильным).

     О форме, которая может заменить другие формы, но не может быть заменена ими, условимся говорить, что данная форма подчиняет формы слона и кота. Точно так же форма метро подчиняет формы окно и окна; из грамматически правильных предложений Окно занимается гимнастикой и Верблюд стоял у окна можно получить грамматически правильные предложения Метро занимается гимнастикой и Верблюд стоял у метро. Но форма метро не может быть заменена на формы окно или окна в таком предложении, как Полюбуйтесь нашим метро (предложения Полюбуйтесь нашим окно и Полюбуйтесь нашим окна являются грамматически неправильными)... В работах О. С. Кулагиной4 и Р. Л. Добрушина 5 показано, что на основании таких операций можно посредством определенной процедуры строго описать грамматические понятия, которые интуитивно хорошо, но тем не менее в грамматических сочинениях описываются часто очень нечетко.

     Применительно к строгому определению падежа, идентичный подход был предложен А. Н. Колмогоровым 6. Конечный результат, получаемый в итоге такого исследования, зависит не от интуиции человека, а от грамматики языка, хотя для получения исходного материала вначале привлекались данные интуиции. После того как грамматические понятия точно определены, они могут быть использованы, например, для построения правил автоматического анализа текста машиной, что может служить критерием для проверки полученного описания языка. Но хотелось бы подчеркнуть, что, помимо возможного прикладного использования результатов формального описания языковой интуиции человека, методика таких работ представляет теоретический интерес для тех паук, где человек является одновременно и исследователем, и прибором, показания которого исследуются, или, как определял эту ситуацию Нильс Бор, где актер и зритель объединяются в одном лице.

 

1.2 Вторая проблема.

 

     Выбор описания языка е зависимости от устройства, которое производит операции над языком. Связь между моделью языка и устройством, па которое эта модель рассчитана, можно пояснить примером, который относится к области популярных научно-фантастических домыслов о возможностях встречи в космосе с высокоорганизованными системами (типа \черного облака ] в романе английского астрофизика Хойла). Если предположить, что у такой высокоорганизованной системы объем оперативной и постоянной памяти существенно выше человеческого, а время выборки из памяти существенно меньше, то для описания человеческого языка этой системы может потребоваться только словарь (но не набор фонем или набор морфем). Но если память этой системы не является бесконечной, то ей нужны будут грамматические правила для того, чтобы из словаря с конечным числом слов строить бесконечное число грамматически правильных последовательностей слов.

     Таким образом, у обезьян (и, возможно, у дельфинов), по-видимому, нет необходимости в делении слов потому, что объем словаря и памяти достаточно мал. Человек же делит слово на более элементарные единицы из-за необходимости примирить относительно большой размер словаря и относительно малый объем памяти. Согласно изложенной точке зрения, описание дискретных (раздельных) элементов речи, которое составляет предмет фонологии, имеет дело с результатом фонемной классификации звуков речи человеком, отражающей особенности физиологической организации нервной системы человека.

     Для операций над языком, которые должны совершать автоматы, наряду с такой лингвистикой для дискретного случая оказывается нужным создать лингвистику непрерывного речевого потока (звукового или письменного, так как письмо, например, в скорописи или в письменности типа арабской является непрерывным). Предположение об универсальном (общечеловеческом) характере тех ограничений, которые отражаются на числе фонологических единиц, подтверждается также и тем, что во всех развитых системах письма (за исключением ранней иероглифики, сохраняющей еще следы своего рисуночного происхождения, как в древнейших китайских, шумерских и египетских надписях, иероглифическом хеттском, майя и других центральноамериканских, андском и рапануйском письме) выделяется очень ограниченный набор основных элементов ( \черт ]), из которых строятся все письменные знаки (ср. \черты ], на которые обычно разлагаются китайские иероглифы, основные графические элементы числом 21, выделяемые в китайских иероглифах для целей синотайпа — машины, используемой для автоматического набора иероглифов, а также 5 основных элементов, из которых строятся все знаки поздней псредпеазиатской клинописи, и т. д.).

     Весьма существенно, что количество информации, приходящейся на один элемент в иероглифике, оказывается величиной того же порядка, что и количество информации, приходящейся на одну букву в алфавитном письме (эта последняя величина оказывается сходной в различных языках с разным числом букв в алфавите, как русский, английский и самоанский7). По отношению к грамматическим правилам, так же как и к распознаванию звуковой речи, объему словаря и теоретико-информационным характеристикам языка, всегда встает вопрос о зависимости модели языка от параметров устройства.

 

1.3 Третья проблема.

 

     Лингвистика как наука о дешифровке,, Языки можно исследовать, отвлекаясь в известной мере от человека или устройства, которое пользуется языком. В таком положении находится, например, исследователь, который занимается дешифровкой текста на древнем мертвом языке.

     Такой подход к языку можно назвать собственно лингвистическим смотренных нами ранее задан, смежных с психологией, физиологией и инженерной кибернетикой). Все собственно лингвистические задачи можпо свести к криптографическим, т. е. к дешифровке.

 

1.4 Четвертая проблема.

 

     Анализ языка как восстановление синтеза. Когда человек или машина анализируют (распознают или разбирают) буквы, слова или предложения устного и письменного языка, задача состоит в том, чтобы восстановить процесс, посредством которого было построено анализируемое сообщение.   

     Простым примером является распознавание человеком китайских иероглифов; для того, чтобы распознать иероглиф и найти его в словаре, нужно уметь его писать: например, знак | = \ограда ] пишется тремя чертами, но человек, не умеющий его писать, и не найдет этот четырехугольный знак из трех начертаний в словаре, где иероглифы расположены по числу черт. Поэтому, вероятно, что эффективные читающие устройства с обратной связью должны иметь возможность сами воспроизводить знаки, сравнивая их с воспринимаемыми. По отношению к распознанию речи человеком сходная точка зрения была проведена в работах Л. А. Чистович 10 1. Экспериментально установлено, что классификация звуков речи производится на основании их артикуляции.

     Поэтому нарушения в артикуляции ведут к нарушениям классификации звуков (например, при таких поражениях мозга, когда нарушается произносительная работа речевого аппарата, а работа слухового аппарата сама по себе сохранена, но зачем расстраивается из-за отсутствия обратной связи). Ребенок, обучающийся звукам речи, не пассивно воспринимает и заучивает акустические образы слов, а сам учится воспроизводить звуки (это можно сравнить, например, с ходом обучения математике). Принципиально такой же подход к грамматике языка был предложен Г. С. Цейтиным и М. Халле и. По мнению Л. А. Чистович, акустические сигналы несут информацию не непосредственно о последовательностях фонем, а об артикуляционных командах, которые управляют движениями органов предложении несут информацию о правилах порождения данного предложения. Следовательно, для того чтобы научиться анализировать предложение, нужно понять, как оно строилось. Для каждой из синтезирующих моделей языка, порождающих правильно построенные предложения, можно построить соответствующую анализирующую модель. В качестве примера можно привести простейшую синтезирующую модель-грамматику с конечным числом состояний. Эта грамматика может быть представлена как машина, которая, находясь в некотором состоянии so, ..., Sn, печатает на ленте слово wo, ..., w?n, после чего переходит в некоторое другое состояния.

     Каждая грамматика с конечным числом состояний может быть представлена диаграммой состояний или деревьев, причем каждая цепочка символов (грамматически правильное предложение) связана с одним естественным путем на диаграмме. Так, грамматика, порождающая русские предложения: Сегодня я читал очень длинную статью, Сегодня мы читали очень длинную статью, Сегодня я читал очень длинные статьи, может быть представлена диаграммой состояний В диаграмму состояний введена петля, благодаря которой грамматика может производить бесконечное множество предложений: Сегодня мы читали очень длинную статью.

     Сегодня мы читали очень очень длинную статью. Большинство анализирующих моделей, используемых в практике машинного перевода, основано на грамматике \непосредственно составляющих ] и на грамматике зависимостей. Алгоритм анализа реконструирует правила развертывания предложений в грамматике \непосредственно составляющих ] (которым соответствуют правила свертывания в модели анализа) или правила расстановки стрелок, связывающих слово с главным в грамматике зависимостей, где для каждого слова в предложении (кроме одного абсолютно главного) указывается одно и только слово, от которого зависит данное слово (см. рис. 4, где стрелки идут к зависимому слову от главного). Дерево предложения в грамматике \непосредственно составляющих ] может быть получено из скобочной: Талантливый художник пишет необычную картину, которая соответствует дереву.

     Для грамматики зависимостей может быть построен такой алгоритм анализа текста, который позволяет частично автоматизировать составление алгоритма синтаксического анализа. Для этого каждому слову достаточно приписать категорию или класс (например, указание на способность быть главным или зависимым: так, для английского языка при артикле указывается способность зависеть от главного слова справа от данного и т. п.) и построить таблицу сочетаемости слов разных категорий. Метод анализа, обратный по отношению к порождающей грамматике, возможен и по отношению к трансформационной грамматике: в этом случае обнаружение определенной конструкции (например, пассивной) служит для восстановления той трансформации, при которой получена эта конструкция.

 

 

1.5 Пятая проблема.

 

     Описание смысла. В отличие от формализованных языков, для которых характерно наличие взаимно-однозначных соответствий между именем, денотатом (предметом, который обозначается именем) и концептом (смыслом имени), естественные языки характеризуются неоднозначным употреблением слов, в частности возможностью косвенного употребления имени, при котором денотатом становится то, что было концептом при прямом употреблении имени. Неоднозначность слов в естественных языках вызывает существенные трудности при автоматическом анализе текста, так как для определения денотата (референта) и концепта слова в естественном языке часто требуется знание обширного контекста (иногда всего данного текста и всей внеязыко- вой ситуации) Для некоторых специальных целей (в частности, для задач связи и для информационных машин) требуется построить систему однозначного описания ограниченного числа ситуаций, изображаемых в языке. Но для языка в целом такое описание невозможно, так как с помощью конечного числа слов язык описывает бесконечное число ситуаций.

     Это оказывается возможным потому, что обычный разговорный язык устроен относительно свободным образом: каждое слово может, вообще говоря, значить все что угодно при одном единственном условии, что оно не должно смешиваться со словами, наиболее близкими ему по значению 14; так, слово \соль ] может обозначать не только вещество, но и остроту, и избранных людей и т. п., но оно не должно смешиваться со словами \перец ] и \горчица ], т. е. со словами, входящими в тот же локальный словарь (или то же \семантическое поле ]; смешение таких слов может наблюдаться только при афазии). Это совершенно аналогично тому, что имеет место при произнесении слов, когда каждая фонема может звучать как угодно при том условии, что она не смешивается с остальными (напр., украинское звонкое может образовываться в гортани, зеве или задней части полости рта, так как не смешивается ни при одном положении органов речи ни с одной другой фонемой).

     Поэтому было бы безнадежным занятием пытаться точно определить все различные возможные звучания фонемы или все различные возможные случаи употребления слова. Как только мы фиксируем все известные употребления, окажется возможным употребить то же слово в новой ситуации, не предусмотренной нашими инструкциями 15. Эта особенность человеческого языка делает возможным свободное общение между всеми членами коллектива независимо от возраста, уровня интеллектуальных способностей, профессии и т. и. Каждый из собеседников употребляет слова в значении, которое он им придает (и в специфическом для него звучании), но если эти колебания не превышают установленных норм, т. е. если не смешиваются близкие но значению слова или разные фонемы, то общение оказывается незатруднительиым.

     Эта особенность значений человеческого языка решительно отличает его от способов сигнализации у животных, что особенно рельефно было показано Ю. В. Кнорозовым. Так, например, пчелы, сообщающие посредством ганца о расстоянии до найденного источника пищи, обладают точным однозначным способом выражения, который не может быть понят двусмысленно (так как число оборотов пчелы во время танца является функцией от расстояния до источника пищи). Точно так же каждый из звуковых сигналов человекообразных обезьян соответствует одной определенной ситуации, например кормлению, опасности и т. п. В этом смысле каждый из нескольких десятков сигналов, используемых обезьянами, аналогичен таким сигналам в человеческом обществе, как удар гонга, созывающий к обеду, набат, извещающий о пожаре, или сигнал воздушной тревоги. Человеческие языки, начиная с языков жестов (который имеет аналог в символах, вырабатываемых у обезьян при коллективном решении задач в экспериментальных условиях), обладают прямо противоположной особенностью, наиболее ярко выражающейся в языках так называемых первобытных племен и в младенческом лепете.

     Так, в австралийском языке аранта одно и то же слово ngu обозначает корни водяной лилии, скрытые под водой; спящих людей и сон; кости человека (невидимые, как и подводные корни); вопросительное местоимение (относящееся к невидимому человеку) и т. и. Таким же фамильным именем для целого комплекса предметов, объединенных случайными признаками, является инснираторное звукосочетание хь, которым ребенок, еще не научившись говорить на обычном языке, называет горячую кастрюлю, горячую лампу, грелку (хотя бы и пустую) и батарею летом, когда батарея не топится 16. Такие комплексные значения слов сохраняются во всех современных языках, хотя развитие логики и современного научного мышления было бы невозможным без четкого ограничения значений используемых терминов. В то время как научный язык стремится к минимальной гибкости, т. е. к полной однозначности, поэтический язык стремится к максимальному увеличению гибкости 17, что достигается путем употребления слов языка в тех переносных значениях (так называемых образных), которые не запрещены языком в значении названия комплекса переживаний и части биографии поэта в "Поэме горы" М. Цветаевой). Благодаря этому оказывается возможным в одном слове, метафорически употребленном, высказать одновременно несколько мыслей, т. е. соединить последовательный принцип высказывания мыслей с параллельным (ср. двойную экспозицию в языке кино, описанную С. М. Эйзенштейном).

     Таким образом, в естественном языке современных взрослых людей комплексные значения слов сосуществуют с логически определенными обозначениями понятий и иногда (в частности, в словесном художественном творчестве) используются как особое средство описания действительности. Для всякого научного языка естественный язык (хотя бы через ряд промежуточных этапов) остается основной интерпретацией. Как показал Ю. В. Кнорозов, относительно примитивная организация такой системы, как язык, делает возможным дальнейшее его развитие, которое способствует и развитию надстроенных над ним научных языков. Разрабатывая информационные языки для храпения информации и языки для машин, современные исследователи по существу отходят от основных принципов устройства обычного языка и приближаются к принципам языка пчел, в котором отсутствует сочетание терминологической однозначности с комплексной многозначностью. Предстоит иссле/щвать, является ли этот путь единственно возможным или можно попытаться построить программы такого обучения машин языку, в котором сохранились бы принципиальные особенности человеческого языка.

 

1.6 Шестая проблема.

 

     Язык лингвистики. Проблема языка науки, особенно остро стоящая в XX веке, становится чрезвычайно жгучей но отношению к науке о языке, где использование обычного языка для описания этого же языка может привести к двусмысленности и неудобствам. На это было обращено внимание еще в древнеиндийской науке, где впервые был разработан язык для описания некоторых звуковых и грамматических явлений языка. Следующим важнейшим шагом в лингвистике явилось изобретение языка сравнительного языкознания в XIX в.

     В наше время увлечение возможностями точных методов изучения языка сопровождается заимствованием математического языка или, еще чаще, математической терминологии. Изложение уже известных в лингвистике истин на математическом языке не является единственно возможным способом объединения усилий лингвистики и математики. Гораздо более интересную задачу представляет разработка нового языка для лингвистики, которая фактически уже начата: именно такая совместная работа и ведется лингвистами и математиками при построении систем записи смысла единиц обычных языков, при построении систем стандартного описания алгоритмов перевода и т. п.

     Лингвистику необходимо избавить от словесного сора, большого числа тех самых абстрактных слов, ничего не обозначающих, о которых речь шла выше. В этом смысле очень много дает опыт машинного перевода, где термины, используемые в грамматическом описании, могут быть определены весьма точным образом — посредством перевода на язык операций машины. При этом для сопоставления машинного перевода с человеческим представляет интерес как описание машинных операций над языком в терминах более крупных операций (стандартных операторов), так и более дробное описание человеческих операций над языком, построенное по типу алгоритмов машинного перевода.

     При исследовании языка лингвистики выясняется, что многие особенности, рассматриваемые обычно как характеристики языка-объекта (естественного языка), в действительности зависят от организации метаязыка (искусственного языка самой лингвистики). В частности, введение уровня фонем нисколько не является обязательным для лингвистического описания, хотя по изложенным выше причинам оно и соответствует человеческой языковой интуиции. Можно подвергнуть обсуждению и обязательность уровня морфем, который требуется в основном из соображений экономии памяти. Особенно существенно то, что оба эти уровня могут описываться не в привычных терминах \фонема ], \морфема ], а в равноценных (и в некоторых отношениях более удобных) терминах \быть фонемным ], \быть морфемным ] 18. Весьма важной задачей является построение нескольких различных описаний одного и того же языка-объекта, что позволило бы ввести более точные критерии выбора наиболее удобного языка лингвистического описания применительно к данному естественному языку.

 

1.7 Седьмая проблема.

 

     Количественное исследование языка. Некоторые основные количественные характеристики языка, особенно существенные для лингвистики, носят очень простой характер. Таково, в частности, различие между числом слов (от 104 до 105), числом морфем (несколько тысяч), числом слогов (от нескольких сотен до нескольких тысяч) и числом фонем (от 10 до 80). Согласно высказанному выше предположению, эти соотношения связаны с устройством человеческой памяти. Эти простые соотношения могут быть положены в основу определения характера письменности, как это, например, сделал Ю. В. Кнорозов в своей дешифровке письменности майя. Дешифровка Ю. В. Кнорозова является практическим приложением теории языка (и теории сигнализации в целом), в частности, опирающейся на наличие языковых констант. Простые количественные отношения между словами, слогами и фонемами позволяют дать классификацию языков, которую можно использовать и при изучении их истории.

     Так, в случае если слова в языке односложны, средняя длина слова слишком мала для того, чтобы возможно было членение слова на части; поэтому в языках с односложными словами слово не делится на морфемы. Вместе с тем необходимость различения нескольких тысяч морфем (слов) при ограниченном инвентаре слогов делает необходимым различение слогов посредством музыкального ударения. Поэтому языки с односложными словами-морфемами всегда являются языками с музыкальным ударением (вьетнамский, классический китайский, некоторые центральноафриканские языки и т. п.)°§          

     Если в истории языка слова в результате обычного сокращения длины слова становятся односложными, то они перестают члениться на морфемы, и в языке развивается музыкальное ударение (так объясняется музыкальное ударение в тибетском и классическом китайском языках). Другой существенной закономерностью является связь между числом фонем и средней длиной морфемы: так, в абхазском языке, бзибский говор которого имеет рекордное число фонем (81), корневая морфема обычно бывает однофонемной. В гавайском и других полинезийских языках морфема в среднем состоит из двух слогов (4 фонем), односложные морфемы составляют ничтожный процент общего числа морфем; вместе с тем имеются неразложимые морфемы из 20 фонем (11 слогов), например название рыбы homohomonukunukuapua 19. Знание этих зависимостей можно использовать в сравнительно- историческом языкознании: так, если для какого-либо языка (например, пракартвельского) предполагается однофопемиость корня, то это с необходимостью требует предположения о развитой системе фонем, превосходящей среднюю норму (40 фонем) 20.

 

     Необходимость количественного исследования явно или неосознанно на практике признается всеми лингвистами, хотя они иногда и заявляют обратное. Отсутствие количественного подхода к истории языка сказывается особенно отрицательно, так как изменение величины выборки по мере приближения к современному состоянию языка должно учитываться для поддержания хронологической перспективы. Другие языковые константы не в такой степени \лежат на поверхности ]: для их выявления требуется определение теоретико-информационных параметров языка. Вычисление теоретико-информационных параметров языка представляет интерес не только для лингвистики, но и для практических задач связи. Для определения избыточности некоторых \экзотических языков ] можно использовать такие естественные видоизменения языка для передачи его на расстояние, как языки свиста, языки барабанов (в Африке и Южной Америке) и т. п., которые применительно к устному языку играют такую же роль, как стенография по отношению к письменному языку.  

     Сходное с этими видоизменениями обычного языка частичное устранение избыточности осуществляется также и на протяжении истории языка: в письменном языке это обнаруживается в распространении сокращенных написаний (примеры этому имеются уже в клинописных текстах, ср. широкое распространение сокращенных написаний китайских и японских иероглифов), в устном — в фонетическом изнашивании, т. е. сокращении длины слова типа русского [чэк] вместо человек. Поэтому история языка может дать некоторые косвенные указания на величину избыточности. Для кибернетики (а возможно, и для соответствующих чисто математических дисциплин) язык может представлять интерес как массовая совокупность объектов. Эти объекты часто бывает бессмысленно исследовать изолированно, так как поведение отдельной единицы можно знать только, если известны законы, управляющие всей совокупностью в целом. Так, по Чжао Юаньжэню21, в китайском языке на рубеже VI и VII вв. н. э. засвидетельствовано 3877 различавшихся между собой слогов, каждый из которых был морфемой и словом. В современном китайском языке фонетическое изнашивание привело к тому, что число слогов сократилось до 1279, согласно тому же автору; в связи с этим (для восстановления утраченных различий) стала преобладать статистическая норма двусложного слова.

     Поэтому многие древние односложные слова заменились двусложными — чаще всего сочетанием двух морфем с одинаковыми или близкими значениями; было бы нелепо исследовать только индивидуальные причины каждой замены односложного слова двусложным (с большей смысловой избыточностью), так как существенна прежде всего общая закономерность. Статистическая лингвистика могла бы стать содержательной научной дисциплиной еще и потом



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.