Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации

Аналитика

29/01/2019

Aeon (Великобритания): почему языки и диалекты — это совершенно разные вещи

Британское онлайн-издание публикует статью датского лингвиста, в которой объясняется разница между языком и диалектом. Разграничение между ними может зависеть от той или иной точки зрения, утверждает ученый. Лично он предпочитает лингвистический подход. Объяснив, почему, он показывает, что таким способом можно даже вычислить время, необходимое для того, чтобы диалекты стали отдельными языками.

Нередко на простые вопросы приходится давать сложные ответы. Например: в чем разница между языком и диалектом? Если вы решите спросить об этом лингвиста, то усаживайтесь поудобнее. Хотя на первый взгляд в этом вопросе нет ничего сложного, ответить на него можно по-разному.

Разграничение между языком и диалектом может зависеть от той или иной точки зрения. С политической точки зрения, язык — это то, на чем обычно говорит народ как нация. К примеру, с 1850 по 1992 год существовал так называемый сербохорватский язык, который включал в себя несколько диалектов, в том числе сербский, хорватский и боснийский. Но после того, как в середине 1990-х годов Югославия распалась на несколько независимых государств, эти диалекты были признаны отдельными языками. Такое политическое определение отчасти работает, хотя и несет с собой больше проблем, нежели решений: бывают языки, на которых говорят в разных странах, яркий тому пример — испанский в Латинской Америке. Никто не станет утверждать, что мексиканский испанский и колумбийский испанский — это разные языки. Возможно, испанский, на котором говорят в некоторых частях Испании, настолько отличается от своих латиноамериканских разновидностей, что заслуживает называться отдельным языком, но это не до конца ясно.

А что, если провести границу между языком и диалектом, руководствуясь критерием взаимопонимания? К сожалению, и этот подход не идеален. Датчанин будет несколько лучше понимать шведский, чем швед — датский. Точно так же человек, говорящий на специфическом крестьянском говоре британского английского, поймет американца из Лос-Анджелеса гораздо лучше, чем американец его. Взаимопонимание часто зависит от внешних факторов — они представляют собой довольно неконтролируемую переменную — а не от присущих самому языку свойств.

Так что, возможно, нам стоит взять на вооружение чисто лингвистический подход. Представьте, что мы можем систематически измерить разницу (D) между двумя речевыми вариантами. Тогда конкретное значение D позволило бы нам определить границу между двумя диалектами и двумя языками. Найти такую величину, должно быть, не очень сложно, поскольку два языка можно сравнивать по множеству критериев, таких как звуковой инвентарь, грамматические характеристики или лексика.

Но что, если различия между речевыми вариациями являются градуальными и вероятность нахождения заданного значения D столь же высока, сколь и вероятность нахождение какой-то другой величины? Тогда нам пришлось бы выбрать в качестве отправной точки произвольное значение D, а произвольное значение отбросило бы нас назад к соображениям политического или практического характера, которые мы не собирались брать в рассмотрение. Хотим мы, чтобы наша линия разрыва проходила на уровне, где сербский и хорватский — это разные языки или один? Каталогизируя языки мира, сколько тысяч языков мы хотим предать забвению: пять? Или семь? А может быть, десять тысяч?

За последние годы удалось преодолеть два основных препятствия на пути различения языка и диалекта. Первое состоит в том, как измерить различия между речевыми вариантами — то есть найти значение для D. В 2008 году группа лингвистов создала Автоматизированную программу оценки сходства (Automated Similarity Judgment Program, ASJP), ежедневным куратором и основателем которой является ваш покорный слуга. ASJP кропотливо подготовила систематический сравнительный набор данных по языкам, который в настоящее время содержит 7655 списков слов. Они имеют отношение к двум третям мировых языков, если предположить, что для наших целей языки определяются по стандартному коду ISO 639-3. Поскольку каждый список слов содержит фиксированный набор из 40 понятий, которые истолковываются единообразно, их легко сравнивать и таким образом получить меру различия. Чаще всего в качестве меры различия между двумя словами используется вариант «расстояния Левенштейна» — этот термин был назван в честь Владимира Левенштейна, советского ученого, который в 1965 году разработал алгоритм для сравнения двух строк символов. Он определил «расстояние» как минимальное количество замен, вставок и удалений, необходимых для превращения одной строки в другую. Расстояние Левенштейна можно с пользой разделить на длину самой длинной из двух строк и таким образом поместить все расстояния в шкалу от 0 до 1. Данное явление известно как нормализованное расстояние Левенштейна, или LDN.

Второе препятствие заключается в том, что, возможно, «язык» и «диалект» являются понятиями, которые могут быть определены только в произвольном порядке. Здесь у нас есть для вас вполне обнадеживающие новости. Если мы посмотрим на все языковые семьи в базе данных ASJP, куда участники проекта включили существенную долю близких разновидностей, мы можем приступить к поиску различных типов поведения языков и диалектов. Перед нами возникает интригующая картина: расстояния как правило колеблются либо вокруг относительно небольшой величины, либо вокруг относительно большой, и между ними образуется впадина. Как выясняется, чаще всего эта впадина лежит в узком диапазоне, в среднем равном примерно 0,48 LDN. Мы не погрешим против точности, если скажем, что речевые варианты стремятся не быть частично похожими друг на друга в своей базовой лексике. Либо наблюдается тенденция к большей схожести, и в этом случае речевые варианты можно определить как разные диалекты, либо к меньшей схожести — и в этом случае их можно отнести к разным языкам. Здесь как раз и пролегает граница между языком и диалектом.

Вероятно, это явление стало результатом социальных обстоятельств. Диалекты расходятся по мере того, как люди расселяются на новых территориях и формируют новые идентичности, но, если между ними все еще есть некоторый контакт, может иметь место конвергенция, так что речевые варианты остаются похожими более чем на 50 процентов (и, следовательно, речь идет об одном языке). Однако небольшой толчок в направлении дивергенции может привести к тому, что языковые варианты разойдутся относительно быстро, увеличив расстояние Левенштейна, и в этом случае мы можем квалифицировать их как отдельные языки. Возможно, существует связь между границей для расстояний между словами в стандартном списке, используемом ASJP, и соответствующими расстояниями в других частях языковой структуры, которые могут приводить к серьезной потере взаимопонимания. Другими словами, порог взаимопонимания может коррелировать с порогом между языками и диалектами. Мы еще не изучили этот вопрос, но как объект для исследования он крайне интересен.

Придя к объективному, а не произвольному критерию для отделения языков от диалектов, мы можем применить его к языкам мира. Некоторые пары речевых разновидностей, которые считаются национальными языками, такие как боснийский и хорватский, находятся значительно ниже порога LDN, равного 0,48 (значит, это один и тот же язык, независимо от существования Югославии). Совсем недалеко от этого порога оказываются такие языки, как хинди и урду (едва ли их можно назвать двумя разными языками). А разновидности арабского и китайского языков, которые часто рассматриваются как единые языки, взлетают выше LDN = 0,48 (эти разновидности являются отдельными языками). На самом деле, есть несколько пар разновидностей, которые обычно считаются разными языками, но колеблются на границе: например, датский и шведский языки, у которых LDN составляет 0,4921.

Наконец, метод, полученный из наборов данных, называемый ASJP-хронологией, может быть применен с целью установить количество времени, необходимого для того, чтобы диалекты дистанцировались друг от друга настолько далеко, чтобы считаться отдельными языками. Найденный нами результат — 1059 лет, если не учитывать некоторую погрешность. Эти выводы подтверждаются тем, сколько времени обычно требуется, чтобы родовой язык языковой семьи распался на дочерние, которые впоследствии становятся предками подсемейств. Для этого нам необходимы другие методы анализа, но результаты схожи: для превращения диалектов в языки требуется около тысячелетия. Мы знаем это, потому что теперь можем отличить одно от другого.

Сёрен Вихманн (Søren Wichmann)

Сёрен Вихманн — датский лингвист, сотрудничающий с Лейденским университетом (Нидерланды), Казанским федеральным университетом (Россия) и Пекинским лингвистическим университетом (Китай). Его последняя книга — «Временная стабильность лингвистических типологических особенностей» (Temporal Stability of Linguistic Typological Features, 2009) — написана в соавторстве с Эриком Холменом (Eric W. Holman).


https://inosmi.ru/science/20190129/244458552.html