Масштабное лингвистическое исследование с использованием базы отсканированной литературы Google Books, Twitter, текстов популярных песни песен и газеты The New York Times показало, что английский язык в целом позитивен: слов с положительной эмоциональной окраской в нем больше, чем с отрицательной.
Результаты являются предварительными, но уже демонстрируют фундаментальные характеристики английского языка, а в перспективе и языка вообще.
«На основе того факта, что люди в значительной степени являются существами говорящими - Homo narrativus - мы можем исследовать язык как количественное свидетельство характеристик нашей социальной жизни», - говорят ученые.
В антропологии существует точка зрения, что язык является для человека средством удовлетворения основных социальных характеристик. С этой точки зрения он должен отражать основные социальные императивы (желания). Ее придерживаются и ученые из Корнельского университета (Cornell University) и Университета штата Вермонт (University of Vermont), которые и взялись за подтверждение теории на основе активного словаря современного английского языка.
Под руководством Изабель Клуман (Isabel Klouman) из Университета Вермонта исследователи взяли четыре огромных текстовых базы данных: 361.000.000.000 слов в 3.290 книгах на Google Books, 9 миллиардов слов в 821 миллионах твитов (в период с 2008 по 2010 год), 1 миллиард слов в 1.800.000 статей The New York Times (за период с 1987 по 2007 год) и 58.600 слов из 295 000 популярных песен.
Они составили для каждой из этих баз список из пяти тысяч наиболее часто употребленных слов, из которых был составлен итоговый список, включающий 10.122 слова.
Затем ученые использовали маркетинговый сервис Amazon (Mechanical Turk labor-outsourcing service) для получения 50 отдельных оценок эмоционального значения для каждого слова. Слова таким образом были ранжированы по шкале от одного до девяти - от отрицательного до положительного значения.
Например, самый высокий балл получило слово laughter («смех») – 8,5, а слово terrorist «террорист» получило средний балл 1,30.
В общей сложности, слова с положительной оценкой превосходили по количеству слова с отрицательной оценкой – они были использованы в базах чаще.
Такая диаграмма предлагается к препринту статьи на портале arXiv.org
По предварительным результатам проделанной работы, «позитив (в языке – ред.) более универсален».
«В наших текстах мы склонны к просоциальной коммуникации», - пишет Изабель Клуман, однако не поясняет, что имеется в виду под этими словами.
Нужно исследовать таким же образом другие языки, считает команда ученых, а также применить тот же метод не на отдельные слова, а на фразы и целые предложения – это в разы сложнее, но результаты покажут гораздо более точную картину.
Статья пока не опубликована в печатном издании, но доступна на сайте arXiv.org (Positivity of the English language).
Москва, 31 августа.
Источник: Wired
Мир 24
Новость: www.mir24.tv/news/Science/4227466