Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации

Аналитика

01/08/2018

Воззвание машин. Зачем люди изучают поэзию нейросетей?

Какие стихи пишет искусственный интеллект и что ученые могут понять о творчестве настоящих поэтов, имитируя их стиль с помощью нейросетей?

Рассказывает Борис Орехов, доцент Школы лингвистики при московской Высшей школе экономики.


Ранние опыты

Первым программистом, сделавшим компьютер автором художественного текста, был немец Тео Лутц: в 1959 году он написал программу, которая комбинировала в случайном порядке фразы из «Замка» Кафки. Количество экспериментов с компьютерной поэзией, проведенных с той поры, сосчитать невозможно.

Например, в начале 1990-х годов довольно много программ для генерации текста писали русские программисты, еще под MS Dos. Этому явлению посвятил свой дипломный проект студент Московского горного института и будущий писатель Лео Каганов. В качестве одного из примеров Каганов приводит программку poet.exe, в которой пользователь размечал стихотворный размер для будущего произведения — количество слов в строке и расстановку ударений — а компьютер подбирал из словаря слова, соответствующие критериям. Получалось примерно такое. Ну скажите, что это не про Томск?


Город отличный сибирский ученый сухой
 Вешний покой завершающий жвачный студеный
 Страшный сердитый пример полусонный ученый
 Утренний скорый размер на просторе глухой

Но относительная осмысленность этого текста с человеческой точки зрения объясняется ограниченностью словаря: компьютер выбирал слова из довольно небольшого списка, составленного программистом по определенным принципам.

Ключевой фактор киберпоэзии прошлой, уже можно сказать, эпохи, до появления самообучающихся программ – случайность. Запомним, это важно.


Буква за буквой

Все изменилось, когдав широкое применение вошли нейросети, и люди тоже стали ставить с ними поэтические опыты. Откровенно говоря, смысла в поэзии, написанной нейросетями, больше не стало. Но принципиально изменился подход: на смену случайности пришла закономерность.

Не вдаваясь в подробности, нейросеть – это такая программа, которая изучает большой объем данных, ищет в них свою «логику» и на основе этого может создавать самостоятельные произведения. Чтобы окончательно не запутаться, мы будем рассматривать только один вид сетей — рекуррентные.

Сначала сеть обучают — дают ей «прочитать» огромное количество текстов. Например, весь корпус стихов поэтов Серебряного века. И всё! Больше никаких условий, никаких алгоритмов. Программа сама делает предположение, что после буквы «п» в изученных ею текстах часто стоит буква «р», а все последующие буквы складываются в слово «проснись». Буква за буквой нейросеть, не имея ни идеи, ни вдохновения, ни плана, создает стихотворение:


И так же все теперь слова
 Проснись ль скорей и воздух дал
 Но вот к концу весенних дней
 и облачное на челе
 спешит полутвердил я в небе…

Кажется, что-то символистское в нем прослеживается, а слово «полутвердил», хотя в словарях и отсутствует, вполне могло быть результатом языковых экспериментов поэтов начала ХХ века.

А нейросеть Яндекса написала целый альбом песен в подражание творчеству Егора Летова. Кто-то говорит, что похоже, кто-то, что не очень: «Что-то общее есть, но, в отличие от Егорки, бессмысленно. Набор слов нейросеть взяла верный, но смысла добавить не сумела», — пишут в комментариях к одной из статей об этом событии. Впрочем, в стихах самого Летова тоже не каждый может обнаружить внятное послание.


А в чем смысл?

Дискретный сюжет, причудливые образы и невозможность четко интерпретировать «что сказал автор» — особенности поэзии ХХ века. И в этом причина того, почему Хармс, по признанию разработчиков того же алгоритма Яндекса, получается «годным» в исполнении нейросетки, а Пушкин — нет.

Ниже, кстати, отрывок из подлинного стихотворения Даниила Хармса, которое поэт написал в 1926 году без всяких искусственных нейросетей, прямо из головы:


мимо этого большого
 на заборе — ах вы дети —
вырастала палеандра
 и влетая на вагоны
 перемыла не того
 кто налима с перепугу
 оградил семью волами
 вынул деньги из кармана
 деньги серые в лице

Обычный читатель скажет: «Чушь какая-то», выпускник филфака пожмет плечами: «Это ж Хармс, поэзия абсурда». А вот четверостишье другого великого поэта — совершенно не абсурдиста.


Это — ряд наблюдений. В углу — тепло.
Взгляд оставляет на вещи след.
Вода представляет собой стекло.
Человек страшней, чем его скелет.

Первые строки стихотворения Иосифа Бродского кто-то тоже может назвать бессмыслицей -— серия парадоксальных утверждений, слабо связанных между собой. (Нейронная сеть, кстати, пишет ровно так же: её хватает на отдельные строки, но не на связи между ними). А кто-то увидит в этих строках Бдродского глубокую мысль. В общем-то, смысл — понятие субъективное, и появляется тогда, когда люди сами вкладывают его в то или иное явление.

Проводился такой эксперимент: психологи показывали испытуемым репродукции картин и фиксировали их реакцию на них. Все картины были написаны людьми, но про некоторые из них говорили, что они сгенерированы компьютером. Психологи заметили совершенно явную тенденцию: если люди считали, что картины написаны живыми художниками, то они внимательно изучали детали, старались определить свое отношение к работе. А если думали, что автор — компьютер, то не обращали на картину особого внимания.

Со стихами то же самое: если это написано человеком, особенно признанным поэтом, мы стараемся понять идею и смысл произведения. Если нейросетью — и так все понятно: чистая бессмыслица, набор букв. И вряд ли в ближайшее время удастся научить искусственный интеллект увязывать форму слова со смыслом, да еще и таким сложным и многозначным, как в поэзии.

В таком случае, зачем вообще ученым тратить время на «творчество» нейросетей? Прежде всего, потому, что это — дополнительный инструмент для изучения наследия настоящих поэтов. Ведь у нейросети есть интересное свойство — улавливать поэтический стиль. Например, если «скормить» ей все тексты песен Высоцкого или все стихотворения, написанные гекзаметром по-русски, то на выходе получится довольно бессмысленный текст, источник которого, однако, будет хорошо угадываться.

Плюс особенности текста не будут заслоняться «проклятым» школьным вопросом: «Что хотел сказать автор?». В случае с нейросетью литературоведы могут быть спокойны: автор ничего не хотел сказать.

 

Текст: Катерина Кайгородова

Томский Обзор / Фото: Томский Обзор


https://obzor.westsib.ru/article/576844---vozzvanie-mashin-zachem-ljudi-izuchajut-poeziju-nejrosetej