Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации

Аналитика

16/05/2013

Инструмент и только

Как появилась программа «Антиплагиат», как она развивалась и чем является сегодня –«Часкор» поговорил с Юрием Чеховичем, генеральным директором компании Forecsys, разработчики которой в 2005 году создали продукт, помогающий российским вузам отслеживать качество студенческих и научных работ.

Юрий Чехович — генеральный директор ЗАО «Форексис», выпускник факультета управления и прикладной математики Московского физико-технического института. В 2002 году окончил аспирантуру факультета вычислительной математики и кибернетики МГУ им. М.В. Ломоносова, а в 2004 году защитил диссертацию на соискание степени кандидата физико-математических наук. С 2000 года работает в компании Forecsys.

— Давайте начнём сначала: откуда пошёл «Антиплагиат»?
— В 2005 году в компанию Forecsys(отечественный производитель программного обеспечения, организованный на базе Вычислительного центра РАН) обратился ректор МИЭМП Артемий Никитов с просьбой помочь в решении следующей проблемы: студенты прут рефераты из интернета, а на проверку уникальности текста вручную, когда ты загоняешь каждую строчку текста в поисковую строку, уходит колоссальное количество времени; необходимо создать ПО, которое облегчало бы преподавателям процесс проверки уникальности текстов студентов. Мы оглянулись на Запад и обнаружили достаточное количество продуктов, способных решать такие задачи. Однако западные разработчики в то время выходить на российский рынок с подобными продуктами не торопились. А нам задача показалась интересной, решили попробовать. По сути,«Антиплагиат» - это текстовый поисковик, в видовой классификации софта - близкий родственник больших поисковиков, таких как Яндекс или Google. Мы сделали ПО, создали компанию, придумали слово «антиплагиат», которое оказалось весьма удачным, и работаем. Само название в итоге переросло в прямое назначение продукта, став обозначением явления борьбы с заимствованиями в целом.

— Но звучит-то оно действительно широко, и с анализом только научных работ не ассоциируется, мне кажется?
— Исследования, которые позволяет проводить это программное обеспечение, ориентируются только на анализ текстового контента. Мы не занимаемся картинками, звуком и т.д. А задача с текстами решается за разумное время, в разумных объёмах и, главное, помогает решать огромную проблему в образовании и в науке, на наш взгляд. Мы же выросли из ВЦ РАН, и в каком-то смысле эта работа является и кадровой, и идейной подпиткой. Количество диссертаций, кандидатских и докторских растёт год от года. Спрашивается, на чём оно растёт, где научные успехи, обеспечивающие такой рост диссертаций? В семидесятые, восьмидесятые, девяностые годы диссертаций защищалось гораздо меньше, а сейчас, если судить по количеству диссертаций, получается просто невиданный подъём научной мысли.

— Какие конкретно образовательные проблемы удаётся решать «Антиплагиату»?
— Очень просто. Ключевая проблема - обнаружение несамостоятельности автора при подготовке письменной работы. То есть это не плагиат, в том смысле, который вложен в понятие законодательными нормами: краденые идеи, изобретения и т.д.Мы говорим лишь о самостоятельности работ и выводов студента, учёного, научного коллектива. В случае студенческой работы несамостоятельный продукт ставит под сомнение знания и навыки автора, в случае научной работы - под сомнение попадает заявленная учёным квалификация, со всеми вытекающими, а в случае коллективных научных разработок поднимается вопрос об эффективности расходования средств. Кстати, ключевым в подготовке несамостоятельных работ является именно экономический вопрос.

— Как так?
— Давайте прикинем, сколько могут зарабатывать те, кто пишет работы на заказ. Цены на сайтах, предлагающих вам рефераты, дипломы, диссертации и прочее - от нескольких десятков рублей за страницу. Пусть в среднем будет сто рублей страница. Любой, кто что-то писал сам, знает, что если очень напрячься, за день можно написать страниц десять уникального текста максимум. И это в очень удачный день! Такими темпами за месяц без выходных очень квалифицированный человек может заработать сумасшедшие 30 000 рублей. При этом есть еще расходы – компьютер, интернет, расходники и прочее. Выжить с такими ценами не получится. Отсюда простой вывод: «работы под заказ» не пишутся, а компилируются из других работ. Этот путь, с одной стороны, делает этот бизнес доходным. Но, с другой стороны, позволяет системе «Антиплагиат» обнаруживать эти компиляции.


С научными работами всё куда сложнее, стоимость их исчисляется тысячами долларов и сроки их написания несопоставимы. Понятное дело, что существует и рынок «качественного написания» диссертаций, когда нанимается «научный раб» и он пишет работу для конкретного «автора» - такую историю вскрыть практически невозможно. Разве что настоящий автор сам заговорит, чего не происходит никогда. Стоимость работ начинается от десятков тысяч долларов, в силу уникальности текстов, вычислить их невозможно, а, учитывая стоимость, на общем фоне несамостоятельных работ их количество мизерно.

Наша цель – убрать из общепринятой практики хотя бы поточное производство «студенческих» и «научных» работ – это будет уже серьезная победа. Вообразите, до того как был создан «Антиплагиат», две трети работ, которые студенты приносили в вузы, создавались за несколько минут: выкачиваем из интернета, меняем титульный лист, несём преподавателю.

А сейчас преподаватель, загрузив работу в «Антиплагиат» и получив отчет, за несколько секунд обнаружит такое творчество и не примет работу. При этом, естественно, преподавателю необходимо не только посмотреть на «процент плагиата», но и проанализировать качество заимствований. Заимствования могут быть вполне правомочными. Антиплагиат, кстати, помогает в этой деятельности. Например, цитаты из законодательных и нормативных документов, подсвечиваются в отчете особым образом, ведь в юридических текстах без таких заимствований обойтись практически невозможно.

— Программу уже пытались обманывать недобросовестные пользователи? Известны случае мошенничества с заменой буквы О на ноль в госпорталах при объявлении о тендерах…
— Конечно, пытались обмануть. Сначала пробовали ставить точки после каждого слова и красить их в цвет фона. Или разбивать предложения пополам. Пробовали даже с помощью нехитрого софта объединять несколько слов в одно, вместо пробела вставляя буквы белого цвета – конечно, это может вызывать вопросы у преподавателей, если включён словарь – он высвечивает орфографические ошибки. Ну и, наконец, для тех преподавателей, которые вообще не читают работы, есть особый метод в виде «двойного гугла» - машинного перевода на английский и обратно. Считается, что плагиат теряется в переводе. В общем, поверьте, эта битва никогда не останавливается, но самые очевидные дырки мы уже закрыли благодаря изобретательным жуликам-первопроходцам. Это, кстати говоря, даёт нам определённую устойчивость на рынке, в том числе при работе как с новыми продуктами, так и с русскими версиями глобальных сервисов, которые ранее не хотели выходить на русский рынок – но теперь, возможно, передумают. Мы будем рады: чем больше инструментов, тем сильнее мотивация к развитию продукта у наших разработчиков.

— Ну и как вы справляетесь с этими жуликами?
— Для того, чтобы пресекать такое «новаторское» жульничество, мы используем несколько разработок, начиная от языковых статистик до исследования и анализа частоты встречаемых сочетаний букв. На самом деле лингвистический анализ – это сфера, в которой есть серьёзные наработки. Помните, когда были споры по авторству произведений Шолохова? А ведь это не единственный случай. Но мы ещё далеки от финала в этой истории, развитие продукта продолжается.

— Прежде чем приступить к созданию продукта, ваши коллеги оглянулись на западный опыт. Что там?
— ам эта тема существует с конца XX века. Мне известно несколько десятков подобных продуктов. Например, TurnItIn компании IParadigms - один из самых распространённых в мире продуктов, работает с текстами на английском. Вот как раз по поводу диссергейта они приезжали к нам, изучали, что тут происходит, заинтересовались выведением своего продукта на российский рынок. Есть ряд продуктов на национальных языках других стран: в Швеции -- на шведском, в Германии -- на немецком четыре крупных проекта существует, есть испаноязычные продукты. В общем, тема во всём мире развивается очень активно.

Подобное ПО - необходимый инструмент цифрового века, мы никуда не денемся от этого. Если заказчика, кем бы он ни был, интересует качество вашего текстового продукта, только с помощью подобного инструмента он сможет его проверить. Публикация дипломов и диссертаций и открытая возможность их проверить ставит серьёзный заслон на пути некачественных знаний и липовых квалификаций. Необходимость инструмента обусловлена простотой и скоростью, с которой сегодня любой желающий может сварганить себе хоть курсовую работу, хоть докторскую диссертацию.

— Сколько учебных заведений сегодня пользуются вашим ПО?
— На конец марта у нас было 163 вуза среди подписчиков. Это, в основном, Россия, чуть-чуть Казахстан и Киргизия. Первые пять лет своей работы проект «Антиплагиат» отвоевывал свое право на существование. Мы просто общались с вузами и доказывали, что такой инструмент является неотъемлемым в учебной процессе. Нас в этой работе поддерживала Высшая школа экономики - на данный момент наш старейший клиент. Ситуация сдвинулась с мертвой точки в 2010 году, когда у нас собралось около 15 вузов, в конце 2011 их было уже 45, на конец 2012 - чуть больше 140. Сегодняшняя цифра еще выше. Если по количеству вузов она не очень большая, в стране их около полутора тысяч, но в 163вузах, которые стоят на обслуживании у нас, обучается в общей сложности более двух миллионов студентов, речь идёт об очень крупных учебных заведениях. На сайте можно посмотреть список. В сутки сегодня «Антиплагиат» проверяет порядка ста тысяч документов.

— Но вот программа и в политику влезла. Или политика сама нарвалась?
— Ну программе-то всё равно, какой текст проверять. У нас больше полумиллиона зарегистрированных пользователей, в секунду проверяется иногда несколько десятков работ.И кто куда влез - сказать невозможно. Я думаю, что все эти обнаружившиеся работы, по поводу которых нынче разгорелись скандалы, журналисты или блогеры изначально обязательно проверяли через «Антиплагиат».У нас все-таки самая обширная база.

Но есть нюанс: часть скандалов, которые пошли в прессу, на поверку оказались несостоятельны. По крайней мене с точки зрения анализа текста работы. То есть, первоначальная проверка c помощью «Антиплагиата» показал некоторое количество совпадений, но если смотреть глубже, оказывается, что эти совпадения не являются плагиатом. В таком анализе важно не только то, оформлены или не оформленны ссылки, а в какой последовательности публиковались работы, текст которых отображён в проверяемом документе, не является ли автор текста автором источников заимствований и т.д.. Автор докторской диссертации может, например, заимствовать из своей же кандидатской. Машина проанализировала и выдала результат: «данный фрагмент текста совпадает вот с этим фрагментом из базы данных «Антиплагиата», но только эксперт, проверив всю выдачу, может дать окончательное заключение. И вот этому заключению можно доверять полностью и только с ним можно затевать судебное разбирательство и выносить решение о лишении степени.

— В чём претензия Бурматова?
— Об этом лучше спросить у него самого. Я лишь могу сказать, что наша компания обратилась в суд с иском. Кстати, против нас даже Femen выступили - главная рекламная площадка страны, да ещё и бесплатно! На их плакате было написано: «Антиплагиат - инструмент сексуальных домогательств!» - вот как.

— Как развиваются отношения «Антиплагиата» с официальными госструктурами?
— сентябре прошлого года Медведев выступил в своём видеоблоге, где призвал повысить качество образования, публиковать студенческие и научные работы, тщательно проверять дипломы и диссертации на плагиат и т.д. В связи с этим были даны поручения министерству образования и науки, министерству связи, министерству культуры и открытому правительству к декабрю подготовить предложение. В этот момент министерские чиновники и обнаружили, что «Антиплагиат» уже давно существует. Правда, изначально они думали, что существует он как природное явление, которое ещё нужно лицензировать и регулировать. Но мы-то существуем официально, всё уже давно есть и работает. Нас приглашали на разные заседания, где мы подробно объясняли что это и с чем это едят, дали список вузов, которые давно уже системой пользуются. А в январе появилась информация, что 11 «учёных», по результатам этой проверки будут лишены полученных ученых степеней.

И на фоне шума в прессе, все, наконец, осознали, что теперь (а на самом деле давно!) можно взять любую диссертацию и проверить её на подлинность. И понеслась вереница разоблачений, причём среди них приличное количество совершенно непроверенных утверждений, повторюсь, когда люди просто поленились заглянуть дальше первой выдачи.

— Позиция РАН и Минобрнауки как-то во всех этих спорах стала уже совсем непонятна, как её видите вы?
— От РАН выступил только главный учёный секретарь президиума Владимир Иванов, который высказался в том духе, что окончательное заключение о качестве научной работы должен выдавать научный совет, а не дилетанты. И в его высказывании каких-то нападок конкретно на программу не было. Игорь Федюкин от Минобра высказался примерно так же. Самое интересное, что мы всегда последовательно настаивали именно на таком подходе: окончательное заключение о факте плагиата или его отсутствии может сделать только эксперт.

— Антиплагиат способен поставить под сомнение эффективность российских вузов?
— Да нет же. За эффективность вузов работодатель голосует рублём.Выпускника физтеха МГУ или Вышки возьмут на работу с удовольствием, а выпускника заборостроительной академии брать не будут - вот и вся эффективность. В общем-то эффективность вузов такая же размытая и непонятная история, как ПРНД (показатель результативности научной деятельности). Когда учёные должны каждый год заполнять форму, где отражены их публикации за предыдущий год, участие в конференциях, преподавательская работа, гранты и прочее. В результате всё это измеряется по определённой шкале, тебе начисляются баллы, которые после выливаются в определённые финансовые бонусы. Тут же возникла группа людей, которые работают специально на эти баллы. Но к науке это не имеет никакого отношения.

— А для кого на самом деле существует ваш продукт в первую очередь.
— В образовании можно выделить, условно, управленцев, преподавателей и студентов. В принципе, Антиплагиат создавался по заказу управленца из вуза для того, чтобы повысить качество работы преподавателей и качество учебного процесса у студентов, но преподавателям продукт тоже облегчает жизнь, равно как и студентам – при условии, что они способны проверить себя сами. Ведь неправомерное заимствование по сути криминально из-за отсутствия указания на источник. В конечном счёте мы работаем на повышение уровня научно-образовательных процессов в стране, в том числе через внедрение культуры научного цитирования.

 понедельник, 13 мая 2013 года, 17.45

 http://www.chaskor.ru/article/antiplagiat_31963