В этом году на рынке появится первое приложение для трансляции русской разговорной речи в текст, сообщил CNews его разработчик «Центр речевых технологий». Первые «диктовочные» решения ориентированы на работу с SMS, чатами и соцсетями и будут доступны для различных мобильных платформ, включая iPhone.
До конца 2011 г. на рынок выйдет первое приложение класса «диктовочный блокнот», предназначенное для преобразования надиктованной русской речи в текст. Об этом рассказал CNews директор питерского «Центра речевых технологий» Михаил Хитров. Приложение будет выпущено для нескольких мобильных платформ, включая и iOS.
Сама система для распознавания русской слитной речи «Руссограф» была создана в «Центре речевых технологий» (ЦРТ) еще в 2008 г., появление массовых решений на ее основе тормозилось необходимостью создания словаря словоформ. Как говорит рукодвитель группы в ЦРТ Алексей Рыбаков, если для создания англоязычного продукта достаточно словарной базы размером 5 тыс. словоформ, то для русскоязычного требуется 500 тыс.
Михаил Хитров добавляет, что, помимо накопления словарей, «речь шла о придании платформе большей интеллектуальности, способности правильно обрабатывать множество похожих форм слов и учитывать правила русского языка».
Сейчас в мире существуют только два математических ядра для работы со слитной русской речью, одно из которых принадлежит разработчикам ЦРТ, а другое — компании из Массачусетса Nuance Communications.
Nuance хорошо известна своими «диктовочными» продуктами из семейства Dragon, выпущенными в том числе и для мобильных платформ. Они адресованы, главным образом, англоговорящим пользователям. «Диктовального блокнота», основанного на «русском» ядре, у Nuance пока нет.
Интерес к мобильным «распознавалкам речи» усилился, когда Google запустил голосовой поиск.
Интересно, что в процессе разработки своих продуктов и в Nuance, и в ЦРТ пришли к выводу, что наиболее простым для разработки и одновременно актуальным для рынка являются приложения, ориентированные на применение в медицине. Это обусловлено, с одной стороны, высокой стоимостью рабочего времени западного врача, а с другой — с высокой регламентацией профессиональной речи медицинского работника, что позволяет со сравнительно небольшими усилиями создавать специализированные словарные базы.
Помимо «медицинского» приложения, в ЦРТ существуют наработки для диктовки новостей: «Более того, даже внутри новостной тематики мы выделяем различные тематики: спорт, экономика, политика», - говорит Михаил Хитров.
Однако в первую очередь, по словам руководителя ЦРТ, на рынке появится мобильное приложение разговорной тематики, востребованной у конечных пользователей, для работы с SMS, электронной почтой, чатами, сообщениями в социальных сетях и блогах.
Насколько известно CNews, сейчас осуществляется как минимум одно промышленное внедрение «диктовочного» решения ЦРТ - в медицинских учреждениях Санкт-Петербурга по заказу городского правительства. ЦРТ, подтверждая сам факт внедрения, не раскрывает по этому поводу никаких подробностей.
CNews.ru: Главные новости
28.03.2011, 15:03:44
--------------------------------------------------------------------------------
Адрес новости: http://www.cnews.ru/news/top/index.shtml?2011/03/28/433808
--------------------------------------------------------------------------------
Все права защищены © 1995 – 2011 РИА «РосБизнесКонсалтинг»