Новости

Главная / Новости

23/10/2018

Алгоритм с рекордной точностью распознавания речи работает даже на бюджетном смартфоне

Обычно системы распознавания речи зависят от вычислительных мощностей удаленных серверов, однако канадские специалисты разработали нейросеть, которая справляется с этой задачей эффективно, быстро и используя минимум ресурсов процессора.

Система EdgeSpeechNets, предложенная разработчиками стартапа DarwinAI и Университета Уотерлу, способна работать даже на недорогих смартфонах. Она основана на нескольких предыдущих достижениях: алгоритмах навигации, температурного контроля и проигрывания музыки, не требующие удаленных серверов, созданных в начале года командой Alexa Machine Learning из Amazon; моделях распознавания голоса на устройстве, представленных в мае Qualcomm; голосовой модели WaveNet для мобильных устройств дублинского стартапа Voysis; и Intel.

Разработчики создали прототип, выполняющий распознавание речи с ограниченным словарем, или поиск ключевых слов — быстрое обнаружение специфических слов в потоке речи, пишет VentureBeat. Затем они выбрали метод трансформации аудиосигнала в математическое представление — так называемый анализ статистического распределения мел-кепстральных коэффициентов — и применили остаточную нейронную сеть для расширения возможностей представлений.

Затем они взялись за генеративный синтез — технологию машинного обучения, которая создает глубокие нейросети с упором на производительность. В данном случае была использована конфигурация, которая обеспечивает точность распознавания не менее 95%.

Для оценки производительности EdgeSpeechNets разработчики использовали набор данных Google Speech Commands, состоящий из 65 000 образцов из 30 коротких слов и фоновых шумов.

Одна из моделей — EdgeSpeechNets-А — показала 97-процентную точность распознавания речи, то есть превзошла все известные результаты.

Другая — EdgeSpeechNets-D — была запущена на телефоне Motorola Moto E с процессором Cortex-A53 с частотой 1,4 ГГц и показала десятикратное уменьшение времени ожидания и снижение объема требуемой памяти на 16,5% по сравнению с современными нейросетями.

В дальнейшем разработчики планируют адаптировать свою технологию к распознаванию зрительных образов и обработке естественной речи.

По мнению главы исследований Google Бена Гомеса, распознавание голоса — основа для дальнейшего развития информационных технологий. Все идет к тому, что информацию можно будет получать в живом диалоге с компьютером. А в какой-то момент нейросети начнут понимать и сложные вопросы.

Avatar
Георгий Голованов

Фото: EAST NEWS

https://hightech.plus/2018/10/23/algoritm-s-rekordnoi-tochnostyu-raspoznavaniya-rechi-rabotaet-dazhe-na-byudzhetnom-smartfone

Аналитика

09.03.2023

«Национальный словарный фонд» объединит 30 словарей

Лингвистика – уже почти политическая наука.

13.07.2022

Не то слово! Филологи выяснили любопытные подробности о разговорной речи

Филологи Санкт-Петербургского госуниверситета, выясняя, какие функции выполняют самые употребляемые в речи слова, создали словарь «прагматических маркеров».

10.05.2022

Нескучный русский: День Победы – пишем правильно

Чтобы в текстах ко Дню Победы было меньше досадных ошибок, даём несколько лингвистических подсказок.

Вся аналитика

Новые словари

Словарь крылатых слов и выражений нашего времени

Словарь содержит более 1300 крылатых слов и выражений. Они восходят к текстам и выступлениям наших современников, а также к произведениям прошлых лет, получившим распространение. Многие выражения зафиксированы в словаре впервые.

Подробнее

Большой словарь церковнославянского языка нового времени. Том 2

Второй том фундаментального многотомного словаря представляет собой систематическое описание лексики церковнославянского языка Нового времени (буква В). Он будет незаменим при чтении библейских, богослужебных, агиографических и других церковнославянских текстов.

Подробнее

Энциклопедия «Русский язык»

Третье издание энциклопедии «Русский язык», переработанное и существенно дополненное, продолжает традицию энциклопедического представления основных сведений об устройстве и особенностях функционирования русского языка в его современном состоянии и историческом развитии.

Подробнее

Новости

Алгоритм с рекордной точностью распознавания речи работает даже на бюджетном смартфоне

Аналитика

«Национальный словарный фонд» объединит 30 словарей

Не то слово! Филологи выяснили любопытные подробности о разговорной речи

Нескучный русский: День Победы – пишем правильно

Новые словари

Словарь крылатых слов и выражений нашего времени

Большой словарь церковнославянского языка нового времени. Том 2

Энциклопедия «Русский язык»

Подключиться к порталу