Новости

Главная / Новости

17/12/2010

ABBYY будет распознавать тексты в «Сколково»

Компания ABBYY получила финансирование государственного фонда "Сколково" для продолжения работы над системой машинного перевода и распознавания текстов NLC, передает CNews.

Над проектом NLC (Natural Language Compiler) компания ABBYY работает уже в течение 15 лет. Информация об этом проекте никогда не была полностью обнародована, и сейчас, после получения гранта, компания решила представить пользователям направление, в котором ведется работа, и некоторые подробности проекта.

Компания сообщила, что сутью проекта-долгожителя является создание системы искусственного интеллекта, наиболее важной задачей для которой будет даже не перевод, а распознавание и анализ текстов, вычленение необходимых кусков текста из огромных массивов данных. При этом разрабатываемая технология не зависит от иностранного языка.

NLC не является отдельной программой, она разрабатывается в качестве перспективной платформы, пригодной для дальнейшей разработки программного обеспечения для смыслового поиска в тексте, нахождения фактов в тексте, не имеющем четкой структуры, для анализа документации и других приложений.

Справка

Обработка естественного языка (Natural Language Processing, NLP) — общее направление искусственного интеллекта и математической лингвистики. Оно изучает проблемы компьютерного анализа и синтеза естественных языков. Применительно к искусственному интеллекту анализ означает понимание языка, а синтез — генерацию грамотного текста. Решение этих проблем будет означать создание более удобной формы взаимодействия компьютера и человека.

Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот некоторые примеры сложностей, с которыми сталкиваются системы понимания текстов.

• Предложения "Мы отдали бананы обезьянам, потому что они были голодные" и "Мы отдали бананы обезьянам, потому что они были перезрелыми" похожи по синтаксической структуре. В одном из них местоимение они относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны. По нормам русского языка второе предложение некорректно, потому что в нем местоимение ссылается не на последнее подходящее слово, однако в живой речи такое предложение очень даже может встретиться.

• Свободный порядок слов может привести к совершенно иному толкованию фразы: "Бытие определяет сознание" — кто кого определяет?

• В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.

• В речи могут встретиться неологизмы, например, глагол "Пятидесятирублируй" — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.

• Правильное понимание омонимов — ещё одна проблема. При распознавании речи, помимо прочих, возникает проблема фонетических омонимов. Во фразе "Серый волк в глухом лесу встретил рыжую лису" выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись. (Кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей.)

Финская Nokia также расположится в "Сколково". Проект компании нацелен на развитие операционных систем, которые используются Nokia для производства телефонов и смартфонов (Symbian и MeeGo), также планируется вести разработки в области мобильных сенсоров, нано- и квантовых технологий, которые можно применить в программном обеспечении для смартфонов.

17.12.2010 10:50
Источник: Таможня.ру
http://www.tamognia.ru/news/nb/1544419/

Аналитика

02.09.2025

71% россиян поддерживает идею обучать школьников использованию ИИ

Как именно это делать? Единого мнения нет.

08.06.2025

Россияне оценили свою грамотность на четверку с минусом

ВЦИОМ опубликовал результаты опроса ко Дню русского языка.

29.05.2025

Экзамен по русскому языку — самый сложный для школьников

Об этом сообщают 27% девятиклассников и 20% одиннадцатиклассников.

Вся аналитика

Новые словари

Словарь крылатых слов и выражений нашего времени

Словарь содержит более 1300 крылатых слов и выражений. Они восходят к текстам и выступлениям наших современников, а также к произведениям прошлых лет, получившим распространение. Многие выражения зафиксированы в словаре впервые.

Подробнее

Большой словарь церковнославянского языка нового времени. Том 2

Второй том фундаментального многотомного словаря представляет собой систематическое описание лексики церковнославянского языка Нового времени (буква В). Он будет незаменим при чтении библейских, богослужебных, агиографических и других церковнославянских текстов.

Подробнее

Энциклопедия «Русский язык»

Третье издание энциклопедии «Русский язык», переработанное и существенно дополненное, продолжает традицию энциклопедического представления основных сведений об устройстве и особенностях функционирования русского языка в его современном состоянии и историческом развитии.

Подробнее

Новости

ABBYY будет распознавать тексты в «Сколково»

Аналитика

71% россиян поддерживает идею обучать школьников использованию ИИ

Россияне оценили свою грамотность на четверку с минусом

Экзамен по русскому языку — самый сложный для школьников

Новые словари

Словарь крылатых слов и выражений нашего времени

Большой словарь церковнославянского языка нового времени. Том 2

Энциклопедия «Русский язык»

Подключиться к порталу