Российская интернет-компания «Яндекс» в среду, 2 октября, представила
собственную технологию мобильного голосового поиска. Технология
получила название Yandex SpeechKit; она работает на Android и iOS и
«понимает» только запросы на русском языке.
Руководитель проекта Yandex SpeechKit Денис Филиппов рассказал
«Ленте.ру», что разработка «Яндекса» правильно распознает 84 процента
слов в запросах общей тематики и 94 процента слов — в географических
запросах (например, названия населенных пунктов и улиц). Среднее время
ожидания ответа от системы составляет 1,1 секунды.
В своей работе Yandex SpeechKit опирается на акустические и языковые
модели, составленные «Яндексом». Чтобы получить акустические модели,
потребовалось записать и разметить 300 часов мужской, женской и детской
речи. Языковые модели формировали на основе поисковых запросов и
специально подготовленных текстов.
«Яндекс» начиная со 2 октября использует Yandex SpeechKit в
собственных мобильных сервисах. Кроме того, компания «поделится»
технологией со сторонними разработчиками. Необходимая документация и
дистрибутивы доступны
на ресурсе «Яндекс.Технологии». SpeechKit можно использовать бесплатно,
если количество запросов в программе не превышает 10 тысяч в день.
Распознавать русскую устную речь на мобильных устройствах умеют и
продукты других компаний — в частности, технология компании Nuance и
созданный Google интерфейс Android Speech API. Последний, однако,
работает только на платформе Android.