На конференции YaC 2014 Яндекс представил новые разработки в области речевых технологий: голосовую активацию, выделение смысловых объектов из текста и синтез речи. Все три функции доступны в виде библиотеки SpeechKit Mobile SDK и облачной платформы SpeechKit Cloud. Это позволит разработчикам существенно расширить возможности своих продуктов.
Представленные разработки дополняют технологию распознавания речи, созданную Яндексом в 2013 году. Она понимает запросы на русском и турецком языках. Сейчас её используют 500 мобильных приложений, а также сервисы и устройства 600 различных компаний. Качество распознавания зависит от тематики запроса: для географических названий оно составляет 95%, для коротких фраз — 88%, для текстов вроде заметок и смс — 82%. С расширением набора технологий устройства и программы научатся не только распознавать речь, но и понимать, когда обращаются именно к ним, выполнять голосовые команды, а также озвучивать ответы.
Чтобы продемонстрировать новые возможности, Яндекс разработал специальное приложение-витрину Яндекс.Диктовка. Оно записывает под диктовку тексты на русском языке и умеет озвучивать написанное. Распознавание речи начинается по команде «Яндекс, записывай», отредактировать текст также можно с помощью команд. Формулировки могут быть любыми: приложение поймёт, например, и «Удали последнюю фразу», и «Сотри последнее предложение».
Скачать Диктовку можно в Яндекс.Store, в Google Play и App Store она появится чуть позже.