«Яндекс» создал технологии выделения смысловых компонентов в речи, а также технологию синтеза речи.
Об этом представители корпорации официально сообщили на конференции YaC (прошла в Москве).
Технология синтеза речи активно используется в процессе озвучивания обновляемой информации.
Например, может использоваться в робототехнике для озвучивания ответов или в телефонии, когда клиенту банка необходимо автоматически озвучить состояние счета.
Синтез речи может быть полезен в мобильных приложениях, что позволит использовать приложение без рук.
Технология распознавания естественного языка (смысловых объектов) позволяет программно выделить в тексте определенные объекты (адрес, дату, имя или время).
Можно использовать, к примеру, в сервисе автоматизированного вызова такси: пользователь голосом сообщает нужную информацию, программа переводит предложения в текст, после чего выделяет из него нужную информацию (время и адрес). Это позволяет оформить заказ в автоматическом режиме.
Протестировать новый функционал Yandex SpeechKit можно в демонстрационной программе «Яндекс.Диктовка». Чтобы активировать распознавание голоса достаточно сказать утилите команду «Яндекс.Записывай». Далее можно продиктовать устройству произвольный текст – SMS-сообщение, рецепт и т.д. Программа переведет произнесенную речь в текст.
Использование технологии вычленения смысловых объектов позволяет использовать команды для редактирования текста: «удалить первое слово», «перейти на новую строку», «заменить слово утро на вечер» или «добавить грустный смайлик». При помощи инструкции «Прочитай все» можно активировать технологию синтеза речи и воспроизвести полученный текст.
Текст, надиктованный в программу, можно перенести в новое SMS-сообщение, электронное письмо, оформить как комментарий в социальной сети, скопировать в буфер обмена, а также сохранить как заметку.
Первый инструмент пакета SpeechKit «Яндекс» анонсировала в октябре 2013 года. Это был инструмент для автоматического распознавания речи. В августе 2014 года компания запустила облачный ресурс SpeechKit Cloud – ресурс позволил внедрить функции распознавания речи в различные устройства – от смартфонов до робототехники и медицинских устройств.