Яндекс научился синтезировать речь и понимать естественный язык


«Яндекс» создал технологии выделения смысловых компонентов в речи, а также технологию синтеза речи.

Об этом представители корпорации официально сообщили на конференции YaC (прошла в Москве).

Технология синтеза речи активно используется в процессе озвучивания обновляемой информации.

Например, может использоваться в робототехнике для озвучивания ответов или в телефонии, когда клиенту банка необходимо автоматически озвучить состояние счета.

Яндекс.Диктовка

Яндекс.Диктовка

Синтез речи может быть полезен в мобильных приложениях, что позволит использовать приложение без рук.
Технология распознавания естественного языка (смысловых объектов) позволяет программно выделить в тексте определенные объекты (адрес, дату, имя или время).

Можно использовать, к примеру, в сервисе автоматизированного вызова такси: пользователь голосом сообщает нужную информацию, программа переводит предложения в текст, после чего выделяет из него нужную информацию (время и адрес). Это позволяет оформить заказ в автоматическом режиме.

Протестировать новый функционал Yandex SpeechKit можно в демонстрационной программе «Яндекс.Диктовка». Чтобы активировать распознавание голоса достаточно сказать утилите команду «Яндекс.Записывай». Далее можно продиктовать устройству произвольный текст – SMS-сообщение, рецепт и т.д. Программа переведет произнесенную речь в текст.

Использование технологии вычленения смысловых объектов позволяет использовать команды для редактирования текста: «удалить первое слово», «перейти на новую строку», «заменить слово утро на вечер» или «добавить грустный смайлик». При помощи инструкции «Прочитай все» можно активировать технологию синтеза речи и воспроизвести полученный текст.

Текст, надиктованный в программу, можно перенести в новое SMS-сообщение, электронное письмо, оформить как комментарий в социальной сети, скопировать в буфер обмена, а также сохранить как заметку.

Первый инструмент пакета SpeechKit «Яндекс» анонсировала в октябре 2013 года. Это был инструмент для автоматического распознавания речи. В августе 2014 года компания запустила облачный ресурс SpeechKit Cloud – ресурс позволил внедрить функции распознавания речи в различные устройства – от смартфонов до робототехники и медицинских устройств.

580 на 303   25 простых СПОСОБов ЗАРАБОТКА скачать

Комментирование и размещение ссылок запрещено.

Комментарии закрыты.


580 на 303   25 простых СПОСОБов ЗАРАБОТКА скачать