Социальная сеть «ВКонтакте» запустила технологию распознавания аудиосообщений для тех, кто устал, не хочет или не может слушать голосовые сообщения. Чтобы прочитать текст, достаточно нажать соответствующую кнопку.
«Расшифровка аудиосообщений — уникальная и по-своему интересная задача, которая значительно отличается, например, от распознавания речи в голосовых помощниках. С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке», — рассказал о технологии директор по исследованиям в области искусственного интеллекта «ВКонтакте» Павел Калайдин.
Функция пока работает только в мобильном приложении и расшифровывает сообщения длительностью до 30 секунд.
Подписывайтесь на наш канал в Telegram — подборка главных новостей за день.
Комментарии (0)