Платформа для видеовстреч "VK Звонки" представила новый функционал – расшифровку звонков и автоматические субтитры. Об этом сообщили в пресс-службе социальной сети "ВКонтакте".
"Функция расшифровки автоматически переводит звуковую дорожку встречи в текст, который можно найти в чате звонка после его окончания", – рассказали представители соцсети.
Автоперевод аудио в текст возможен пока только с русской речью, в дальнейшем собираются добавить другие языки. Текстовую расшифровку может запустить любой пользователь группового звонка, а другие его участники получат уведомление о начале расшифровки.
Файл с текстом сохранится в специальном разделе в профиле пользователя, который включил функцию. К слову, в файле расшифровки автоматически расставляются тайм-коды и имена спикеров.
А что с автоматическими субтитрами?
Они позволят дублировать речь участников звонка в ходе встречи. При этом субтитры будут отображаться лишь у тех пользователей, которые запустили функцию, отметили в пресс-службе.
Там добавили, что нейросеть способна определять разных спикеров и разделять речь на предложения.
Как обеспечивается качество расшифровки аудио?
Перевод устной речи в текст применяет собственные нейросетевые разработки "ВКонтакте", которые соцсеть использует для расшифровки голосовых сообщений и создания автосубтитров в видео. Аудиопоток проходит несколько этапов обработки. Сначала запись очищается от фонового шума, далее нейросеть распознает слова, создает из них текст и наконец делит речь на отдельные предложения.
Представители "ВКонтакте" отметили, что нейросети обучают в том числе на основе разговорной речи и сленга.
Новый функционал доступен всем пользователям "VK Звонков", их можно использовать также в сессионных залах и в звонках от имени сообщества. Кроме того, платформа планирует запустить новые функции в звонках один на один и возможность администратора настраивать, кто из участников встречи может запускать расшифровку.
>>>Больше интересных историй – подпишитесь на наши Telegram, Instagram и Viber