Компания Microsoft представила свою новую нейросеть, которая может за несколько секунд сымитировать голос человека.
Разработка получила название VALL-E и за три секунды способна обучиться человеческой речи. Причем отличить ее произношение от реальной личности будет очень непросто.
Кроме того, нейросеть отличается от других подобных технологий еще и тем, что может имитировать эмоции и тон говорящего. Это впечатляет и настораживает одновременно.
Специалисты подчеркивают, что нейросеть обучалась человеческому произношению с помощью 60 тыс. часов английской речи.
Разработка делает внушительные успехи, однако еще местами можно догадаться, что фраза произнесена машиной.
VALL-E от Microsoft пока доступна для узкого круга лиц, однако существует угроза, что технология попадет в плохие руки.
Специалисты не исключают вероятности, что в этом случае нейросеть может стать эффективным инструментом мошенников, которые будут совершать реалистичные спам-звонки, имитируя голос родственников и знакомых человека.
Впрочем, пока технология еще дорабатывается, однако оценить ее результаты вы можете по этой ссылке.
>>>Больше интересных историй – подпишитесь на наши Telegram и Viber