Изкуствен интелект симулира гласа на всеки

Изкуствен интелект симулира гласа на всеки
A A+ A++ A

Почитателите на филмите "Терминатор" знаят, че едноименните роботи имат способността да копират гласа на всеки. Същото вече е възможно и в реалността чрез нов изкуствен интелект, съобщава Ars technica.

Изкуственият интелект VALL-E е дело на Microsoft. Той може да синтезира гласа на всеки човек, като дори запазва емоционален тон на изказването. Така всеки може да бъде "записан" да казва каквото и да е дори това да не се е случило.

За целта VALL-E е нуждае от едва 3 сек. запис на оригиналния глас. Това е достатъчно, за да се анализират акустичните характеристики на гласа. Той се разделя на "токени", т.е. малки елементи, които се сравняват с база данни. Чрез тях изкуственият интелект "разбира" как би звучал гласът във всякакви ситуации и изказвания.

VALL-E е базиран на EnCodec на Meta, като е обучен с база данни от над 60 000 часа записи на 7000 англоговорящи. За сега изкуственият интелект може да синтезира глас само на английски. Резултатите са най-добри, ако гласът е сходен с някой от вече наличните в базата данни.

Но потенциалът му е видим и има и още възможности. Една от тях е да генерира и акустичната среда около гласа, т.е. да звучи сякаш говори по телефона например. Могат да се генерират и вариации в тона на гласа.

Заради потенциалния риск от манипулации и злоупотреби, Microsoft не публикува кода на изкуствения интелект. Експертите казват, че първо трябва да се направи друг компютърен модел, който да може да анализира записите и да казва дали те са оригинални или синтезирани от изкуствен интелект.

#технологии

Последвайте ни в Twitter и Facebook

Още по темата:

Коментирай

Най-четено от Технологии
Последно от Технологии

Всички новини от Технологии »

Инбет Казино

Анкета

Отрази ли се инфлацията на джоба Ви преди великденските празници