AI технология ще може да имитира всеки човешки глас

Дори най-популярните компютъризирани гласове като Siri на Apple, Alexa на Amazon и Cortana на Microsoft все пак звучат като машини. Базираният в Монреал стартъп Lyrebird, изглежда, ще промени това с помощта на система, базирана на изкуствен интелект, която е програмирана да анализира човешката реч и да се обучава как да я възпроизвежда с интонация и емоция.

Речевият генератор бе официално представен миналата седмица, като по време на специалното събитие бе обяснено, че системата може да възпроизвежда хиляди изречения в рамките секунди, което е значително по-бързо от възможностите на вече съществуващите методи.

За да възпроизведат глас, Siri, Alexa и Cortana използват софтуер на принципа от текст-към-реч и „говорят“ на базата на предварително записани файлове на един определен глас. Евентуалното преминаване към друг глас изисква нов аудио файл, съдържащ всяка възможна дума, която устройството може да се наложи да използва в комуникацията с потребителите.

И други компании боравят с изкуствен интелект, за да синтезират човешки гласове като Google например. Project VoCo на Adobe също може да се похвали с постижение в тази област, но нейната система изисква минимум 20-минутно аудио, за да успее да имитира глас.

Постижението на Lyrebird е, че на тази система ѝ е необходима по-малко от 1 минута. Макар и резултатите да не са неразличими от естествената човешка реч, те все пак са впечатляващи, а създателите са сигурни, че с течение на времето ще изчистят несъвършенствата.

На практика Lyrebird може да предостави безкраен каталог от гласове на реално съществуващи хора. Системата ще може да възпроизведе едно и също изречение по най-различни начини.

По отношение на възможността да имитира почти всеки човешки глас възниква и етичният въпрос дали това не е предпоставка технологията да се използва за бъдещи злоупотреби и измами, пише изданието ScientificAmerican.

Източник: Economic.bg.