Vai al contenuto

Questo articolo è disponibile anche in versione podcast audio.

È stato pubblicato pochi giorni fa un nuovo podcast
nel quale il popolarissimo podcaster statunitense Joe
Rogan
intervista un ospite molto speciale: Steve Jobs. I due si
parlano e si scambiano opinioni e battute sull’attualità per una
ventina di minuti, eppure Jobs, cofondatore di Apple, è morto nel
2011.

Medium e spiritisti non c’entrano: la voce del defunto e quella
di Joe Rogan sono state ricreate usando un generatore di voci umane
basato sull’intelligenza artificiale, disponibile presso Play.ht,
e questo non è realmente il podcast di Joe Rogan: se ci avete fatto
caso, infatti, il conduttore si è presentato come Bro Jogan,
presumibilmente per evitare complicazioni legali. Si tratta insomma
di un podcast sintetico dimostrativo, creato appunto da Play.ht.

Il generatore ha usato registrazioni pubbliche della voce di Jobs
e ha “imparato”, per così dire, a parlare come parlava lui. Il
risultato è davvero notevole: la voce è quella caratteristica che
abbiamo sentito per anni nelle presentazioni dei prodotti Apple.

L’unico indizio di artificialità è il tono, che sembra un po’
troppo da palcoscenico e leggermente fuori luogo per una
conversazione personale come è un podcast, ma questo è
probabilmente un effetto dei campioni utilizzati, che provengono
appunto dalle presentazioni fatte in pubblico. La voce di Joe Rogan,
invece, è praticamente perfetta, probabilmente perché il software
ha potuto attingere a tutti i suoi podcast, che hanno il tono giusto.

Play.ht propone un servizio nel quale i clienti usano voci
sintetiche generiche oppure personalizzate. In sostanza, è possibile
mandare all’azienda dei campioni di una voce che si desidera usare
e poi farle dire qualunque cosa. Le demo sono davvero notevoli, con
esempi delle voci sintetiche di Elon Musk, Tom Hanks e persino del
presidente statunitense John Kennedy, assassinato nel 1963.

Per ora questa tecnologia viene usata presso Podcast.ai
dichiarando esplicitamente che si tratta di voci sintetiche create
per intrattenimento e offrendo agli ascoltatori la possibilità di
scegliere gli
ospiti virtuali; inoltre i tempi di generazione sono relativamente
lenti, per cui non è possibile usare software di questo tipo per
imitare qualcuno in diretta al telefono, per esempio. Ma è il caso
di cominciare a non fidarsi delle registrazioni audio di persone
famose o dei nostri amici e conoscenti, specialmente se dicono cose
che non direbbero mai.

Fonte aggiuntiva: Gizmodo.

0 0 voti
Valutazione dell'articolo
Iscriviti
Notificami
guest

0 Commenti
0
Esprimete la vostra opinione commentando.x