Sonantic, la tecnologia che riproduce le voci

Sonantic, la tecnologia che riproduce le voci
SmartWorld team
SmartWorld team

Sono molte le startup che negli ultimi anni si sono dedicate alla riproduzione di voci artificiali o che non esistono più. Dal mondo dei giochi e degli assistenti vocali ci si muove verso il cinema e l'intrattenimento.

Sonantic e il video di Val Kilmer

Sonantic è una startup che lavora nel campo della riproduzione vocale. La sua notorietà è aumentata recentemente grazie a un video caricato su YouTube. Realizzato in collaborazione con Val Kilmer, nel video si sente la voce dell'attore statunitense anticipata da un messaggio scritto che riporta quanto segue: “L’intero discorso è stato generato al computer.

Ciò che segue è stato creato da Sonantic e Val Kilmer. Per riprodurre la voce di Val sono state utilizzate delle vecchie registrazioni”. Kilmer racconta la sua storia: nel 2015 ha affrontato un intervento a causa di un tumore alla gola che ha cambiato la sua voce, così come tutti la conoscevano, in maniera irreversibile. L'attore si è rivolto a Sonantic, con cui ha collaborato, al fine di riprodurre la sua voce originale.

Le voci artificiali

Sonantic non è l’unica a operare nel settore.

La tecnologia impiegata per creare o riprodurre voci viene utilizzata da moltissime aziende. Si tratta di un settore piuttosto giovane. La riproduzione delle voci di personaggi noti o la creazione di nuove può essere impiegata in diversi settori. Basti pensare, ad esempio, alle assistenti vocali come Siri e Alexa, o al caso di Val Kilmer precedentemente citato. L’intelligenza artificiale impiegata per la riproduzione o creazioni di voci potrebbe aprire nuove strade in settori ancora poco esplorati, come quello dell’intrattenimento.

LEGGI ANCHE: I dispositivi Alexa stanno ricevendo una nuova opzione vocale dal sound maschile

Una tecnologia innovativa

“Sonantic ha costruito una potente piattaforma vocale IA che permette ai professionisti dell'intrattenimento di creare performance vocali convincenti, ricche di sfumature e straordinariamente realistiche. Questa tecnologia innovativa è pronta a rivoluzionare la produzione di giochi e film, permettendo agli studios di accelerare i flussi di lavoro creativi e scalare la narrazione come mai prima. Con un background che va dalla terapia della parola e del linguaggio alla produzione del suono di Hollywood, i fondatori di Sonantic sono impegnati a collegare i mondi dell'espressione creativa e della tecnologia avanzata. Attraverso la collaborazione continua con attori, esperti dell'industria dell'intrattenimento e tecnologi, l'azienda si sforza di fornire le migliori soluzioni di intrattenimento ora e in futuro” si legge sul sito ufficiale.

Dal mondo dei videogiochi all'intrattenimento

Sonantic, fondata tre anni fa da Zeena Qureshi e John Flynn, opera principalmente nel settore dei videogiochi. La startup crea dei software che permettono di modificare le voci dei personaggi. Flynn, il responsabile tecnologico ha affermato: “Ci piace pensare che sia come Photoshop per la voce, dove si può entrare e ritoccare piccole aree”. Generalmente si ha bisogno di circa tre ore di audio per ricreare una voce entro una giornata. Nel caso di Kilmer, ha raccontato Flynn, la voce è stata riprodotta con soli trenta minuti di audio a causa delle licenze dei suoi film.

Come viene riprodotta una voce

Gli ingegneri partono da alcuni campioni di audio ed estraggono da questi la voce degli attori, eliminando il rumore di fondo. Dopo aver creato uno script basato sul materiale a disposizione procedono con l'utilizzo degli algoritmi definiti “voice engine", che imparano a parlare ascoltando le registrazioni. Il tono della voce cambia a seconda del significato dalle parole scritte, dunque potremmo dire che questa tecnologia, in un certo senso, è in grado di riprodurre anche le emozioni attraverso le sfumature della voce.

Creare dei modelli dalle voci degli attori

La startup lavora con con attori professionisti creando modelli della loro voce. Ogni volta che questa voce artificiale viene utilizzata, gli attori ottengono un profitto, generando loro, quindi, un reddito passivo. Secondo l’azienda, questa strategia consentirebbe agli artisti di lavorare su più progetti contemporaneamente, non dovendo appunto eseguire il lavoro in prima persona. Dall'altro lato, per gli studios e i creatori questo strumento risulta più veloce ed economico. Dati i molteplici utilizzi delle voci registrate in varie aree del mercato del lavoro, questo settore sembra diretto verso l’espansione. Questo modus operandi potrebbe rivelarsi una nuova normalità nel giro di pochi anni.

LEGGI ANCHE: Messenger dà voce alle emoji: arrivano le Soundmojis

Commenta