Voi avete mai visto la Gioconda parlare? (video)

Enrico Paccusse - Quest'algoritmo crea sequenze video con una sola immagine di riferimento

I ricercatori dell’AI Center di Samsung fanno il punto sul progresso dei deepfake – frammenti video o audio generati da intelligenze artificiali – e lo fanno sbalordendo il pubblico di tutto il mondo, con le prime immagini di una Gioconda parlante.

Non è la prima volta che vediamo dei video generati dall’intelligenza artificiale (capace anche di creare melodie o poemi), ma è la prima volta che un algoritmo è capace di dare un risultato quanto meno accettabile con un dataset risicato, alle volte persino limitato ad una sola immagine: da qui deriva la straordinarietà dell’evento.

Il segreto sta nell’utilizzo di landmark, ovvero punti di riferimento facciali (occhi, forma della bocca, lunghezza e forma del naso) e nell’aver addestrato l’algoritmo su un database di oltre 7.000 immagini di celebrità ottenute da YouTube (ed offerte da VoxCeleb), così da avere un metro di paragone ed un modello da replicare con le immagini poi sottoposte.

LEGGI ANCHE: Queste persone non esistono, sono frutto dell’IA

Nel video in allegato potete vedere in tempo reale l’utilizzo del software, e anche la differenza tra i risultati ottenuti, che migliorano con l’aumentare delle immagini a disposizione. Chiaramente non si tratta di finzioni che, al momento, possano ingannare l’occhio umano, ma la tecnologia ci ha abituato a crescite esponenziali, quindi meglio essere sempre vigili.

Via: TheVergeFonte: arXiv