
Google Imagen: un AI che crea immagini a partire da testo, con incredibile realismo
Gli studi sull'intelligenza artificiale sono un campo particolarmente attivo, sempre aperto a novità e innovazioni. Si va dai generatori di testo, in alcuni casi quasi indistinguibili da quelli creati dagli umani, ai generatori di musiche e persino opere d'arte (anche venduti all'asta).
Il mese scorso OpenAI ha svelato DALL-E 2 un programma di intelligenza artificiale che crea immagini fotorealistiche da descrizioni testuali (qui ne parla il famoso Marques Brownlee) e Google ne ha implementato una propria versione, chiamata Imagen.

Come dichiarato da Jeff Dean, responsabile dell'intelligenza artificiale di Google, Imagen aumenta le dimensioni dei modelli generici di linguaggio, in modo da aumentare sia la fedeltà del campione che l'allineamento del testo immagine, e i risultati sono incredibili.

Google ha testato il suo programma attraverso un benchmark per la valutazione dei modelli da testo a immagine chiamato DrawBench. I valutatori umani preferivano "Imagen rispetto ad altri modelli nei confronti affiancati, sia in termini di qualità del campione che di allineamento immagine-testo".
Il problema è purtroppo sempre il solito: come si addestra l'IA (ricordate Meta?). Google infatti non ha rilasciato Imagen in quanto basandosi su codificatori di testo addestrati su dati su scala web non curati, eredita i pregiudizi sociali e le limitazioni dei modelli linguistici di grandi dimensioni. Se volete comunque divertirvi, qui c'è la demo del progetto e qui l'articolo.


