Cos'è l'IA generativa, l'intelligenza artificiale che "crea contenuti originali"

Cos'è l'IA generativa, l'intelligenza artificiale che "crea contenuti originali"
Alessandro Nodari
Alessandro Nodari

Con l'avvento di ChatGPT, DALL-E o Midjourney, nelle nostre vite ha fatto irruzione un tipo particolare di intelligenza artificiale, in grado di creare, o meglio generare, contenuti a partire da una nostra indicazione. Ma cos'è l'intelligenza artificiale generativa (o IA Generativa)? 

Per rispondere a questa domanda, dovremo comprendere meglio cosa sia l'intelligenza artificiale, un termine che si sente sempre più di frequente, e come sia stato possibile arrivare, grazie a essa, alle soglie di un cambiamento niente meno che epocale per la nostra specie. 

Andiamo quindi a scoprire come può un algoritmo generare contenuti in modo così strabiliante, e quali siano possibilità e rischi di questa tecnologia, oltre a ricordarvi i nostri approfondimenti sui soprannominati ChatGPT e Midjourney.

Indice

Cos'è l'intelligenza artificiale

ChatGPT, Bing Chat, Google Bard, Midjourney, DALL-E. Difficile navigare su Internet senza incontrare questi nomi, che a partire dalla seconda metà del 2022 hanno segnato una rivoluzione che ha cambiato non solo il nostro rapporto con la rete, ma con il tempo modificherà profondamente la nostra società.

Questi programmi sono alimentati da modelli grandi dimensioni che consentono di comprendere il nostro input e generare di conseguenza un testo che suoni naturale o immagini incredibili. Ecco perché si parla di intelligenza artificiale (IA) generativa.

Ma prima di capire cosa sia l'IA generativa, dobbiamo fare un passo indietro e spiegare cosa sia l'IA in senso più ampio. Dunque, cos'è esattamente l'IA?

Intelligenza artificiale è un termine che definisce tutti quei sistemi informatici avanzati che "imitano" l'intelligenza umana per eseguire determinati compiti. Abbiamo a che fare con esempi di intelligenza artificiale tutti i giorni, dagli assistenti vocali, ai chatbot che rispondono alle nostre domande sui siti web.

Il termine è stato coniato per la prima volta nel 2004 da John McCarthy in un articolo in cui spiegava come l'IA fosse "la scienza e l'ingegneria per realizzare macchine intelligenti, in particolare programmi per computer intelligenti. È legato al compito simile di utilizzare i computer per comprendere l'intelligenza umana, ma l'IA non deve limitarsi a metodi biologicamente osservabili".

Ma se il termine ha origini recenti, il concetto di intelligenza artificiale è ben più radicato nella nostra cultura, anche di tipo popolare. Chi non conosce il famoso "Test di Turing"? Nel 1950, il geniale matematico inglese, spesso indicato come il padre dell'informatica, ha proposto un test per determinare attraverso una serie di domande se un interlocutore fosse umano o meno. La domanda di partenza, "Le macchine possono pensare?" sembra quanto mai attuale, e le innovative idee di Turing nel campo della linguistica, mai come ora pertinenti. 

Ma torniamo all'IA. Nella sua forma più semplice, l'intelligenza artificiale è un campo che combina l'informatica e grandi set di dati per consentire la risoluzione dei problemi, ma non c'è un unico tipo di intelligenza artificiale.

Ci sono infatti diverse branche di questa vera e propria scienza, e il machine learning, o apprendimento automatico, è quello oggi vediamo più comunemente nell'IA. Andiamo a scoprire cosa sia.

Cos'è il machine learning

Cos'è l'intelligenza artificiale generativa

Quando si parla di intelligenza artificiale, in genere si associano anche i termini machine learning (apprendimento automatico) e deep learning (apprendimento profondo).

Il machine learning e il deep learning sono quindi entrambi tipi di intelligenza artificiale, ma mentre il primo utilizza algoritmi per analizzare i dati, apprendere da tali dati e prendere decisioni informate in base a ciò che ha appreso, adattandosi automaticamente con la minima interferenza umana, il secondo è un sottoinsieme del machine learning che utilizza reti neurali artificiali per imitare il processo di apprendimento del cervello umano e prendere decisioni in completa autonomia.

La parola "apprendimento" ha un significato particolare, perché questi sistemi informatici in effetti apprendono da alcuni esempi, set di dati che vengono loro proposti e che consentono di sviluppare determinate capacità.

Il volume sempre crescente e la complessità di questi dati li hanno resi ingestibili dagli esseri umani hanno aumentato il potenziale dell'apprendimento automatico, così come la sua necessità.

Le macchine che imparano dagli esempi e sfruttano l'apprendimento automatico vengono chiamate reti neurali. Ma come funziona l'apprendimento automatico? 

Semplificando, non è molto diverso da quello che facciamo noi per imparare. Se per esempio vogliamo sapere se in un'immagine c'è un cane, si offrono alla rete neurale una serie di esempi che permettano di associare la parola cane all'immagine del cane. Questa parte è chiamata classificazione: si mette un tag per dire al modello che quella parte dell'immagine è un cane, e "lui" riesce a poco a poco a distinguerla dagli altri dettagli nell'immagine. 

Per i modelli di linguaggio, è più o meno la stessa cosa. Gli si forniscono una quantità sterminata di letture, in modo che abbia la possibilità di sapere in maniera più chiara come comportarsi quando gli verrà chiesto di generare.

Più è grande il set di dati che si offre al modello, maggiore sarà la sua capacità di sviluppare contenuti apprezzabili. Modelli come GPT-3 o GPT-4, che hanno utilizzato 175 e 1000 miliardi di parametri rispettivamente, sono chiamati modelli di linguaggio di grandi dimensioni (LLM, large language models).

Per contro, DALL-E e Midjourney hanno utilizzato molti meno parametri per addestrarsi, 3,5 e 5 miliardi rispettivamente. 

Capirete che il parallelismo con la mente umana inizia a vacillare. Ma è nel momento in cui chiediamo al modello di creare qualcosa che evidenzia la maggiore differenza. In termini di "potenza bruta" di calcolo, la nostra mente non può tenere il passo con un sistema informatico, ma questo recupera lo svantaggio della comprensione grazie proprio ad esso. Un modello di linguaggio non "sa" cosa debba mettere dopo una parola perché abbia senso, ma grazie all'apprendimento automatico riesce a prevedere in maniera probabilistica cosa possa andare bene.

Se per esempio abbiamo fornito al modello pochi dati, nel momento in cui deve scrivere la frase "Giorgio beve un..." potrebbe mettere liquido, o marrone, riferendosi per esempio al colore del tè. Con più dati a disposizione, il modello potrebbe completare meglio la frase e mettere a fuoco con maggiore probabilità le parole nel contesto. Quindi se Giorgio è a casa della zia potrebbe bere un tè, mentre se si trova al bar con gli amici potrebbe bere una gazzosa, o una birra.  

E se negli ultimi anni c'è stata una vera e propria corsa all'aumento dei parametri per addestrare meglio il modello, è anche vero che si è cercato di invertire la tendenza creando algoritmi che necessitassero di meno parametri (e quindi costassero meno). Un esempio è DALL-E. La prima versione necessitava di 12 miliardi di parametri, mentre DALL-E 2 ne ha avuto bisogno di "appena" 3,5.

I modelli di linguaggio sono già applicati in molti contesti, pensiamo solo alla previsione del testo delle tastiere dei dispositivi mobili, o alle funzioni intelligenti di Gmail, ma è con l'IA generativa che si è fatto il vero salto di qualità. Andiamo finalmente a scoprire cosa sia.

Cos'è l'intelligenza artificiale generativa

Cos'è l'intelligenza artificiale generativa

Adesso abbiamo le informazioni per comprendere cosa sia l'IA generativa: è un algoritmo di IA che genera nuovi output in base ai dati su cui è stato addestrato. Se infatti un sistema di intelligenza artificiale è progettato per riconoscere modelli e fare previsioni, l'IA generativa crea nuovi contenuti sotto forma di immagini, testo, audio e altro ancora.

La differenza non è da poco, perché l'IA generativa utilizza molta più potenza di elaborazione di un'IA normale, ed è per questo che è incredibilmente più costosa (e il suo sviluppo limitato a pochi attori oggetto di investimenti miliardari, come OpenAI).

E i modelli linguistici non sono limitati alla creazione di testi o linguaggio, ma possono essere utilizzati per generare altri tipi di output, come nuove immagini, audio e persino video. 

Esistono diversi tipi di modelli di intelligenza artificiale generativa, ciascuno progettato per affrontare applicazioni specifiche.

I GAN (Generative adversarial networks) sono composti da due modelli di machine learning che vengono addestrati contemporaneamente. Uno è chiamato generatore e l'altro è chiamato discriminatore. Il compito del generatore è creare nuovi output che assomigliano ai dati di addestramento, mentre il discriminatore deve valutare i dati generati e fornire un feedback al generatore per migliorarne l'output. Amazon usa da tempo i GAN per generare musica. 

I Transformer, come ChatGPT e GPT-3.5 di OpenAI, sono reti neurali progettate per l'elaborazione del linguaggio naturale. Sono addestrati su grandi quantità di dati per apprendere le relazioni tra dati sequenziali, come parole e frasi, rendendoli utili per le attività di generazione del testo.

I VAE (Variational autoencoders) utilizzano un codificatore e un decodificatore per generare contenuti. Il codificatore prende i dati di input, come immagini o testo, e li semplifica in una forma più compatta che ne cattura le caratteristiche. Il decodificatore prende questi dati codificati e li ristruttura in qualcosa di nuovo che assomiglia all'input originale. In sostanza, i processi di codifica e decodifica consentono al modello di apprendere una rappresentazione compatta della distribuzione dei dati, che può quindi utilizzare per generare nuovi output.

I modelli multimodali possono elaborare più tipi di dati di input, inclusi testo, audio e immagini; combinano diverse modalità per creare output più sofisticati. Gli esempi includono DALL-E 2 e GPT-4 di OpenAI, che è anche in grado di accettare input di immagini e testo.

Alcuni modelli di intelligenza artificiale generativa possono persino utilizzare il rumore casuale come input per generare nuovi output. In questo approccio, il modello prende un vettore di rumore casuale come input, lo passa attraverso la rete e genera un output simile ai dati di addestramento.

I nuovi dati possono quindi essere utilizzati come dati di addestramento sintetici aggiuntivi per applicazioni creative nell'arte, nella musica e nella generazione di testi.

Come vedete, la situazione è molto complessa, ma il concetto di fondo è che tramite l'IA generativa si generano contenuti originali. Questo ha un enorme potenziale, soprattutto in campo creativo. Se all'inizio la tecnologia è stata inizialmente utilizzata per automatizzare i processi ripetitivi utilizzati nella correzione delle immagini digitali e dell'audio digitale, ora ha la capacità di "sostituire" la mente umana in una serie di campi, che vanno dalla produzione di testi, di immagini, di musica e persino di programmi informatici, come per ChatGPT e Google Bard. 

Abbiamo usato il termine "sostituire" non a caso, perché l'IA generativa, essendo in grado di creare contenuti, permette in teoria di "saltare" l'intermediario umano, ma non è detto che sia così. Può essere un'opportunità, per esempio per ispirare la generazione di bozze.

Andiamo ad approfondire questo punto più nel dettaglio nei prossimi capitoli.

Esempi di intelligenza artificiale generativa

L'IA generativa ha compiuto progressi significativi negli ultimi anni, e giganti del Web come Amazon, Google e Microsoft hanno investito pesantemente per poterne sfruttare le potenzialità.

Le applicazioni sono le più disparate, ma in generale si parte da un prompt che guida verso la produzione di un risultato desiderato, che sia un testo o un'immagine, come succede per ChatGPT e Midjourney.

Ecco alcuni degli esempi più famosi di IA Generativa:

  • ChatGPT: sviluppato da OpenAI, è un modello di linguaggio AI in grado di generare testo simile a quello umano in base a determinati prompt
  • DALL-E 2: un altro modello di intelligenza artificiale generativa di OpenAI, è progettato per creare immagini e opere d'arte basate su prompt basati su testo
  • Midjourney: sviluppato da Midjourney Inc., questo modello interpreta le richieste di testo e il contesto per produrre immagini
  • Google Bard: creato da Google, questo chatbot consente di generare testo in un linguaggio naturale, ma con capacità anche di creare codice informatico
  • Bing Chat: basato su GPT-4 di OpenAI e il motore di ricerca Bing, Bing Chat è un modello generativo di testo in grado di rispondere alle vostre ricerche in linguaggio naturale
  • Bing Image Creator: come Bing Chat, è uno strumento di Microsoft che si basa sulle tecnologie di OpenAI, in questo caso DALL-E per la produzione di immagini a partire da un prompt
  • GitHub Copilot: uno strumento di creazione di codice basato sull'intelligenza artificiale creato da GitHub e OpenAI, suggerisce completamenti del codice per gli utenti di ambienti di sviluppo come Visual Studio e JetBrains
  • DeepDream Generator: una piattaforma open source che utilizza algoritmi di deep learning per creare immagini surreali e oniriche.
  • Write With Transformer: consente agli utenti di utilizzare i modelli ML del trasformatore di Hugging Face per generare testo, rispondere a domande e completare frasi.
  • AI Dungeon: questo gioco di avventura online utilizza un modello di linguaggio generativo per creare trame uniche basate sulle scelte dei giocatori.
  • Writesonic: questa piattaforma di scrittura e generazione di immagini è una scelta popolare per la descrizione dei prodotti di e-commerce.
  • Amper Music: crea tracce musicali da campioni preregistrati.
  • AIVA: utilizza algoritmi AI per comporre musica originale in vari generi e stili.
  • Ecrette Music: utilizza l'intelligenza artificiale per creare musica royalty free per progetti sia personali che commerciali.
  • Musenet: può produrre canzoni utilizzando fino a dieci diversi strumenti e musica in un massimo di 15 stili diversi.
  • Ultimo ma non meno importante, un esempio pratico: l'immagine di copertina di questo stesso articolo è stata creata da una IA generativa con la query "intelligenza artificiale generativa".

L'impatto dell'intelligenza artificiale generativa

L'intelligenza artificiale generativa di oggi può creare contenuti che sembrano scritti da esseri umani e superare il test di Turing, quindi sarebbe riduttivo affermare che sta avendo e avrà un effetto dirompente sulla nostra società.

La tecnologia, pur all'inizio, ha già trovato una serie di applicazioni in diversi settori, e un articolo pubblicato lo scorso mese su SSRN (Social Science Research Network), ha mostrato l'impatto sul mondo del lavoro da qui ai prossimi anni. Il Washington Post ha riassunto il contenuto utilizzando pratiche tavole interattive e praticamente potrete inserire il vostro lavoro per scoprire se e quanto sarà impattato dall'IA nel breve-medio termine. 

Il risultato: molta gente perderà il posto di lavoro

Il motivo è presto detto. Nella creazione di contenuti, l'IA generativa può produrre testo, immagini e persino musica, assistendo esperti di marketing, giornalisti e artisti nei loro processi creativi. Nell'assistenza clienti, i chatbot e gli assistenti virtuali basati sull'intelligenza artificiale possono fornire un'assistenza più personalizzata e ridurre i tempi di risposta, riducendo al contempo il carico sugli agenti del servizio clienti.

Questo è un esempio di come l'IA generativa può sostituire un redattore di articoli.

Mettiamo che dobbiate mettere insieme un opuscolo assicurativo da un elenco di polizze, insieme ai relativi costi, benefici e altri dettagli.

Tradizionalmente, uno scrittore umano darebbe un'occhiata a tutti quei dati grezzi, prenderebbe appunti e scriverebbe una narrazione. Con l'IA generativa, gli algoritmi di apprendimento possono rivedere i dati grezzi in modo programmatico e creare una narrazione che sembra essere stata scritta da un essere umano, in una frazione infinitesimale del tempo (e del costo). 

Ma questo non è l'unico campo in cui l'IA generativa avrà un impatto. L'IA Generativa sostituirà l'uomo? Martin Ford è convinto di sì, e sicuramente l'impatto sarà macroscopico sulla nostra società. Ma come tutte le tecnologie, ha sia vantaggi che svantaggi. Andiamo a scoprirli.

Possibilità dell'intelligenza artificiale generativa

I modelli di IA generativa rappresentano un'opportunità per le imprese. Scrittura, programmazione, creazione di immagini, sono pochi i campi dove l'IA non farà sentire il suo effetto. E con il tempo e le risorse risparmiati, le società possono perseguire nuove opportunità di business e creare più valore.

Ecco i settori per cui l'IA generativa rappresenterà un vero e proprio cambiamento.

  • Lavoro di ufficio: l'IA generativa può essere usata per scrivere email o lettere di routine che portano via molto tempo
  • Pubblicazione sul Web: i modelli di intelligenza artificiale generativa possono essere utilizzati per creare testi di saggistica accattivanti, immagini digitali, contenuti video e audio.
  • Arte e intrattenimento: i modelli di intelligenza artificiale generativa possono essere utilizzati per creare contenuti nuovi coinvolgenti. Questo è un punto molto dibattuto, in quanto per creare arte AI, questi modelli devono essere addestrati su miliardi di immagini da Internet. Queste immagini sono spesso opere d'arte prodotte da un artista, che vengono poi reinventate e riproposte per generare la vostra immagine. Anche se non è la stessa immagine, la nuova immagine ha elementi del lavoro originale di un artista, che non viene riconosciuto (o pagato). Uno stile specifico che è unico per l'artista può quindi finire per essere replicato dall'intelligenza artificiale e utilizzato per una nuova immagine, senza che l'artista originale lo sappia o approvi. Sono immagini nuove, repliche, o è addirittura arte? Il dibattito è aperto
  • Gestione degli investimenti: i modelli di intelligenza artificiale generativa possono essere utilizzati per ottimizzare i portafogli di investimento analizzando un'ampia gamma di dati di mercato e quindi generando previsioni dettagliate basate sulle prestazioni passate e sulle attuali tendenze del mercato.
  • Sanità: i modelli di intelligenza artificiale possono essere utilizzati per generare piani di trattamento personalizzati e immagini che possono essere utilizzate per ottimizzare le applicazioni di analisi delle immagini mediche. Oppure anche per la scoperta di nuovi farmaci, tagliando i costi della ricerca
  • Marketing: gli inserzionisti utilizzano l'intelligenza artificiale generativa per creare campagne personalizzate e adattare i contenuti alle preferenze dei consumatori
  • Istruzione: alcuni educatori utilizzano modelli di intelligenza artificiale generativa per sviluppare materiali di apprendimento personalizzati e valutazioni che soddisfano gli stili di apprendimento individuali degli studenti. David Banks, direttore del New York City Public Schools, il sistema scolastico più grande degli Stati Uniti, ha appena aperto all'utilizzo di ChatGPT nelle scuole
  • Ambiente: gli scienziati del clima utilizzano modelli generativi di intelligenza artificiale per prevedere i modelli meteorologici e simulare gli effetti del cambiamento climatico.
  • Assistenza clienti: i chatbot generativi possono essere utilizzati per rispondere alle domande dei clienti e fornire messaggi di marketing personalizzati.

Il problema è che lo sviluppo di un modello di intelligenza artificiale generativa richiede così tante risorse che è riservato solo alle aziende maggiori.

Questo vuol dire che se tutti potranno accedere a questi strumenti a basso costo, solo le aziende con più risorse potranno utilizzare l'IA generativa fuori dagli schemi o di perfezionarla per eseguire un'attività specifica. Ma questo è solo uno degli esempi dei rischi che approfondiremo nel prossimo capitolo.

Pericoli dell'intelligenza artificiale generativa

Dal momento che rappresentano una novità così recente, dobbiamo ancora vedere l'effetto a lungo termine dei modelli di intelligenza artificiale generativa. Questo significa che ci sono alcuni rischi intrinseci coinvolti nel loro utilizzo, alcuni noti e altri sconosciuti.

Una delle principali preoccupazioni è il potenziale di diffusione di disinformazione o contenuti dannosi. Il fatto è che i modelli di IA generativa sono convincenti, non pongono troppi dubbi, per progettazione, mentre le informazioni che producono possono essere sbagliate o dannose, a causa dei preconcetti su cui sono allenati. Questi preconcetti si riflettono sull'etnia, la religione, il genere e molto altro, e potrebbero avere effetti a cascata su chi consuma i contenuti, peggio se sono più facilmente manipolabili, come i minori.

L'IA generativa può produrre risultati difficili da ricondurre alle parti responsabili, il che a sua volta può rendere difficile ritenere individui o organizzazioni responsabili per notizie false o video deepfake generati dall'IA.

In questo contesto si ribadisce sempre la necessità di tenere un controllo umano (il cosiddetto Human-in-the-loop), ma è fattibile con la mole di contenuti sviluppati dall'IA? Forse il controllo dovrebbe avvenire a monte.

L'Unione Europea ha proposto nuove regole che richiederebbero alle aziende di divulgare qualsiasi materiale protetto da copyright utilizzato per sviluppare questi strumenti. La speranza è che tali regole incoraggino la trasparenza e l'etica nello sviluppo dell'IA, riducendo al minimo qualsiasi uso improprio o violazione della proprietà intellettuale. Ciò dovrebbe anche offrire una certa protezione ai creatori di contenuti il ​​cui lavoro potrebbe essere inconsapevolmente imitato o plagiato da strumenti di intelligenza artificiale generativa.

Douglas Eck, senior research director di Google, afferma che le aziende hanno la responsabilità di pensare a cosa serviranno questi modelli e di assicurarsi che si tratti di un'evoluzione piuttosto che di un'interruzione.

Il manager dichiara che il loro lavoro sull'intelligenza artificiale coinvolge il gruppo Responsible AI di Google e molti altri gruppi focalizzati sull'evitare pregiudizi, tossicità e altri danni durante lo sviluppo di tecnologie emergenti. Il problema è che quando qualcuno, come Timnit Gebru, parla dei rischi dell'IA, viene licenziato.

Sarebbe utile se le aziende selezionassero meglio i dati usati per l'apprendimento, e anziché utilizzare un modello di intelligenza artificiale generativa standard, usassero modelli più piccoli e specializzati. Le organizzazioni con più risorse potrebbero anche personalizzare un modello generale basato sui propri dati per soddisfare le proprie esigenze e ridurre al minimo i pregiudizi.

Ma questo è un campo nuovo, e i rischi potrebbero evolvere: ogni mese vengono testati nuovi casi d'uso e nei prossimi anni verranno probabilmente sviluppati nuovi modelli. Riusciremo a star dietro a questo tasso di sviluppo?

Mostra i commenti