Allenare l'intelligenza artificiale su un forum razzista e violento? Non è una buona idea

Allenare l'intelligenza artificiale su un forum razzista e violento? Non è una buona idea
Alessandro Nodari
Alessandro Nodari

L'8 giugno 1966 Peter Handke, premio Nobel per la letteratura nel 2019, fece rappresentare a Francoforte la sua pièce teatrale "Insulti al pubblico". Lo spettacolo, inizialmente accolto con scetticismo, fu un successo, e declinava il pensiero anticonformista del geniale scrittore. Ma oggi abbiamo a che fare con i social, e i messaggi d'odio escono dal campo della sperimentazione per assumere una rilevanza nel mondo reale molto diversa, soprattutto quando in ballo c'è l'intelligenza artificiale (IA).

Canale Telegram Offerte

Ormai dovrebbe essere chiaro a tutti che l'intelligenza artificiale è valida solo quanto il materiale su cui si allena, e questo, come insegna la mai troppo citata Timnit Gebru, è valido soprattutto negli algoritmi di creazione del linguaggio di grandi dimensioni, come GPT-3. Lo YouTuber Yannic Kilcher ha però voluto sperimentare ugualmente l'ipotesi, e ha allenato un modello di IA basato su GPT-3 sul forum verbalmente più violento e razzista di 4chan, Politically Incorrect (/pol/).

Il risultato? Una serie di bot generati da un modello (chiamato GPT-4chan) in grado di creare un'ondata d'odio e generare in un solo giorno 15.000 post (più del 10% dei post su /pol/) dall'alto contenuto razzista, con un misto di "offensiva, nichilismo, trolling e profonda sfiducia". Ovviamente Kilcher ha preso le sue precauzioni per superare le difese di 4chan contro i bot e il suo modello è risultato così convincente che ci sono voluti due giorni prima che qualche utente se ne accorgesse, a quel punto addirittura facendo partire reciproche accuse di essere dei bot.

Lo YouTuber ha detto di voler fare uno scherzo, ma il problema è che il modello è stato parzialmente condiviso sul repository di IA Hugging Face, tanto che poi il sito lo ha rimosso temendo potesse essere usato da malintenzionati.

Mostra i commenti