Se pubblicate qualcosa online, Google lo userà per allenare l'IA
La GrandeG aggiorna la pagina delle norme sulla privacyCon l'esplosione dell'intelligenza artificiale generativa, una delle domande (e dei problemi legali) è da dove i modelli hanno preso le loro informazioni per allenarsi. La risposta è semplice: Google e OpenAI hanno attinto dalla fonte disponibile, Internet.
E se questo ha portato a una serie di problemi, come vedremo più avanti, ora la GrandeG, che evidentemente considera Bard e Traduttore obiettivi importanti del suo business, vuole assicurarsi che voi siate d'accordo nell'alimentare l'IA con i vostri dati.
Per questo, dal 1° luglio ha aggiornato le sue norme sulla privacy, che già in passato consentivano all'azienda di raccogliere dati dai suoi utenti e utilizzarli per "scopi commerciali", tra cui la "ricerca e lo sviluppo", termine usato per il miglioramento di Google Traduttore.
Ora però, la casa di Mountain View ha cambiato il termine associato all'addestramento, trasformandolo da modelli di linguaggio a modelli AI, e incluso anche i suoi modelli di intelligenza artificiale, indicati come "prodotti e funzionalità" quali Bard e Cloud AI (oltre a Traduttore).
Ecco il punto interessato:
fonti accessibili pubblicamente
Ad esempio, potremmo raccogliere informazioni pubblicamente disponibili online o da altre fonti pubbliche per contribuire all'addestramento dei modelli AI di Google e alla creazione di prodotti e funzionalità quali Google Traduttore, Bard e funzionalità AI Cloud. Oppure, se le informazioni della tua attività vengono visualizzate su un sito web, potremmo indicizzarle e visualizzarle sui servizi Google.
Questa è una clausola piuttosto insolita per una politica sulla privacy, in quanto in genere queste politiche descrivono i modi in cui un'azienda utilizza le informazioni che pubblicate sui servizi dell'azienda. Qui invece, Google si riserva il diritto di raccogliere e sfruttare i dati pubblicati su qualsiasi parte del Web disponibile, arrogandosi il diritto di utilizzare l'intero Internet come base per il suo modello.
Non che cambi qualcosa. Come abbiamo anticipato in apertura, le grandi aziende che sviluppano questi prodotti hanno già utilizzato (e utilizzano) Internet per allenarli, indipendentemente o meno dal fatto che sia legale.
Questo sta scatenando cause in tutti il mondo (che non potranno che aumentare, ed è il motivo per cui OpenAI si oppone alle nuove regole di trasparenza dell'UE sull'IA) e indirettamente ha causato anche il blocco da parte di Twitter e Reddit sui client di terze parti e, per il primo, sul limite di accesso ai tweet.
Se siete interessati, qui trovate le nuove norme, da cui potete vedere la versione corrente e quelle archiviate.