Vi sorprende che Facebook usi le vostre immagini Instagram per “allenare” la sua intelligenza artificiale?

Vincenzo Ronca

Facebook al keynote F8 di quest’anno tenutosi a San Jose ha esposto anche un’interessante report riguardante il tipo e la quantità di dati usati nei processi di allenamento dei propri modelli di intelligenza artificiale, principalmente impiegati nel riconoscimento automatico delle immagini.

A differenza delle altre piattaforme che lavorano sul machine learning per il riconoscimento delle immagini, Facebook può lavorare su una mole enorme di dati grazie ai post pubblici di Instagram. Una problematica insita in questa grande quantità di immagini è la quantità stessa: la parte difficile è rendere il modello pronto ed allenato a riconoscere e selezionare le immagini più rilevanti ai fini del training, e questo può essere attuato grazie all’analisi degli hashtag.

LEGGI ANCHE: ecco come funzionano le eGPU NVIDIA su macOS

Dunque, per Facebook si è delineato un problema da risolvere a monte rispetto al riconoscimento delle immagini: quello del pre-training, attraverso il quale valutare la significatività degli hashtag collegati alle immagini. Ma una volta risolto il pre-training, anche l’allenamento del modello di deep learning diventa molto più ottimizzato ed efficace. In termini pratici, al momento Facebook è in grado di analizzare moli di immagini pari a 3,5 miliardi correlate con circa 17.000 hashtag.

Di fronte a tutto ciò, qualcuno potrebbe non essere d’accordo sul fatto che il social network usi delle foto personali per allenare i suoi modelli di machine learning, nonostante Facebook abbia puntualizzato come questi modelli siano principalmente orientati nel riconoscimento degli oggetti. L’interrogativo non è semplice da analizzare, anche perché le immagini usate negli algoritmi provengono soltanto dai post dei profili Instagram pubblici.

La parte interessante per Facebook non è tanto la questione della privacy, quanto più l’aver conseguito il successo nel convertire moli di immagini enormi dal significato poco chiaro o rilevante, in insieme di dati ordinati per significatività ed ottimizzati per alimentare e sviluppare i suoi modelli di machine learning.

Via: TechCrunch