Google sta insegnando alla sua IA a leggervi le immagini (foto)

Cosimo Alfredo Pina
Cosimo Alfredo Pina
Google sta insegnando alla sua IA a leggervi le immagini (foto)

In questi giorni a Las Vegas si sta tenendo la Computer Vision and Pattern Recognition Conference, evento dedicato al complicato mondo del riconoscimento delle immagini e della computer visione. Tra gli espositori non poteva ovviamente mancare Google, i cui ricercatori hanno presentato tre importanti risultati.

Il primo è un algoritmo capace di scansionare un flusso video per individuare i protagonisti della scena; nell'articolo dello studio è stato usato l'esempio di una partita di basket dove l'IA, utilizzando reti neurali, sarebbe in grado di capire chi ha la palla o comunque ricopre un ruolo decisivo nell'azione di gioco.

LEGGI ANCHE: Facebook descriverà le foto ai non vedenti

L'altro sistema presentato è invece capace di individuare un entità movente (nello studio sono stati scelti una tigre e un cavallo) e di riconoscerne gli arti; l'algoritmo sarebbe così capace di tracciare la posizione relativa delle varie parti del corpo. La cosa può sembrare molto astratta, ma immaginatevi le potenzialità di un sistema del genere applicate alla sicurezza, ad esempio una videosorveglianza capace di individuare automaticamente comportamenti sospetti.

A concludere una soluzione non del tutto inedita. In effetti anche Facebook è al lavoro su qualcosa di simile e già in passato Google aveva dimostrato di saper generare automaticamente didascalie delle foto grazie alle IA ma adesso il tutto è stato potenziato per fornire descrizioni ancor più dettagliate, con anche informazioni su come disposti gli elementi rispetto gli uni rispetto agli altri.

Come detto siamo ancora nel dominio della ricerca, ma non è difficile immaginare come in un futuro non così remoto, considerando la sempre maggior diffusione di deep learning e reti neurali, sistemi con questi di Google possano trovare applicazioni pratiche e potenzialmente molto utili.