Quello che chiediamo a Google Assistant viene registrato e ascoltato da dipendenti Google (aggiornato)

Lorenzo Delli - Il report arriva da un celebre emittente belga, e ci sarebbero svariate prove a sostegno della cosa.

Nella giornata di ieri l’emittente belga VRT NWS ha svelato in un report che ci sono dipendenti Google che effettivamente ascoltano le registrazioni delle nostre conversazioni con Google Assistant, l’assistente virtuale a cui è possibile accedere da smartphone o dai dispositivi domestici della serie Home/Nest. VRT NWS sostiene anche di avere avuto accesso a migliaia di registrazioni, registrazioni che hanno fatto ascoltare anche a diversi utenti che si sono riconosciuti. “È sicuramente la mia voce” ha dichiarato una delle persone che ha avuto modo di ascoltare le registrazioni incriminate. Tre le fonti, rimaste ovviamente anonime, che hanno rivelato il tutto a VRT NWS fornendo anche i dati audio originali.

Quanto stiamo riportando fa riferimento a registrazioni effettuate ed ascoltate in Belgio e in Olanda. Nel report dell’emittente si fa anche cenno al fatto che ci sono migliaia di dipendenti Google in tutto il mondo che utilizzano un particolare sistema che raccoglie tutte le registrazioni audio di Assistant e ne permette l’ascolto. Nella zona interessata tra il Belgio e l’Olanda ci sarebbero una dozzina di dipendenti Google incaricati di ascoltare le suddette conversazioni.

LEGGI ANCHE: Il 40% degli internauti svenderebbe la sua privacy al miglior offerente

Occorre poi fare altre precisazioni. I dipendenti Google citati nel report di VRT NWS non ascoltano attivamente le conversazioni degli utenti. Quelle che vengono ascoltate sono registrazioni appunto, che vengono memorizzate in teoria solo quando si pronunciano le parole chiave per iniziare una conversazione con Google Assistant. In teoria, perché se avete in casa un dispositivo Google Home saprete probabilmente che i dispositivi in questione si attivano talvolta per errore, e anche in questi casi l’audio potrebbe essere registrato e sfruttato. Ma cosa se ne farebbe Google di tali registrazioni? Vengono utilizzate per migliorare il motore di ricerca e di conseguenza anche le performance di Google Assistant. Il “problema” è che Google può farlo (tranne nei casi di registrazioni accidentali). Nei termini di servizio di Google, quelli che accettiamo quando decidiamo di utilizzare anche Google Assistant o dispositivi comunque che lo sfruttano, si può leggere quanto segue:

Alcuni dei nostri Servizi consentono di caricare, trasmettere, memorizzare, inviare o ricevere contenuti. L’utente mantiene gli eventuali diritti di proprietà intellettuale detenuti su tali contenuti. In breve, ciò che appartiene all’utente resta di sua proprietà.

Quando l’utente carica, trasmette, memorizza, invia o riceve contenuti da o tramite i nostri Servizi, concede a Google (e ai partner con cui collaboriamo) una licenza globale per utilizzare, ospitare, memorizzare, riprodurre, modificare, creare opere derivate (come quelle derivanti da traduzioni, adattamenti o altre modifiche apportate in modo tale che i contenuti funzionino al meglio con i nostri Servizi), comunicare, pubblicare, eseguire pubblicamente, visualizzare pubblicamente e distribuire i suddetti contenuti. I diritti che concede con questa licenza riguardano lo scopo limitato di utilizzare, promuovere e migliorare i nostri Servizi e di svilupparne di nuovi.

L’ultima frase riguarda proprio ciò che Google fa con le registrazioni delle conversazioni con Google Assistant: le utilizza per “migliorare i nostri Servizi e di svilupparne di nuovi“. La situazione è un po’ più fumosa nel caso di registrazioni casuali. VRT NWS ha ascoltato come già accennato migliaia di registrazioni, tra cui ben 153 conversazioniche non sarebbero dovute essere registrate“: chiamate telefoniche private, conversazioni tra genitori e figli, conversazioni “da camera da letto” e altro. Una delle tre fonti anonime che ha rivelato il tutto a VRT NWS ha anche ammesso di aver sentito una registrazione in cui si udiva chiaramente una donna che chiedeva aiuto, probabilmente un caso di violenza domestica. Non sappiamo dire se i termini di servizio effettivamente coprano anche questo genere di registrazioni.

LEGGI ANCHE: Amazon può conservare i dati delle richieste Alexa per sempre, anche se cancellate l’audio

Ma tralasciando le conversazioni registrate casualmente, come si mette in generale per la questione privacy? Il report di VRT NWS spiega anche questo. In teoria ogni registrazione è accompagnata da dati sensibili. Il sistema utilizzato da Google, quello a cui facevamo cenno prima, cancella il nome utente e lo sostituisce con un numero seriale completamente anonimo. Il problema è che è sufficiente ascoltare le registrazioni per ricostruire via via informazioni sensibili a riguardo dell’utilizzatore e della sua famiglia. E come se non bastasse nell’ottica di ottenere dati utili appunto a migliorare le performance dell’assistente di Google, i dipendenti effettuano ricerche relative agli indirizzi, alle parole, ai nomi o a quant’altro presente nelle registrazioni proprio su Google o su Facebook. Non ci vuole molto quindi a ricostruire completamente il profilo della persona che si sta ascoltando.

Google ha già risposto a quanto riportato da VRT NWS affermando di lavorare a livello mondiale a fianco di esperti di linguaggio proprio per migliorare la sua tecnologia di ascolto. Un portavoce della divisione belga di Google ha dichiarato “Utilizziamo trascrizioni di un piccolo numero di file audio; si tratta di un lavoro cruciale per lo sviluppo di prodotti quali Google Assistant“. Da sottolineare comunque che Google non è l’unica azienda che fa uso di tali registrazioni per migliorare i suoi servizi. Il report dello scorso aprile di Bloomberg affermava la stessa cosa di Amazon Alexa.

Aggiornamento12/07/2019

In un post sul blog ufficiale Google, il Product Manager di Search David Monsees, si è espresso a riguardo di quanto riportato dall’emittente belga. Come già detto dalla divisione belga di Google, vari esperti di linguaggio da tutto il mondo lavorano attivamente per migliorare il riconoscimento vocale, e per farlo ascoltano e trascrivono set di domande poste dagli utenti.

Il fatto che uno di questi esperti abbia violato le loro policies di sicurezza facendo trapelare dati audio riservati è ovviamente grave, e Google sta già prendendo provvedimenti a riguardo. Il post di Monsees continua affermando che tali esperti ascoltano lo 0,2% di tutte le conversazioni che avvengono con Google Assistant, ribadendo che tali spezzoni audio non sono associati ad un account utente (vengono generati codici univoci che nascondono il nome utente).

Si fa riferimento anche alle registrazioni casuali, dicendo che c’è effettivamente una possibilità che dispositivi con Google Assistant traducano rumori o frasi di sottofondo nelle parole chiave “Ok Google” attivandoli. Ci sono, da quanto affermato da Monsees, delle “protezioni” che prevengono queste false attivazioni, ma è anche vero che l’emittente belga ha messo mano su oltre 100 registrazioni avvenute appunto per errore.

Via: The VergeFonte: VRT NWS