Quello che chiediamo a Google Assistant viene registrato e ascoltato da dipendenti Google (aggiornato)

Lorenzo Delli - Il report arriva da un celebre emittente belga, e ci sarebbero svariate prove a sostegno della cosa.

Nella giornata di ieri l’emittente belga VRT NWS ha svelato in un report che ci sono dipendenti Google che effettivamente ascoltano le registrazioni delle nostre conversazioni con Google Assistant, l’assistente virtuale a cui è possibile accedere da smartphone o dai dispositivi domestici della serie Home/Nest. VRT NWS sostiene anche di avere avuto accesso a migliaia di registrazioni, registrazioni che hanno fatto ascoltare anche a diversi utenti che si sono riconosciuti. “È sicuramente la mia voce” ha dichiarato una delle persone che ha avuto modo di ascoltare le registrazioni incriminate. Tre le fonti, rimaste ovviamente anonime, che hanno rivelato il tutto a VRT NWS fornendo anche i dati audio originali.

Quanto stiamo riportando fa riferimento a registrazioni effettuate ed ascoltate in Belgio e in Olanda. Nel report dell’emittente si fa anche cenno al fatto che ci sono migliaia di dipendenti Google in tutto il mondo che utilizzano un particolare sistema che raccoglie tutte le registrazioni audio di Assistant e ne permette l’ascolto. Nella zona interessata tra il Belgio e l’Olanda ci sarebbero una dozzina di dipendenti Google incaricati di ascoltare le suddette conversazioni.

LEGGI ANCHE: Il 40% degli internauti svenderebbe la sua privacy al miglior offerente

Occorre poi fare altre precisazioni. I dipendenti Google citati nel report di VRT NWS non ascoltano attivamente le conversazioni degli utenti. Quelle che vengono ascoltate sono registrazioni appunto, che vengono memorizzate in teoria solo quando si pronunciano le parole chiave per iniziare una conversazione con Google Assistant. In teoria, perché se avete in casa un dispositivo Google Home saprete probabilmente che i dispositivi in questione si attivano talvolta per errore, e anche in questi casi l’audio potrebbe essere registrato e sfruttato. Ma cosa se ne farebbe Google di tali registrazioni? Vengono utilizzate per migliorare il motore di ricerca e di conseguenza anche le performance di Google Assistant. Il “problema” è che Google può farlo (tranne nei casi di registrazioni accidentali). Nei termini di servizio di Google, quelli che accettiamo quando decidiamo di utilizzare anche Google Assistant o dispositivi comunque che lo sfruttano, si può leggere quanto segue:

Alcuni dei nostri Servizi consentono di caricare, trasmettere, memorizzare, inviare o ricevere contenuti. L’utente mantiene gli eventuali diritti di proprietà intellettuale detenuti su tali contenuti. In breve, ciò che appartiene all’utente resta di sua proprietà.

Quando l’utente carica, trasmette, memorizza, invia o riceve contenuti da o tramite i nostri Servizi, concede a Google (e ai partner con cui collaboriamo) una licenza globale per utilizzare, ospitare, memorizzare, riprodurre, modificare, creare opere derivate (come quelle derivanti da traduzioni, adattamenti o altre modifiche apportate in modo tale che i contenuti funzionino al meglio con i nostri Servizi), comunicare, pubblicare, eseguire pubblicamente, visualizzare pubblicamente e distribuire i suddetti contenuti. I diritti che concede con questa licenza riguardano lo scopo limitato di utilizzare, promuovere e migliorare i nostri Servizi e di svilupparne di nuovi.

L’ultima frase riguarda proprio ciò che Google fa con le registrazioni delle conversazioni con Google Assistant: le utilizza per “migliorare i nostri Servizi e di svilupparne di nuovi“. La situazione è un po’ più fumosa nel caso di registrazioni casuali. VRT NWS ha ascoltato come già accennato migliaia di registrazioni, tra cui ben 153 conversazioniche non sarebbero dovute essere registrate“: chiamate telefoniche private, conversazioni tra genitori e figli, conversazioni “da camera da letto” e altro. Una delle tre fonti anonime che ha rivelato il tutto a VRT NWS ha anche ammesso di aver sentito una registrazione in cui si udiva chiaramente una donna che chiedeva aiuto, probabilmente un caso di violenza domestica. Non sappiamo dire se i termini di servizio effettivamente coprano anche questo genere di registrazioni.

LEGGI ANCHE: Amazon può conservare i dati delle richieste Alexa per sempre, anche se cancellate l’audio

Ma tralasciando le conversazioni registrate casualmente, come si mette in generale per la questione privacy? Il report di VRT NWS spiega anche questo. In teoria ogni registrazione è accompagnata da dati sensibili. Il sistema utilizzato da Google, quello a cui facevamo cenno prima, cancella il nome utente e lo sostituisce con un numero seriale completamente anonimo. Il problema è che è sufficiente ascoltare le registrazioni per ricostruire via via informazioni sensibili a riguardo dell’utilizzatore e della sua famiglia. E come se non bastasse nell’ottica di ottenere dati utili appunto a migliorare le performance dell’assistente di Google, i dipendenti effettuano ricerche relative agli indirizzi, alle parole, ai nomi o a quant’altro presente nelle registrazioni proprio su Google o su Facebook. Non ci vuole molto quindi a ricostruire completamente il profilo della persona che si sta ascoltando.

Google ha già risposto a quanto riportato da VRT NWS affermando di lavorare a livello mondiale a fianco di esperti di linguaggio proprio per migliorare la sua tecnologia di ascolto. Un portavoce della divisione belga di Google ha dichiarato “Utilizziamo trascrizioni di un piccolo numero di file audio; si tratta di un lavoro cruciale per lo sviluppo di prodotti quali Google Assistant“. Da sottolineare comunque che Google non è l’unica azienda che fa uso di tali registrazioni per migliorare i suoi servizi. Il report dello scorso aprile di Bloomberg affermava la stessa cosa di Amazon Alexa.

Aggiornamento12/07/2019

In un post sul blog ufficiale Google, il Product Manager di Search David Monsees, si è espresso a riguardo di quanto riportato dall’emittente belga. Come già detto dalla divisione belga di Google, vari esperti di linguaggio da tutto il mondo lavorano attivamente per migliorare il riconoscimento vocale, e per farlo ascoltano e trascrivono set di domande poste dagli utenti.

Il fatto che uno di questi esperti abbia violato le loro policies di sicurezza facendo trapelare dati audio riservati è ovviamente grave, e Google sta già prendendo provvedimenti a riguardo. Il post di Monsees continua affermando che tali esperti ascoltano lo 0,2% di tutte le conversazioni che avvengono con Google Assistant, ribadendo che tali spezzoni audio non sono associati ad un account utente (vengono generati codici univoci che nascondono il nome utente).

Si fa riferimento anche alle registrazioni casuali, dicendo che c’è effettivamente una possibilità che dispositivi con Google Assistant traducano rumori o frasi di sottofondo nelle parole chiave “Ok Google” attivandoli. Ci sono, da quanto affermato da Monsees, delle “protezioni” che prevengono queste false attivazioni, ma è anche vero che l’emittente belga ha messo mano su oltre 100 registrazioni avvenute appunto per errore.

Via: The VergeFonte: VRT NWS
  • miksly

    NAAAAAAAAA… MA NON CI CREDOOOOO….

  • Ade

    finalmente qualcuno che mi ascolta. così non sembro pazzo a parlare ad un oggetto inanimato.

  • Lorenzo Cot

    e quindi? come credevate che potessero migliorare il servizio? con la fantasia?

    • Infatti è quello che pensavo anche io leggendo questo articolo, è più che ovvio che da qualche parte i dati li devono pur analizzare.
      Non è che possono migliorare la comprensione di un servizio automatizzato senza appunto ascoltare i suoi errori e quando non risponde correttamente o non capisce quello che l’utente chiede.

    • Assumendo persone per passare le giornate a fare domande ad Assistant? Non è la stessa cosa di assumere persone per ascoltare registrazioni di conversazioni di privati?

      • Mica lo fa solo G, lo fanno tutti: Amazon, Apple, Microsoft, cinesi.
        Tutti.
        Basterebbe un veloce ripasso (ri)vedendo il documentario Citizenfour.
        E il primo che se ne esce con “io non ho niente da temere, non ho fatto nulla”, si becca una bella botta di “[cenrored]”
        I metadati, i dannati metadati.

        • L0RE15

          Quello che dice “non ho nulla da nascondere” è il più onesto e quello che non si lamenta (che abbia letto o meno le condizioni d’uso). Il problema sono quelli che comprano il dispositivo, lo installano, mettono le spunte senza leggere una riga, lo usano (senza magari saperlo nemmeno usare correttamente) e POI si lamentano quando escono queste notizie.

          • Hai visto Citizenfour o no? Non parlo di software o di EULA, o di permessi, ma di uno spionaggio massivo ai danni dei cittadini di tutto il mondo iniziato con l’amministrazione Obama.
            E non solo con cellulari o gps o software.

          • L0RE15

            Ma questo non lo discuto e mi trova d’accordo (purtroppo). Il mio commento era inerente non tanto allo spionaggio esistente, quanto relativo alle azioni-reazioni di parte degli utenti. Sostanzialmente a quello che parte dal presupposto “non ho nulla da nascondere” non importa nulla che lo ascoltino, che sia legale e scritto nell’EULA o no…

          • Non gli importa perché ha poco o punto cervello, semplice 🙂

          • Lorenzo Cot

            dire non ho nulla da temere non ha senso, non si tratta di temere ma del fatto che qualcuno può ascoltare e sapere cosa fai, poi tu sarai anche nella legalità, ma resta il fatto che se non lo usi consapevolmente perdi un pezzo dei tuoi diritti

      • Lorenzo Cot

        Ma che senso ha, se è per questo sono registrate anche le ricerche che uno fa, le cele telefoniche a cui si aggancia e i numeri che si chiamano, non mi sembra questa tragedia se si usa in modo consapevole. La tragedia sarebbe se si arrivassero a caso per colpa di virus

    • Analizzando le trascrizioni per esempio o accettando utenti beta tester volontari (o a pagamento). Ovvio che questo metodo è più semplice e alla fine è permesso dai ToS di Google Home. Non mi sembra però neanche ci sia niente di male non farne un articolo visto che sono venuti fuori alcuni dettagli riservati, no?
      Non mi sembra che nell’articolo si dica di aver scoperto un segreto nazionale o che sia una novità assoluta, no?

      • Lorenzo Cot

        Non era riferita all’articolo Emanuele, ma era in risposta a chi stava già gridando al complotto massonico, scusa se non l’ho messo in risposta ma erano vari commenti. Ovviamente fate informazione e quindi lo scrivete, semplicemente intendevo criticare chi crede che in segreto la pasta ci ruba la privacy. Fai un grande lavoro, complimenti.

  • Alessandro Napoli

    Pensate una casa cibernetica in cui ogni apparato è smart e viene gestito con la voce. Sì, avrà una tecnologia all’avanguardia, ma pensate al momento in cui marito e moglie parlano di dove mettere i soldi, di come andrà il loro viaggio in un determinato posto con partenza in un determinato giorno..praticamente sono fottuti!

  • mariano giusti

    Va beh ragazzi ma come pensate che funzioni?
    “Ok Google alza il volume”
    -> dipendente Google ascolta e alza il volume

  • Marco

    Avete scoperto l’acqua calda. Sono anni che la nostra voce è campionata nei server di google…🤦🏻‍♂️

    • Beh, direi ovvio. Meno ovvio quello di cui parliamo nell’articolo, che non c’entra nulla con quello che dici.

      • Marco

        Ah be allora se lo dici tu

        • Non lo dico io, è un fatto. Un conto è una trascrizione/campionamento, un conto è la voce.

          • Marco

            Ma in entrambi i casi c’è una registrazione, che in questo caso come dicono non sia associato ad un account utente ma ad un codice univoco generato appositamente è tutto da vedere

          • Una registrazione o una trascrizione sono due cose diverse. Però sì, se intendi che da qualche parte c’è una parte del tuo discorso certo. E confermo che non c’è niente di cui stupirsi. Nessuno infatti si sta stupendo 🙂
            Poi c’è il discorso fiducia: non ti fidi dei ToS? Chiedi che qualche polico faccia attivare delle indagini, oppure non lo usi.

  • Elektrosphere

    Sai che novità XD