Google Traduttore impara 24 nuove lingue grazie ad una nuova tecnica di Machine Learning

Lorenzo Delli
Lorenzo Delli Tech Master
Google Traduttore impara 24 nuove lingue grazie ad una nuova tecnica di Machine Learning

Con il passare del tempo e con l'implementazione di novità, Google Traduttore si avvicina sempre di più al traduttore universale di Star Trek. A tal proposito, sul palco del Google I/O è stato annunciato l'arrivo di 24 nuove lingue.

Di per sé potreste pensare che non ci sia nulla di straordinario. In realtà ad essere particolarmente curioso è il modo in cui tali lingue sono state inserite all'interno di Google Translate. Sono le prime forme di linguaggio aggiunte grazie all'uitilizzo del così detto Zero-Shot Machine Translation, ovvero un modello di machine learing che impara a tradurre in un altro linguaggio senza avere a disposizione esempi concreti scritti.

Per arrivare ad affinare questa particolare tecnica di machine learing si è prima lavorato su lingue conosciute, come lo spagnolo e il tedesco. Ovviamente i risultati ottenuti non saranno perfetti al 100%, ma si tratta di un notevole passo in avanti che renderà Google Translate sempre più potente.

C'è anche un elenco di queste 24 nuove lingue, parlate da qualcosa come oltre 300 milioni di persone nel mondo. Probabilmente alcune non le avete mai sentite nominare!

  • Assamese, usato da circa 25 milioni di persone nel nord-est dell'India
  • Aymara, usato da circa 2 milioni di persone in Bolivia, Cile e Peru
  • Bambara, usato da circa 14 milioni di persone in Mali
  • Bhojpuri, usato da circa 50 milioni di persone nel nord dell'India, Nepal e Fiji
  • Dhivehi, usato da circa 300.000 persone nelle Maldive
  • Dogri, usato da circa 3 milioni di persone nel nord dell'India
  • Ewe, usato da circa 7 milioni di persone nel Ghana e Togo
  • Guarani, usato da circa 7 milioni di persone in Paraguay, Bolivia, Argentina e Brasile
  • Ilocano, usato da circa 10 milioni di persone nel nord delle Filippine
  • Konkani, usato da circa 2 milioni di persone nell'India centrale
  • Krio, usato da circa 3 milioni di persone in Sierra Leone
  • Kurdish (Sorani), usato da circa 8 milioni di persone, la maggior parte in Iraq
  • Lingala, usato da circa 45 milioni di persone nella Repubblica Democratica del Congo, in Angola, nel Sudan del Sud
  • Luganda, usato da circa 20 milioni di persone in Uganda e Ruanda
  • Maithili, usato da circa 34 milioni di persone nel nord dell'India
  • Meiteilon (Manipuri), usato da circa 2 milioni di persone nel nord-est dell'India
  • Mizo, usato da circa 830.000 persone nel nord-est dell'India
  • Oromo, usato da circa 37 milioni di persone in Etiopia and Kenya
  • Quechua, usato da circa 10 milioni di persone in Peru, Bolivia, Ecuador e altre nazioni limitrofe
  • Sanskrit, usato da circa 20.000 persone in India
  • Sepedi, usato da circa 14 milioni di persone in Sud Africa
  • Tigrinya, usato da circa 8 milioni di persone in Eritrea and Etiopia
  • Tsonga, usato da circa 7 milioni di persone in Eswatini, Mozambico, Sud Africa e Zimbawe
  • Twi, usato da circa 11 milioni di persone nel Ghana