Il riconoscimento vocale di Microsoft raggiunge la precisione di un essere umano

Cosimo Alfredo Pina
Cosimo Alfredo Pina
Il riconoscimento vocale di Microsoft raggiunge la precisione di un essere umano

Dai dipartimenti di ricerca Microsoft arriva l'annuncio di un importante traguardo riguardo il riconoscimento vocale. Xuedong Huang, a capo della divisione dedicata a riconoscimento e sintesi vocale, ha infatti spiegato: "abbiamo raggiunto precisione umana. Questa è una conquista storica".

In particolare il sistema di riconoscimento vocale, che quindi traduce una registrazione in testo, sarebbe riuscito a raggiungere un tasso di errore del 5,9%, cifra paragonabile a quella ottenuta da un gruppo di trascrittori professionisti messi alla prova con lo stesso set di conversazioni.

Come molte delle tecnologie moderne, dietro a questo successo ci sono algoritmi basati su reti neurali e deep learning; questi riescono a comprendere la frase nel suo intero, dando risultati meno sintetici.

L'idea è ovviamente quella di integrare il tutto su Cortana e del software per la dettatura, ma la strada è ancora lunga. L'IA di Microsoft dovrà "allenarsi" molto prima di poter funzionare in situazioni reali e sopratutto nel riuscire a tradurre frasi in comandi.

Via: The Verge
Fonte: Microsoft