Il riconoscimento vocale di Microsoft raggiunge la precisione di un essere umano
Dai dipartimenti di ricerca Microsoft arriva l'annuncio di un importante traguardo riguardo il riconoscimento vocale. Xuedong Huang, a capo della divisione dedicata a riconoscimento e sintesi vocale, ha infatti spiegato: "abbiamo raggiunto precisione umana. Questa è una conquista storica".
In particolare il sistema di riconoscimento vocale, che quindi traduce una registrazione in testo, sarebbe riuscito a raggiungere un tasso di errore del 5,9%, cifra paragonabile a quella ottenuta da un gruppo di trascrittori professionisti messi alla prova con lo stesso set di conversazioni.
Come molte delle tecnologie moderne, dietro a questo successo ci sono algoritmi basati su reti neurali e deep learning; questi riescono a comprendere la frase nel suo intero, dando risultati meno sintetici.
L'idea è ovviamente quella di integrare il tutto su Cortana e del software per la dettatura, ma la strada è ancora lunga. L'IA di Microsoft dovrà "allenarsi" molto prima di poter funzionare in situazioni reali e sopratutto nel riuscire a tradurre frasi in comandi.