I principali formati audio che dovreste conoscere

I principali formati audio che dovreste conoscere
SmartWorld team
SmartWorld team

I formati audio digitali disponibili sul mercato sono numerosi e spesso c'è poca chiarezza circa le differenze. Per sfruttare al meglio i propri dispositivi e rispondere alle necessità andremo ad analizzarne i principali.

I formati audio

La tecnologia nel settore degli audio digitali è avanzata rapidamente anche grazie alla crescita dei mercati del download di musica e dello streaming. La musica in digitale presenta vari formati a seconda delle necessità degli utenti. Ci sono opzioni di maggiore qualità per chi cerca di sfruttare al meglio l’hardware a disposizione o altre che si concentrano sulla compressione degli audio, consentendo di memorizzare grandi quantità a discapito della qualità.

Lossy e lossless

Gli audio digitali sono una rappresentazione dei suoni reali tradotta in codice binario. L'audio grezzo che viene registrato in uno studio viene salvato in un formato noto come Pulse-code modulation (PCM). Creato nel lontano 1937, questo è caratterizzato da due proprietà: la profondità di bit che misura i valori digitali e la frequenza di campionamento che misura l’ampiezza della forma dell’onda. Questi dati non sono compressi, è una sorta di conversione dell’analogico in un file digitale di grandi dimensioni.

I dati vengono memorizzati campione per campione con precisione. Si ottiene un file stereo a 16-bit 44.1kHz a circa 40MB per una traccia di quattro minuti. Diffondere gli audio digitali in rete con queste dimensioni avrebbe richiesto un grande spazio, dunque le dimensioni dovevano essere ridotte. La compressione dei file può avvenire in due modi differenti:

  • eliminando bit di dati di cui non si ha veramente bisogno o modificando la frequenza di profondità dei bit rinunciando a un certo grado di qualità, con una quantità di informazioni minore di quella contenuta nel file di origine (Lossy). I formati più comuni di questa categoria sono MP3, aiff e wma;
  • riconfigurando i dati sonori in una forma più piccola per essere successivamente decompressi, ma senza essere costretti a rimuovere alcun dato e mantenendo così la qualità del suono; l’informazione contenuta nel file finale è identica a quella contenuta in quello di origine (Lossless). I formati più comuni di questa categoria sono FLAC e ALAC;

PCM (WAV/AIFF)

I file PCM (Pulse Code Modulation), come detto in precedenza, contengono l'audio nella sua forma digitale in campioni individuali e con uno specifico grado di precisione. Le loro dimensioni sono dipendenti da frequenza di campionamento, numero di canali, lunghezza e profondità di bit. Hanno una profondità di 16, 24 o 32 bit e le frequenze di campionamento vanno da 44.1kHz fino a 384kHz. I formati audio più comuni dei file PCM sono WAV e AIFF.

WAV

WAV è un formato che è stato sviluppato da IBM e Microsoft nel 1991. L’acronimo indica WAVEform audio file format e in questa categoria rientrano file non compressi. Si tratta di una riproduzione fedele dei suoni, ma occupa un grande spazio (1.411 Kilobit per ogni secondo di musica stereo a 44.100 Hz/16 bit).

AIFF

AIFF è un formato creato dalla Apple. L’Audio Interchange File Format ha le stesse caratteristiche del formato spiegato in precedenza, quindi non compresso e di grandi dimensioni (1.411 Kilobit per ogni secondo di musica stereo a 44.100 Hz/16 bit). I suoni vengono riprodotti fedelmente ed è un formato adatto a chi registra o si occupa di musica.

FLAC

FLAC (Free Lossless Audio Codec) è uno tra i formati audio molto utilizzati sui servizi di streaming di alta qualità. Questo formato non taglia alcun dato per ridurre le sue dimensioni, ma è in grado di ottimizzare la memorizzazione dei bit di dati. Si può pensare al formato FLAC come fosse una sorta di file .rar o .zip, ovvero un file compresso e poi ripristinato con la qualità mantenuta. È in grado di comprimere del 30-50% le dimensioni dei file, con la stessa qualità del PCM. Viene spesso utilizzato per archiviare sul computer i CD di musica. Apple ha la sua versione, nota come ALAC.

MP3

Il formato MP3 (Moving Picture Expert Group-1/2 Audio Layer 3) è tra i più popolari, seppur talvolta non di ottima qualità. I contenuti vengono tagliati permettendo di avere un maggiore spazio. È il formato adatto perlopiù per lo streaming su reti 3G e 4G. Impiega degli algoritmi intelligenti che modellano il rumore basandosi sugli effetti psicoacustici del cervello e dell'orecchio umano e intervenendo per eliminare quei suoni che non siamo in grado di distinguere (quelli ad alta frequenza, a partire dai 16kHz). Ogni traccia viene divisa in 576 fotogrammi, da cui si ottengono i dati di frequenza. I dati possono così essere quantizzati a profondità di bit minori per ridurre lo spazio. I dati necessari per il ripristino di ciascun fotogramma sono conservati in un'intestazione di 32 bit. L’MP3 ha una qualità che è variabile in base al bit-rate (da 32 a 320 Kbit per ogni secondo di musica. Lo standard è 128 Kb/s). Questo determina la dimensione massima consentita del file per ogni fotogramma.

OGG Vorbis e AAC

Anche questi formati audio utilizzano il modello psicoacustico per la rimozione dei dati, ma con ulteriori tecniche. Rispetto all'MP3, OGG Vorbis presenta una compressione del suono migliore con bassi bit-rate. La qualità resta molto simile. Si tratta di un'alternativa open-source al formato MP3. Utilizza ancora FFT e MDCT per analizzare le informazioni di frequenza mascherabili e quantizzarle, ma con un algoritmo differente. OGG Vorbis considera anche il rumore di fondo per il miglioramento delle prestazioni con un basso bit-rate. l formato ACC consente, invece, delle frequenze di campionamento più elevate: fino a 96kHz. Può modificare la lunghezza dei fotogrammi tra campioni 1024/960 o 128/120 con lo scopo di ottenere una migliore risoluzione quando è necessario.

Commenta