Come risultato del processo di campionamento di un segnale audio analogico otteniamo una sequenza di numeri binari (numeric streams) che può essere scritta in particolari tipi di files (audio files o sound files) memorizzati su svariati tipi di supporti digitali (CD, DVD, HD o altro).
Questi files possono avere tre diversi formati di codifica:
Questo perchè nel momento in cui abbiamo l'esigenza di memorizzare su un supporto digitale tutte le informazioni riguardanti un segnale potremmo voler ridurre lo spazio di memorizzazione occupato a vantaggio della portabilità o della trasmissività del flusso codificato.
Per farlo dobbiamo ricorrere alla compressione delle informazioni in un modo tale che permetta anche l'operazione inversa.
Questa operazione è svolta dai codec che sono dei programmi (o dispositivi) che si occupano sia della digitalizzazione dei segnali (tipicamente audio o video) che della loro codifica e/o decodifica digitale.
Esistono molti tipi di codec, differenti tra loro sia per le caratteristiche del segnale su cui devono operare (audio, video, audiovideo, etc.) che per l’algoritmo di codifica/compressione in essi implementato.
Ogni formato di codifica può essere ottenuto attraverso codec differenti in quanto permettono di ascoltare formati proprietari aperti da qualunque lettore di file, mantenendo separati il livello fisico del formato da quello logico della sua rappresentazione.
I vantaggi della compressione sono:
Gli svantaggi:
Prima di approfondire i diversi tipi di formati audio soffermiamoci su concetti legati alla velocità di trasmissione dei dati in quanto i file audio sono per loro natura legati al tempo che scorre.
Ad ogni secondo è associato un certo contenuto informativo e quindi una certa sottosequenza di cifre binarie.
Il numero di cifre binarie che compongono queste sottosequenze è detto bitrate.
Il bitrate è quindi il numero di cifre binarie impiegate per immagazzinare un secondo di informazione.
I cd musicali ad esempio hanno come standard una frequenza di campionamento pari a 44.100 Hz che genera 44.100 valori al secondo per ogni canale.
Nel caso di un file stereofonico vanno poi moltiplicati per 2 e siccome il campionamento avviene a 16 bit (2 byte) vanno ulteriormente moltiplicati per 2:
# sr ch byte secondi
44100 * 2 * 2 * 60
10584000
Ovvero occupa più o meno 10 MB per ogni minuto.
Il bitrate si esprime in kilobit per secondo (kbps) e può variare da 32 a 320 kbps.
Se volessimo ad esempio calcolare il bitrate del file precedente dovremmo calcolare:
# sr ch byte da bytes a bit
44100 * 2 * 2 * 8
1411200
Ovvero 1.411.200 bit al secondo (1.411 kbs).
I calcoli appena effettuati fanno riferimento a un formato non compresso mentre nel caso dei formati compressi, al diminuire della lunghezza globale del file diminuisce anche la lunghezza media delle sottosequenze e di conseguenza il bitrate medio che corrisponderà al fattore di compressione.
Infatti se un file con un bitrate di 1411 Kbps come quello dell'esempio precedente fosse compresso fino ad ottenere un bitrate medio di 320 Kbps, avremmo ridotto le dimensioni del file originale di un fattore pari a circa 4.5 (1411 / 320).
Nei codec più evoluti esistono tre tipologie di implementazione del bitrate:
Esistono formati audio che non hanno compressione e che in fatto di qualità sonora sono i migliori.
Occupano molto più spazio in memoria e hanno una minore velocità di trasmissione rispetto ai formati compressi.
Con software professionali come Pro Tools, SuperCollider o Max generalmente si lavora con file di questo tipo.
I due principali formati sono:
Permette compressioni maggiori, ma a scapito della qualità sonora.
I metodi di compressione lossy in generale eliminano le informazioni ritenute inutili, e nascono dall’idea che non tutte le frequenze contenute in uno spettro sonoro vengono percepite dall’orecchio umano.
Si tagliano ad esempio le alte frequenze, che si ritiene siano quelle meno distinte dal nostro orecchio.
Più frequenze si tagliano più lo spazio occupato dalla traccia audio diminuisce e con questo anche la qualità del risultato in quanto il processo di riconversione non permette il completo ripristino delle frequenze tagliate.
Principali formati audio di questo tipo:
Questi metodi di compressione cercano di diminuire lo spazio occupato dalla traccia senza andare a toccare il suono.
La percentuale di compressione è decisamente inferiore rispetto ai metodi lossy, ma non si verifica perdita di qualità e in fase di riconversione il suono è identico all'originale.
Principali formati audio di questo tipo: