VINTAGE VAULT SHG MUSIC SHOW PEOPLE STORE
Back to Basic: i formati dei file nell’audio professionale
Back to Basic: i formati dei file nell’audio professionale
di [user #45705] - pubblicato il

Da quando esiste la registrazione audio digitale abbiamo imparato a convivere con numeri e standard. Ma cosa ci serve sapere per utilizzare al meglio le nostre DAW?

Il file Wave

Partiamo dal formato Wav o Wave (e l’equivalente Aiff utilizzato da Apple) formato audio non compresso di cui dobbiamo tenere in conto 2 valori fondamentali:
il numero di bit e la frequenza di compionamento.

Il Bit Depth o numero di bit è la quantità di bit utilizzati per descrivere il valore di ampiezza di ogni campione. Il cd audio utilizza dati a 16 bit, il che corrisponde a 65.536 possibili valori per ogni campione. Con un bit depth di 24 bit abbiamo invece 16.777.216 valori possibili. Il numero di bit definisce anche la dinamica massima ottenibile, cioè la differenza tra il volume massimo e il rumore di fondo. Ogni bit abbiamo un valore teorico di 6 dB di dinamica, con 16 bit quindi possiamo ottenere fino a 96 dB di dinamica. Con 24 bit potremmo in teoria ottenere 144 dB di dinamica, ma la circuitazione allo stato dell’arte attuale permeate al massimo di arrivare intorno ai 120 dB di rapporto segnale/rumore.

La frequenza di campionamento o Sample Rate definisce la frequenza massima riproducibile. Secondo il teorema di Nyquist-Shannon la massima frequenza udibile corrisponde alla metà della frequenza di campionamento, per cui un normale CD audio, che utilizza un sample rate di 44.100 Hz, può riprodurre fino a 22.050 Hz, ben al di sopra della frequenza udibile dall’orecchio umano (da 20 Hz a 20.000 Hz).

Perché allora vengono utilizzati valori di Sample Rate maggiori se già con 44.100 Hz siamo sopra l’udibile umano? Il problema sta nel fatto che bisogna eliminare tutto ciò che sta sopra alla metà della frequenza di campionamento attraverso un filtro Low Pass analogico, prima di procedere al campionamento vero e proprio, altrimenti ci ritroveremo delle frequenze non presenti nel segnale originale (dette Alias), dovute ad un errore di interpretazione da parte del convertitore analogico-digitale (effetto di Aliasing). Dalla bontà di questo filtro dipende l’effettiva qualità della conversione e la quantità di errori introdotti. Semplificando poi, più alziamo la frequenza di campionamento e più spostiamo gli Alias prodotti fuori dallo spettro udibile umano. Questo però comporta una maggiore richiesta di risorse, intese come spazio fisico occupato all’interno dei nostri Hard Disk e utilizzo della CPU in caso di elaborazione del segnale.

I valori più utilizzati di Sample Rate e Bit Depth per i file Wave sono:
  • 44.100 Hz / 16 Bit : il classico formato del CD audio.
  • 44.100 Hz / 24 Bit : il formato base oggi utilizzato per registrare e mixare.
  • 48.000 Hz / 24 Bit : frequenza di campionamento dell’audio utilizzata nella registrazione video.
  • 88.200 Hz / 24 Bit : è il doppio di 44.100 Hz, miglior qualità e facile da ridurre a 44.100 Hz dimezzando i dati.
  • 96.000 Hz / 24 Bit : è il doppio di 48.000 Hz, miglior qualità e facile da ridurre a 48 KHz dimezzando i dati.
  • 192.000 Hz / 24 Bit : è oggi il valore più alto utilizzabile dalla maggior parte dei convertitori e programmi di elaborazione del segnale.
32 o 64 Bit sono utilizzati solo per elaborazioni interne alle DAW in quanto nessun convertitore è oggi in grado di utilizzare tale formato.

Ogni cambio di formato all’interno del computer richiede un calcolo matematico e non un ricampionamento dal segnale elettrico, che può introdurre errori, minimi nel caso in cui si passi ad esempio da 96KHz a 48KHz, perché semplicemente si dimezzano i dati, mentre ben maggiori quando si passa ad un sample rate maggiore o diverso, dove i dati aggiunti vengono creati attraverso algoritmi predittivi.

Il formato MP3

L’ MP3 che tutti noi ormai conosciamo e utilizziamo è un formato audio compresso che riduce sensibilmente il valore dei dati presenti nel file, attraverso degli algoritmi che lavorano sia sulla riduzione della banda audio riprodotta, che sulla quantità di campioni.

In genere viene utilizzato per la diffusione e lo scambio di file audio sulla rete e mai per l’elaborazione del segnale. Importando un file MP3 all’interno di una qualsiasi DAW viene sempre convertito in Wave prima di essere elaborato.

Come avrete sicuramente visto, anche nella produzione di file MP3 abbiamo un valore che definisce la qualità effettiva del file audio. Oggi che ci troviamo sempre più a ragionare in termini di Giga, se non di Terabyte, non c’è alcun motivo di utilizzare file MP3 con una codifica inferiore a 320kbit/s.
Al di sotto di questo valore vengono introdotti artefatti che portano ad una degradazione del segnale troppo grave per chi si occupa di audio professionale.

Gli altri formati

AAC è il formato utilizzato da Apple per iTunes ed è considerato il successore dell’ MP3, ora sostituito dall’ Apple Lossless, più comunemente chiamato M4A, compressione lossless, cioè senza perdita di dati, dove il file originale viene “ricostruito” dalla CPU prima di essere riprodotto. Per il momento, e forse mai, verrà utilizzato all’interno di una DAW, anche per il maggior utilizzo di potenza di calcolo del computer. Altri formati lossless utilizzati nell’audio sono il FLAC e l’ OGG (quest'ultimo è più precisamente un formato “contenitore” che può avere al suo interno diversi tipi di file al suo interno, sia lossy che lossless come il FLAC).

Il formato del futuro sembra essere per ora il DSD, che utilizza una tecnologia di campionamento creata da Sony e Philips (i padri del CD audio) per il oro Super Audio CD (SACD), con performance sonore sulla carta ben al di sopra degli standard attuali. Per il momento sono ancora molto poche le macchine e le DAW che supportano questo formato, a causa della dispendiosa quantità di spazio occupato e potenza di calcolo richiesta. Quanti anni ci vorranno ancora perché diventi il nuovo standard?
 
Nascondi commenti     15
Loggati per commentare

di fabrimix1 utente non più registrato
commento del 07/11/2017 ore 22:30:03
Bell'articolo.
Unici 2 appunti:
1) le frequenze udibili dall'orecchio umano non sono 20-20.000hz, ma si limitano a 35-16.000hz circa (la banda percepita è piuttosto soggettiva e varia da soggetto a soggetto);
2) in realtà, nel passaggio da 96khz a 48khz i moderni sistemi di conversione non si limitano a dimezzare i dati, questo perchè si rischierebbero errori, ma applicano comunque un algoritmo di predizione.
Rispondi
di Pietro utente non più registrato
commento del 08/11/2017 ore 01:03:47
Sbagliato,le frequenze udibili dall'orecchio umano sono esattamente 20-20.000hz,c'è un'intera bibliografia e dati al riguardo,solo che con il passare del tempo (invecchiamento) e/o lo stile di vita,in genere diminuisce anche di 12Khz (il modo naturale,se qualcuno frequenta ambienti "chiassosi" probabilmente anche di più).
Rispondi
di Andy Cappellato [user #45705]
commento del 08/11/2017 ore 04:45:10
Ciao fabrimix1, grazie dei complimenti :)
Si, la banda udibile dall'orecchio umano di 20-20.000 Hz è teorica e come dice Pietro, perdiamo la percezione delle frequenze più alte a causa dell'età e di altri fattori esterni.
Per quanto riguarda la conversione di Sample Rate, hai ragione, anche nel caso di dimezzamento vengono introdotti errori, minimi rispetto ad un aumento o cambio della frequenza di campionamento. Grazie della precisazione!
Rispondi
di qualunquemente1967 [user #39296]
commento del 08/11/2017 ore 08:14:43
Molto interessante grazie per l'articolo ciao
Rispondi
di Andy Cappellato [user #45705]
commento del 08/11/2017 ore 10:39:09
Ciao qualunquemente, grazie! :)
Rispondi
di Nemo [user #713]
commento del 08/11/2017 ore 10:44:14
"Secondo il teorema di Nyquist-Shannon la massima frequenza udibile corrisponde alla metà della frequenza di campionamento". Decisamente impreciso, e teoricamente errato. Il Teorema di Nyquist indica sì come minima frequenza di campionamento un limite inferiore di due volte la massima frequenza della Banda del segnale da campionare ma quel limite è escluso (il segno nella formula è di "maggiore uguale a" '>' e non di "maggiore uguale a" '>=').
Riguardo al suo valore, essendo direttamente collegato al numero di campioni generati, il reale vantaggio nel sovra-campionamento (cioè nell'allontanarsi il più possibile dal limite minimo) consiste principalmente in una migliore corrispondenza tra il fenomeno originale e la sua versione campionata rispetto al suo sviluppo nel tempo. Questo favorisce innanzitutto, all'interno dei DAW, tutti i meccanismi di time stretching.
Sull'MP3 invece, è fuorviante, secondo me, definirlo come nell'articolo. Il passaggio all'MP3 richiede infatti di generare nuovi campioni, a partire dal formato originale, funzione di un'analisi in frequenza del segnale. La banda non viene realmente ridotta, piuttosto modificata, attenuando (o rimuovendo) frequenza considerate psico-acusticamente meno significative. Il motivo è legato anche ai discorsi sulla reale percezione dell'orecchio umano, rispetto ai limiti teorici.
Rispondi
di Andy Cappellato [user #45705]
commento del 08/11/2017 ore 16:20:38
Ciao Nemo, ti ringrazio per le tue precisazioni molto esaurienti e puntuali. Questo articolo intende essere più divulgativo che non tecnico/scientifico, con una conseguente semplificazione di alcuni concetti per renderli più fruibili e comprensibile a tutti, non per questo errati o imprecisi. Grazie comunque per il tuo feedback per noi sempre importante per migliorare i nostri contenuti.
Rispondi
di MojoKingBee [user #39456]
commento del 08/11/2017 ore 10:59:17
bell'articolo, ma l'ogg non è lossless
Rispondi
di Andy Cappellato [user #45705]
commento del 08/11/2017 ore 11:23:43
Ciao MojoKingBee, grazie per la precisazione. OGG è un formato “contenitore” che può contenere diversi tipi di file al suo interno, quindi sia lossy che lossless come il FLAC. Inserisco la precisazione nell’articolo, grazie.
Rispondi
di MojoKingBee [user #39456]
commento del 08/11/2017 ore 11:28:28
vero, è che comunemente per ogg si intende il formato vorbis (che usa l'estensione .ogg) che è appunto lossy.
il flac infatti è citato a parte nell'articolo (insieme all'ogg)

EDIT
per completezza cito da wikipedia (vai al link)

Vorbis è un algoritmo nato in concomitanza al formato contenitore Ogg e con questo spesso confuso, principalmente a causa:

dell'iniziale sovrapposizione dei due progetti;
dell'estensione associata ai file Vorbis (.ogg e .oga);
del MIME-Type associato ai file Vorbis (application/ogg);
del lungo periodo necessario a sviluppare codec alternativi a Vorbis che potessero approfittare del medesimo container Ogg, chiarendo le finalità generiche di quest'ultimo.
Rispondi
di Andy Cappellato [user #45705]
commento del 08/11/2017 ore 16:21:40
Grazie MojoKingBee, a presto!
Rispondi
di Claudio80 [user #27043]
commento del 14/11/2017 ore 16:10:00
Ho sempre adorato la produzione della musica dalla a alla z. Tuttavia il cambiamento dei tempi/progresso tecnologico mi mette sempre un poco in difficoltà...Tante e tante nozioni da sapere, che ovviamente ben vengano, ma troppo poco il tempo per assimilarle e sperimentarle in ambito, per quanto mi riguarda, dell'home-recording. Nella mia breve esperienza, preferisco un metodo un po' più pragmatico, e diretto, un po' più analogico, più spontaneo, Comunque l'articolo è di assoluto interesse. Grazie!
Un saluto.
Rispondi
Loggati per commentare

di Andy Cappellato [user #45705]
commento del 14/11/2017 ore 16:39:34
Ciao Claudio80, grazie dei complimenti!
Concordo sul fatto che in un momento storico come questo stare dietro alla tecnologia non è per niente facile. In compenso possiamo fare cose in un piccolo home studio o in viaggio con un portatile che pochi anni fa ci sognavamo. È il rovescio della medaglia! Speriamo con le nostre guide di rendere tutto un po' più digeribile! :)
Rispondi
di Claudio80 [user #27043]
commento del 14/11/2017 ore 16:41:03
Assolutamente si! Ben vengano i vostri consigli...
Rispondi
di Les Strat [user #47361]
commento del 27/11/2017 ore 18:49:36
Interessante articolo dato che lavoro sia con file audio che video.
Per quanto riguarda la registrazione di strumenti (uso uno Zoom R8),è preferibile registrare i takes a 48000/24,fino alla creazione del master finale e solo in seguito per la distribuzione portarlo a 44100/16?
Rispondi
Altro da leggere
Manuale di sopravvivenza digitale
Go:Keys: tastiere Roland con suoni pro per chi inizia
Fundamental Ambient: riverbero sperimentale Walrus a prezzo budget
Theodore Standard: la Gibson perduta di Ted McCarty diventa realtà
Hotone Omni AC: quel plus per la chitarra acustica
American Series: la Soloist USA con due EMG in duplice versione
Articoli più letti
Seguici anche su:
Scrivono i lettori
Manuale di sopravvivenza digitale
Hotone Omni AC: quel plus per la chitarra acustica
Charvel Pro-Mod DK24 HSH 2PT CM Mahogany Natural
Pedaliere digitali con pedali analogici: perché no?!
Sonicake Matribox: non solo un giochino per chi inizia
Ambrosi-Amps: storia di un super-solid-state mai nato
Il sarcofago maledetto (e valvolare) di Dave Jones
Neural DSP Quad Cortex: troppo per quello che faccio?
Massa, sustain, tono e altri animali fantastici
Ho rifatto la Harley (Benton ST-57DG)




Licenza Creative Commons - Privacy - Accordo.it Srl - P.IVA 04265970964