il segnale analogico, di natura elettrica, è tale per cui che la rappresentazione analogica del suono lavora per “analogia” ovvero la curva continua nel tempo costituita dalle variazioni di ampiezza dell’onda di pressione acustica, viene rappresentata da un’analoga curva continua nel tempo i cui punti sono le variazioni di tensione elettrica. Questa seconda curva può essere memorizzata all’interno dei solchi di un disco in vinile o nel campo magnetico di un nastro e riproduce fedelmente le variazioni di ampiezza del suono acustico.
La rappresentazione digitale del suono invece non riproduce la curva continua di ampiezza con una curva analoga ad essa, ma è una successione finita di numeri (discreta) che rappresentano di volta in volta il valore dell’ampiezza in istanti successivi di tempo.
Pertanto, in ambito analogico si ha un curva continua che approssima una curva continua mentre in ambito digitale si ha una successione di numeri che approssima una curva continua. I numer icostituenti la successione digitale vengono rappresentati in ambito binario e sono chiamati campioni (sample). I loro valori si riferiscono alla tensione elettrica del segnale analogico.
Perché è importante poter trasformare il suono dal segnale analogico a quello digitale? I vantaggi del codice digitale, costituito da una sequenza finita di dati, sono innumerevoli:
1) essendo un numero determinato, cosentono di dimensionare opportunamente i supporti di memorizzazione (hard disk, nastri);
2) non inducono fenomeni di degradazione del segnale durante le operazioni di copia del segnale stesso: infatti copiando ripetutamente lo stesso segnale analogico si ottiene una degradazione sempre maggiore della qualità del segnale in quanto l’operazione di copia deve nuovamente approssimare con una curva continua la curva che era stata memorizzata in precedenza e questo introduce sempre più errori. Invece, fare una copia di numeri non comporta alcun errore: la curva memorizzata in precedenza rimane sempre la stessa, non subisce alterazioni nella copia;
3) le operazioni di manipolazione (termine tecnico tradotto in inglese con le parole processing, editing) del segnale digitale sono operazioni aritmetiche che comporteranno il cambiamento di alcuni numeri. Se si vuole incrementare l’intensità di un suono basta moltiplicare i suoi numeri per il fattore desiderato di amplificazione. Invece, nel corrispondente caso analogico, bisogna utilizzare un dispositivo elettronico per accrescere l’ampiezza della curva in questione;
4) il segnale digitale può avere algoritmi in grado di correggere gli errori introdotti dai supporti per la memorizzazione (compact disc, dvd, dat, ecc.) e dai dispositivi di trasmissione (via cavo, via satellite). Gli errori “digitali” consistono nel leggere alcuni numeri, rappresentanti il segnale, in maniera differente rispetto a come erano stati memorizzati. Un sistema digitale, grazie alla finitezza del codice, conosce quali sono le rappresentazioni possibili, e quindi è in grado di rilevare e correggere alcuni errori mediante l’introduzione di informazioni aggiuntive rispetto al segnale vero e proprio.
La rappresentazione digitale del segnale audio porta anche degli svantaggi:
1) è necessaria la realizzazione di un’interfaccia di comunicazione tra l’interno e l’esterno dell’elaboratore, costituita tipicamente da una scheda audio che ospita i convertitori AD (analogico-digitale) e DA (digitale-analogico)
2) i processi di conversione inducono approssimazioni del segnale.
3) per avere una qualità del segnale comparabile con i migliori sistemi analogici occorrono grandi capacità di memoria, di calcolo e di velocità di trasmissione per la memorizzazione, la manipolazione e il trasferimento del segnale, comportando ovviamente costi maggiori. Per fortuna la tecnologia è in rapida evoluzione e nel corso degli anni ha consentito di adottare numerose soluzioni per mitigare questi svantaggi. La tecnolgia digitale applicata all’audio è piuttosto recente e risale dall’inizio degli anni ’80.
Quando si considera la catena audio di un processo di registrazione e riproduzione che utilizza un computer per l’acquisizione, l’editing e la memorizzazione dei segnali dobbiamo pensare allo schema mostrato nell'immagine del presente articolo. Come possiamo osservare, il suono subisce una serie di modificazioni dette trasduzioni ovvero dei processi che trasformano il segnale da una forma energetica in un’altra: la trasduzione che opera la trasformazione acustica-analogica è effettuata tramite il microfono, quella analogica-digitale e viceversa dai convertitori AD e DA, quella analogica-acustica da un diffusore (monitor, speaker).
In un processo puramente analogico, il microfono cattura le variazioni di pressione dell’aria e le “trasduce” in un segnale elettrico, ovvero, i valori della pressione x del segnale in ingresso vengono convertiti nei valori di tensione y del segnale in uscita, in modo che le variazioni di y rappresentino ancora le variazioni di x. Viceversa, il diffusore è un trasduttore elettroacustico ha in ingresso un segnale i cui valori esprimono una variazione di tensione y che trasduce in un segnale d’uscita i cui valori x rappresentano una variazione di pressione x. Anche l’orecchio è un trasduttore elettroacustico: come il microfono, trasduce l’energia acustica in impulsi nervosi di tipo elettrico. Le variazioni di tensione descrivono “esattamente” il segnale acustico. Il debole segnale elettrico in uscita da un microfono risulta essere molto debole e pertanto deve passare attraverso un preamplificatore e un amplificatore prima di essere registrato tipicamente su un nastro magnetico; qui una testina elettromagnetica produce un campo magnetico sulla pellicola di polvere o ossido di ferro o ancora ferro-cromo che è presente sul nastro. Il campo magnetico, fatto variare nel tempo dalla corrente elettrica della corrente sulla testina, orienta in modo ordinato le particelle di polvere di ferro. Dai supporti di memorizzazione analogici il segnale può essere prelevato mediante un lettore adeguato (ad esempio un giradischi, in cui la testina trasduce l’andamento dei microsolchi in un segnale elettrico), amplificato e mandato ai diffusori acustici, che trasducono il segnale elettrico in un segnale sonoro acustico. Se un sistema è di alta fedeltà (e di conseguenza abbastanza costoso), le curve di ampiezza sonora iniziale e finale sono piuttosto simili. Comunque sia, gli elementi della catena introducono del rumore e della distorsione più o meno accentuata a seconda della qualità delle macchine e dei cavi. Il rumore è un segnale indesiderato ad ampio spettro che si aggiunge al segnale analogico. Quando presenta un livello di segnale piuttosto omogeneo in tutte le frequenze è detto rumore bianco (è il tipo rumore, fruscio, che si percepisce passando manualmente da un canale radio FM ad un altro). Per la riduzione del rumore (noise reduction) dai supporti analogici sono stati sviluppati vari sistemi il cui più noto è quello della Dolby. Per stimare l’ammontare di rumore introdotto da un sistema analogico, si utilizza una grandezza chiamata rapporto segnale-rumore (Signal-to-Noise-Ratio - SNR) che è definita come il rapporto tra la massima ampiezza utile del segnale e l’ampiezza del rumore presente:
SNR = max ampiezza segnale/ampiezza rumore
È chiaro che maggiore è il rapporto SNR, migliore sarà la qualità del segnale. Si usa esprimerlo in decibel:
SNR (in dB) = 20 log (max ampiezza segnale/ampiezza rumore)
Un altro parametro utilizzato per esprimere la qualità del dispositivo audio analogico è la gamma dinamica (dynamic range) ovvero il rapporto tra l’ampiezza massima e quella minima presenti nel segnale. È misurata in decibel e pertanto esprime la differenza tra l’ampiezza massima e l’ampiezza minima presenti nel segnale in che significa che un segnale audio che passa da un pianissimo a un fortissimo o viceversa presenta un’estesa gamma dinamica. Ovviamente un sistema analogico migliore è un sistema che approssima meglio la gamma dinamica del segnale in ingresso. La presenza di un rumore nel segnale analogica limita la gamma dinamica riducendola. La distorsione è una modifica non voluta della forma d’onda (e quindi dello spettro) di un segnale audio. Nei componenti elettronici, la distorsione aumenta con l’ampiezza. Per ampiezza utile si intende quella massima alla quale non si presentano effetti di distorsione, ovvero quella alla quale la distorsione è mantenuta al di sotto di una certa soglia di tolleranza prefissata. Se osserviamo i parametri di un’onda, la distorsione può essere in frequenza, ampiezza e fase. Un tipico caso di distorsione in frequenza è presente nella nostra percezione uditiva perchè l’orecchio risponde in modo differente alle diverse frequenze e quindi la forma d’onda percepita è differente dalla quella in ingresso.
Il segnale digitale (numerico, discreto) è una successione di numeri che rappresentano l’ampiezza del segnale in precisi e ravvicinati istanti di tempo. Lo strumento che effettua la trasduzione analogica-digitale è il convertitore AD mentre il procedimento è detto campionamento del suono. Cosa vuol dire campionare un segnale? Vuol dire trovare una rappresentazione discreta per qualcosa che in origine è una variazione continua. Ad un tempo fissato e ripetuto da un circuito di clock, interno al convertitore, lo strumento effettua una lettura di ampiezza del segnale in ingresso che associa ad un campione (sample). Passato un tempo pari al precedente, viene effettuata una nuova lettura e creato un nuovo campione. Il tempo che trascorre tra un campione e il successivo è detto tempo di campionamento. Se diminuiamo il tempo che trascorre tra un campione e il successivo otteniamo un maggior numero di letture, ovvero di campioni, nell’unità di tempo. Il numero dei campioni che vengono creati al secondo stabilisce il tasso o frequenza di campionamento (sample rate - SR), espresso in hertz. Si preferisce parlare di frequenza soltanto quando si parla di cicli al secondo per un segnale, impiegando il nome tasso o velocità quando si parla di campioni al secondo. In inglese, la confusione viene evitata usando il termine frequency per la frequenza vera e propria, e il termine rate per i campioni. Se ad esempio utilizziamo una SR di 10 Hz significa che in un secondo avremo 10 campioni e pertanto il tempo di campionamento sarà pari a 0,1 secondi (1/10). Se invece SR = 100 Hz, allora avremo 100 campioni e il tempo di campionamento sarà pari a 0,01 secondi (1/100). Ovviamente più è alta la sample Rate e maggiore sarà la risoluzione, ovvero la qualità con cui approssimiamo la curva analogica.