home studio

Il manuale dei musicisti emergenti

Cap 4: l’home studio

Nel capitolo della scorsa settimana del nostro “manuale” (lascio qui il link per chi se lo fosse perso), abbiamo parlato del contratto discografico; inoltre, durante il nostro percorso, abbiamo parlato di come provare a scrivere un testo di una canzone e di come proteggerla a livello di diritto d’autore. Da qualche anno, è possibile depositare la propria canzone in SIAE o Soundreef in formato digitale, mp3 o wav che sia.

È impossibile non notare come ormai la tecnologia “smart” sia entrata nelle vite di ciascuno di noi in ogni aspetto della quotidianità; anche per noi musicisti, la musica è cambiata con l’affermazione sempre più crescente del concetto di “home studio”. Per scrivere e produrre una nostra canzone, ci bastano ormai pochi componenti: un pc, una scheda audio, un paio di cuffie o di casse e una midi keyboard. Sia ben chiaro un concetto: lo studio di registrazione in quanto tale non è morto ma è certamente vero che quella che io definisco “democratizzazione del processo creativo” fa parte del presente e farà certamente sempre più parte del futuro, prossimo e lontano.

Entriamo nell’argomento partendo dal segnale analogico e da quello digitale e vediamo insieme come si registra, si modifica e si riproduce del materiale audio.

Analogico e digitale |

L’informazione analogica ha un carattere continuo: si passa da uno stato al successivo mediante una serie infinita di valori.

Prendiamo in considerazione un’onda sonora che, propagandosi attraverso l’aria, trasporta l’informazione da una sorgente ad una destinazione. Dal punto di vista fisico, quando parliamo, generiamo uno spostamento d’aria che giunge all’orecchio dell’interlocutore dove viene convertito in informazioni accessibili al cervello che è così in grado di decodificare il significato dell’informazione sorgente.

Un’onda sonora analogica contiene informazioni in maniera continua durante tutto il suo ciclo. Ogni parte dell’onda trasporta informazioni e non solo i valori desunti al momento di massima e minima ampiezza dell’oscillazione.

L’informazione digitale ha un carattere discreto. Si passa cioè da uno stato al successivo senza valori intermedi. L’informazione digitale conosce esclusivamente due possibili valori: 0 oppure 1, accesso oppure spento, presente oppure assente, massimo oppure minimo. Non vi è quindi alcun valore intermedio.

Le informazioni di tipo analogico e digitale sono trasversali e si applicano a comunicazioni telefoniche, video e ovviamente audio. Le onde sonore generate dalla sollecitazione di un corpo elastico si trasmettono attraverso l’aria; possiamo prendere come esempio il suono generato dalle corde di un pianoforte o la compressione/espansione dell’aria all’interno degli strumenti a fiato. Per poter essere registrate su un supporto magnetico, tali onde sonore dovranno essere convertite in un differente formato: la tensione elettrica.

Consideriamo, ad esempio, ciò che accade quando si suona una chitarra elettrica. La vibrazione indotta dalla sollecitazione delle corde viene recepita dai pick up dello strumento e convertita in tensione elettrica. La tensione elettrica così generata prosegue il suo viaggio, mediante un apposito cavo, verso l’amplificatore dove viene successivamente amplificata e inviata a una cassa acustica. La cassa acustica così sollecitata produce lo spostamento d’aria necessario a percepire il suono convertendo nuovamente la tensione elettrica in pressione sonora.

Durante il tragitto effettuato dalla tensione elettrica attraverso il cavo, è possibile che il segnale venga in qualche modo alterato in maniera indelebile da disturbi elettromagnetici: sono frequenti i ronzii che si percepiscono quando si suona la chitarra. In realtà, con alcuni semplici accorgimenti (Direct Input Box e cavi bilanciati), il problema può essere circoscritto in maniera efficace ma i costi del tentare spasmodicamente di mantenere la sorgente analogica intatta, “pulita”, ed esente da fattori contaminanti aumentano considerevolmente.

A ogni registrazione su nastro magnetico, il segnale audio analogico subirà un inevitabile deterioramento rispetto all’originale. Al contrario, in ambito digitale, l’informazione è replicabile all’infinito rimanendo di fatto identica alla prima digitalizzazione effettuata. È questo il motivo che ha portato oggi a utilizzare macchine per la registrazione digitale: esse permettono di effettuare operazioni che sarebbero altrimenti impossibili in ambito analogico, mantenendo relativamente contenuti i costi.

L’obiezione più diffusa imputata alla digitalizzazione è relativa al fatto che, essendovi una riproduzione approssimata delle informazioni analogiche, il risultato non sarà mai sufficientemente “analogo” all’informazione originale. Oggi, però, grazie alla sempre maggiore definizione offerta dal processo di digitalizzazione, ciò si rivela un compromesso vantaggioso in quanto l’informazione digitalizzata, pur non essendo pienamente “sovrapponibile” a quella analogica, a livello teorico è potenzialmente indistinguibile.

In conclusione, l’essere umano, seppur operando in un mondo “fisico” dove la trasmissione delle informazioni avviene in maniera analogica, si avvale di computer che operano in ambito digitale. Da ciò, scaturisce un’oggettiva difficoltà di comunicazione. Noi non siamo in grado di percepire il suono di una cifra (informazione digitalizzata) e quindi, nel contesto della produzione musicale, diventa necessario avvalersi di un “traduttore” che si interfacci tra uomo e macchina effettuando continui cambi di formato dall’ambito analogico a quello digitale e viceversa: l’interfaccia audio e l’interfaccia MIDI.

Durante un percorso di produzione musicale, si utilizzano due tipologie di informazioni: MIDI e audio. Il termine Digital Audio Workstation (DAW) definisce l’intero sistema composto da software e hardware impiegato per la produzione musicale. Generalmente, una DAW è composta dai seguenti elementi: uno o più computer, un software in grado di registrare, modificare e riprodurre eventi MIDI e audio e le relative interfacce.

Registrare, modificare e riprodurre materiale audio |

Una sorgente audio analogica, per essere acquisita all’interno di un computer, dovrà necessariamente essere digitalizzata. Definiamo quindi i seguenti punti del percorso che il suono dovrà affrontare per arrivare all’interno del computer e ritornare alle nostre orecchie:

  1. Sorgente sonora
  2. Preamplificazione
  3. Conversione da analogico a digitale
  4. Ingresso nel computer
  5. Registrazione/modifica/riproduzione dei dati digitalizzati mediante le funzionalità offerte dalla DAW
  6. Uscita dal computer
  7. Conversione da digitale ad analogico
  8. Ascolto mediante studio monitor e/o cuffie

Per sorgente sonora, s’intende lo strumento musicale: la chitarra, la batteria oppure la voce umana che si ha intenzione di acquisire all’interno della DAW. La sorgente sonora intraprende il viaggio verso il computer attraversando innanzitutto il preamplificatore. Il preamplificatore è un elemento necessario per ottimizzare il livello della sorgente al fine di ottenere un corretto livello di registrazione. Il livello sonoro si misura in decibel (dB): 0 dBFS (o deciBel Full Scale) rappresenta il livello massimo raggiungibile in ambito digitale. L’obiettivo del preamplificatore nel contesto di una registrazione digitale è quello di gestire il livello della sorgente sonora mantenendolo entro, mai oltre, il livello di 0 dBFS. Il preamplificatore dispone solitamente dei seguenti controlli: Input Selector, Pad/Attenuator, Gain.

L’”Input Selector” consente di impostare la tipologia di sorgente sonora presente all’ingresso del preamplificatore al fine di poter gestire correttamente le differenti tipologie di segnale. Potremo avere alcune o tutte tra le seguenti opzioni: Line, Mic oppure Instrument. La sorgente di tipo “Line” è solitamente rappresentata da apparecchiature elettroniche come, ad esempio, sintetizzatori e drum machine. Quella di tipo “Microphone” o “Mic” è rappresentata dal microfono con il quale si procederà ad acquisire la performance, ad esempio, di un’esecuzione vocale oppure una batteria. La sorgente di tipo “Instrument”, invece, è rappresentata solitamente da chitarra elettrica, basso elettrico e pianoforte elettrico (Rhodes o Wurlitzer).

Il “Pad/Attenuator” è un controllo necessario per applicare un’eventuale attenuazione del livello della sorgente in ingresso al preamplificatore. Spesso presentato come selettore di tipo switch, in relazione ad apparati di differenti marche e modelli, potremmo trovare questo parametro con assegnati differenti valori d’attenuazione.

Il controllo “Gain”, spesso presentato sotto forma di controllo rotativo, consente di gestire il livello della sorgente. Nel contesto della registrazione digitale è necessario ottimizzare il livello di registrazione portandolo a un valore prossimo a 0 dBFS. È di fondamentale importanza che la sorgente non oltrepassi mai tale livello altrimenti si introdurrebbero distorsioni che minerebbero l’integrità della sorgente sonora da acquisire.

È necessario prestare molta attenzione alla qualità dei preamplificatori inclusi nel percorso audio. Qualsiasi segnale audio che attraversi componenti elettronici ne verrà inevitabilmente condizionato; quindi, un preamplificatore dotato di un circuito di bassa qualità contribuirà a peggiorare la realtà della sorgente mentre un buon preamplificatore potrebbe contribuire a renderla addirittura più interessante.

La sorgente audio, ora ottimizzata dal preamplificatore, può procedere verso il successivo appuntamento: la conversione da segnale analogico a dato digitale. Il convertitore analogico/digitale (Digital Audio Converter A/D; d’ora innanzi abbreviato con DAC A/D) si occupa di campionare la forma d’onda analogica traducendola in dati digitali. Per comprendere meglio il funzionamento del DAC A/D, facciamo un esempio: paragoniamo il DAC A/D a una cinepresa in grado di “filmare materiale audio” e tradurlo in numeri comprensibili al computer. Va da sé che una cinepresa con prestazioni elevate acquisirà materiale di qualità superiore rispetto a una con specifiche tecniche meno performanti: il DAC A/D rappresenta un importante crocevia verso un’elevata qualità dell’acquisizione del materiale audio.

La sorgente così digitalizzata dal DAC A/D può ora continuare il viaggio verso il computer attraverso diverse connessioni: USB, FireWire 400, FireWire 800, Thunderbolt oppure PCI. Il computer non è in grado di comprendere a cosa facciano riferimento i dati digitali in ingresso; per questo motivo, è necessario installare un software denominato “driver” il quale ha il compito di informare il computer dell’esistenza di un nuovo apparato in grado di fornire materiale audio digitale.

Il materiale audio, finalmente giunto all’interno del computer, può essere ora preso in consegna dalla DAW. I dati digitali, mediante l’utilizzo di una Track Audio, verranno salvati all’interno di un audio file sull’hard disk del PC. Adesso, potranno essere gestiti e modificati a piacimento all’interno della DAW mediante l’utilizzo di finestre dedicate. È ora completo il percorso audio in ingresso (input). È bene chiarire che, se a questo punto vi fossero distorsioni oppure imperfezioni dovute ad un’errata impostazione dei parametri, sarebbe già troppo tardi per porvi rimedio.

Il materiale ora riprodotto dalla vostra DAW continua il percorso audio, questa volta in direzione inversa alla precedente: dall’uscita del computer verso le nostre orecchie. La DAW può riprodurre, dall’hard disk, l’audio file precedentemente acquisito indirizzandolo verso differenti apparati che ne consentano l’uscita dal PC e quindi la possibilità di essere ascoltato in un contesto analogico.

L’orecchio umano non “sente i numeri” e, di conseguenza, è necessario un ulteriore convertitore che operi questa volta in senso inverso al precedente: da digitale ad analogico (d’ora innanzi DAC D/A). Il DAC D/A convertirà la sorgente precedentemente digitalizzata nuovamente in forma d’onda analogica. Ora, all’uscita del convertitore D/A, potremo connettere i nostri studio monitor oppure le cuffie ed ascoltare di nuovo la riproduzione della sorgente.

L’interfaccia audio |

Ma allora cos’è un’interfaccia audio e come mai non è citata nel percorso che abbiamo appena valutato? L’interfaccia audio è un apparato hardware che consente a un computer di acquisire e/o riprodurre materiale audio. Si sono da tempo diffusi apparati con un numero variabile di preamplificatori, DAC A/D e DAC D/A. Non è stabilito a priori quale dotazione debba avere un’interfaccia audio ma possiamo ritenere che debba contenere almeno un convertitore D/A. Sebbene i computer di ultima generazione godano di un’interfaccia audio incorporata, al fine di incrementare la qualità del percorso audio, è corretto valutare l’utilizzo di un apparato esterno e dedicato.

Per effettuare una buona ripresa di materiale video, si ha necessità di una buona cinepresa, di un buon soggetto e di effettuare un corretto settaggio dei parametri quali zoom e focus. Volendo fare un parallelismo con il DAC, quali sono i parametri da regolare in un convertitore A/D? I parametri in questione sono il Sample Rate e il Bit Resolution i quali avranno un enorme influsso sulla qualità dell’acquisizione e riproduzione del materiale audio digitale.

Il Sample Rate |

La qualità dell’hardware presente nel percorso audio definisce la qualità dell’audio acquisito sebbene sia necessario valutare anche la componente software con le sue impostazioni come la frequenza di campionamento (d’ora innanzi, Sample Rate). Il Sample Rate definisce il numero di campionamenti (sample) che il DAC acquisisce o riproduce ogni singolo secondo: si misura in Hertz (abbreviato in Hz).

Per comprendere meglio cosa sia un campionamento audio, facciamo un piccolo esempio. Poniamo di andare al cinema a vedere un film con il nostro attore preferito: in realtà, al cinema non è ovviamente presente l’attore in carne e ossa bensì stiamo vedendo una serie di fotografie dell’attore, i fotogrammi, mostrati a una velocità sufficientemente elevata da indurre l’occhio umano a rilevare un movimento fluido. Quanti fotogrammi servono per “ingannare” l’occhio? In realtà, solo poche decine: i professionisti in ambito video utilizzano da ventiquattro a trenta fotogrammi per secondo (frames per seconds, abbreviato fps).

Al contrario, per “ingannare” l’orecchio, inducendolo a credere che ciò che sentiamo provenire dal nostro computer sia veramente il suono di una chitarra e non “il filmato” di suono di chitarra, dovremo acquisire un numero di fotogrammi decisamente maggiore, dell’ordine delle decine di migliaia. Ogni fotogramma nel precedente esempio rappresenta in realtà un campionamento: il numero di campionamenti che il DAC acquisirà per ogni secondo è definibile dal parametro Sample Rate. Attualmente, i settaggio più diffusi di Sample Rate sono: 44.1, 88.2, 48, 96 e 192 kHz. Un Sample Rate elevato porterà ad una maggiore fedeltà nell’acquisire la sorgente ma va tenuto in considerazione che più il Sample Rate sarà elevato, maggiore sarà il carico di lavoro del computer: ciò andrà a scapito di altre elaborazioni come, ad esempio, la possibile attivazione di ulteriori plug-in all’interno del brano su quale si sta operando.

Nella figura, la linea rossa rappresenta la forma d’onda analogica, che appare sinuosa e continua in quanto può disporre di una risoluzione pressoché infinita, mentre la linea nera rappresenta la stessa forma d’onda ma digitalizzata. La forma d’onda nera appare squadrata in quanto il DAC, operando in maniera discreta, non può rappresentare valori intermedi. In sostanza, l’audio analogico dispone di una risoluzione pressoché infinita mentre l’audio digitale, o meglio, l’audio analogico “digitalizzato” campiona la sorgente in un numero finito di sample. La differenza tra le due forme d’onda potrà o meno essere percepita dall’ascoltatore ma porrà comunque innanzi alla certezza che la sorgente analogica e la sua digitalizzazione non sono “esattamente” la stessa cosa.

Per acquisire materiale audio all’interno del computer, è necessario digitalizzarlo ma allora quale Sample Rate sarà meglio utilizzare? In realtà, la scelta del Sample Rate dipende da una serie di fattori. Tenendo in considerazione che, una volta effettuata l’acquisizione, non ci sarà spazio per nessuna miglioria, ha senso ponderare bene quali siano i settaggi corretti.

Si tenga in considerazione che il supporto CD supporta esclusivamente il Sample Rate di 44.1 kHz; ne consegue che, se si volesse stamparne una copia da ascoltare in macchina, si dovrebbe necessariamente ottenere un brano finito a tale frequenza di campionamento. Qualora venisse richiesto di poter utilizzare il medesimo brano per una colonna sonora, il regista probabilmente chiederà un audio file a 48 kHz oppure a 96 kHz. In quest’ottica, è bene impostare il proprio sistema per operare con Sample Rate superiori a 44.1 kHz. Personalmente, consiglio 48 kHz al fine di consentire di esportare comodamente il prodotto aggiornandone la qualità relativamente all’effettivo contesto di utilizzo.

Il parametro Bit Resolution consente di definire la risoluzione dinamica di ogni singolo campionamento audio. Facciamo un esempio: poniamo di effettuare una fotografia alla risoluzione di un pixel. Di fatto, otterremo solo una banale macchia di colore rendendo la foto di fatto inutile in quanto non rappresentativa del soggetto. Ovviamente, aumentando il numero di pixel all’acquisizione, la definizione dell’immagine ne trarrebbe immediatamente giovamento potendo offrire più realisticamente i contorni e i colori offerti dal soggetto originario. Incrementando il numero di pixel, quindi aumentando la definizione, acquisiremo anche particolari praticamente invisibili a occhio nudo.

Come una macchina fotografica usa la quantità di pixel per ottenere fotografie di qualità più elevata, il DAC utilizza la quantità di bit per definire la dinamica della sorgente audio. La maggior parte dei DAC oggi in commercio può operare a 16 oppure a 24 bit. Alla risoluzione di 16 bit, abbiamo la possibilità di “catturare” 65536 (216) possibili livelli audio. A ogni bit che aggiungiamo, raddoppierà la risoluzione sino ad arrivare a 24 bit laddove toccheremo la vetta dei 16777216 (224) possibili livelli per ogni singolo sample. Un piccolo confronto: il formato CD opera a 44.1 kHz/16 bit; si avranno allora 44100 sample al secondo ognuno dei quali avrà la risoluzione di 65536 possibili livelli audio. Alla risoluzione di 96 kHz/24 bit avremo 96000 sample al secondo con una risoluzione di quasi 17 milioni di possibili livelli audio. Una quantità enorme di informazioni aggiuntive catturate ogni singolo secondo.

Va tenuto in considerazione che le suddette impostazioni sono relative e non assolute: non bastano a “far suonare bene” un brano. In sostanza, non ha senso acquisire a 192 kHz/24 bit tramite preamplificatori e DAC scadenti. Un’ulteriore considerazione: se, per quanto riguarda il Sample Rate, si potrà optare per il settaggio che si riterrà più opportuno in relazione al materiale che si vuole acquisire, per quanto riguarda il Bit Resolution, è sempre consigliabile acquisire a 24 bit in quanto ciò apporterà chiari vantaggi alla qualità del vostro lavoro.

È da chiarire un ultimo concetto: il Buffer Size. La comunicazione tra la DAW e l’interfaccia audio non avviene in tempo reale (un sample dopo l’altro), bensì viene utilizzato un buffer in ingresso e uno in uscita. Il materiale audio in acquisizione dal percorso in ingresso verrà posto nel buffer di input mentre il materiale audio che verrà ascoltato andrà a colmare il buffer di output: il tempo necessario a “riempire” i buffer è denominato latenza ed è avvertito come un ritardo nel percepire l’operazione richiesta.

Un Buffer Size di piccole dimensioni diminuisce il tempo di latenza ma appesantisce il lavoro della CPU. Un Buffer Size di grandi dimensioni, al contrario, alleggerisce il lavoro della CPU ma aumenta il tempo di latenza. In sostanza, si ha un rapporto indirettamente proporzionale tra i parametri “latenza” e “carico sulla CPU”. Ne consegue che, durante la fase di registrazione, è preferibile mantenere il tempo di latenza al minimo onde evitare fastidiosi ritardi nel percepire la performace da parte del musicista (mediamente 10/11 ms sono già percepibili) mentre, durante la fase di missaggio, dove è necessario destinare la potenza del nostro computer al funzionamento di processori di segnale, è tollerabile un tempo di latenza superiore.

Dopo questo articolo pieno di tecnicismi, finisce qui la nostra rubrica dedicati ai musicisti emergenti. Ci si rivede presto su Recensiamo Musica. Buona musica a tutti.

The following two tabs change content below.

Francesco Cianciola

Classe '93, Francesco Cianciola è un chitarrista, autore, arrangiatore e produttore musicale. Si affaccia alla scena nazionale nel 2017 firmando il brano "Tutta colpa mia", in collaborazione con Warner Chappell Music Italy e Universal Music Italia, cantato da Elodie alla 67° edizione del Festival di Sanremo e certificato disco di platino. Questo lo porta nel 2018 a collaborare nuovamente con Warner Chappell Music Italy per il disco di Ermal Meta, successivo alla sua vittoria del Festival di Sanremo, "Non abbiamo armi", certificato disco di platino, firmando il brano "Il vento della vita". Dal 2020, è docente di "Music Production" presso la University of West of Scotland.

By Francesco Cianciola

Classe '93, Francesco Cianciola è un chitarrista, autore, arrangiatore e produttore musicale. Si affaccia alla scena nazionale nel 2017 firmando il brano "Tutta colpa mia", in collaborazione con Warner Chappell Music Italy e Universal Music Italia, cantato da Elodie alla 67° edizione del Festival di Sanremo e certificato disco di platino. Questo lo porta nel 2018 a collaborare nuovamente con Warner Chappell Music Italy per il disco di Ermal Meta, successivo alla sua vittoria del Festival di Sanremo, "Non abbiamo armi", certificato disco di platino, firmando il brano "Il vento della vita". Dal 2020, è docente di "Music Production" presso la University of West of Scotland.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.