SISTEMI MUSICALI
(Stefano Lanza1)
Per sistema musicale intendiamo l'insieme delle regole di organizzazione e uso dei
suoni per produrre musica nell'ambito di una data cultura; in forma semplificata
viene definito anche come "sistema di intervalli". Questa organizzazione comporta la
determinazione: A) delle note, cioè del repertorio dei suoni a disposizione, B) della
loro intonazione e C) delle loro relazioni, inquadrate in modelli primari di condotta
melodica e/o armonica (scale, generi, modi, strutture, ecc.), talvolta anche D) regole
per la determinazione e l'organizzazione delle durate.
A. Che cosa sono le note? Nonostante che maggioranza dei musicisti, anche ad alto
livello, continui a definire le note come i "segni grafici che rappresentano i suoni
musicali", o tutt'al più come i "nomi dei suoni musicali", in realtà le note sono i suoni
musicali stessi (uso questo termine non nel significato obsoleto di "suoni
determinati" in altezza, contrapposti ai "rumori", ma in quello di "suoni definiti per
l'uso musicale").
Non è di scarsa importanza questa precisazione. Il concetto di nota corrisponde
nella musica al concetto di suono nella fisica. Ma perché non usiamo nella musica lo
stesso termine "suono" della fisica? Perché ha un altro significato. Infatti:
1) i suoni fisici sono infiniti, perché fra due frequenze, per quanto ravvicinate, posso
sempre produrre (o almeno immaginare) una frequenza intermedia; ora, infiniti
suoni sono ingestibili, irrappresentabili, irriproducibili con sufficiente esattezza. Nella
musica bisogna quindi fare una selezione, riducendo la quantità di suoni da usare a
un numero finito, rappresentabile e riproducibile: le note, appunto. Ma quante
note? Il limite naturalmente, è dato dalla capacità di risoluzione dell'orecchio3, ma
bisogna fare una distinzione. Un conto è il confronto fra due frequenze in
simultanea, o in successione diretta (situazione sintagmatica, come dicono i
linguisti), nel qual caso si può sfruttare la capacità dell'orecchio di distinguere
differenze anche piccolissime (come quando si accorda uno strumento), e un altro
conto è la differenza minima necessaria perché due note siano distinguibili in
absentia, cioè a mente, in un contesto di altre note (situazione paradigmatica): per
esempio, con l'attuale sistema di intonazione, l'ascoltatore medio è in grado di
sentire la differenza fra, poniamo un DO che viene suonato in un certo passaggio, e
un SI, o un DO# che viene suonato, a distanza, nel successivo (naturalmente anche
senza saper dare il giusto nome ai due suoni). E' chiaro che, per costituire un
sistema, le note devono differenziarsi a questo secondo livello. Qual è il limite? Non
1
S. Lanza: Sistemi musicali della musica occidentale. Dispense del corso di Teoria Musicale. A.A. 2010-11, pp. 2-6.
In acustica si dice soglia differenziale di altezza, l’incremento minimo richiesto affinché la sensazione uditiva possa
rivelare una differenza tra due stimoli successivi. Cfr. P. Righini:L’acustica per il musicista. Fondamenti fisici della
musica. Zanibon-Milano, rist.1994 , p.110 [n.d.c.].
3
si può dire, perché un sistema è suscettibile di evoluzione anche nella direzione di un
arricchimento del numero dei suoni a disposizione, nella misura in cui l'orecchio
degli ascoltatori è messo in grado di affinarsi gradualmente.
Un breve richiamo storico ci aiuterà a capire il procedimento.
Sulla nascita della musica, e quindi delle note, gli etnomusicologi e gli antropologi della musica ci
suggeriscono che ci sia stata un'evoluzione progressiva dal semplice al complesso e
dall'estemporaneo al sistematico. Il sistema musicale non è un dato naturale, ma è un fatto di
cultura (tant'è vero che in diverse civiltà abbiamo sistemi diversi), e come tale è appreso
inconsciamente dai bambini insieme con la lingua materna e i comportamenti sociali: nell'ambito
della capacità naturale dell'orecchio di riconoscere differenze piccolissime, il bambino apprende a
distinguere quelle che sono significative (di una certa grandezza) da quelle che non lo sono (di
grandezza molto inferiore). Per fare un esempio, il bambino normodotato impara che un suono di
poco superiore a una data nota accettata come "giusta" è una nota crescente (probabilmente
"stonata", cioè fuori del sistema) mentre un suono più alto di almeno un semitono è un'altra nota.
Pare che il punto di partenza nelle civiltà primitive sia stato l'uso di pochissimi suoni grandemente
differenziati (un suono acuto e un suono grave, poi anche un suono medio) cui si sono aggiunti un
po' alla volta suoni intermedi per aumentare il numero dei messaggi possibili, ai quali era però
necessario che l'orecchio si abituasse, perché comportavano differenze di altezza via via
decrescenti. A ciò si aggiunga la disposizione asimmetrica dei suoni che si aggiungevano: per
esempio, dal momento in cui, presa coscienza della natura anche qualitativa della percezione
musicale (per cui suoni a distanza di "ottava" sono sì diversi in altezza, ma anche per certi versi
uguali, tant'è vero che diamo loro lo stesso nome), si trattò di segmentare l'ottava in intervalli più
piccoli, che cosa avvenne? Probabilmente si introdusse dapprima un solo suono intermedio, il
quale però, per i meccanismi della percezione uditiva, fondata su rapporti di frequenza armonici, e
non aritmetici, non era esattamente a metà, ma un po' spostato verso l'alto, nel rapporto più
semplice possibile fra i due estremi: praticamente, fra due DO, dalle parti del nostro SOL. Questa
divisione asimmetrica dell'ottava dava al sistema un certo grado di tensione ad evolversi, perché
produceva intervalli di diversa ampiezza (quelli che noi chiameremmo di "quinta" e di "quarta"):
come dire, se l'orecchio, oltre alla quinta DO-SOL, è costretto a riconoscere anche la quarta SOLDO, può immaginarsi anche la quarta DO-FA (e la quinta FA-DO).
Spunta così una terza nota, ma virtuale, perché, data la sua eccessiva (per quello stadio di
evoluzione del sistema) somiglianza con la seconda, non viene sentita come nota autonoma, ma
come "variante" ("alterazione"?) di questa. Verrà il momento in cui la frequenza d'uso alternato
delle due "varianti" consentirà a un compositore o a un esecutore audace di metterle a contatto
sempre più stretto, "costringendo" l'ascoltatore a prenderne atto e a imparare a distinguerle.
Allora sarà nato il sistema a tre note, anch'esse però distribuite asimmetricamente nell'ottava.
Analogamente, sembra che, in epoca storica, si sia passati da un sistema a cinque note
(pentafonia) distanziate da intervalli che noi chiameremmo toni e terze minori, a quello a sette,
con toni e semitoni, che già ai tempi del canto gregoriano aveva una nota oscillante (ottava nota),
finché negli spazi degli intervalli più grandi, fecero capolino note "varianti", che poi si stabilizzarono
portandoci all'attuale sistema a dodici note. Con l'adozione del temperamento equalizzato (scelta
avulsa da ogni principio teorico, dettata esclusivamente da considerazioni pratiche) il sistema non
presenta più disuguaglianze fra gli intervalli che darebbero una spinta "naturale" a un'ulteriore
evoluzione: è, per così dire, "saturo". E così come è stato "saturato" artificialmente, altrettanto
artificialmente dev’essere spinto ad evolversi, ma senza dimenticare che, sia pure attualmente
soffocate e perciò non più sentite, esistono leggi naturali dell'evoluzione dei sistemi musicali.
Le note sono dunque il risultato di una segmentazione del continuum delle altezze:
che cosa significa ciò? Significa che nell'ambito di una grandezza variabile per
infinitesimi, come l'altezza (frequenza) dei suoni, vengono selezionate un numero
finito di altezze, rispondenti a definiti criteri di scelta. Le frequenze selezionate
diventano gli elementi riconosciuti utilizzabili per l'uso musicale, ad esclusione delle
altre: ogni suono che sarà emesso da una voce o da uno strumento sarà interpretato
in funzione della segmentazione, cioè per paragone con l'elemento cui più si avvicina
in frequenza. Il valore di altezza, la frequenza attribuita a ciascuna nota sarà dunque
un modello ideale cui ciascuna realizzazione effettiva tenderà, ma dal quale di fatto
si discosterà sempre poco o tanto (in un'esecuzione bene intonata, pochissimo). In
ogni caso, anche se la frequenza eseguita fosse media equidistante fra le frequenze
di due note riconosciute non potrà essere interpretata come una nuova nota, se il
sistema non la prevede: nel nostro sistema a dodici note per ottava, una frequenza
intermedia fra un SI e un DO dovrà necessariamente essere classificata come un SI
crescente o come un DO calante (in ogni caso stonata rispetto al sistema).
Nel linguaggio verbale si ha una situazione analoga, utile perciò come paragone per la più
approfondita conoscenza ed esperienza che abbiamo della lingua. In questo caso la segmentazione
riguarda il continuum dei timbri, la quale dà origine ai suoni linguistici, o, meglio, a quei loro
modelli ideali che prendono il nome di fonemi. Pensiamo, per esempio, alle vocali: l'arcobaleno
timbrico (anche i colori dell'arcobaleno ottico sono il frutto di una segmentazione del continuum
delle frequenze visibili) esemplificato dal verso del gatto mieaou può essere segmentato in un
numero variabile di vocali, come riscontriamo confrontando diverse lingue. Saranno da considerare
fonemi distinti quelli il cui scambio dia luogo a parole sentite come diverse: per esempio, in
italiano, pira è una parola diversa (cioè, ha un significato diverso) da pera, ma anche péra (il frutto)
da pèra (congiuntivo poetico del verbo "perire"). Ecco perché, nonostante che i segni siano solo
cinque, il sistema vocalico dell'italiano comprende sette vocali, perché sono fonemi distinti le
forme aperta e chiusa delle "e" e delle "o" (cfr. oratóri, plurale di "oratore", e oratòri, di
"oratorio"). Queste, però, sono distinzioni fonematiche che si vanno perdendo (chi, al di fuori della
Toscana, distingue più la pésca dalla pèsca?).
Le segmentazioni di un continuum possono distinguersi non solo per il numero di elementi
riconosciuti, ma anche per la "spaziatura" fra di essi: per restare alle vocali, c'è una bella differenza
fra il modo di pronunciarle dei piemontesi e dei pugliesi; e la "a" dei baresi è riconoscibilissima per
essere molto vicina a quella che altrove è sentita come una "e".
Le note dunque possono ben essere definite i fonemi della musica, con proprietà
molto simili a quelle dei fonemi linguistici: in particolare, è bene rimarcare che il loro
legame con le altezze, più ancora del legame dei fonemi linguistici col timbro, non è
di per sé assoluto, ma relativo. Sappiamo infatti che l'assegnazione della frequenza
di 440 Hz alla nota di riferimento (LA diapason) è recente, e che ancor oggi non viene
sempre rispettata: nei tempi passati era variabile, anche di molto, sia pure
nell'ambito di una generalizzata tendenza ad innalzarsi cui appunto la Conferenza di
Londra del 1939 intendeva porre uno stop. Sta di fatto che quello che per Giuseppe
Verdi suonava DO, per noi oggi suonerebbe SI bemolle, e gli esecutori di musica
antica si regolano per lo più su un LA di 415 Hz.4
Ma allora con quale criterio diciamo che la tale nota è un LA se può avere una
intonazione così mutevole? Chiamiamo LA la nota di riferimento (e le sue ottave) e
distribuiamo gli altri nomi alle note alle note che stanno, rispetto ad essa, nel
rapporto previsto dal sistema: sarà SOL la nota un tono (ovvero un grado diatonico)
sotto il LA, DO quella una terza minore (o due gradi diatonici di cui un semitono)
sopra, e così via. In pratica il nome delle note identifica, più che la loro frequenza
assoluta, la loro posizione nel sistema.
B.
Descriveremo fra poco in dettaglio i principali sistemi di intonazione
avvicendatisi nella storia della musica occidentale; concludiamo prima l'analisi dei
concetti generali costitutivi di un sistema musicale.
C. Fra le note di un sistema musicale intercorrono sempre delle relazioni più o
meno esplicite e regolamentate, che, senza necessariamente coinvolgere tutte le
note, costituiscono, come si è già detto, dei modelli primari di condotta melodica e/o
armonica. Per esempio, nell'ambito delle dodici note per ottava disponibili nel
nostro sistema, il principale modello di condotta melodica è la scala diatonica, i cui
sette gradi sono legati da una rete di funzioni che generano una tonalità e
costituiscono la premessa delle regole di concatenazione degli accordi: le cinque
note rimanenti, estranee alla data tonalità, permettono di trasportare il modello, e
quindi di modulare e mettere in contrasto le tonalità, ai fini costruttivi ed espressivi.
D. Infine, spesso il sistema si dota di criteri per la determinazione delle durate e di
regole per la loro organizzazione: costruisce cioè dei meccanismi per il controllo
dello svolgimento della musica nel tempo. Ciò è indispensabile quando manchi un
riferimento cronologico esterno alla musica (un testo nella musica vocale) e/o
quando si affermi un'esigenza di riproducibilità fedele. Ci sono dunque due
possibilità:
1) che non ci sia nessuna regola specifica, perché la musica è associata alla parola, e
segue quindi il suo ritmo oratorio, o comunque quando è solistica, in cui il suonatore
non deve fare i conti con nessun altro (o quasi);
2) che il decorso della musica sia inquadrato in una griglia metrica, o almeno sulla
scansione di un battito costante, che consente a) una misurazione precisa delle
durate, se non anche b) una ciclicità, e quindi una prevedibilità, degli eventi ritmici:
in particolare la prima condizione è necessaria per poter eseguire polifonia, la
seconda per accompagnare la danza. Nel caso 2 abbiamo la sovrapposizione di un
ritmo a un metro: due fenomeni uniti nella pratica da un legame strettissimo,
inseparabile, ma che concettualmente vanno chiaramente distinti.
4
Su questo argomento è autorevole il libro di Pietro Righini, La lunga storia del diapason. Bèrben-Ancona, 1990
[n.d.c.].
Il metro, o tempo musicale, è lo strumento con cui la musica tiene il controllo del tempo che passa:
la musica si svolge nel tempo, è l'arte "cronologica" per eccellenza, che non tollera imprecisioni
temporali nemmeno piccolissime e perciò deve misurarne lo scorrere in maniera rigorosa. E come
fa? Con lo stesso mezzo di cui si servono tutti gli altri apparecchi di misura del tempo: facendo
riferimento a una successione di eventi ciclici regolari. Il computo del tempo musicale ebbe inizio
così: dall'osservazione che la linea infinita del divenire è scandita da fenomeni astronomici
equidistanti (culmini di altezza del sole sull'orizzonte e loro variazioni stagionali, fasi lunari),
contando i quali si possono tenere in ordine i ricordi. Tali fenomeni costituiscono ritmi naturali di
vario ordine di grandezza. Analogamente, attivando dei fenomeni ritmici regolari artificiali
(rovesciamento di una clessidra, oscillazione di un pendolo, vibrazione di un cristallo, ecc.) si
possono ottenere unità di misura inferiori a quelle astronomiche.
Il metro si definisce quindi come una successione di battiti regolari, ma, attenzione!, di che natura
sono questi battiti? Non sono certo i battiti fisici del metronomo né i gesti del direttore d'orchestra
– gli uni e gli altri semplici espedienti per evidenziare i "battiti" del metro musicale – ma gli impulsi
mentali che noi pensiamo a intervalli regolari di tempo come appoggi e punti di riferimento per la
collocazione delle note del ritmo. Quest'ultimo nella musica si distingue dal metro perché è
concreto (prodotto dalla percussione delle note effettive: niente note, niente ritmo) e non
necessariamente regolare (cioè è costituito da note di valore in generale diverso, ovvero i cui
attacchi stanno a diverse distanze nel tempo).
Vale la pena di rimarcare anche le differenze fra il ritmo musicale e quello naturale, per spiegare le
origini e quindi evitare le confusioni e le ambiguità che ancora si perpetuano fra i concetti di ritmo
e di metro. I ritmi naturali sono tutti periodici, cioè ciclici, regolari: sono quelli che si fanno notare
e che val la pena di rilevare nel complesso "caotico" degli avvenimenti naturali, proprio come punti
di riferimento per l'ordinamento di questi. Al loro confronto la linea del tempo appare continua e
indifferenziata. Nella musica, invece, la periodicità è già compresa nel concetto di tempo, che è
come una linea già segmentata dai battiti regolari di cui sopra: il ritmo quindi, se dev'essere,
com'è, un concetto distinto, non può identificarsi anch'esso con una ciclicità, bensì con un
andamento libero di porsi in vario rapporto (dalla perfetta aderenza al contrasto più marcato) col
tempo. Il ritmo rispetto al tempo musicale sta nello stesso rapporto del disegno rispetto al foglio
quadrettato o alla carta millimetrata. Lo definiamo come la disposizione degli attacchi delle note
nel tempo.5
Sistemi di intonazione
Un sistema di intonazione è una regola che determina la frequenza delle note non
tanto in modo assoluto (Hertz), quanto in relazione fra loro, a partire da una nota di
riferimento: la determinazione della precisa frequenza di ciascuna sarà il risultato di
calcoli e procedure che il sistema definisce in astratto. Parleremo quindi più di
intervalli che di note, e di queste ultime solo come estremi di intervalli o come
risultato dell'applicazione di essi.
Precisiamo però che l'approccio fisico-matematico agli intervalli è diverso da quello
musicale: in musica si parla di "differenze" di altezza, in fisica di "rapporti di
frequenza". Come dire, perché la nota A formi con la nota B lo stesso intervallo
musicale della nota C con la nota D (abbiano la stessa "differenza" di altezza) bisogna
che il rapporto, la proporzione, non la differenza, fra le frequenze di A e B sia la
5
Cfr. P. Righini op. cit. pp. 15-16 [n.d.c.].
stessa che fra C e D; e un rapporto è rappresentato da una frazione matematica,
ovvero da una proporzione, cioè una divisione. Per esempio se fra il LA3 di 440 Hz e il
LA4 di 880 Hz diciamo che c'è un intervallo di ottava non è perché fra queste note c'è
una differenza di frequenza di 440 Hz (880 – 440), ma perché c'è un rapporto di
frequenza di 1 a 2 (o 1 : 2 o 1 / 2 che dir si voglia). Infatti, la frequenza del successivo
LA, il LA5 che forma un'ottava con il LA4 appena raggiunto, non sarà di 1320 Hz (880
+ 440, stessa differenza di frequenza) ma di 1760 (880 x 2, stesso rapporto).
Un intervallo sarà dunque rappresentato da una frazione matematica di numeri
positivi, la quale rappresenta il valore che, moltiplicato per la frequenza della prima
nota, dà la seconda: se tale valore è maggiore di 1, l'intervallo è ascendente (da una
nota di una certa frequenza a una di frequenza maggiore), se è minore di 1 (ma
sempre maggiore di zero), discendente; fra 1 e 2, è un intervallo entro l'ottava, fra 2
e 4, entro la seconda ottava, ecc.
I risultati di tali operazioni con le frazioni sono frazioni a loro volta, che però
rappresentano note, o meglio le loro frequenza espresse come rapporti rispetto ad
altre. Per esempio prendiamo il rapporto 3/2, che rappresenta, diciamolo subito, un
intervallo di 5.a: se lo applichiamo a una frequenza che consideriamo punto di
partenza dei nostri calcoli, e rappresentiamo quindi col numero 1, otteniamo (1 x 3/2
=) 3/2. Questa frazione risultante, pur uguale a quella che abbiamo appena
utilizzato, rappresenta adesso la frequenza della nota che sta una 5.a sopra la nota di
partenza; applicando ancora l'intervallo di 5.a a quest'ultima, calcolerò: 3/2
(frequenza della nota trovata) x 3/2 (rapporto dell'intervallo di 5.a) = 9/4 (frequenza
della 5.a della 5.a). Se la nota di partenza fosse LA1, due ottave sotto il LA diapason e
quindi di frequenza uguale a (440 : 2 : 2 =) 110, tali operazioni avrebbero condotto a:
110 x 3/2 = 165, frequenza del MI2, e da questo, tramite l'operazione 165 x 3/2, a
247,5, frequenza del SI, 5.a del MI.
Non si confondano dunque le frazioni che rappresentano intervalli con quelle che
rappresentano note.
Le frazioni sono divisioni in forma indicata: eseguendole si ottengono numeri
decimali, che sono un altro modo di rappresentare gli intervalli e le note, ma noi non
ne faremo uso. Useremo invece, per paragoni immediati fra gli intervalli, un'unità di
misura logaritmica, tale cioè da rappresentare i rapporti come differenza (una
visione dunque simile a quella musicale!): il cent, un piccolissimo intervallo pari a
1/100 di semitono temperato, e quindi a 1/1200 di ottava, introdotto nell'uso
dall'inglese Alexander Ellis nel 1884.
Intonazione temperata
(S. Lanza1)
Nell'antichità vigeva il SISTEMA PITAGORICO, la cui invenzione è attribuita al celebre filosofo e
matematico greco. La sua caratteristica principale era di avere i toni un po' più grandi e i semitoni
un po' più piccoli dei nostri (un tono quindi era più ampio di due semitoni). Questo sistema andò
bene finché la musica rimase monodica, cioè a una sola voce; ma con l'inizio della musica
polifonica, verso l'anno 1000, esso si dimostrò inadatto principalmente perché gli intervalli
armonici di 3.a maggiore, formati con due toni così grandi, risultavano dissonanti. Perciò nella
pratica l'intonazione veniva corretta a orecchio, in attesa che venisse stabilito un altro sistema
privo di quei difetti.
Questo fu presentato verso la fine del 1500 da Gioseffo Zarlino, un teorico veneziano, il quale, sul
modello dei suoni armonici, corresse le 3.e di Pitagora restringendo il secondo dei due toni che le
costituivano. Ammetteva cioè due specie di toni, uno grande come quello di Pitagora (tono
maggiore) e uno più piccolo (tono minore), i quali dovevano alternarsi fra i gradi di un certo ordine
fisso. Questo sistema, ancor oggi considerato il modello perfetto dell'intonazione degli intervalli, si
dimostrò però fin dall'inizio inapplicabile in pratica, perché la piccola differenza di ampiezza fra le
due specie di tono produceva piccole differenza nell'intonazione delle stesse note da una tonalità
all'altra: per avere a disposizione tutte le note necessarie in tutti i casi gli strumenti a tastiera
avrebbero dovuto avere tanti tasti da renderne impossibile l'esecuzione. E così pure gli altri
strumenti a intonazione fissa: solo i cantanti, o gli strumenti ad arco, o i tromboni a tiro, che
possono graduare l'intonazione per infinitesimi, possono usare il SISTEMA ZARLINIANO quando
suonano fra di loro.
Ecco perché verso l'anno 1700 si affermò la proposta attribuita al teorico tedesco Andreas
Werkmeister, di perfezionare secondo una regola precisa ciò che già si faceva nella pratica:
1) prima temperando, cioè appiattendo, smussando le differenze di intonazione troppo piccole, e
unificando così in un suono intermedio le note che avessero un'altezza minore di un semitono: in
tal modo le note vengono ridotte alle solite 12;
2) poi equalizzando, cioè rendendo tutti uguali gli intervalli (semitoni) fra di esse. In tal modo tutti
gli intervalli, eccetto le 8.e giuste, risultano un po' “stonati” rispetto alla loro misura perfetta
zarliniana2: ma è un sacrificio che l'orecchio tollera benissimo, e che produce in cambio un gran
vantaggio di semplicità e mobilità per la musica.
Oggi a sua volta il sistema temperato è diventato un modello di intonazione per la musica
dodecafonica, la quale, fondandosi sul principio della scala cromatica, in cui non esiste grado
d'inizio né di fine, bensì le note sono tutte d'uguale importanza, non chiede di meglio che ciò sia
confermato e garantito dalla perfetta uguaglianza di tutti gli intervalli.
Qualcuno sostiene che l'affermazione definitiva del temperamento equalizzato
[intonazione temperata] non si ebbe prima del 1850.
Si tratta dunque di un sistema di intonazione del tipo chiamato partitivo, in cui
l'ottava viene divisa in un certo numero n di intervalli tutti uguali, il cui valore è dato
dalla radice n – esima (nel nostro caso, 12esima) di 2. […] Il nostro non è l'unico
sistema di intonazione equalizzato esistente: se ne trovano in diverse altre culture
musicali. Per esempio a Giava si usa la scala slendro che percorre l'ottava con cinque
1
S. Lanza: Introduzione alla musica. Manuale ragionato di teoria musicale. Zanibon-Padova, 1987, p. 47.
La differenza delle 4.e e delle 5.e è di 2 cent; le 2.e maggiori di 4 cent; e così via. - S. Lanza Sistemi musicali della
musica occidentale. Dispense del corso di Teoria Musicale. A.A. 2010-11, pp. 16.
2
intervalli uguali e nel medio oriente si trova una articolazione dell'ottava in 17 parti
uguali.
Oggi le 12 note sembrano non bastare più, per cui, prendendo a giustificazione
l'esistenza di altre culture di sistemi che prevedono intervalli più piccoli del
semitono, si propongono nuove divisioni dell'ottava in quarti e sesti di tono. C'è una
corrente teorica e un filone di letteratura musicale che fin dalla seconda metà del
secolo XIX propone e promuove l'uso di questi microintervalli.
Il sistema tonale
(Stefano Lanza1)
La descrizione delle caratteristiche del sistema tonale, a partire dalla sua evoluzione
dal sistema modale mette in luce le intenzioni fra sistema di intonazione e sistema
musicale generale. Tutto nasce dall' "invenzione" della polifonia, la quale mise in crisi
un sonnacchioso sistema plurisecolare (quello dei modi ecclesiastici) non solo
contestandone il più che millenario e venerato sistema di intonazione, ma anche i
meccanismi compositivi. Le prime fra le nuove regole che fu necessario stabilire
riguardavano situazioni di necessità: quali fra gli inusitati, fino ad allora, incontri di
note simultanee (intervalli armonici) fossero sempre accettabili, quali non lo fossero
mai, e quali talvolta, sub condicione. E fin qui si tratta solo del vecchio sistema
modale di regole di "compatibilità allargata" alla polifonia. Ma nei margini di scelta
nell'ambito del consentito si esplorarono un po' alla volta le alternative possibili, e
finirono per affermarsi delle preferenze.
Questa evoluzione si vede in modo più chiaro nei procedimenti di conclusione di
pezzi, sezioni, frasi. Infatti il problema del compositore-esecutore non è quello di
cominciare: per questo, basta rompere il silenzio in un modo qualsiasi; il problema è
quello di finire, cioè di interrompere la successione dei suoni in modo non
traumatico, anzi, dando all'ascoltatore, l'impressione convincente che è proprio ora
di finirla. Ora, a questo scopo, una singola melodia può facilmente accondiscendere
ai suggerimenti della sinestesia, la facoltà umana che associa fra loro le esperienze
dei vari organi di senso in modo che una sensazione esperita con l'uno suscita il
ricordo di quelle esperite con altri: in particolare le sensazioni acustiche hanno il
potere di risvegliarne altre provenienti dall'esterno o dall'interno. Così, come
testimoniano i termini musicali stessi, che sono in gran parte metafore spaziali,
l'altezza dei suoni dà l'idea di una proporzionale tensione, come se "ci si sentisse" a
quell'altezza, con conseguente attrazione a cadere: maggiore altezza, maggiore
tensione; grande intervallo, grande sbalzo di tensione. Analogamente per mezzo
della densità ritmica (numero di battiti ritmici per unità di tempo) si può dosare la
tensione sul versante temporale. Perciò, per produrre un'aspettativa di conclusione
si dovrà dare il senso di una diminuzione graduale della tensione generale, tramite
un andamento melodico congiunto discendente e, possibilmente, un allargamento
1
S. Lanza: Sistemi musicali della musica occidentale. Dispense del corso di Teoria Musicale. A.A. 2010-11, pp.22-27
del ritmo.
Le voci che si aggiungono ad ornamento di una melodia primaria, però, si
troveranno condizionate dai modi di procedere e dalla semplice presenza di questa
(e delle altre precedentemente aggiunte), con una progressiva limitazione delle
scelte a disposizione. Per esempio, la prima voce aggiunta potrà, e dovrà,
concludere sulla stessa nota della melodia originaria, per rispetto del suo modo, ma
dovrà farlo per moto contrario, dato che deve essere una melodia diversa. E poiché
la stragrande maggioranza di melodie gregoriane finisce con un passo congiunto
discendente, la melodia aggiunta finirà con un passo congiunto ascendente. Ne
nasce uno stereotipo: la formula conclusiva data da un intervallo di 6a che si apre in
8a, o uno di 3a che si chiude in unisono [Es. 1-2].
Le ulteriori voci aggiunte che potranno fare?
La terza voce potrà ancora raggiungere la medesima finalis, ma dovrà farlo di salto, a
partire da una nota consonante con quelle delle due voci precedenti, e cioè con una
scelta praticamente obbligata; oppure finirà con una nota consonante con la finalis
ma che, in quanto diversa, darà la sensazione di un altro modo: conflitto di modi?
Come risolverlo? A quali condizioni accettarlo? Una maniera di togliersi dagli impicci
largamente usata nei primi tempi della polifonia era il ricorso alle clausolae, formule
convenzionali che volevano dire "il pezzo è finito". C'erano interi repertori di
clausolae: quando il compositore aveva concluso il suo lavoro, sceglieva fra le
clausolae a disposizione una che ben si concatenasse con la disposizione delle voci
cui era giunto e gliela appiccicava (o più semplicemente dava un'indicazione della
clausola cui ricorre per concludere). L'uso delle clausolae è una procedura
convenzionale, un segnale artificioso di conclusione; la faticosa e problematica
combinazione di note nel rispetto delle regole acquisite e accettate, generando la
necessità di stabilirne ulteriori altre, è una procedura di evoluzione, per così dire,
naturale.
Intanto che ci si trova in queste strettoie, che sembrano condurre a soluzioni uniche
e obbligate, si aprono però anche piccoli spazi di scelta. Per esempio, qualcuno finirà
per notare che si ha un effetto di conclusione più convincente quando la voce che
procede per grado congiunto ascendente si trova ad eseguire un semitono anziché
un tono; questo qualcuno proporrà di applicare tale effetto anche in situazioni
(modi) in cui il semitono ascendente per natura non ci sia, modificando l'intonazione
della penultima nota. Questa scelta, come al solito, provocherà dei problemi di
conflitto con altre voci (per esempio il tritono con la voce centrale: se sopra Fa-Mi-Re
e La-Sol-La metto Re-Do#-Re, si crea il tritono Do#-Sol [Es.3]). Ci sarà chi per quieto
vivere preferirà non applicarla in questi casi; chi invece, più audace, pur di non
cedere si avventurerà in soluzioni inimmaginabili dei problemi insorgenti (alterazione
della voce interna per restringere il tritono: Sol# insieme col Do# [Es.4]).
Finché, un po' alla volta, si affermerà una soluzione, o un ristretto gruppo di
soluzioni preferenziali, o almeno una regola per affrontare il problema, lasciando la
possibilità di trovare di volta in volta soluzioni personali.
Quella che abbiamo descritto, come tutti hanno capito, è la comparsa sulla scena
musicale occidentale della sensibile, cioè l'affermarsi della percezione di una sorta di
"attrazione" melodica che una nota subisce da parte di quella che le sta un semitono
sopra. Ne possiamo ravvisare le tracce fin dal XIII secolo, a dispetto dell'incapacità
della scrittura di allora di esprimere queste "alterazioni" dell'intonazione di certe
note: per questo si parlava di musica ficta, cioè "finta", perché tali modifiche
andavano introdotte d'iniziativa, senza che fossero indicate, seguendo il proprio
gusto e senso musicale. Una conseguenza fu la progressiva affermazione di un nuovo
modo: quello di Do che fu chiamato ionico e che noi oggi chiamiamo maggiore, la cui
scala ascendente finisce appunto con un semitono (ed è formata da due tetracordi
disgiunti uguali, il che rende meno percepibile il tritono fra il IV e il VII grado). A
questo nuovo "modello unico" si dovettero adattare gli altri modi, dando la sensibile
a tutti quelli che non ce l'avevano per natura. E' facile immaginare la resistenza
opposta a questa forzatura da parte del modo di Mi (frigio), che sopra il suo Fa
naturale non accettava un Re#: e questo fu effettivamente per lungo tempo un
cruccio e un problema per i compositori.
Questo è il germe del senso tonale, che consiste nel riconoscere, utilizzare e infine
regolamentare varie relazioni di attrazione-opposizione fra le note, non in quanto
tali, ma in quanto gradi di una scala, cioè in base alla loro posizione reciproca nel
contesto. I teorici ci hanno messo un bel po' a trovare i concetti giusti per descrivere
questo nuovo modo di sentire la musica. Fino almeno a tutto il '500 si è tentato di
giustificare i nuovi procedimenti con allargamenti ad hoc delle teorie tradizionali
(Dodekachordon di Heinrich Loris Glareanus); nel corso del '600 cominciarono a
spuntare qua e là concetti appropriati ("attrazione", "fondamentale" degli accordi e
unità sostanziale degli stati, ecc.), ma fu solo nel 1722 che Jean-Philippe Rameau
riuscì a dare un quadro razionale, ordinato e compiuto delle procedure nel suo Traité
de l'harmonie reduite a sés principes naturelles, e bisognerà arrivare alla fine dell'
'800, cioè praticamente al periodo in cui, secondo certuni, il sistema tonale era già
finito, per averne la codificazione moderna, attualmente in uso, da parte di Hugo
Riemann (concetto di "funzione", classificazione delle sue tipologie in "regioni
tonali", ecc.).
Possiamo individuare la caratteristica fondamentale del sistema tonale proprio nel
concetto di funzione, e il governo dei suoi meccanismi in regole di funzionalità.
Cerchiamo di capire di che cosa si tratta.
Fa parte delle abilità, che ciascuna persona mediamente dotata possiede, anche il
senso della scala diatonica maggiore: cioè ci si può aspettare da chiunque che, oltre
a conoscere il nome delle sette note, le sappia anche cantare in successione, da Do a
Do. E' una competenza acquisita inconsciamente, come quella di parlare la lingua
materna: e infatti qualcuno definisce il senso della scala diatonica "lingua materna
musicale". Ogni bambino riesce ad estrapolare, dalle frasi linguistiche che gli
vengono rivolte, gli elementi di prima e seconda articolazione (morfemi e fonemi) di
cui queste sono costituite, nonché le regole che gli permettono di ricombinarli
correttamente per produrre nuove frasi; analogamente, anche dalle proprie
esperienze musicali ognuno di noi ricava la percezione degli elementi primi che le
compongono, le note, e della loro combinazione primaria, la scala. Ma, attenzione!
Questa competenza non consiste nel ricordare a memoria i suoni: chiunque infatti è
in grado di intonare correttamente i gradi della scala; purché naturalmente rientrino
nell'estensione della sua voce, a partire da qualsiasi nota o suono che gli si dia, e che
lui chiamerà comunque Do. Si tratta dunque della competenza di un processo, di
una successione, di un'arcata di effetti che, a partire da un effetto dato, porta, nel
giro di 7 passi, a un senso di conclusione soddisfacente sull'ottava del suono di
partenza. La scala deve essere conclusa all'ottava, cioè su una nota dello stesso
nome, come la chiusura di un cerchio, pena un senso di incompletezza, di mancato
raggiungimento della meta, di insoddisfazione bisognosa di essere saziata. La scala è
dunque percepita come una frase musicale di senso compiuto: le condizioni per cui
la si sa cantare sono assolutamente le stesse per cui si sa riprodurre (e, viceversa,
riconoscere) una melodia conosciuta, a prescindere dalla tonalità. In pratica,
sappiamo riprodurre non le note, ma gli intervalli, sia pure inconsapevolmente.
Quindi, nel cantare una scala, cioè nel ricostruire quella successione di effetti, di
grado in grado noi estraiamo dalla nostra esperienza il suono, unico e insostituibile,
che ci vuole in quel momento per portare avanti il lavoro: ogni suono nella scala
svolge un ruolo inconfondibile, che dipende esclusivamente dalla sua posizione nella
medesima. Immaginiamo la scala come l'arcata di un ponticello fatto di otto blocchi,
comprese le basi di sostegno, di partenza e di arrivo: ogni blocco ha non solo una
posizione diversa rispetto alle basi, ma anche una diversa carica di tensione fra forza
di gravità e spinte laterali, per cui, se lasciato a sé stesso, ciascuno tenderebbe a
cadere in una diversa posizione e distanza rispetto alle basi (e le basi non si
muoverebbero proprio). Analogamente i gradi della scala sembrano avere ciascuno
una sua propria e diversa carica di tensione verso l'uno o l'altro dei due punti di
appoggio che sono le note di partenza e di arrivo. Queste sono le funzioni, che
possiamo definire come cariche dinamiche (in senso fisico e non musicale), o
tensioni di movimento, proprie dei gradi della scala. Tali tensioni variano in quantità
o gradazione (da "zero", la stabilità, che appartiene soltanto alla "base", il I grado, al
massimo che è la fortissima attrazione del VII grado per il I) e in qualità o direzione
(per es.: I grado = direzione "zero", e infatti non si muove; gradi II, III e IV = direzione
retroflessa, cioè attrazione più o meno forte per il I grado precedente; gradi V, VI e
VII = direzione anteroflessa, cioè verso il I grado seguente, detto talvolta VIII).
In questa forma originaria, a questo livello primario, le funzioni sono forze
melodiche, proprietà dei gradi della scala che sono note. Vi alludono, in modo
ingenuo e approssimativo, i "soprannomi" che si usa dare ai gradi della scala: tonica,
sopratonica, mediante o caratteristica, sottodominante (la quale, più che,
banalmente, come "grado che precede o sta sotto la dominante" va interpretata
come "dominante di sotto", cioè antagonista inferiore" della tonica, in posizione
speculare alla dominante "di sopra", dominante, sopradominante, sensibile. E'
evidente che cambiando tonalità, la posizione nei gradi della scala generale cambia,
e quindi cambia l'attribuzione delle funzioni alle note.
Ma in un contesto polifonico le note sono quasi sempre inserite in accordi, e quindi
sommate ad altre note portatrici di funzioni diverse: come si conciliano? Senza
domandarci quale ne sia la giustificazione teorica, scientifica o psicologica,
osserviamo che, di fatto, l'influsso della funzione di ciascuna nota che forma un
accordo sull'effetto funzionale complessivo dell'accordo stesso diminuisce al salire
della posizione della nota nell'accordo: così un accordo esprimerà sempre la
funzione del grado che ne è la fondamentale (nota al basso nello stato diretto),
mentre la 3a contribuirà solo per sfumature, la 5a per niente se non, nel caso sia
alterata, come dissonanza, insieme con l'eventuale 7a. Questo è il secondo livello,
armonico, di manifestazione delle funzioni tonali, quello che si dà per scontato,
anche senza specificarlo, quando si parla di armonia.
Esiste anche un terzo livello, architettonico o formale, che citiamo adesso per
completezza anche se vi accenneremo meglio fra un po', in cui le funzioni si
manifestano nella forma di tonalità dei gradi.
Questa triplice gradazione corrisponde a un progressivo ampliamento
dell'esplicitazione delle funzioni, con la possibilità di specificarle sempre più in
dettaglio. Per farcene un'idea consideriamo l'analoga gradazione che si ha nella
lingua nella manifestazione dei valori grammaticali. Questi sono concetti che lo
"spirito della lingua" considera indispensabili, tanto da sentire il bisogno di
richiamarli sistematicamente nella formazione delle frasi e spesso anche delle
parole, o almeno di darsi dei mezzi standardizzati per esprimerli: genere, persona,
numero, causa, eventualità, qualificazione, ecc. Consideriamo, per esempio, il valore
grammaticale del tempo: questo può essere espresso a livello minimale, cioè con
minima possibilità di specificazione, dalla coniugazione dei verbi, nella quale si
distingue solo passato, presente e futuro; per dirne un po' di più si può ricorrere a un
avverbio di tempo, il quale però, essendo una parte invariabile del discorso, va preso
come sta, non è modificabile; con un complemento di tempo, forma nominale
complessa, si possono aggiungere numerose specificazioni sotto forma di aggettivi e
complementi dipendenti; ma è solo con l'impiego di una intere proposizione
temporale che ci si apre la possibilità di introdurre qualsiasi specificazione.
Non è qui né il luogo né il caso di fare un riassunto di una teoria completa
dell'armonia tonale, ma vale la pena di richiamare almeno la teoria delle regioni
tonali, non inventata ma così bene e definitivamente organizzata da Hugo Riemann:
questa dice che, pur ammettendo che le funzioni tonali dei gradi della scala
diatonica siano tutte diverse l'una dall'altra, a livello di accordi loro "tipologie" si
riducono sostanzialmente a tre, quelle espresse nella forma più piena dai gradi
fondamentali della tonalità (I, IV e V). Alle "regioni tonali" intitolate a questi si
ascrivono per affinità (e qui si riscontrano piccole varianti da un teorico all'altro) gli
altri gradi, destinati a sostituire (applicazione vicaria) o a prolungare (applicazione
dilatoria) la funzione dei gradi principali. Le conseguenti regole sulla concatenazione
degli accordi appartenenti alla stessa o a diverse regioni tonali finiscono per
inquadrare un modello universale di costruzione della frase tonale, riassumibile in
T > (SD) > D > T
che vuol dire: da una situazione di tonica si passa (o anche no) a una situazione di
sottodominante, da questa (oppure direttamente dalla tonica) a una situazione di
dominante che sfocia infine in una situazione di tonica (usiamo il termine
"situazione" per indicare la generalità di tutti i casi riconducibili a una certa regione:
quindi accordi principali e secondari, diretti e rivoltati). Le variazioni possibili nelle
realizzazioni di questo modello sono infinite, perché non solo si ha a disposizione più
di una scelta ad ogni livello [accordo principale e/o accordo secondario, accordo
facoltativo (uno o più) sì/no, ecc.] e più di una realizzazione di base per ogni scelta
(accordi diretti o rivoltati, con diversa distribuzione delle note tra le voci e nello
spazio sonoro, ecc.) ma il modello stesso può essere reiterato a volontà e non si
contano le possibili variazioni ed elaborazioni retoriche del modello in sé e delle sue
reduplicazioni.
Non sfugge la somiglianza di questo modello musicale col modello universale di
costruzione delle frasi linguistiche, che tradizionalmente ha la forma Soggetto >
Predicato > Complementi, ma è più chiaro se lo riscriviamo nella forma moderna
della grammatica strutturale: Gruppo nominale > Gruppo verbale > Gruppo
nominale. L'analogia sembra veramente precisa nell'impianto: la frase comincia e
finisce con lo stesso tipo di elemento e ha l'elemento di contrasto in mezzo, per cui
viene spontanea l'associazione "tonica – gruppo nominale" e "dominante – gruppo
verbale"; ha inoltre lo stesso svolgimento ad "arcata" ("esordio" – "carica" –
"compimento"). Questa constatazione ha indotto certuni a cercare corrispondenze
nei dettagli, pensando che l'analisi grammaticale della lingua, essendo più antica e
collaudata, possa essere una buona guida per una classificazione, tutta da costruire,
degli elementi grammaticali della frase musicale: per esempio qual è il
corrispondente musicale della congiunzione?
A parte questa amenità, facciamo notare due particolarità comuni al modello
linguistico e a quello musicale, oltre a quella della variabilità infinita nelle
applicazioni. Le citiamo in riferimento al modello linguistico, meglio conosciuto, per
evidenziarne poi le corrispondenze in quello musicale:
1) il modello interpretativo è unico, anche per le costruzioni che sembrano non
corrispondervi: si introducono allora concetti che classificano vari casi di
incompletezza. Così, per esempio, si parla di frasi "ellittiche" quando un elemento
manca ma è deducibile dal contesto (esempio: "Vuoi una mela o una pera?" "Una
mela": nella risposta manca sia il soggetto che il predicato, ma sono deducibili dalla
domanda); di frasi "impersonali" quando manca il soggetto e non ne è possibile
nessuno ("Piove": chi piove? Non c'è nessun soggetto possibile); ecc. Analogamente
in musica tutte le frasi tonali si analizzano in termini di T, SD e D, anche quando uno
o più elementi sembrino non esserci.
2) il modello è unidirezionale, come mostrano le frecce fra un elemento e l'altro: ciò
significa che è il soggetto che condiziona il predicato, e questo i complementi, e non
viceversa, a prescindere, nella lingua, dall'ordine delle parole (per esempio, nella
frase "A questo guaio rimedieremo noi" il primo sintagma nominale è preceduto
dalla preposizione plurale perché deve concordarsi col soggetto "noi"). Nella frase
musicale tonale non sono possibili queste inversioni nell'ordine degli elementi, ma
vale l'unidirezionalità: una volta raggiunta la dominante, non si può tornare indietro
alla sottodominante, ma bisogna procedere alla tonica.
*****