Controllo dei livelli acustici
dei messaggi pubblicitari e
delle televendite
Misurazioni sperimentali
oggettive e soggettive
pagina intenzionalmente bianca
pagina 2 di 45
Sommario
1
INTRODUZIONE ...................................................................................................................................5
2
LE MISURE OGGETTIVE “DI BASE”........................................................................................................5
3
4
5
6
2.1
Le misure consolidate: lo stato dell’arte ............................................................................................................6
2.2
Le misure nelle future normative e per i futuri scenari......................................................................................7
MISURE DIAGNOSTICHE E PER L’ANALISI DELLA QUALITA’ ..................................................................8
3.1
Analisi del “livello ordinario” dei programmi .....................................................................................................9
3.2
Analisi del “livello di potenza sonoro delle pubblicità” ....................................................................................11
3.3
Una variabile “neutrale”: i valori  ...................................................................................................................13
MISURAZIONI SPERIMENTALI ............................................................................................................14
4.1
E01: misurazioni sperimentali ..........................................................................................................................14
4.2
E02: misurazioni sperimentali ..........................................................................................................................14
4.3
E03: misurazioni sperimentali ..........................................................................................................................15
4.4
E04: misurazioni sperimentali ..........................................................................................................................15
4.5
E05: misurazioni sperimentali ..........................................................................................................................16
4.6
E06: misurazioni sperimentali ..........................................................................................................................16
4.7
E07: misurazioni sperimentali ..........................................................................................................................16
4.8
E08: misurazioni sperimentali ..........................................................................................................................17
4.9
E09: misurazioni sperimentali ..........................................................................................................................17
4.10
E10: misurazioni sperimentali ..........................................................................................................................18
4.11
E11: misurazioni sperimentali ..........................................................................................................................18
4.12
E12: misurazioni sperimentali ..........................................................................................................................18
4.13
E13: misurazioni sperimentali ..........................................................................................................................19
4.14
E14: misurazioni sperimentali ..........................................................................................................................19
4.15
E15: misurazioni sperimentali ..........................................................................................................................20
4.16
E16: misurazioni sperimentali ..........................................................................................................................20
4.17
E17: misurazioni sperimentali ..........................................................................................................................20
4.18
E18: misurazioni sperimentali ..........................................................................................................................21
4.19
E19: misurazioni sperimentali ..........................................................................................................................21
4.20
E20: misurazioni sperimentali ..........................................................................................................................22
4.21
Considerazioni generali sui “livelli ordinari”.....................................................................................................22
4.22
Considerazioni generali sui livelli di “loudness della pubblicità”......................................................................24
MISURE DIAGNOSTICHE E PER L’ANALISI DELLA QUALITA’ ................................................................26
Le "MISURE" per il controllo del livello sonoro delle pubblicità.........................................................29
6.1
7
8
Statistica delle "unità" e delle "misure" ...........................................................................................................30
MISURE SOGGETTIVE.........................................................................................................................30
7.1
I test eseguiti nell'ambito dei Tavoli Tecnici.....................................................................................................33
7.2
Una nuova "valutazione soggettiva" ................................................................................................................33
7.3
Considerazioni sulle misure soggettive (ed i test soggettivi) ...........................................................................34
CONCLUSIONI ....................................................................................................................................35
pagina 3 di 45
9
ALLEGATI ...........................................................................................................................................36
9.1
ALLEGATO A: LISTA DELLE 20 EMITTENTI REGISTRATE E LORO VALORI STATISTICI RELATIVAMENTE A
"UNITA' e MISURE"...........................................................................................................................................36
9.2
ALLEGATO B: LA DISTRIBUZIONE DI PROBABILITA’ ..........................................................................................41
9.3
ALLEGATO C: ESEMPI DI LETTURA DELLE DISTRIBUZIONI DI (delta)..............................................................43
9.4
ALLEGATO D: VERIFICA INFRAZIONI SU CAMPAGNA SPERIMANTALE..............................................................44
pagina 4 di 45
1
INTRODUZIONE
Scopo della relazione è fornire una panoramica sulle misurazioni e sulle misure attinenti al
problema del controllo dei livelli acustici dei messaggi pubblicitari e delle televendite per quanto
riguarda le trasmissioni televisive su digitale terrestre (DVB-T) e satellitare (DVB-S) in formato
“standard definition”. Più rigorosamente possiamo dire che le misurazioni sono pertanto attinenti
a segnali stereofonici o, qualora ve ne siano ancora in servizio, monofonici. Nel caso, piuttosto
improbabile, di segnali monofonici tuttavia si intende che il medesimo segnale sia trasmesso
sempre su due canali audio, questo al fine di rendere compatibili i livelli dei segnali, monofonici e
stereofonici, rispetto ai livelli di loudness, che altrimenti risulterebbero disallineati di circa 3LU. In
altre parole un segnale “monofonico” vero, cioè monocanale, ha sempre un valore minore di 3LU
rispetto a quello costituito dal medesimo segnale trasmesso in forma replicata su i due canali di
un segnale stereofonico.
Il lavoro è articolato in tre sezioni.
Per prima cosa la descrizione tecnica delle misure, in cui si descriveranno oltre che le misure “di
base”, dove con questo termine intendiamo quelle misure strettamente necessarie alla verifica
del divieto imposto dalla normativa vigente, anche ulteriori misure diagnostiche e/o statistiche
da noi utilizzate per effettuare una più dettagliata ed esplicativa analisi dei risultati ottenuti.
Verranno quindi utilizzati degli schemi di analisi aventi l’ambizione di fornire una visione più
approfondita rispetto alla semplice verifica dei divieti imposti dalla normativa, con lo scopo di
caratterizzare la qualità del segnale audio rispetto al livello di loudness dei segmenti pubblicitari
di nostro interesse.
Segue la descrizione dei risultati sperimentali ottenuti dalla campagna di misura conclusasi ad
inizio 2011, e che ha coperto esaustivamente quanto richiesto dal committente ed in particolare
ha permesso il controllo dei livelli pubblicitari di 20 emittenti (14 su DBV-T e 6 su DVB-S) su un
periodo di una settimana. A tal fine è stato necessario registrare 240 giorni completi di segnale
audio per un totale di circa 4 bilioni di byte (o se vogliamo 4 terabyte). Questo ha permesso di
avere una dettagliata visione dello scenario relativo alle principali emittenti nazionali per quanto
riguarda il livello sonoro delle pubblicità rispetto ai valori di livello ordinario dei programmi.
Conclude il lavoro una ragionata revisione delle misure e delle misurazioni effettuate, con
particolare attenzione a tutti quei fattori che contribuiscono alla determinazione ed alla verifica
di infrazione del divieto stabilito in delibera. In questa ottica si sottolineeranno sia alcune misure
a questo associate, sia i suoi punti critici anche il relazione alla percezione, e quindi la
correlazione tra la verifica di infrazione e il fastidio apportato da un eccessivo livello di potenza
delle pubblicità rispetto a quella dei programmi ordinari. Alcuni suggerimenti su metodologie
alternative che possono risolvere le incongruenze evidenziate chiudono la presente relazione.
Nel seguito di questo lavoro la trattazione sarà principalmente concentrata sulle misure oggettive
che sono il riscontro sperimentale delle misurazioni sul segnale audio. Si farà riferimento agli
effetti ed ai correlati soggettivi e percettivi sulla base delle esperienze maturate e di sommari
controlli operati da ascoltatori esperti, ovvero attraverso una metodologia diagnostica generica
basata su ascolti di esperti.
2
LE MISURE OGGETTIVE “DI BASE”
Come già anticipato, per poter parlare delle misurazioni è prima necessario definire chiaramente
le misure, ovvero gli strumenti tecnici che permettono la loro esecuzione.
Per misure di base intendiamo pertanto quell’insieme minimo di grandezze necessarie alla
verifica di infrazione del divieto di cui alla delibera 219/09/CSP. Nel seguito ci atterremo
strettamente a quanto oggi definito e quindi alle misure “consolidate” da norme tecniche. In
pagina 5 di 45
seguito vedremo brevemente le possibili evoluzioni di queste misure e l’ampliamento dello
scenario di applicazione delle medesime. Non verranno qui affrontati invece i criteri che
determinano la verifica di infrazione, in quanto tali criteri sono arbitrari e non costituiscono
propriamente una misura oggettiva. Dell’effetto di tali criteri si discuterà al termine del presente
documento.
2.1
Le misure consolidate: lo stato dell’arte
Nel nostro caso, una volta accordatoci sulla misura di loudness, la situazione è piuttosto semplice
perché possiamo ridurre l’insieme delle misure necessarie ad una unica grandezza, ovvero a
quella definita nella normativa EBU come “integrated loudness”, ovvero della misura di loudness
di un segnale audio a partire da un determinato istante di tempo ad un altro determinato istante
di fine. Ai fini della verifica di infrazione l’esecuzione di tale misura deve essere declinata in due
modalità. La prima per il calcolo del “livello ordinario”, che corrisponde appunto alla misura di
integrated loudness eseguita su un unico segmento audio corrispondente a cinque giorni contigui
di segnale (a partire sempre dalla mezzanotte o più propriamente dall’ora zero), mentre la
seconda corrisponde alla misura del singolo evento pubblicitario, ed è quindi la misura di
integrated loudness avente come istante di inizio e di fine quelli corrispondenti all’inizio e alla
fine della pubblicità medesima.
È quindi sufficiente avere uno strumento che realizzi un’unica misura, quella di integrated
loudness appunto, per operare tutte quelle misurazioni necessarie alla determinazione di
infrazione.
Ricordiamo, molto brevemente dato il fatto che i dettagli tecnici e implementativi sono
accuratamente descritti nelle normative internazionali, che, relativamente alla delibera AGCOM,
la misura deve essere effettuata secondo gli algoritmi definiti nella raccomandazione ITU
BS.1770, utilizzando una finestra di analisi che può essere di lunghezza compresa tra 300ms e
1000ms, con un gating relativo di -8dB rispetto al livello ungated (ma misurato con un gating di
sicurezza assoluto pari a -70LKFS) ed operando su finestre di analisi contigue ovvero senza
sovrapposizione. Qualsiasi implementazione che soddisfi tali requisiti deve ritenersi valida ai fini
delle misurazioni necessarie a verificare l’infrazione del divieto. In particolare risulta valida da
definizione di “integrated loudness” definita nella raccomandazione EBU R128 che risulta identica
a quella sopra descritta e dove la lunghezza della finestra temporale di analisi è fissata a 400ms
(tempo ammesso in quanto nell’intervallo 300ms 1000ms previsto da AGCOM). Questa è anche la
misura che abbiamo utilizzato nella esecuzione delle misurazioni sperimentali che verranno
successivamente esposte.
Vi è però una formale differenza tra la realizzazione della misura di “integrated loudness” definita
nel documento tecnico EBU 3341 e quanto richiesto nella Delibera AGCOM. Se quest’ultima
infatti non prevede alcuna sovrapposizione tra le finestra di analisi, al contrario la normativa EBU
recita “a constant overlap between consecutive gating blocks of at least 50% is required (for
increased precision especially when measuring programs of short duration)”. La tecnica di
eseguire la misura con finestre parzialmente sovrapposte in realtà non altera la misura, ma anzi la
rende più robusta in quanto minimizza possibili variazioni di misura dovute alla indeterminazione
dell’istante di inizio e fine del segmento da analizzare. È chiaro pertanto che tale ottimizzazione
ha particolarmente senso per segnali di breve durata mentre è del tutto inefficace quando
applicata su segnali di lunga durata il cui valore di “integrated loudness” non dipende dalla
indeterminazione degli istanti di inizio e fine. Per tale motivo nella implementazione delle nostre
misure non è applicata alcuna sovrapposizione per il calcolo dei livelli ordinari, mentre una
sovrapposizione del 75% tra finestre di 400ms (che corrisponde quindi ad una sovrapposizione di
300ms o se vogliamo ad uno spostamento di 100ms tra finestre successive) è applicata quando si
eseguono le misure di loudness dei segmenti pubblicitari, tipicamente di breve durata, ovvero dai
5 ai 30 secondi. Ovviamente per le misure con finestre sovrapposte si è verificata la totale
pagina 6 di 45
compatibilità e concordanza delle misure di loudness operate con finestre senza sovrapposizione
in uso nella attuale delibera. Questo d’altro canto non solo è dimostrabile matematicamente,
essendo quella a finestre sovrapposte semplicemente una media maggiormente precisa in
risoluzione che tende a quella con finestre senza sovrapposizione nel caso di osservazioni estese
nel tempo, ma si verifica anche sperimentalmente, tenuto conto ovviamente delle possibili
imprecisioni dovute allo scarto dei campioni finali del segmento e della inevitabile imprecisione
della determinazione iniziale e finale del segmento in esame.
2.2
Le misure nelle future normative e per i futuri scenari
Nella riunione dei gruppi di lavoro ITU dell’ottobre 2010, considerata la pubblicazione delle
nuove raccomandazioni EBU sul loudness e la sollecitazione sia da parte di EBU, sia da parte di
diversi paesi, tra cui l’Italia, affinché l’ITU recepisca le normative europee, è iniziata una attività di
integrazione e adattamento delle diverse metodologie e approcci. Va premesso che la normativa
EBU non riguarda solo le misure di loudness ma copre a trecentosessanta gradi gli aspetti audio di
produzione, distribuzione ed emissione nel broadcast e che, oltre a un dialogo prettamente
tecnico, questo tra ITU ed EBU diviene anche un luogo di confronto politico tra diversi paesi ed in
particolare tra Stati Uniti ed Europa, che hanno a tutt’oggi alcuni punti di discordanza dovuti sia
alle prassi implementative sino ad oggi utilizzate nei due continenti, sia relative alle soluzioni
tecniche vere e proprie.
Di fronte alla evidente superiorità delle misure definite nella normativa europea, l’organismo
internazionale, ed in particolare i rappresentanti dei paesi americani, hanno comunque ritenuto
ragionevole adottare quanto proposto da EBU, ma hanno contestualmente richiesto alcune
modifiche, ancora in fase di valutazione, alla misura di loudness di nostro interesse. In questi
ultimi mesi si è svolto un intenso lavoro di mediazione, sia tecnica sia politica, che sembrerebbe
portare ad una misura di loudness condivisa analoga a quella precedentemente descritta ma che
prevede un gating relativo a -10LU (anziché -8LU, come attualmente in uso) ed un utilizzo della
metodologia delle finestre di analisi sovrapposte con una valore minimo di sovrapposizione pari
al 75%. Quest’ultimo parametro, come abbiamo detto, non altera di fatto le misure, e quindi non
deve ritenersi di alcuna importanza rispetto al suo impatto negli scenari di misurazione. Al
contrario, l’utilizzo di una soglia di gating diversa è sicuramente un fattore che può portare a,
seppur minime, variazioni delle misurazioni. Secondo le attività sperimentali effettuate in EBU un
valore di gating a -10 risulta ancora all’interno di quella zona di valori ottimali prediligendo
tuttavia una normalizzazione percettiva di segnali a media e ampia dinamica (mentre la soglia a -8
in qualche modo ottimizzava i segnali ad alta dinamica che sono quelli di maggior interesse). Allo
stato attuale non è possibile dire se questa sarà la soluzione definitiva. È certamente un buon
punto di partenza per la prosecuzione dei lavori che, in assenza di impedimenti, potrebbe portare
nella primavera del 2011 una nuova raccomandazione ITU che integri i dettami dell’attuale
raccomandazioni EBU. D’altro canto EBU ha già anticipato che se ITU adotterà queste variazioni,
allora anche EBU aggiornerà le proprie raccomandazioni in modo da avere un’unica e condivisa
metodologia per la misura di loudness.
Anche per quanto riguarda le future strumentazioni disponibili sul mercato l’unificazione in
un’unica normativa deve ritenersi un vantaggio non indifferente. Infatti anche se ormai il mercato
dei produttori ha ampiamente adottato la normativa europea, riconoscendone l’indubbia
superiorità, anche l’avvento di una nuova, ma in questo caso unica ed universale, normativa di
misura come quella ipotizzata, non comporta rilevanti difficoltà implementative rispetto alle
attuali, ed è quindi certo che il mercato possa reagire velocemente con l’introduzione copiosa di
strumenti di misura i quali, tuttavia, non dovrebbero essere altro che modeste revisioni rispetto a
quelli oggi marcati con il logo “EBU R128” e che implementano le misure descritte nella rispettiva
raccomandazione.
pagina 7 di 45
Se questo è lo scenario evolutivo certo per quanto riguarda le misure sui segnali di nostro
interesse, ovvero quelli stereofonici, il discorso diventa molto più complicato quando ci
spostiamo su sistemi multicanali, ed in particolare sia su quello già in oggetto alle attuali norme
ed in utilizzo ai principali formati HD (5.1), piuttosto che su formati ormai consolidati
tecnologicamente ed in forte diffusione ma che non sono oggi ancora coperti da alcuna
normativa. Come esempio ricordiamo il formato 7.1 già in uso in molti Blu-Ray e in alcuni formati
di broadcast come il nuovo “Dolby Digital Plus”, estensione del più comune “Dolby Digital”, oggi
adottato dalla maggioranza dei broadcaster. Per il formato “Plus”, ad esempio, si prevede un
massiccio utilizzo per le IPTV ad alta definizione e per i servizi tv di prossima generazione. Per
quanto riguarda il primo caso, è opinione di molti che l’attuale normativa primigenia, ovvero la
ITU BS.1770, risulti essere carente di un modello tecnico adeguato per tale formato. Anche il set
up sperimentale utilizzato per valutare i filtri ed i pesi utilizzati nella normativa attuale risulta
fortemente inadeguato per un corretto utilizzo nei segnali multicanale, in quanto non sono stati
utilizzati segnali ad alta dinamica e con effetti contributivi alle basse frequenze. In particolare i
problemi più rilevanti derivano dall’aver totalmente ignorato il canale aggiuntivo LFE (lowfrequency effect) per le basse frequenze nella misura di loudness e conseguentemente da aver
utilizzato un taglio in frequenza del segnale che non tiene sufficientemente conto delle
fenomenologia dei segnali multicanale.
3
MISURE DIAGNOSTICHE E PER L’ANALISI DELLA QUALITA’
Una volta scelte le misure da eseguire, è necessario definire delle procedure di analisi dei dati al
fine di poter estrarre e rappresentare le informazioni contenute in queste misure. È questa la
parte più difficile delle attività, specialmente quando si muovono ancora i primi passi in discipline
tecniche e/o scientifiche come quelle di nostro interesse. Solo a titolo di esempio vogliamo
ricordare che per quanto riguarda altre problematiche di qualità audio più “consolidate” rispetto
a quelle del loudness, e dove è disponibile una più ampia mole di risultati e di ricerca, esistono
metodologie e analisi di uso comune, se non addirittura delle normative, che ne definiscono l’uso
ed il significato. È il caso, ad esempio, della valutazione dei terminali voip che nella
raccomandazione ITU-T P.505 “One-view visualization of speech quality measurement results”
definisce quali insieme di misure (o meglio sarebbe dire di test) effettuare e come rappresentare
graficamente, in un unico riassuntivo schema i parametri di qualità del sistema. L’arte di sapere
rappresentare in modo semplice ed efficace il significato derivante da un insieme di dati
sperimentali non è una questione banale. Necessità da un lato di un ampio bagaglio culturale
relativo alle discipline di base come matematica, statistica, ecc., e dall’altro di un’approfondita e
specifica esperienza e conoscenza del problema che si vuole studiare. Inoltre, e non meno
importante, è necessario disporre di più insiemi di dati dove validare le proprie ipotesi di lavoro. È
noto che nelle diverse discipline, dalla medicina all’economia, dalla sociologia alla psicologia, e
così via, esistono delle formalizzazioni standard che hanno assunto importanza o comunque un
utilizzo comune tra gli operatori del settore. Se prendiamo ad esempio una rivista specialistica in
questioni finanziarie è probabile che non saremmo in grado di capire quali siano i potenziali rischi
del nostro patrimonio alla luce di grafici professionalmente corretti ma di difficile interpretazione
se non agli addetti ai lavori. Sicché pur avendo sottomano tutte le necessarie informazioni non
saremmo in grado, per mancanza di capacità nell’analisi dei dati, di arrivare a delle conclusioni di
nostro interesse. Lo stesso discorso si potrebbe fare per questioni mediche e così via. Allo stato
attuale purtroppo questa disciplina, o se volete questa arte di comunicare il significato di una
serie di dati, non trova una universale applicazione e rimane quindi un linguaggio settoriale
interno alle singole aree di competenza. Certamente grandi sforzi sono stati operati, e tecniche di
OLAP (On-Line Analytical Processing), piuttosto che approcci di tipo drill-down o drill-up sono
oramai strumenti comuni di analisi quando si ha a che fare con un insieme di dati complesso. Più
in generale il “data mining” si pone il problema di risolvere in modo astratto questi problemi e
pagina 8 di 45
definisce una serie di approcci standard per le varie tipologie di dati, per lo più al fine di estrarre
delle informazioni non evidenti da un insieme di risultati.
Anche nell’apparente semplice caso di misure di loudness è possibile, ed è anzi doveroso, se si
vuole capire la realtà delle cose senza fermarsi a banali risultanze dovute a semplici e spesso
inadeguate interpretazioni dei numeri, operare delle specifiche analisi dei risultati. Anche per
quanto riguarda la qualità dei segnali audio, e più segnatamente del solo parametro di loudness,
non esiste ancora alcun tipo di rappresentazione convenzionale. È ipotizzabile comunque che con
la diffusione delle normative EBU che prevedono l’esecuzione di tutta una serie di misure (non
solo quindi di “integrated loudness” come nel caso di nostro interesse di controllo del livello delle
pubblicità), si possa in futuro determinare uno schema standard per la rappresentazione della
qualità dell’audio nel broadcasting almeno relativamente al livello di potenza percepito del
segnale, che ovviamente costituisce solo una piccola parte delle grandezze che possono influire
sulla qualità generale.
Di seguito introdurremo alcune analisi che risultano, anche sulla base delle precedenti esperienze
maturate sul problema del loudness, di un qualche interesse per una maggiore comprensione dei
dati di loudness ed in particolare dei soli dati utilizzati nella metodologia definita nella delibera
219/09/CSP. Come vedremo anche da questi semplici ed essenziali dati è possibile realizzare delle
rappresentazioni che possono aumentare la nostra conoscenza delle informazioni contenute nei
dati a nostra disposizione. Per quanto sopra detto, ad ogni rappresentazione dovremo associare
una dettagliata descrizione di come questa è costruita, ed eventualmente supportare con degli
esempi il loro significato. Analogamente saranno descritte le tecniche di lettura, ovvero le
principali informazioni derivabili dalla proposta rappresentazione.
È bene sottolineare che questo non è, e non vuole essere, uno studio sulle possibili
rappresentazioni e su quali siano le più adatte o le più “comunicative”. Molto più semplicemente
si vogliono riportare alcune delle analisi utilizzate nella nostra specifica esperienza di lavoro sul
problema dei livelli di potenza sonora della pubblicità rispetto a quella dei programmi ordinari.
Tutto ciò a mero titolo di esempio e per mostrare al lettore come si possa facilmente avere una
visione, a nostro avviso certamente più interessante delle aride misure. In altre parole come si
possa correttamente estrarre conoscenza a partire da un insieme di dati sperimentali, e come da
questa conoscenza si possano dedurre risultati e fatti altrimenti difficilmente riconoscibili.
Ovviamente questo tipo di analisi hanno principalmente due scopi fondamentali: uno è quello di
indagine diagnostica; l’altro è quello di rappresentare semplicemente informazioni utili al
management e/o ai gestori ai livelli apicali e decisionali.
3.1
Analisi del “livello ordinario” dei programmi
Il livello ordinario dei programmi è una variabile giornaliera (cioè il cui valore può variare ad
intervalli giornalieri) e corrisponde al valore di “integrated loudness” dei cinque giorni precedenti
al’indice giornaliero della variabile.
La prima immediata considerazione da fare è quindi che per studiare questa grandezza è
necessario disporre di grandi quantità di segnale audio.
Figura 1 – Esempio di schema temporale per il calcolo della variabile giornaliera di “Livello Ordinario”
Come si evince dallo schema di figura uno, per ottenere un singolo valore di livello ordinario è
infatti necessario avere cinque giorni completi di segnale audio, ovvero centoventi ore di segnale
pagina 9 di 45
audio. Poiché qualsiasi analisi richiede un numero statisticamente significativo di misure, è chiaro
come il compito di studiare la variabile di “livello ordinario” sia possibile solo avendo a
disposizione grandi moli di segnale audio.
Consideriamo ora quali sono le indagini che ci interessa eseguire su questa variabile e come
possiamo analizzare i nostri dati a tal fine. Il livello ordinario dei programmi dovrebbe essere un
indicatore del livello “medio” di trasmissione. Tale assunzione però è basata su un prerequisito
fondamentale, ovvero che tutte le trasmissioni di una determinata emittente siano
approssimativamente allineate come livello sonoro e che tale livello sia mantenuto nel tempo.
Idealmente quindi il livello ordinario di una emittente dovrebbe essere costante ed ammettere
solamente delle minime variazioni. La raccomandazione EBU R128 richiede che il livello di ciascun
programma sia allineato, entro l’errore massimo di 1LU ammesso solo per i programmi live o
dove non è possibile controllare i livelli, ad un valore target di -23LUFS. La raccomandazione
riporta testualmente:
“the Programme Loudness Level shall be normalised to a Target Level of -23 LUFS. The permitted
deviation from the Target Level shall generally not exceed ±1 LU for programmes where an exact
normalisation to Target Level is not achievable practically (for example, live programmes)”.
Considerando che un eventuale errore di allineamento dei programmi ha una distribuzione
normale intorno al valore di target (cioè assumerà a volte valori leggermente maggiori, e a volte
valori leggermente minori) è ipotizzabile che se una emittente rispettasse i dettami della R128, il
suo “livello ordinario” sia identicamente uguale a -23LU con una variabilità dell’ordine di uno o
due punti decimali. In questo caso inoltre si avrebbe l’ulteriore vantaggio di avere un unico livello
ordinario per tutte le emittenti, e quindi per tutti gli ascoltatori.
Nel nostro caso tuttavia non è richiesto che il livello ordinario sia pari ad un certo valore di target,
e pertanto le nostre analisi dovranno mirare a stimare la variabilità di questa grandezza, ovvero
quanto la variabile di livello ordinario sia veramente rappresentativa considerando appunto che il
livello ordinario dovrebbe essere costante nel tempo.
Qualora avessimo a disposizione un cospicuo numero di misure potremmo certamente calcolare
la distribuzione di probabilità, ovvero stimare la funzione di densità di probabilità e da questa
dedurre alcune caratteristiche della variabile di nostro interesse. Se invece sfortunatamente
abbiamo a disposizione un numero limitato (inferiore al centinaio) di dati è ragionevole eseguire
una semplice statistica descrittiva.
Consideriamo quest’ultimo caso. Ricordando il fatto che siamo interessati a verificare la stabilità
del livello ordinario, possiamo in prima istanza pensare di utilizzare la varianza (o la deviazione
standard) dei nostri dati. Questa ci indica “statisticamente” quanto è probabile avere una misura
che si discosta di una certa quantità dal valor medio della grandezza.
-22,0
-22,0
-22,2
-22,2
-22,4
-22,4
-22,6
-22,6
-22,8
MAX
-22,8
MAX
-23,0
LO
-23,0
LO
-23,2
MIN
-23,2
MIN
-23,4
-23,4
-23,6
-23,6
-23,8
-23,8
-24,0
-24,0
Figura 2a – Esempio di dati entro la “maschera” di
tolleranza
Figura 2b – Esempio di dati fuori la “maschera” di
tolleranza
Poiché tuttavia non è noto il tipo di distribuzione dei nostri dati e comunque non siamo
interessati, in questo caso, a valutazioni statistiche ma vogliamo più semplicemente verificare che
tutti i livelli ordinari siano compatibili con un valore costante, possiamo più semplicemente
calcolare i limiti di massimo e di minimo dei livelli ordinari e verificare che questi rientrino in una
prefissata “maschera” di esistenza. In questo modo se tutti i valori rientrano entro tale maschera
pagina 10 di 45
potremo dire che, limitatamente ai soli dati osservati, la variabile di livello ordinario si comporta
nella maniera auspicata, altrimenti è ragionevole affermare il contrario.Nelle figure 2a e 2b sono
riportati due esempi in cui si è supposto di avere una finestra di tolleranza di ampiezza pari a
0,5LU ed un valore target di -23,0LUFS. Nel primo caso il livello ordinario (LO) rientra nella
maschera di tolleranza è può quindi considerarsi costante, nel secondo caso invece tale assunto è
violato.
Volendo infine compattare ulteriormente la nostra rappresentazione grafica, possiamo
riassumere, per ogni serie di dati, le informazioni di nostro interesse con una barra che riporta il
valore medio (ma potremmo anche riportare il valore target, o la mediana o altro) con un
simbolo ed i valori di massimo e minimo come gli estremi di un segmento verticale. Queste
tecniche di “compattazione” dei risultati vengono comunemente dette operazioni di “drill-up”.
-22,00
-22,25
-22,50
-22,75
-23,00
-23,25
-23,50
-23,75
-24,00
Figura 3 – Una più concisa rappresentazione dei dati relativi alle figure 2a e 2b
Nella figura 3 sono riassunti i dati delle precedenti figure 2a e 2b. Da questa figura, in maniera
ancora più semplice e intuitiva, risulta chiaro come i dati della prima serie siano conformi a
quanto auspicato, mentre quelli della seconda serie vanno oltre i limiti imposti affinché il livello
ordinario possa considerarsi effettivamente costante nell’intervallo di tempo osservato. Vedremo
nel seguito l’utilizzo di tale rappresentazione per reali serie di dati.
3.2
Analisi del “livello di potenza sonoro delle pubblicità”
La seconda misura di nostro interesse è quella del livello di potenza sonoro delle pubblicità, o più
correttamente di tutti quei segmenti audio che contribuiscono al conteggio dell’affollamento
pubblicitario. La misura è sempre quella di “integrated loudness”, ma in questo caso, lo
ricordiamo, il calcolo è eseguito su finestre temporali di 400ms sovrapposte del 75%. La
numerosità di misure che tratteremo, ad esempio su un arco di tempo settimanale, può variare
da qualche centinaia fino a diverse migliaia. In ogni caso siamo di fronte a numeri che
permettono un’analisi statistica più sofisticata della precedente e, certamente, il calcolo della
distribuzione di probabilità delle misure.
Se una semplice statistica descrittiva riassume in pochi numeri le caratteristiche principali di un
insieme di dati, dalla distribuzione di probabilità riusciamo invece ad avere una conoscenza più
dettagliata e comunque più intuitiva grazie anche all’approccio grafico.
Nella tabella seguente, figura 4, è riportato un tipico esempio di statistica descrittiva operata su i
reali valori di loudness delle pubblicità per un’emittente.
Sono evidenziati per comodità quelle grandezze di maggior interesse ai nostri fini come media,
intervallo, deviazione standard, ecc.
Sui medesimi dati abbiamo calcolato la distribuzione di probabilità e la relativa curva cumulativa,
che non è altro che la probabilità che un valore appartenga all’intervallo composto dal valore
minimo a quello indicato sull’asse orizzontale.
Ovviamente questa curva sarà sempre identicamente uguale a zero per il valore minimo della
variabile, mentre sarà pari al 100% per il valore massimo.
pagina 11 di 45
Un esempio di Statistica Descrittiva
Media
-23,8105
Errore standard
0,0116
Mediana
-23,9323
Moda
-24,0172
Deviazione standard
0,4664
Varianza campionaria
0,2176
Curtosi
0,6312
Asimmetria
0,6912
Intervallo
3,4029
Minimo
-25,3068
Massimo
-21,9038
Conteggio
1610
Figura 4 – Un esempio di “Statistica Descrittiva” applicata ad una serie reali di misure di loudness
Di particolare interesse sono i punti in cui la cumulativa assume i valori di 25%, 50%, 75% (o altri
come 90%, ecc.). Nel grafico di figura 5 ad esempio il valore della cumulativa è uguale al 50% per
un valore intorno a -24; questo significa che nella nostra serie di dati il 50% dei valori sono
superiori a -24 e il 50% sono inferiori. Analogamente, se, ad esempio, vogliamo sapere per quale
valore della nostra grandezza abbiamo una percentuale del 90% della popolazione che ha valore
uguale o minimo a tale valore, allora sempre dal medesimo grafico vediamo che al valore di 90%
corrisponde il valore di -23 circa. Quindi possiamo dire che il 90% dei dati della nostra
popolazione ha un valore di loudness uguale o minore a -23.
0,30
125,00%
0,25
100,00%
Frequenza
Frequenza (%)
0,20
% cumulativa
75,00%
0,15
50,00%
0,10
25,00%
0,05
Altro
-20,60
-21,20
-21,80
-22,40
-23,00
-23,60
-24,20
-24,80
-25,40
0,00%
-26,00
0,00
Figura 5 – Un esempio di “Distribuzione di Probabilità” applicata ad una
serie reale di misure di loudness
Questi valori sono comunemente detti “percentili”, e quindi si avrà il “percentile al 90%” e così
via. Ma nel caso particolare dei valori a passo 25%, che dividono lo spazio da 0 a 100 in quattro
parti (25, 50, 75, 100) questi vengono anche detti “quartili”, e avremo quindi il primo, secondo,
terzo e infine quarto “quartile”.
Con un minimo di esperienza un operatore esperto può analizzare un grafico di distribuzione di
probabilità e realizzare subito se i dati in analisi hanno particolari anomalie, se sono “corretti”
rispetto alle aspettative o ancora se sono da considerarsi problematici. Con una sapiente
osservazione della distribuzione, è anche possibile fare una veloce stima dei principali parametri
della statistica descrittiva e quindi avere una sommaria visione delle proprietà dei dati in analisi.
Un protocollo di analisi più formale vorrebbe che in prima istanza si controllino i risultati di una
statistica descrittiva e solo qualora i valori della statistica descrittiva non siano compatibili con
quelli aspettati, ovvero con un intervallo di valori che definiscono una maschera di tolleranza, si
passi ad analisi diagnostiche di livello superiore come la distribuzione di probabilità. Tuttavia a
pagina 12 di 45
volte possono verificarsi casi particolarmente ingannevoli in cui i parametri descrittivi sono
corretti ma la distribuzione mostra evidenti anomalie nella serie di dati in osservazione.
Un’analisi dei livelli di potenza delle pubblicità è utile al fine di studiare la qualità del segnale
audio di un’emittente, ma non è esattamente la grandezza che permette di studiare la
conformità dei livelli pubblicitari rispetto alla delibera 219/09/CSP. Il solo livello sonoro della
pubblicità, infatti, non ci da alcuna informazione sugli elementi alla base della determinazione
dell’infrazione, in quanto è necessario rapportare tali valori a quelli del livello ordinario. Solo se il
livello ordinario fosse una costante, allora l’analisi diretta dei livelli di loudness delle pubblicità
potrebbe essere utilizzata ai fini del controllo di verifica del divieto di infrazione. È pertanto
necessario introdurre una variabile che sia indicativa della potenza sonora della pubblicità, ma
indipendente dal valore di livello ordinario dei programmi.
Una variabile “neutrale”: i valori 
Per poter operare analisi su una variabile che sia direttamente alla base delle procedure per la
determinazione di eventuali infrazioni dobbiamo eliminare la dipendenza dal livello ordinario dei
programmi. Introduciamo quindi una variabile che è la differenza tra il livello ordinario e la
potenza sonora della pubblicità. Chiameremo questa grandezza , e detto Lp il livello di loudness
di un evento pubblicitario e LO il livello ordinario corrispondente al giorno in cui l’evento
pubblicitario è stato trasmesso allora avremo semplicemente che  = Lp - LO.
Un esempio di Statistica Descrittiva
Media
-0,8105
Errore standard
0,0116
Mediana
-0,9323
Moda
-1,0172
Deviazione standard
0,4664
Varianza campionaria
0,2176
Curtosi
0,6312
Asimmetria
0,6912
Intervallo
3,4029
Minimo
-2,3068
Massimo
1,0962
Conteggio
1610
Figura 6 – Un esempio di “Statistica Descrittiva” applicata ad una serie di valori “”
0,30
125,00%
0,25
100,00%
Frequenza
0,20
Frequenza (%)
% cumulativa
75,00%
0,15
50,00%
0,10
25,00%
0,05
Altro
2,60
2,00
1,40
0,80
0,20
-0,40
-1,00
-1,60
0,00%
-2,20
0,00
-2,80
3.3
Figura 7 – Un esempio di “Distribuzione di Probabilità” applicata ad una serie di valori “”
pagina 13 di 45
Questa non è altro che la distanza del valore di loudness dell’evento pubblicitario rispetto al
livello ordinario. Se  è positivo allora il livello di loudness della pubblicità sarà maggiore del
livello ordinario, se negativo la pubblicità ha un livello di loudness più basso del livello ordinario.
Consideriamo quindi, a mero titolo di esempio, i dati di livello pubblicitario di figura 4 e 5, e
supponiamo di avere un livello ordinario di -23,0LUFS per tutte le misurazioni: allora su questa
nuova serie di  dati, avremo la seguente statistica descrittiva e distribuzione di probabilità.
È quindi chiaro, dalla statistica descrittiva e a maggior ragione dalla distribuzione di probabilità,
come per i dati in questione i livelli della pubblicità siano mediamente inferiori al livello dei
programmi di quasi 1LU (0,8 per la precisione) e come il 90% delle pubblicità abbia un valore il cui
delta è negativo (valore della curva cumulativa corrispondente al valore zero sull’asse orizzontale)
e come oltre il 99% delle pubblicità abbia un valore di delta minore di uno (valore della curva
cumulativa corrispondente al valore uno sull’asse orizzontale).
Uno schema, non esaustivo, di come possono essere interpretati i valori dei  negli studi di nostro
interesse, è sommariamente riportato, senza ulteriori spiegazioni, in allegato.
4
MISURAZIONI SPERIMENTALI
In questa sezione vedremo come le tecniche sopra esposte possono essere applicate a serie di
dati reali, ed, in particolare, alle misurazioni effettuate attraverso il prototipo di monitoraggio del
loudness. Per quanto riguarda queste analisi diagnostiche sono state analizzate tutte le 20
emittenti incluse nella campagna di misure sperimentali. Ciascuna emittente sarà analizzata in un
paragrafo diverso, e in conclusione si faranno delle considerazioni generali sui risultati della
campagna di misure sperimentali.
4.1
E01: misurazioni sperimentali
La media dei  è pari a -2,0LU, e il picco della distribuzione è di -2,8LU. Tuttavia, sempre dalla
distribuzione, notiamo come per valori di  anche molto grandi (>2,2LU) non si sia raggiunto il
100% della cumulativa, il che significa che vi è una significativa percentuale di pubblicità con
potenza sonora molto maggiore del livello ordinario. Anche l’intervallo tra minimo e massimo dei
livelli è molto grande (20LU). Questo è evidente anche dalla distribuzione che non è
“concentrata” in un intervallo ben definito, ma copre tutto l’asse delle ascisse.
Figura 8 – E01: Statistica descrittiva e distribuzione di probabilità”
4.2
E02: misurazioni sperimentali
E02 ha una soglia di guardia piuttosto grande con una media di -1,3LU e un picco della
distribuzione a -1,8LU. Si evidenziano chiaramente valori di pubblicità con  piuttosto grandi, con
pagina 14 di 45
una chiara presenza di pubblicità a +4LU ed oltre rispetto al livello ordinario. L’intervallo tra
massimo è minimo ha un valore di 10LU.
Figura 9 – E02: Statistica descrittiva e distribuzione di probabilità”
4.3
E03: misurazioni sperimentali
Per E03 il livello medio dei delta è intorno a -1.4LU, quindi piuttosto basso o meglio indice del
fatto che mediamente il livello della pubblicità è inferiore rispetto al livello ordianario. Tuttavia
l'intervallo dei delta risulta molto ampio, e si può chiaramente vedere un residuo di componenti
poco sopra i 3.0LU.
Figura 10 – E03: Statistica descrittiva e distribuzione di probabilità”
4.4
E04: misurazioni sperimentali
Figura 11 – E04: Statistica descrittiva e distribuzione di probabilità”
pagina 15 di 45
Nel caso di E04 la pubblicità è superiore al livello ordinario con una media di 1,6LU, che è già un
valore molto alto e dalla distribuzione si vede come questa media sia in realtà il contributo di due
insiemi di valori identificabili intorno ai due picchi della curva, che sono rispettivamente a circa
1,5LU il primo e a 3,0LU il secondo. Quest’ultimo in particolare evidenzia una significativa
quantità di pubblicità con  molto elevati.
4.5
E05: misurazioni sperimentali
Figura 12 – E05: Statistica descrittiva e distribuzione di probabilità”
E05 presenta una media a circa -1LU. La distribuzione non presenta numerosi picchi , sembrando
composta da una sovrapposizione di due distribuzioni gaussiane una centrata a -1LU ed una
seconda minore centrata a circa 0,2LU. Il massimo piuttosto limitato è evidente dal precoce
raggiungimento del valore del 100% della curva cumulativa che invece scende gradatamente per i
valori minori dei delta.
4.6
E06: misurazioni sperimentali
La media e la distribuzione indicano come, nel caso di E06, la pubblicità sia perfettamente
allineata con il livelli ordinari entro un decimo di LU. Inoltre la cumulativa mostra che il valore di
100% viene raggiunto per valori di  intorno a 1,5LU.
Figura 13 – E06: Statistica descrittiva e distribuzione di probabilità”
4.7
E07: misurazioni sperimentali
Per E07 valgono le medesime considerazioni fatte per E06.
pagina 16 di 45
Figura 14 – E07: Statistica descrittiva e distribuzione di probabilità”
4.8
E08: misurazioni sperimentali
I valori per E08 sono altamente simmetrici e presentano una curva ben piazzata al centro (delta
medio=-0,14LU). Il valore massimo di delta è però leggermente alto anche se la coda destra della
distribuzione non sembra mostrare percentuali significative di valori di delta oltre il valore di 1LU.
La curva è infatti ben concentrata nell'intervallo di ± 2LU intorno allo zero.
Figura 15 – E08: Statistica descrittiva e distribuzione di probabilità”
4.9
E09: misurazioni sperimentali
Figura E09 – Statistica descrittiva e distribuzione di probabilità”
La statistica descrittiva mette in evidenza una media piuttosto alta ed una deviazione standard
affatto trascurabile, sebbene l'intervallo tra massimo e minimo non sia così ampio da coprire
l'intera scala grafica rimane comunque significativo intorno ai 6LU.
pagina 17 di 45
4.10
E10: misurazioni sperimentali
Figura 17 – E10: Statistica descrittiva e distribuzione di probabilità”
Nel caso di E10 si rileva un livello medio dei valori delta prossimo all'unità, cui si associa una
deviazione standard piuttosto ampia. Inoltre la curva dell'istogramma risulta praticamente
azzerata per valori inferiori a -2LU mentre specularmente non risulta affatto nulla per valori
superiori a +2LU, né per valori superiori a circa +3LU (considerando una media dei delta prossima
all'unità come precedentemente notato). La variazione dei valori di delta copre un intervallo di
oltre 10LU con una distribuzione tutt'altro che piccata intorno alla media.
4.11
E11: misurazioni sperimentali
Figura 18 – E11: Statistica descrittiva e distribuzione di probabilità”
Nel caso della emittente E11 notiamo che nonostante una centratura della curva prossima allo
zero, in realtà leggermente negativa, la distribuzione ha una larga coda sulla destra, ovvero per i
valori di delta positivi, che si spinge su valori anche di 3LU. Nonostante l'intervallo sia contenuto e
la curva ben centrata, lo sbilanciamento sulla parte destra, evidente anche dal secondo
agglomerato nella distribuzione intorno ai 2LU, è indice di una compromissione della potenziale
qualità globale.
4.12
E12: misurazioni sperimentali
La curva di E12 è ben centrata ma ha un intervallo molto ampio anche se percentualmente il
tutto raggiunge la prossimità dello zero in un intervallo di circa 6LU. La distribuzione non è affatto
concentrata, anzi si mostra molto piatta e con un ragguardevole valore percentuale per valori
superiori al 1LU.
pagina 18 di 45
Figura 19 – E12: Statistica descrittiva e distribuzione di probabilità”
4.13
E13: misurazioni sperimentali
Figura 20 – E13: Statistica descrittiva e distribuzione di probabilità”
Il livello medio dei delta raggiunge quasi i 3LU, con un intervallo di variabilità tutto spostato sulla
parte dei delta positivi (si noti come l'istogramma sia nettamente nullo per tutti i valori negativi).
I valori dei delta assumono significativamente valori superiori ai 3,4,5 ed anche 6LU.
4.14
E14: misurazioni sperimentali
Figura 21 – E14: Statistica descrittiva e distribuzione di probabilità”
Per E14 la evidenza principale è che la curva di distribuzione non si presenta né come una singola
campana, né come una doppia campana. In questo caso invece sono ben evidenti almeno sei
diverse campane a partire dalla minore centrata a -3,5LU sino alla maggiore centrata a +2,3LU.
Non vi è un centro unico o maggioritario della distribuzione ma sembra piuttosto una
pagina 19 di 45
sovrapposizione di diverse curve più o meno equivalenti. Questo risulta anche dalla tipica forma a
"scaletta" della curva cumulativa.
4.15
E15: misurazioni sperimentali
Figura 22 – E15: Statistica descrittiva e distribuzione di probabilità”
Nel caso di E15, la pubblicità è mantenuta ad un livello leggermente più basso, poco meno di
1,0LU, rispetto ai programmi ordinari e, sebbene la distribuzione mostri un range di valori e una
certa asimmetria, si nota come tutte le pubblicità siano contenute in un intervallo compreso tra 2,0LU e +1,0LU..
4.16
E16: misurazioni sperimentali
E16 presenta un livello di guardia intorno a -1,6LU. La curva è inoltre piuttosto simmetrica e la
limitazione verso l'alto è ben contenuta, mentre verso il basso è piuttosto ampia ma come è noto
questo non comporta problemi. Si rileva altresì la presenza di un secondo picco minore intorno ai
0LU.
Figura 23 – E16: Statistica descrittiva e distribuzione di probabilità”
4.17
E17: misurazioni sperimentali
Nel caso di E17,a fronte di una distribuzione mediamente buona, la globalità dei risultati è
fortemente affettata dallo sbilanciamento della distribuzione sui valori positivi di delta. In
particolare la media si posiziona ad un valore superiore all'unità; inoltre si rileva una distribuzione
non particolarmente concentrata.
pagina 20 di 45
Figura 24 – E17: Statistica descrittiva e distribuzione di probabilità”
4.18
E18: misurazioni sperimentali
Figura 25 – E18: Statistica descrittiva e distribuzione di probabilità”
La particolarità delle misure risultanti per la emittente E18 è sicuramente la rapida velocità con
cui i valori dei delta vanno a zero nelle due code dell'istogramma. Al di fuori dell'intervallo, per
altro ragionevolmente limitato e inferiore ai 3LU, centrato intorno ad una media leggermente
positiva, i valori dell'istogramma cadono precipitosamente a zero. Non vi è pertanto evidenza di
delta maggiori a 2LU.
4.19
E19: misurazioni sperimentali
Figura 26 – E19: Statistica descrittiva e distribuzione di probabilità”
La media non ha livelli di guardia ma è prossima al livello ordinario e i valori di  sono abbastanza
contenuti, specialmente per quanto riguarda i valori positivi che hanno un massimo a 2,7LU.
pagina 21 di 45
4.20
E20: misurazioni sperimentali
Figura 27 – E20: Statistica descrittiva e distribuzione di probabilità”
La distribuzione dei delta per l'emittente è ben posizionato in vicinanza del valore nullo. La
variabilità tuttavia copre un intervallo molto ampio anche se in prevalenza si spinge più verso i
valori negativi che per quelli positivi che sono contenuti entro i 4LU. La curva dell'istogramma
sembra presentare un doppio picco: uno leggermente negativo ed uno in prossimità dei 0.8LU.
4.21
Considerazioni generali sui “livelli ordinari”
Abbiamo già visto nel paragrafo §3.1 come sia possibile rappresentare in maniera molto succinta
le informazioni relative all’andamento dei livelli ordinari di una emittente. Nella figura seguente si
riportano le misurazioni effettuate secondo lo schema introdotto. Le misure sono ordinate in
ordine crescente.
La prima cosa che risulta evidente è che il livello ordinario non è per nulla lo stesso per le diverse
emittenti, ma varia da un valore di circa -25LU di E10 a quello di -19LU E16 con un variabilità
quindi per i valori medi del livello ordinario di circa 6LU. Se consideriamo il valore target di
loudness, solo 13 su 20 emittenti rientrano con un valore di livello ordinario ±1LU (e ricordiamo
che EBU prevede invece il valore esatto per tutti i programmi e non per il livello ordinario, quindi
un allineamento ben più stringente).
La seconda evidenza, sempre per quanto riguarda i livelli ordinari, è che sembrano esserci due
tipologie di emittenti ben distinte: una prima tipologia (ad esempio E10, E18, E15, E12, ecc.)
aventi una variazione giornaliera molto piccola dell’ordine di 0,1LU del livello ordinario tale da
poterlo effettivamente considerare una “costante” (nel grafico di Figura28 corrispondono a tutte
quelle emittenti che non mostrano le code rosse del minimo e massimo del livello ordinario);
mentre una seconda tipologia (E02, E03, E04, E16, ecc.) che ha una variazione ben più
significativa, fino a quasi 0,5LU. Allo stato attuale e considerando la esigua numerosità dei valori
di livello ordinario disponibili per emittente, non è possibile stabilire se tali differenze siano
intrinsecamente naturali nella statistica dei segnali o se siano tali da poter caratterizzare
effettivamente la “stabilità” dei livelli ordinari delle emittenti secondo due specifiche condizioni
di qualità del segnale.
Dobbiamo infine ricordare che se le emittenti analizzate avessero adottato le indicazioni della
raccomandazione europea EBU R128, e se anche solamente le medie fossero state allineate tra
loro ad un valore target, la situazione, da un punto di vista generale di qualità, sarebbe stata
considerata soddisfacente (anche se ovviamente sarebbe preferibile che tutte le emittenti
avessero una variazione piccola del livello ordinario). In una visione globale, allo stato attuale, il
disallineamento tra i livelli ordinari tra emittente e emittente risulta essere un problema più serio
rispetto a quello della variabilità del livello ordinario all’interno della stessa emittente.
pagina 22 di 45
Figura 28 – Grafico dei livelli ordinari (media, min, max) delle emittenti analizzate
pagina 23 di 45
4.22
Considerazioni generali sui livelli di “loudness della pubblicità”
Nel paragrafo precedente abbiamo visto come sia possibile rappresentare in un unico grafico, ed
in modalità chiara e succinta, le informazioni derivanti dalle misurazioni di livello ordinario.
Consideriamo ora il caso delle pubblicità. In questo caso ovviamente dobbiamo compattare, pur
mantenendo una qualche significatività di rappresentazione, tutte quelle informazioni
dettagliatamente sopra descritte nei paragrafi in cui abbiamo analizzato la statistica descrittiva e
le distribuzioni di probabilità. È possibile costruire una rappresentazione dove per ciascun
insieme di pubblicità misurate si riportino simultaneamente alcune grandezze, e più
specificatamente: media, mediana, massimo e minimo, percentile al 90%. La media è il valore
rappresentativo della serie, mentre la mediana rappresenta il punto centrale della distribuzione
ovvero il valore per cui il 50% dei valori analizzati sono sopra la mediana e l’altra 50% sono sotto
la mediana. Se media e mediana sono distanti la distribuzione sarà asimmetrica e “sbilanciata”.
Da questo tipo di grafico (ad esempio per i dati analizzati si veda la figura 29) abbiamo subito una
chiara visione della diversa “variabilità” dei livelli pubblicitari da emittente e emittente.
Dalla estensione dei box di percentile, dalla media, dalla mediana e dagli estremi di minimo e
massimo possiamo subito avere una idea dei valori e della distribuzione delle pubblicità, e
possiamo anche vedere come vi sia un netto diverso comportamento tra le molte emittenti.
Infine va ricordato che per i nostri scopi ultimi, che trascendono da una rappresentazione
specificatamente legata alla qualità del loudness delle sole pubblicità, dobbiamo confrontare
questi livelli pubblicitari con quelli del livello ordinario (in tracciato rosso nel grafico). Ora la
distribuzione delle pubblicità potrà essere di buona o cattiva qualità, ma se questa si posiziona
nettamente sopra il livello ordinario sarà sempre segno di potenziali problemi, che non si
manifestano viceversa se è ampiamente al di sotto. Una certa omogeneità tra livelli ordinari e
livelli pubblicitari è sempre auspicabile in quanto segno di qualità.
In generale comunque tale rappresentazione ha un potere di analisi inferiore a quello sopra
riportato e dettagliatamente descritto per ciascuna emittente misurata. A suo favore bisogna
tuttavia sottolineare che con questa rappresentazione abbiamo una più facile comparazione tra
le diverse emittenti. La stessa rappresentazione potrebbe, probabilmente ed anche con maggior
successo interpretativo, essere utilizzata sui valori . Tralasciamo ora questa ulteriore
rappresentazione per amor di brevità, e in quanto del tutto simile a quella appena esposta.
pagina 24 di 45
Figura 29 – Grafico dei livelli pubblicitari (media, mediana, min-max, p90%) delle emittenti analizzate e loro livelli ordinari (traccia)
pagina 25 di 45
5
MISURE DIAGNOSTICHE E PER L’ANALISI DELLA QUALITA’
Quella che sino ad ora è stata semplicemente definita come pubblicità è in realtà un insieme di
diverse categorie di programmi. Nella generica classe di pubblicità abbiamo infatti gli “spot
tabellari” (quelli che comunemente indichiamo con pubblicità), le televendite, le telepromozioni,
le autopromozioni, le campagne sociali, i billboard di inizio e fine programma, ecc. Ognuna di
queste tipologie di programma ha genesi, caratteristiche e scopi diversi. Pertanto è possibile
ipotizzare che anche il loro loudness sia diverso se non si opera un controllo di qualità che mira
sempre al famoso obiettivo del livello target per tutti i programmi.
Qualora vi siano delle situazioni anomale evidenti dalla sommaria analisi operata con i mezzi
sopra esposti, ed in particolare con la statistica descrittiva e con la distribuzione di probabilità,
può essere di un qualche interesse operare una diagnostica più approfondita. Si potrebbe
erroneamente pensare che questo tipo di analisi è di esclusivo interesse dei fornitori del servizio
che vogliono individuare i loro problemi per successivamente operare delle correzioni, e che, al
contrario, il “controllore” sia solo interessato ad applicare le regole di controllo in maniera blind,
senza indagare oltre e senza quindi individuarne o comprenderne le motivazioni. In una visione
puramente ispettiva questo può anche essere attendibile, ma se il nostro fine è quello di
controllo della qualità, ovvero di tutela dei fruitori del servizio, il nostro lavoro non può escludere
tale ricerca diagnostica al fine di comprende meglio il problema e quindi valutarne il peso.
Abbiamo visto come dall’analisi statistica, prima ancora di eseguire un calcolo puramente
ispettivo, vi è, per i dati di alcune emittenti, la forte ipotesi che un cospicuo numero di pubblicità
sia fuori soglia, ovvero che si verifichi una situazione di scarsa qualità del segnale tale da
“infastidire” l’ascoltatore. Potrebbe essere interessante operare quella che viene detta una
operazione di “drill-down” e analizzare i nostri dati a un livello di dettaglio maggiore e quindi per
ogni tipologia di pubblicità. I risultati di tale analisi sono riportati nelle figure seguenti per il caso
di soglia 2,2LU relativa al periodo transitorio definito in delibera. Nella maggior parte dei casi il
problema non è rappresentato dagli spot, ma dalle telepromozioni.
Lo scenario di qualità è ora maggiormente chiaro se consideriamo la pubblicità tout court, ovvero
la tabellare, o la pubblicità come viene intesa per il conteggio dell’affollamento pubblicitario.
Infatti, risulta chiaro solo ora, e solamente grazie a questo “drill-down”, che il problema
principale per alcuni canali generalisti consiste unicamente nei livelli sonori dei promo.
Quella qui riportata è solo un esempio di analisi diagnostica: molte altre sono possibili ed in
generale dobbiamo tener presente che esistono due utilizzi tipici per le analisi diagnostiche. Una
prima legata ai protocolli di controllo di qualità: in questo caso, sulla base di ampie esperienze,
viene definito una metodologia tipo da applicare su un determinato prodotto o servizio al fine di
verificarne il suo rispetto di determinati requisiti. In tale ottica si possono avere anche diverse
classi di requisiti più o meno stringenti e quindi classi di qualità diversa. Siamo quindi in uno
scenario di controllo o di verifica di parametri e di indici di qualità ben noti e consolidati. Il
secondo caso invece si presenta quando siamo costretti a operare un’analisi diagnostica al fine di
dipanare un problema che non può essere risolto con le informazioni disponibili, o,
alternativamente, quando si è in fase di realizzazione di nuovi prodotti o servizi da utilizzare in
nuovi contesti. In quest’ultimo caso è necessario prima di tutto pianificare un modello di analisi e,
successivamente, scegliere gli strumenti più opportuni. È questo un lavoro che richiede un ampio
bagaglio conoscitivo e di esperienza. Diversamente dal primo caso, infatti, è necessario risolvere
un problema e non più semplicemente controllare il buon funzionamento dell’oggetto o servizio
di nostro interesse.
pagina 26 di 45
Come già sottolineato, per quanto riguarda la qualità audio nel broadcasting, o se vogliamo per
quanto riguarda la tutela degli “ascoltatori” nell’ampio scenario di fruizione audio (tv, radio, web,
media, ecc.), siamo solo agli albori in quanto il problema del loudness può considerarsi come il
primo passo di una lunga e certamente difficile strada.
pagina 27 di 45
Figura 30 – Numero e percentuali di pubblicità fuori soglia (>2,2LU) per le diverse tipologie di pubblicità di alcune emittenti (E01-E05)
pagina 28 di 45
6
Le "MISURE" per il controllo del livello sonoro delle pubblicità
La Delibera 219/09/CSP definisce non solo il tipo di misure da effettuare, ma anche come
utilizzare tali misure per determinare una infrazione al divieto.
Riportiamo, per maggior comodità, i punti 10,11 e12 dove è descritta questa parte.
10. Il livello del messaggio pubblicitario o della televendita sarà misurato (con gating)
su un intervallo di osservazione corrispondente a ciascuna unità indivisibile (eg: singolo
spot pubblicitario, singola trasmissione di televendita). Il numero di unità analizzate
(messaggio pubblicitario o televendita) che costituisce una misura sarà pari a 50 unità
consecutive e ricadenti nel medesimo giorno, a partire da una prima unità selezionata
dai rilevatori secondo principi di casualità; tale successione di unità non può essere
parte di una misura successiva.
11 Ai fini dell’osservanza della disposizione di cui all’articolo 1, comma 1, della delibera
n. 34/09/CSP, si intenderanno utili le rilevazioni da cui risulti, per almeno l’8% dei casi
osservati, una differenza fra il livello sonoro del singolo messaggio pubblicitario (o della
televendita) ed il livello ordinario del canale superiore a 1,0 LU, ambedue misurati con il
gating. Nel periodo transitorio di cui all’articolo 1, comma 2, della delibera n.
219/09/CSP la soglia di tolleranza è elevata a 2,2 L.U. mentre la percentuale dei casi
misurati utile ai fine dell’osservanza della disposizione di cui all’articolo 1, comma 1, è
pari al 15%.
12. L’infrazione al divieto di cui all’articolo 1, comma 1, della delibera n. 34/09/CSP da
parte dell’emittente o del fornitore di contenuti oggetto della verifica, si intende
integrata quando nelle misurazioni di cui al punto 11 si verifichi il superamento dei
valori ivi indicati.
Riportiamo ora, in termini più pratici, quanto sopra. Intanto incominciamo con il dire che la
medesima tecnica, ma con soglie di loudness e di percentuali diverse, è applicata in un “periodo
transitorio” ed a regime. Nel “periodo transitorio” si ha una soglia per i  di 2,2LU ed una
percentuale almeno del 15% dei casi osservati che superano tale soglia, mentre a regime la soglia
è di 1,0LU e la percentuale di almeno 8%.
Siamo qui interessati alla metodologia piuttosto che ai valori di soglie e percentuali, quindi dopo
questa premessa consideriamo semplicemente la “soglia” per differenza tra il livello ordinario e il
loudness dell’elemento, quello che fino ad ora abbiamo chiamato , e la percentuale degli
elementi sopra soglia che è condizione di infrazione al divieto.
La “misura” per identificare una condizione di infrazione al divieto è quindi così definita “una
misura sarà pari a 50 unità consecutive e ricadenti nel medesimo giorno, a partire da una prima
unità selezionata dai rilevatori secondo principi di casualità”.
Pertanto ogni qual volta troviamo che in una sequenza di 50 elementi pubblicitari contigui la
percentuale di quelli sopra soglia è uguale o maggiore a quella ammessa, allora siamo di fronte
alla evidenza di una infrazione al divieto definito nella Delibera 219/09/CSP. Il termine “ogni qual
volta” qui utilizzato deriva da quanto in Delibera che indica come il primo termine della sequenza
dei 50 elementi che costituiscono la misura sia preso “a partire da una prima unità selezionata
dai rilevatori secondo principi di casualità”. In altre parole la misurazione composta da 50
elementi contigui può iniziare in un punto qualsiasi della sequenza di tutte le pubblicità
trasmesse. Inoltre se e solo se la misura è indice di infrazione allora l’intero blocco dei 50
elementi non può essere utilizzato per altre misure infatti “tale successione di unità non può
essere parte di una misura successiva”.
pagina 29 di 45
6.1
Statistica delle "unità" e delle "misure"
Nella figura seguente è riportata, a mero di titolo di esempio, la prima delle venti tabelle che
costituiscono l'appendice A di questo deliverable, in particolare quella relativa a E01. Questo tipo
di tabella è generata automaticamente dal software di Loudness Monitor e riporta una serie di
valori e statistiche relativamente alle "unità" ed alle "misure" così come definite in Delibera.
Per una sua dettagliata descrizione rimandiamo al documento che descrive il software da noi
realizzato. Qui vogliamo solo evidenziare come le misure siano effettuate su base giornaliera
secondo la prima colonna della tabella, e come le successive sei colonne (da NUD a SV-DELTA)
facciano riferimento a misure e statistiche relative alle "unità", mentre le ultima quattro colonne
(da MinEN a PIPE) fanno riferimento alle potenziali "misure". In testa si trova, evidentemente una
anagrafica delle misure effettuate.
Figura 34 – Tabella riassuntiva delle statistiche di unità e delle misure generata dal software LM (Loudness Monitor)
Richiamando quanto descritto nei paragrafi da §4.1 a §4.20 particolarmente interessante per
sondare lo stato di salute della emittente sono il valore MV-DELTA che riporta il valore medio
nella giornata dei valori  e la associata deviazione standard riportata in SV-DELTA. Può essere di
nostro interesse sapere anche quante unità di sono nella giornata (NUD) piuttosto che sapere in
percentuale quante di queste sono sopra soglia (PC-NUDS). In generale attraverso le misure e le
statistiche delle "unità" possiamo farci una idea del predetto stato di salute della emittente.
Se invece volessimo avere delle indicazioni più specificatamente legate alla probabilità di
infrazione così come definita in delibera sicuramente il valore PIPE, che descrive la probabilità di
trovare una infrazione con una prima estrazione casuale nella giornata, ci da sicuramente una
idea orientativa sul potenziale problema.
Da una veloce analisi di tali tabelle si può immediatamente avere una prima impressione sui
risultati ottenuti e sulle loro potenziali ricadute. Consideriamo quindi tre casi tipici (si veda
l'allegato A), la cui selezione è del tutto casuale,. Come primo esempio consideriamo E05, si vede
chiaramente dalla tabella che in questo caso non potremmo mai avere problemi in quanto i valori
nella colonna PIPE sono identicamente nulli. Questo caso è in realtà vero per molte emittenti.
Consideriamo ora il caso opposto di E13 dove tutti i valori di PIPE sono prossimi al 100%.
Ovviamente in questo caso abbiamo certezza che ci sono problemi e anche a livello molto serio. Il
terzo e ultimo caso è quello intermedio come per E10 o E14 o comunque per tutte quelle
emittenti che riportano per alcuni giorni un valore di PIPE intorno al 50%. Allora rientriamo nel
caso di emittenti che potrebbero risultare problematiche per quanto riguarda la verifica di
infrazione, ma su cui non possiamo dire più di tanto perché il risultato finale potrà essere
fortemente modulato dalla scelta casuale della misura.
7
MISURE SOGGETTIVE
La definizione di "misure soggettive" potrebbe sembrare un ossimoro in quanto per definizione
una misura dovrebbe essere ripetibile. I risultati di una valutazione soggettiva al contrario sono
pagina 30 di 45
altamente variabili e dipendono da una serie molto ampia di fattori. Tuttavia per tutte le
discipline dove il termine ultimo è la reazione di un essere umano a fronte di un evento o di una
sollecitazione, è chiaro che il termine di riferimento non può che essere l'analisi degli stimoli
opportunamente raccolti e analizzati. L'arte di una appropriata e corretta misura soggettiva è
cosa difficile, costosa e richiede un ampio bagaglio culturale teorico e sperimentale nella pratica.
Non ci si può improvvisare esecutori di misure soggettive se non si ha un adeguato bagaglio
conoscitivo teorico e se è maturata una esperienza pratica e tecnica nell'argomento. Per questo
motivo è, purtroppo, facile imbattersi in lavori o presentazione di risultati derivati da misure
soggettive del tutto inattendibili o che comunque vengono liberamente interpretate o che
vengono analizzate con metodiche statistiche inadatte. Ogni qual volta misuriamo una reazione
di un essere umano ad uno stimolo potremo parlare di misure soggettive, ma a secondo di come
queste vengono eseguite, raccolte e analizzate potremo avere una serie di diversi strumenti dalle
potenzialità e dalla accuratezza ampiamente variabile.
Proprio per aiutare gli sperimentatori nella esecuzione di misure soggettive vi è, in letteratura,
un'ampissima messe di raccomandazioni e di specifiche tecniche sull'argomento. Queste sono la
base imprescindibile di un buon punto di partenza per una corretta misura. Un ulteriore
problema a riguardo, è il tipicamente altissimo costo di tali misure in quanto si richiede:
strumentazione e condizioni di lavoro di altissimo livello professionale; una notevole quantità di
lavoro da parte di personale esperto; il coinvolgimento di un cospicuo numero di persone per la
raccolta delle misure.
Limitatamente ai test soggettivi ad esempio ricordiamo che gli enti normativi tipo ITU, che
eseguono continuamente tali tipi di misurazioni, prevedono, al solo titolo di "rimborso spese",
una quota che va dai 15 ai 20 kEuro per test soggettivo, e questo non copre le spese fisse di
allestimento e di materiale ma solo quelle spese vive di esecuzione. Tipicamente allora gli
esecutori raccolgono pacchetti di diversi test soggettivi (almeno 3/4 per diverse volte all'anno) in
modo da trovare risorse economiche nei margini di guadagno per mantenere/allestire tutto
quanto necessario alla esecuzione dei test stessi. Abbiamo qui espressamente parlato di "test
soggettivi" e con questo termine intendiamo una valutazione soggettiva conforme agli standard
di valutazione, condotta rispettando tutte le necessarie verifiche tecniche, e nei modi e nelle
quantità ben definite dai pianificatori dei test. Tipicamente un "test soggettivo" coinvolge almeno
una classe di 24 soggetti e ciascuno di questi non può essere utilizzato per un tempo maggiore di
circa 60 minuti in totale considerando anche pause e quanto altro. Prima di andare oltre
cerchiamo di dare una nostra tassonomia al fine di meglio chiarire di cosa stiamo parlando
quando tiriamo in ballo misure soggettive.
A tal fine consideriamo/utilizziamo la seguente nomenclatura:


Test Soggettivo: è la esecuzione di un test secondo i canoni già standardizzati in
normative e ampiamente documentati in letteratura. I risultati di tali test, se derivati da
un corretto planning e disegno del test, sono da considerarsi come il riferimento assoluto
per qualsiasi valutazione e sono indiscutibili. La negazione dei risultati di un test
soggettivo correttamente eseguito, a qualsiasi titolo e per qualsiasi motivazione, è segno
di certa malafede ed è un atteggiamento altamente ascientifico;
Disegno del test: è la procedura per cui definito un problema viene selezionato, sulla
base della letteratura presente o a volte proponendo nuovi metodi (che però dovranno
essere validati) il test da eseguire e le sue modalità. Nell'ambito dei test soggettivi audio
esistono ad esempio tre macrocategorie di test, ACR (Absolute Category Rating), DCR
(Degradation Category Rating), e CCR (Comparison Category Rating). Ognuno di questi
poi puoi essere di tipo passivo (Listening Only) o interattivo e così via fino a sviluppare
una pletora di diversi casi che vanno opportunamente utilizzati a seconda del fine
valutativo;
pagina 31 di 45

Pianificazione del test: è la procedura di pianificazione globale del test che tipicamente
può consistere in diversi test soggettivi dello stesso tipo o di tipo diverso, ripetuti nel
tempo o per diverse tipologie di segnali o di lingue (nel caso di segnale parlato). In questa
fase viene anche considerata la parte di valutazione finale e statistica dei risultati che è
ovviamente derivata dalla pianificazione del test stesso, in altre parole già dalla fase di
pianificazione dobbiamo sapere che tipo di analisi effettuare e che tipo di possibili
risultati possiamo ottenere.
Per il primo punto è necessaria una grande esperienza e una notevole conoscenza tecnica; per il
secondo è necessaria una profonda conoscenza teorica del problema e una notevole esperienza
specifica del problema e della situazione che si vuole studiare; per il terzo e più difficile punto è
necessaria sicuramente una altissima preparazione culturale e una notevole conoscenza ad
ampio spettro di tutte le problematiche attinenti. Per quanto riguarda i costi succitati si faceva
riferimento al solo test soggettivo. È chiaro che una generica attività di misurazione che prevede
immancabilmente tutte le tre succitate attività avrà un costo ampiamente maggiore. Un ulteriore
importante fattore da considerare è la estrema contestualità dei risultati di una campagna di test
soggettivi. I risultati ottenuti infatti devono essere considerati come validi strettamente alle
condizioni, allo scenario ed alla tipologia di segnali considerati. Si è spesso infatti tentati di
estendere i risultati di una campagna di test a problemi simili a quelli valutati (anche per non
eseguire ulteriori e costosi test). Questo è un errore piuttosto comune e che può portare a
risultati molto dannosi. Infatti i risultati ottenuti attraverso una corretta campagna di valutazione
sono estremamente contestualizzati e come tali devono sempre essere considerati.
Un buon risultato è garantito solo alle condizioni sopra citate, ma purtroppo le condizioni sopra
citate non sono garanzia di un buon risultato. A volte infatti il compito è così difficile che anche
una buona pianificazione, disegno ed esecuzione di test non porta a risultati definitivi e/o
sufficienti.
Ogni altra attività che utilizzi risultati di misure soggettive che non rientra in quelle citate deve
essere considerata con le opportune precauzioni, anche se eseguita al meglio delle possibilità
(spesso limitate) o secondo principi di massima ragionevolezza. Un tipo di misurazioni soggettive
che spesso vengono considerate sono quelle operate da una classe selezionata di soggetti esperti.
Si è tentati di credere infatti che una classe di esperti possa dare risultati migliori di una generica
classe di utenti, nel nostro caso di ascoltatori. Questo in realtà è, nella maggior parte dei casi,
falso. Inoltre l'esperto tende a dare giudizi fortemente "faziosi" in quanto tipicamente ha operato
delle scelte professionali, o opera in condizioni professionali diverse da quelle di un utente
medio. Certamente il giudizio soggettivo di esperti può essere molto importante per identificare
problemi o caratteristiche di tipo diagnostico particolari, ma in generale la proprietà di "esperto"
non risulta rilevante in molti dei compiti assegnati ai test soggettivi.
Esistono ovviamente tutta una serie diversamente graduata di possibili misure soggettive. Oltre a
quelle sopra citate, che lo ricordiamo sono le uniche che garantiscono una completa e massima
correttezza, possiamo considerare altri casi, come ad esempio quelli di una:


Valutazione soggettiva: dove con questo termine indichiamo un "piccolo test soggettivo"
condotto in condizioni controllate ma non normate, su un campione ridotto di persone, e
su un insieme di dati controllato e opportunamente preparato ma che non
necessariamente copre esaustivamente tutti i fattori in considerazione di nostro
interesse;
Valutazione "personale": dove un singolo soggetto (tipicamente un esperto) o
comunque un numero molto esiguo di persone (massimo 2/3) esegue un ascolto di
determinato materiale in condizioni parzialmente controllate e comunque non
necessariamente identiche tra loro.
pagina 32 di 45
Nel caso di una "valutazione soggettiva" dobbiamo pensare a qualcosa di simile ad una
valutazione pilota che sicuramente ci può dare delle indicazioni significative sulle misure che
vogliamo studiare, e che può rassicurarci sul corretto disegno del test. In altre parole ha una
validità minore di un "test soggettivo" ma può chiaramente indicarci dei risultati, anche se non
possiamo dire di avere un grado di certezza massimo di questi risultati. La "valutazione
personale" è invece il grado più basso di affidabilità di misure soggettive. Per quanto possiamo
aver fiducia nelle capacità del valutatore e per quanto poi i suoi risultati possano risultare
concordi con quelli ad esempio di un "test soggettivo" vero e proprio, non è mai ammissibile
assegnare un grado di media o addirittura alta certezza ai risultati derivati da una valutazione
personale. Purtroppo proprio l'eccessiva fiducia nel giudizio personale di molti esperti, fa si che
basandosi sulle proprie valutazioni personali si danno per scontato risultai e fatti che poi non
trovano riscontro nei giudizi e nelle valutazioni delle generiche classi di ascoltatori. È
principalmente proprio questo fatto che tende spesso a far considerare le misure soggettive
come antagoniste alle misure oggettive ed in generale a porre scarsa fiducia proprio nelle
misurazioni soggettive. Tutto questo è ovviamente del tutto errato, le misure soggettive se
correttamente operate sono concordi con quelle oggettive, anzi potremmo dire di più: le migliori
misure oggettive sono quelle che concordano con quelle ottenute da "test soggettivi" ed al
contrario il problema è proprio che le misure oggettive non sempre concordano con quelle dei
"test soggettivi".
7.1
I test eseguiti nell'ambito dei Tavoli Tecnici
Prima di proseguire con la descrizione delle misure soggettive eseguite nell'ambito di tale
progetto, vogliamo brevemente ricordare il test soggettivo eseguito congiuntamente con l'ISCOM
durante l'ultimo tavolo tecnico. Scopo dello studio era verificare dato un segmento di segnale
relativo ad un programma ed una pubblicità avente livello di loudness integrato diverso da quello
del segmento di programma gli ascoltatori fossero in grado di rilevare la differenza di volume e se
si per quali livelli.
I risultati hanno mostrato come gli ascoltatori hanno capacità di rilevare differenze anche inferiori
all'unità di loudness. Però il confronto di tipologie diverse di segnali (programma e pubblicità)
introduceva una bias percettivo per cui tutte le pubblicità, che tipicamente corrispondono a
segnali ipercompressi, vengono percepite come mediamente di volume più alto di circa 1,5LU. In
altre parole a parità di valore oggettivo di loudness una pubblicità viene percepita come più alta
di circa 1,5LU.
Questo in realtà è chiaramente spiegabile date le diverse caratteristiche dei segnali, e non deve
quindi sorprenderci che proprio l'EBU nel documento tecnico 3343 preveda che il solo
allineamento dell'integrated loudness delle pubblicità non sia vincolo sufficiente ma che venga
imposto anche (e solo per le pubblicità) un ulteriore vincolo sul loudness immediato. Ricordiamo
che queste condizioni sono poste da una associazione di broadcaster pubblici in maniera del tutto
autonoma e secondo principi di autoregolamentazione; non sono cioè richieste o imposizioni di
associazioni di consumatori o altro che peraltro avrebbero il pieno diritto di essere considerati nel
caso precipuo.
7.2
Una nuova "valutazione soggettiva"
Abbiamo eseguito una "valutazione soggettiva" che ha coinvolto 10 soggetti che hanno
partecipato ad un test di tipo CCR al fine di verificare ulteriormente se una differenza di 1LU e di
2LU sono percepite dagli ascoltatori. Al fine di eliminare l'effetto bias di cui si è evidenziata prova
nel precedente test soggettivo, questa volta abbiamo utilizzato per il confronto solo segnali
omogenei per tipologia ovvero solamente spot pubblicitari. Il segnale audio inoltre non è stato
assolutamente alterato ma è stato riproposto esattamente come raccolto durante la campagna di
misure sperimentali da noi eseguita. Avendo a disposizione diverse migliaia di segmenti
pagina 33 di 45
pubblicitari a diversi livelli di loudness abbiamo selezionato 10 unità aventi livello di loudness
integrato intorno al livello target di -23,0LU (per intorno intendiamo con un valore un una
approssimazione di qualche decimale), 10 unità con valori intorno ai -22.0LU e altre 10 con valori
intorno ai -21.0Lu ovvero rispettivamente a +1LU e a +2LU rispetto a quelli di riferimento intorno
al livello target.
Si sono generate delle sequenze casuali tra coppie a -24 e -23 LU chiedendo agli utenti quale delle
due unità a loro giudizio era di livello sonoro maggiore, e analogamente tra coppie a -24 e -22 LU.
L'ascolto è avvenuto in cuffia utilizzando delle cuffia AGK 240 (omologate secondo la
raccomandazione ITU per la esecuzione di test soggettivi di ascolto) ed aveva durata di circa 20
minuti. I risultati mostrano come per 73% degli ascolti i soggetti riconoscono come più alta la
pubblicità con un dislivello di loudness integrale intorno a 1LU, e come per ben il 91% degli ascolti
i soggetti riconoscono come più alta la pubblicità con un dislivello di loudness integrale intorno ai
2LU.
Nella figura seguente si riporta il grafico delle percentuali di corretto riconoscimento, ovvero di
individuazione di segmento a loudness maggiore, ottenuto nella valutazione soggettiva nel
confronto di unità pubblicitarie con dislivelli di 1LU e di 2LU.
Figura 35 – Percentuali di corretta riconoscimento della "valutazione soggettiva"
Si evidenzia la parte in verde che sovrasta il valore di 50% che corrisponde al valore di ugual
loudness ovvero ad un dislivello di 0LU.
Ovviamente per quanto sopra detto il test ha validità limitata e contestuale ai segnali pubblicitari
televisivi. Tuttavia l'ampissima percentuale che si riscontra già per una differenza di 1LU, per non
parlare poi di quella a 2LU, lasciano ben pochi dubbi sulla correttezza della ipotesi che segnali del
tipo di quelli in analisi sia possibile distinguere un livello sonoro pari a 1LU.
7.3
Considerazioni sulle misure soggettive (ed i test soggettivi)
Considerando l'insieme dei test soggettivi eseguiti nell'ambito del tavolo tecnico e le valutazioni
soggettive ulteriormente sviluppate nell'ambito del presente progetto, considerando inoltre che
tutto il materiale utilizzato nelle misure soggettive è stato selezionato a partire da trasmissioni
recentemente trasmesse dalle principali emittenti nazionali e considerando infine l'alta
correlazione tra i risultati ottenuti e quanto si trova nella letteratura "seria e conforme" (dove per
seria e conforme intendiamo letteratura di terze parti che non devono promuovere una propria
posizione, che abbiano eseguito test secondo normative internazionali e infine che abbiano
utilizzato segnali conformi a quelli di nostro interesse), otteniamo dei risultati del tutto allineati
con quanto definito nella più moderna letteratura tecnica ed in particolare con la recentissime
raccomandazioni e documenti tecnici EBU. Non bisogna lasciarsi trarre in inganno da obsolete
pagina 34 di 45
definizioni derivanti da altri documento o esperimenti fatti in condizioni di lavoro completamene
diverse. In particolare non bisogna confondere quello che è il livello per cui un ascoltatore è in
grado di distinguere uno dall'altro da quello che viene detta "confort zone" ovvero il dislivello
massimo di tolleranza che un ascoltatore può sopportare prima di ricorre a riallineamento
manuale dei livelli attraverso il telecomando o altri sistemi di controllo.
I risultati confermano quanto già indirettamente definito ad esempio nella Raccomandazione
R128 dove si pone un vincolo massimo di 1LU di tolleranza tra i diversi programmi, facendo di
questo valore un ottimo candidato per discriminare, in maniera del tutto generale, il livello sei
segnali televisivi di nostro interesse.
8
CONCLUSIONI
Nel presente elaborato si riportano i risultati e la loro analisi relativamente alla campagna di
misure sperimentali effettuate su venti emittenti tra DVB-T e DVB-S. Si esegue un percorso
articolato sulle misure oggettive a partire dalle normative vigenti al fine arrivare alle possibili
analisi diagnostiche operabili con i software di loudness monitoring da noi sviluppati. Si
propongono metodi e protocolli di analisi e di rappresentazione delle misure oggettive al fine di
avere una caratterizzazione della qualità del segnale audio per quanto riguarda la variabile di
nostro interesse ovvero per la potenza sonora. Relativamente alle misure soggettive, dopo una
breve ma fondamentale introduzione teorica, se ne ricorda sia la valenza tecnica sia la “difficile”
esecuzione, e come a volte sia solamente possibile operare delle semplici valutazioni soggettive,
come
quelle eseguite e riportate nel presente contesto.
Un’ampia parte dell’elaborato è relativa alla discussione puntuale dei risultati di ciascuna singola
emittente, e/o alla comparazione di alcune significative misure, quali ad esempio il livello
ordinario, tra le diverse emittenti. Il quadro che ne risulta da questa analisi è molto variegato e
conferma come alle basi per una potenziale infrazione al divieto definito in delibera possono
concorrere diversi fattori quali un livello medio delle pubblicità superiore al livello ordinario,
oppure una eccessiva variabilità del livello delle pubblicità stesso, oppure il non controllo del
livello di alcune specifiche tipologie di pubblicità. Da queste analisi anche gli approcci strategici
che sembrano essere adottati dalle diverse emittenti risultano piuttosto diversi. C’è chi adopera
un “livello di guardia” (ovvero il livello medio delle pubblicità rispetto al livello ordinario)
piuttosto ampio cercando di compensare eventuali problemi dovuti alla variabilità del loudness
delle diverse pubblicità, e chi al contrario, confidando in un rigido e stretto controllo della
variabilità del loudness delle pubblicità, si pone su un livello di guardia praticamente nullo o
addirittura negativo, ovvero con un livello medio della potenza sonora delle pubblicità maggiore
del livello ordinario.
In conclusione ricordiamo che tali misure e tali analisi fanno riferimento esclusivamente ad un
controllo della qualità del loudness del segnale, anche se utilizzano tutte quelle misure alla base
della determinazione della infrazione al divieto definito in Delibera. Costituiscono quindi solo una
visione sommaria ed analitica delle condizioni del problema loudness e pubblicità per le emittenti
considerate.
pagina 35 di 45
9
ALLEGATI
9.1
ALLEGATO A: LISTA DELLE 20 EMITTENTI REGISTRATE E LORO VALORI
STATISTICI RELATIVAMENTE A "UNITA' e MISURE"
E01: tabella riassuntiva delle statistiche giornaliere
E02: tabella riassuntiva delle statistiche giornaliere
E03: tabella riassuntiva delle statistiche giornaliere
E04: tabella riassuntiva delle statistiche giornaliere
pagina 36 di 45
E05: tabella riassuntiva delle statistiche giornaliere
E06: tabella riassuntiva delle statistiche giornaliere
E07: tabella riassuntiva delle statistiche giornaliere
E08: tabella riassuntiva delle statistiche giornaliere
pagina 37 di 45
E09: tabella riassuntiva delle statistiche giornaliere
E10: tabella riassuntiva delle statistiche giornaliere
E11: tabella riassuntiva delle statistiche giornaliere
E12: tabella riassuntiva delle statistiche giornaliere
pagina 38 di 45
E13: tabella riassuntiva delle statistiche giornaliere
E14: tabella riassuntiva delle statistiche giornaliere
E15: tabella riassuntiva delle statistiche giornaliere
E16: tabella riassuntiva delle statistiche giornaliere
pagina 39 di 45
E17: tabella riassuntiva delle statistiche giornaliere
E18: tabella riassuntiva delle statistiche giornaliere
E19: tabella riassuntiva delle statistiche giornaliere
E20: tabella riassuntiva delle statistiche giornaliere
pagina 40 di 45
9.2
ALLEGATO B: LA DISTRIBUZIONE DI PROBABILITA’
In statistica e nella teoria delle probabilità, una distribuzione di probabilità identifica la
probabilità di ciascun valore della variabile (quando questa è discreta), ovvero la probabilità che il
valore cada in un particolare intervallo (nel caso di variabile continua). La distribuzione di
probabilità descrive l’intervallo di possibili valori che la variabile può assumere e la probabilità
che i valori della variabile siano compresi entro un misurabile segmento di questo intervallo.
Consideriamo, ad esempio, la probabilità che lanciando un dado esca il numero 1,2, ecc., se il
dado è “onesto” allora queste saranno equiprobabili ed uguali a 1/6 e possiamo formulare
teoricamente la nostra distribuzione di probabilità dove i valori che la variabile può assumere
sono solo gli interi da 1 a 6 e dove la probabilità è uguale per ciascun valore, come mostrato in
figura 1. Lanciando quindi un dado “onesto” un numero molto grande di volte, la distribuzione
che avremo sarà quella della figura AB1.
0,30
0,25
0,30
0,20
0,25
0,20
0,15
P(v)
0,10
0,15
0,05
0,10
P(v)
0,05
0,00
1
2
3
4
5
6
0,00
1
Figura AB1 – Distribuzione di probabilità
di un dado “onesto”
2
3
4
5
6
Figura AB2 – Distribuzione di probabilità
di un dado “truccato”
Se invece lanciando un numero molto grande di volte (questa condizione è fondamentale ma non
vogliamo ora entrare nella giustificazione matematica di questo requisito) un dado ci ritroviamo
una distribuzione di probabilità come quella di figura 2, possiamo con buona certezza affermare
che il dado è “truccato” in quanto la probabilità che esca il numero “4” è molto più grande di
quella degli altri numeri. In altre parole la distribuzione di probabilità dei dati sperimentali ci può
dire se le cose vanno come è ragionevole aspettarsi, oppure se ci sono anomalie (il che non vuol
dire necessariamente errori) nella nostra serie di dati. Anzi proprio l’osservazione di anomalie o di
variazioni rispetto a quello che ci si aspetta è spesso il fattore determinante che permette di
acquisire conoscenze che altrimenti non avremmo avuto modo di scoprire.
Mentre per il caso di un dado possiamo conoscere a priori la distribuzione teorica, nel caso di
generici insiemi di dati sperimentali questo non è sempre possibile, ed anzi si è soliti procedere
inversamente: prima si ricava la distribuzione di probabilità dai dati sperimentali, quindi si stima
quanto la distribuzione risultante sia modellabile da una delle note funzioni statistiche che
descrivono le variabili. Quando non si hanno informazioni a priori sul tipo di distribuzione che ci si
aspetta da una serie di dati, la prima ipotesi è quella di una distribuzione “normale” (detta anche
“gaussiana” in onore al matematico e fisico Carl Friedrich Gauss che la studio per primo). Questa
è in realtà la distribuzione a cui sono soggette la maggior parte delle variabili che possiamo
incontrare ed in particolare si può dimostrare che tutte le variabili legate a degli errori seguono
questo tipo di distribuzione. Le corrispettive serie di dati infatti saranno caratterizzate da quello
che è comunemente detto il valor medio “” (cioè il valore più probabile della nostra serie di
dati) e dalla varianza “” (che descrive quanti degli altri valori della serie di dati siano vicini a
quello della media). Un’altra importante caratteristica dei dati di una distribuzione gaussiana è
che questi sono simmetrici rispetto al loro valor medio, in altre parole la probabilità di trovare un
valore distante una certa quantità rispetto al valor medio è uguale sia se questa distanza è
positiva, sia se è negativa.
pagina 41 di 45
La figura 3 riporta una distribuzione gaussiana. I valori riportati all’interno delle singole aree
ampie  (34,1; 13,6; ecc.) corrispondono alla probabilità che un valore della serie dei dati
appartenga a quell’intervallo ampio  e distante n dalla media .
Figura AB3 – Distribuzione di probabilità “normale” o “gaussiana”
pagina 42 di 45
9.3
ALLEGATO C: ESEMPI DI LETTURA DELLE DISTRIBUZIONI DI (delta)
La singola riga ci dice quante
pubblicità hanno un DELTA
pari al valore riportato
sull’asse delle ascisse, nel
nostro esempio circa 500
pubblicità con DELTA=0.0LU
oppure che per
DELTA= -1.0LU ci sono
circa 10 pubblicità
In questo invece non c’è nulla o quasi.
In questo intervallo (-1;+1)
c’è la grande maggioranza
delle pubblicità
Figura AC1 – Esempi di lettura della grandezza “frequenza” nelle distribuzioni di 
Dalla cumulativa vediamo che
circa il 75% delle pubblicità
ha DELTA negativo cioè è
inf eriore al livello ordinario
La pendenza (puntuale) e la
simmetria della cumulativa ci
danno inf ormazioni sulla
variabilità e su come sono
distribuiti i DELTA, ovvero su
come sono “piazzati” i livelli
della pubblicità rispetto al
livello ordinario,
Piuttosto che (quasi) il 100%
della pubblicità è non
superiore di 1.5LU rispetto al
livello ordinario
Figura AC2 – Esempi di lettura della “curva cumulativa” nelle distribuzioni di 
pagina 43 di 45
9.4
ALLEGATO D: VERIFICA INFRAZIONI SU CAMPAGNA SPERIMANTALE
In questo allegato si riportano i risultati conclusivi delle misurazioni, conformi alla Delibera
AGCOM nr. 219/09/CSP, eseguiti sul materiale acquisito ed elaborato nella campagna di misure
sperimentali effettuata nell’ambito delle attività di progetto.
Per l’esecuzione delle misure, sono stati utilizzati i dati raccolti durante la campagna di misure
sperimentali che corrisponde alla registrazione di venti emittenti. Ciascuna emittente è stata
registrata per dodici giorni consecutivi senza alcuna interruzione, e da questo si hanno pertanto
sette giorni per emittente su cui effettuare le “misure” secondo le modalità specificate in
Delibera. Sulla base dei risultati prodotti dal sistema prototipale di Monitoraggio del Loudness, si
è utilizzato il software EML secondo i parametri definiti per il “periodo transitorio” (si veda la
citata Delibera per maggiori dettagli) e si è utilizzata la procedura di scelta casuale su base dei
dati estratti al lotto (si veda il manuale del software EML per maggiori dettagli).
Riguardo al numero di misure eseguite si è deciso di operare esaustivamente, ovvero di eseguire
tutte le possibili misure. Pur operando esaustivamente secondo la procedura definita, si ha una
media di circa 2,3 misure al giorno.
In totale sono state eseguite 309 misure. Secondo i parametri definiti per il periodo transitorio, le
misure che hanno portato alla verifica di infrazione sono 28 su 309, distribuite secondo la
seguente tabella che riassume per ciascuna emittente i risultati ottenuti nella settimana in
osservazione.
Nella prima colonna il numero totale, per ciascuna delle venti emittenti, di misure eseguite nel
periodo di osservazione, nella seconda colonna il numero misure che soddisfano i principi di
infrazione definiti in Delibera, e quindi il suo valore in percentuale. Si può evincere facilmente che
solo per sei emittenti si sono realizzate misure indici di infrazione. In particolare, di queste solo
tre mostrano proporzionalmente un elevato rapporto tra misure eseguite e misure che verificano
la determinazione di infrazione.
Tabella D1 – Riassunto delle misure eseguite
Per ciascuna delle misure eseguite si è realizzato il documento relativo al dettaglio della misura (si
veda manuale del software EML per maggiori informazioni). Questo ovviamente sia quando la
misura è indice di infrazione, sia quando che non lo è.
Di seguito, quindi, come esempio, una delle 28 misure che hanno portato alla verifica di
infrazione nella campagna di misure sperimentali eseguita.
pagina 44 di 45
Tabella D2 – Dettagli misura che evidenzia una infrazione
pagina 45 di 45