Poveri sondaggisti In questi ultimi venti anni si sente spesso parlare

Poveri sondaggisti
In questi ultimi venti anni si sente spesso parlare di sondaggi, soprattutto durante le campagne
elettorali. Non sempre, però, le previsioni delle indagini statistiche hanno dato informazioni vicine ai
risultati elettorali. Da qui l’opinione pubblica ha denigrato i sondaggisti. In Italia non c’è una cultura
scientifica figuriamoci, poi, una cultura matematica e statistica. Discipline molto dure e razionali, la cui
comprensione richiede una concentrazione totale e costante. Alquanto difficile, visto che siamo
immersi in una società dove l’emozione deve far da padrona.
I sondaggi di natura politica sono una minima parte del campo delle ricerche di mercato per testare
il gusto dei consumatori e richiedono una professionalità culturale notevole nelle discipline
economiche, matematiche, statistiche, probabilistiche e sociali. Le battute sarcastiche di qualche
giornalista, evidenziano la loro ignoranza totale che non è colpa dei sondaggisti ma della loro carenza
culturale. Purtroppo l’Italia è il paese dei tuttologi. Tutti sono allenatori di calcio, tutti sono economisti
e fiscalisti, tutti sono esperti di tutto. Il guaio è che una finta cultura umanistica vuole giudicare la
cultura scientifica. Ora, non è mio obiettivo contrapporre le due culture, ma fare una riflessione su
cosa questi sondaggi sono e cosa fanno. Tenete presente che il sottoscritto non è un sondaggista, ma
uno che un po’ di matematica e di statistica ne comprende qualcosa.
E’ opinione comune che la matematica sia il luogo della certezza assoluta, nel senso che la
matematica deve dare la verità, ma non è così. I primi ad esserne convinti sono i matematici. La storia
della matematica è vasta e non è stata lineare, presenta cambiamenti radicali. Il lavoro che i
matematici hanno profuso, nel corso dei secoli, è stato faticoso, incerto e sempre esposto alle
contraddizioni. Il profano crede che la matematica sia di una verità ben distinta, ma quando si è nel
variegato mondo delle informazioni della società e, quindi, delle incertezze la matematica può portare
a delle contraddizioni. I sondaggi non rilevano dati e informazioni a casaccio, bensì adottano delle
metodologie rigorose e scientifiche. I risultati sono tali se si accetta che vi è un rischio di errore
probabilistico. Se non si accetta ciò, allora è inutile discutere delle situazioni cui le ricerche di mercato
fanno riferimento.
La teoria della probabilità ha cercato di tenere sotto controllo l’incertezza dei dati, ma nei risultati i
dubbi rimangono sempre. Tenete presente che ogni teoria scientifica è tale se è falsificabile. Quindi
una certezza assoluta non esiste. E’ chiaro che se i dati sono incerti non significa che non bisogna fare
sondaggi. Le imprese se vogliono lanciare sul mercato un nuovo prodotto devono necessariamente
commissionare ricerche di mercato per prevedere i gusti dei probabili acquirenti. Fare domande in un
sondaggio non semplice. Chiedere se in casa ci sono stanzini, la risposta è un si o un no, l’elaborazione
è semplice. Domandare l’auto ideale o una politica economica ideale, non porta certo all’acquisto
dell’auto ideale ed è sempre complesso mettere in pratica una politica economica ideale. La
descrizione non è la realtà. Ecco perché bisogna essere disposti, soprattutto nei sondaggi politici,
accettare il rischio di errore.
L’incertezza è dovuta dalla scelta dei campioni. Si può fare una scelta casuale con un sorteggio,
oppure con la costruzione del campione stratificato secondo alcune variabili quali il sesso, l’età, la
categoria socio professionale, le abitudini di consumo, il numero dei componenti familiari, ecc.. ma il
metodo del sorteggio casuale è il migliore perché può darci margini di errore più precisi. Il sondaggista
costruisce il campione tenendo conto che tutte le unità della popolazione hanno la stessa probabilità di
farne parte.
L’incertezza dunque esiste perché l’indagine si fa su una parte del campione. Ma non si può fare
altrimenti per motivi di costi e di tempo. Scandagliare l’opinione di tutta la popolazione richiede tempo
e denaro. I committenti vogliono risultati subito e con costi contenuti. Immaginate di dover fare un
controllo di qualità sulla durata delle lampadine, bisognerebbe analizzare tutta la linea di produzione
per voler la “certezza”, ma con il risultato è che l’azienda non venderebbe nessuna lampadina, perché
distrutte dall’indagine. Quindi il campione è necessario.
La metodologia che permette di risalire alla popolazione attraverso il campione, è l’inferenza statistica
e la verifica delle ipotesi. Dal campione si possono fare delle stime riguardo i parametri della
popolazione (medie, scarto quadratico medio, percentuali).
Se si vuole stimare un parametro della popolazione πœƒ attraverso uno stimatore πœƒΜ‚, fissato 𝛼 come
rischio di errore, il livello di fiducia in termini probabilistici del parametro incognito πœƒ è:
1 − 𝛼 = Pr(πœƒΜ‚ − 𝛿′ ≤ πœƒ ≤ πœƒΜ‚ + 𝛿)
Cioè con probabilità 1 − 𝛼 possiamo ritenere vera l’affermazione che il valore incognito πœƒ sia
compreso nell’intervallo, al variare del campione, (πœƒΜ‚ − 𝛿′ ≤ πœƒ ≤ πœƒΜ‚ + 𝛿).
Per esempio, se si vuole stimare la percentuale πœ‹ di individui che voterebbero un dato candidato,
scelto un campione di numerosità 𝑛, si stima la percentuale con lo stimatore P, attraverso domande ai
componenti del campione, l’intervallo di confidenza è:
𝑃(1 − 𝑃)
𝑃(1 − 𝑃)
1 − 𝛼 = Pr (𝑃 − 𝑧𝛼 βˆ™ √
< πœ‹ < 𝑃 + 𝑧𝛼 βˆ™ √
)
𝑛
𝑛
Dove P è la percentuale calcolata nel campione, 𝑧𝛼 è il valore soglia della normale standardizzata che si
desume da tavole della curva normale secondo il valore di rischio 𝛼 prefissato.
Un sondaggio è attendibile se si intervistano un numero abbastanza adeguato di persone. In base alla
numerosità della popolazione e in base ad un valore dell’errore ammesso, si ricava la numerosità
campionaria.
La metodologia statistica matematica è rigorosa, ma è da tenere sempre presente che il sondaggio è
una fotografia del momento. Fare previsione è tutt’altra cosa. Bisognerebbe avere a disposizione di
una serie storica dei dati e attuare dei modelli regressivi. Ma questo è un altro discorso. I media
vogliono lo spettacolo, lo statistico non è un clown.