Poveri sondaggisti In questi ultimi venti anni si sente spesso parlare di sondaggi, soprattutto durante le campagne elettorali. Non sempre, però, le previsioni delle indagini statistiche hanno dato informazioni vicine ai risultati elettorali. Da qui l’opinione pubblica ha denigrato i sondaggisti. In Italia non c’è una cultura scientifica figuriamoci, poi, una cultura matematica e statistica. Discipline molto dure e razionali, la cui comprensione richiede una concentrazione totale e costante. Alquanto difficile, visto che siamo immersi in una società dove l’emozione deve far da padrona. I sondaggi di natura politica sono una minima parte del campo delle ricerche di mercato per testare il gusto dei consumatori e richiedono una professionalità culturale notevole nelle discipline economiche, matematiche, statistiche, probabilistiche e sociali. Le battute sarcastiche di qualche giornalista, evidenziano la loro ignoranza totale che non è colpa dei sondaggisti ma della loro carenza culturale. Purtroppo l’Italia è il paese dei tuttologi. Tutti sono allenatori di calcio, tutti sono economisti e fiscalisti, tutti sono esperti di tutto. Il guaio è che una finta cultura umanistica vuole giudicare la cultura scientifica. Ora, non è mio obiettivo contrapporre le due culture, ma fare una riflessione su cosa questi sondaggi sono e cosa fanno. Tenete presente che il sottoscritto non è un sondaggista, ma uno che un po’ di matematica e di statistica ne comprende qualcosa. E’ opinione comune che la matematica sia il luogo della certezza assoluta, nel senso che la matematica deve dare la verità, ma non è così. I primi ad esserne convinti sono i matematici. La storia della matematica è vasta e non è stata lineare, presenta cambiamenti radicali. Il lavoro che i matematici hanno profuso, nel corso dei secoli, è stato faticoso, incerto e sempre esposto alle contraddizioni. Il profano crede che la matematica sia di una verità ben distinta, ma quando si è nel variegato mondo delle informazioni della società e, quindi, delle incertezze la matematica può portare a delle contraddizioni. I sondaggi non rilevano dati e informazioni a casaccio, bensì adottano delle metodologie rigorose e scientifiche. I risultati sono tali se si accetta che vi è un rischio di errore probabilistico. Se non si accetta ciò, allora è inutile discutere delle situazioni cui le ricerche di mercato fanno riferimento. La teoria della probabilità ha cercato di tenere sotto controllo l’incertezza dei dati, ma nei risultati i dubbi rimangono sempre. Tenete presente che ogni teoria scientifica è tale se è falsificabile. Quindi una certezza assoluta non esiste. E’ chiaro che se i dati sono incerti non significa che non bisogna fare sondaggi. Le imprese se vogliono lanciare sul mercato un nuovo prodotto devono necessariamente commissionare ricerche di mercato per prevedere i gusti dei probabili acquirenti. Fare domande in un sondaggio non semplice. Chiedere se in casa ci sono stanzini, la risposta è un si o un no, l’elaborazione è semplice. Domandare l’auto ideale o una politica economica ideale, non porta certo all’acquisto dell’auto ideale ed è sempre complesso mettere in pratica una politica economica ideale. La descrizione non è la realtà. Ecco perché bisogna essere disposti, soprattutto nei sondaggi politici, accettare il rischio di errore. L’incertezza è dovuta dalla scelta dei campioni. Si può fare una scelta casuale con un sorteggio, oppure con la costruzione del campione stratificato secondo alcune variabili quali il sesso, l’età, la categoria socio professionale, le abitudini di consumo, il numero dei componenti familiari, ecc.. ma il metodo del sorteggio casuale è il migliore perché può darci margini di errore più precisi. Il sondaggista costruisce il campione tenendo conto che tutte le unità della popolazione hanno la stessa probabilità di farne parte. L’incertezza dunque esiste perché l’indagine si fa su una parte del campione. Ma non si può fare altrimenti per motivi di costi e di tempo. Scandagliare l’opinione di tutta la popolazione richiede tempo e denaro. I committenti vogliono risultati subito e con costi contenuti. Immaginate di dover fare un controllo di qualità sulla durata delle lampadine, bisognerebbe analizzare tutta la linea di produzione per voler la “certezza”, ma con il risultato è che l’azienda non venderebbe nessuna lampadina, perché distrutte dall’indagine. Quindi il campione è necessario. La metodologia che permette di risalire alla popolazione attraverso il campione, è l’inferenza statistica e la verifica delle ipotesi. Dal campione si possono fare delle stime riguardo i parametri della popolazione (medie, scarto quadratico medio, percentuali). Se si vuole stimare un parametro della popolazione π attraverso uno stimatore πΜ, fissato πΌ come rischio di errore, il livello di fiducia in termini probabilistici del parametro incognito π è: 1 − πΌ = Pr(πΜ − πΏ′ ≤ π ≤ πΜ + πΏ) Cioè con probabilità 1 − πΌ possiamo ritenere vera l’affermazione che il valore incognito π sia compreso nell’intervallo, al variare del campione, (πΜ − πΏ′ ≤ π ≤ πΜ + πΏ). Per esempio, se si vuole stimare la percentuale π di individui che voterebbero un dato candidato, scelto un campione di numerosità π, si stima la percentuale con lo stimatore P, attraverso domande ai componenti del campione, l’intervallo di confidenza è: π(1 − π) π(1 − π) 1 − πΌ = Pr (π − π§πΌ β √ < π < π + π§πΌ β √ ) π π Dove P è la percentuale calcolata nel campione, π§πΌ è il valore soglia della normale standardizzata che si desume da tavole della curva normale secondo il valore di rischio πΌ prefissato. Un sondaggio è attendibile se si intervistano un numero abbastanza adeguato di persone. In base alla numerosità della popolazione e in base ad un valore dell’errore ammesso, si ricava la numerosità campionaria. La metodologia statistica matematica è rigorosa, ma è da tenere sempre presente che il sondaggio è una fotografia del momento. Fare previsione è tutt’altra cosa. Bisognerebbe avere a disposizione di una serie storica dei dati e attuare dei modelli regressivi. Ma questo è un altro discorso. I media vogliono lo spettacolo, lo statistico non è un clown.