Che cos’è la statistica? La statistica è una disciplina che si occupa di fenomeni, riferibili ad individui (unità, elementi) in quanto appartenenti a fissate popolazioni (insiemi, aggregati,…) che possono manifestarsi con modalità diverse da individuo ad individuo e che sono collegati (o possono essere collegati) a fenomeni oggetti di specifiche ricerche. 1 Statistica descrittiva La STATISTICA DESCRITTIVA mira all’organizzazione, all’analisi tabellare e grafica, al calcolo di grandezze sintetiche di ciò che si è rinvenuto nella rilevazione • E’ anche nota come analisi esplorativa (Exploratory Data Analisys) proposta soprattutto da J. W. Tukey nel 1977 • Si configura come una trattazione preliminare indispensabile per affrontare uno studio complesso. • Utilizza tecniche elementari, soprattutto grafiche, di grande efficacia nell’aiutare a comprendere l’esito della rilevazione 2 Le fonti dei dati: fonti statistiche • Fonti orali: testimonianze, colloqui … • Fonti scritte o documenti “espressivi”: notizie ricavabili da archivi storici, lettere personali, biografie … • Fonti statistiche: fonti che forniscono informazioni sotto forma di dati statistici; • Fonti nuove di dati: telerilevamenti via satellite, stazioni di rilevamento dei livelli di inquinamento Le fonti statistiche sono le più attendibili poiché forniscono dati raccolti fissando determinati criteri di classificazione. Le fonti orali sono, da un punto di vista statistico, le meno attendibili 3 ISTAT: che cos’è? • L’Istituto nazionale di statistica (ISTAT) è un ente di ricerca pubblico, presente in Italia dal 1926. • E’ il principale produttore di statistica ufficiale a supporto dei cittadini e dei decisori pubblici. Opera in piena autonomia e in continua interazione con il mondo accademico e scientifico. 4 ISTAT: che cosa fa? • Produce e diffonde informazioni affidabili, imparziali, accessibili e pertinenti, capaci di descrivere le condizioni sociali, economiche e ambientali del Paese ed i cambiamenti che in esso avvengono, con il rigoroso rispetto della privacy. • Realizza i censimenti generali: popolazione e abitazioni, industria e servizi, agricoltura. • Esegue la maggior parte delle indagini comprese nel Programma statistico nazionale, l'insieme di rilevazioni ed elaborazioni considerate indispensabili per il Paese. • Dal 1989 svolge un ruolo di indirizzo, coordinamento, assistenza tecnica e formazione all'interno del Sistema statistico nazionale (Sistan). Il Sistema è stato istituito per razionalizzare la produzione e diffusione delle informazioni ed ottimizzare le risorse destinate alla statistica ufficiale. 5 L’indagine statistica • Se la trattazione del problema costringe a cercare nuovi dati, questi devono essere rilevati con uno schema appropriato. • La rilevazione si articola in una sequenza ordinata di casi o repliche che hanno tanti elementi in comune da essere considerati facenti parte di un unico processo: l’indagine statistica. • Ogni indagine ha il suo piano di realizzazione legato alle peculiarità della disciplina in cui il problema è sorto. 6 Nuove rilevazioni L'acquisizione di nuovi dati è dovuta al fatto che: La base informativa di un problema non è soddisfacente E' utile e praticabile realizzarne una nuova o integrare quella esistente La rilevazione dei dati consiste nella annotazione sistematica, precisa e impersonale della modalità delle variabili riscontrate sull’unità. Le rilevazioni possono essere: • TOTALI: coinvolgono tutti gli elementi di una popolazione • PARZIALI: la rilevazione è estesa solo ad una parte, comunque scelta, di popolazione 7 Le rilevazioni totali Le RILEVAZIONI TOTALI (O CENSIMENTI) sono quelle in cui sono enumerate o misurate tutte ed indistintamente le unità della popolazione. All'interno delle totali si hanno: RILEVAZIONI GENERALI: riguardano la rilevazione di tutte le unità rispetto alle variabili di interesse (POPOLAZIONE) Esempio: un'indagine sul voto che si rivolga a tutti gli elettori di qualsiasi sesso e regione di residenza RILEVAZIONI SPECIALI: riguardano la rilevazione delle sole unità rispondenti a certe specifiche (SOTTOPOPOLAZIONE) Esempio: un'indagine sul voto che si rivolga a tutti, ma i soli iscritti alle camere di commercio come "artigiani" 8 Le rilevazioni parziali • Sono limitate solo ad una parte delle unità della popolazione (o sottopopolazione) scelta in base ad opportuni criteri. La parte esaminata si chiama CAMPIONE. • La riduzione delle unità propria del metodo CAMPIONARIO è valida solo se permette il raggiungimento di risultati molto prossimi di quelli ottenibili con la TOTALE. Esperienze consolidate in molti paesi e in molte discipline dimostrano che si può dare pieno affidamento ai campioni purché scelti con accuratezza. 9 Perché il campione? La Rilevazione Totale non è sempre praticabile perché: HA UN COSTO ECCESSIVO O RICHIEDE GRANDI ORGANIZZAZIONI – il censimento generale si realizza ogni 10 anni RICHIEDE TROPPO TEMPO – l'intervista di tutti i lavoratori dipendenti richiederebbe tanti anni che una volta finita la popolazione attuale sia molto diversa dalla censita E' TEORICA: PARTE DELLE SUE UNITA' NON ESISTE ANCORA o NON ESISTE PIU’ – il controllo della qualità dovrebbe riguardare anche le unità non ancora prodotte. – le vestigia di antiche civiltà E' SUPERFLUA – per valutare l'inquinamento di un tratto di mare non bisogna esaminarne tutta l'acqua E' RISCHIOSA – prima di somministrare un nuovo vaccino all'intera popolazione è bene sperimentarne su poche unità la tossicità e l'efficacia E' DISTRUTTIVA per stimare la durata di una batteria di 1.5 volt si deve per forza farla esaurire, ma se si esauriscono tutte, che cosa si vende NON È VELOCE – per conoscere i risultati delle elezioni non si possono aspettare gli esiti ufficiali. Più 10 immediati e precisi possono essere gli EXIT POLL Le fasi di un’indagine statistica 1. 2. 3. 4. 5. Il piano di rilevazione La raccolta dei dati La classificazione e lo spoglio dei dati L’elaborazione dei dati L’interpretazione dei risultati 11 Il piano di rilevazione Il piano di rilevazione riguarda la definizione del problema da analizzare in tutti i suoi aspetti (scientifici, statistici, organizzativi, economici, ecc.). È una fase preparatoria e preliminare alle fasi successive. In tale fase, dopo aver definito il fenomeno oggetto di studio, bisogna definire: 1. La scelta del campo d’indagine, ossia la scelta e la definizione statistica sia delle unità che dei caratteri. 2. La scelta del metodo di rilevazione Direttamente tramite questionario o da modello da sottoporre alla collettività. La rilevazione può essere totale o parziale. Indirettamente tramite raccolta di dati statistici prodotti da enti. Attraverso osservazioni di tipo sperimentale. 3. La scelta del periodo di rilevazione: quando effettuare la raccolta. 4. Il personale e l’organizzazione necessaria alla materiale raccolta dei dati. 5. Strumenti necessari alla rilevazione ed elaborazione dei dati. 6. Tempi e costi sia di rilevazione dei dati sia di elaborazioni. 7. Diffusione dei risultati (pubblicazioni convegni, ecc…). 12 La raccolta dei dati Consiste nella costituzione della documentazione statistica di partenza ossia nella rilevazione del materiale o nell’acquisizione dei dati secondo le modalità definite nella fase preparatoria. Sebbene si tratta di materiale grezzo ossia in forma non ancora statisticamente trattabile, la documentazione statistica di partenza contiene tutte le informazioni relative a tutte le unità statistiche considerate e quindi rappresenta la base di partenza per la formazione dei dati statistici necessari alle successive analisi. 13 Il questionario: che cos’è? Il questionario è un modello di rilevazione costituito da un certo numero di domande espresse in modo standardizzato (uguale per tutti gli interpellati) e strutturato (le cui domande riflettono le ipotesi e l’oggetto della ricerca). Il suo scopo è quello di fornire sia una descrizione quantitativa delle caratteristiche, opinioni, atteggiamenti, comportamenti degli interpellati sia stabilire l’esistenza di eventuali relazioni casuali o interrelazioni tra caratteri rilevati e di verificare se esse sono dovute o meno la caso attraverso l’utilizzo di statistiche di tipo inferenziale. 14 Il questionario: come si compila? Il questionario può essere compilato: 1. Direttamente dalla persona da interpellare (Autocompilazione) 2. Tramite la tecnica dell’intervista. È l’intervistatore a porre le domande del questionario ed è, in tal caso, possibile che ci sia un intervento dell’intervistatore nel corso dell’intervista. 3. Tramite una combinazione dei due precedenti modi: ad esempio la tecnica del “giorno dopo”. 15 Il questionario: come si stende? Alcuni criteri da seguire nella stesura di un questionario sono: 1. 2. 3. 4. 5. Il linguaggio utilizzato deve essere il più possibile chiaro, preciso nei riferimenti, semplice ed imparziale. L’ordine in cui vengono poste le domande. Bisogna tener conto degli effetti che una domanda ha sulla successiva; domande delicate o riservate devono essere poste alla fine. Il numero delle domande deve essere limitato. La presentazione tipografica della domanda e relative risposte. Le domande possono essere di vario tipo a seconda del modo in cui sono previste le possibili risposte. 1. Domande aperte 2. Domande libere 3. Chiuse o strutturate 4. Domande filtro 5. Domande gerarchizzate 6. Domande mutiresponse 16 Tipi di domande • Domande aperte: le possibili risposte sono solo in parte • Domande libere: danno un’informazione ricca ed estesa; • Domande chiuse: sono previste tutte le possibili risposte. Se si previste lasciandone una libera del tipo: “altro (specificare)”; riferiscono a caratteri qualitativi si specificano tutte le possibili risposte; se riguardano caratteri quantitativi si scrive il numero corrispondente alla risposta; se riguardano variabili divise in classi si procede come per le qualitative; • Domande filtro: selezionano sottogruppi di intervistati • Domande gerarchizzate: permettono di dare un ordine di preferenza le modalità di un fenomeno; • Domande multiresponse: si possono dare più domande tra loro compatibili. 17 Tipi di domande • Domande delicate o condizionanti: ad es. domande sull’uso di alcool, droga, sul reddito, sull’appartenenza a partiti politici ecc …. Per tali domande, in cui vi può essere reticenza da parte dell’intervistato, si possono utilizzare diverse tecniche: – – • Tecnica delle domande proiettive (l’intervistato è sottoposto ad una situazione- stimolo che apparentemente non lo riguarda personalmente) Tecnica delle domande indirette (ad es. nelle domande sul reddito chiedendo quanto avrebbe bisogno al mese una famiglia composta come la sua per vivere in una data città) Domande sul controllo di qualità: riguardano notizie che il rilevatore compila alla fine dell’intervista concernenti: – – – l’andamento dell’intervista stessa Chi ha risposto alle domande Numero di volte che si è dovuto contattare l’intervistato Per le variabili strutturali riguardanti le notizie generali, le caratteristiche socio-demografiche dell’intervistato, per la comparabilità con altre indagini esistono norme di classificazione internazionali accettate dall’ISTAT, in cui vengono fornite le modalità da impiegare nella formulazione delle domande su tali variabili. 18 La classificazione e lo spoglio dei dati La classificazione riguarda la trasformazione dei dati grezzi in forma statisticamente trattabile. Ogni unità statistica oggetto d’indagine viene classificata mediante lo spoglio dei dati contenuti nella documentazione statistica di partenza in base alla modalità quantitativa o qualitativa da essa assunta. Tale fase rappresenta il primo passo per il trattamento statistico dei dati poiché trasforma il materiale grezzo di partenza in dati e distribuzioni statistiche. Tecnicamente si effettua attraverso lo spoglio che può essere di due tipi: 1. Spoglio manuale 2. Spoglio con mezzi informatici 19 L’elaborazione dei dati Tale fase riguarda tutte le possibili elaborazioni dalle più elementari alle più complesse, che possono essere effettuate, secondo gli scopi della ricerca, a partire dal file dei dati creato nella fase precedente. È la fase in cui si applicano i procedimenti propri della metodologia statistica. L’interpretazione dei risultati Tale fase riguarda l’analisi dei risultati ottenuti e l’isolamento dei risultati significativi emersi dalle analisi effettuate. È l’aspetto più delicato ma anche il più creativo dell’indagine. 20