Elementi base di statistica Le fasi di un’indagine statistica Cos’è la Statistica La Statistica studia i metodi per raccogliere, elaborare e interpretare i dati relativi ad un fenomeno collettivo. Prende il nome dal termine “Stato”. Era una tecnica collegata al governo dello Stato, finalizzata a conoscere quanti fossero gli abitanti e quale fosse il loro censo. Da qui deriva la parola censimento, che indica una rilevazione di dati dell’intera popolazione di uno Stato. Popolazione statistica Si dice popolazione statistica o collettività statistica un insieme di elementi che presentano una o più caratteristiche comuni. Ogni elemento della popolazione è detto individuo o unità statistica. Le fasi dell’indagine statistica Definizione degli obiettivi Definizione del problema e modalità di raccolta delle informazioni Raccolta delle informazioni Elaborazione dei dati Definizione degli obiettivi Individuare il fenomeno sul quale si deve indagare e le modalità con le quali esso si presenta. Per analizzare le caratteristiche della popolazione studentesca di una scuola, dobbiamo innanzitutto decidere quale aspetto studiare e poi quali sono le informazioni sugli studenti che dobbiamo conoscere per poterlo analizzare. Ogni studente rappresenta un’unità statistica. Tipologia di indagine Indagine totale o completa: è possibile intervistare tutti gli studenti Indagine per campione o campionamento: si considera solo una parte della popolazione rappresentativa dell’intera collettività. Il campione deve essere scelto in modo da ben rappresentare la popolazione, una scelta sbagliata può inficiare i risultati dell’intera indagine. Indagine per campione La scelta di effettuare indagine a campione è legata principalmente a problemi relativi ai costi e ai tempi: – una raccolta esaustiva di dati può risultare troppo dispendiosa in relazione al risultato da raggiungere – i tempi necessari all’elaborazione dei dati crescono all’aumentare del numero dei dati stessi; quindi i tempi di attesa potrebbero diventare eccessivi Modalità di raccolta delle informazioni Le modalità con le quali in un’indagine si raccolgono i dati dipendono dal tipo di problema studiato. Analisi di un fenomeno fisico – strumento di indagine: esperimenti di laboratorio. – dati da elaborare: i parametri in base ai quali l’esperimento è stato realizzato e i risultati ottenuti. Analisi di un fenomeno sociale o economico in una data epoca storica (es. livello di scolarizzazione delle donne negli anni ‘30) – ricerca bibliografica dei dati Modalità di raccolta delle informazioni Indagine nella quale le unità statistiche sono soggetti viventi: – strumenti: intervista diretta di tali unità. Affinché le risposte siano confrontabili è necessario che a tutti vengano poste le stesse domande nella stessa forma e nello stesso numero. Il questionario Un questionario è una lista di domande da porre agli intervistati per ottenere le informazioni utili per svolgere un’indagine statistica. I questionari sono essenzialmente di tre tipi: – aperti – semistrutturati – rigidamente strutturati I questionari aperti Le domande sono poste in modo tale che sia lo stesso intervistato a esporre la risposta con parole proprie. Cosa ne pensi delle poste italiane? Questionari abbastanza semplici da costruire Lo spoglio richiede un’interpretazione soggettiva della risposta, di conseguenza i risultati dell’inchiesta potrebbero non essere attendibili. I questionari strutturati L’intervistato pone una crocetta su una delle risposte previste. Sono difficili da costruire in quanto è necessario prevedere tutte le possibili risposte (ALTRO) Non richiedono l’interpretazione delle risposte Garantiscono una maggiore attendibilità dei risultati dell’indagine. Secondo te, le poste italiane sono : molto efficienti efficienti poco efficienti inefficienti molto inefficienti I questionari semistrutturati Contengono domande a risposta aperta e domande a risposta chiusa. Presentano i difetti dei due tipi precedenti Sono poco utilizzati. Caratteristiche fondamentali dei quesiti La scelta delle domande è strettamente collegata agli obiettivi dell’indagine. Criteri: 1. Ridurre al minimo i quesiti, limitandosi soltanto a quelli che effettivamente potranno dare informazioni utili ai fini della ricerca 2. Evitare domande che forniscono dati inutili per non appesantire il lavoro di spoglio dei dati Caratteristiche fondamentali delle domande Espresse in un linguaggio tale da garantire l’univocità di interpretazione del loro significato Espresse in un linguaggio che sia comprensibile dalla totalità degli intervistati Poste in modo da non suggerire la risposta (Non crede che le poste italiane siano poco efficienti?) Domande di controllo Hanno lo scopo di verificare la sincerità delle risposte. Inchiesta sul tabagismo: se si chiede quante sigarette fuma al giorno, si può inserire una domanda di controllo nella quale si chiede qual è la sua spesa mensile o settimanale per le sigarette. Le domande di controllo devono essere ben distanziate dalle domande da “controllare”. Domande di controllo In questionari molto lunghi si ripropone la stessa domanda, in termini leggermente diversi, più volte nello stesso questionario. La necessità di inserire tali domande deriva, non tanto dal presupposto che l’intervistato dia volutamente delle risposte non veritiere , quanto dal fatto che spesso si tende inconsciamente a rifiutare certe realtà personali e a modificare involontariamente certi dati per adattarli alla situazione. Per evitare che le risposte non siano sincere, si usa spesso la tecnica del questionario anonimo. L’intervista Si può procedere in due modi: – si consegnano i questionari agli intervistati i quali li compilano da soli e li riconsegnano all’addetto che provvede al loro ritiro; – il questionario viene compilato da un intervistatore il quale propone le domande e si preoccupa di segnare le risposte dando eventuali chiarimenti. Autocompilazione Presenta il vantaggio di una maggior semplicità e rapidità, ma ha i seguenti svantaggi: – in caso di domande non chiare l’intervistato da un’interpretazione personale e può compromettere l’attendibilità dei risultati; – qualche questionario può andare perduto e ciò altera la struttura del campione compromettendo la validità della ricerca. Intervista diretta Non presenta gli svantaggi del primo E’ lento Richiede una buona preparazione del personale addetto alle interviste Non sempre garantisce l’anonimato Raccolta delle informazioni La fase centrale di un’indagine statistica è quella della rilevazione, classificazione e tabulazione dei dati. Di ogni individuo soggetto all’indagine interessano, a seconda degli obiettivi scelti, alcuni caratteri: il sesso, l’età, il titolo di studio, una particolare opinione…. Ogni carattere si presenta con diverse modalità, che possono essere quantitative o qualitative. Modalità dei caratteri – il carattere “colore degli occhi” è qualitativo e le sue modalità sono: neri, marroni, verdi, azzurri,… – il carattere “titolo di studio” è qualitativo, ma, in certa misura è ordinabile gerarchicamente: 0=nessuno, 1=licenza elementare, 2=adempimento dell’obbligo, 3=diploma di scuola superiore, 4=diploma postsecondario, 5=laurea – il carattere “metri quadrati di verde pubblico”, relativo ad un’indagine su una “popolazione” di comuni europei, è di tipo quantitativo. Spoglio dei dati Spoglio: – si esaminano tutte le schede – si contano quanti individui presentano l’una o l’altra modalità, – si contano e classificano le varie risposte date a ciascuna domanda. Lo spoglio può avvenire manualmente o immettendo i dati in un computer e utilizzando un software opportuno Dopo lo spoglio i dati vengono organizzati in tabelle che possono essere semplici, a doppia entrata, composte. Tabelle di spoglio Quesito n…. Modalità A del carattere Intensità /////,/// 8 B /////,/ 6 C /// D /// 3 3 Intensità: numero di volte in cui una modalità è stata rilevata totale 20 Tabelle semplici Carattere Quesito n. 4: Che tipo di musica ti piace? Tipo di musica classica leggera rock altro totale Modalità numero alunni 2 12 8 6 28 Intensità Tabelle a doppia entrata Si considerano contemporaneamente due caratteri associati alla stessa unità statistica 1° colonna: modalità del 1° carattere Colonne successive: intensità del primo carattere ripartite a seconda delle modalità del secondo La lettura può essere fatta per righe e/o per colonne Tabelle a doppia entrata 1° carattere 2° carattere Quesito n. 5: Dove la ascolti? e n.6 Con chi la ascolti? n.5 n.6 a casa tua a casa di amici in locali pubblici altro totale da solo 6 0 1 0 7 con parenti 1 0 0 0 1 con amici altro totale 6 5 8 1 20 0 0 0 0 0 13 5 9 1 28 Le somme dei due totali parziali devono coincidere tra loro con il numero totale di schede spogliate Tabelle composte • Hanno più colonne, ma la lettura si effettua solo per righe •1° colonna: modalità del carattere studiato •Colonne successive: intensità del carattere suddivise in rapporto a informazioni supplementari che non costituivano un carattere indagato Tabelle composte carattere Quesito n.1 A quanto ammonta la somma, in euro, di cui puoi disporre settimanalmente? somma 0-3 3-6 6-9 9-12 12-15 totale modalità maschi 0 2 6 3 2 13 femmine 2 5 5 2 1 15 Classi di intensità Il carattere è quantitativo le modalità sono state divise in classi classe: gruppo in cui vengono riuniti i valori intermedi intervalli chiusi a sinistra e aperti a destra ultimo intervallo è chiuso rispetto ad entrambi gli estremi si riducono dimensioni della tabella somma 0-3 3-6 6-9 9-12 12-15 Organi preposti alla raccolta dei dati La raccolta dei dati può essere effettuata da chiunque abbia interesse a fare una ricerca statistica. In Italia, l’organo più importante che si occupa della raccolta dei dati e della loro successiva elaborazione è l’Istituto Centrale di Statistica (ISTAT). Elaborazione dei dati Per studiare le caratteristiche e la natura di un fenomeno si devono esaminare i dati osservando: – i loro rapporti statistici – la loro distribuzione – la loro variabilità. Distribuzione statistica Si definisce distribuzione statistica semplice, l’insieme dei dati relativi alle modalità con cui si presenta un singolo carattere. Gli “strumenti” che misurano la distribuzione statistica sono gli indici centrali: media, moda, mediana. Esse danno un’informazione parziale dell’effettiva natura di un fenomeno poiché non tengono conto della variabilità esistente tra i dati. Indici di dispersione Gli indici di dispersione misurano quanto i dati si discostino dal valore centrale – – – – – intervallo di variazione scarto assoluto scarto medio varianza scarto quadratico medio (o deviazione standard)