Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di produzione dei dati ad opera delle fonti statistiche nazionali e internazionali interpretare e analizzare in senso critico tali informazioni, organizzate sempre più spesso in banche dati di grandi dimensioni disponibili on-line Alla fine del corso lo studente avrà acquisito: le conoscenze necessarie per l'individuazione delle fonti statistiche adeguate ai propri bisogni conoscitivi le competenze per l'uso e la rielaborazione dei prodotti statistici nell'ambito di un proprio progetto di indagine, in cui le statistiche diventano indicatori di fenomeni semplici e complessi Pagina 1 Analisi dei dati Obiettivo: fornire concetti e strumenti utili per evidenziare gli aspetti salienti dell’informazione disponibile e per quantificare la forza dei suggerimenti che da essi si possono ragionevolmente trarre Informazione espressa in forma quantitativa Dati Fornisce regole, strumenti e tecniche che consentono la raccolta e l’analisi quantitativa delle caratteristiche dei fenomeni collettivi L’ Analisi dei Dati si avvale delle tecniche proprie della Statistica Pagina 2 1 Statistica Definizione: Metodologia che ha come scopo la conoscenza quantitativa dei fenomeni collettivi, ossia dei fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali Fenomeni collettivi Relativi ad una collettività di casi singoli Relativi ad una collettività di osservazioni di un solo caso o fenomeno Pagina 3 I fenomeni collettivi I fenomeni esistenti in natura sono descritti da uno o più caratteristiche. I fenomeni che si conoscono attraverso una molteplicità di manifestazioni vengono definiti fenomeni collettivi. Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono formalmente denominate caratteri o variabili statistiche. Esempio: il fenomeno clima può essere delineato e descritto mediante: la temperatura, le precipitazioni, il vento al suolo, il soleggiamento,… Tali caratteristiche costituiscono i diversi aspetti con cui si palesa il clima, ossia gli elementi meteoritici che ci permettono di definire il clima di una regione in un certo istante, o in un intervallo di tempo, e che si manifestano in un’ampia gamma di modi differenti Pagina 4 2 I fenomeni collettivi semplici o complessi Sono fenomeni collettivi semplici quelli completamente delineati attraverso un unico carattere Es. Il fenomeno statura degli individui è completamente descritto dal carattere che misura la distanza verticale tra il piano d’appoggio dei piedi e il sommo del cranio quando l’individuo si trova in massima estensione Sono fenomeni collettivi complessi o multivariati quelli descritti da più caratteri Es. Il fenomeno consumo non alimentare delle famiglie è collettivo multivariato dato che è caratterizzato da molte caratteristiche tra le quali (espresse in quantità di spesa in euro): vestiario, calzature, servizi sanitari, abitazioni, combustibili ed elettricità, mobili, trasporti, istruzione, spettacoli,… Pagina 5 Perché l’analisi statistica Consente di esplorare i dati al fine di: descrivere in forma sintetica le informazioni Approccio esplorativo Approccio confermativo evidenziare la struttura di relazioni implicite (pattern) ricavare modelli interpretativi/predittivi della realtà verificare poche ipotesi formulate prima della rilevazione dei dati Pagina 6 3 …Senza Statistica Impressioni qualitative dei fenomeni Statura M > Statura F Buone condizioni sanitarie diminuiscono la mortalità Errori Osservazione di una parte del fenomeno • Proporzione nei sessi degli animali • Per ogni maschio indiano 10 femmine Impressione distorta • Nascono + femmine che maschi Pagina 7 Metodologia Statistica La metodologia statistica viene suddivisa tradizionalmente in due branche, strettamente collegate Statistica descrittiva indicatori statistici per riassumere realtà complesse Statistica inferenziale generalizzazione di risultati a partire dal dato empirico allo scopo di fornire affermazioni valide anche per fenomeni che non sono stati osservati nel loro complesso Pagina 8 4 Il dato statistico E’ una informazione qualitativa o quantitativa su una caratteristica posseduta da un elemento oggetto di rilevazione e/o misurazione E’ il risultato di un'operazione di misurazione/rilevazione del modo con cui una caratteristica è presente su un elemento E’ la base di ogni ricerca ed è quindi della massima importanza che sia “affidabile” Pagina 9 I dati statistici Carattere Statistico: una delle possibili manifestazioni del fenomeno e quindi è una caratteristica da studiare; viene osservata (o rilevata) sulle u.s. Unità Statistica: entità, unità elementare, che presenta le caratteristiche oggetto di studio Popolazione: insieme di u.s. omogenee rispetto ad 1 o più caratteristiche Finita aziende esistenti in una certa area in un determinato periodo Infinita (collettivo reale) pezzi producibili da una fabbrica a ciclo continuo Indefinita (collettivo virtuale o teorico) potenziali malati di un certa patologia Pagina 10 5 Unità statistica E’ un’entità reale (persona, animale, oggetto, territorio) o virtuale (evento) suscettibile di misura che presenta le caratteristiche oggetto di studio Non è necessariamente una persona fisica • Es: nello studio del fenomeno «vendita di quotidiani» le unità statistiche di riferimento potrebbero essere sono le diverse Testate • Es: nello studio delle Imprese che producono automobili le unità statistiche di riferimento sono le imprese Non è necessariamente rappresentata da un singolo elemento • Es: nello studio del fenomeno relativo al consumo delle famiglie, l’unità statistica di riferimento è la famiglia e quindi un insieme di individui Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo Pagina 11 Caratteri statistici Osservare i caratteri sulle u.s. significa attribuire a tali u.s. una modalità secondo determinate regole e con certi contenuti u x x rappresenta la modalità del carattere X associata all’u.s. u Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una sola modalità Pagina 12 6 La struttura dei dati 1 Carattere Qualitativo (mutabile statistica) Unità statistica Osservazione di uno o più caratteri 2 Carattere Quantitativo (variabile statistica) Collettivo statistico Pagina 13 L’indagine statistica Obiettivo: conoscenza di una popolazione intesa come insieme di unità statistiche su cui si manifesta il fenomeno da studiare Fasi Piano di Rilevazione Raccolta dati Classificazione e spoglio dei dati Elaborazione dei dati Interpretazione dei risultati Analisi dei dati Pagina 14 7 Piano di rilevazione Obiettivo: definizione del problema da analizzare in tutti i suoi aspetti Gli aspetti specifici da affrontare riguardano sostanzialmente: il collettivo oggetto di studio le caratteristiche di interesse Scelta metodo di rilevazione Diretto Censimento Campione Tecnica: Capi, Cati, Ind. Postale Indiretto Base dati Lista Completa Esatta Aggiornata Epoca rilevazione Definizione questionario Def. strumenti e modalità diffusione risultati Tempi e costi Pagina 15 Rilevazione censuaria Per indagine censuaria o totale si intende una rilevazione di tutte le unità (universo o popolazione target) che presentano le caratteristiche che si intendono studiare Esempio: i censimenti e le indagini in cui la popolazione target è costituita da poche unità molto importanti (perché caratteristiche) Vantaggi misure esatte Svantaggi alti costi di rilevazione e trattamento dei dati possibile incompletezza dovuta all’incapacità materiale di raggiungere tutte le singole unità Pagina 16 8 Indagini campionarie Alla luce di questi problemi si ricorre spesso alle indagini campionarie anche se questo implica minor precisione Notevole risparmio di mezzi, e più in generale un minor impiego di risorse materiali e umane accrescere il numero delle indagini abbreviare la cadenza di quelle periodiche maggiore tempestività Pagina 17 Classificazione dei caratteri Carattere Qualitativo (Mutabile Statistica): modalità espresse da attributi • Genere, Stato civile, Sett. di attività econ., Titolo di studio, Grado militare Carattere Quantitativo (Variabile Statistica): modalità espresse da numeri Discreto: numero finito, o numerabile, di modalità • Num. di figli, Num. di pezzi prodotti Continuo: numero infinito di modalità • Peso, Altezza, Reddito Pagina 18 9 Misurazione dei caratteri Carattere qualitativo Scala nominale o Mutabile Sconnessa Se date due sue modalità è possibile affermare solo se queste sono uguali o diverse Nessun ordine tra le modalità Sesso, Stato civile, Sett. attività econ. Scala Ordinale o Mutabile Ordinata Esiste un ordine naturale tra le modalità se date due sue modalità è possibile affermare se queste sono uguali e stabilire un ordinamento oggettivo, specificando quale precede l’altra Mutabili rettilinee: Tit. studio, Grado militare Mutabili cicliche: Mese di nascita, Giorno della settimana di nascita Pagina 19 …continua Caratteri quantitativi: esiste un’unità di misura delle modalità numeriche Variabile a scala di intervalli non esiste uno zero assoluto, naturale e non arbitrario Operazioni = o e > o < e distanza Temperatura, Q.I. Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni = o e > o < , distanza e rapporto Nati, Morti, Pezzi prodotti, Reddito, Peso Pagina 20 10 In sintesi Carattere Qualitativo Nominale Luogo di nascita Genere Colore capelli Stato civile Nazionalità Religione Professione Tipo maturità Quantitativo Ordinale Anno di corso Grado militare Ceto sociale Anno di nascita Titolo studio Mese di nascita Giorno settimana di nascita Discreto Numero fratelli Num. pezzi prodotti Num. macchine possedute Voto diploma Q.I. Continuo Statura Peso Età Reddito prodotto Temperatura Longitudine Latitudine Pagina 21 Classificazione gerarchica SCALA DI RAPPORTI Modalità numeriche con unità di misura e zero naturale SCALA DI INTERVALLO Modalità numeriche con unità di misura e origine arbitraria ORDINALE Modalità con ordinamento NOMINALE Modalità senza ordinamento Potenzialmente tutti i caratteri Pagina 22 11