Titolo della lezione Introduzione Informazioni sul corso - 1 Obiettivi Nel corso verranno approfonditi gli argomenti relativi alla statistica descittiva di base e alla statistica inferenziale; particolare attenzione verrà dedicata alle indagini campionarie, che verranno analizzata nelle sue diverse fasi, dalla formazione del campione, alla investigazione delle unità statistiche, fino alla stima dei parametri di interesse e alla verifica di ipotesi sui parametri della popolazione. Informazioni sul corso - 2 Prima parte: Statistica descrittiva e modelli probabilistici Concetti introduttivi: la rilevazione dei fenomeni statistici. Distribuzione di un carattere e rappresentazione: distribuzioni di frequenza; frequenze relative e percentuali; rappresentazioni grafiche. Sintesi delle distribuzioni - le medie analitiche: moda; mediana; media aritmetica. Sintesi delle distribuzioni – la variabilità: varianza; scarto quadratico medio; indici relativi di variabilità; standardizzazione. Concetti di base della probabilità. Cenni sulle variabili casuali: le distribuzioni normale e t di student. Informazioni sul corso - 3 Prima parte: Statistica inferenziale Campionamento e distribuzioni campionarie. Teoria della stima - stima puntuale e per intervallo: intervallo di confidenza per la media aritmetica; intervallo di confidenza per una proporzione; determinazione della numerosità campionaria. La verifica di ipotesi statistiche: test parametrici per la media e per la proporzione. La verifica di ipotesi statistiche: cenni sui test non parametrici. Analisi dell’associazione tra caratteri: distribuzioni doppie; dipendenza, indipendenza, interdipendenza; misure dell’associazione per caratteri qualitativi e quantitativi: il Chiquadrato. Informazioni sul corso - 3 Modalità d’esame Esame orale Libro di testo Triola M. M., Triola M. F., Statistica per le discipline biosanitarie, Pearson-Addison Wesley. Altri testi consigliati Pagano M., Gauvreau K., (2003), Biostatistica, Idelson-Gnocchi, Napoli. Bland M. (2009), Statistica medica, Apogeo, Milano. Soliani L. (2005), Manuale di statistica per la ricerca e la professione (Statistica univariata e bivariata, parametrica e non parametrica per le discipline ambientali e biologiche), disponibile all’indirizzo internet: http://www.dsa.unipr.it/soliani/soliani.html. Contatti Per qualsiasi problema, comunicazione, consiglio, proposta, ecc …: Andrea Ciccarelli: [email protected] (Ma ditemi chi siete, Facoltà, CDL, che cosa vi serve, etc. (?!)) La Statistica - 1 Statistica vs Matematica Approccio diretto, semplice, poco formale Capire e non studiare (a memoria …) Necessità di spiegare le “funzioni” della statistica (per capire bene cosa andremo a fare ...) Necessità di imparare un linguaggio comune (essenziale non solo per “capirci” ma anche, come vedremo, per utilizzare le opportune metodologie quantitative) La Statistica - 2 Obiettivo della statistica è quello fornire informazioni di carattere quantitativo sugli aspetti economici, sociali, demografici, avendo come fine principale quello di approssimare la realtà. Non esistono informazioni “certe”, ma solo informazioni (se possibile …) di “buona qualità”, in termini di: a) corrispondenza tra l’informazione finale e l’aggregato che si vuole misurare; b) di classificazione e definizione degli aggregati stessi; c) di metodologie quantitative predisposte al fine di stimare gli aggregati; d) di modalità con le quali l’informazione viene resa fruibile per l’utente finale. La Statistica - 3 La statistica deve fornirci le necessarie metodologie quantitative che ci consentano di: Raccogliere le informazioni Descrivere le informazioni Sintetizzare Fornire indicazioni (tendenze) quantitative (e, dunque, oggettive) Statistica Descrittiva e Inferenziale Statistica Descrittiva La statistica descrittiva si occupa di descrivere e sintetizzare (con tabelle, grafici, indici sintetici, ecc..) le informazioni (qualitative e quantitative) relative ad un certo gruppo di “soggetti” al fine di far emergere caratteristiche, andamento e le eventuali relazioni che si verificano all’interno del fenomeno analizzato. Statistica Inferenziale La statistica inferenziale utilizza le informazioni raccolte da un’indagine campionaria e le “manipola” (grazie all’utilizzo di opportuni “modelli”) in modo da poter generalizzare le indicazioni tratte dal gruppo investigato a tutta la popolazione dal quale tale gruppo è stato estratto. Popolazione e Campione Popolazione Per popolazione si intende l’insieme di tutte le unità che compongono un collettivo. Sono esempi di popolazione: Tutti i cittadini italiani Tutti gli studenti dell’Università di Teramo Tutte i cavalli di una certa razza presenti in un territorio Tutti i cani presenti nei canili della regione Abruzzo Tutte le donne sposate con almeno un figlio Campione Una parte della popolazione (Deve avere “certe” caratteristiche …) Indagini censuarie e campionarie - 1 Indagine censuaria (o Totale) Effettuata su TUTTI i componenti della popolazione Indagine campionaria Effettuata solo su ALCUNI componenti della popolazione Pregi e difetti Esaustività Ricchezza informazioni Maggior dettaglio Costi elevati Lunghi tempi elaborazione Difficoltà a raggiungere tutti Qualità informazioni (?) Economicità Possibilità di ripetere le indagini continuamente nel tempo Indagini mirate in base ad esigenze anche improvvise Errore campionario Minor livello di dettaglio Titolo della lezione Distribuzione di un carattere e sua rappresentazione Le Distribuzioni Statistiche – Distribuzione Unitaria Esempio: indagine effettuata su 300 laureati di una certa università; distribuzione unitaria. Unità 1 2 3 4 5 6 7 8 9 10 Sesso M F F M F F M M M F Unità statistiche Età 24 25 24 27 29 24 25 27 26 26 Laurea Economia Economia Matematica Statistica Economia Statistica Matematica Statistica Economia Statistica Caratteri Voto 109 110 107 103 95 107 105 105 110 110 Componenti 2 5 3 4 3 6 4 3 2 4 Modalità Reddito 25.100 26.500 17.500 35.600 76.200 14.700 19.350 22.300 18.640 45.020 Le modalità del carattere Modalità Qualitative Non Ordinabili (Sconnesse) Non posso esprimere “preferenza” (Sesso, Laurea, ecc…) Ordinabili Posso esprimere “preferenza” (Titolo di studio, Gradi militari, Qualifica lavorativa, ecc…) Quantitative Discrete Numeri interi (senza decimali) Continue Numeri reali (decimali) Le frequenze Assolute (ni): rappresentano il numero di volte in cui una determinata modalità del carattere si presenta Relative (fi): sono date dal rapporto tra le frequenze assolute e la numerosità totale: fi = ni/N Percentuali (pi): sono date dal prodotto tra le frequenze relative e 100: pi = fi x 100. Le Distribuzioni Statistiche Le distribuzioni statistiche descrivono il modo in cui uno o più caratteri si manifestano (distribuiscono) in un dato collettivo. distribuzioni semplici (un solo carattere) distribuzioni doppie (due caratteri) distribuzioni multiple (molti caratteri) Si costruiscono associando ad ogni modalità il numero di volte in cui questa si è presentata Distribuzione di Frequenze – Esempio Esempio: indagine effettuata su 300 laureati di una certa università; distribuzione di frequenze. Unità 1 2 3 4 5 6 7 8 9 10 Sesso M F F M F F M M M F Xi Maschi Femmine ni 170 130 300 Distribuzione di Frequenze – 2 Esempio Unità 1 2 3 4 5 6 7 8 9 10 Laurea Economia Economia Matematica Statistica Economia Statistica Matematica Statistica Economia Statistica ni fi = n N1 = n 1 N 2 = N1 + n 2 Componenti 2 5 3 4 3 6 4 3 2 4 Xi Economia Statistica Matematica Xi 1 2 3 4 5 ni 120 100 80 300 ni 50 80 90 60 20 300 fi 0,400 0,333 0,267 1,000 Ni 50 130 220 280 300 N3 = N 2 + n 3 19 Le Distribuzioni doppie Unità 1 2 3 4 5 6 7 8 9 10 Laurea Economia Economia Matematica Statistica Economia Statistica Matematica Statistica Economia Statistica Sesso M F F M F F M M M F Economia Statistica Matematica M 75 35 60 170 F 45 65 20 130 20 Riferimenti sul testo di Triola M. M., Triola M. F. Statistica per le discipline biosanitarie, Pearson-Addison Wesley Paragrafi da studiare: 1.1, 1.2, 1.3, 2.1, 2.2. Esercizi alla fine dei paragrafi. Paragrafi da leggere: 2.3. Esercizi alla fine dei paragrafi. 21