Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2015/2016 Docente: Dott.ssa Rita Marras LEZIONE 1 – INTRODUZIONE Dopo aver esplicato alcuni concettibase e definizioni, ci concentreremo sulla predisposizione delle distribuzioni di frequenza e relativi grafici. Che cosa è la Statistica La Statistica può essere definita come un insieme di tecniche che hanno come scopo la conoscenza quantitativa dei fenomeni collettivi Operazioni tipiche delle analisi statistiche sono: il conteggio la classificazione la misurazione la sintesi tramite modelli esplicativi dei fenomeni reali Caratteri, unità statistiche, collettivo • Qualche definizione: – – – – unità statistica collettivo o popolazione carattere modalità del carattere • Vari tipi di collettivo: – di stato o di movimento – empirico o teorico – finito o infinito La rilevazione dei dati La raccolta delle informazioni può essere completa oppure parziale È completa quando si esaminano tutte le unità statistiche che compongono la popolazione oggetto di studio È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento Pregi: Pregi: • • • • • • Accuratezza delle stime anche a livelli territoriali molto spinti Ricchezza delle informazioni raccolte Esaustività Difetti: • • • Costo elevato Tempi di elaborazione dei dati molto lunghi Qualità dei dati non sempre elevata Continuità della rilevazione Economicità Indagini più mirate e approfondite Difetti: • • Riferimento territoriale non troppo spinto Variabilità campionaria Popolazioni e campioni Statistica descrittiva e inferenza La statistica descrittiva fornisce gli strumenti per sintetizzare ed esplicitare in modo corretto il modo in cui il fenomeno si è manifestato nel collettivo (popolazione) osservato Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione del collettivo (popolazione) osservato Sapere di che tipo è la variabile oggetto di studio è fondamentale, perché per ciascuna abbiamo analisi e indagini specifiche, che non sono applicabili (o sono comunque inadatte) alle altre. Nominali (Colore occhi, sesso, etc.) Qualitative Ordinali (Livello di un parametro, come il reddito o il dolore) Variabili Discrete ( Numero di figli o di capi di bestiame) Quantitative Continue ( Altezza, peso, etc.) Le distribuzioni statistiche Le distribuzioni statistiche descrivono il modo in cui uno o più caratteri si distribuiscono in un dato collettivo Un singolo carattere distribuzioni semplici Due caratteri distribuzioni doppie Più di due caratteri distribuzioni multiple L’elenco delle modalità osservate, unità per unità si chiama distribuzione unitaria Distribuzione unitaria multipla Unità Sesso Età Reddito Statura (cm) Colore degli occhi 1 Maschio 22 0.7 173 nero 2 Femmina 18 0.2 168 marrone 3 Femmina 34 1.6 165 marrone 4 Maschio 42 2.5 180 nero 5 Femmina 50 3.2 163 azzurro 6 Femmina 12 0.1 160 nero 7 Maschio 46 3.8 177 marrone 8 Maschio 72 1.3 164 verde 9 Femmina 27 1.2 158 azzurro 10 Femmina 48 1.7 170 nero 11 Femmina 35 1.9 167 nero 12 Maschio 84 0.8 159 marrone 13 Femmina 21 0.4 174 azzurro 14 Femmina 44 1.8 164 verde 15 Maschio 56 1.9 177 nero 16 Femmina 58 3.2 172 nero 17 Femmina 37 2.1 166 marrone 18 Femmina 16 0.1 160 marrone 19 Maschio 73 1.6 170 azzurro 20 Maschio 64 2.2 184 verde Distribuzioni di frequenze semplici Sesso freq. maschi 8 da 10 a 30 6 femmine 12 da 30 a 50 7 Totale 20 da 50 a 70 4 da 70 a 90 3 Totale 20 Colore degli occhi freq. Età Statura freq. freq. nero 7 da 150 a 160 2 marrone 6 da 160 a 170 9 azzurro 4 da 170 a 180 7 verde 3 da 180 a 190 2 Totale 20 Totale 20 Distribuzione di frequenze assolute • Frequenza assoluta nj numero di volte che la modalità di un carattere viene osservata nel collettivo (N) • Distribuzione di frequenze assolute associa alle modalità che può assumere un carattere X le corrispondenti frequenze assolute Frequenze relativa e percentuale • La frequenza relativa fj è la frazione di collettivo che presenta la modalità j-esima ossia fj nj N • La frequenza percentuale pj è uguale alla frequenza relativa moltiplicata per 100 Esempi: distribuzione unitaria, assoluta, relativa, percentuale Distribuzione unitaria per il sesso Unità Sesso 1 M 2 F 3 4 5 … … F M F … … Distribuzione frequenza assoluta Sesso Frequenza relativa Frequenza percentuale (%) Sesso Frequenza assoluta M 8 M 0,4 40,0 F 12 F 0,6 60,0 Totale 20 Totale 1 100,0 Frequenza cumulata La frequenza cumulata di una classe è data dalla somma della frequenza della classe con quella delle classi precedenti j Frequenza assoluta cumulata: Nj ni i1 j Frequenza relativa cumulata: Fj fi i1 Esempi: frequenze Titolo di studio Frequenza assoluta Frequenza assoluta cumulata Media 3 3 Diploma 6 Laurea 11 Totale 20 Frequenza relativa Frequenza relativa percentuale Frequenza relativa cumulata Frequenza percentuale cumulata 0,15 15 0,15 15 9 0,30 30 0,45 45 20 0,55 55 1,00 100 1,00 100 Rappresentazioni grafiche delle distribuzioni semplici • Grafici a barre o a nastri 4. 000 • Grafici ad aree 3. 500 3. 000 2. 500 2. 000 1. 500 1. 000 500 0 19 9 5 • Istogramma • Grafici a torta Gen. 50 Dic. Feb. 40 30 Nov. • Grafici a radar Mar. 20 10 0 Ott. Apr. Set. Mag. Ago. Giu. Lug. • Cartogramma • Diagramma 1995 1996 1997 1998 1999 2000 2001 19 9 6 19 9 7 19 9 8 19 9 9 2000 2001