Statistica descrittiva Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 1 = Cos ’è la Statis tica? • Analisi e inter pr etaz ione dei dati attr aver so concetti e str umenti di tipo matematico. contesto Scelta dei dati astr az ione contesto Metodologia statistica Inter pr etaz ione Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 2 1 T ipi di dati • NOMINALE ( n o oper az ion i , n o con f r on t i ) • ORDINALE ( n o oper az i on i, s ì con f r on t i ) • RAPPORTO ( s ì oper az ion i s om m a/ di f f er en z a, s ì con f r on t i - z er o var i abi le) • INTERVALLARE ( s ì oper az ion i , s ì con f r on t i z er o f is s o) Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 3 Il campionamento S tatis tico Uno dei principi base della statistica è il seguente: è possibile caratterizzare un insieme di dati (popolazione) ispezionandone Un piccolo sottoinsieme scelto in maniera casuale (campione). Test Caratterizzare la popolazione ? DATI Metodi statistici Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 INFERENZA Popolazione incognita 4 2 IST OGRAMMA Esempio: costruire un istogramma per visualizzare le anomalie verificatesi nella produzione di un certo tipo di blocchetto metallico. 3 . 56 3 . 48 3 . 46 3 . 56 3 . 48 3 . 50 3 . 50 3 . 52 3 . 42 3 . 47 3 . 43 3 . 48 3 . 52 3 . 46 3 . 49 3 . 50 3 . 44 3 . 56 3 . 50 3.38 3 . 41 3 . 55 3.48 3.59 3 . 37 3 . 52 3 . 48 3 . 63 3 . 47 3 . 44 3 . 32 3 . 59 3 . 49 3 . 50 3 . 40 3 . 47 3.45 3.45 3 . 52 3 . 38 3.44 3.44 3 . 34 3 . 52 3.49 3.46 3 . 43 3 . 48 3.46 3.52 3.30 3.31 3.46 3.46 3.46 3.46 3.40 3.48 3 . 52 3 . 41 3 . 54 3 . 50 3.48 3 . 45 3 . 46 3 . 56 3.46 3 . 34 3 . 51 3 . 48 3 . 50 3 . 52 3.45 3.46 3 . 44 3 . 47 3 . 50 3 . 46 3.54 3 . 47 3.50 3.48 3 . 46 3 . 45 3 .68 3 . 60 3.46 3 . 46 3.52 3.48 3 . 49 3 . 48 3 . 54 3.52 3.56 3.41 3 . 47 3 . 48 3.54 3 . 41 S CE L T A DE L L E CL AS S I AP P R OPR IAT A Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 t ro Al 5 67 3, 5 57 5 3, 47 3, 5 3 1 1 40 30 20 10 0 37 32 38 10 Frequenz a 5 3 3 9 3, 3 . 275 − 3 . 325 3 . 325 − 3 . 375 3 . 375 − 3 . 425 3 . 425 − 3 . 475 3 . 475 − 3 . 525 3 . 525 − 3 . 575 3 . 575 − 3 . 625 3 . 625 − 3 . 675 3 . 675 − 3 . 725 27 Freq.assolute 3, Classi 5 Fornisce una stima della “legge di probabilità” che descrive una caratteristica della popolazione. Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 6 3 Quali s ono le caratteris tiche del prodotto? Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 7 o lt r A 5 5 5 67 3, 57 3, 47 3, 37 5 Diagr amma di fr equenz a 3, F requenz a Percentuali La differ enz a tr a fr equenz a e per centuale 0,4 0,3 0,2 0,1 0 3,2 75 3,3 25 3,3 75 3,4 25 3,4 75 3,5 25 3,5 75 3,6 25 3,6 75 3,7 25 A lt ro 3, 27 5 40 30 20 10 0 tro 40 30 20 10 0 3, 27 5 3, 37 5 3, 47 5 3, 57 5 3, 67 5 • E’ possibile costruire una legge generale per il procedimento di costruzione dei blocchetti? Frequenza Al • Qual è lo spessore più frequente dei blocchetti? • Quanto è grande la dispersione? • Ha un solo massimo? • La distribuzione è simmetrica o asimmetrica? • C’è un evidente andamento? Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 8 4 Distribuzione Cumulativ a tr o 5 Al 72 5 3, 67 5 3, 62 5 3, 57 5 3, 52 5 3, 5 47 3, 3, 42 5 5 37 3, 32 3, 3, 27 5 1 0 ,8 0 ,6 0 ,4 0 ,2 0 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 9 I diagrammi a torta L’area di ogni fetta rappresenta la frequenza relativa di occorrenza dei dati nelle classi. F requenz a 3,275 3,325 3,375 3,425 3,475 3,525 3,575 3,625 3,675 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 10 5 Grafici di s erie s toriche (o temporali) Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 11 Indici delle distr ibuz ioni di fr equenz a Posiz ione Più a s inis tr a Più a destr a Var iabilità Meno var iabile più var iabile Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 12 6 Simmetr ia Asimmetr ica simmetr ica Coda sinistr a Coda destra Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 13 La moda Dato cui cor r isponde la fr equenz a più alta. A lberghi di A ssisi per categoria 40 35 30 25 freq 20 15 10 5 0 Freq.m odale 1 stella m oda 2 stelle 3 stelle 4 stelle categoria Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 14 7 La mediana Dato che è più gr ande del 50% delle osser vaz ioni e più piccola del 50% delle osser vaz ioni D istribuzione per titolo distudio 25 60 50 20 40 15 30 10 20 5 10 0 0 Analfa Alfabe Elem en D iplom M edia Laurea beti ti tari a frequenza 1 9 20 12 6 1 cum ulata 1 10 30 42 48 49 m ediana Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 1 n µ = ∑ xi n i =1 La media 18 16 14 Non r isente delle code 16 simmetr ia 12 10 8 6 15 14 12 10 8 6 4 2 0 4 2 -4 -3 -2 -1 0 1 2 M e=M 3 0 4 -4 20 18 16 14 12 10 8 6 4 2 0 -3 -2 -1 0 1 2 3 M e M 1<M 2 4 5 25 20 15 10 5 0 -4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 M e<M 1 M <M e 2 3 4 16 8 Quantili e Per centili p ∈ (0,1) x p : P{X ≤ x p }= F ( x p ) = p 0,2 1 0,18 0,9 0,16 0,8 Pr(X <=xp) 0,14 0,12 0,7 0,6 0,1 F(x) 0,5 0,08 0,4 p 0,06 0,3 0,04 0,2 0,02 0 0 2 4 xp 6 1-p 8 0,1 0 10 12 14 16 18 0 2 4 6 8 10 12 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 14 16 18 17 Indicator i elementar i di var iabilità • Campo di var iaz ione (r ange): R= x(1)-x(n) • Differ enz a inter quar tile:D I=Q 3-Q 1 50% x(1) Q1 Q3 Campo di var iaz ione Diff er enza inter quar tile x(n) Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 18 9 Var ianz a e scar to quadr atico medio xi-m m xi 2 1 n 2 s = ∑ (xi − m ) ⇒ s = n i =1 2 1 n ∑ (xi − m) n i =1 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 19 As immetr ia 3RVLWLYD 1HJDWLYD 1XOOD distribuzione con coda destra distribuzione con coda sinistra distribuzione con due code equi-pesanti Cur tos i positiva nulla negativa Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 20 10 S T AT IS T ICA DE S CR IT T IVA DA E XCE L Colonna1 Media Errore standard Mediana Moda Deviazione standard Varianza campionaria Curtosi Asimmetria Intervallo Minimo Massimo Somma Conteggio 3,4764 0,006279 3,48 3,46 0,062789 0,003942 1,550284 -0,10859 0,38 3,3 3,68 347,64 100 Statistica descrittiva - Probabilità e Statistica I a.a. 04/05 21 11