Campus di Arcavacata Università della Calabria Corso di statistica ARCAVACATA a.a 2009-2010 1 INDIRIZZO E-MAIL: [email protected] Statistica a) Insieme di metodi finalizzati allo studio (mediante l’analisi) di fenomeni reali b) Metodologia strumentale per l’analisi della realtà allo scopo di trarre leggi e regole generali per obiettivi predefiniti (Scienza o metodo?) c) Scienza delle decisioni in condizioni di incertezza …… in altre parole “La statistica riguarda tutte le “operazioni” che rientrano in un processo di indagine finalizzato all’accrescimento della conoscenza “. Perché l’indagine statistica? 3 obiettivi informazioni Metodi statistici risultati 4 Indagine Statistica Fasi 1. Definizione degli obiettivi (generali, parziali) in funzione dei vincoli (di tempo, di costo) 2. Raccolta (Rilevazione) dei dati a) Dati derivanti da misurazioni, da questionario, da basi di dati b) Rilevazioni semplici o complesse 5 Elaborazione dei dati Memorizzazione Codifica/Ricodifica Analisi statistica Descrittiva/Inferenziale, Univariata/Multivariata Presentazione dei risultati Riformulazione delle ipotesi di ricerca / Ridefinizione degli obiettivi 6 TERMINOLOGIA Rilevazioni statistiche Complesso delle operazioni rivolte ad acquisire una o più informazioni su un insieme di elementi (caratteri) oggetto di studio. Caratteristiche: - semplici/complesse - derivanti da risposte o da misure - globali (censimenti) / parziali (rilevazioni campionarie) Unità statistica: entità su cui viene condotta la rilevazione statistica Popolazione: insieme di tutte le unità statistiche facenti parte di un collettivo di riferimento Campione: sottoinsieme della popolazione 7 I Caratteri Statistici Insieme di fenomeni oggetto di studio riguardanti le caratteristiche che differenziano tra loro le unità statistiche L’espressione del carattere nelle unità statistiche si denomina modalità o intensità Tipologie a) Caratteri quantitativi (VARIABILI): assumono intensità rappresentate da numeri reali • Variabili continue • Variabili discrete b) Caratteri qualitativi (MUTABILI): assumono modalità rappresentate da attributi non numerici • Nominali • Ordinali • Dicotomici Tutti i caratteri possono essere resi dicotomici 8 Tipi di caratteri ed operazioni possibili Tipo di carattere QUANTITATIVI QUALITATIVI Nominale Esempi Operazioni possibili "stato civile", uguaglianza/disuguaglianza "zona di redidenza" Ordinale "titolo di studio", "professione" uguaglianza/disuguaglianza ordinamento Dicotomico "genere", "condizione occupazionale" uguaglianza/disuguaglianza Discreto "numero di componenti il nucleo familiare", "numero di esami sostenuti" uguaglianza/disuguaglianza ordinamento calcolo di indicatori numerici Continuo "reddito", "temperatura" uguaglianza/disuguaglianza ordinamento calcolo di indicatori numerici 9 Cosa si studia al corso di Statistica 1? I. Statistica descrittiva: Distribuzioni di frequenza Rappresentazioni grafiche Indici di posizione, variabilità e forma Omogeneità ed eterogeneità Relazioni statistiche (connessione, indipendenza in media, correlazione) II. Statistica Inferenziale: Probabilità Variabili Casuali Modelli per variabili casuali 10 La matrice (50 unità statistiche, 9 caratteri) FATT SM AZIENDA I c e P a c k a g i n g1 0 2 1 Agricola Italiana Alimentari 109 Alimentare Antonio Amato & C. 233 Alimentare Argel 199 Alimentare Bauli 354 Health Care Beiersdorf Ice Packaging 145 Bertana 467 Bevande Birra Peroni Industriale 177 Alimentare C. & V. Zuegg 161 Alimentare Cameo 158 Health Care Cartiera Lucchese Ice Packaging 115 Centrale del Latte Firenze Ice Packaging 108 Centrale del Latte Milano 1444 Alimentare Cirio Polenghi De Rica 493 Health Care Colgate Palmolive Ice Packaging 185 Cooperlat Ice Packaging 285 Danone 242 Bevande Davide Campari 386 Alimentare Dolma 981 Alimentare Eridania Zuccherifici 105 Alimentare Eurico Italia 103 Bevande F.lli Averna I c e P a c k a g i n g2 0 1 2 Galbani 104 Alimentare Gelati Sanson Ice Packaging 521 Granarolo Felsinea 131 Health Care Hatù 129 Alimentare Illy Caffè 138 Alimentare Italkali 228 Health Care Johnson Wax Ice Packaging 457 Kraft Gen. Foods-Proc. Meats Ice Packaging 163 Latteria Soresinese 103 Alimentare Lindt e Sprungli 308 Alimentare Massalombarda Colombani 609 Health Care Mira Lanza Ice Packaging 142 Montorsi Blasi Ice Packaging 189 Montorsi Francesco 107 Alimentare Oleificio Zucchi 130 Health Care Paglieri Ice Packaging 354 Pavo 593 Alimentare Perfetti 604 ealth Care H. L. & C Procter & Gamble div 324 Alimentare Progeo 149 Health Care Reckitt & Colman 430 Alimentare S.f.i.r. 323 Alimentare San Carlo 181 Health Care Sara Lee De Italy 443 Health Care Scott 378 Alimentare Trinity Alimentari Ice Packaging 228 Unicarni 157 Health Care Unikay 122 Alimentare Unione Laboratori FATEST 12% 10% 4% 10% 50% 7% 5% 10% 14% 35% 0% 0% 18% 13% 15% 12% 45% 12% 45% 90% 10% 12% 10% 5% 0% 27% 6% 4% 20% 13% 12% 20% 29% 19% 20% 18% 5% 10% 3% 25% 11% 0% 5% 1% 7% 0% 10% 10% 8% 0% ADD94 2600 292 323 1320 640 135 1176 225 326 378 192 385 1477 933 208 678 576 205 2001 2664 136 6266 285 294 445 206 813 205 1410 273 566 893 783 264 236 92 273 98 614 1390 503 119 551 293 343 964 608 167 396 517 NSTAB 6 2 2 1 2 1 4 2 2 2 3 1 3 1 3 1 5 1 11 1 1 8 1 8 1 1 6 0 3 1 1 4 2 4 5 1 2 1 4 4 2 0 4 7 2 3 2 1 3 2 NPF 2500 500 332 335 1200 50 137 150 260 350 150 60 270 250 800 106 600 500 30 1700 30 300 150 650 2500 100 250 150 450 300 800 500 260 277 1375 310 1300 300 200 70 280 170 10 158 350 280 90 450 260 810 NMP 250 10 1200 1940 1861 25 257 600 650 150 15 25 500 500 200 600 4000 20 0 160 190 2500 1200 420 2000 195 500 1599 1000 120 5000 200 861 947 1619 350 10000 100 1000 1000 135 135 15 20 2800 390 14 150 20 1440 NCLIENT 10000 20000 30000 11000 16000 600 2000 3000 2000 11700 6000 2000 20000 1200 16600 45000 80000 12000 400 3000 20000 100000 23000 28000 18000 17500 20000 1350 8500 3500 18000 7000 1200 17400 9925 730 8000 12000 143000 1200 3000 4300 500 200000 2500 4000 1300 1500 2000 11900 NFORN 200 60 130 317 2900 200 130 1000 770 990 1000 200 100 60 130 1200 800 2040 1200 10000 200 5080 300 1400 500 153 35 220 650 150 1700 960 1980 1800 1900 61 1000 1190 25 30 100 30 2100 100 150 560 1880 1200 10 1160 Un campione di 50 aziende appartenenti alle imprese produttrici di beni di largo consumo. Rif.: M. Caputo (a cura di) Organizzare la logistica per l’Efficient Consumer 11 Response, CEDAM, 1998 Legenda dei caratteri considerati: SM FATT FATEST ADD94 NSTAB NPF NMP NCLIENT NFORN Settore Merceologico Fatturato (in miliari di lire) Percentuale fatturato per vendite all’estero Numero Addetti Numero Stabilimenti Numero codici Prodotti Finiti Numero codici Materie Prime Numero Clienti Numero Fornitori Obiettivo: Descrivere i dati costruendo distribuzioni di frequenza ed “opportune” rappresentazioni grafiche 12 Tipologia di caratteri osservati: SM Settore Merceologico FATT Fatturato FATEST Percentuale fatturato per vendite all’estero ADD94 Numero Addetti NSTAB NMP Numero Stabilimenti Numero codici Prodotti Finiti Numero codici Materie Prime NCLIENT Numero Clienti NFORN Numero Fornitori NPF Qualitativo Nominale Quantitativo Continuo Quantitativo Continuo Quantitativo Discreto Quantitativo Discreto Quantitativo Discreto Quantitativo Discreto Quantitativo Discreto Quantitativo Discreto Per costruire la distribuzione di frequenza dei caratteri osservati per le aziende incluse nel campione bisogna contare, per ciascun carattere, quante volte si presenta ciascuna modalità/intensità. 13 Carattere qualitativo nominale SETTORE MERCEOLOGICO Caratterizzazione della mutabile Modalità Abbreviazione Alimentare A Health Care H Ice Packaging I Bevande B Significato Drogheria Food, Petfood Cura della persona,cura e pulizia della casa Deperibili, Surgelati, Congelati, Gelati Beverage 14 La successione delle modalità è la seguente: I,A,A,A,H,I,B,A,A,H,I,I,A,H,I,I,B,A ,A,A,B,I,A,I,H,A,A,H,I,I,A,A,H,I,I, A,H,I,A,H,A,H,A,A,H,H,A,I,H,A Sono stati riportati i settori merceologici elencati nella prima colonna della matrice dei dati sostituendo l’abbreviazione alla dicitura per esteso. 15 In simboli: Distribuzione di frequenza Freque Frequenza nza Modalità relativa assoluta Ice Packaging 14 0,28 Alimentare 21 0,42 Health Care 12 0,24 Bevande 3 0,06 Totale 50 1,00 X Carattere osservato n Numero di unità statistiche k Numero di xi ni fi modalità/intensità di X i-esima modalità/intensità di X Frequenza assoluta della i-esima modalità xi Frequenza relativa della i-esima modalità xi f i ni X ni x1 n1 f1 x2 n2 f2 xi ni fi xk nk fk Totale n 1 n 16 Distribuzione di frequenza n1 n2 I) k i 1 II ) f1 f 2 k i 1 fi 1 ni x1 n1 f1 x2 n2 f2 xi ni fi xk nk fk Totale n 1 ni 1 ni ni 1 ni n f i ni X n nk 1 nk ,k i 1, 2, 0 ni n f i 1 f i f i 1 f k 1 f k ,k i 1, 2, 0 fi 1 17 Carattere qualitativo nominale: Rappresentazioni grafiche Diagramma a barre Frequenze assolute Distribuz ione delle az iende per settore merceologico (frequenz e assolute) 25 20 15 10 5 0 Alimentare Health Care Ice Packaging Bevande N.B. E’ possibile costruire il diagramma a barre riportando in ordinata le frequenze assolute OPPURE le frequenze relative, la forma della rappresentazione risulta invariata. Frequenza relative Distribuzione delle aziende per settore merceologico (frequenze relative) 0.5 0.4 0.3 0.2 0.1 0 Alimentare Health Care Ice Packaging Bevande 18 Carattere qualitativo nominale: Rappresentazioni Grafico a torta grafiche Dis tr ibuzione de lle azie nde pe r s e ttor e m e r ce ologico (fr e que nze as s olute ) 6% 28% 42% 24% A limentare Health Care Ice Packaging Bevande Carattere quantitativo discreto NUMERO DI STABILIMENTI La successione delle intensità osservate è la seguente: 6,2,2,1,2,1,4,2,2,2,3,1,3,1,3,1,5 ,1,11,1,1,8,1,8,1,1,6,0,3,1,1,4,2 ,4,5,1,2,1,4,4,2,0,4,7,2,3,2,1,3, 2 19 Distribuzione di frequenza Intensità Frequenza assoluta xi 0 1 2 3 4 5 6 7 8 11 Totale ni 2 16 12 6 6 2 2 1 2 1 50 Frequenza relativa ni n fi 0,04 0,32 0,24 0,12 0,12 0,04 0,04 0,02 0,04 0,02 1,00 Frequenza relativa cumulata Fi i fl l 1 0,04 0,36 0,60 0,72 0,84 0,88 0,92 0,94 0,98 1,00 Frequenza relativa cumulata: somma delle frequenze relative fino alla i-esima intensità. Si può calcolare per ogni tipo di distribuzione di frequenza. F1 Fk 1 l 1 k f l f1 ; F2 2 f l f1 f 2 ; l 1 f l f1 f 2 fi f k 1; l 1 N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi 20 Rappresentazioni grafiche del carattere “Numero di stabilimenti” Frequenza assoluta Distribuz ione delle az iende per numero di stabilimenti (frequenz e assolute) 20 15 10 5 0 0 1 2 3 4 5 6 7 8 11 8 11 Numero di stabilimenti Distribuz ione delle az iende per numero di stabilimenti (frequenz e relative) Frequenza relativa 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 Nume ro di sta bilime nti Distribuzione delle aziende per numero di stabilimenti 2,0% 4,0% 2,0% 4,0% 4,0% 4,0% 32,0% 12,0% 12,0% 24,0% 0 1 2 3 4 5 6 7 8 11 21 Suddivisione in classi Le intensità di un carattere quantitativo discreto possono essere anche suddivise in classi, per cui si può considerare una distribuzione di frequenza tenendo conto delle classi di intensità I possibili criteri di raggruppamento di una distribuzione in classi di intensità sono: 1.Classi equiampie 2.Classi di diversa ampiezza e diversa frequenza CLASSI EQUIAMPIE Fasi: 1.Si ordinano le intensità del carattere osservato in senso non decrescente 2.Si fissa il numero delle classi k 3.Si calcola l’ampiezza delle classi d attraverso il rapporto: d xmax xmin k in cui xmax ed xmin rappresentano il valore massimo ed il valore minimo della distribuzione le cui intensità devono essere suddivise in classi 4.Si costruisce la distribuzione di frequenza 22 Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi equiampie Fissiamo k=5 per la suddivisione in classi della variabile numero di stabilimenti. L’ampiezza delle classi sarà data da: d 11 0 2, 20 2, 00 5 Trattandosi di un carattere quantitativo discreto è possibile approssimare per difetto 2,20 e quindi considerare classi di ampiezza 2. Le classi saranno: 0 xi 2, Prima classe 2 < xi 4, Seconda Classe 4 < xi 6, Terza Classe 6 < xi 8 Quarta Classe 8 < xi 11 Quinta Classe 23 Carattere “N. di distribuzione in classi stabilimenti”: costruzione della La successione ordinata delle intensità osservate è la seguente: 0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2, 2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4, 4,4,4,4,5,5,6,6,7,8,8, 11 La distribuzione in classi equiampie della variabile numero di stabilimenti risulta: Classi xi xl xi 1 0 |--| 2 2 --| 4 4 --| 6 6 --| 8 8 --| 11 Totale Frequenza assoluta ni 30 12 4 3 1 50 Frequenza relativa fi n i n 0,60 0,24 0,08 0,06 0,02 1,00 Frequenza relativa cumulata Fi i fl l 1 0,60 0,84 0,92 0,98 1,00 N.B. Valgono tutte le altre proprietà viste per le distribuzioni di frequenza dei caratteri qualitativi e quantitativi discreti 24 CLASSI DI DIVERSA AMPIEZZA E FREQUENZA Fasi: 1.Si ordinano le modalità del carattere osservato in senso non decrescente 2.Si fissano il numero delle classi k e le loro ampiezze di 3.Si costruisce la distribuzione di frequenza Carattere “N. di stabilimenti”: suddivisione delle intensità in 5 classi di diversa ampiezza e frequenza Si immagini che, per motivi di convenienza, fissano le seguenti classi di intensità: 0 xi 1, Prima classe 1 < xi 3, Seconda Classe 3 < xi 5, Terza Classe 5 < xi 7 Quarta Classe 7 < xi 11 Quinta Classe si 25 Considerando ancora la successione ordinata delle intensità: 0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2, 2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4, 4,4,4,4,5,5,6,6,7,8,8,11 Classi xi xl xi 1 Freq. assoluta ni Freq. relativa fi ni n Frequenza relativa cumulata Fi i fl l 1 0 |--| 1 1 --| 3 3 --| 5 5 --| 7 7 --| 11 Totale 18 18 8 3 3 50 0,36 0,36 0,16 0,06 0,06 1,00 0,36 0,72 0,88 0,94 1,00 26 Distribuzioni di frequenza per caratteri quantitativi continui Poiché i caratteri quantitativi continui spesso presentano un numero elevatissimo di diverse intensità, si ricorre quasi sempre al raggruppamento delle intensità in classi. I possibili criteri di raggruppamento di una distribuzione in classi sono: 1.Classi equiampie 2.Classi equifrequenti 3.Classi di diversa ampiezza e diversa frequenza I criteri 1 e 3 sono uguali al caso della suddivisione in classi di un carattere quantitativo discreto. CLASSI EQUIFREQUENTI Fasi: 1.Si ordinano le intensità del carattere osservato in senso non decrescente 2.Si fissa la frequenza da assegnare ad ogni classe ni 3.Si determinano gli estremi delle classi a partire dalla distribuzione ordinata della intensità 4.Si costruisce la distribuzione di frequenza 27 Carattere quantitativo continuo FATTURATO Si ipotizzi di voler determinare una distribuzione in classi in cui ogni classe ha una frequenza assoluta pari a 10 (ni=10 i=1,…..,k). La distribuzione ordinata delle modalità è la seguente: 103,103,104,105,107,108,109,115, 122,129,130,131,138,142,145,149, 157,158,161,163,177,181,185,189, 199,228,228,233,242,285,308,323, 324,354,354,378,386,430,443,457, 467,493,521,593,604,609,981,1.021 1.444,2.012 Le classi saranno: 103 xi 129, Prima classe 129 < xi 163, Seconda Classe 163 < xi 285, Terza Classe 285 < xi 457 Quarta Classe 457 < xi 2.012 Quinta Classe 28 Carattere “Fatturato”: Classi equifrequenti Classi xi xl xi 1 103 |--| 129 129 --| 163 163 --| 285 285 --| 457 457 --| 2.012 di 26 34 122 172 1555 Totale 0.008 Ampiez za della classe Frequenza relativa fi n i n 0,20 0,20 0,20 0,20 0,20 Densità di frequenza hi fi di 0,008 0,006 0,002 0,001 0,000 Somma delle aree Pl i d h l l l 1 0,20 0,40 0,60 0,80 1,00 1,00 Istogramma del fatturato (classi equifrequenti e densità di frequenza) 0.006 Densità di requenza 0.004 0.002 0.0 500 1000 1500 2000 classi di modalità 29 Carattere “Fatturato”: Classi equiampie Come cambia la distribuzione se consideriamo 5 classi equiampie (k=5)? d xmax xmin 2.012 103 381, 80 k 5 Classi xi xl xi 1 103,0 |--| 484,8 484,8 --| 866,6 866,6 --| 1.248,4 1248,4 --| 1.630,2 1630,2 --| 2.012,0 Totale Classi xi xl xi 1 103,0 |--| 484,8 484,8 --| 866,6 866,6 --| 1.248,4 1248,4 --| 1.630,2 1630,2 --| 2.012,0 Totale Freq. Ass. ni 41 5 2 1 1 50 Ampiez za della classe di 381,8 381,8 381,8 381,8 381,8 Freq. relativa fi ni n 0,82 0,10 0,04 0,02 0,02 1,00 Freq. relativa fi n i n 0,82 0,10 0,04 0,02 0,02 1,00 Frequenza relativa cumulata i Fi fl l 1 0,82 0,92 0,96 0,98 1,00 Densità di frequenza f hi i di 0,00215 0,00026 0,00010 0,00005 0,00005 Somma delle aree Pl i d h l l l 1 0,82 0,92 0,96 0,98 1,00 30 Carattere “N.ro di stabilimenti”: Classi equiampie Classi xi xl xi 1 fi di 0 |--| 2 2 --| 4 4 --| 6 6 --| 8 8 --| 11 Totale densità di frequenza Freq. relativa Ampiez za della classe 2 2 2 2 3 Densità di frequenza n i hi f i n di 0,60 0,24 0,08 0,06 0,02 1,00 0,30 0,12 0,040 0,030 0,0067 Somma delle aree Pl i d l hl l 1 0,60 0,84 0,92 0,98 1,00 Istogramma normalizzato del numero di stabilimenti (classi equiampie) 0.30 0.25 0.20 0.15 0.10 0.05 0.0 0 2 4 6 8 10 classi di modalità 31 Rappresentazioni grafiche 1. Variabili qualitative Diagramma a barre Diagramma a torta Frequenze assolute Distribuz ione delle az iende per settore merceologico (frequenz e assolute) 25 20 15 10 5 0 Alimentare Health Care Ice Packaging Bevande • Variabili nominali o ordinali • Frequenze assolute o relative 2. Variabili quantitative discrete Diagramma a bastoni Diagramma a torta 12 10 8 6 4 2 0 0 1 2 3 4 5 6 7 • Frequenze assolute o relative 32 3. Variabili quantitative continue 3.1 Istogramma rettangoli = classi base = ampiezza della classe di altezza = densità di frequenza hi bi di x i x i 1 ni hi i 1, d 2,i ,k area del imo rettangolo = frequenza della ima classe A i bi h i d i ni di ni area totale A = n 33 Esempio 1: variabile X suddivisa in 2 classi di diverse ampiezza e frequenza xi-1 - xi 0 - 100 100 - 150 ni 40 20 Istogramma delle frequenze assolute 45 40 30 20 15 0 Apparentemente sembrerebbe che le unità statistiche sono più concentrate nella prima classe, ma in realtà dovremmo tener presente che è vero che la frequenza nella prima classe è doppia rispetto alla frequenza nella seconda, ma è pur vero che la prima classe ha anche un’ampiezza doppia rispetto alla seconda. 34 Istogramma delle densità di frequenza (normalizzato) 0,6 0,4 0,4 0,4 0,2 0 Rappresentando la densità di frequenza, invece, risulta evidente che le due classi sono perfettamente omogenee relativamente al modo in cui le unità statistiche si distribuiscono tra di esse. 35 Istogramma normalizzato in cui la densità di frequenza è calcolata sulle frequenze relative bi di x i x i 1 fi hi di base = ampiezza della classe di altezza = densità di frequenza hi area del rettangolo = frequenza relativa della classe A i bi h i d i fi di fi area totale A = 1 36 Dati: 30 consumatori di succhi di frutta n. bottiglie prezzo CH prezzo MM sconto CH sconto MM fedele CH fedele MM ID. cliente scelta Negozio 1 2127027 CH 2 1,86 2,13 0,470 0,540 0,933 0,067 Coloniali 2 2128058 CH 5 1,99 2,09 0,100 0,400 0,400 0,600 Bar 3 2128231 CH 5 2,09 2,09 0,200 0,400 0,820 0,180 Bar 4 2128363 CH 5 2,09 2,09 0,200 0,400 0,978 0,022 Bar 5 2128389 CH 4 2,09 2,09 0,200 0,400 0,795 0,205 S.market 6 2130153 CH 5 2,09 2,09 0,200 0,400 0,384 0,616 Bar 7 2131060 CH 6 1,99 2,09 0,100 0,400 0,986 0,014 Bar 8 2131060 CH 2 2,09 2,09 0,200 0,400 0,993 0,007 Bar 9 2131060 CH 4 2,09 2,09 0,200 0,400 0,994 0,006 Bar 10 2131631 CH 3 1,99 2,09 0,100 0,400 1,000 0,000 Bar 11 2131631 CH 5 2,09 2,09 0,200 0,400 1,000 0,000 Bar 12 2133751 CH 6 1,86 2,13 0,470 0,540 0,520 0,480 Coloniali 13 2136325 MM 5 2,09 2,09 0,200 0,400 0,342 0,658 S.market 14 2136838 MM 5 2,09 2,09 0,200 0,400 0,000 1,000 S.market 15 2137778 MM 2 1,75 1,99 0,160 0,300 0,351 0,649 D. Autom. 16 2138081 MM 1 1,99 2,09 0,100 0,400 0,500 0,500 S.market 17 2138081 CH 3 1,99 2,09 0,100 0,400 0,400 0,600 S.market 18 2138685 CH 4 1,69 1,69 0,300 0,200 0,320 0,680 Coloniali 19 2142976 CH 5 1,86 2,13 0,470 0,540 0,314 0,686 Coloniali 20 2143495 MM 5 1,75 1,99 0,160 0,300 0,131 0,869 D. Autom. 21 2143644 MM 2 1,75 1,99 0,160 0,300 0,248 0,752 D. Autom. 22 2143644 MM 3 1,86 2,13 0,470 0,540 0,220 0,780 Coloniali 23 2144956 CH 6 2,09 2,09 0,200 0,400 0,533 0,467 S.market 24 2147207 MM 5 1,99 2,09 0,100 0,400 0,670 0,330 S.market 25 2147207 CH 4 1,86 2,13 0,470 0,540 0,629 0,371 Coloniali 26 2147207 MM 1 2,09 2,09 0,200 0,400 0,450 0,550 S.market 27 2147660 CH 5 1,86 2,13 0,470 0,540 0,913 0,087 Coloniali 28 2147819 CH 1 1,86 2,13 0,470 0,540 0,500 0,500 Coloniali 29 2148098 CH 4 1,86 2,13 0,470 0,540 0,803 0,197 Coloniali 30 2149252 CH 6 1,75 1,99 0,160 0,300 0,895 0,105 D. Autom. 37 Carattere scelta n. bottiglie prezzo CH prezzo MM sconto CH sconto MM fedele MM fedele CH negozio Descrizione marca prescelta numero di bottiglie acquistate prezzo della marca CH prezzo della marca MM sconto per il prodotto CH sconto per il prodotto MM indicatore di fedeltà per il prodotto MM indicatore di fedeltà per il prodotto CH rivenditore del prodotto 38 Esempio 2 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equiampie n = 30 di x max x min 5 Fedele CH Totale 0, 2 5 ni 0 |—| 0,2 0,2 —| 0,4 0,4 —| 0,6 0,6 —| 0,8 0,8 —| 1 1 0 fi 2 9 5 3 11 30 0,06 0,30 0,17 0,10 0,37 1 Fi 0,06 0,36 0,53 0,63 1 hi fi di 0,3 1,5 0,85 0,5 1,85 39 Istogramma delle frequenze relative 0,4 0,37 0,3 0,3 0,2 0,17 0,1 0,1 0 0,06 0 0,2 0,4 0,6 0,8 1 Istogramma delle densità di frequenza 2 1,85 1,5 1,5 1 0,85 0,5 0,5 0,3 0 0 0,2 0,4 0,6 0,8 1 In questo caso le due rappresentazioni sono ugualmente valide, ma solo in quanto le classi hanno la stessa ampiezza 40 Esempio 3 Carattere: “fedele CH” Distribuzione di frequenza di 5 classi equifrequenti n = 30 ni = 30 : 5 = 6 Fedele CH di 0 |—| 0,32 0,32 —| 0,45 0,45 —| 0,67 0,67 —| 0,93 0,93 —| 1 ni 0,32 0,13 0,22 0,26 0,07 Totale fi 6 6 6 6 6 30 hi Fi 0,2 0,2 0,2 0,2 0,2 1 0,2 0,4 0,6 0,8 1 fi di 0,625 1,538 0,909 0,769 2,857 41 Istogramma delle frequenze assolute 4 3 2 0 1 frequenza assoluta 5 6 Is togramma (c las s i equif requenti) 0.0 0.2 0.4 0.6 0.8 1.0 c l as s i di modal i tà Istogramma delle densità di frequenza 2.0 1.5 1.0 0.0 0.5 densità di frequenza 2.5 Is togramma (c las s i equif requenti e dens ità di f requenz a) 0.0 0.2 0.4 0.6 0.8 1.0 c l as s i di modal i tà In questo caso è evidente che il primo grafico non è adeguato a rappresentare la distribuzione di frequenza. 42 In sintesi l’istogramma: • considera l’intensità con cui le frequenze si addensano all’interno delle diverse classi • è sensibile a cambiamenti dei criteri di raggruppamento delle intensità in classi • permette di distribuzioni confrontare “graficamente” diverse 43 Esempio 4: Confronto grafico tra diversi criteri di raggruppamento delle classi Carattere “Fatturato” A. Classi equifrequenti Classi xi xl xi 1 103 |--| 129 129 --| 163 163 --| 285 285 --| 457 457 --| 2.012 Ampiez za della classe n i n fi di 26 34 122 172 1555 Totale 0.008 Frequenza relativa 0,20 0,20 0,20 0,20 0,20 Densità di frequenza f hi i di 0,008 0,006 0,002 0,001 0,000 Somma delle aree Pl i d h l l l 1 0,20 0,40 0,60 0,80 1,00 1,00 Istogramma del fatturato (classi equifrequenti e densità di frequenza) 0.006 Densità di requenza 0.004 0.002 0.0 500 1000 classi di modalità 1500 2000 44 B. Classi equiampie Come cambia la distribuzione se consideriamo 5 classi equiampie? Classi di 103,0 | -- | 484,8 484,8 -- | 866,6 866,6 -- | 1.248, 4 1248,4 -- | 1.630,2 1630,2 -- | 2.012,0 Totale Densità di frequenza 381,8 381,8 381,8 381,8 381,8 fi n i h i fi di n 0,82 0,10 0,04 0,02 0,02 1,00 0,00215 0,00026 0,00010 0,00005 0,00005 F 0,82 0,92 0,96 0,98 1,00 Istogramma del fatturato (classi equiampie e densità di frequenza) 0.0020 0.0015 0.0010 0.0005 0.0 500 1000 classi di modalità 1500 2000 45 C. Classi di diversa ampiezza e frequenza La gran parte delle aziende incluse nel campione ha un fatturato compreso tra 100 e 500 milioni (I classe). Domanda : La distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato può considerarsi uniforme? Risposta : consideriamo la seguente distribuzione in classi: 100| -- |200, 200 --|300, 300 -- |400, -- |2.100 400 -- |500, 500 Classi 100 | 200 300 400 500 -- | 200 -- | 300 -- | 400 -- | 500 -- | 2.100 Totale di 100 100 100 100 1.600 n i fi n 0,50 0,10 0,14 0,10 0,16 1,00 hi f i di 0,0050 0,0010 0,0014 0,0010 0,0001 F 0,50 0,60 0,74 0,84 1,00 46 Confronto grafico: quale suddivisione in classi approssima meglio i dati originari? 0.008 Istogramma del fatturato (classi equifrequenti e densità di frequenza) 0.006 Densità di requenza 0.004 0.002 0.0 500 Densità di frequenza 1000 1500 2000 classi di modalità Istogramma del fatturato (classi equiampie e densità di frequenza) 0.0020 0.0015 0.0010 0.0005 0.0 500 1000 1500 2000 classi di modalità Densità di frequenza Istogramma del fatturato (classi di diversa ampiezza e frequenza e densità di frequenza) 0.005 0.004 0.003 0.002 0.001 0.0 500 1000 1500 2000 classi di modalità 47 Densità di frequenza Istogramma del fatturato (classi di diversa ampiezza e frequenza e densità di frequenza) 0.005 0.004 0.003 0.002 0.001 0.0 500 1000 classi di modalità 1500 2000 Come si evince dall’istogramma, la densità di frequenza è più elevata in corrispondenza della prima classe (da 100 a 200 miliardi), per cui la distribuzione del fatturato delle aziende appartenenti alla prima classe di fatturato (100 – 500) relativa al caso delle classi equifrequenti NON può considerarsi uniforme. 48 3.2 Funzione di ripartizione empirica # X xl frequenza relativa delle unità Fl n statistiche con modalità xl l 1 l 2 l i l k n1 n n n2 1 n F1 f1 F2 f1 f 2 Fi f1 f 2 Fk f1 f 2 fi fi fk n1 n2 n n1 n2 ni ni n nk 1 Proprietà: 1. 0 Fl 1 2. Fl è non decrescente F 1 3. F 0; 4. Fl è continua da destra 49 Rappresentazione grafica Carattere “Fatturato” Classi equiampie 1,0 0,8 0,6 0,4 0,2 0,0 103 484,8 866,6 1284,4 1630,2 2012 2500 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 103 484,8 866,6 1284,4 1630,2 2012 50 Confronto tra i diversi criteri di raggruppamento a) classi equifrequenti 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 b) classi equiampie 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 c) classi di diversa ampiezza e frequenza 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 51 LE RELAZIONI STATISTICHE Riguardano lo studio delle relazioni tra due o più caratteri statistici. Due o più caratteri vengono analizzati simultaneamente al fine di evidenziare i legami intercorrenti tra di essi. Nel caso delle relazioni tra due caratteri, l’oggetto dello studio è la distribuzione doppia (o bivariata) rappresentabile in una tabella a doppia entrata. 52 LA DISTRIBUZIONE DOPPIA carattere in colonna frequenza marginale di riga carattere in riga j-ma modalità (intensità) di Y Y X x1 y1 y2 yj yh n11 n12 n1 j n1h n1 x2 n21 n22 n2 j n2 h n2 xi ni1 ni 2 nij nih ni xk nk 1 nk 2 nkj nkh nk n1 n 2 n j n h n i-ma modalità (intensità) frequenza congiunta di xi ed di X yj frequenza marginale di colonna 53 LA DISTRIBUZIONE DOPPIA Caratteristiche principali • Se dividiamo ogni cella per n otteniamo la tabella doppia per frequenze relative • Valgono per estensione tutte le proprietà viste per le distribuzioni semplici • n frequenza congiunta ij • ni totali di riga h n ij j 1 n j totali di colonna • n • k h n i 1 j 1 ij n i i k n i 1 ij n j j 54 X LA DISTRIBUZIONE DOPPIA Frequenze relative y1 y2 yj yh x1 f11 f12 f1 j f1h f1 x2 f 21 f 22 f2 j f2h f 2 xi f i1 fi 2 f ij f ih fi xk f k1 fk 2 f kj f kh fk f 1 f 2 f j f h 1 Y f ij frequenza relativa f i totali di riga h j 1 f ij f j totali di colonna 1 k h i 1 j 1 f ij i congiunta k f ij i 1 f i f j j 55 ESEMPIO A partire dalla successione delle intensità riguardanti i caratteri Fatturato (FATT) e Fatturato Estero (FATEST) si costruisca la distribuzione doppia di frequenze rappresentandola in una tabella a doppia entrata suddividendo le intensità dei due caratteri nei modi seguenti: FATT: 200, 200 -| 300, 300 -| 400, 400 -| 500, >500 FATEST: 5%, 5% -| 10%, 10% -| 25%, 25% -| 50%, >50% FATT 1021, 109, 233, 199, 354, 145, 467, 177, 161, 158, 115, 108, 1444, 493, 185, 285, 242, 386, 981, 105, 103, 2012, 104, 521, 131, 129, 138, 228, 457, 163, 103, 308, 609, 142, 189, 107, 130, 354, 593, 604, 324, 149, 430, 323, 181, 443, 378, 228, 157, 122, FATEST 12,00%, 10,00%, 4,00%, 10,00%, 50,00%, 7,00%, 5,00%, 10,00%, 14,00%, 35,00%, 0,00%, 0,00%, 18,00%, 13,00%, 15,00%, 12,00%, 45,00%, 12,00%, 45,00%, 90,00%, 10,00%, 12,00%, 10,00%, 4,50%, 0,00%, 27,00%, 6,00%, 4,00%, 20,00%, 13,00%, 12,00%, 20,00%, 29,00%, 19,00%, 20,00%, 18,00%, 5,00%, 10,00%, 3,00%, 25,00%, 10,60%, 0,00%, 5,00%, 1,00%, 7,00%, 0,00%, 10,00%, 10,00%, 8,00%, 0,00% 56 Bisogna considerare le coppie di intensità così come esse si presentano nella successione e collocarle in una delle celle della seguente tabella a doppia entrata: Fatturato Fatturato Estero 5% 5%-|10% 10%-|25% >50% 25%-|50% 200 200 -| 300 300 -| 400 400 -| 500 >500 Ad esempio la prima coppia di intensità (FATT=1021, FATEST=12%) va collocata nella cella corrispondente alla quinta riga (FATT > 500) e terza colonna (10% <FATEST<25%) della tabella ( ) . Procedendo in questo modo per ogni coppia di intensità e contando la frequenza in ogni cella si ottiene la seguente tabella a doppia entrata relativa ad una distribuzione doppia di frequenza. Fatturato (X) 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Fatturato Estero (Y) 5% 6 2 1 3 2 14 5%-|10% 10%-|25% 25%-|50% >50% 9 1 2 0 0 12 7 1 3 2 4 17 2 1 1 0 2 6 1 0 0 0 0 1 Totale 25 5 7 5 8 50 57 DISTRIBUZIONI MARGINALI Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 25 5 7 5 8 50 Fatturato estero 5% Freq. ass. 14 12 17 6 1 50 5% -| 10% 10%-| 25% 25%-|50% >50% Totale DISTRIBUZIONI CONDIZIONATE DI X X y j 5% Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 6 2 1 3 2 14 X 25% y j 50% Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 2 1 1 0 2 6 X 5% y j 10% Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 9 1 2 0 0 12 X 10% y j 25% Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 7 1 3 2 4 17 X y j 50% Fatturato 200 200 -| 300 300 -| 400 400 -| 500 >500 Totale Freq. ass. 1 0 0 0 0 1 58 DISTRIBUZIONI CONDIZIONATE DI Y Y xi 200 Fatturato estero 5% 5% -| 10% 10%-| 25% 25%-|50% >50% Totale Freq. ass. 6 9 7 2 1 25 Y 400 xi 500 Fatturato estero 5% 5% -| 10% 10%-| 25% 25%-|50% >50% Totale Freq. ass. 3 0 2 0 0 5 Y 200 xi 300 Fatturato estero 5% 5% -| 10% 10%-| 25% 25%-|50% >50% Totale Freq. ass. 2 1 1 1 0 5 Y 300 xi 400 Fatturato estero 5% 5% -| 10% 10%-| 25% 25%-|50% >50% Totale Freq. ass. 1 2 3 1 0 7 Y xi 500 Fatturato estero 5% 5% -| 10% 10%-| 25% 25%-|50% >50% Totale Freq. ass. 2 0 4 2 0 8 Sulle distribuzioni condizionate e marginali è possibile calcolare tutte le statistiche univariate (indici di posizione, indici di variabilità, indici di forma, etc.). 59 Misure di tendenza centrale Sono misure sintetiche che posizionano la distribuzione di frequenza di un fenomeno e consentono il passaggio da una pluralità di informazioni ad un solo numero L’obiettivo è di consentire di effettuare confronti nel tempo, nello spazio o tra circostanze differenti • Media • Moda Mediana Quartili • Quantili Decili Percentili 60 Moda La Moda (o “norma” o “valore normale”) di una distribuzione è rappresentata dal valore (qualitativo o numerico) che presenta la frequenza assoluta o relativa più elevata. Sintetizzare una distribuzione con la sua moda equivale ad assumere come valore “più rappresentativo” quello che si è verificato più spesso. L’uso della moda ha tanto più senso quanto più la sua frequenza si differenzia rispetto a quella delle altre modalità o intensità 61 Variabili nominali Carattere SCELTA SCELTA CH MM Totale ni Mo = CH fi 21 9 30 0,7 0,3 1 Variabili quantitative discrete Carattere NUMERO DI BOTTIGLIE N. bottiglie 1 2 3 4 5 6 Totale ni Mo = 5 3 4 3 5 11 4 30 fi 0,10 0,13 0,10 0,17 0,37 0,13 1 62 Distribuzioni in classi • Classi equiampie: la classe modale è la classe a cui corrisponde la frequenza più elevata • Classi equifrequenti o di diversa ampiezza e frequenza: la classe modale è la classe a cui corrisponde la densità di frequenza più elevata Carattere PREZZO CH, classi equiampie (primi 20 consumatori) f hi Classe 1,69 1,77 1,85 1,93 2,01 Mo ni fi i di Fi |—| 1,77 3 0,15 0,15 —| 1,85 0 0 0,15 —| 1,93 3 0,15 0,30 —| 2,01 5 0,25 0,55 2,09 =—| classe modale = 92,01 0,45 --| 2,09 1 Totale 20 1 1,875 0 1,875 3,125 5,625 63 Istogramma normalizzato 3 2 0 1 densità di frequenza 4 5 Is togramma normaliz z ato del c arattere PREZZO CH (c las s i equiampie) 1.7 1.8 1.9 2.0 2.1 c las s i di intens ità Funzione di ripartizione empirica 4 3 2 1 0 densità di frequenza 5 6 Funz ione di ripartiz ione empiric a del c arattere PREZZO CH (c las s i equiampie) 1.7 1.8 1.9 2.0 2.1 c las s i di intens ità 64 Carattere Fatturato, classi equifrequenti Classi xi xl xi 1 103 |--| 129 129 --| 163 163 --| 285 285 --| 457 457 --| 2.012 Totale Ampiez za della classe di Frequenza relativa n fi i n 26 34 122 172 1555 Densità di frequenza hi 0,20 0,20 0,20 0,20 0,20 1,00 fi di 0,008 0,006 0,002 0,001 0,000 Classe modale = 103 |--| 129 0.008 Istogramma del fatturato (classi equifrequenti e densità di frequenza) 0.006 Densità di requenza 0.004 0.002 0.0 500 1000 1500 2000 classi di modalità 65 Distribuzioni bimodali o plurimodali Carattere NEGOZIO Negozio Bar Coloniali ni D. automatico Supermarket Totale fi 9 9 0,30 0,30 4 8 30 0,13 0,27 1 Il carattere presenta due modalità con la massima frequenza, dunque le due mode sono: Mo1 = Bar Mo2 = Coloniali Distribuzione zeromodale X x1 x2 Totale ni fi 20 20 40 Mo = ??? 0,5 0,5 1 66 I QUANTILI Valori che bipartiscono la distribuzione intensità/modalità in due gruppi disgiunti. Mediana Quantili Quartili Decili delle N:B. Quando si calcolano i quantili è sempre neces-sario ordinare le intensi-tà/modalità in senso non decrescente MEDIANA Percentili I. Valore che bipartisce la distribuzione ordinata delle intensità/modalità x(1),……,x(n) in due gruppi della stessa numerosità II. Intensità/modalità dell’unità statistica che occupa il posto centrale nella distribuzione ordinata x(1),……,x(n) III. Intensità/modalità in corrispondenza della quale la funzione di ripartizione è pari a 0,5 (FME = 0,5) IV. E’ quel valore Me tale che tra il minimo x(1) ed Me vi sono n/2 intensità/modalità (II Quartile Q2 ) 67 Caratteri quantitativi discreti x i intensità che occupa la i-esima posizione nella successione ordinata delle intensità (i=1,….,n) x Me n 2 x n 1 2 2 x n 1 2 se n è pari se n è dispari N.B. Se n è pari, la mediana può non corrispondere a nessuna delle intensità osservate. Caratteri qualitativi ordinali Si individuano le 2 modalità: x(Me-1) tale che F(x(Me-1) )<0,5 x(Me) tale che F(x(Me)) 0,5 Me x(Me) , perché tra le ni unità che possiedono modalità xMe sarà certamente compresa quella (se n è dispari) o quelle (se n è 68 pari) di posto centrale. Carattere NUMERO DI BOTTIGLIE 1 3 5 5 1 3 5 5 1 4 5 6 2 4 5 6 2 4 5 6 2 4 5 6 2 4 5 3 5 5 n = 30 Essendo n pari la mediana è ottenuta come: xn xn Me 2 2 1 2 x1 5 x1 6 4 5 4 ,5 2 2 Eliminando l’ultima osservazione: n = 29 Essendo n dispari: Me x n1 x 29 1 x15 4 2 2 69 Caratteri quantitativi continui | x Classe mediana : classex in corrispondenza della quale la funzione di ripartizione empirica passa (anche idealmente) per il punto 0,5. Me 1 Me xMe 1 xMe 1 xMe FMe xMe xMe 1 Me 0, 5 FMe 1 FMe FMe 1 estremo inferiore della classe mediana estremo superiore della classe mediana Valore della Funzione di ripartizione in corrispondenza della classe mediana FMe 1 Valore della Funzione di ripartizione in corrispondenza della classe che precede la classe mediana 70 classe mediana F 0,5 F Me Me-1 x N.B. L’area tratteggiata Me-1 Me x Me è pari a 0,5 71 Ci [5,27; 15,43] ]15,43; 25,59] ]25,59; 35,76] ]35,76; 45,92] ]45,92; 56,08] ]56,08; 66,24] Totale ni 13 7 5 1 2 2 30 fi 0,43 0,23 0,17 0,03 0,07 0,07 1,00 Fi 0,43 0,66 0,83 0,87 0,93 1,00 1. Individuazione della classe mediana CMe = Ci : Fi = min (Fi > 0,5) ] 15,43; 25,59 ] 2. Stima della mediana all’interno della classe Me 15 , 43 10 ,16 0 , 67 0 , 43 0 ,5 0 , 43 18 , 39 72 QUARTILI Primo Quartile: E’ quel valore Q1 tale che tra il minimo x(1) e Q1 vi sono n/4 intensità. Q1 x n 4 x x n n r s 4 4 2 se n 4 è un numero intero se n 4 non è un numero intero ed r ed s sono le differenze tra n 4 e i due interi più vicini Caratteri qualitativi ordinali Si individuano le 2 modalità: x(Q1-1) tale che F(x(Q1 -1) )<0,25 x(Q1) tale che F(x(Q1)) 0,25 Q1 x(Q1) , perché tra le ni unità che possiedono modalità xQ1 sarà certamente compresa quella (se n/4 è intero) o quelle (se n/4 non è intero) di posto n/4. 73 Terzo Quartile: E’ quel valore Q3 tale che tra il minimo x(1) e Q3 vi sono 3n/4 intensità. Q1 x 3 n 3n se è un numero intero 4 4 x x 3 n 3n r s se 3n non è un numero intero 4 4 4 2 ed r ed s sono le differenze tra 3n 4 e i due interi più vicini Caratteri qualitativi ordinali Si individuano le 2 modalità: x(Q3-1) tale che F(x(Q3 -1) )<0,75 x(Q3) tale che F(x(Q3) ) 0,75 Q3 x(Q3) , perché tra le ni unità che possiedono modalità xQ3 sarà certamente compresa quella (se n/4 è intero) o quelle (se n/4 non è intero) di posto 3n/4. 74 Calcolo dei quartili per una distribuzione semplice Carattere NUMERO DI BOTTIGLIE 1 3 5 5 1 3 5 5 1 4 5 6 Considerando le numerosità n’: 2 4 5 6 2 4 5 6 2 4 5 6 n = 30 due 2 4 5 semi-distribuzioni, 3 5 5 ciascuna di n 15 2 n' Q1 x n' 1 x 8 3 2 Q2 Me 4,5 Q3 x n' 1 n' 2 x2 3 5 75 Caratteri quantitativi continui 0, 25 FQ1 1 0, 75 FQ3 1 Q1 xQ1 1 xQ1 xQ1 1 Q3 xQ3 1 xQ3 xQ3 1 FQ1 FQ1 1 FQ3 FQ3 1 DECILI q-mo Decile: E’ quel valore Dq tale che tra il minimo x(1) e Dq vi sono (q·n)/10 intensità. Per una distribuzione si possono calcolare fino a 9 Decili PERCENTILI q-mo Percentile: E’ quel valore Pq tale che tra il minimo x(1) e Pq vi sono (q·n)/100 intensità. Per una distribuzione si possono calcolare fino a 99 Percentili Per il calcolo dei Decili e dei Percentili si utilizzano le stesse formule (adattate allo specifico indice) utilizzate per il calcolo della Mediana. 76 I quartili di una distribuzione in classi saranno determinati in base alla formula per il generico quantile xpx: x P x x P x 1 x P x x P x 1 FP x FP x 1 Fdes iderata FP x1 in cui, individuata la classe di riferimento, si sostituirà ad Fdesiderata il valore 0,25 per Q1, 0,5 per Q2 (Me) e 0,75 per Q3. CQ1 = Ci : Fi = min (Fi > 0,25) = C1 10 ,16 Q1 5 , 27 0 , 25 0 0 , 43 Q3 CQ3 = Ci : Fi = min (Fi > 0,25) = C3 10,16 0,75 25,59 0,83 0,67 10 , 9 0,67 30,67 77