Esercitazione 2 A. Iodice Frequenze cumulate Esercitazione 2 Frequenze retrocumulate Statistica Funzione di ripartizione empirica Alfonso Iodice D’Enza [email protected] Indici robusti Università degli studi di Cassino A. Iodice () Esercitazione 2 Statistica 1 / 41 Outline Esercitazione 2 A. Iodice Frequenze cumulate 1 Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 2 / 41 Outline Esercitazione 2 A. Iodice Frequenze cumulate 1 Frequenze cumulate 2 Frequenze retrocumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 2 / 41 Outline Esercitazione 2 A. Iodice Frequenze cumulate 1 Frequenze cumulate 2 Frequenze retrocumulate 3 Funzione di ripartizione empirica Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 2 / 41 Outline Esercitazione 2 A. Iodice Frequenze cumulate 1 Frequenze cumulate 2 Frequenze retrocumulate 3 Funzione di ripartizione empirica 4 Indici robusti Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 2 / 41 Distribuzioni cumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti frequenza cumulata la frequenza assoluta cumulata corrispondente ad una data modalità di un carattere, indica il numero di unità della popolazione considerata che presentano un valore del carattere minore o uguale a quella modalità. Analogamente, le frequenze cumulate relative e percentuali fanno riferimento a frazioni del collettivo considerato. A. Iodice () Esercitazione 2 Statistica 3 / 41 Distribuzioni cumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti frequenza cumulata la frequenza assoluta cumulata corrispondente ad una data modalità di un carattere, indica il numero di unità della popolazione considerata che presentano un valore del carattere minore o uguale a quella modalità. Analogamente, le frequenze cumulate relative e percentuali fanno riferimento a frazioni del collettivo considerato. frequenze assolute cumulate La frequenza assoluta cumulata Nj della j-esima modalità è data da: Nj = n1 + n2 + . . . + nj A. Iodice () Esercitazione 2 Statistica 3 / 41 Distribuzioni cumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica frequenze relative cumulate La frequenza relativa cumulata Fj della j-esima modalità è data da: Fj = f1 + f2 + . . . + fj Indici robusti A. Iodice () Esercitazione 2 Statistica 4 / 41 Distribuzioni cumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti frequenze relative cumulate La frequenza relativa cumulata Fj della j-esima modalità è data da: Fj = f1 + f2 + . . . + fj frequenze percentuali cumulate La frequenza percentuale cumulata Pj della j-esima modalità è data da: Pj = p1 + p2 + . . . + pj A. Iodice () Esercitazione 2 Statistica 4 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni cumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 5 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni cumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 5 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni cumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 5 / 41 Distribuzioni retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti frequenza retrocumulata la frequenza assoluta retrocumulata corrispondente ad una data modalità di un carattere, indica il numero di unità della popolazione considerata che presentano un valore del carattere maggiore o uguale a quella modalità. Analogamente, le frequenze retrocumulate relative e percentuali fanno riferimento a frazioni del collettivo considerato. A. Iodice () Esercitazione 2 Statistica 6 / 41 Distribuzioni retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti frequenza retrocumulata la frequenza assoluta retrocumulata corrispondente ad una data modalità di un carattere, indica il numero di unità della popolazione considerata che presentano un valore del carattere maggiore o uguale a quella modalità. Analogamente, le frequenze retrocumulate relative e percentuali fanno riferimento a frazioni del collettivo considerato. frequenze assolute retrocumulate La frequenza assoluta retrocumulata RNj della j-esima delle K modalità del carattere è data da: RNj = nj + nj+1 + . . . + nK A. Iodice () Esercitazione 2 Statistica 6 / 41 Distribuzioni retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate frequenze relative retrocumulate La frequenza relativa retrocumulata RFj della j-esima delle K modalità del carattere è data da: Funzione di ripartizione empirica RFj = fj + fj+1 + . . . + fK Indici robusti A. Iodice () Esercitazione 2 Statistica 7 / 41 Distribuzioni retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate frequenze relative retrocumulate La frequenza relativa retrocumulata RFj della j-esima delle K modalità del carattere è data da: Funzione di ripartizione empirica Indici robusti RFj = fj + fj+1 + . . . + fK frequenze percentuali retrocumulate La frequenza percentuale cumulata Pj della j-esima delle K modalità del carattere è data da: RPj = pj + pj+1 + . . . + pK A. Iodice () Esercitazione 2 Statistica 7 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni retrocumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 8 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni retrocumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 8 / 41 Distribuzioni cumulate: tabelle Esercitazione 2 Distribuzioni retrocumulate A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 8 / 41 Frequenze cumulate vs. retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate E’ possibile ottenere le frequenze retrocumulate a partire dalle cumulate, e viceversa: Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 9 / 41 Frequenze cumulate vs. retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate E’ possibile ottenere le frequenze retrocumulate a partire dalle cumulate, e viceversa: RNj = nj +nj+1 +. . .+nK = N −(n1 +. . .+nj−1 ) = N −Nj−1 Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 9 / 41 Frequenze cumulate vs. retrocumulate Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti E’ possibile ottenere le frequenze retrocumulate a partire dalle cumulate, e viceversa: RNj = nj +nj+1 +. . .+nK = N −(n1 +. . .+nj−1 ) = N −Nj−1 La stessa relazione riguarda ovviamente anche le distribuzioni relative e percentuale. RFj = 1 − Fj−1 RPj = 100 − Pj−1 A. Iodice () Esercitazione 2 Statistica 9 / 41 ottenere le frequenze di una modalità a partire dalle distribuzioni cumulate Esercitazione 2 A. Iodice Supponendo di conoscere Nj , frequenza assoluta cumulata della j-esima modalità di un carattere, si ha che Frequenze cumulate Frequenze retrocumulate Nj = n1 + · · · + nj−1 + nj = Nj−1 + nj da cui nj = Nj − Nj−1 Funzione di ripartizione empirica Indici robusti ovvero basterà sottrarre alla frequenza cumulata della j-esima modalità (Nj ) la frequenza cumulata della j − 1-esima modalità (Nj−1 ). A. Iodice () Esercitazione 2 Statistica 10 / 41 ottenere le frequenze di una modalità a partire dalle distribuzioni cumulate Esercitazione 2 A. Iodice Supponendo di conoscere Nj , frequenza assoluta cumulata della j-esima modalità di un carattere, si ha che Frequenze cumulate Frequenze retrocumulate Nj = n1 + · · · + nj−1 + nj = Nj−1 + nj da cui nj = Nj − Nj−1 Funzione di ripartizione empirica Indici robusti ovvero basterà sottrarre alla frequenza cumulata della j-esima modalità (Nj ) la frequenza cumulata della j − 1-esima modalità (Nj−1 ). analogamente... fj = Fj − Fj−1 pj = Pj − Pj−1 A. Iodice () Esercitazione 2 Statistica 10 / 41 Funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Si consideri il carattere X, carattere quantitativo discreto con K + 1 modalità, tali che x0 ≤ x1 ≤ · · · ≤ xK oppure il carattere X quantitativo continuo suddiviso in K classi [x0 , x1 ], )x1 , x2 ], . . . , )xK−1 , xK ]; la distribuzione delle frequenze relative cumulate puÌ£ essere rappresentata tramite la seguente funzione di ripartizione Indici robusti A. Iodice () Esercitazione 2 Statistica 11 / 41 Funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Si consideri il carattere X, carattere quantitativo discreto con K + 1 modalità, tali che x0 ≤ x1 ≤ · · · ≤ xK oppure il carattere X quantitativo continuo suddiviso in K classi [x0 , x1 ], )x1 , x2 ], . . . , )xK−1 , xK ]; la distribuzione delle frequenze relative cumulate puÌ£ essere rappresentata tramite la seguente funzione di ripartizione 0 per x < x0 F1 per x0 ≤ x ≤ x1 F2 per x1 < x ≤ x2 F (x) = ... ... ... F per x K K−1 < x ≤ xK 1 per x > xK A. Iodice () Esercitazione 2 Statistica 11 / 41 Esempio di costruzione di una f. di ripartizione Esercitazione 2 A. Iodice Si consideri il carattere età, variabile continua suddivisa in classi e rappresentata in tabella Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 12 / 41 Esempio di costruzione di una f. di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti la funzione di ripartizione corrispondente è... 0 per x < 10 0.25 per 10 ≤ x ≤ 30 0.7 per 30 < x ≤ 50 F (x) = 0.9 per 50 < x ≤ 70 1 per 70 < x ≤ 90 A. Iodice () Esercitazione 2 Statistica 12 / 41 Rappresentazione grafica di una f. di ripartizione: caso discreto Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti variabile discreta n.f igli 0 1 2 3 4 A. Iodice () absF reqs 5 5 3 3 4 cum.F reqs 5 10 13 16 20 Esercitazione 2 relF reqs 0.25 0.25 0.15 0.15 0.2 cum.relF r. 0.25 0.50 0.65 0.80 1.00 Statistica 13 / 41 Rappresentazione grafica di una f. di ripartizione: caso discreto Esercitazione 2 A. Iodice Frequenze cumulate Step function la funzione di ripartizione ottenuta è rappresentabile graficamente come segue: Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 14 / 41 Rappresentazione grafica di una f. di ripartizione: caso continuo Esercitazione 2 A. Iodice Frequenze cumulate Si consideri la distribuzione di frequenze relativa alla variabile peso in chilogrammi. Frequenze retrocumulate fino a 50 (50,55] (55,60] (60,65] (65,70] (70,75] (75,80] (80,85] (85,90] oltre 90 Funzione di ripartizione empirica Indici robusti A. Iodice () f.abs 4.00 3.00 2.00 2.00 2.00 3.00 1.00 0.00 2.00 1.00 f.rel 0.20 0.15 0.10 0.10 0.10 0.15 0.05 0.00 0.10 0.05 Esercitazione 2 cum.f.abs 4.00 7.00 9.00 11.00 13.00 16.00 17.00 17.00 19.00 20.00 F(x) 0.20 0.35 0.45 0.55 0.65 0.80 0.85 0.85 0.95 1.00 Statistica 15 / 41 Rappresentazione grafica di una f. di ripartizione: caso continuo Esercitazione 2 A. Iodice La funzione di ripartizione è rappresentata graficamente come segue: Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 16 / 41 Proprietà della funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica La funzione di ripartizione di una variabile X, o di una mutabile rettilinea (ordinabile), e con campo di variazione [x0 , xK ], gode delle seguenti proprietà: Indici robusti A. Iodice () Esercitazione 2 Statistica 17 / 41 Proprietà della funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica La funzione di ripartizione di una variabile X, o di una mutabile rettilinea (ordinabile), e con campo di variazione [x0 , xK ], gode delle seguenti proprietà: 1 F (X) = 0 per x < x0 2 F (X) = 1 per x > xK 3 F (X) è una funzione non decrescente Indici robusti A. Iodice () Esercitazione 2 Statistica 17 / 41 Proprietà della funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica La funzione di ripartizione di una variabile X, o di una mutabile rettilinea (ordinabile), e con campo di variazione [x0 , xK ], gode delle seguenti proprietà: 1 F (X) = 0 per x < x0 2 F (X) = 1 per x > xK 3 F (X) è una funzione non decrescente Indici robusti A. Iodice () Esercitazione 2 Statistica 17 / 41 Proprietà della funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica La funzione di ripartizione di una variabile X, o di una mutabile rettilinea (ordinabile), e con campo di variazione [x0 , xK ], gode delle seguenti proprietà: 1 F (X) = 0 per x < x0 2 F (X) = 1 per x > xK 3 F (X) è una funzione non decrescente Indici robusti A. Iodice () Esercitazione 2 Statistica 17 / 41 Proprietà della funzione di ripartizione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica La funzione di ripartizione di una variabile X, o di una mutabile rettilinea (ordinabile), e con campo di variazione [x0 , xK ], gode delle seguenti proprietà: 1 F (X) = 0 per x < x0 2 F (X) = 1 per x > xK 3 F (X) è una funzione non decrescente Indici robusti A. Iodice () Esercitazione 2 Statistica 17 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 Per calcolare il valore di un generico percentile α si ricorre al calcolo dell’equazione della retta passante per due punti. A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Retta passante per due punti Dati due punti P1 = (x1 , y1 ) e P2 = (x2 , y2 ), l’equazione dell’unica retta passante per P1 e P2 è descritta dalla seguente equazione (x2 − x1 ) × (y − y1 ) − (y2 − y1 ) × (x − x1 ) = 0 si ottiene la seguente equazione Indici robusti x × (y2 − y1 ) − x1 × (y2 − y1 ) = (x2 − x1 ) × (y − y1 ) se y1 6= y2 l’equazione può essere riscritta in forma esplicita x(y2 − y1 ) = x1 × (y2 − y1 ) + (x2 − x1 ) × (y − y1 ) da cui x = x1 × A. Iodice () (y2 − y1 ) (y − y1 ) + × (x2 − x1 ) (y2 − y1 ) (y2 − y1 ) Esercitazione 2 Statistica 18 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Retta passante per due punti (epilogo...) Frequenze retrocumulate Funzione di ripartizione empirica x = x1 × (y2 − y1 ) (y − y1 ) + × (x2 − x1 ) (y2 − y1 ) (y2 − y1 ) la forma esplicita dell’equazione della retta passante per due punti è Indici robusti x = x1 + A. Iodice () (y − y1 ) × (x2 − x1 ) (y2 − y1 ) Esercitazione 2 Statistica 19 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Si supponga di voler calcolare il 72mo percentile, ovvero sia α = 0.72. Individuare graficamente il percentile α Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 20 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Utilizzo dell’interpolazione Una volta identificati i punti che delimitano il tratto della funzione di partizione contenente l’α-mo percentile, si ricorre alla formalizzazione della retta (y − y1 ) × (x2 − x1 ) x = x1 + (y2 − y1 ) In questo, per α = 0.72 risulta P1 = (x1 = 70, y1 = 0.65) P2 = (x2 = 75, y2 = 0.8) y = α = 0.72 x =?, è il valore del percentile che si vuole trovare A. Iodice () Esercitazione 2 Statistica 21 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Utilizzo dell’interpolazione Una volta identificati i punti che delimitano il tratto della funzione di partizione contenente l’α-mo percentile, si ricorre alla formalizzazione della retta (y − y1 ) x = x1 + × (x2 − x1 ) (y2 − y1 ) sostituendo le quantità note x = 70 + A. Iodice () (.72 − 0.65) × (75 − 70) = 72.33 (0.8 − 0.65) Esercitazione 2 Statistica 22 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Il valore corrispondente al 72mo percentile, ovvero sia α = 0.72. Individuare graficamente il valore corrispondente ad α Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 23 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate approssimazione del valore di un generico percentile tramite F (x) F. di ripartizione Funzione di ripartizione empirica xα ' x1 + (x2 − x1 ) α − F (x1 ) F (x2 ) − F (x1 ) Indici robusti x2 è la modalità per la quale F (x2 ) ≥ α x1 è la modalità per la quale F (x2 ) < α A. Iodice () Esercitazione 2 Statistica 24 / 41 Indici robusti (o di posizione): la moda Esercitazione 2 A. Iodice Frequenze cumulate La moda di una distribuzione di frequenze si indica con M o e corrisponde alla modalità con la frequenza assoluta (relativa) più alta Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 25 / 41 Indici robusti (o di posizione): la moda Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti La moda di una distribuzione di frequenze si indica con M o e corrisponde alla modalità con la frequenza assoluta (relativa) più alta Esempio Dato un collettivo di 10 unità statistiche, si consideri la seguente serie di osservazioni: {1, 2, 3, 4, 4, 4, 4, 3, 4, 1} risulta M o = 4, dal momento che la modalità 4 presente cinque volte nel collettivo. A. Iodice () Esercitazione 2 Statistica 25 / 41 Indici robusti (o di posizione): la moda Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti classe modale E’ possibile calcolare la moda anche per variabili quantitative continue raggruppate in classi: se le classi sono di ampiezza diversa si fa riferimento alla densità di frequenza e non alla frequenza di ciascuna classe. A. Iodice () Esercitazione 2 Statistica 26 / 41 Indici robusti (o di posizione): la mediana Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate La mediana M e di una distribuzione corrisponde alla modalità osservata sulla unità statistica centrale nella distribuzione ordinata delle osservazioni Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 27 / 41 Indici robusti (o di posizione): la mediana Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti La mediana M e di una distribuzione corrisponde alla modalità osservata sulla unità statistica centrale nella distribuzione ordinata delle osservazioni variabile X discreta Si considerino le osservazioni ordinate dal valore minimo x1 al valore massimo xn , la mediana M e sar data da ( x( n+1 ) se n dispari 2 Me = x( n ) +x( n +1) 2 2 se n pari 2 A. Iodice () Esercitazione 2 Statistica 27 / 41 La mediana per variabili discrete (dati in distribuzione unitaria) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Esempio (n dispari) Dato un collettivo di 15 unità statistiche, si consideri la seguente serie di osservazioni: {29, 7, 18, 15, 27, 23, 14, 1, 25, 13, 18, 24, 28, 22, 5} Funzione di ripartizione empirica Indici robusti che ordinata in modo crescente diventa {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} la mediana è data dalla modalità che occupa la posizione n+1 2 = 16/2 = 8, vale a dire M e = 18 A. Iodice () Esercitazione 2 Statistica 28 / 41 La mediana per variabili discrete (dati in distribuzione unitaria) Esercitazione 2 A. Iodice Frequenze cumulate Esempio (n pari) Dato un collettivo di 12 unità statistiche, si consideri la seguente serie di osservazioni: Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti {34, 42, 1, 34, 19, 42, 25, 35, 21, 15, 9, 10} che ordinata in modo crescente diventa {1, 9, 10, 15, 19, 21, 25, 34, 34, 35, 42, 42} la mediana data dalla semi somma delle modalità che occupano le posizioni n2 = 12/2 = 6 e n2 + 1 = (12/2) + 1 = 7, vale a dire M e = 21+25 = 46 2 2 = 23 A. Iodice () Esercitazione 2 Statistica 29 / 41 La mediana per variabili discrete (dati in distribuzione unitaria) Esercitazione 2 Tornando ai voti degli studenti... A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 30 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Se i dati della variabile X discreta sono noti mediante una distribuzione di frequenze (seriazione) l’individuazione della modalità assunta dall’unità statistica di posto centrale risulta agevole se, calcolate le frequenze relative cumulate, si considera la funzione di ripartizione F (x) (supponendo di aver ordinato le modalità di X in modo crescente) . Indici robusti A. Iodice () Esercitazione 2 Statistica 31 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Se i dati della variabile X discreta sono noti mediante una distribuzione di frequenze (seriazione) l’individuazione della modalità assunta dall’unità statistica di posto centrale risulta agevole se, calcolate le frequenze relative cumulate, si considera la funzione di ripartizione F (x) (supponendo di aver ordinato le modalità di X in modo crescente) . individuare la modalità x(i−1) tale che F (x(i−1) ) < 0.5 A. Iodice () Esercitazione 2 Statistica 31 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Se i dati della variabile X discreta sono noti mediante una distribuzione di frequenze (seriazione) l’individuazione della modalità assunta dall’unità statistica di posto centrale risulta agevole se, calcolate le frequenze relative cumulate, si considera la funzione di ripartizione F (x) (supponendo di aver ordinato le modalità di X in modo crescente) . individuare la modalità x(i−1) tale che F (x(i−1) ) < 0.5 F (x(i) ) ≥ 0.5 A. Iodice () Esercitazione 2 Statistica 31 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti Se i dati della variabile X discreta sono noti mediante una distribuzione di frequenze (seriazione) l’individuazione della modalità assunta dall’unità statistica di posto centrale risulta agevole se, calcolate le frequenze relative cumulate, si considera la funzione di ripartizione F (x) (supponendo di aver ordinato le modalità di X in modo crescente) . individuare la modalità x(i−1) tale che F (x(i−1) ) < 0.5 F (x(i) ) ≥ 0.5 La mediana data da M e = xi : tra le ni unità statistiche che presentano la modalità xi ci saranno quelle di posizione centrale (o delle posizioni centrali se n dispari) A. Iodice () Esercitazione 2 Statistica 31 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 32 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 32 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 32 / 41 La mediana per variabili discrete (dati organizzati in frequenze) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 32 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Nel caso di variabili continue, la suddivisione in classi delle modalità del carattere consente l’identificazione della classe mediana: in tale classe cadrà la modalità assunta dall’unità statistica che occupa la posizione centrale della distribuzione ordinata delle modalità Indici robusti A. Iodice () Esercitazione 2 Statistica 33 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Nel caso di variabili continue, la suddivisione in classi delle modalità del carattere consente l’identificazione della classe mediana: in tale classe cadrà la modalità assunta dall’unità statistica che occupa la posizione centrale della distribuzione ordinata delle modalità approssimazione del valore M e (tramite F (x) F. di ripartizione) Indici robusti M e ' xi−1 + (xi − xi−1 ) 0.5 − F (xi−1 ) F (xi ) − F (xi−1 ) xi la modalità per la quale F (xi ) ≥ 0.5 xi−1 la modalità per la quale F (xi−1 ) < 0.5 A. Iodice () Esercitazione 2 Statistica 33 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 34 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 34 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 34 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 34 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Trovati i valori xi , xi−1 , F (xi ) e F (xi−1 ) possibile ricavare il valore approssimato di M e Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 35 / 41 La mediana per variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Trovati i valori xi , xi−1 , F (xi ) e F (xi−1 ) possibile ricavare il valore approssimato di M e 0.5 − F (xi−1 ) = F (xi ) − F (xi−1 ) 0.5 − 0.3897 = = 80 + (100 − 80) 0.5247 − 0.3897 = 80 + 20 × 0.817 = 96.3407 Funzione di ripartizione empirica M e 'xi−1 + (xi − xi−1 ) Indici robusti A. Iodice () Esercitazione 2 Statistica 35 / 41 Rappresentazione grafica di una f. di ripartizione: caso continuo Esercitazione 2 A. Iodice Frequenze cumulate Si consideri la distribuzione di frequenze relativa alla variabile peso in chilogrammi. Frequenze retrocumulate fino a 50 (50,55] (55,60] (60,65] (65,70] (70,75] (75,80] (80,85] (85,90] oltre 90 Funzione di ripartizione empirica Indici robusti A. Iodice () f.abs 4.00 3.00 2.00 2.00 2.00 3.00 1.00 0.00 2.00 1.00 f.rel 0.20 0.15 0.10 0.10 0.10 0.15 0.05 0.00 0.10 0.05 Esercitazione 2 cum.f.abs 4.00 7.00 9.00 11.00 13.00 16.00 17.00 17.00 19.00 20.00 F(x) 0.20 0.35 0.45 0.55 0.65 0.80 0.85 0.85 0.95 1.00 Statistica 36 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Utilizzo dell’interpolazione In questo caso α = 0.5 Funzione di ripartizione empirica Indici robusti x = x1 + (y − y1 ) × (x2 − x1 ) (y2 − y1 ) sostituendo le quantità note x = 60 + A. Iodice () (.5 − 0.45) × (65 − 60) = 62.5 = M e (0.55 − 0.45) Esercitazione 2 Statistica 37 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 Individuare graficamente il valore corrispondente ad α A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 38 / 41 Proprietà della mediana Esercitazione 2 A. Iodice la mediana sempre un valore osservato su una delle unità statistiche oggetto di studio Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 39 / 41 Proprietà della mediana Esercitazione 2 A. Iodice la mediana sempre un valore osservato su una delle unità statistiche oggetto di studio Frequenze cumulate Frequenze retrocumulate la mediana minimizza la somma degli scarti in valore assoluto. Dato un valore c, Funzione di ripartizione empirica n X Indici robusti |xi − c| i=1 minima se (e solo se) c ≡ M e. A. Iodice () Esercitazione 2 Statistica 39 / 41 Proprietà della mediana Esercitazione 2 A. Iodice la mediana sempre un valore osservato su una delle unità statistiche oggetto di studio Frequenze cumulate Frequenze retrocumulate la mediana minimizza la somma degli scarti in valore assoluto. Dato un valore c, Funzione di ripartizione empirica n X Indici robusti |xi − c| i=1 minima se (e solo se) c ≡ M e. resistenza della mediana ai valori estremi A. Iodice () Esercitazione 2 Statistica 39 / 41 Quantili di una distribuzione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate La mediana corrisponde alla modalità assunta dall’unità statistica che bipartisce la distribuzione ordinata delle osservazioni Il 50% delle unità statistiche si trova alla sinistra della mediana, l’altro 50% alla sua destra. Analogamente possibile definire i seguenti quantili di una distribuzione. Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 40 / 41 Quantili di una distribuzione Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate La mediana corrisponde alla modalità assunta dall’unità statistica che bipartisce la distribuzione ordinata delle osservazioni Il 50% delle unità statistiche si trova alla sinistra della mediana, l’altro 50% alla sua destra. Analogamente possibile definire i seguenti quantili di una distribuzione. Funzione di ripartizione empirica primo quartile Q1 : corrisponde alla modalità assunta dall’unità statistica per il quale 14 n (25%) delle unità statistiche presenta valori ad esso inferiori Indici robusti secondo quartile Q2 : coincide con la mediana terzo quartile Q3 : corrisponde alla modalità assunta dall’unità statistica per il quale 34 n (75%) delle unità statistiche presenta valori ad esso inferiori decili A. Iodice () Esercitazione 2 Statistica 40 / 41 Quartili in distribuzione unitaria) Esercitazione 2 A. Iodice Frequenze cumulate Esempio (n dispari) Dato un collettivo di 15 unità statistiche, si consideri la seguente serie di osservazioni: Frequenze retrocumulate Funzione di ripartizione empirica {29, 7, 18, 15, 27, 23, 14, 1, 25, 13, 18, 24, 28, 22, 5} che ordinata in modo crescente diventa Indici robusti {1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29} la posizione di Q1 (n + 1) ∗ la posizione di Q2 (n + 1) ∗ la posizione di Q3 (n + 1) ∗ A. Iodice () Esercitazione 2 1 4 2 4 1 4 = 16/4 = 4, Q1 = 13 = 16 ∗ 2/4 = 8, Q2 = 18 = 16 ∗ 3/4 = 12, Q3 = 25 Statistica 41 / 41 Rappresentazione grafica di una f. di ripartizione: caso continuo Esercitazione 2 A. Iodice Frequenze cumulate Si consideri la distribuzione di frequenze relativa alla variabile peso in chilogrammi. Frequenze retrocumulate fino a 50 (50,55] (55,60] (60,65] (65,70] (70,75] (75,80] (80,85] (85,90] oltre 90 Funzione di ripartizione empirica Indici robusti A. Iodice () f.abs 4.00 3.00 2.00 2.00 2.00 3.00 1.00 0.00 2.00 1.00 f.rel 0.20 0.15 0.10 0.10 0.10 0.15 0.05 0.00 0.10 0.05 Esercitazione 2 cum.f.abs 4.00 7.00 9.00 11.00 13.00 16.00 17.00 17.00 19.00 20.00 F(x) 0.20 0.35 0.45 0.55 0.65 0.80 0.85 0.85 0.95 1.00 Statistica 42 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Utilizzo dell’interpolazione In questo caso α = 0.25 Funzione di ripartizione empirica Indici robusti x = x1 + (y − y1 ) × (x2 − x1 ) (y2 − y1 ) sostituendo le quantità note x = 50 + A. Iodice () (.25 − 0.2) × (55 − 50) = 51.66 = Q1 (0.35 − 0.2) Esercitazione 2 Statistica 43 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 Individuare graficamente il valore corrispondente ad α A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 44 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 A. Iodice Frequenze cumulate Frequenze retrocumulate Utilizzo dell’interpolazione In questo caso α = 0.75 Funzione di ripartizione empirica Indici robusti x = x1 + (y − y1 ) × (x2 − x1 ) (y2 − y1 ) sostituendo le quantità note x = 70 + A. Iodice () (.75 − 0.65) × (75 − 70) = 73.33 = Q3 (0.8 − 0.65) Esercitazione 2 Statistica 45 / 41 Calcolo percentili di variabili continue (suddivise in classi) Esercitazione 2 Individuare graficamente il valore corrispondente ad α A. Iodice Frequenze cumulate Frequenze retrocumulate Funzione di ripartizione empirica Indici robusti A. Iodice () Esercitazione 2 Statistica 46 / 41