Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 2 ESERCIZIO 1 Date le seguenti distribuzioni di frequenza Calcolare la Moda: Tit. Godimento Freq. Relative Settore Freq. Assolute Affitto 0.40 Agricoltura 4 Proprietà 0.50 Industria 11 Altro 0.10 Altro 5 1 20 Calcolare la Moda, la Mediana e i Quartili: Calcolare la Moda, la Mediana ed i Quartili: N° Figli Freq. Assolute Freq. Cumulate 0 3 3 Tit. di Studio Freq. Percentuali Freq. Perc. Cumulate Senza Titolo 5% 5% 1 5 8 Lic. Elem. 5% 10% 2 5 13 Lic. Media 30% 40% 3 4 17 Diploma 25% 65% 4 1 18 Laurea 35% 100% 5 2 20 20 Calcolare la Moda, la Mediana ed i Quartili: Classe Età Freq. Assolute 25 -| 30 5 30- | 45 2 45 -| 50 4 50 -| 60 7 60 -| 70 2 Calcolare Moda e Mediana: Classe Reddito Freq. Relative 15000 |- 20000 0.60 20000 |- 25000 0.15 25000 |- 30000 0.25 1 20 Calcolare la Moda: ESERCIZIO 1 – Soluzione: 1. Settore di Attività: Mo è “industria” 2. Titolo di Godimento dell’Abitazione: Mo è “proprietà” Elena Siletti: [email protected], [email protected] 1 3. Titolo di Studio del Capo Famiglia: Mo è “laurea”; Me è “diploma”, Q1 è “lic. Media” e Q3 è “laurea” 4. Numero Figli: il fenomeno è bimodale Mo sono “1 figlio” e “2 figli”, P1 = 10 e P2 = 11; Me è “2 figli”, Q1 è “1 figlio”, Q3 è “3 figli” 5. Età del Capo Famiglia: Classe Età Freq. Assolute Ampiezza Freq. Specifiche Freq. Cumulate 25 -| 30 5 5 1 0.25 30- | 45 2 15 0.13 0.35 45 -| 50 4 5 0.8 0.55 50 -| 60 7 10 0.7 0.90 60 -| 70 2 10 0.2 1.00 20 La classe modale è 25 -| 30, Mo è “27 anni e 6 mesi” P = 10.5, la classe mediana è 45 -| 50, Me è “47 anni e 6 mesi” oppure ai 5 5 (α − Fi −1 ) = 45 + ( 0.5 − 0.35) = 45 + ( 0.15 ) = 48.75 , ovvero Me “48 anni e nove fi 0.2 0.2 mesi”, Q1 è “30 anni” e Q3 è “55.7 anni”ovvero “55 anni e circa 8 mesi e mezzo” essendo P1 = 5.25 e P2 = 15.75. li + 6. Reddito Lordo Annuo: Classe Reddito Freq. Relative Freq. Cumulate 15000 |- 20000 0.60 0.60 20000 |- 25000 0.15 0.75 25000 |- 30000 0.25 1 La classe modale è 15000 -| 20000, Mo è “17500 euro”, la classe mediana è 15000 -| 20000, Me è “17500 euro”, oppure li + ai 5000 5000 (α − Fi −1 ) = 15000 + ( 0.5 − 0 ) = 15000 + ( 0.5 ) = 19166.67 fi 0.6 0.6 ESERCIZIO 2: Data la distribuzione per età degli individui visitati nel centro medico in una giornata:. ETA' 10 |- 30 30 |- 50 50 |- 70 70 |- 90 Totale ni 3 10 7 5 25 Calcolare la moda, la mediana e la media aritmetica e rappresentare graficamente la funzione di ripartizione Elena Siletti: [email protected], [email protected] 2 ESERCIZIO 2 – Soluzione: ETA' 10 |- 30 30 |- 50 50 |- 70 70 |- 90 ni Ni fi Fi 3 10 7 5 3 13 20 25 0.12 0.40 0.28 0.20 0.12 0.52 0.80 1.00 25 Dato che le classi sono di uguale ampiezza, non è necessario considerare le frequenze specifiche, quindi la classe modale è “30 -| 50” e la Mo è “40 individui”. La posizione mediana è P = 13, la classe mediana è “30 -| 50”, e la Me è “40 individui”. La media aritmetica è: M1 = µ X = 1 k 1 60 + 400 + 420 + 400 = 51.2 xi ni = [ 20 ⋅ 3 + 40 ⋅10 + 60 ⋅ 7 + 80 ⋅ 5] = ∑ n i =1 25 25 Ovvero l’età media è di circa “51 anni e 73 giorni ” 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 10 ESERCIZIO 30 50 70 90 3: Individuare la moda e la mediana, se possibile, dei dati rappresentati nella seguente tabella riguardanti gli occupati in Italia per settore di attività economica nel 2004 e nel 2005: SETTORE DI ATTIVITA' agricoltura industria altre attività Totale ESERCIZIO ANNO 2004 1034 6956 14640 22630 ANNO 2005 999 6998 14689 22685 3 – Soluzione: Sia nel 2004 che nel 2005 la Mo è “altre attività”. Non essendo il fenomeno almeno ordinale è impossibile identificare la mediana. Elena Siletti: [email protected], [email protected] 3 ESERCIZIO 4: Dall’esame di 20 dipendenti emerge la seguente distribuzione del titolo di studio. Individuare moda e mediana se possibile. Titolo di studio ni Senza Titolo Lic. Elem. Lic. Media Diploma Laurea ESERCIZIO 1 1 6 5 7 4 – Soluzione: La moda è “Laurea”. Il fenomeno è qualitativo rettilineo è quindi possibile ordinare le modalità con cui si manifesta ed individuare la mediana: n è pari quindi avremo P1 = 10 e P2 = 11; Titolo di studio Ni Senza Titolo Lic. Elem. Lic. Media Diploma Laurea 1 2 8 13 20 Coincidendo le modalità di P1 e P2 Me è “Diploma”. ESERCIZIO 5: Individuare la moda utilizzando la distribuzione delle frequenze assolute relativa agli incidenti stradali suddivisi per giorni della settimana in Italia nel 2004. Giorni lunedì martedì mercoledì giovedì venerdì sabato domenica ESERCIZIO N° incidenti 41.042 39.793 40.802 40.564 40.412 47.364 43.113 5 – Soluzione: La moda è “sabato”, ovvero il maggior numero di incidenti avviene al sabato. ESERCIZIO 6: Individuare moda e mediana, se possibile, utilizzando i dati della seriazione che descrive il numero di vani nelle 100 abitazioni del quartiere. NUMERO VANI FREQUENZE 1 2 3 4 5 6 22 28 25 15 8 2 Elena Siletti: [email protected], [email protected] 4 ESERCIZIO 6 – Soluzione: La moda è “2 vani” NUMERO VANI CUMULATE 1 2 3 4 5 6 22 50 75 90 98 100 Essendo n pari P1 = 50 e P2 = 51, a P1 è associata la modalità “2 vani” mentre a P2 è associata la modalità 7: Date le seguenti distribuzioni di frequenza, calcolare la Media Aritmetica, la Media Geometrica e la Media Armonica: ESERCIZIO N° Figli Freq. Assolute 0 3 1 5 2 5 3 4 4 1 5 2 20 Classe Età Freq. Assolute 25 -| 30 5 30- | 45 2 45 -| 50 4 50 -| 60 7 60 -| 70 2 20 Classe Reddito Freq. Relative 15000 |- 20000 0.60 20000 |- 25000 0.15 25000 |- 30000 0.25 1 ESERCIZIO 7 – Soluzione: X: “Numero di Figli” Media Aritmetica x= 1 k 0 ⋅ 3 + 1 ⋅ 5 + 2 ⋅ 5 + 3 ⋅ 4 + 4 ⋅1 + 5 ⋅ 2 5 + 10 + 12 + 4 + 10 41 xi ni = = = = 2.05 ∑ 20 20 20 n i =1 Elena Siletti: [email protected], [email protected] 5 Media Geometrica k Mo = M g = n k ni k 3 5 5 4 1 2 ∏ xini = ∏ xin = ∏ xifi = 0 20 ⋅120 ⋅ 2 20 ⋅ 320 ⋅ 4 20 ⋅ 5 20 = 0 i =1 i =1 i =1 In effetti ha senso calcolare la media solo per valori maggiori di zero. Media Armonica n 20 20 M −1 = k = = = 3 5 5 4 1 2 5 4 1 2 ni + + + + + 5 + + + + ∑ 0 1 2 3 4 5 2 3 4 5 i =1 xi = 20 1200 1200 = = = 2.11 60 ⋅ 5 + 30 ⋅ 5 + 20 ⋅ 4 + 15 ⋅1 + 12 ⋅ 2 300 + 150 + 80 + 15 + 24 569 60 X: “Età del Capo Famiglia” Media Aritmetica 1 k ∑ xi ni = n i =1 27.5 ⋅ 5 + 37.5 ⋅ 2 + 47.5 ⋅ 4 + 55 ⋅ 7 + 65 ⋅ 2 137.5 + 75 + 190 + 385 + 130 917.5 = = = = 45.9 20 20 20 x= Media Geometrica k n 5 2 4 7 2 ln M g = ∑ i ln xi = ln 27.5 + ln 37.5 + ln 47.5 + ln 55 + ln 65 = 20 20 20 20 20 i =1 n 1 1 1 7 1 = ln 27.5 + ln 37.5 + ln 47.5 + ln 55 + ln 65 = 0.83 + 0.36 + 0.77 + 1.40 + 0.42 = 3.78 4 10 5 20 10 M g = e3.78 = 43.72 Media Armonica n 20 20 M −1 = k = = = 41.93 5 2 4 7 2 0.477 ni + + + + ∑ 27.5 37.5 47.5 55 65 i =1 xi X: “Reddito della Famiglia” Media Aritmetica k x = ∑ xi f i = 17500 ⋅ 0.6 + 22500 ⋅ 0.15 + 27500 ⋅ 0.25 = 20750 i =1 Media Geometrica k ln M g = ∑ f i ln xi = 0.6 ln17500 + 0.15ln 22500 + 0.25 ln 27500 = 5.86 + 1.50 + 2.56 = 9.92 i =1 M g = e9.92 = 20332.99 Media Armonica 1 1 1 M −1 = k = = = 20000 0.6 0.15 0.25 fi 0.00005 + + ∑ 17500 22500 27500 i =1 xi Elena Siletti: [email protected], [email protected] 6 ESERCIZIO 8: Le medie aritmetiche dei voti riportati da un campione di studenti del corso di laurea XXX suddivisi nei tre anni di corso sono le seguenti Anno di Corso Voto Medio N° Studenti 1° 2° 3° 24.3 25.7 28 320 250 230 800 Calcolare la media del voto tra tutti gli studenti del corso di laurea. ESERCIZIO 8 – Soluzione: Si utilizza il teorema per la media di un miscuglio per cui. x= 1 k 1 7776 + 6425 + 6440 20641 xi ni = = = 25.8 [ 24.3 ⋅ 320 + 25.7 ⋅ 250 + 28 ⋅ 230] = ∑ n i =1 800 800 800 ESERCIZIO 9: Facendo riferimento alla seguente seriazione: X Freq. Assolute 1 3 3 5 5 2 10 2 Determinare la media aritmetica della trasformata Y = 2 ( X − 3) + 5 ESERCIZIO 9 – Soluzione: La media aritmetica è ( 2 ) M (Y ) = M 2 ( X − 3) + 5 = 2 M ( ( X − 3) ) + 5 = 2 M ( X 2 2 − 6 X + 9) + 5 = = 2 M ( X 2 ) − 12 M ( X ) + 23 M (X ) = 1 k 1 ⋅ 3 + 3 ⋅ 5 + 5 ⋅ 2 28 xi ni = = = 2.8 ∑ n i =1 10 10 M (X2) = 1 k 2 12 ⋅ 3 + 32 ⋅ 5 + 52 ⋅ 2 3 + 45 + 50 x n = = = 9.8 ∑i i n i =1 10 10 M ( Y ) = 2 M ( X 2 ) − 12 M ( X ) + 23 = 2 ⋅ 9.8 − 12 ⋅ 2.8 + 23 = 19.6 − 33.6 + 23 = 9 Elena Siletti: [email protected], [email protected] 7 ESERCIZIO 10 Una ricerca rivolta allo studio del peso in kg di 100 studenti iscritti al primo biennio delle superiori, ha consentito di calcolare i seguenti indici: N mediana = 60; ∑x i = 6000 ; i =1 valutare il livello di simmetria del fenomeno analizzato. ESERCIZIO 10 – Soluzione: N 1 n = 100 e Me = 60, essendo ∑ xi = 6000 , allora x = N i =1 N ∑x i = i =1 6000 = 60 100 Sostituendo si ricava l’indice delta di simmetria, ma siccome la media è uguale alla mediana, risulta essere nullo., la distribuzione potrebbe essere simmetrica. ESERCIZIO 11: In un’azienda produttrice di semilavorati per prefabbricati edili, è stato valutato il peso in quintali dei prodotti realizzati nell’ultima settimana, le informazioni inerenti sono state sintetizzate nella seguente tabella. Peso in quintali Prodotti 40 |- 50 50 |- 55 55 |- 60 60 |- 65 65 |- 70 70 |- 80 80 |-95 16 20 35 43 53 78 32 Valutare la simmetria della distribuzione del peso. ESERCIZIO 11 – Soluzione: Per valutare, come richiesto, la simmetria della distribuzione di frequenze si calcola l’indice di simmetria: α1 = 1 N k ∑( x − µ ) i 3 ni i =1 σ3 Quindi è necessario calcolare la media: 1 k 1 x = ∑ xi ni = ( 45 ⋅16 + 52.5 ⋅ 20 + 57.5 ⋅ 35 + 62.5 ⋅ 43 + 67.5 ⋅ 53 + 75 ⋅ 78 + 87.5 ⋅ 32 ) = N i =1 277 720 + 1050 + 2012.5 + 2687.5 + 3577.5 + 5850 + 2800 = = 67.5 277 Il numeratore nell’indice si calcola come: 1 −11390.63 ⋅16 − 3375 ⋅ 20 + ... + 8000 ⋅ 32 3 3 = 214.01 ( 45 − 67.5 ) ⋅16 + ... + (87.5 − 67.5) ⋅ 32 = 277 277 Elena Siletti: [email protected], [email protected] 8 Mentre per ricavare il denominatore prima si ricava la varianza: 1 506.25 ⋅16 + ... + 400 ⋅ 32 2 2 σ2 = 45 − 67.5 ) ⋅16 + ... + ( 87.5 − 67.5 ) ⋅ 32 = = 124.05 ( 277 277 Da cui si ricava lo scarto quadratico medio: σ = 124.05 = 11.14 e quindi σ 3 = 11.143 = 1382.47 1 N k ∑(x − µ ) i 3 ni 214.01 = 0.16 σ 1382.47 Essendo l’indice, che è molto vicino a 0, il grado di asimmetria positiva (perché è positivo) è minimo. α1 = ESERCIZIO i =1 3 = 12: In un liceo privato, visto il grande numero di studenti che hanno fatto richiesta di iscrizione, si è deciso di effettuare un test di ingresso in modo da poter effettuare un’eventuale graduatoria. Ad ogni test è stato effettuato un punteggio da 0 a 4. i risultati sono riportati di seguito. Punteggio test d’ingresso Percentuale di studenti 0 1 2 3 4 45 % 30 % 10 % 10 % 5% Verificare se è possibile affermare che la distribuzione dei punteggi è simmetrica, in caso negativo si valuti il grado di asimmetria. ESERCIZIO 12 – Soluzione: Per valutare, come richiesto, la simmetria della distribuzione di frequenze si calcola l’indice di simmetria: δ = µ − me Quindi è necessario calcolare la media e la mediana: k x = ∑ xi f i = ( 0 ⋅ 0.45 + 1 ⋅ 0.30 + 2 ⋅ 0.10 + 3 ⋅ 0.10 + 4 ⋅ 0.05 ) = 1 i =1 Utilizzando le frequenze relative cumulate: 0.45, 0.75, 0.85, 0.95, 1, la mediana è 1. δ = µ − me = 1 − 1 = 0 Quindi utilizzando l’indice sembra esserci simmetria perfetta, ma calcolando la moda = 0, ci si accorge che essendo quest’ultima diversa dalla media e dalle mediana non c’è simmetria. Se X è simmetrica, allora l’indice è nullo, ma non è vero il contrario. Notando invece che la moda < media si può affermare che si è in una situazione di asimmetria positiva. Elena Siletti: [email protected], [email protected] 9 ESERCIZIO 13: Date le seguenti distribuzioni di frequenza, calcolare la Varianza: N° Figli Freq. Assolute 0 3 1 5 2 5 3 4 4 1 5 2 20 Classe Età Freq. Assolute 25 -| 30 5 30- | 45 2 45 -| 50 4 50 -| 60 7 60 -| 70 2 20 Classe Reddito Freq. Relative 15000 |- 20000 0.60 20000 |- 25000 0.15 25000 |- 30000 0.25 1 ESERCIZIO 13 – Soluzione: X: “Numero di Figli” 1 k 2 02 ⋅ 3 + 12 ⋅ 5 + 22 ⋅ 5 + 32 ⋅ 4 + 42 ⋅1 + 52 ⋅ 2 5 + 20 + 36 + 16 + 50 2 2 2 x n − x = − ( 2.05 ) = − ( 2.05 ) = ∑ i i n i =1 20 20 127 2 = − ( 2.05 ) = 6.35 − 4.2 = 2.15 20 X: “Età del Capo Famiglia” 1 k 27.52 ⋅ 5 + 37.52 ⋅ 2 + 47.52 ⋅ 4 + 552 ⋅ 7 + 652 ⋅ 2 2 σ 2 = ∑ xi2 ni − x 2 = − ( 45.9 ) = n i =1 20 3781.25 + 2812.5 + 9025 + 21175 + 8450 45243.8 = − 2106.8 = − 2106.8 = 155.4 20 20 σ2 = X: “Reddito della Famiglia” k σ 2 = ∑ xi2 f i − x 2 = 175002 ⋅ 0.6 + 225002 ⋅ 0.15 + 275002 ⋅ 0.25 − ( 20750 ) = 18187500 2 i =1 Elena Siletti: [email protected], [email protected] 10 ESERCIZIO 14: Date la seguente distribuzione di frequenza, calcolare il campo di variazione e la differenza interquartile, e creare il box plot: N° Figli Freq. Assolute 0 3 1 5 2 7 3 5 4 2 5 3 25 ESERCIZIO 14 – Soluzione: X: “Numero di Figli” K = xn − x1 = 5 − 0 = 5 N° Figli Freq. Relative Cumulate 0 0.12 1 0.32 2 0.6 3 0.8 4 0.88 5 0.1 DI = Q3 − Q1 = 3 − 1 = 2 Per disegnare il box plot è necessario individuare anche la mediana che è 2: Box Plot 6 5 4 3 2 1 0 Elena Siletti: [email protected], [email protected] 11 ESERCIZIO 15: Facendo riferimento alla seguente distribuzione: X Freq. Assolute 1 3 3 5 5 2 10 Determinare lo scarto quadratico medio della trasformata Z = 12 − 3 X ESERCIZIO 15 – Soluzione: Lo scarto quadratico medio è 2 2 σ Z = V ( Z ) = V (12 − 3 X ) = M ( −3 X + 3x ) = 9M ( X − x ) = 9σ X2 σ X2 = 2 1 k 2 2 xi ni − x 2 = M ( X 2 ) − ( M ( X ) ) = 9.8 − ( 2.8 ) = 9.8 − 7.84 = 1.96 ∑ n i =1 σ Z = 3 1.96 = 4.2 ESERCIZIO 16: Facendo riferimento alle variabili dell’esercizio 6 dire qual è il fenomeno più variabile. ESERCIZIO 16 – Soluzione: Per confrontare la variabilità è necessario calcolare i coefficienti di variazione X: “Numero di Figli” 1 k x = ∑ xi ni = 2.05 n i =1 X: “Età del Capo Famiglia” 1 k x = ∑ xi ni = 45.9 n i =1 X: “Reddito della Famiglia” k x = ∑ xi f i = 20750 i =1 σ2 = 1 k 2 xi ni − x 2 = 2.15 ∑ n i =1 σ2 = 1 k 2 xi ni − x 2 = 155.4 ∑ n i =1 CV = CV = k σ 2 = ∑ xi2 f i − x 2 = 18187500 CV = i =1 σ x = σ x σ x = = 2.15 = 0.72 2.05 155.4 = 0.27 45.9 18187500 = 0.21 20750 Il fenomeno più variabile è il “Numero di Figli” essendo: 0.72 > 0.27 > 0.21 Elena Siletti: [email protected], [email protected] 12 ESERCIZIO 17: Date le seguenti tabelle contenenti informazioni sui fenomeni “temperatura registrata dalla sonda frigorifera” e “diametro in cm dei bulloni”: Temperatura ni x1 = -1 x2 = 0 x3 = 5 x4 = 8 x5 = 10 6 4 12 3 8 Id 1 2 3 4 Diametro del bullone in cm Id yi yi 0.89 5 0.84 0.85 6 0.85 0.88 7 0.85 0.85 8 0.86 calcolare il campo di variazione, lo scarto quadratico medio, ed inoltre, dire qual è il fenomeno più variabile. ESERCIZIO 17 – Soluzione: Nella prima tabella il campo di variazione è: il valore maggiore – valore minore = 10 – (-1) = 11, mentre nella seconda tabella è: 0.89 – 0.84 = 0.05. La prima tabella è una distribuzione di frequenza del fenomeno “temperatura” su una popolazione statistica di n = 33, per calcolare gli indici sarà quindi necessario utilizzare le formule ponderate, mentre la seconda tabella è una matrice dei dati con n = 8 unità statistiche (bulloni) sulle quali è stato rilevato il diametro, in questo caso sarà necessario utilizzare le formule semplici. Per calcolare gli scarti quadratici medi è necessario calcolare le varianze, quindi anche le medie di entrambi i fenomeni: 1 k 1 xi ni = [ −1 ⋅ 6 + 0 ⋅ 4 + 5 ⋅12 + 8 ⋅ 3 + 10 ⋅ 8] = 4.79 ∑ n i =1 33 n 1 1 y = ∑ yi = [ 0.89 + 0.85 + 0.88 + 0.85 + 0.84 + 0.85 + 0.85 + 0.86] = 0.859 n i =1 8 x= σ X = σ X2 = = σ Y = σ Y2 = 1 k 2 ∑ xi ni − x 2 = n i =1 1 2 ( −1) ⋅ 6 + 02 ⋅ 4 + 52 ⋅12 + 82 ⋅ 3 + 102 ⋅ 8 − ( 4.792 ) = 4.05 33 1 n 2 ∑ yi − y 2 = n i =1 1 2 0.89 2 + 0.852 + 0.882 + 0.852 + 0.84 2 + 0.852 + 0.852 + 0.86 2 − ( 0.859 ) = 0.00026 = 0.016 8 Per confrontare la variabilità si calcolano i coefficienti di variazione perché sono indici di variabilità relativi: σ 4.05 σ 0.016 CVX = X = = 0.85 CVY = Y = = 0.019 x 4.79 y 0.859 ovvero il fenomeno X: temperatura è il più variabile. = Elena Siletti: [email protected], [email protected] 13 ESERCIZIO 18: I dati riguardo al peso in grammi di un dolce prodotto nella prima ora di produzione dall’azienda kk sono riportati nella seguente tabella: Peso in gr. 200 330 250 450 230 350 400 280 Numero di dolci 50 20 15 34 5 12 18 10 1. Calcolare la deviazione standard del peso in grammi; 2. Dopo aver costruito una tabella di frequenze per la variabile peso secondo le seguenti classi 200 |- 300, 300 |- 450, 450 |- 500, calcolare la deviazione standard partendo dai dati forniti dalla stessa tabella. Se si riscontrano differenze con i risultati ottenuti al punto 1. motivarli. ESERCIZIO 18 – Soluzione: 1. Per calcolare la deviazione standard è necessario calcolare la media e la varianza del peso: 1 k M 1 = x = ∑ xi ni = N i =1 1 = ( 200 ⋅ 50 + 330 ⋅ 20 + 250 ⋅15 + 450 ⋅ 34 + 230 ⋅ 5 + 350 ⋅12 + 400 ⋅18 + 280 ⋅10 ) = 164 1 51000 = = 310.98 (10000 + 6600 + 3750 + 15300 + 1150 + 4200 + 7200 + 2800 ) = 164 164 σ = σ2 = = 1 k 2 ∑ xi ni − x = n i =1 1 2 2002 ⋅ 50 + 3302 ⋅ 20 + 2502 ⋅15 + 4502 ⋅ 34 + 230 2 ⋅ 5 + 350 2 ⋅12 + 4002 ⋅18 + 2802 ⋅10 ) − ( 310.98 ) = ( 164 = 9385.63 = 96.88 2. xi |- xi+1 200 |- 300 300 |- 450 450 |- 500 ni 80 50 34 Individuati i valori centrali delle classi xi |- xi+1 200 |- 300 300 |- 450 450 |- 500 ni 80 50 34 xi 250 375 475 si calcola la media e lo scarto quadratico medio: M1 = x = σ = σ2 = 1 k 1 xi ni = [ 250 ⋅ 80 + 375 ⋅ 50 + 475 ⋅ 34] = 334.76 ∑ n i =1 164 1 k 2 1 2 2502 ⋅ 80 + 3752 ⋅ 50 + 4752 ⋅ 34 − ( 334.76 ) = 89.86 xi ni − x = ∑ n i =1 164 Elena Siletti: [email protected], [email protected] 14 Quando si raccolgono i dati in classi si effettua un’approssimazione è quindi normale ottenere dei risultati differenti. ESERCIZIO 19: Utilizzando i dati rappresentati nella seguente tabella riguardanti il numero di vani delle abitazioni in due differenti comuni, individuare la varianza del fenomeno in entrambi i comuni. Successivamente, utilizzando l’indice opportuno, dire dove il fenomeno è più variabile. N° vani ni nel Comune A 1 |- 3 3 |- 5 5 |- 9 ESERCIZIO ni nel Comune B 1034 6956 14640 22630 999 14689 6998 22686 19 – Soluzione: Per calcolare la varianza del numero dei vani delle abitazioni in entrambi i comuni è prima necessario calcolare le due medie: xA = 1 k 1 xi ni = [ 2 ⋅1034 + 4 ⋅ 6956 + 7 ⋅14640] = 5.85 ∑ n i =1 22630 xB = 1 k 1 xi ni = [ 2 ⋅ 999 + 4 ⋅14689 + 7 ⋅ 6998] = 4.84 ∑ n i =1 22686 quindi si ottiene: σ A2 = 1 k 1 k 2 2 x − x n = ( ) ∑ i ∑ xi ni − x 2 = 2.58 i n i =1 n i =1 σ B2 = 1 k 1 k 2 2 x − x n = ( ) ∑ i ∑ xi ni − x 2 = 2.25 i n i =1 n i =1 Per individuare se c’è più variabilità è necessario individuare i coefficienti di variazione: CVA = σ x = 0.28 e CVB = ESERCIZIO σ x = 0.31 , c’è più variabilità nel Comune B. 20: Facendo riferimento alla seguente seriazione: X 1 3 7 10 12 Freq. Assolute 3 5 4 6 2 20 Elena Siletti: [email protected], [email protected] 15 Determinare il campo di variazione, la varianza e lo scarto quadratico medio della variabile X. Successivamente considerando il fenomeno Y che è legato al fenomeno X dalla seguente relazione: Y = 1.3 − 0.1X calcolare la varianza di Y. ESERCIZIO 20 – Soluzione: Freq. Assolute 3 5 4 6 2 20 X 1 3 7 10 12 xini 3 15 28 60 24 130 xi2 1 9 49 100 144 xi2ni 3 45 196 600 288 1132 2 σ2 = 1 k 1 k 2 1132 130 2 x − x n = − ( i ) i ∑ xi ni − x 2 = ∑ = 14.35 n i =1 n i =1 20 20 σ = 14.35 = 3.79 Campo di Variazione = 12 – 1 = 11 2 Ricordando le proprietà della varianza: σ Y2 = ( −0.1) σ X2 = 0.14 Elena Siletti: [email protected], [email protected] 16