Scienze Politiche, Vecchio Ordinamento Programma dell'Insegnamento di Statistica PARTE I: STATISTICA DESCRITTIVA UNIVARIATA DISTRIBUZIONI DI FREQUENZE La statistica e i suoi campi di applicazione – Concetti elementari: unità statistica, popolazione statistica, campione, collettivo statistico, censimento, indagine campionaria, carattere statistico – Tipologie di caratteri statistici: qualitativi nominali, qualitativi ordinabili, quantitativi discreti, quantitativi continui – Distribuzioni di frequenze: frequenze assolute, relative e percentuali – Distribuzioni di frequenze di classi di modalità: frequenze assolute specifiche, frequenze relative specifiche – Frequenze assolute cumulate, frequenze relative cumulate, frequenze percentuali cumulate – Rappresentazioni grafiche: istogramma per caratteri qualitativi, diagramma ad aste, istogramma di frequenze, ogiva di frequenze. LE MEDIE Moda e classe modale – Mediana: definizione e procedura di calcolo per un elenco di modalità – La mediana per le distribuzioni di frequenze – La mediana per le distribuzioni di frequenze di classi di modalità(*) – Mediana: proprietà di minimo – Altri indici di posizione: primo e terzo quartile – Media aritmetica: definizione e procedura di calcolo per un elenco di modalità – La media aritmetica per le distribuzioni di frequenze – La media aritmetica per le distribuzioni di frequenze di classi di modalità – Proprietà della media aritmetica: invarianza(*), internalità, scarti semplici(*), quadrati degli scarti – Media geometrica: definizione ed esempi di applicazione. MISURE DI VARIABILITA’ Campo di variazione e distanza interquartilica – Varianza: definizione e formula di calcolo (*) per un elenco di modalità – Varianza: definizione e formula di calcolo (*) per le distribuzioni di frequenze – La varianza per le distribuzioni di frequenze di classi di modalità – Scarto quadratico medio e coefficiente di variazione - Media aritmetica, varianza e scarto quadratico medio per: cambiamenti di scala, traslazioni, trasformazioni lineari. PARTE II: STATISTICA DESCRITTIVA BIVARIATA TABELLE A DOPPIA ENTRATA Distribuzione congiunta di due caratteri: frequenze congiunte in una tabella a doppia entrata – Distribuzioni marginali – Distribuzioni condizionate – Medie e misure di variabilità per le distribuzioni marginali e condizionate - Rappresentazioni grafiche: stereogramma e diagramma scatter. MISURE DI DIPENDENZA STATISTICA Concetto di indipendenza statistica: similitudine delle distribuzioni condizionate – Distribuzione marginale simile alle distribuzioni condizionate (*) – Condizione di indipendenza in una tabella a doppia entrata – Le contingenze – Proprietà delle contingenze: somma per righe e per colonne (*) – Indice chi-quadrato di dipendenza statistica: definizione e formula di calcolo (*) – Massima dipendenza in una tabella a doppia entrata – Indice di Cramer: misura del grado relativo di dipendenza statistica. CORRELAZIONE E REGRESSIONE Definizione di covarianza per un elenco di coppie di modalità: concordanza e discordanza tra due caratteri – Formula di calcolo della covarianza per un elenco di coppie di modalità (*) – La covarianza in una tabella a doppia entrata: definizione e formula di calcolo (*) – Diseguaglianza di Cauchy-Schwartz – Uguaglianza nella diseguaglianza di Cauchy-Schwartz (*) – Coefficiente di correlazione per la misura del grado relativo di dipendenza lineare – Indipendenza statistica e correlazione (*) – Retta di regressione: determinazione dei parametri e indice di determinazione per la misura della bontà di adattamento. (*): degli argomenti contrassegnati da asterisco è richiesta la dimostrazione. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 19 novembre 2003 Esercizio 1 1) Un gruppo di studenti universitari è stato classificato in base al voto di maturità (X) ed al numero di esami superati (Y). I dati dell'indagine sono riportati nella seguente tabella delle frequenze assolute congiunte: Y 0 4 4 8 8 12 X 60 76 84 76 84 100 12 6 4 2 18 10 5 0 3 a) Si calcoli il numero medio di esami superati. b) Si calcoli il voto di maturità mediano degli studenti che hanno superato al massimo 8 esami. c) Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica tra i due caratteri considerati. d) Si calcoli e si commenti un indice relativo di dipendenza lineare. ========================== Esercizio 2 La seguente tabella riporta il voto conseguito da 10 studenti all'esame di diritto (X) e quello conseguito all'esame di economia (Y). X Y 25 18 27 20 25 24 25 27 30 26 30 27 25 20 30 18 22 29 30 18 a) Stabilire, tramite un indice adeguato, quale delle due distribuzioni è più variabile. Esercizio 3 Si dimostri, nel caso di distribuzione doppia di frequenze assolute, che se X e Y sono statisticamente indipendenti, allora la Cov(X,Y)=0. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 19 febbraio 2004 Esercizio 1 1) Un gruppo di imprese manifatturiere è stato classificato in base al fatturato annuo (X), espresso in milioni di euro, ed al numero di dipendenti (Y), espresso in centinaia. I dati dell'indagine sono riportati nella seguente tabella delle frequenze assolute congiunte: Y 0 3 3 8 8 16 X 1 3 3 7 7 10 10 20 12 6 4 0 0 18 5 2 5 0 3 10 a) Si valuti il numero mediano di dipendenti occupati nelle imprese che fatturano più di 3 milioni di euro. b) Si valuti, tramite un indice confrontabile, il grado della interdipendenza statistica tra i due caratteri considerati. c) Supponendo che tra i due caratteri considerati valga la seguente dipendenza funzionale Y=a+bX, si determini una stima dei parametri del modello proposto. Esercizio 2 La seguente tabella riporta il voto conseguito da 8 studenti all' esame di maturità (X) e quello conseguito all'esame di laurea (Y). X Y 75 95 85 98 90 96 90 107 95 100 100 95 92 99 80 94 a) Stabilire, tramite un indice adeguato, quale delle due distribuzioni è più variabile. Esercizio 3 Si dimostri, nel caso di distribuzione doppia di frequenze assolute, che se X e Y sono statisticamente indipendenti, allora la Cov(X,Y)=0. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 27 febbraio 2004 Esercizio 1 Un gruppo di individui è stato classificato in base al peso (Y), espresso in kg, ed all’altezza (X) , espressa in cm. I dati della rilevazione sono i seguenti: Y X 80 160 75 168 80 175 90 180 85 170 70 175 70 160 90 185 90 180 75 180 a) determinare l’altezza che bipartisce la distribuzione ordinata delle altezze; b) stabilire, tramite un indice confrontabile, quale delle due distribuzioni considerate risulta essere più variabile; c) supponendo che il peso sia funzione lineare dell'altezza, allora, prevedere il peso di una persona alta 200 cm; d) supponendo che il peso di ogni individuo diminuisca di 10 kg, determinare, utilizzando opportune proprietà, media e varianza per la nuova distribuzione dei pesi. Esercizio 2 Un insieme di alberghi non di lusso è stato classificato secondo la categoria (X) e il numero di presenze (Y) in un dato periodo dell’anno : 0 50 50 150 150 300 I 5 8 4 II 8 5 4 III 7 5 12 Y X a) determinare il numero mediano di presenze negli alberghi di prima categoria; b) determinare la distribuzione doppia delle frequenze relative percentuali; c) valutare, tramite una misura relativa, il grado della eventuale dipendenza tra i due caratteri. Esercizio 3 Dimostrare, nel caso di distribuzione doppia unitaria, che 1 k Cov(X, Y) Xi Yi M X M Y n i 1 UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 23 aprile 2004 Esercizio n. 1 Un gruppo di imprese industriali ed un gruppo di imprese di servizi sono state classificate in base al numero di dipendenti. I dati della rilevazione sono stati i seguenti: Imprese industriali Classi Freq. assolute ( numero di dipendenti) 20 0 ⊣ 40 40 40 ⊣ 100 80 100 ⊣ 140 10 140 ⊣ 200 Imprese di servizi Classi Freq. Assolute ( numero di dipendenti) 80 0 ⊣ 40 60 40 ⊣ 100 70 100 ⊣ 140 50 140 ⊣ 200 a) Utilizzando un indice di variabilità confrontabile, basato sugli scarti dalla media presi al quadrato, si stabilisca quale delle due distribuzioni presenta la maggiore variabilità. Esercizio n. 2 Un campione di piccoli e medi comuni è stato classificato in base al numero di residenti (X), espresso in migliaia, ed al numero di immobili sfitti(Y), espresso in decine. I dati sono riportati nella tabella seguente: 0 ⊣ 50 50 ⊣ 100 100 ⊣ 200 0⊣4 60 16 4 4 ⊣ 16 15 40 20 16 ⊣ 24 0 40 25 Y X a) Valutare il numero mediano di immobili sfitti. b) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il grado di dipendenza statistica mediante un indice relativo. Esercizio n. 3 Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA CATASTALE (Y), espressa in migliaia di euro. I dati della rilevazione sono riportati nella seguente tabella delle frequenze assolute congiunte: Y X 2 3 4 0 ⊣ 0.6 0.6 ⊣ 1 1 ⊣ 1.8 74 12 0 8 25 16 3 0 15 a) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 26 giugno 2004 Esercizio 1 Un gruppo di giovani è stato classificato in base al tipo di maturità scolastica conseguita (X) ed al numero di libri che leggono in un anno (Y). I dati dell'indagine sono riportati nella seguente tabella delle frequenze assolute congiunte: Y X scientifica classica magistrale 0 ---l 2 2 ---l 4 4 ---l 8 8 ---l 16 22 6 4 6 8 10 5 6 12 4 0 6 a) Si calcoli il numero medio di libri letti dai giovani con licenza classica. b) Si calcoli il numero mediano di libri letti dai giovani intervistati. c) Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica. Esercizio 2 Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA CATASTALE (Y), espressa in centinaia di euro. I dati della rilevazione sono riportati nella seguente tabella delle frequenze assolute congiunte: Y 0 ---- 0.5 0.5 ---- 1 1 ---- 1.5 64 12 5 8 35 16 9 4 15 X 1 2 3 a) Si stabilista tramite un indice confrontabile quale delle due distribuzioni (X e Y) risulta essere maggiormente variabile. b) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare. Esercizio 3 a) Si dimostri, nel caso di distribuzione doppia di frequenze relative, che se X e Y sono statisticamente indipendenti, allora la Cov(X,Y)=0. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 17 luglio 2004 Esercizio n. 1 Si considerino le due seguenti distribuzioni di frequenza: Distribuzione X Modalità Freq. assolute 4 36 8 74 16 38 30 10 Distribuzione Y Modalità Freq. Assolute 4 50 8 70 16 34 30 8 a) Utilizzando un indice di variabilità confrontabile, basato sugli scarti dalla media presi al quadrato, si stabilisca quale delle due distribuzioni presenta la maggiore variabilità. Esercizio n. 2 Un gruppo di aziende è stato classificato in base al numero di dipendenti (X) ed al fatturato(Y). I dati sono riportati nella tabella seguente: 0 ⊣ 50 50 ⊣ 100 100 ⊣ 200 0⊣4 70 16 4 4 ⊣ 16 40 60 20 16 ⊣ 24 0 40 50 Y X a) Valutare ed interpretare il fatturato mediano. b) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il grado di dipendenza statistica mediante un indice relativo. Esercizio n. 3 Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA CATASTALE (Y), espressa in migliaia di euro. I dati della rilevazione sono riportati nella seguente tabella delle frequenze assolute congiunte: Y X 1 2 3 4 0 ⊣ 0.5 0.5 ⊣ 1 1 ⊣ 1.5 74 12 0 5 8 25 16 8 3 0 15 40 a) Si valuti la rendita media delle abitazioni con un vano. b) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare. c) Assumendo che la rendita catastale sia funzione lineare del numero di vani, valutare la rendita catastale di una abitazione con 5. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 4 settembre 2004 Esercizio 1 Un gruppo di giovani è stato classificato in base al tipo di maturità scolastica conseguita (X) ed al numero di libri che leggono in un anno (Y). I dati dell'indagine sono riportati nella seguente tabella delle frequenze assolute congiunte: Y X scientifica classica magistrale linguistica a) b) c) d) 0 ---l 42 6 4 0 4 4 ---l 6 60 10 5 8 8 ---l 12 5 6 9 18 Si calcoli il numero medio di libri letti dai giovani con licenza classica. Si calcoli il numero mediano di libri letti dai giovani intervistati. Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica. Si dica quale è la percentuale di giovani che leggono almeno 5 libri. Esercizio 2 Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA CATASTALE (Y), espressa in centinaia di euro. I dati della rilevazione sono riportati nella seguente tabella delle frequenze assolute congiunte: Y 0 ---- 0.5 0.5 ---- 1 1 ---- 1.5 X 1 2 3 24 12 5 8 65 16 9 4 55 a) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare. Esercizio 3 a) Si dimostri, nel caso di distribuzione doppia di frequenze relative, che se X e Y sono statisticamente indipendenti, allora la Cov(X,Y)=0. UNICAL Facoltà di Scienze Politiche Corso di Laurea in Scienze Politiche VECCHIO ORDINAMENTO A.A. 2003-2004 Esame di Statistica 14 settembre 2004 Esercizio n. 1 Un gruppo di aziende è stato classificato in base al numero di dipendenti (X) ed al fatturato(Y). I dati sono riportati nella tabella seguente: Y 0 ⊣ 50 50 ⊣ 100 100 ⊣ 200 X 20 26 4 0⊣4 4 ⊣ 16 40 40 20 16 ⊣ 24 0 40 70 d) Valutare il numero medio di dipendenti. e) Valutare il fatturato mediano. f) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il grado di dipendenza statistica mediante un indice relativo. g) Si dica quale è la percentuale di aziende che hanno almeno 5 dipendenti Esercizio n. 2 Nella tabella seguente sono riportate le serie storiche dei prezzi medi, espressi in euro, della benzina (X) e del pane (Y). Anno prezzo prezzo pane benzina Y X 1995 1996 1997 1998 1999 2000 2001 2002 0.8 1.4 1.6 1.8 1.7 1.9 1.8 2.0 0.85 1.15 1.10 1.14 1.10 1.12 1.5 1.9 a) Valutare il prezzo medio della benzina e del pane. b) Determinare i parametri della retta di regressione di Y a X. c) Valutare la bontà di adattamento della retta di regressione. d) Se il prezzo del pane aumenta di 0.5 euro, determinare, utilizzando opportune proprietà, media e varianza per la serie del prezzo del pane. e) Valutare la mediana della distribuzione del prezzo della benzina. Esercizio n. 3 k h n 2 ij 2 1 n Si dimostri che i 1 j1 n i n j