Facoltà di Scienze Politiche Università “La Sapienza” di Roma CORSO DI STATISTICA Cattedra (I –O) – Prof. Giuseppe Arbia (30 gennaio 2004) Riconsegnare questo foglio compilato insieme al vostro elaborato: Nome Cognome N. matricola Sono già esonerato La prima parte La seconda parte da (barrare) Nessuna parte (esame completo) I parte (corrispondente alla 1 prova intermedia) Quesito n. 1 E’ data la seguente tabella individui modalità nella quale alcuni dati sono andati persi: Individui 1 2 3 4 5 6 7 8 9 10 11 12 X 1 2 4 ? 1 3 9 3 6 ? 1 3 Y 7 3 2 1 7 3 8 4 2 9 1 2 a) Sapendo che la media di X è pari a 4 e la sua varianza é pari a 7,333, ricostruire i dati mancanti b) Calcolare la media, la moda, la mediana e la varianza di Y c) Calcolare il coefficiente di correlazione tra X ed Y d) Calcolare i parametri della retta di regressione di Y su X Quesito n.2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y X Y 2 4 6 0 1 72 16 40 44 16 112 a) Calcolare media e varianza di X b) Calcolare la correlazione tra X ed Y Quesito n.3 Sono state rilevate due variabili statistiche X ed Y per le quali si dispone delle seguenti statistiche sommario: X Y Media 1 100 Moda 2 90 Mediana 1,5 95 Minimo 0 2 Massimo 4 300 Primo quartile 1,4 50 Terzo quartile 3 110 Varianza 1 3600 a) Cosa si può dire circa la tendenza centrale delle 2 variabili? b) Quale delle due variabili presenta maggiore variabilità? c) Che conclusioni possiamo trarre circa la asimmetria delle 2 distribuzioni? Quesito n 4 Osservare le seguenti 2 distribuzioni di frequenza 0,25 1 0,2 0,8 0,15 0,6 0,1 0,4 0,05 0,2 0 0 1 2 3 4 5 6 (a) 7 1 8 2 3 4 5 6 7 8 (b) a) Quale delle due distribuzioni presenta la maggiore variabilità? Perché? II parte (corrispondente alla 2 prova) intermedia Quesito n. 1 Si consideri il seguente gioco d’azzardo Si lancia un dado a 6 facce per due volte. Se esce per 2 volte un numero pari si vince 2 volte la scommessa, se esce per 2 volte un numero dispari si perde 2 volte la scommessa, se escono un numero pari ed un numero dispari si riprende la posta. a) Il gioco è equo? b) Qual è il risultato più probabile? c) Qual’è la varianza della variabile vincita? Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti: X Y 0 1 2 (a) 1 2 0,03 0,12 0,25 0,05 0,3 0,25 X Y -1 0 1 (b) -1 1 0 0,25 0,25 0,25 0 0,25 Quesito n.3 Data una variabile X distribuita in forma normale con media 2 e varianza 1, calcolare le seguenti probabilità: a) P(X>1) b) P(X > 0,75) c) P(X<3,55) d) P(2,55<X<2,75) Quesito n. 4 L’ISAE (Istituto Studi per l’Analisi Economica) rileva mensilmente su un campione di circa 4000 imprese il grado di fiducia delle imprese in Italia. Se si legge che nell’ultima indagine il 12,5% registra una fiducia crescente, in che intervallo cadrà con probabilità pari a 0,95 il vero valore della percentuale incognita? Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora. Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!! Facoltà di Scienze Politiche Università “La Sapienza” di Roma CORSO DI STATISTICA Cattedra (I –O) – Prof. Giuseppe Arbia (5 febbraio 2004) Riconsegnare questo foglio compilato insieme al vostro elaborato: Nome Cognome N. matricola Intendo sostenere La sola prima La sola seconda (barrare) parte parte Entrambe le parti I parte Quesito n. 1 Uno studente della facoltà di Scienze Politiche ha sostenuto finora 11 esami con le seguenti votazioni: 27, 30, 21, 25, 27, 27, 19, 25, 28, 30, 27. Deve ora sostenere l’esame di Statistica. a) calcolare la media, la mediana e la moda dei voti. b) Calcolare la varianza dei voti. c) La distribuzione dei voti presenta asimmetria positiva, negativa o nulla? d) Che voto dovrebbe prendere lo studente all’esame di Statistica per mantenere invariata la propria media? e) Che voto minimo dovrebbe prendere all’esame di Statistica per mantenere la media al di sopra del 24? f) Escludendo il caso della bocciatura, quali limiti minimo e massimo presenterà la nuova media dopo aver sostenuto l’esame di Statistica? Quesito n. 2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y X Y 0 1 2 3 4 5 c) d) e) f) 0 1 2 4 5 16 11 2 3 5 7 12 26 7 Calcolare media, la moda e la mediana di X Calcolare il range interquartilico e la varianza di X Calcolare la correlazione tra X ed Y Calcolare la media di X quando Y è uguale a 0. Quesito n.3 Di una variabile X osservata su 20 individui si conosce la somma (100) e la somma dei quadrati (3000). Si sa, inoltre, che 11 individui assumono il valore 4. Se ne calcoli la media, la moda, la mediana, la varianza ed un indice di asimmetria. Quesito n 4 Il seguente diagramma a dispersione rappresenta la distribuzione congiunta di due variabili statistiche X ed Y. Quale dei seguenti tre valori rappresenta meglio la correlazione tra le due variabili? a) r = 0,56 b) r = 0,07 c) r = –0,12 -4 -2 0 2 4 6 8 II parte Quesito n. 1 Si prenda in considerazione una variabile casuale X la quale può assumere tre soli valori (0, 1 e 2). La variabile è costruita a partire dall’estrazione (con reimmissione) di 2 carte da un mazzo di 52 carte da poker e rappresenta il numero di figure estratte. Essa, pertanto, assumerà il valore X=2 se entrambe le carte sono delle figure, X=1 se una delle 2 carte è una figura e X = 0 se nessuna delle 2 carte è una figura. Calcolare il valore atteso e la varianza di X. Quesito n. 2. Sono date le seguenti 2 distribuzioni di variabili casuali doppie: 2 Totale X Y 1 0 0,2 1 0,05 2 0,03 Totale 0,90 (a) Completare le distribuzioni nell’ipotesi d’indipendenza X Y -1 0 totale 0 1 totale 0,5 0.7 (b) Quesito n.3 Calcolare le seguenti probabilità di una variabile casuale normale di media = 1 e varianza = 1: e) P(X>1,5) f) P(0,5<X<1,25) g) P(X<0,75) Quesito n. 4 In una recente indagine condotta su 9 individui estratti da una popolazione normale di media incognita e varianza pari ad 1 si sono osservati i seguenti valori: Individui 1 X 3 2 2 3 2 4 4 5 3 6 6 7 12 8 1 9 3 Costruire l’intervallo di confidenza al livello (1 ) = 0,99 per la media della popolazione Tempo a disposizione 1.30 minuti. Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!! Facoltà di Scienze Politiche Università “La Sapienza” di Roma CORSO DI STATISTICA Cattedra (I –O) – Prof. Giuseppe Arbia (28 febbraio 2004) Riconsegnare questo foglio compilato insieme al vostro elaborato: Nome Cognome N. matricola Intendo sostenere La sola prima La sola seconda (barrare) parte parte Entrambe le parti I parte Quesito n. 1 Su n unità si è rilevato congiuntamente la variabile X ed Y: Y\X 2 6 10 A B K 5 90 5 50 40 10 a) fissando le marginali di X,Y ricavare la tabella di indipendenza . b) fissando le marginali di X ricavare la tabella di massima dipendenza g) calcolare la media, la moda, la mediana di Y Quesito n. 2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y X Y 0 1 2 3 4 5 g) h) i) j) 0 1 2 4 5 16 11 2 3 5 7 12 26 7 Calcolare media, la moda e la mediana di X Calcolare il range interquartilico e la varianza di X Calcolare la correlazione tra X ed Y Calcolare la media di X quando Y è uguale a 0. Quesito n.3 Di una variabile X osservata su 20 individui si conosce la somma (100) e la somma dei quadrati (3000). Si sa, inoltre, che 11 individui assumono il valore 4. Se ne calcoli la media, la moda, la mediana, la varianza ed un indice di asimmetria. Quesito n 4 Il seguente diagramma a dispersione rappresenta la distribuzione congiunta di due variabili statistiche X ed Y. Quale dei seguenti tre valori rappresenta meglio la correlazione tra le due variabili? a) r = 0,56 b) r = 0,07 c) r = –0,12 -4 -2 0 2 4 6 8 II parte Quesito n.1 Dire, senza utilizzare le tavole, se le seguenti affermazioni sono vere o false: a) P(Z>0,5) < P(Z>1,5) b) P(Z > 0) = 0,55 c) P(Z<-0,3) = P(Z>0,3) (con Z la normale standardizzata). Quesito n. 2 E’ data la seguente variabile casuale doppia (X,Y) X 1 4 5 Y 2 2b 2b b 4 b 4b 2b a) Si ricavi b b) Si trovi la distribuzione di probabilità marginale di X ed il suo valore atteso c) X ed Y sono dipendenti? Quesito n. 3 Si definisca la proprietà della correttezza di uno stimatore. A titolo esemplificativo si consideri il caso di una V.C. Normale che ha media e varianza 2=1 Per stimare si estrae un campione (X1, X2) di ampiezza 2 e si propone lo stimatore T = (X1+2X2)/3. Tale stimatore è corretto ? Tempo a disposizione 1.30 minuti. 45’ per ogni parte da svolgere. Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!! Facoltà di Scienze Politiche Università “La Sapienza” di Roma CORSO DI STATISTICA Cattedra (I –O) – Prof. Giuseppe Arbia (11 giugno 2004) Riconsegnare questo foglio compilato insieme al vostro elaborato: Nome Cognome N. matricola Sono già esonerato La prima parte La seconda parte da (barrare) Nessuna parte (esame completo) I parte (corrispondente alla 1 prova intermedia) Quesito n. 1 E’ data la seguente tabella individui modalità Individui 1 2 3 4 5 6 7 8 9 10 11 12 X 5 6 9 11 7 6 5 4 3 2 5 9 Y 3 2 1 5 6 3 4 9 8 6 5 8 a) b) c) d) e) Calcolare la media, la moda, la mediana e la varianza di X Calcolare il coefficiente di correlazione tra X e Y. Calcolare i parametri della retta di regressione di Y su X Di quanto cresce mediamente la Y se X passa da 5 a 7 ? Calcolare il coefficiente di determinazione. Quesito n.2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y X Y -1 0 1 0 1 16 24 9 27 12 14 k) Calcolare media e varianza di X l) Calcolare la correlazione tra X ed Y Quesito n.3 Sono state rilevate due variabili statistiche X ed Y per le quali si dispone delle seguenti statistiche sommario: X Y Media 35 10 Moda 75 9 Mediana 38 11,6 Minimo 3 0 Massimo 90 19 Primo quartile 13,4 5 Terzo quartile 74,6 13,7 Varianza 13 124 d) Cosa si può dire circa la tendenza centrale delle 2 variabili? e) Quale delle due variabili presenta maggiore variabilità in termini di varianza? E’ possibile effettuare il confronto utilizzando un altro indice? E cosa può/potrebbe essere concluso utilizzandolo? Quesito n.4 Osservare le seguenti 2 distribuzioni di frequenza 14 12 10 8 Serie1 6 4 2 19 17 15 13 11 9 7 5 3 1 0 14 12 10 8 Serie1 6 4 2 a) 19 17 15 13 11 9 7 5 3 1 0 Quale delle due distribuzioni presenta la maggiore variabilità? Perché? II parte (corrispondente alla 2 prova) intermedia Quesito n. 1 Un’urna contiene due palline bianche, tre rosse e due nere. a) Qual è la probabilità che estraendo una pallina essa sia bianca? Si ipotizzi che sia stata estratta una pallina e che questa sia rossa. b) Si ipotizzi di reimmetterla nell’urna. Qual è la probabilità che estraendo una nuova pallina sia nera? c) Calcolare la stessa probabilità nel caso in cui non si effettui la reimmisione. Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti: X Y 0 1 10 (a) 0 X Y 2 2 0,04 0,21 0,20 0,20 0,04 0,31 6 X Y -1 0 1 (b) 0 X Y 4 1 0,2 0,2 0,3 0,1 0,1 0,1 5 0 1 3 (c) 0,12 0,3 0,18 0,08 0,2 0,12 1 2 0 0,8 0,2 0 (d) Quesito n.3 Dire, senza utilizzare le tavole, se le seguenti affermazioni sono plausibili: h) P(Z>0.5) < P(Z>1) i) P(Z > 3) < P(Z <3) j) P(Z>0) = 0,5 con Z la normale standardizzata. Quesito n. 4 In un controllo statistico di qualità eseguit0 su 15000 televisori prodotti da una nota ditta, il 13% di essi ha mostrato un difetto nella luminosità dell’immagine. Costruire l’intervallo di confidenza al livello (1 ) = 0,95 per tale percentuale. Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora. Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!! Facoltà di Scienze Politiche Università “La Sapienza” di Roma CORSO DI STATISTICA Cattedra (I –O) – Prof. Giuseppe Arbia (30 settembre 2004) Riconsegnare questo foglio compilato insieme al vostro elaborato: Nome Cognome N. matricola Sono già esonerato La prima parte La seconda parte da (barrare) Nessuna parte (esame completo) I parte (corrispondente alla 1 prova intermedia) Quesito n. 1 E’ data la seguente tabella che riporta l’altezza in cm e la taglia di otto individui: Altezza in (X-M(X)) (Y-M(Y)) (X-M(X))2 (Y-M(Y))2 Taglia (Y) (1)*(2) cm (X) (1) (2) (3) (4) 70 100 65 100 65 110 70 105 45 120 55 110 60 125 65 120 f) Calcolare la media, la moda, la mediana di X g) Calcolare la varianza delle due variabili. Che indicatore usereste per confrontare le due distribuzioni in termini di variabilità? Perché? h) Calcolare i parametri della retta di regressione di Y su X. i) Di quanto cresce mediamente la taglia se l’altezza passa da 150 a 160 cm.? j) Calcolare il coefficiente di correlazione e il coefficiente di determinazione. Quesito n.2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y X Y -1 0 1 0 1 25 5 3 30 21 15 m) Calcolare media e varianza di X n) Calcolare la correlazione tra X ed Y Quesito n.3 E’ data la seguente tabella individui modalità nella quale alcuni dati sono andati persi: Individui 1 2 3 4 5 6 7 8 9 10 11 12 X 1 2 4 ? 1 3 9 3 6 ? 1 3 Y 7 3 2 1 7 3 8 4 2 9 1 2 e) Sapendo che la media di X è pari a 4 e la sua varianza é pari a 7,333, ricostruire i dati mancanti f) Calcolare la media, la moda, la mediana e la varianza di Y g) Calcolare il coefficiente di correlazione tra X ed Y h) Calcolare i parametri della retta di regressione di Y su X Quesito n.4 Osservare i tre seguenti grafici a dispersione: -4 -3 -2 -1 0 1 2 3 4 5 6 7 Siete in grado di associare a ciascun grafico un valore del coefficiente di correlazione ? II parte (corrispondente alla 2 prova) intermedia Quesito n. 1 Da un’urna che contiene palline rosse (con frequenza relativa p=0,4) e di altri colori, si fanno estrazioni con ripetizione. a) Calcolare la probabilità degli eventi: A=(pallina rossa esce per la prima volta alla quarta estrazione) B=(fra le prime sei palline estratte esattamente 4 non sono rosse) b) Sareste in grado di calcolare le stesse probabilità nel caso di estrazione senza ripetizione? Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti: X Y 0 1 10 (a) 0 X Y 0 1 3 (c) 2 2 0,05 0,20 0,20 0,15 0,20 0,20 6 0,10 0,30 0,10 0,20 0,18 0,12 X Y -1 0 1 (b) 0 X Y 1 2 4 1 0,30 0,10 0,30 0,00 0,00 0,30 5 0 0,75 0,25 0 (d) Quesito n.3 Dire, senza utilizzare le tavole, se le seguenti affermazioni sono plausibili: k) P(Z<0.5) < P(Z>1) l) P(Z > 3) = P(Z <3) m) P(Z>2) = 1-P(Z<2) con Z la normale standardizzata. Quesito n. 4 Un campione casuale di tre studenti estratti tra i partecipanti di un corso di statistica ha fatto registrare i seguenti voti: 25, 23, 27. Costruire l’intervallo di confidenza al livello (1 ) = 0,95 per la media della popolazione. Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora. Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!!