LEZIONE 1.1 corso di statistica Francesco Lagona Università Roma Tre LEZIONE 1.1 – p. 1/18 Introduzione al corso • sito: http://scienzepolitiche.uniroma3.it/flagona/ ◦ programma, slides ed esercitazioni: materiali didattici: (A-L) • orario di ricevimento: giovedi’ 18-20 (ufficio 4.16) • articolazione del corso (8 CFU): • ◦ I PARTE: STATISTICA DESCRITTIVA ◦ II PARTE: CALCOLO DELLE PROBABILITÀ ◦ III PARTE: INFERENZA STATISTICA articolazione del corso (3 CFU): ◦ • statistica I PARTE: STATISTICA DESCRITTIVA (marzo) il programma per un numero diverso di CFU (se ammissibili) va concordato con me LEZIONE 1.1 – p. 2/18 il questionario • esempio di indagine statistica: somministrazione di un questionario ad un gruppo di individui • caratteristiche di un’indagine statistica: cosa chiediamo? a chi lo chiediamo? ◦ le domande del questionario: VARIABILI STATISTICHE (o caratteri) ◦ gli individui che rispondono al questionario: UNITÀ STATISTICHE (l’insieme delle unità statistiche si chiama popolazione) • i risultati dell’indagine: cosa hanno risposto? ◦ le risposte del questionario: MODALITÀ • i risultati della rilevazione possono essere organizzati all’interno di una tabella unità-variabili LEZIONE 1.1 – p. 3/18 esempio Tabella 1: Una tipica tabella unità-variabili variabili unità genere residenza giudizio numero esami età distanza Marta femmina Roma sufficiente 2 21 5 Gianluca maschio Roma scarsa 3 20 3 Sandro maschio Frascati buona 4 20 30 ... ... ... LEZIONE 1.1 – p. 4/18 tabella unità-variabili variabili unità X1 X2 ... Xk ... XK 1 x11 x12 ... x1k ... x1K 2 .. . x21 .. . x22 .. . ... .. . x2k .. . ... .. . x2K .. . i .. . xi1 xi2 ... xik ... xiK n xn1 xn2 ... xnk ... xnK • xik : modalità della variabile Xk espressa dall’unità i • colonna k: distribuzione unitaria della variabile Xk • riga i: profilo dell’unità i LEZIONE 1.1 – p. 5/18 matrice unità-variabili x11 x21 .. . x12 x22 .. . . . . x1k . . . x2k .. . . . . x1K . . . x2K .. . X= xi1 xi2 . . . xik . . . xiK .. .. .. .. . . . . xn1 xn2 . . . xnk . . . xnK • vettore colonna xk = (x1k . . . xik . . . xnK ): distribuzione unitaria della variabile Xk • vettore riga xT = (xi1 . . . xij . . . xiK ): profilo dell’unità i i LEZIONE 1.1 – p. 6/18 tipologia delle variabili statistiche qualitative sconnesse qualitative ordinabili quantitative discrete quantitative continue LEZIONE 1.1 – p. 7/18 tipologia delle variabili statistiche • il supporto di una variabile statistica è l’insieme delle modalità che essa assume • le variabili statistiche si distinguono secondo le caratteristiche assunte dal supporto ◦ il supporto di una variabile ha sempre la seguente caratteristica minimale: date le modalità xi e xj espresse da due unità i e j è sempre possibile stabilire quali delle due affermazioni è vera xi = xj xi 6= xj ◦ variabili con un supporto di questo tipo si chiamano qualitative sconnesse ◦ esempi di variabili qualitative sconnesse: genere, nazionalità, residenza, lingua madre, stato civile, ... LEZIONE 1.1 – p. 8/18 variabili qualitative ordinabili • le modalità di una variabile sono ordinabili quando per due modalità xi 6= xj è sempre possibile stabilire quali delle due affermazioni è vera xi ≺ xj xj ≺ xi • variabili con supporto di questo tipo si chiamano variabili qualitative ordinabili • esempi: titolo di studio, giudizio su un prodotto o servizio, ... LEZIONE 1.1 – p. 9/18 variabili quantitative discrete • le modalità di una variabile sono quantitative quando sono definite sulla base di un sistema di riferimento numerico che contiene l’origine (indicata con il numero 0) e un’unità di misura u, tale per cui le modalità sono espresse come multipli di u • le variabili con un supporto di questo tipo si distinguono in variabili quantitative discrete e quantitative continue • quantitative discrete ◦ indicano di solito il numero di volte con cui si è verificato un evento ◦ l’unità di misura u è univocamente determinata e indica il manifestarsi di un singolo evento ◦ esempi: numero di esami sostenuti, numero di incidenti automobilistici o di ricoveri ospedalieri, il numero di figli, il numero di componenti di un nucleo familiare, ... LEZIONE 1.1 – p. 10/18 variabili quantitative continue • quantitative continue • indicano di norma la misurazione di un fenomeno • è di norma possibile definire le modalità come multipli di diverse unità di misura • esempi: altezza, peso, reddito, età, durata, distanza, temperatura, pressione, velocità, ... riassumendo: variabili genere residenza giudizio numero esami distanza (qual. sconn.) (qual. sconn.) (qual. ord.) (quant. discr.) (quant.cont.) Marta femmina Roma sufficiente 2 5 Gianluca maschio Roma scarsa 3 3 Sandro maschio Frascati buona 4 30 ... ... unità ... LEZIONE 1.1 – p. 11/18 distribuzioni di frequenza • concentriamo l’attenzione su una singola distribuzione univariata: (x1 . . . xi . . . xn ) • caso 1: il genere (qualitativa sconnessa con supporto {M, F }) ◦ distribuzione unitaria: (M, F, M, F, F, F, M, F, F, M ) ◦ distribuzione di frequenze assolute (nk ), relative (fk ) e percentuali (pk ): xk M F nk 4 6 10 fk 0.4 0.6 1 pk 40 60 100 LEZIONE 1.1 – p. 12/18 distribuzioni di frequenza • caso 2: residenza (qualitativa sconnessa con supporto {RM, V T, LT, M I}): ◦ distribuzione unitaria: (RM, V T, LT, LT, M I, RM, RM, M I, M I, M I) ◦ distribuzioni di frequenza xk RM VT LT MI nk 3 1 2 4 10 fk 0.3 0.1 0.2 0.4 1 pk 30 10 20 40 100 LEZIONE 1.1 – p. 13/18 distribuzioni di frequenza • caso 3: giudizio su un prodotto (qualitativa ordinabile con supporto {scarso, suf f, discreto} = {S, SS, D}) ◦ distribuzione unitaria: (S, SS, SS, D, S, D, S, SS, SS, SS, SS, D) ◦ distribuzioni di frequenza xk S SS D nk 3 6 3 12 fk 0.25 0.5 0.25 1 pk 25 50 25 100 LEZIONE 1.1 – p. 14/18 distribuzioni di frequenza • caso 4: numero di auto possedute (quantitativa discreta con supporto 0, 1, 2, 3, 5) ◦ distribuzione unitaria: (3, 2, 3, 1, 2, 1, 2, 2, 1, 0, 2, 5, 2, 2, 1, 0, 3, 1, 3, 1, 3, 3, 2, 0, 0) ◦ distribuzioni di frequenza xk 0 1 2 3 5 nk 4 6 8 6 1 25 fk 0.16 0.24 0.32 0.24 0.04 1 pk 16 24 32 24 4 100 LEZIONE 1.1 – p. 15/18 diagrammi a barra xk nk xk nk RM 3 M 4 VT 1 F 6 LT 2 10 MI 1 0 0.0 1 0.5 2 1.0 3 1.5 4 2.0 5 2.5 6 3.0 7 F M LT MI RM VT LEZIONE 1.1 – p. 16/18 diagrammi a barra xk nk xk nk 0 4 S 3 1 7 SS 4 2 8 D 2 3 7 B 2 4 3 11 6 1 0 0 1 2 4 2 6 3 8 4 30 S SS D B 0 1 2 3 4 x 5 6 LEZIONE 1.1 – p. 17/18 diagrammi a barra • l’ampiezza delle barre è arbitraria ma fissata • rispetto all’asse delle ascisse: ◦ nel caso di variabili sconnesse, le barre sono collocate in punti arbitrari ma equidistanti ◦ nel caso di variabili ordinabili, le barre sono equidistanti e collocate secondo l’ordine delle modalità ◦ nel caso di variabili discrete, le barre sono collocate sulle modalità del supporto • i diagrammi a barra possono essere costruiti anche per distribuzioni di frequenze relative e percentuali (la forma del diagramma non muta, cambia solo l’unità di misura dell’asse delle ordinate) LEZIONE 1.1 – p. 18/18