Corso di Statistica Variabili casuali Distribuzioni di probabilità Prof.ssa T. Laureti a.a. 2013-2014 1 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti VARIABILI CASUALI O ALEATORIE Una variabile casuale è simile a una variabile statistica E’ definita da un insieme di modalità cui è associata una probabilità Variabili casuali o aleatorie variabili aleatorie discrete variabili aleatorie continue P(x) 0,36 0,16 0,06 0,04 0,02 0 1 2 3 4 5 x Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 2 Definizione di variabile casuale Una variabile casuale (v.c.) X è una funzione definita sullo spazio campionario Ω che associa ad ogni evento elementare ωi un unico numero reale X: R V.c. discreta assume un insieme finito (al più numerabile) di valori V.c. continua assume tutti i valori compresi in un intervallo reale 3 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Variabile casuale discreta È definita da un insieme finito o numerabile di modalità cui è associata una probabilità Esempio Lancio due monete bilanciate. Definisco la variabile casuale X = numero di teste X può assumere i valori 0, 1, 2 Infatti i possibili risultati sono CC X=0 P(X = 0) = 1/4 CT TC X=1 P(X = 1) = 2/4 TT X=2 P(X = 2) = 1/4 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 4 Variabile casuale discreta Si supponga di fare 3 puntate successive alla roulette. Ogni volta si puntano 10 euro sul rosso. Per comodità, si ipotizza che la roulette non abbia lo zero. RNR NRN NNN -30 -20 RNN -10 NNR 0 RRN NRR 10 20 30 RRR X P(X=x) variabile 3/8 casuale “vincita” 1/8 X -30 -20 -10 0 10 20 30 5 Variabile casuale discreta V.C. NUMERO DI TESTE X 0 P(X) P(X=x) 1/4 1 2/4 2 1/4 V.C. “VINCITA” X P(X) P(X=x) -30 1/8 -10 3/8 10 3/8 30 1/8 6 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Variabile casuale discreta Ulteriori esempi di v.c. discreta Alla prova “lancio di un dado” la funzione che associa ad ogni faccia (evento elementare) il punteggio corrispondente (da 1 a 6) è una v.c. Alla prova “lancio di due dadi” la funzione che associa ad ogni risultato la somma dei punteggi è una v.c. (da 2 a 12) Anche associando ad ogni risultato il prodotto dei punteggi (o la loro differenza) si generano v.c. 7 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Funzione di probabilità La f. di probabilità di una v.c. X mette in relazione i valori assunti da X con le corrispondenti probabilità La f. di probabilità P associa ad ogni valore xi la probabilità P(X=xi) Valori della v.c. X P(x) x1 x 2 ........ x i .... P(x1 ) P(x 2 ) ........ P(xi ) .... Proprietà: P(X xi ) 0 P(X x ) 1 i i 8 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Funzione di probabilità La funzione di probabilità può essere rappresentata graficamente In relazione agli esempi precedenti si ha: V.C. “VINCITA” V.C. NUMERO DI TESTE P(X=x) 3/8 1/8 X -30 -20 -10 0 10 20 In corrispondenza di ogni valore, la barra verticale ha un’altezza proporzionale alla probabilità. Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 30 9 Funzione di ripartizione E’ utile calcolare le probabilità cumulate, ossia la probabilità che la v.c. X assuma un valore minore o uguale a un dato valore xi P ( X xi ) La f. di ripartizione di una v.c. X mette in relazione i valori assunti da X con le corrispondenti probabilità cumulate La f. di ripartizione F associa ad ogni valore x le probabilità cumulate F(x) P(X x) P(X w) w x Proprietà: F(x) è non decrescente lim F(x) 0; lim F(x) 1 x x Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 10 Funzione di ripartizione V.C. “VINCITA” V.C. NUMERO DI TESTE X 0 1 2 P(x) 1/4 2/4 1/4 F(x) 1/4 3/4 4/4 X P(x) F(x) -30 1/8 1/8 -10 3/8 4/8 10 3/8 7/8 30 1/8 8/8 Rappresentazione grafica della Funzione di ripartizione Ha l’aspetto di una funzione a gradini. In corrispondenza di ogni valore c’è un salto proporzionale alla probabilità associata a quel valore Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 11 Si consideri ad esempio la seguente distribuzione di probabilità di una v.c. discreta: X -3 P(x) 0,1 -1 0,3 0 0,1 2 0,2 4 0,1 5 0,2 P(x) 0,4 distribuzione di probabilità 0,3 0,2 0,1 X 0 F(x) -3 -2 -1 0 1,0 1 2 3 4 5 0,2 0,8 0,6 0,3 0,4 funzione di ripartizione 0,2 0 -3 -2 -1 0 1 2 3 4 5 12 X Misure sintetiche della distribuzione di probabilità di una v.c. discreta In analogia con le distribuzioni di frequenza, anche per le distribuzioni di probabilità è utile avere degli indici di sintesi Valore medio o atteso (Expected Value) E(X) xiP(xi ) i Varianza V(X) Confronta con la formula della media di una distr. di freq. rel. 2 2 x E ( X ) P(xi ) i x K x f j1 K x j1 j j x fj 2 j i Deviazione standard SD(X) V(X) Confronta con la formula della varianza di una distr. di freq. rel. 13 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Calcolo dei valori caratteristici di una distribuzione di probabilità V.C. NUMERO DI TESTE nel lancio di due monete X P(x) E ( X ) xi P ( xi ) i 0 1/4 1 2/4 0 0,25 1 0,5 2 0,25 1 V ( X ) xi E ( X ) P ( x i ) 2 2 1/4 i 0 1 0,25 1 1 0,5 2 1 0,25 0,5 2 2 2 SD( X ) V ( X ) 0,5 0,7 14 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti V.c. continua Una v.c. si dice continua se può assumere tutti i valori di un determinato intervallo di numeri reali. Una v.c. continua estende l’idea di variabile statistica continua Misure di altezza, peso, durata, consumo, reddito, ecc. Esempi di v.c. continua Dall’insieme dei debiti verso i fornitori di un’azienda, il revisore estrae casualmente un valore. Questo importo è una v.c. continua. Dall’elenco dei dipendenti di una ditta, l’Ufficio Stipendi ne estrae casualmente uno e legge il suo salario. Il salario di un dipendente estratto a caso è una v.c. continua. 15 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti V.c. continua Consideriamo la v.c. altezza di un collettivo di ragazzi. La v.c. assume valori tra 156 e 177. Si suddivide l’intervallo in N piccoli intervalli Probabilità che X assuma valori nell’intervallo 166,0 e 166,5 Area complessiva degli N rettangoli è uguale a 1 Istogramma di probabilità Funzione di densità Se si aumenta N (o si diminuisce l’ampiezza degli intervalli) il profilo del grafico tende a una curva continua. Modello descrittivo di una v.c. continua che prende il nome di funzione di densità. La probabilità è una area sotto la curva 16 ab P(a<X<b) Funzione di densità La variabile aleatoria continua è definita dalla funzione di densità f(x) 1) La funzione deve essere positiva 2) L’area totale sotto la funzione deve essere uguale a 1 f(x) funzione di densità X b f(x) P(a X b) f(x)dx a è l’area colorata al di sotto della curva compresa tra i valori a e b Proprietà: f(x) 0 f(x)dx 1 P(X a) 0 X 17 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Funzione di ripartizione x Per ogni valore x posso calcolare la probabilità di non superarlo F ( x ) P( X x ) Si definisce in tal modo la funzione di ripartizione come area sottesa a sinistra del valore x 18 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Funzione di ripartizione F(x) P(X x) x f(w)dw Proprietà: F(x) è non decrescente lim F(x) 0; lim F(x) 1 x F(x) x 1 Rappresentazione grafica di una Funzione di ripartizione continua F(x1 ) P(x1 x x 2 ) F(x1 ) 0 x1 x 2 x 19 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Misure sintetiche della distribuzione di probabilità di una v.c. continua Valore medio o atteso (Expected Value) E(X) xf(x)dx Varianza V(X) 2 x E(x) f(x)dx Confronta con la formula del valore medio di una v.c. discreta V(X) E(X) x P(x ) i i 2 x E ( X ) P(xi ) i i Deviazione standard SD(X) V(X) i Confronta con la formula della varianza di una v.c. discreta Standard Deviation (SD) Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 20 VARIABILI STANDARDIZZATE E TEOREMA DI CHEBYSHEV Se X è una v.c. con valore E(X) e SD(X) allora: X E( X ) Y SD( X ) È una v.c. standardizzata con E(Y)=0 e V(Y)=1 Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza: P X E X k SD X 2 k 1 Indipendentemente dalla distribuzione della v.c. , la probabilità che X assuma valori distanti dalla media più di k deviazioni standard è al più 1/k2 21 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Principali distribuzioni di probabilità di v.c. V.c. discrete Bernoulli Binomiale Poisson V.c. continue Normale Chi-quadrato T di Student F di Fisher 22 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti