Le variabili casuali o aleatorie Intuitivamente un numero casuale o aleatorio è un numero sul cui valore non siamo certi per carenza di informazioni - ad esempio la durata di un macchinario, il valore di un titolo fra 2 giorni Nella teoria della probabilità il numero aleatorio è definito formalmente con riferimento a un esperimento casuale o aleatorio. Consideriamo ancora il risultato di un esperimento casuale (lancio di una moneta o di un dado......) e sia S il suo spazio campionario. Si può associare a ogni evento semplice (o complesso) di S un numero reale positivo (per esempio il risultato di una misura) legandolo a una caratteristica dell'evento. Il numero associato è una variabile casuale (o aleatoria) poiché è stato riferito al risultato di un esperimento esso stesso casuale. 1 Esempio: lancio di 2 dadi indipendenti Sia S lo spazio campionario dell'esperimento lancio di 2 dadi indipendenti e si osservi la somma delle facce in ogni lancio Si può immaginare di raccogliere in un unico evento complesso gli eventi semplici che danno la stessa somma e associare a detto evento complesso il numero reale positivo somma X delle facce (1,6) (2,5) 3,4) (4,3) (5,2) (6,1) → 7 La variabile aleatoria X può assumere i valori interi da 2,..., 12. L'intervallo di valori di X è detto spazio campionario numerico Legge di probabilità di un numero aleatorio Xi La probabilità di Xi, che si indica P(Xi), è la probabilità dell'evento elementare o complesso Ei a cui è stata associata la variabile Xi Se gli eventi Ei sono mutualmente eclusivi e costituiscono una partizione dello spazio S ovvero E1 ∩ E2 ∩ E3 ∩ E4 ∩ … = S la condizione di S P(Ei) = 1 equivale alla condizione di normalizzazione S P(Xi) =1 DISTRIBUZIONE DI PROBABILITA' di una variabile aleatoria discreta ● ● ● ● ● ● La funzione P(Xi ) precedente è un esempio semplice di distribuzione di probabilità di una variabile discreta Esempio: pesare una massa Evento Ei → operazione di pesata Xi → risultato della pesata P(Xi) probabilità di avere come risultato xi Gli eventi Ei, da cui le variabili Xi provengono sono mutualmente eclusivi e costituiscono una partizione dello spazio S. ● Vale pertanto la condizione Σ P(Xi) = 1 ● E' utile rappresentare graficamente la funzione P(Xi) Esempio: distribuzione di probabilità della variabile somma dei numeri che appaiono sulle facce superiori nel lancio di 2 dadi simmetrici E' facile verificare,usando la regola della probabilita’ totale per eventi disgiunti,che le probabilità P(Xi) sono : P(2)=1/36, P(3)=2/36, P(4)=3/36, P(5)=4/36, P(6)=5/36 P(7)=6/36, P(8)=5/36, P(9)=4/36, P(10)=3/36, P(11)=2/36, P(12)=1/36 Σ P(Xi) = 1 DISTRIBUZIONE DI PROBABILITA' di una variabile aleatoria continua Se la variabile casuale X può assumere tutti i valori in un intervallo continuo (a,b), la variabile è detta continua. Si noti che la variabile casuale continua è un'astrazione: essa non è osservabile nella realtà. Qualsiasi esperimento di misura può dare solo luogo a un insieme discreto di numeri per il limite di precisione dello strumento di misura. Ciò non toglie che le variabili casuali continue abbiano grande importanza nella statistica come modelli approssimati di situazioni reali Esempio Si supponga di voler considerare l'altezza di adulti maschi estraendo un campione a caso da una popolazione. L'altezza di una popolazione è di per sè una variabile continua, ma la misura di un numero finito della variabile altezza estratta da un campione porta a un numero discreto di valori. Pur tuttavia si può immaginare di procedere intuitivamente assegnando a intervalli contigui della variabile altezza una probabilità che soddisfi la definizione assiomatica. Rappresentazione della distribuzione di probabilità per variabili aleatorie continue La rappresentazione grafica che corrisponde ad una suddivisione in intervalli dello spazio campionario di una variabile aleatoria continua è un istogramma a intervalli, ossia con rettangoli aventi per basi segmenti uguali all'ampiezza D dell'intervallo scelto e per altezza la probabilità dell'intervallo diviso D. Si immagini ora di prendere intervalli sempre più piccoli. Il profilo del grafico diventa sempre più regolare mentre resta invariato il significato dell'altezza e dell'area dell'istogramma il cui valore totale è 1. Si dice che l'istogramma è normalizzato a 1 ovvero che la probabilità che una misura della variabile-altezza sia compresa nell'intero range o spazio campionario della variabile è 1 (risultato certo) La rappresentazione grafica che corrisponde a una suddivisione in intervalli dello spazio campionario di una variabile aleatoria continua è un istogramma a intervalli, ossia con rettangoli aventi per basi segmenti uguali all'ampiezza D dell'intervallo scelto e per altezza la probabilità dell'intervallo / D . Funzione densità di probablità Spingendo al limite → 0 l'intervallo ∆ si può immaginare che la spezzata diventi una curva continua f(x) detta funzione di densità di probabilità. Definizione : si chiama funzione densità di probabilità della variabile casuale continua X, definita nell'intervallo a-b, la funzione che possiede le seguenti proprietà: Definizione di funzione densita’ di probabilita’ Si chiama funzione densità di probabilità di una variabile casuale continua X definita nell'intervallo (a,b) una funzione che possiede le seguenti proprietà: f(x) 0 ∫ab f(x)dx = 1 Ovvero e’ definita positiva ,continua ed integrabile nell’intervallo a-b Valore medio atteso , varianza e deviazione standard di una distribuzione di probabilita’ Si definisce valore medio atteso o media della variabile casuale X il numero m =E(X) = Σi xi P(xi) per distribuzioni discrete E(X) = ∫ab x f(x)dx per distribuzioni continue. si definisce varianza di X e si indica con s2 s 2 = Σi (xi- µ)2 P(xi) per distribuzioni discrete s2 = ∫ab (x - µ)2 f(x)dx per distribuzioni continue Si definisce deviazione standard s la radice quadrata della varianza Momenti Per una variabile casuale X discreta (o continua) avente una funzione di distribuzione di probabilità P(X) (o funzione di densità di probabilità f(x)) è possibile introdurre i cosiddetti momenti (rispetto all'origine) µk di ordine k µk = E(Xk) Il momento di ordine 1 è il valore atteso E(X) = µ Il momento di ordine 2 µ2 = E(X2) = Σi Xi2 P(Xi) per distribuzioni discrete µ2 = E(X2) = ∫ab x2 f(x)dx per distribuzioni continue. Distribuzione discreta uniforme Siano gli eventi equiprobabili E1, E2, E3, E4, E5, E6 comparsa delle 6 facce di un dado E1 ∩ E2 ∩ E3 ∩ E4 ∩ E5 ∩ E6= S ● X i =(1,2,3,4,5,6) le variabili casuali associate = numero che compare sulle facce ● P(xi)=1/6 ● Valor medio atteso m = E(x) = S xi P(xi) = 3.5 ● ● Varianza s2 = S P(xi) (xi - m) 2 = = S P(xi) (xi)2 - 2m S xi P(xi) + (m)2 S P(xi) = S P(xi) (xi)2 - (m)2 = 1/6*(1+4+9+16+25+36) - (3.5)2 =91/6-12.25= 2.917 e quindi deviazione standard σ=1.708 Distribuzione uniforme continua ●