INTRODUZIONE Teoria delle probabilità è la parte della matematica che formalizza e quantifica il concetto di incertezza. I fenomeni che interessano la teoria della probabilità devono essere incerti nei risultati e ripetibili. La statistica consta di due filoni : statistica descrittiva ed inferenziale. La statistica descrittiva è volta a rappresentare tramite mezzi matematici fenomeni reali. La statistica inferenziale risolve il cosiddetto problema inverso, ossia perviene a soluzioni valide per la popolazione a partire da un campione della popolazione stessa. La statistica moderna si può far risalire al P.S. Laplace, che ne fece la prima sistemazione teorica nel 1812. ALGEBRA DEGLI EVENTI L’algebra degli eventi studia le relazioni fra eventi e loro proprietà. Si parte dal concetto di prova: Per prova si intende un esperimento soggetto ad incertezza e tale per cui: - Tutti i possibili risultati devono essere noti a priori - Il risultato della prova deve essere incognito - L’esperimento può essere iterato. Per estrazione si intende l’individuazione di un insieme di unità (unità statistiche) da una popolazione tramite procedimento casuale (es. l’estrazione di palline da un’urna). Si distinguono due tipi di estrazione: - Estrazione con ripetizione (o bernoulliana) se la pallina una volta estratta è rimessa nell’urna - Estrazione senza ripetizione (o in blocco) se una volta estratta la pallina non è rimessa nell’urna e quindi non può più essere estratta. Per evento intendiamo uno dei possibili risultati della prova (nel caso dei dadi, un evento sarà ad esempio {faccia con due punti} ). L’insieme di tutti i possibili risultati è detto spazio campione Ω ed i suoi elementi sono i punti campione. Nel caso del dado, Ω= in cui E1,..,E6 sono i punti campione. Uno spazio campione si dice: -discreto se è costituito da un numero finito o una infinità numerabile di punti campione (es. lo spazio del lancio di due dadi, {(E1,E1), (E1,E2),…,(E6,E5),(E6,E6)} -continuo se è costituito da un’infinità non numerabile di punti campione (es. le misurazioni dell’altezza di un campione). L’algebra degli eventi è mutuata dall’algebra di Boole. Ne conseguono le seguenti definizioni, assiomi, teoremi. Se per gli eventi di A (evento complesso) vale A=Ω, tutti gli eventi di A si verificano necessariamente. L’insieme vuoto è l’insieme senza alcun elemento Ø, e se vale A=Ø allora gli eventi di A non si verificano ed A è l’evento impossibile. Utilizziando i diagrammi di Venn, lo spazio campione è un rettangolo e al suo interno si disegnano gli eventi e le operazioni fra eventi: unione, intersezione, negazione. Si dice unione fra due eventi A e B, L’evento C che si verifica quando almeno uno dei due eventi A o B si verifica, o se si verificano entrambi: Ne segue che Se gli eventi sono in numerro finito o infinito, siano E1,E2,…,En una raccolta di eventi , si avrà allora è l’evento unione e si verifica quando almeno uno degli eventi si verifica. Possiamo definire evento elementare l’evento che non è costituito da altri eventi elementari, e evento composto l’evento costituito da più eventi elementari. Lo spazio campione è l’evento certo, un solo punto campione è evento elementare. L’insieme di elementi non inclusi in A costituisce la sua negazione o complemento, oppure . Dati due eventi A e B, si dice intersezione di A e B L’evento C che si verifica se e solo se si verificano sia A che B. Un evento elementare è quindi l’evento E per cui, per ogni evento A, o E è incluso in A oppure è incompatibile con A (ossia A E=E oppure AE= ) . quando AB = A Attraverso i diagrammi di Venn è semplice verificare le seguenti proprietà notevoli: Idempotenza Elemento neutro Commutativa Associativa Distributiva Secondo le leggi di De Morgan, la negazione dell’unione è uguale all’intersezione fra le negazioni di ciascun evento: = Invece la negazione dell’intersezione di due eventi è uguale all’unione delle loro negazioni: = Partizione di Ω Se A e B si dicono incompatibili o mutuamente esclusivi. Si dicono invece necessari due eventi la cui unione è l’evento certo: Si dice partizione di Ω una raccolta di eventi necessari ed incompatibili, ossia tali che la loro unione è l’evento certo e sono incompatibili a due a due: . DEFINIZIONI DI PROBABILITA’ Il concetto di probabilità non è univocamente stabilito. Esistono almeno tre definizioni del termine probabilità. - Definizione classica (Galileo, Fermat, Laplace) : dato un esperimento ed un evento E , siano m i possibili risultati che danno luogo ad E ed n i possibili risultati (tutti ugualmente possibili) dell’esperimento. Allora la probabilità dell’evento E è e vale anche 0≤P(E)≤1 Se il numero di casi favorevoli all’evento è 0, l’evento è impossibile, se invece m=n l’evento è certo. Questa definizione di probabilità però necessita di contenere in sè il significato di casi ugualmente possibili, ossia equiprobabili, formando un circolo vizioso. - Definizione frequentista (R. von Mises) Si fonda sulla relazione fra probabilità e frequenza, quest’ultima definibile a posteriori dopo l’esperimento. Dato un esperimento ripetibile ed un evento E fra i possibili eventi risultanti, sia (frequenza assoluta di E) esperimenti. Allora numero di volte in cui E si è verificato in n Ossia P(E ) è il limite cui tende la frequenza dell’evento E quando il numero delle prove (nelle medesime condizioni) tende all’infinito. La cosiddetta legge empirica del caso viene usata ad esempio dalle assicurazioni. Tuttavia non è mai possibile avere infinite prove e la condizione di ripetibilità non è quasi mai attuabile. - Definizione soggettivista (De Finetti) . Tipica del gioco d’azzardo. Si basa sul grado di fiducia circa il verificarsi di un evento in base alle informazioni di cui si è in possesso. Dato un esperimento ed un evento E fra i possibili eventi risultanti, la probabilità di E è la somma che un individuo equilibrato è disposto scommettere in un gioco equo in cui riceverebbe un importo unitario se E si verificasse. Ad esempio, se un individuo è disposto a pagare 20 euro per riceverne 100 in caso di vittoria di un cavallo, questo equivale a dire che per lo scommettitore la probabilità di vittoria del cavallo è 0.2 . Questa definizione è poco rigorosa. ASSIOMATIZZAZIONE DEL CALCOLO DELLE PROBABILITA’ Kolmogorov (1933) introdusse una formalizzazione rigorosa utilizzando concetti primitivi, formalizzati in assiomi, e deducendo da questi una serie di teoremi. Concetti primitivi: prova, evento, probabilità (numero associato al verificarsi di un evento). Siano i=1,…,n n eventi nello spazio campione Sia la probabilità dell’evento i esimo. Ad ogni evento è associato un numero reale . t.c. POSTULATO 1: La probabilità di un evento è una funzione che assegna ad ogni evento un numero reale non negativo POSTULATO 2: L’evento certo Ω ha probabilità 1, POSTULATO 3: La probabilità dell’unione di una infinità numerabile di eventi incompatibili è uguale alla somma delle singole probabilità: P ( Ei ) P( Ei ) i 1 i 1 Sulla base di questi postulati sono dimostrabili i seguenti Teoremi: 1. 2. 3. 4. 5. 6. (per eventi non incompatibili) 7. n 8. P( E 1E 2 ... E n ) P( Ei ) i 1 n P( E i j 1 i Ej) P( E i j h 1 i E j E h ) ..... (1) n1 P( E1 E 2 ..... E n ) Valgono inoltre n Diseguaglianza di Boole P( E1 E 2 .... E n ) P( Ei ) i 1 Diseguaglianza di Bonferroni N n i 1 i 1 P( E1 E2 ..... En ) 1 P( Ei ) P( Ei ) (n 1) PROBABILITA’ CONDIZIONATA Interessa valutare la probabilità di un evento una volta che se ne è verificato un altro (che diventa quindi certo). Probabilità condizionata di B dato A (supposta ) Quindi la probabilità che si verifichino sia A che B (1) Se invece A e B sono eventi indipendenti sarà Ed in questo caso segue Dati m>1 eventi, questi sono mutuamente indipendenti se TEOREMA DELLE PROBABILITA’ TOTALI Siano eventi mutuamente incompatibili che costituiscono una partizione di Ω. Allora per ogni evento si ha come discende facilmente dal Postulato 3 e dalla (1). TEOREMA DI BAYES E’ il fondamentale teorema che consente di calcolare la probabilità che, nel verificarsi di un evento, abbia agito una causa in un gruppo di cause incompatibili ed esaustive. Siano eventi che costituiscono una partizione di Ω. Allora per qualunque evento , la probabilità di dato E è Il teorema si dimostra a partire dalla (1) e dal teorema delle probabilità totali. Nel teorema vengono considerate: - le probabilità a posteriori dell’ipotesi dato l’effetto : - le probabilità a priori che le singole ipotesi si verifichino: - le verosimiglianze che l’effetto sia stato causato da una data ipotesi: . Dimostrazione: Dalla (1) si ha che P( H i | E ) P( H i E ) P( E ) m Ma essendo E ( E H j ) si può scrivere per il teorema delle probabilità j 1 totali m P( E ) P( H j ) P( E |H j ) j 1 e sempre per la (1) si ottiene subito P( H i | E ) P( H i ) P( E | H i ) P( E ) e sostituendo la (2) si ottiene la formula del Teorema di Bayes. (2) RICHIAMI DI CALCOLO COMBINATORIO DISPOSIZIONI SENZA RIPETIZIONE Le disposizioni senza ripetizione DN ,n di N elementi ad n ad n (o di classe n) sono gruppi di n elementi tratti dagli N e tali che due gruppi differiscono tra loro - per almeno un elemento - pere l’ordine degli elementi. Si vede che DN ,n N ( N 1)( N 2)...( N n 1) N! ( N n)! DISPOSIZIONI CON RIPETIZIONE Le disposizioni con ripetizione di N elementi a n a n sono gruppi che si formano dagli N elementi associando ogni elemento con gli altri e anche con se stesso. I gruppi differiscono fra loro - per almeno un elemento - per l’ordine - per la ripetizione. - Si vede che r PERMUTAZIONI DN ,n N n . Le permutazioni di n elementi sono le disposizioni senza ripetizione di n elementi in n posti, vale Pn n(n 1)(n 2)...3 2 1 e si indica con il fattoriale di n (n!). COMBINAZIONI SENZA RIPETIZIONE Le combinazioni senza ripetizione di N elementi ad n ad n si formano dagli N elementi in modo che ciascun gruppo differisca da un altro per almeno un elemento. Si vede che vale C N ,n DN ,n Pn C N ,n N ( N 1)( N 2)...( N n 1) N! = n! n!( N n)! N ( ) n coefficiente binomiale . COMBINAZIONI CON RIPETIZIONE Le combinazioni con ripetizione di N elementi ad n ad n sono gruppi di n elementi fra loro uguali o diversi e tali che due gruppi differiscono fra loro per - almeno un elemento - la ripetizione. Si ottiene r C N ,n C N n1,n ( N n 1 n )