Elementi di probabilità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di Napoli Federico II Professore supplente, Università della Basilicata a.a. 2011/2012 Prof. Roberta Siciliano Statistica 1 Obiettivo dell’unità didattica • Introdurre gli elementi fondamentali della teoria della probabilità e l’utilità per l’inferenza statistica Contenuti • Probabilità e inferenza statistica • Le diverse scuole • Elementi di calcolo delle probabilità Prof. Roberta Siciliano Statistica 2 1 Probabilità e inferenza statistica • La teoria della probabilità consente la costruzione di modelli matematici per lo studio di fenomeni aleatori o casuali • Sviluppa le conseguenze logico-deduttive che derivano dall'applicazione di tali modelli. Prof. Roberta Siciliano Statistica 3 Il passaggio alla inferenza statistica • I risultati e gli schemi interpretativi della teoria della probabilità vengono poi utilizzati dall'inferenza statistica per giungere ad una scelta tra i modelli matematici alternativi che possono aver generato i dati campionari o sperimentali. Prof. Roberta Siciliano Statistica 4 2 La differenza • Mentre la teoria della probabilità stabilisce i risultati che ci si può attendere dall'esecuzione di un esperimento o dalla rilevazione campionaria, l'inferenza statistica si serve dei risultati sperimentali o campionari per costruire o interpretare la legge generale sulla popolazione (secondo il metodo induttivo, dal particolare al generale). Prof. Roberta Siciliano Statistica 5 Esempio • Si supponga di dover determinare la proporzione di clienti che scelgono il pagamento con carta di credito, considerando il totale di clienti che acquistano con regolarità in un supermercato. • Il problema si traduce nella stima della probabilità che un cliente, che acquista con regolarità, scelga di pagare con carta di credito. • Tale stima dovrà essere effettuata in condizioni di incertezza, in quanto non è possibile rilevare tale informazione per la totalità dei clienti, bensì occorrerà basarsi sulle informazioni derivanti dalla rilevazione di un campione statistico di clienti che acquistano con regolarità. Prof. Roberta Siciliano Statistica 6 3 Esempio • Con il calcolo delle probabilità si associa alla popolazione che genera i dati campionari, un modello matematicoprobabilistico da cui è possibile far discendere con logicadeduttiva i possibili risultati derivanti dall’estrazione casuale delle osservazioni campionarie. • Con il metodo induttivo si perviene alla stima e, attraverso il calcolo delle probabilità, è possibile controllare il margine di rischio o di incertezza derivante dall’informazione parziale. Prof. Roberta Siciliano Statistica 7 Il processo deduttivo • La Teoria della Probabilità deduce dal contenuto noto della popolazione il contenuto probabile del campione, cioè deduce le proprietà di un processo fisico da un modello matematico. Prof. Roberta Siciliano Statistica 8 4 Il processo induttivo • L'Inferenza Statistica induce le caratteristiche della popolazione dall'analisi del contenuto del campione osservato, cioè inferisce le proprietà del modello matematico a partire dall'analisi dei dati campionari che sono stati osservati. Prof. Roberta Siciliano Statistica 9 Interpretazione della Probabilità • La Probabilità è un concetto che viene usato in molte discipline e che è ormai entrato a far parte del linguaggio corrente in quanto usualmente si devono prendere decisioni che, anche dopo aver esaminato le informazioni disponibili, vengono maturate in condizioni di incertezza. Prof. Roberta Siciliano Statistica 10 5 Le Definizioni di Probabilità • Nonostante ciò è difficile dare un'interpretazione, e quindi una definizione, di probabilità che sia completamente soddisfacente ed esente da critiche. • Si sono succedute nella storia diverse scuole di pensiero: – I classici – I frequentisti – I soggettivisti – Gli assiomatici Prof. Roberta Siciliano Statistica 11 Scuola Classica • La probabilità è il rapporto tra il numero dei casi favorevoli al verificarsi di un risultato e il numero totale dei possibili risultati, ammesso che questi siano egualmente possibili. • Critica: la definizione è ridondante in quanto “egualmente possibili” è sinonimo di “egualmente probabili”. Prof. Roberta Siciliano Statistica 12 6 Scuola Frequentista • La probabilità è il limite della frequenza relativa di un evento ripetibile quando cresce, oltre ogni limite, il numero delle prove. • Critica: non sempre è possibile ripetere l’esperimento all’infinito! Prof. Roberta Siciliano Statistica 13 Scuola Soggettivista • La probabilità rappresenta il grado di fiducia che un individuo coerente attribuisce al presentarsi di un evento, ovvero, per quantificare, come la somma p che è disposto a scommettere quando, verificandosi l'evento, vince 1. • Critica: il grado di fiducia è stabilito in maniera soggettiva e pertanto la probabilità non è univocamente determinata. Prof. Roberta Siciliano Statistica 14 7 L'Impostazione Assiomatica • La probabilità non si definisce, è un concetto primitivo. • L’impostazione assiomatica si basa su: – Concetti Primitivi – Postulati – Teoremi fondamentali Prof. Roberta Siciliano Statistica 15 I concetti primitivi • Si introducono i Concetti Primitivi e la loro reciproca relazione: • "la Prova genera l'Evento con una certa Probabilità" Prof. Roberta Siciliano Statistica 16 8 • Prova: è un esperimento soggetto a incertezza e può suddividersi in sottoprove. Prof. Roberta Siciliano Statistica 17 • Evento: è uno dei possibili risultati della prova e costituisce un insieme di descrizioni circa i possibili risultati dell'esperimento. • L'insieme di tutti i risultati possibili prende il nome di Spazio Campionario. Prof. Roberta Siciliano Statistica 18 9 • Probabilità: è un numero reale compreso tra 0 e 1 associato al presentarsi di un evento e gode di proprietà intuitive formalizzate nei postulati Prof. Roberta Siciliano Statistica 19 I postulati Si stabiliscono delle affermazioni, detti Postulati o Assiomi, che non si dimostrano Prof. Roberta Siciliano Statistica 20 10 I teoremi fondamentali • Dai postulati si deducono tutte le possibili conseguenze, sia logiche sia matematiche, pervenendo alla dimostrazione dei Teoremi del calcolo delle probabilità. Prof. Roberta Siciliano Statistica 21 L'Algebra degli Eventi • a) Unione o Somma Logica fra due eventi A e B è quell'evento C che si verifica quando si verifica A oppure B oppure A e B contemporaneamente: • C = A ∪ B (“ A o B ”) Prof. Roberta Siciliano Statistica 22 11 • b) Intersezione o Prodotto Logico fra due eventi A e B è quell'evento D che si verifica quando si verifica sia A sia B contemporaneamente: • D = A ∩ B (“ A e B ”) Prof. Roberta Siciliano Statistica 23 • c) Negazione di un evento A è quell'evento E che si verifica allorquando A non si verifica: • E = (“ non A ”) • Si può anche indicare con Prof. Roberta Siciliano Statistica 24 12 Eventi particolari • Evento Certo = I: è l'evento che si verifica sempre; • Evento Impossibile = : è l'evento che non può mai verificarsi; • Evento Incompatibile: Prof. Roberta Siciliano Statistica 25 Eventi particolari • Evento Necessario: • Evento Elementare: Prof. Roberta Siciliano Statistica 26 13 Alcune definizioni ….. • Spazio Campionario S: è l'insieme di tutti i risultati possibili dell'esperimento. • Spazio degli Eventi: una classe di eventi ai quali si vuole assegnare una probabilità e che questa classe sia un'algebra, ovvero che contenga S e come elementi e sia chiusa rispetto alla complementazione e all'unione. Prof. Roberta Siciliano Statistica 27 Alcune definizioni • Quando S è costituito da un numero finito k di elementi, lo spazio degli eventi può essere rappresentato dall'insieme di tutti i possibili sottoinsiemi di S ed ha cardinalità 2k. Prof. Roberta Siciliano Statistica 28 14 Esempi • lancio di una moneta Prof. Roberta Siciliano Statistica 29 Esempi • lancio di un dado Prof. Roberta Siciliano Statistica 30 15 Esempi • lancio di un dado (cont.) Prof. Roberta Siciliano Statistica 31 Diagrammi di Venn • Le relazioni dell'algebra degli eventi vengono illustrate su un piano mediante grafici caratteristici detti Diagrammi di Venn nei quali lo spazio campionario viene disegnato come un rettangolo all'interno del quale vengono posti insiemi chiusi che rappresentano gli eventi. Non interessa l'esatto contorno, quanto piuttosto le mutue relazioni fra di essi e con lo spazio campionario. Prof. Roberta Siciliano Statistica 32 16 Diagrammi di venn Spazio Campionario S A B A S Prof. Roberta Siciliano B S Statistica 33 Diagrammi di Venn S S Prof. Roberta Siciliano Statistica 34 17 I postulati del Calcolo delle Probabilità I. Positività: La Probabilità di un evento A è un numero unico non negativo: P(A)≥0. II.Certezza: La Probabilità dell’evento certo e quindi dello Spazio Campionario S è sempre 1: P(I)=P(S)=1. III. Unione: Se A e B sono eventi incompatibili, allora la probabilità della loro unione è la somma delle singole probabilità di A e B: Prof. Roberta Siciliano Statistica 35 Modello Probabilistico • Consiste nell'insieme ipotizzato dei risultati possibili di una prova e nella descrizione delle probabilità assegnate a tali risultati. • Spazio Campionario S: E' l'insieme di tutti i risultati possibili dell'esperimento. Prof. Roberta Siciliano Statistica 36 18 . Quando l’assegnazione delle probabilità ad eventi soddisfa i tre postulati, la funzione P(evento) viene definita funzione di probabilità. Prof. Roberta Siciliano Statistica 37 I Teoremi Fondamentali Teorema della Probabilità Totale P(A ∪ B) = P(A) + P(B) - P(A ∩ B) A B S € Prof. Roberta Siciliano Statistica 38 19 I Teoremi Fondamentali (cont.) Generalizzazione al caso di 3 eventi A B C Prof. Roberta Siciliano S Statistica 39 Probabilità Condizionata • La probabilità dell'evento B, dato che si è verificato l'evento A, è il rapporto fra la probabilità del contemporaneo verificarsi di A e B e la probabilità di A, se questa è diversa da zero: Teorema della Probabilità Composta P(A ∩ B) = P(A | B) × P(B) = P(A) × P(B | A) Prof. Roberta Siciliano Statistica 40 € 20 Indipendenza Stocastica • Due Eventi A e B sono Stocasticamente Indipendenti se: P(A ∩ B) = P(A) × P(B) € Prof. Roberta Siciliano Statistica 41 Teorema di Bayes • Siano date due cause, A e la negazione di A, che possono generare l’evento E • Siano date le probabilità a-priori delle singole cause e le probabilità probative del verificarsi dell’evento E date le singole cause. • Si dimostrano le probabilità a-posteriori: P( A | E ) = P ( A) P ( E | A) P ( A) P ( E | A) = P( E ) P ( A) P ( E | A) + P ( A ) P ( E | A ) P( A | E ) = P ( A )P( E | A ) P( A )P( E | A ) = P( E ) P ( A) P ( E | A) + P ( A ) P ( E | A ) Prof. Roberta Siciliano Statistica 42 € 21 Una misura della Probabilità • Data una Prova che genera k eventi elementari • E1, ..., Ek necessari , • E1 ∪ E2 ∪….∪ Ek = I, • incompatibili a due a due Prof. Roberta Siciliano Statistica 43 Una misura della Probabilità • Dai postulati si deduce univocamente la misura della probabilità per ciascuno di essi 1 P(E i ) = k € Prof. Roberta Siciliano Statistica 44 22 Il postulato empirico del caso • In una successione di prove, ripetute molte volte nelle stesse condizioni, ogni evento si presenta con una frequenza relativa quasi uguale alla sua probabilità; • la differenza tra frequenza relativa e probabilità di un evento tende ad annullarsi all'aumentare delle prove. Prof. Roberta Siciliano Statistica 45 osservazioni la frequenza è un concetto a posteriori, cioè si calcola dopo aver compiuto l'esperimento, mentre la probabilità è un concetto a priori, cioè si calcola prima dell'esperimento e senza che sia necessario effettuarlo; Prof. Roberta Siciliano Statistica 46 23 osservazioni • nella teoria della probabilità alla parola "caso" non si dà il significato che gli affida il linguaggio comune; per lo statistico, in un esperimento concreto, "caso" è l'insieme di quei fattori che egli non ritiene preponderanti nel determinare il risultato della prova; Prof. Roberta Siciliano Statistica 47 osservazioni • la "tendenza" della frequenza relativa verso la probabilità di un evento non deve essere interpretata nel senso dell'analisi matematica (cioè come il limite di una successione); essa scaturisce solo da una universale convinzione circa il comportamento degli eventi casuali. Prof. Roberta Siciliano Statistica 48 24