INFERRE COLLANA DI PROBABILITÀ E STATISTICA MATEMATICA Direttore Corrado T Università degli Studi di Palermo Comitato scientifico Giuseppe R Università degli Studi di Palermo Francesco R University of Cape Town Francesco T Università degli Studi di Palermo INFERRE COLLANA DI PROBABILITÀ E STATISTICA MATEMATICA Credo che il calcolo delle probabilità sia l’unica branca della matematica in cui buoni autori ottengono spesso risultati completamente sbagliati. Charles P La collana è orientata verso due direzioni diverse ma connesse tra loro. La prima ha come obiettivo quello di trasferire gradualmente al lettore (studente o meno) un messaggio preciso, anche se a prima vista ovvio: i metodi della matematica pura sono fondamentali e formano il tessuto connettivo essenziale al calcolo delle probabilità e alla statistica. Ciò non è scontato, perché si nota una carenza significativa nel panorama editoriale italiano di testi orientati in tal senso. Questa chiave di lettura, quindi, privilegia testi con linguaggio formale della matematica pura nella teoria delle probabilità e della statistica matematica, senza escludere le applicazioni. I volumi sono pensati per gli studenti delle scuole di matematica. La seconda direzione, usando un linguaggio meno formale ma pur sempre essenziale e rigoroso, riguarda l’applicazione del calcolo delle probabilità e della statistica descrittiva a specifici temi, quali la teoria dei giochi, le scienze naturali, la chimica, la farmacia, la medicina, l’ingegneria, la biologia, la sociologia, l’economia e la finanza. Corrado Tanasi Calcolo delle probabilità con elementi di Statistica matematica II edizione Aracne editrice www.aracneeditrice.it [email protected] Copyright © MMXVI Gioacchino Onorati editore S.r.l. – unipersonale www.gioacchinoonoratieditore.it [email protected] via Sotto le mura, Canterano (RM) () ---- I diritti di traduzione, di memorizzazione elettronica, di riproduzione e di adattamento anche parziale, con qualsiasi mezzo, sono riservati per tutti i Paesi. Non sono assolutamente consentite le fotocopie senza il permesso scritto dell’Editore. I edizione: maggio Indice Introduzione 1 Algebra degli eventi 1.1 Algebra di Boole . . . . . . . . . . . . . . . . . . . . . 1.2 Elementi di calcolo combinatorio . . . . . . . . . . . . 17 117 27 2 Probabilità di un evento 2.1 Stupirsi di un evento poco probabile 2.1.1 Dove cade un fulmine? . . . . 2.2 Teorema delle probabilità totali . . . 2.3 Probabilità di alcuni giochi popolari 2.3.1 Legge del caso? . . . . . . . . 2.3.2 Lotto . . . . . . . . . . . . . 2.3.3 Superenalotto . . . . . . . . . 2.3.4 WinforLife . . . . . . . . . . . 2.4 Diagramma ad albero . . . . . . . . 2.5 Il problema della rovina del giocatore 2.6 Formula di Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 44 51 52 56 56 57 59 64 65 67 71 3 Variabili aleatorie discrete 3.1 Modelli discreti . . . . . . . . . . . . . . . . . . . . . 3.2 Speranza matematica (o valore atteso) . . . . . . . . 3.2.1 Speranza matematica e gioco equo . . . . . . 3.2.2 Speranza matematica come operatore lineare 3.2.3 Disuguaglianza di Schwarz . . . . . . . . . . . . . . . . 7 7 77 80 81 83 88 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 8 Indice Indice 3.2.4 3.3 3.4 3.5 3.6 3.7 3.8 3.9 Speranza matematica di una funzione di una variabile aleatoria . . . . . . . . . . . . . . . . Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Notizie storiche e significato dei momenti . . . Coefficiente di correlazione di due variabili aleatorie . . Variabile aleatoria di Bernoulli . . . . . . . . . . . . . La variabile aleatoria polinomiale . . . . . . . . . . . . La variabile aleatoria ipergeometrica . . . . . . . . . . La speranza matematica e la varianza di una H(a, b, n) Variabile aleatoria geometrica . . . . . . . . . . . . . . 3.9.1 Variabile aleatoria di Poisson . . . . . . . . . . 3.9.2 La distribuzione di Poisson come limite della binomiale . . . . . . . . . . . . . . . . . . . . . 4 Modelli continui 4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Variabile aleatoria qualunque . . . . . . . . . . . . . . 4.2.1 Funzione di ripartizione di una variabile aleatoria qualunque . . . . . . . . . . . . . . . . . . 4.2.2 Variabili aleatorie assolutamente continue . . . 4.3 Cenni sull’integrale di Riemann-Stieltjes . . . . . . . . 4.4 Momenti di una variabile aleatoria qualunque . . . . . 4.5 Disuguaglianza di Hölder . . . . . . . . . . . . . . . . . 4.6 Disuguaglianza di Markov e di Bienaymé-Tchebychev . 4.7 La mediana e i quantili . . . . . . . . . . . . . . . . . . 4.8 Variabili aleatorie continue . . . . . . . . . . . . . . . . 4.8.1 La variabile aleatoria uniforme . . . . . . . . . 4.8.2 La variabile aleatoria normale o di LaplaceGauss N (m, σ) . . . . . . . . . . . . . . . . . . 4.8.3 Cos’è normale? . . . . . . . . . . . . . . . . . . 4.8.4 Ulteriori proprietà della Normale . . . . . . . . 4.8.5 Approssimazione normale alla distribuzione binomiale . . . . . . . . . . . . . . . . . . . . . . 4.8.6 La tavola di Galton . . . . . . . . . . . . . . . . 4.8.7 Variabili aleatorie esponenziali . . . . . . . . . 89 90 95 96 99 104 105 108 109 111 118 119 119 120 124 130 134 136 141 142 147 145 146 149 152 153 159 161 162 9 Indice Indice 4.8.8 Un atomo non ha memoria . . . . . . . . . . . 169 4.8.9 Amnesia discreta e continua . . . . . . . . . . . 170 4.8.10 Variabile aleatoria di Cauchy . . . . . . . . . . 173 5 Variabili aleatorie n dimensionali 5.1 Leggi di probabilità congiunte . . . . . . . . . . . . . . 5.1.1 Variabili aleatorie bidimensionali . . . . . . . . 5.2 Speranza matematica condizionata di una variabile aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 La retta di regressione e dei minimi quadrati . . . . . . 5.4 Variabile aleatoria normale bidimensionale . . . . . . . 5.5 Somma di due variabili aleatorie . . . . . . . . . . . . 5.6 La funzione caratteristica . . . . . . . . . . . . . . . . 5.7 Teorema di inversione . . . . . . . . . . . . . . . . . . 5.8 Esempi di funzione caratteristica di variabili aleatorie note . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 La funzione caratteristica in Rn . . . . . . . . . . . . . 175 175 181 6 Successioni di variabili aleatorie 6.0.1 Convergenza in probabilità . . . . 6.0.2 Convergenza in legge . . . . . . . . 6.0.3 Convergenza in media quadratica . 6.1 La legge dei grandi numeri . . . . . . . . . 6.2 Il caso “domato” . . . . . . . . . . . . . . 6.2.1 Quando un campione è numeroso? 215 215 217 221 225 229 231 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Distribuzioni legate alla normale 7.0.2 La variabile aleatoria χ2 . . . . . . . . . . . . . 7.0.3 La distribuzione di t-Student . . . . . . . . . . 7.0.4 La distribuzione di Behrens-Fisher-Snedecor . . 7.0.5 La distribuzione Gamma . . . . . . . . . . . . 7.1 La distribuzione delle statistiche campionarie . . . . . 7.1.1 Introduzione . . . . . . . . . . . . . . . . . . . 7.1.2 Campioni e popolazioni e tecniche di campionamento . . . . . . . . . . . . . . . . . . . . . . 7.1.3 Media e varianza empirica . . . . . . . . . . . . 187 189 193 198 199 205 209 210 23 5 235 241 246 248 250 250 250 251 10 Indice Indice 7.1.4 Campione di Laplace -Gauss . . . . . . . . . . 256 8 Stime e test d’ipotesi 8.0.5 Definizioni . . . . . . . . . . . . . . . . . . . . . 8.0.6 Efficienza di uno stimatore . . . . . . . . . . . 8.0.7 La verosimiglianza e stimatori di massima verosimiglianza . . . . . . . . . . . . . . . . . . . 8.0.8 Elementi della teoria dell’informazione . . . . . 8.0.9 Stimatore efficiente . . . . . . . . . . . . . . . . 8.1 Statistica esaustiva . . . . . . . . . . . . . . . . . . . 8.1.1 Quantità di informazione di una statistica . . . 8.2 Stimatori bayesiani . . . . . . . . . . . . . . . . . . . . 8.3 Stime intervallari . . . . . . . . . . . . . . . . . . . . . 8.4 Test d’ipotesi . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Generalità sulla teoria dei test . . . . . . . . . . 8.5 Test tra ipotesi semplici . . . . . . . . . . . . . . . . . 26 9 270 272 9 Catene di Markov il caso irriducibile 9.1 Primo esempio di convergenza . . . . . . . . . 9.2 Secondo esempio di non convergenza . . . . . . 9.3 Definizione di catena di Markov . . . . . . . . . 9.4 Grafico associato a una catena di Markov . . . 9.5 La matrice di transizione della catena . . . . . 9.6 Uso della matrice di transizione P . . . . . . . 9.7 Scrittura con vettori riga . . . . . . . . . . . . . 9.8 Scrittura con vettori colonna . . . . . . . . . . 9.9 Dallo stato n allo stato n + m. La matrice P m 9.10 Matrici stocastiche. Una osservazione . . . . . . 9.11 Catena di Markov irriducibile . . . . . . . . . . 9.12 Catena di Markov regolare . . . . . . . . . . . . 9.13 Legge invariante di una catena irriducibile . . . 9.14 Convergenza di una catena irriducibile . . . . . 9.15 Qual è il limite eventuale? . . . . . . . . . . . . 9.16 In termini di matrici . . . . . . . . . . . . . . . 9.17 Convergenza di una catena irriducibile . . . . . 9.18 Enunciati ed esempi . . . . . . . . . . . . . . . 337 337 340 341 342 345 346 346 347 331 348 350 352 352 355 356 357 357 357 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 278 281 287 294 301 304 316 317 321 Indice Indice 9.19 9.20 9.21 9.22 9.23 Calcolo esplicito dello stato al tempo n . Catene di Markov irriducibili periodiche Esempi . . . . . . . . . . . . . . . . . . . Catene di Markov riducibili . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 359 36 1 36 3 36 8 370 12 Presentazione degli autori Indice Introduzione Decisamente la matematica è una disciplina ambiziosa, infatti ha sviluppato strumenti di una scienza impensabile: quella del caso. Immaginiamo una teoria razionale e coerente, che voglia rendere conto di ciò che, per sua natura, è sfuggente e sembra inaccessibile alla ragione: il caso. Ora gli eventi casuali interessano al filosofo, che cerca di dare risposta al quesito: il caso esiste nel mondo reale? La fisica, con la teoria quantistica, introduce l’aleatorio all’interno stesso dei suoi modelli di materia. La matematica, con la teoria delle probabilità, sviluppa indagini e fornisce mezzi di conoscenza del caso. La psicologia si occupa dell’aleatorio ponendosi la questione se esso sia qualcosa di reale o di soggettivo. Ogni persona d’altra parte fa delle congetture, che poi giudica, su cui ragiona e poi regola i propri atti e interessi in funzione delle loro probabilità , è quello che nella vita pratica ci accompagna costantemente. La filosofia segue un tipo di riflessione che verosimilmente non si chiuderà mai. Anche se l’approccio al soggetto viene affrontato dal filosofo in maniera interessante, questo ci aiuta poco. La fisica quantistica propone un modello che non prova l’esistenza del caso e come la filosofia, non fornisce la definizione formale del caso e non risponde alla questione della sua esistenza nel mondo. Restano la matematica e la psicologia le due discipline sono più di tutte in grado di farci scoprire e fare luce sull’aleatorio. Diversi domini della matematica studiano il caso. Le probabilità sono in grado di “misurare” il caso, di predire se non i dettagli di un processo aleatorio, almeno in grandi linee di fornirne alcune caratteristiche globali. Uno dei meravigliosi risultati della teoria delle probabilità è che da eventi casuali ne può scaturire una struttura, in altri termini da un insieme disordinato si può scorgere un certo determinismo. Vedremo in questo 13 14 Introduzione corso come la probabilità manipola il caso, quali sono le leggi, come è possibile comprendere e usare i fenomeni aleatori. Presentiamo, in forma chiara e accessibile, i fondamenti del calcolo delle probabilità, presupponendo solo la conoscenza di elementi del calcolo infinitesimale. Il testo è rivolto agli studenti delle Scuole di Scienze Applicate e di Base, in particolare agli studenti della facoltà di Ingegneria, Scienze Matematiche e Informatiche e Scienze Fisiche e Naturali ed Economia. Diamo ora in sintesi, una rassegna degli argomenti trattati nei singoli capitoli, sarà sottinteso che per quasi ogni nuova nozione introdotta, viene accompagnata da esempi ed esercizi svolti. Nel Capitolo 1 si costruisce l’ambiente matematico idoneo a definire la probabilità di un evento. Introducendo gli elementi fondamentali di calcolo combinatorio, si è in grado poi di risolvere vari problemi e di dare esempi. Nei Capitoli 2 e 3 con gli assiomi di algebra e σ-algebra di probabilità e di σ-algebra probabilità subordinata, si dimostrano vari teoremi utili, riguardanti la probabilità di variabili aleatorie discrete e si prova il teorema della probabilità totale. Prendendo spunto da alcuni giochi popolari: Superenalotto, Lotto, Winforlife.. se ne calcola la probabilità e si prova che in tutti i casi si tratta di giochi non equi, si verifica l’inequità in dettaglio nel caso del gioco del Lotto e Superenalotto. Infine si presenta la formula di Bayes, ricca di implicazioni. Si definisce poi il momento di qualunque ordine finito, con un breve excursus storico sull’argomento. Dopo aver analizzato i modelli classici di variabili aleatorie discrete, si definisce e si fornisce qualche caratterizzazione del coefficiente di correlazione. Nel Capitolo 4 si motiva l’uso dei modelli di variabili aleatorie continue e mediante l’integrale di Riemann-Stieltjes si entra nell’ambito matematico dei modelli probabilistici di variabile aleatoria di tipo continuo e assolutamente continuo. Si introducono, in questo ambito, i momenti di qualunque ordine finito e le disuguaglianze di Hölder, di Markov di Bienaymé-Tchebychev, si esaminano poi alcuni modelli classici di variabile aleatoria continue, come la uniforme, di Laplace Gauss, ed esponenziale. Introduzione 15 Nel Capitolo 5 la nozione di variabile aleatoria si estende al caso multidimensionale e si analizzano alcune leggi di probabilità congiunte. Si definisce la nozione di funzione caratteristica di una variabile aleatoria uno e multidimensionale se ne sottolinea la ragion d’essere, insieme e la sua utilità nella teoria delle probabilità e si dimostra il teorema di inversione. Il Capitolo 6 presenta vari tipi di convergenza: in Probabilità, in Legge e in Media Quadratica. Il capitolo si chiude con la legge forte dei grandi numeri e le dimostrazioni del teorema di Levy e del fondamentale teorema del limite centrale definito come il teorema del “caso domato”. Il Capitolo 7 tratta di variabili aleatorie legate alla distribuzione normale, introduce la nozione statistica secondo Fisher di un campione con brevi nozioni di tecniche di campionamento e la variabile aleatoria χ2 , di T-student. La nozione di media e varianza campionaria si studiano nei dettagli, si dimostra l’interessante Teorema di Geary, il capitolo si chiude con l’ovvia conseguenza del teorema di Bernstein. Nel Capitolo 8 mostra come usare i dati per stimare di alcuni parametri di interesse e introduce la nozione di efficienza di una statistica e limite di Cramer-Rao. Si prosegue con la nozione di massima verosimiglianza e di statistica esaustiva e di stima per intervalli. Gli argomenti introdotti sono accompagnati da esempi. Poi si introducono i test d’ipotesi semplici con il metodo di Neyman-Pearson, l’argomento è accompagnato da esempi sia teorici che numerici. Una buona parte dell’ “arsenale” della teoria della probabilità viene impiegato in questi ultimi capitoli, in un mixing di risultati teorici e di indirizzo puramente pratico. Nell’ultimo capitolo si trattano le catene di Markov. Alcuni esempi ci faranno strada per capire due tipi di catene, quelle irriducibili e non irriducibili con cui si chiude il capitolo. 16 Presentazione degli autori Indice Capitolo 1 Algebra degli eventi 1.1 Algebra di Boole Definizione 1. Consideriamo una famiglia non vuota A e supponiamo che in A siano definite tre operazioni interne che indicheremo con ∩ , ∪ e c . La famiglia A si dice algebra di Boole, se sono verificati i seguenti assiomi: 1) (A ∪ B) = (B ∪ A), (A ∩ B) = (B ∩ A), proprietà commutativa di ∩ e ∪, ∀A, B ∈ A. 2) (A∪B)∪C = A∪(B ∪C), (A∩B)∩C = A∩(B ∩C), ∀A, B, C ∈ A, proprietà associativa. 3) A ∩ (A ∪ B) = A, A ∪ (A ∩ B) = A, ∀A, B, C ∈ A, proprietà di assorbimento. 4) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) e A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), ∀A, B, C ∈ A proprietà distributiva di ∩ rispetto a ∪ e viceversa. 5) (A ∩ c A) ∪ B = B, (A ∪ c A) ∩ B = B, ∀A, B ∈ A proprietà del complementare. Esempi di algebre di Boole: 1. Lo spazio euclideo n-dimensionale Rn con le ordinarie operazioni di intersezione, unione e passaggio al complementare di sottoinsiemi di Rn . 17