C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità CAPITOLO 2. LA NASCITA DELLA PROBABILITÀ. 2.1 Prima della probabilità. Abbiamo documenti pittorici, come un affresco del XIV secolo nel Castello di Arco (TN), che rappresentano scene di vita connesse al gioco con tre dadi. Alcune ricerche (Henry, Todhunter) hanno individuato la presenza di argomenti riconducibili alla probabilità in Letteratura (Commento al primo verso del VI canto del Purgatorio e in precedenza nel poema De Vetula di Richard de Fournival (1201 – 1260)). Recenti indagini di carattere storico (Simi, Toti-Rigatelli, Barra) hanno riconosciuto, inoltre, in trattati d’abaco di scuola toscana, databili tra la fine del XIV secolo e l’inizio del XV secolo, alcuni problemi che rivelano la presenza di questioni in cui non si ha ‘certezza’ e che vengono risolte con ragionamenti che poi si evolveranno nel campo della probabilità, ad esempio il problema della divisione della posta, su cui si tornerà in seguito. Si tratta comunque di forme di sapere non codificate, ma occasionali (e dettate dal buon senso). Un’evoluzione più articolata si trova in Pacioli. Anche Tartaglia si sofferma sull’argomento. Al tema del gioco Luca Pacioli 1445 - 1517 del dado, Cardano dedica un intero trattato, De ludo aleae (1523, Girolamo Cardano 1501 - 1576 ma pubblicato postumo nel 1663) in cui tratta il problema del risultato ottenuto come somma del lancio di tre dadi. Inoltre vi è un inizio di trattazione della legge empirica del caso. Qualche accenno quest’ultimo argomento probabilistico si trova anche in una lettera di Galilei. A parte questi abbozzi, per altro neppure molto elaborati, si può affermare che nel Galileo Galilei 1564 - 1642 mondo antico non ci fosse una concezione probabilistica ed il motivo di ciò potrebbe essere il fatto che nell’antichità non si sia sviluppato un metodo scientifico, che si venne a delineare da Galilei in poi. 2.1.1. Probabilità e sistemi morali. La dottrina del Probabilismo, trae le sue origini dall’Accademia platonica legata alla corrente scettica (III sec. a.C. con Arcesila di Pitane (315 – 241 a.C.) e principalmente con Carneade di Cirene (219 – 129 a.C.)), in quanto, assunta per ipotesi l’impossibilità di raggiungere la conoscenza della verità (ideale ed assoluta), si può accettare come ‘vero’ l’opinione più probabile. In questo caso si parla di Probabilismo gnoseologico. Di questa dottrina è interessan- 45 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità te l’idea che ci possa essere una valutazione comparativa di probabilità, e che essa sia utile per eseguire delle scelte. Tale Probabilismo è attivo ancora oggi e se ne può trovare l’eco nella Epistemologia critica, proprio per la serrata analisi che si svolge in questa corrente di pensiero, al concetto di conoscenza. Solitamente si fa risalire all’opera di Pascal l’individuazione della probabilità come campo d’indagine in risposta ad un problema postogli. Ma si tratta di un approccio riduttivo che tiene conto solo a metà della figura del pensatore francese. Pascal, infatti, in alcune sue opere prende posizione netta per contrastare un sistema morale che ha origine nel XVII secolo e che ai sui tempi era assai dibattuto, in Francia ed altrove, il Probabilismo etico. Si attribuisce al domenicano Bartolomeo di Medina l’affermazione che se una opinione è probabile si ha il permesso di farla propria anche fosse più probabile un’opinione opposta. Tale sistema morale risale al 1577. Anche, in esso è presente l’idea che ci possa essere una vaS. Agostino 354 - 430 lutazione comparativa di probabilità. Delle idee del Probabilismo è possibile ritrovare precedenti negli scritti S. Gregorio di Nazianzio 329 - 390 di S. Agostino, di S. Gregorio di Nazianzio e più avanti, in S. Tommaso d’Aquino. La diffusione di questo sistema morale, appoggiato anche dalle scuole gesuitiche, fece sì che si contrapponessero punti di vista anche diversi, a tale punto che si diffuse la ‘convinzione’ che prima del 1638, tutti i teologi fossero seguaci del S. Tommaso d’Aquino 1225 - 1274 Probabilismo, vista come origine di forme di lassismo e li- bertinismo. Questa data è quella della morte di Jansen e delle diffusione sue idee che diedero vita al Giansenismo, movimento re- Cornelius Jansen 1585 - 1638 ligioso interno alla fede cattolica che oppose il Rigorismo al ProInnocenzo X 1644 - 1655 babilismo. Le tesi fondamentali del teologo già professore a Lovanio, vennero ufficialmente poste al bando da Papa Innocenzo X (Giovanni Battista Pamphili (1574 – 1655) nel 1653, a favore del Probabilismo, sulla base di un pronunciamento della Università di Parigi. A loro volta, i teologi della scuola di Lovanio condannarono il Probabilismo. Le idee del Alessandro VII 1655 - 1667 Giansenismo si diffusero in Francia e in Olanda - Belgio, non ostante la loro condanna, ufficiale. A questo punto della storia, Pascal prese la parola, contro il Probabilismo, nelle Lettere provinciali (1657). Ma l’opera del Francese venne condannata nello stesso anno in cui apparve dal Papa Alessandro VII (Fabio Chigi (1599 – 1667)). 46 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità Le idee del Probabilismo trovarono poi un ulteriore difensore in S. Alfonso Maria de’ Liguori (1696 – 1787) che con la sua opera favorì la fine del Giansenismo. Del clamore dell’acceso dibattito che si svolse tra XVII e XVIII secolo oggi è rimasto vivo assai poco. Ma è significativo S. Alfonso Maria de’ Liguori 1696 - 1787 che uno dei più accesi confutatori del Probabilismo si trovi ad occupare il posto di ‘fondatore’ del calcolo delle probabilità. 2.1.2. Il problema di De Méré. Il Signor Antoine Gombault cavaliere De Méré, persona di buono stato sociale, con qualche conoscenza matematica e accanito giocatore, pose all’amico Pascal alcuni quesiti sul gioco. Sulla natura dei quesiti si hanno versioni contrastanti. Secondo alcuni la domanda posta a Pascal sarebbe stata relativa al fatto che puntando sull’uscita del 6 in quattro lanci di due dadi fosse più facile vincere che sull’uscita del doppio 6 in ventiquattro lanci di due dadi 1. Secondo un’altra tradizione egli pose a Pascal il cosiddetto problema della ripartizione della posta, che era già stato affrontato 2 anche in precedenza da altri autori, dato che è presentato in un manoscritto anonimo del 1400 e poi ripresentata da Pacioli nella Summa de aritmetica, geometria, proportioni et proportionalità (1494). Il problema è così formulabile: come è possibile suddividere la posta fra due (o più) giocatori che possono ottenere un punto se la partita viene interrotta prima che uno dei due giocatori abbia raggiunto il risultato vincente?3 Per meglio spiegarlo, si considerino due giocatori A e B che stiano giocando una partita, ad esempio giocando con una moneta a testa o croce, in cui vince la somma s (posta in gioco a metà da ciascun giocatore) chi per primo raggiunge n punti. Al momento dell’interruzione della partita, il giocatore A ha totalizzato a punti e B, b punti, con a e b entrambi minori di n. Luca Pacioli propone il problema con n = 60, a = 50 e b = 20 e la sua soluzione è errata, proponendo egli di dividere la posta assegnando ad A la somma s ⋅ a b e a B, s ⋅ e quindi non tenendo conto a+b a+b del fatto che uno dei due giocatori possa essere ‘più vicino’ ad ottenere il punteggio che lo fa vincere. Tartaglia contesta la soluzione di Pacioli osservando che, in base ad essa, un giocatore che al momento della interruzione avesse totalizzato 0 punti, non riceverebbe nulla, anche se nel caso il gioco continuasse potrebbe arrivare alla vittoria. Ma neppure Tartaglia offre una soluzione corretta. Il problema di De Méré divenne un motivo di scambio epistolare tra Pascal e Pierre de Fermat 1601 - 1665 Fermat. In una lettera del 29 luglio 1654, Pascal scrive a Fermat: 1 Presentata da Costantini, D. (1970). Fondamenti del calcolo delle probabilità. Roma: Feltrinelli. Presentato da Dall’Aglio, G. (1987). Calcolo delle probabilità, Bologna: Zanichelli. 3 Questa versione è presa da Paola, D. Il problema delle parti: passi didattica e storia della matematica, nel sito www.matematica.it/paola/analisi.html 2 47 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità «Signore, L’impazienza mi prende tanto quanto prende voi, e sebbene io sia ancora a letto, non posso impedirmi da dirvi che ho ricevuto ieri sera, da parte del Signor De Carcavi (1600 – 1684), la vostra lettera sulle parti, che ammiro così tanto da non poterlo esprimere. Non ho la possibilità di dilungarmi, ma, in una parola, voi avete trovato le due parti dei dadi e delle parti in modo perfetto; ne sono completamente soddisfatto poiché non dubito più, ora, di non avere ragione, dopo l’incontro ammirevole con cui mi trovo con voi. 1 aaaa Ammiro molto di più il metodo della partite che quello dei dadi: avevo visto già più persoaaab 1 ne trovare quello dei dadi, come il Signor Cavaliere De Méré che è colui che mi ha propoaaba 1 sto queste questioni ed anche il Signor De Roberval (1602-1675): ma il De Méré non era aabb 1 mai riuscito a trovare il giusto valore delle parti e neppure il metodo per arrivare a ciò, in 1 abaa modo che io mi sia trovato come il solo che fosse giunto a quella proporzione. 1 abab Il vostro metodo è sicurissimo ed è quello che per primo mi si è proposto quando ho iniziaabba 1 to a pensare a questa ricerca; ma poiché la fatica delle combinazioni è eccessiva, ho trovato babb 2 un modo più breve e propriamente un altro metodo molto più breve e più netto che vorrei 1 baaa potervi dire qui in poche parole, perché ormai vorrei aprirvi il mio cuore e, se si potesse, 1 baab avrei tanto piacere di vedere il nostro consenso. Comprendo perfettamente che la verità è la baba 1 stessa a Tolosa e a Parigi. babb 2 Ecco più o meno come faccio per saper il valore di ciascuna delle partite, quando due gio1 bbaa catori giocano, per esempio in tre partite, e ciascuno ha puntato 32 pistole al gioco. Metbbab 2 tiamo che uno ne abbia vinte due e l’altro una; loro giocano ancora una partita la cui sorte è bbba 2 tale che se il primo vincesse, egli avrebbe tutto il danaro che è in gioco, cioè 64 pistole; se bbbb 2 vincesse l’altro ci siano due partite contro due partite e, di conseguenza, se vogliono separarsi bisogna che ciascuno ritiri ciascuno quanto ha puntato, a ciascuno 32 pistole. Considerate dunque, Signore, che [nella terza partita] se il primo vince a lui se ne danno 64; se egli perde, gliene toccano 32. Quindi se non vogliono rischiare questa partita e si separano senza giocare, il primo dovrebbe dire: “Sono sicuro di avere 32 pistole, in quanto anche perdendo le ottengo; ma le altre 32 le potrei avere io o le potreste avere voi: il rischio è uguale; dividiamo dunque queste 32 pistole a metà e datemi, oltre a ciò, le mie 32 pistole che mi sono assicurate.” Egli avrà, dunque, 48 pistole e l’altro 16. Poniamo ora che il primo abbia vinto due partite ed il secondo nessuna e che inizino a giocare una partita. Lo svolgimento della partita è tale che se il primo vince, ritira tutto il denaro, 64 pistole, se l’altro vince la partita si ritorna al caso precedente, nel quale uno avrà due partite e l’altro una. Ma abbiamo già mostrato che in questo caso a quello delle due parti appartengono 48 pistole: dunque se vogliono non giocare questa partita, il primo dovrebbe dire: “Se vinco, otterrò tutto, 64 pistole, se perdo ritiro comunque 48 pistole, quindi datemi le 48 che prenderei comunque e dividiamoci le altre 16 a metà, perché abbiamo le stesse possibilità di vincere.” Otterrà così 56 pistole. Poniamo, infine che il primo abbia una partita e l’altro nessuna. Vedete, Signore, che se iniziano una nuova partita, la sorte sarebbe tale che se il primo vince avrà due partite e, suddividendo in base ai casi precedenti, gli appartengono 56 pistole; se perde siccome sono una partita contro una partita, gli toccano 32 pistole. Dunque dovrebbe dire “Se non voleste giocare, dovreste darmi le 32 pistole che comunque mi sono assicurate e dividiamo il resto delle 56 a metà: dalle 56 togliete le 32, ne restano 24, e quindi datemi la metà, 12. e prendete le altre 12.”» Di questa lettera vale la pena di mettere in evidenza il tono cortese, ma allo stesso tempo l’affermazione che i risultati di Fermat erano già stati trovati, indipendentemente, da Pascal, con la frase cortese: “Il vostro metodo è sicurissimo ed è quello che per primo mi si è proposto quando ho iniziato a pensare a questa ricerca;”. Compare anche la nozione di ‘valore atteso’ o ‘speranza’. Il resto è convincente, ma non c’è alcun uso della probabilità, solo un ‘sano’ buon senso. Poco meno di un mese dopo, il 24 agosto 1654, Pascal scrive ancora a Fermat e commenta una proposta di Fermat con queste parole: «Quando non ci sono che due giocatori, il vostro metodo che procede mediante le combinazioni è sicurissimo, ma quando ci sono tre giocatori, credo di avere una dimostrazione che la soluzione non è appropriata, a meno che voi non procediate in qualche modo che non comprendo. Ma il metodo che vi ho indicato e di cui mi servo ogni volta è comune a tutte le situazioni immaginabili e per ogni tipo di partite, invece quello delle combinazioni (di cui mi servo solo in casi particolari in cui quello è la maniera più breve del metodo generale) non va bene che in casi singoli e non in altri. Sono sicuro che mi farò capire, ma mi servirà fare qualche premessa. Ecco come procedete nel caso di due giocatori: Se due giocatori giocano più partite e si trovano nelle condizioni che manchino due partite al primo e tre al secondo per vincere, bisogna (dite voi) vedere in quante partite il gioco sarà deciso in modo assoluto. È facile sostenere che ciò avverrà in quattro partite da cui concludete che bisogna vedere in quanti modi si combinano 48 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità quattro partite tra due giocatori per fare vincere il primo e quante per fare vincere il secondo e suddividere la posta in proporzione. Avrei avuto difficoltà a capire questo discorso se non l’avessi scoperto da me in anticipo, come l’avete scritto in questo pensiero. » Nel brano riportato, a parte le solite manifestazioni di amicizia, si nota ancora una volta l’affermazione della priorità della scoperta da parte di Pascal, anzi il confronto tra i metodi dei due francesi, e l’introduzione del calcolo combinatorio, nell’esempio, le disposizioni con ripetizione di classe 4 di due soli elementi, le lettere ‘a’ e ‘b’. Lo schema combinatorio serve per individuare in modo completo i casi e il loro numero, da cui costruire un rapporto del tipo: casi favorevoli / casi possibili. Nell’esempio ci dovrebbero essere 24 = 16 casi, di cui 11 favorevoli al primo giocatore e 5 al secondo giocatore. In effetti qui Pascal individua tutti i casi possibili e quindi ne trae una stima di probabilità. Da questa analisi combinatoria è evidente la idealizzazione del problema data da Pascal e forse è questa che ispira l’ammontare delle posta come un multiplo di 16, numero dei casi possibili secondo l’autore. Nella prima lettera qui riportata, Pascal accenna alle combinazioni, ma il ragionamento che produce non utilizza gli aspetti combinatori, bensì fa uso del buon senso. I risultati però sono in accordo con quanto potrebbe ottenere mediante le combinazioni. Il primo caso che tratta è quello in cui la differenza del numero delle partite che darebbero la vittoria al momento dell’interruzione è 1 per il giocatore 1 e 2 per il giocatore 2. Sono quindi necessarie, al più, due partite, quindi si tratta di considerare uno schema analogo al precedente (in cui si trattano contemporaneamente i tre casi che Pascal presenta, tenendo conto che nel secondo servono tre partite e nel terzo quattro). Sulla base della tabella, nel primo caso la probabilità di vittoria del primo giocatore è ¾ quindi sulla ∆a=1∧∆b=2 ∆a=1∧∆b=3 ∆a=2∧∆b=3 base di ciò la posta dovrebbe essere suddivisa in Casi aa ab ba bb Casi aaa aab aba abb baa bab bba bbb Casi aaaa aaab aaba aabb abaa abab abba abbb baaa baab baba babb bbaa bbab bbba bbbb proporzione di ¾ e ¼, vale a dire di 48 pistole al Vincitore 1 1 1 2 Vincitore 1 1 1 1 1 1 1 2 Vincitore 1 1 1 1 1 1 1 2 1 1 1 2 1 2 2 2 primo e 16 al secondo. Nel secondo caso le proporzioni sono 7/8 e 1/8, quindi 56 pistole al primo e 8 al secondo. Nel terzo caso la suddivisione è 11/16 e 5/16, per cui al primo spettano 44 pistole ed al secondo 20 pistole. Il metodo proposto da Pascal nella prima lettera è più veloce (e ricorsivo) del metodo delle combinazioni, ma fornisce gli stessi risultati. Non avendo un’eventuale risposta di Fermat, non è semplice comprendere perché Pascal dopo avere presentato il ‘metodo abbreviato’ si senta in dover di esporre quello con le disposizioni con ripetizione. L’affermazione che quello usato da Fermat nel caso di tre giocatori non lo soddisfa, potrebbe essere la causa scatenante. 49 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità I casi effettivi, con la situazione ‘pregressa’ di precedenti partite, possono essere conteggiati in altro modo: in certi casi bastano due partite, in altre 3 e in solo pochissimi casi quattro ulteriori partite. Si può introdurre sull’insieme delle 16 partite una relazione di equivalenza, visualizzata nello schema, dai caratteri tipografici uguali e dalle sottolineature. In corsivo si sono indicati i casi in cui bastano 2 ulteriori partite, in grassetto, quelli in cui ne servono 3, e in carattere normale quelli in cui sono indispensabili 4 partite. Ci sono quindi: solo un caso con due partite, favorevole al giocatore 1, tre casi con tre partite, date da aba, baa, bbb, i primi due favorevoli al giocatore 1 e il terzo al giocatore 2; e 8 casi in cui servono tutte e quattro le partite, con i casi favorevoli equamente ripartiti tra i due giocatori. Con questa analisi ci sarebbero, pertanto, 12 casi possibili di cui 7 favorevoli al primo giocatore e 5 al secondo. Ma ragionando in questo modo i risultati sarebbero diversi e non corretti. Dice infatti Pascal, procedendo nella lettera del 24 agosto 1654: «Per vedere come quattro partite si combinino tra loro bisogna immaginare che i giocatori usino dadi a due facce (perché sono solo due giocatori) come testa e croce e che essi gettino 4 dadi di questo tipo (perché giocano 4 partite); ora bisogna vedere in quanti modi si possono avere assetti differenti…. Ecco il vostro metodo con due giocatori, del quale voi dite che se ci fossero più giocatori non sarebbe difficile utilizzare lo stesso metodo. Ma su questo, Signore, vi devo dire che questo modo di fare la ripartizione per due giocatori è giusto e molto buono, ma che se ci sono più di due giocatori non sarà sempre giusto e vi dirò la ragione di questa differenza. Ho comunicato il vostro metodo ai nostri amici e su di esso il Signor De Roberval mi ha fatto la seguente obiezione: che si sbaglia a suddividere in parti dato che se ne giocheranno solo due o tre o, al più quattro partite. E così egli non vede ragione per cui si pretenderebbe di suddividere la posta su una condizione ‘finta’ che si giocheranno quattro partite, vista che la condizione naturale del gioco è che non si giocherà più quando uno dei giocatori avrà vinto, e, quanto meno, se ciò non fosse falso, non sarebbe comunque dimostrato, in modo che ci sarebbero alcuno che potrebbe supporre che noi abbiamo utilizzato un paralogismo. Gli ho risposto che io non mi fondavo tanto sul metodo delle combinazioni, il quale non è adatto in questa occasione, quanto su un altro metodo universale cui nulla sfugge e che porta la sua dimostrazione con sé, mediante il quale si trovano le stesse partizioni ottenute mediante le combinazioni, di più gli dimostrerò che la verità della ripartizione tra i due giocatori mediante le combinazioni in questo modo: Non è vero che se due giocatori sono in situazione tale che manchino due partite all’uno e tre all’altro conviene ora che gettino quattro dadi a due facce tutti in una volta e non è vero, gli dirò, che se essi decidono di giocare le quattro partite la ripartizione deve essere quella che abbiamo detto, in base alla moltitudine di assetti favorevoli a ciascun giocatore? È rimasto d’accordo con questo ragionamento che in effetti è dimostrativo, ma negava che la stessa cosa potesse sussistere in realtà. » Avendo così condiviso con Fermat il metodo delle combinazioni ed avendo risposto alla critica di Roberval, Pascal riflette sul caso di tre giocatori: «Seguiamo lo stesso procedimento per tre giocatori e supponiamo che manchi una partita al primo, due al secondo e due al terzo. Per fare la ripartizione seguendo il metodo della combinazioni bisognerà cercare dapprima in quante partite il gioco sarà deciso, come fatto nel caso di due giocatori. Ciò avverrà in tre partite in quanto i giocatori non giocheranno più di tre partite senza che la decisione sia giunta favorevole ad uno dei tre. Bisogna ora sapere in quanti modi diversi tre partite possano dare assetti diversi e quanti di questi sono favorevoli all’uno, all’altro o al terzo e, seguendo questa proporzione distribuire la somma di denaro, così come si fa con due giocatori. Per vedere quante combinazioni ci sono la cosa è facile: è la terza potenza di tre, vale a dire il suo cubo: 27. Perché se getto tre dadi in una volta (perché bisogna giocare tre partite) e [ciascun dado abbia] tre facce (poiché vi sono tre giocatori) una indicante a perché a favore del primo, l’alta b, a favore del secondo e con c la terza, è manifesto che si otterranno 27 possibili assetti. » I casi che Pascal individua coi tre giocatori sono indicati in tabella. Da essa si coglie che con combinazioni (o con il lancio simultaneo di dadi, come indicato da Pascal), potrebbero esserci due vincitori in quattro casi. Se si considerano disposizioni e non combinazioni, cioè se si ritiene rilevante 50 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Casi aaa aab aac aba abb abc aca acb acc Vincitore 1 1 1 1 1,2 1 1 1 1,3 Casi baa bab bac bba bbb bbc bca bcb bcc Vincitore 1 1,2 1 2,1 2 2 1 2 3 Casi caa cab cac cba cbb cbc cca ccb ccc Vincitore 1 1 1,3 1 2 3 3,1 3 3 Capitolo 2. La nascita della probabilità l’ordine, spariscono le ambiguità e la posta dovrà essere ripartita secondo le proporzioni 17/27 per il primo, 5/27 per il secondo e 5/27 per il terzo, la cui somma fa l’intero. Nella seconda lettera, laddove analizza la ripartizione della posta tra tre giocatori 4, Pascal trova 13 casi che sono esclusivamente favorevoli al primo giocatore, trova poi tre casi che sono ugualmente favorevoli al primo ed al secondo giocatore, quelli in cui compare a una volta e b due volte. Similmente ci sono tre casi ugualmente favorevoli al primo ed al terzo giocatore, quindi considera che i casi favorevoli al primo giocatore sono 13 + 3 3 + = 16. Poi individua 4 casi favorevoli esclusivamente al secondo giocatore, quelli in cui 2 2 compare b due o tre volte e compare eventualmente una sola volta c, ma non a, ed analogamente per il terzo giocatore. Così i casi favorevoli al secondo giocatore sono 4 + 3 1 = 5 + ed analogamente 2 2 per il terzo giocatore. In questo modo i casi trattati sono ancora 27: 16 + 5,5 + 5,5. Ed è su questo che Pascal dissente con i numeri 17, 5 e 5 trovati da Fermat. Tra Pascal e Fermat, forse, è intercorsa qualche incomprensione, perché Fermat scrive, il 25 settembre 1654 a Pascal la seguente lettera: «Signore, non temete che la nostra intesa diminuisca come avete affermato voi stesso pensando di distruggerla, e mi sembra che rispondendo al Signor de Roberval da parte vostra abbiate risposto anche da parte mia. Prendo l’esempio dei tre giocatori, in cui al primo manca una partita ed agli altri due ne mancano due, che è il caso che mi opponete. Non trovo che 17 combinazioni per il primo e 5 per ciascuno degli altri due: in quanto, quando dite che la combinazione acc è buona per il primo ed il terzo, sembra che noi non ci ricordiamo più che tutto ciò che si fa quando uno dei giocatori ha vinto, non serve a nulla. Ma questa combinazione ha fatto vincere il primo giocatore nella prima partita e cosa importa se il terzo vince le due partite successive, perché anche se ne vincesse in seguito trenta ciò non sarebbe superfluo? Tutto ciò viene, come avete ben osservato, dalla finzione di estendere il gioco fino ad un certo numero di ulteriori partite che non serve altro che a facilitare la regola e (a mio avviso) a rendere tutti i casi eguali, ovvero in modo più intelligibile, a ridurre tutte le frazioni allo stesso denominatore. E affinché non dubitiate più, se invece di tre partite voi estendeste, nel caso proposto, la finta fino a quattro non ci sarebbero solo 27 combinazioni, bensì 81 e bisognerà guardare quante di queste farebbero vincere il primo prima che vinca ciascuno degli altri… voi troverete che le combinazioni per la vincita del primo sarebbero saranno 51 e quelle di ciascuno degli altri due 15, e così si ritorna agli stessi rapporti. » A parte le forme retoriche di cortesia, anche Fermat è ben consapevole di quanto propone e non manca di mettere l’accento su cosa non dovrebbe funzionare, secondo Pascal col suo modello del lancio multiplo di dadi e con la considerazione dell’ordine. Così facendo, però, darebbe ragione a Roberval e al suo rifiuto dei casi ‘finti’. 4 Per queste specifiche considerazioni si trae spunto da Todhunter, I. (1865). A History of the Mathematical Theory of Probability from the time of Pascal to that of Laplace, Cambridge & London: Macmillan and Co. 51 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità In tale lettera Fermat mostra che supporre che la disposizione acc rappresenti un caso ugualmente favorevole per due giocatori, va contro l’esperienza, perché in questo caso il primo giocatore ritiene di aver diritto alla vincita e con la prima vincita, il gioco è concluso. Ma Fermat fornisce una diversa soluzione al problema, in cui non assume più la necessità di considerare tutti i 27 casi delle possibili disposizioni, sulla base dell’osservazione di Roberval, e comunque giunge allo stesso risultato di 17, 5, 5, osservando che i vari casi con diversi numeri di partite, vanno considerati con diversi rapporti di ripartizione (con diverse probabilità, espresse come terzi, noni e ventisettesimi). Di fatto, proponendo la sostituzione del gioco con il lancio iterato di un dado con 3 facce, Fermat riduce l’uso dei casi finti, ma non lo elimina del tutto. Nel resto della lettera del 25 settembre, Fermat presenta a Pascal alcuni dei suoi risultati di teoria dei numeri che lo hanno reso famoso. Pascal risponde il 27 ottobre 1654 e dice che in base all’ultima missiva si ritiene completamente soddisfatto. La storia della loro corrispondenza va avanti, ma interessava mettere in evidenza come sia entrato il calcolo della probabilità. Nelle lettere, che qui non sono riportate per intero, Pascal presenta due risultati generali, senza dimostrazione. (1) Si suppone che ciascun giocatore abbia stanziato una somma A di denaro; sia n+1 il numero dei punti nel gioco e si supponga che il primo giocatore abbia già ottenuto n punti e il secondo giocatore, nessuno. Se i giocatori si accordano per separarsi senza giocare oltre, al primo giocatore spettano la cifra di 2 A − A 2n . (2) Si suppone la posta ed il numero di punti nel gioco come in (1), e si suppone che il primo giocatore abbia ottenuto 1 punto e il secondo nessuno. Se i giocatori decidono di separarsi senza giocare ulteriormente, al primo giocatore spetta A + A 1 ⋅ 3 ⋅ 5 ⋅ ... ⋅ (2n − 1) 2 ⋅ 4 ⋅ 6 ⋅ ... ⋅ 2n Pascal afferma che il secondo teorema è difficile da provare. Dice che dipende da due proposizioni, la prima delle quali è puramente aritmetica e la seconda è connessa con gli aspetti aleatori. La prima proposizione equivale alla proposizione nata in Algebra che è relativa alla somma dei coefficienti binomiali dei termini presenti nel Teorema binomiale. Il secondo consiste, invece, di un’affermazione sul valore della probabilità del giocatore, per mezzo di combinazioni, dalle quali, con l’aiuto della proposizione aritmetica, il valore precedente viene dedotto. In questo modo nasce il triangolo aritmetico che, in Francia, prende il nome da Pascal. Il trattato sul triangolo aritmetico fu scritto nello stesso anno 1654, ma venne pubblicato solo nel 1665. Tra le ipotesi implicite utilizzate dai due matematici francesi c’è quella che le partite siano indipendenti, vale a dire che in ogni partita ‘parziale’ entrambi abbiano la stessa probabilità di vincere. 52 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità 2.1.3. Il contributo di Huygens. Ispirandosi ai problemi sollevati da Pascal, Fermat ed altri studiosi coevi, Huygens nel 1657 pubblica De ratiociniis in ludo aleae. In esso si dà spazio a concetti che poi saranno considerati fondamentali, come quello di speranza o valore atteso (quello che in probabilità viene visto come un primo esempio di momento del primo ordine). Il testo appare come una appendice al quinto volume di Exercitationum Mathematicarum, di van Schooten, pubblicato a Leida, da Johann Else- Christiaan Huygens 1629 - 1695 vier. Van Schooten è stato un matematico di valore, ma la sua fama maggiore è dovuta al fatto di avere tradotto dal Francese in Latino l’opera maggiore di CarFrans van Schooten 1615 - 1660 tesio, Il discorso sul metodo, rendendolo così accessibile agli studiosi di tutto il modo pochi dei quali praticavano la lingua materna di Fermat. Le Exercitationum di van Schooten sono una miscellanea di vari argomenti di matematica. Vi si tratta l’aritmetica, tabelle di numeri primi, la geometria nel piano e nello spazio ed anche curve nello spazio. Inoltre i modi per trovare terne pitagoriche. Sono studiate le progressioni aritmetiche e geometriche ed i numeri figurati i poligoni regolari, la suddivisione degli angoli. Ci sono anche parti in cui l’autore René Descartes 1596 - 1650 risolve problemi ‘celebri’: uno assegnato da Cartesio, un altro che ha origine in Diofanto (III sec. d.C.). Spesso si avvale di complessi strumenti algebrici ed è interessante una breve guida su come fare a scegliere le incognite in relazione per risolvere più facilmente problemi geometrici con l’algebra. Credo che darebbe parecchio filo da torcere all’odierno laureato in matematica per la complessità delle considerazioni e la relativa povertà degli strumenti. Alla fine del trattato, si congeda dal lettore con la seguente dichiarazione: «Postquam finem exercitationibus hisce imponere decreveram, diversa mihi alia, Amice Lector, jucundissimae ac perpulchrae contemplationis argumenta superesse deprehendi, quae, si pro eorum dignitate pertractata Sectionibus hisce adiunxissem, non parum et meis laboribus ornamenti, et tui fortis studiis adjumenti commodique attulissent, sed tam labor quam opus in immensum accrevit. Quocirca cum interalia, precedentibus Sectionibus pertractata, modum, quo elegantiores et sublimiores quaedam Propositiones, partim ab Antiquis, partim a praestantissimis hujus saeculi Mathematicis ingeniosissime inventae, ab ipsis investigatae fuerint, illaeve Analyticae artis praesidio inveniri possint, ostenderim: haud alienum ab instituto judicavi, si, ad uberiorem hujus artis usum, ea, quae Nobilissimus atque Clarissimus D. CHRISTIANUS HUGENIUS nuper de Ratiociniis in aleae ludo adinvenit mihique conscripta communicavit, hic una cum ispius literis reliquorum, quae mihi supersunt, loco, adjicerem.... » Spiega poi che i contenuti di questa parte sono innovativi e che sono utili al lettore per fare pratica di nuove e sottili maniere di pensare. Il testo contiene, come detto prima, una lettera di Huygens datata 27 Aprile 1657 (quindi non molto tempo dopo lo scambio epistolare tra Pascal e Fermat). Huygens si preoccupa di dire che i problemi che si possono trattare con questi nuovi strumenti sono almeno tanto ‘dignitosi’ quanti quelli di Diofanto, anche se hanno origine nel gioco. Per quanto riguarda l’originalità del suo trattato afferma: 53 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità «Sciendum vero, quod jam pridem inter praestantissimos tota Gallia Geometras calculus hic agitatus fuerit, ne quis indebitam mihi primae inventionis gloriam hanc in re tribuat. Caeturum illi, difficillimus quibusque quaestionibus se invicem exercere soliti, methodum suam quisque occultam retinuere, adeo ut a primis elementis universam hanc materiam evolvere mihi necesse fuerit. Quamobrem ignoro etiamnum an eodem mecum principio illi utantur; at in resolvendis Problematis pulchre nobis convenire saepenumero expertus sum. Horum Problematum nonnulla in fine operis addidisse me invenies, omissa tamen analysi, cum quod prolixam nimis operam poscebant, si perspicue omnia exequi voluissem, tum quod reliquendum aliquid videbatur exercitationi nostrorum, si qui erunt, Lectorum. Vale » Dunque l’argomento non è innovativo, ma lo è la sua esposizione. Per questo si considera il testo di Huygens come il primo esempio di trattato matematico della probabilità. E del trattato il testo ne ha l’aspetto, essendo suddiviso in una introduzione esplicativa e 14 proposizioni. Il termine proposizioni è consueto, da Euclide in poi. Ma il testo, scritto con carattere più piccolo, che segue una proposizione, è talvolta una giustificazione argomentativa, più che una vera dimostrazione. Dell’impianto euclideo mancano le nozioni comuni e i postulati, non il ricorso all’evidenza del buon senso. Per meglio comprendere quanto detto, si mostrano alcune proposizioni, adeguandole al linguaggio odierno Proposizione 1. Se ottenessi a oppure b e questi valori hanno uguale possibilità, allora il valore atteso dell’evento a oppure b sarebbe a+b . 2 Questa regola mi conviene non solo dimostrarla, ma anche approfondirla; posto x in luogo di quale è il valore atteso, di nuovo per sorte simile può accadere, giocando in condizione equa, che abbia x. Si ponga quindi che il gioco sia tale che mi opponga ad un altro in questa condizione che chiunque ottenga x in quanto vincitore, come vincitore riceva a. Infatti questo gioco è giusto e mi sembra chiaro che con questa debba avere, a, nel caso perda, altrimenti 2x-a se vincessi, infatti mentre ottengo 2x, appunto quanto è stato depositato e all’altro è erogato a. Pertanto se 2x – a valesse b, per la sorte equa mi potrebbe capitare tanto a quanto b. Si pone pertanto 2x – a ∝ b e sarà x ∝ a+b , 2 come valore atteso. La dimostrazione di ciò è facile. Come si vede da questo esempio, non si tratta di una trattazione formalizzata, anzi le proposizioni hanno spesso il valore di assiomi o principi che vengono giustificati dei brani che seguono. Solitamente poi la ‘dimostrazione’ viene seguita da un esempio numerico semplice. Un’analisi grossolana del testo di Huygens mostra che le Proposizioni I – III trattano i valori attesi (medie) di due, tre, 54 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità quattro valori ed in generale, di p volte a e q e volte b. La successiva Proposizione IV non è una affermazione, ma solo l’introduzione ad un problema: «Proposizione IV. Per venire ad una questione postaci per prima, cioè di come eseguire una distribuzione tra diversi contendenti quando sono in condizioni dissimili, è doveroso che iniziamo dalle situazioni più semplici. » La successiva Proposizione V tratta del caso di due giocatori, il primo a cui manca un punto ed al secondo a cui ne mancano 3. L’argomentazione che segue, anche se il caso è diverso, è del tutto simile a quella di Pascal nella lettera del 29 luglio 1654. Le successive due Proposizioni, VI e VII trattano altri due casi con due giocatori, nuovi rispetto a quelli di Pascal, ma risolti con gli stessi metodi. La Proposizione VIII tratta dei tre giocatori di cui al primo ed al secondo manca una sola partita ed al terzo due. Le tecniche di risoluzione restano non collegate alle combinazioni. La Proposizione IX sembra presentare il problema in termini molto generali: Affinché con tanti contendenti, quanti si voglia, di cui alcuni mancano di molte partite ed altri di meno partite, e di quello di cui debba essere trovata la parte, bisogna considerare se quello di cui vogliamo trovare la parte [nella ripartizione] vinca lui stesso la partita successiva oppure se vinca qualcuno degli altri. Di costoro, poi se raccogliamo le parti in una somma e la dividiamo per il numero dei contendenti, il quoziente mostrerà la parte richiesta. Poi la trattazione riguarda il caso (Di Fermat-Pascal) in cui uno debba vincere una partita e gli altri due, due ciascuna. I risultati coincidono con quelli di Fermat, la ripartizione viene fatta proporzionalmente ai numeri 17, 5 e 5 (ventisettesimi), anche se non appaiono le combinazioni (e quindi eludendo il problema di Roberval). Il testo presenta le seguenti tavole per 3 contendenti. Le tavole vanno lette in questo modo. Nella parte alta della casella compaiono, separati da punti i numeri di partite mancanti a ciascun giocatore, ponendo per primo quello più vicino alla vittoria, poi l’altro ed infine il più lontano. Nella parte inferiore compaiono i numeri che intervengono nella ripartizione e sotto di essi, la somma di tali numeri. Così nel caso 1 . 3 . 5, i numeri da applicare sono 629/729, 87/729, 13/729. Ma 729 = 36, quindi questa ripartizione trae origine dalla disposizioni con ripetizione di classe 6, di 3 oggetti. I dati numerici non sono tutti corretti. Ad esempio nella situazione 1.2.3 si devono considerare al più quattro partite e la posta va suddivisa in base a 60/81, 14/81 e 7/81. Anche Huygens introduce il lancio dei dadi per giustificare i risultati trovati 55 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità Poi passa alla considerazione del gioco dei dadi. Le ultime 5 Proposizioni, dalla X alla XIV sono relative al gioco dei dadi e si occupano di particolari uscite con vari tipi di lanci. Di questi fa una analisi delle possibili frequenze delle uscite e sulla base di queste indica frazioni che esprimano la probabilità. In un certo senso, questa è la parte più vicina al calcolo delle probabilità nella accezione classica. Il trattato termina con 5 problemi di gioco con dadi, carte ed urne. Tali problemi appariranno risolti nella Ars conjectandi. 2.1.4. Gli anni ’60 del XVII secolo. Nella storia della teoria della probabilità, sicuramente gli anni ’60 del XVII secolo, intesi in senso lato, sono stati cruciali. Pascal al termine della Logica di Port Royal, presenta la sua scommessa sulla esistenza di Dio, che, a ben guardare non è un argomento scientifico di calcolo della probabilità, ma che risente delle considerazioni trattate nelle lettere con Fermat. In quegli stessi anni, sempre Pascal faceva le prime applicazioni del pensiero non deterministico ad altri giochi d’azzardo e, nel frattempo, inventava ciò che diverrà la teoria dei giochi. Sempre nella Logique ou l’art de penser di Port Royal, attribuita ad Arnauld e Pierre Nicole (1625 – 1695), si presenta per la prima volta l’idea di una misurazione numerica di qualcosa simile alla probabilità. Nel frattempo, in Germania, 56 Antoine Arnauld 1612 - 1694 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità uno studente di legge adolescente, Leibniz, cercava di applicare le misure di probabilità ai casi legali con le conseguenze che tratteremo in 3.2.2. Contemporaneamente era impegnato nella scrittura di un trattato Dissertatio de Arte combinatoria (1666) che, finalmente, metteva ordine Gottfried Wilhelm Leibniz 1646 - 1716 nell’argomento. Una volta giunto a Parigi e venuto a conoscenza della matematica che era stata elaborata nel periodo in considerazione, si rese conto che essa rientrava, senza sforzo, nello schema che egli aveva elaborato in modo indipendente. Verso la fine degli anni ’60 i registri delle rendite finanziarie che erano usate da lungo tempo nelle città Olandesi per scopi di finanza pubblica, trovano un saldo fondamento attuariale mediante l’opera di van Hudde e di de Witt. A Londra, nel 1662 un mercante, John Graunt pubblica le prime estensive tavole di mortalità (a partire dal 1592) e da esse Johann van Hudde 1628 - 1704 trae delle inferenze statistiche che daranno origine alle compagnie di assicurazioni. La ricerca sull’opinione in termini probabi- Jan de Witt 1625 - 1672 listici opera di John Wilkins, si realizzò nel periodo al termine della decade. Il grande fiorire degli aspetti probabilistici, però, quasi subito, iniziò ad essere ritenuto meno importante. Il motivo è stato individuato, da alcuni storici e filosofi della scienza, nel sorgere ed affermarsi del calcolo differenziale che ha ‘drenato’ quasi tutte le risorse umane per affrontare i tanti e rilevanti problemi che il calcolo stesso proponeva. Non è da credere che non venisse più considerata la teoria della probabilità. Ci sono infatti numerosi autori che si sono occupati di essa, sia in modo principale e specifico, sia inserendola in altri tipi di ricerche. Con questo rapido sviluppo, la probabilità si sottrae dalla sfera del gioco e, pur se conserva questo aspetto legato alla sua nascita, diviene un campo di ricerca matematico a sé stante 2.2. I primi passi della probabilità. Come visto in precedenza, l’argomento connesso alla probabilità assume, in breve tempo, un nuovo assetto, se si vuole, più scientifico, anche se il paradigma euclideo che in quegli anni era imperante, appare lontano e lo si può assumere come l’obiettivo finale. L’accenno di Huygens ai “praestantissimos tota Gallia Geometras” è significativo, in questo senso. Pascal, tra le altre cose, si è occupato di ge- ometria, ma non altrettanto può dirsi di Fermat. È pur vero che Pascal stesso, in una comunicazione della Accademia di Matematica di Parigi, nel novembre del 1654, afferma: 57 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità «… con l’unione così realizzata tra le dimostrazioni della matematica e l’incertezza del caso, e con la conciliazione tra contrari apparenti, essa può prendere il suo nome da una parte e dall’altra e arrogarsi a buon diritto questo sorprendente titolo: Geometria del caso» a riprova che se non è ‘geometria’ nel senso di formale e ben articolata, non è disciplina da considerare. 2.2.1. Significati e sinonimi della parola probabilità. La strada da percorrere, però è ancora lunga e, come mostrano le ricerche del XX secolo, non è ancora conclusa. Ci sono, infatti, vari modi di intendere il termine probabilità. La ‘fioritura’ del XVII secolo ha messo in luce che con lo stesso termine si indicano concetti che hanno aspetti di carattere statistico, esprimono costanza di leggi riconoscibili nel caso, processi in cui interviene la ‘fortuna’5. La parola ‘probabilità’ è di origine latina ed è legata a fenomeni casuali. L’uso riconoscibile della parola come si potrebbe intendere oggi deriva dal francese probabilité, che compare nella Logique di Port Royal (1662) nel brano «… non bisogna solo considerare il bene e il male in sé, ma anche la probabilità che succeda o che non succeda, e osservare geometricamente la proporzione che tutte queste cose hanno insieme…» rivelando, in tal modo il debito che la probabilità odierna ha con la polemica tra Giansenismo e Probabilismo come sistemi morali. L’avverbio ‘geometricamente’ e il sostantivo ‘proporzione’ spostano però l’attenzione agli aspetti matematici. L’aspetto morale continua a sussistere: William Kneale nel 1949 6 afferma: «se nella vita di tutti i giorni udiamo un uomo parlare di probabilità uguale di varie alternative, dovremmo intendere che esse [alternative] sono ugualmente accettabili come base per una azione… la parola ‘probabile’ è un termine valutativo. Dire che una proposizione è probabile è più simile ad affermare che è giusto fare così e così.» La parola latina probabilis, significava, tra le altre cose ‘meritevole di approvazione’ e quindi con una sfumatura di significato diversa da una di quelle proposte da Kneale. Nel XVIII secolo affermare che un uomo era un ‘dottore probabile’ era come dire che ci si poteva fidare delle sue diagnosi. Daniel Defoe (1660 – 1731), in Roxana (1724) mette in bocca al suo personaggio la seguente frase: «Questo era il mio primo punto di vista sul modo di vivere, piuttosto confortevole, ed era un modo molto probabile. Lo devo confessare, avevamo ottime condizioni, sei camere su un solo piano e tre piani sopra.» Può essere significativa una citazione apparsa sul Supplemento letterario del Times, del 9 agosto 1971, di brani di Edward Gibbon (1737 – 1794), a proposito della strada tenuta da Annibale nell’attraversamento delle Alpi: «Concludiamo, allora, sebbene con un resto di scetticismo, che anche se la narrazione di Tito Livio ha più probabilità, quella di Polibio ha più verità ….. Un tale fatto è probabile, ma indubbiamente falso.» 5 Gli argomenti di questo paragrafo sono ricavati da Hacking, I. (1975). The emergence of probability, Cambridge: Cambridge University Press e da Henry, M. (2007-2008). Dal caso alla probabilità: genesi storica di un potente strumento matematico, l’educazione Matematica, 2007, 32 – 41 (Prima parte) e l’educazione Matematica, 2008, 39 –51 (Seconda parte). 6 Kneale, W. (1949). Probability and induction. Oxford, citato da Hacking (1975). 58 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità Nel 1748 Hume presentò una critica alla credibilità dei miracoli, basata sulla sua interpretazione della probabilità. Questo scritto ebbe il merito di innescare un dibattito estremamente vivace e repliche ben ponderate che ebbero l’effetto di portare l’attenzione del pubblico colto sul concetto di probabilità. In una di queste ‘repliDavid Hume 1711 - 1776 che’ a Hume, Thomas Church nel 1750, scrisse: «…nel discorso comune non è inusuale affermare che una cosa sia credibile o incredibile, come antecedente delle nostre dimostrazioni. Ma, se esaminiamo le nostre idee, troveremo che è un modo vago e non filosofico di esprimerci. Tutto ciò che può essere significato è che una tal cosa è possibile o impossibile, probabile o improbabile o, al massimo, che accade molto frequentemente o molto raramente. » Gli esempi sopra riportati servono a segnalare il pericolo di ‘incommensurabilità’ 7 presente nel leggere ed interpretare testi antichi. Infatti nella fase di origine della teoria, non ci si può aspettare che il termine venga utilizzato con il significato che gli si può attribuire in un linguaggio tecnico specifico, ma necessariamente risente della varietà di interpretazioni, nell’uso colloquiale ordinario (dell’epoca), che gli esempi mettono in evidenza. Oggi la parola ‘probabile’ ed i suoi derivati, sono usati nel linguaggio comune per dare forme di giudizio, come ‘affermazione che ci sono ragioni per quanto si pensa o per come si potrebbe agire, ma ragioni non ‘conclusive’. Però non si può escludere che ancora oggi la parola probabilità non risenta delle interpretazioni datele nel passato, soprattutto quando viene usata in termini colloquiali. Ciò giustifica l’utilizzazione di sinonimi, o di termini connessi, in vari contesti: possibilità, credenza, propensità, facilità, caso, azzardo, credibilità, proclività, chance, fortuna, sfortuna, rarità, frequenza, conoscenza, aleatorietà, verosimiglianza, contingenza, certezza, impossibilità,… Sicuramente l’introduzione della probabilità in termini scientifici e con il linguaggio tecnico ha ‘ridotto’ i significati, ma non ha tolto le ‘sfumature’ che a volta aiutano, a volte ostacolano la comprensione delle situazioni e dei fenomeni probabilistici. Hacking paragona la precisazione del concetto di probabilità alla ‘scoperta’ di Newton della differenza tra peso e massa inerziale. Fondamentalmente ci sono (anche dal punto di vista tecnico) almeno due modi di intendere la probabilità: uno è statistico e concerne le leggi stocastiche (del caso) dei processi casuali; il secondo modo di vedere è di tipo epistemologico (cioè lega- Isaac Newton 1642 - 1727 to alla έπιστήµη (conoscenza certa) e contrapposta alla δόξα (opinione)) ed è dedicato a valutare i gradi di credenza senza fare riferimento agli aspetti statistici. Questi due modi sono alcune delle attuali linee di ricerca in teoria delle probabilità. 7 Termine introdotto da Paul Feyerabend (1924 – 1994) e le cui implicazioni didattiche sono ben illustrate da Bagni, G.T. (2008). Storia Didattica ed Epistemologia, Bologna: Editrice Pitagora 59 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità 2.2.2. Il trattato di Jacob Bernoulli e la sua rilevanza. Nel panorama matematico della fine del XVII secolo ed inizio del successivo si stagliano le figure dei matematici della famiglia Bernoulli (o Bernouilli) per l’importanza dei loro contributi. Il più anziano, Jacob (I), nasce il 27 dicembre dell’anno di nascita della proJacob (I) Bernoulli 1654 - 1705 babilità dalla corrispondenza Pascal – Fermat, e quindi come se fosse segno del destino, si è occupato di probabilità o meglio, come dice il nome del suo testo più importante in questo ambito, Ars conjectandi, dell’arte di fare congetture 8 Il trattato è frutto di un lungo lavoro, iniziato probabilmente pochi anni dopo la pubblicazione dell’opera di Huygens, ma è stato reso noto solo nel 1713 ad opera di un nipote, Nicolas (I) Bernoulli (1687 – 1759), che insegnò all’Università di Padova. L’opera è stata composta in quattro parti. La prima parte è un’analisi critica del trattato di Huygens di cui l’autore risolve alcuni problemi lasciati senza soluzione dall’Olandese. Nella seconda parte si tratta delle permutazioni e combinazioni, la terza parte spiega come utilizzare gli oggetti combinatori applicandoli a problemi relativi ai giochi di dado o a casi aleatori. La quarta parte, quella più rilevante è dedicata, come dice l’autore a « l’uso e l’applicazione della dottrina precedente agli affari civili, morali e scientifici» ed è in essa che viene presentata l’interpretazione che Bernoulli dà del concetto di pro- babilità e di vari termini connessi. Nel capitolo quinto di questa parte compare il teorema che prende il nome dal suo autore. Per meglio comprendere le ragioni ispiratrici del teorema e della sua dimostrazione, la concatenazione dei capitoli in quest’ultima parte del trattato chiarisce bene il contesto della dimostrazione data nel quinto Capitolo. 2.2.2.1. Capitolo I della Ars conjectandi. Il capitolo è dedicato ad osservazioni introduttive su certezza, probabilità, necessità e casualità delle cose. Vista la difficoltà di intendersi su questi concetti l’autore fornisce una sorta di dizionario ad uso del lettore: «La certezza di qualunque cosa si può trattare o oggettivamente, cioè in sé – e in questo caso non mostra altro che la reale, presente o futura, presenza di quella cosa – o soggettivamente, cioè in rapporto a noi – e in questo caso consiste nella misura della nostra conoscenza di quella realtà. Tutto ciò che esiste o sorge sotto il sole – il passato, il presente e il futuro – ha in sé la massima certezza. Rispetto alle cose presenti o passate questa affermazione si chiarisce da sé, dato che quelle cose, essendo presenti o essendo state, escludono per ciò stesso la possibilità che non esistano o non siano esistite. Anche rispetto alle cose future non c’è da dubitare che saranno presenti, anche se non con l’ineluttabile necessità di una certa fatalità, come nella previsione e predeterminazione divine. Infatti, se ciò che è futuro non avvenisse sicuramente, non si capirebbe perché l’altissimo creatore dovrebbe godere della fama incondizionata di onnisciente e onnipotente. Ma su come questa certezza dell’essere futuro si concili con la casualità e l’indipendenza dalle cause efficienti, altri possono discutere. Noi non vogliamo addentrarci nella questione, la cui discussione non rientra nei nostri scopi. 8 In questo paragrafo mi avvalgo di Henry (2007) e di un testo (senza data) di Antonello Sciacchitano, reperibile in rete, come commento e traduzione della quarta parte della Ars conjectandi. 60 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità La certezza soggettiva delle cose – quella relativa a noi – non è in tutti uguale, ma varia di molto in più e in meno. Le cose di cui siamo certi per rivelazione, riflessione, percezione sensoriale, esperienza, autopsia o per altri modi, cioè le cose per le quali non dovremmo avere dubbi sulla loro esistenza presente o futura, possiedono per noi la certezza massima e assoluta. Tutte le altre cose contengono, a seconda della nostra conoscenza, una misura incompleta di certezza, che può essere più grande o più piccola, a seconda che esistano maggiori o minori probabilità che una certa cosa sia stata, sia o sarà. La probabilità è, infatti, un grado di certezza e si differenzia dalla certezza come la parte dal tutto. Quando, per esempio, indichiamo con a o con 1 la certezza piena e assoluta, composta per ipotesi da cinque probabilità o parti, di cui tre sono a favore del verificarsi di un certo evento presente o futuro, mentre le due rimanenti depongono contro, allora l’evento possiede la certezza 3 a o 3 . 5 5 Di due cose è più probabile quella che possiede una parte di certezza maggiore, anche se nell’uso linguistico comune viene detto realmente probabile ciò la cui probabilità è sensibilmente superiore a metà della certezza. Ho detto sensibilmente. Infatti, una cosa la cui probabilità è solo approssimativamente uguale a metà della certezza è detta dubbia o fluttuante. Ciò che ha 1 di certezza è più probabile di ciò che ne ha solo 1 , anche se nes10 5 suno dei due è effettivamente probabile. Possibile è ciò che ha una parte di certezza, anche se molto piccola. Impossibile è ciò che non possiede alcuna parte di certezza o ne possiede una infinitamente piccola. Possibile è per esempio ciò che ha 1 o 1 di certez20 30 za. Moralmente certo è ciò che si avvicina alla certezza piena, in modo tale che la differenza sia impercettibile. Per contro moralmente impossibile è ciò che possiede tanta probabilità quanto manca alla certezza morale per essere certezza piena. Se si tratta ciò che ha certezza di 999 come moralmente certo, ciò che ha solo 1 di certezza è 1000 1000 moralmente impossibile. Necessario è ciò che deve essere, essere stato in passato o essere in futuro. La necessità può essere fisica – per esempio, è necessario che il fuoco bruci; il triangolo abbia tre angoli che sommano a due retti; l’eclissi di luna debba verificarsi quando al plenilunio la luna si trova in un nodo; ipotetica, come conseguenza di cose che sono o sono supposte essere state in passato o essere in futuro, che esistono o devono essere esistite – in questo senso è necessario che Peter, che so o suppongo che scriverà, scriva effettivamente; stabilita per accordo – per esempio, il giocatore di dadi che faccia “sei” con un dado, deve necessariamente vincere, se i giocatori si sono preventivamente accordati che la vittoria va assegnata al lancio del “sei”. Casuale (sia in dipendenza dall’arbitrio di un essere dotato di ragione sia in dipendenza da un evento contingente o del destino) è ciò che poteva non essere, non essere stato nel passato o non essere nel futuro, beninteso come conseguenza di una possibilità lontana, non immediata. Infatti, non sempre la casualità esclude del tutto la necessità limitatamente a cause di importanza secondaria, come chiarirò con esempi. Certamente, in funzione del luogo, della velocità, della distanza del tavolo da gioco e del momento in cui lascia la mano, il dado non può cadere in modo diverso da come effettivamente cade. Analogamente il tempo per una determinata condizione atmosferica – quantità, dislocazione, movimento, direzione del vento, della nebbia e delle nuvole, nonché certe leggi meccaniche, secondo cui questi fattori interagiscono tra di loro – domani mattina non può fare altro che il tempo che farà. Questi eventi seguono le loro cause prossime non meno necessariamente dell’eclissi il movimento degli astri. E tuttavia ci si attiene alla consuetudine di considerare solo l’eclisse come evento necessario, mentre i lanci del dado e le configurazioni future del tempo atmosferico sono classificati come casuali. Ciò dipende esclusivamente dal fatto che non ci è sufficientemente noto ciò che è assunto come dato per la determinazione degli eventi successivi e in realtà è effettivamente dato. Ma se ci fosse sufficientemente noto, lo studio della matematica e della fisica è sufficientemente avanzato da consentirci di calcolare, a partire da date cause, gli effetti successivi, come dalle leggi astronomiche possiamo prevedere le eclissi. Prima che l’astronomia giungesse a tale perfezione si dovevano classificare le eclissi come gli altri eventi citati nel novero degli eventi casuali del futuro. Ne consegue che a un certo uomo e in un determinato momento può sembrare casuale quel che a un altro uomo (magari lo stesso) in un altro momento, può sembrare necessario, una volta note le cause. La casualità dipende soprattutto dalla nostra ignoranza [delle cause], nella misura in cui non possiamo formulare nessun argomento, che deponga contro il fatto che qualcosa non sia o non sarà, benché sulla base delle cause immediate a noi ancora sconosciute è o sarà necessariamente. Si chiama fortuna o sfortuna quel che di buono o di cattivo ci capita, ma non un buono o un cattivo qualunque, bensì solo ciò che probabilmente o almeno altrettanto probabilmente avrebbe potuto non toccarci in sorte. Perciò la fortuna e la sfortuna sono tanto maggiori quanto minore è la probabilità dell’evento buono o cattivo. Così è baciato dalla fortuna chi scavando una fossa per terra trova un tesoro, un caso che non si verifica neppure una volta su migliaia di casi. Se di venti disertori uno viene estratto a sorte per essere impiccato, come esempio dimostrativo per gli altri, i diciannove che restano, con i quali il destino si è mostrato benevolo, non possono dirsi particolarmente fortunati, ma il ventesimo che salito sul patibolo, quello è stato il più sfortunato di tutti. Se il tuo 61 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità amico torna dalla battaglia in cui sono caduti in pochi, senza neppure un graffio, non lo puoi dire fortunato, anche se forse lo vorresti, perché si è distinto solo per la fortuna di mantenersi in vita.» Il capitolo si apre con una dichiarazione che potremmo dire determinista, o meglio teologicamente tale, perché si riferisce ad una divinità onnisciente, quindi che non ha l’imbarazzo della incertezza. Così il campo della probabilità è tipicamente umano che trova la sua applicazione perché l’essere umano può raggiungere una certezza soggettiva o solo un certo grado di certezza oggettiva. La probabilità è quindi un grado di certezza. Discute inoltre la differenza tra la sua posizione e quella del senso comune. Il testo è discorsivo e tratta anche di altri argomenti connessi, che oggi difficilmente troveremmo su un testo di teoria delle probabilità. C’è un accenno ad un connettivo modale, ‘necessario che’. In logica modale questo connettivo (unario) è associato all’altro connettivo modale (unario) ‘possibile che’. Ma la definizione di Bernoulli male si accorda col legame fondamentale che sussiste tra questi connettivi modali, per cui ‘necessario che’ può essere inteso come ‘non possibile che non’ e ‘possibile che’ come ‘non necessario che non’, rapporti che ricordano dappresso le relazioni tra i quantificatori. Bernoulli non lo dice, ma sembra che ‘necessario’ sia invece un sinonimo di ‘certo’. Nel termine casuale Bernoulli congloba diversi concetti che hanno una lunga storia filosofica. Questa definizione di casualità include la nozione moderna di contingente, inteso come non impossibile e non necessario, in pratica come ciò che è possibile che sia ed è possibile che non sia, che trova la sua origine in un famoso esempio di Aristotele a riguardo di una battaglia. In termini di probabilità, un evento è contingente se la sua probabilità è diversa da 0 e da 1. Ma nella nozione di casualità c’è qualcosa di più del puramente logico che la rende problematica. Bernoulli non sapeva che l’analisi odierna della casualità, unita alla critica che trae origine dallo scetticismo (prima e dopo Hume) avrebbe individuato nella casualità un misto di oggettivo e soggettivo e pertanto che non può essere definita in modo rigoroso. Inoltre Bernoulli non sapeva distinguere tra determinismo e meccanicismo. Il determinismo è l’azione della causa ed esclude che ci possano essere effetti in assenza di causa, ‘spontanei’. Il determinismo censura l’esperienza del ‘falso’, che si fa quotidianamente in laboratorio: da una parte i ‘falsi positivi’ (effetti senza causa) e dall’altra i ‘falsi negativi’ (causa senza effetti). Il meccanicismo è indipendente dal determinismo, in quanto si limita a introdurre delle simmetrie nello spazio degli eventi, come la leva di Archimede che sta in equilibrio se ha bracci uguali e pesi uguali. Così due eventi complementari di probabilità pari a p e 1–p sono simmetrici rispetto a ½, quindi sono meccanici, anche se non sono deterministici. Inoltre in un passo successivo l’autore basandosi su una sorta di principio di ragione sufficiente dà un’interpretazione della casualità come mancanza (soggettiva) di conoscenza della causa, compiendo così una ‘dislessia’: casualità come acausalità. 62 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità 2.2.2.2. Il Capitolo II della Ars Conjecturandi. L‘argomento del secondo capitolo è «Sapere e congetturare. L’arte della congettura. Argomenti per congetture. Teoremi generali.» Il titolo del capitolo pone a fianco il ruolo della conoscenza nel senso di conoscenza certa e definisce cosa vuole dire congetturare. In questo è esplicito. Mostra poi alcuni esempi. Ma vediamolo in un certo dettaglio: «Di ciò che è certo e indubitabile diciamo che lo sappiamo o lo conosciamo, ma di tutto il resto diciamo solo che lo congetturiamo o lo supponiamo. Congetturare una certa cosa significa misurarne la probabilità. Perciò designiamo con arte della congettura (ars conjectandi sive stochastice), l’arte di misurare il più esattamente possibile la probabilità delle cose allo scopo di poter costantemente scegliere quel giudizio e seguire quella condotta, che ci sembrano migliori, più consoni, più sicuri o più consigliabili. Solo in ciò consiste la saggezza del filosofo e il senno dell’uomo di Stato. Le probabilità vengono valutate in funzione del numero e del peso degli argomenti che in un certo qual modo dimostrano o segnalano che una certa cosa è stata, è o sarà. Con peso intendiamo la forza dimostrativa. Gli argomenti sono o interni, essenzialmente artificiali, supposti a partire dai punti dimostrativi delle cause, degli effetti, dei soggetti, dei collegamenti, degli indizi o di qualsivoglia altra circostanza, che sembri avere una qualche connessione con la cosa da dimostrare, o esterni, o non artificiali, assunti dall’autorità o dalle testimonianze degli uomini. …» La proposta di misurare la probabilità è assai rilevante e ad essa si ispireranno in molti. L’idea quindi non è che la probabilità sia una misura, ma che la probabilità sia un qualche cosa di esterno che l’uomo sente l’esigenza di misurare. Il capitolo tratta poi un caso (fittizio) di omicidio, per mostrare come si articolano in pratica i concetti introdotti. L’autore fa affermazioni (condivisibili), ma con il tono di colui che mette le basi o gli assiomi di una nuova teorie. Ogni affermazione è seguita da una breve spiegazione – illustrazione: « 1 2. 3. 4. 5. 6. 7. 8. 9. Sono inammissibili congetture su cose su cui si può ottenere la certezza totale. Non basta ponderare l’uno o l’altro argomento, ma bisogna esaminare tutti gli argomenti di cui possiamo venire a conoscenza, i quali sembrino essere in qualche modo adatti a dimostrare la cosa. Non si deve tener conto solo di tutti gli argomenti a favore di una cosa, ma anche di quelli che possono essere portati contro di essa, affinché sia possibile stabilire in tutta evidenza dopo ponderazione accurata quali prevalgano. Per giudicare di cose generali bastano argomenti generali e generici. Ma per formulare congetture su cose singole si devono impiegare argomenti particolari e individuali, ammesso che siano disponibili. In cose incerte e dubbie bisogna rimandare l’azione finché si sia fatta più luce. Ma se l’occasione favorevole all’azione non tollera rinvii, allora tra due cose bisogna sempre scegliere quella che sembra più adatta, più sicura, più vantaggiosa e più probabile dell’altra, anche se nessuna delle due possiede effettivamente queste qualità. Ciò che in un caso può essere vantaggioso e in nessun caso svantaggioso, va preferito a ciò che in nessun caso è vantaggioso o svantaggioso. Il valore delle azioni umane non può essere valutato dal loro successo Nei nostri giudizi dobbiamo stare attenti ad attribuire alle cose più peso di quanto spetti loro e considerare ciò che è solo probabile come affatto sicuro, o imponendolo ad altri come tale. Poiché solo raramente si può pretendere la certezza assoluta, la necessità e la tradizione impongono di considerare come incondizionatamente certo ciò che è solo moralmente certo. » 63 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità Come si vede, si tratta di buon senso, talvolta di buona educazione, talaltra di aspetti morali. Un poco inquietante è la ‘quantificazione’ della morale. Dice infatti «Sarebbe utile fissare d’autorità limiti ben definiti alla certezza morale, per esempio esigere il 99/100 o 999/1000 della certezza, in modo che il giudice non sia di parte, ma abbia un punto di vista solido, da tener presente in ogni caso di giudizio.» Ad un lettore abituato allo stile dei moderni trattati di matematica, queste considerazioni suonano abbastanza strane. Ritroviamo, però una formulazione della regola 3, espressa con altre parole, in Dimostrazioni e confutazioni di Lakatos 9. Imre Lakatos 1922 - 1974 2.2.2.2 Il Capitolo III della Ars conjectandi. Si tratta di un capitolo in cui, tra altre cose di poco interesse matematico, compare la definizione di probabilità come rapporto, assegnato a priori. Il titolo del capitolo è: « Diversi tipi di argomenti dimostrativi. Valutazione del loro peso per il calcolo delle probabilità delle cose. » Il capitolo si apre con alcune affermazioni e loro spiegazioni. La prima affermazione è: « Chi voglia comprovare gli argomenti dimostrativi di un giudizio o di una congettura, ne distinguerà di tre tipi diversi. Alcuni sono necessariamente presenti e mostrano la casualità della cosa; altri sono casualmente presenti e mostrano la necessità della cosa; altri ancora sono casualmente presenti e mostrano la casualità della cosa. Chiarirò le differenze con esempi…. Oltre a queste diversità tra argomenti dimostrativi, se ne possono registrare altre, nella misura in cui alcuni sono puri e altri misti. Chiamo puri quegli argomenti dimostrativi che in certi casi dimostrano una cosa, mentre in altri non la dimostrano positivamente. Chiamo misti quegli argomenti che in certi casi dimostrano una cosa, mentre in altri dimostrano l’esatto contrario. » L’ultima distinzione merita una riflessione. La distinzione che Bernoulli fa tra argomenti puri che possono dimostrare o non dimostrare e quelli misti che possono dimostrare o possono dimostrare che non. C’è quindi un sottile gioco della negazione. E viene anche il sospetto che la logica usata da Bernoulli non sia strettamente classica, in quanto gli stessi argomenti potrebbero dimostrare una affermazione o la sua negazione. Alcuni studiosi hanno visto qui una anticipazione tra probabilità ‘assoluta’ e ‘probabilità condizionata’. Continuiamo l’analisi «Da quanto detto risulta evidente che la forza dimostrativa di un argomento dipende dal numero dei casi in cui esso è o può essere presente, mostrando una cosa o non mostrandola o potendo addirittura mostrare il suo contrario. In base a questi casi si può calcolare, con l’aiuto della teoria esposta nella prima parte, esattamente il grado di certezza o di probabilità, che un argomento dimostrativo porta con sé, nonché la speranza di vincita di un partecipante a un gioco d’azzardo. Per dimostrarlo assumiamo che il numero di casi in cui un argomento possa essere casualmente presente sia b, il numero di casi in cui non possa essere presente sia c, e che il totale dei casi sia b + c = a. Inoltre sia β il numero di casi in cui un argomento dimostrativo mostra casualmente una certa cosa, e sia γ il numero di casi in cui non mostra quella cosa o mostra il suo contrario, e sia β + γ = α. Assumiamo inoltre che tutti i casi siano egualmente possibili, cioè che ogni caso possa verificarsi con la stessa facilità degli altri. In altri casi adottiamo la modifica per cui, al posto di un caso che si verifica più facilmente contiamo tanti casi che nell’insieme si verificano tanto facilmente quanto quello. Per esempio, invece di un caso tre volte più probabile contiamo tre casi che si verificano con la stessa facilità. 1. Se un argomento dimostrativo può essere casualmente presente e mostrare necessariamente una cosa, allora per le convenzioni precedenti esistono b casi in cui è presente e può mostrare anche la cosa e c casi in cui non è 9 Lakatos, I. (1979). Dimostrazioni e confutazioni – La logica della scoperta matematica, Milano: Feltrinelli Editore. 64 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità presente e quindi non può mostrare la cosa. Ciò dà il peso b ⋅1 + c ⋅ 0 = b , così l’argomento dimostra b della cosa o a a a possiede b della certezza della cosa.» a Così si ha la determinazione della probabilità in situazioni di equiprobabilità, come rapporto dei casi favorevoli rispetto ai casi possibili. Ma Bernoulli tratta anche gli altri due casi:. «2. Se un argomento dimostrativo è necessariamente presente e può mostrare casualmente la cosa, per le assunzioni precedenti sono presenti β casi in cui l’argomento può mostrare la cosa e γ casi in cui non la mostra o mostra addirittura il suo contrario. Ne consegue che la forza dimostrativa dell’argomento è β ⋅ 1 + γ ⋅ 0 = β e dimoα α stra quindi β della certezza della cosa. Se l’argomento dimostrativo è di tipo misto, consegue per la certezza del α suo contrario γ ⋅ 1 + β ⋅ 0 = γ . α α 3. Se un argomento dimostrativo è casualmente presente e può mostrare casualmente la cosa, assumiamo innanzitutto che esso sia presente. In tal caso, come abbiamo visto, dimostra β della cosa e, se l’argomento è di tipo α misto, dimostra γ del contrario della cosa. Poiché ora ci sono b casi, in cui l’argomento dimostrativo è presente, α e c casi in cui non è presente, l’argomento dimostrativo ha per la cosa il peso tipo misto il valore per la dimostrazione del contrario è b⋅ b⋅ β + c⋅0 bβ . Se l’argomento di α = a aα γ + c⋅0 bγ . » α = a aα Interessante l’analisi separata “della cosa”, noi diremmo dell’evento e della dimostrazione. In caso di certezza della cosa o della dimostrazione entra in gioco solo un tipo di probabilità. Ma nel terzo caso, in cui l’informazione è casuale sia sull’evento che sulla sua dimostrazione, la probabilità si ottiene come prodotto e questo anticipa vari tipi di concetti: eventi indipendenti (e quindi probabilità condizionata), probabilità totali, o spazi prodotto. Sembra che l’autore consideri due probabilità condizionate ma con condizionamenti diversi, p(B|A) e p(¬B|A’). Bernoulli mostra diversi esempi, anche con più ‘cose’ contemporaneamente. Ma data la novità di quello che propone, prima di concludere il capitolo afferma: «Prevedo, in quanto non posso negarlo, che si presenteranno diverse circostanze in cui, applicando a casi speciali queste regole, si possa spesso incorrere in sottili errori per non aver accuratamente elaborato le differenze tra gli argomenti. Infatti, talvolta gli argomenti dimostrativi sembrano diversi, mentre rappresentano un unico argomento. Viceversa, argomenti dimostrativi effettivamente diversi sembrano formare un unico argomento. Si arriva ad applicare argomenti tali da rendere impossibile dimostrare il contrario e così via.» La sua previsione si rivelerà veridica anche oggi, perché restano ancora vari aspetti dell’argomento da chiarire. Per quanto riguarda la concezione di probabilità, in questo capitolo l’autore sembra adottare una nozione di tipo classico. 2.2.2.4. Il Capitolo IV della Ars conjectandi. Si tratta del capitolo in cui Bernoulli ‘svela’ la sua interpretazione della probabilità. Certamente un’analisi che preveda l’adozione completa da parte del matematico di Basilea di un unico approccio fondazionale sul tema è storicamente poco plausibile. Bernoulli mostra, nei primi capitoli, attenzione per aspetti ‘a margine’ della ricerca matematica, e possibili applicazioni a vari aspetti della vita comune. E quindi, nel districare l’intricata rete di con65 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità cetti prescientifici in cui si muove, fluttuazioni nella scelta di un idea sui fondamenti, non è un ‘peccato’, ma la norma. È invece evidente il suo sforzo per giungere ad un modello matematico affidabile che sia utilizzabile in vari casi. La complessità dell’argomento, che è mostrata dall’analisi fine presentata in precedenza, può essere la ragione per un uso scorretto delle idee, ma nonostante gli sforzi fatti, le complessità rimangono. Il titolo del quarto capitolo è «Sui due modi di determinare i casi. Validità della determinazione attraverso l’osservazione. Problema principale e altro.» Il testo è ricco di spunti di vario interesse: «Quindi siamo arrivati al punto in cui, per formare corrette congetture su qualcosa, non si richiede altro che determinare dapprima esattamente il numero di questi casi e poi stabilire quanto è più facile che un caso si verifichi rispetto a un altro. La difficoltà – ci sembra – sta proprio qui. Infatti, ciò è possibile per pochissimi fenomeni e quasi esclusivamente per i giochi d’azzardo. Affinché i partecipanti al gioco avessero uguali prospettive di vincita, gli inventori dei giochi d’azzardo li hanno predisposti in modo che il numero di casi in cui si dà guadagno o perdita siano noti e determinabili a priori e che tutti i casi si possano verificare con uguale probabilità. Nella stragrande maggioranza dei casi, dipendenti dalle forze della natura o dall’arbitrio dell’uomo, ciò non si verifica. Per esempio, nei dadi il numero dei casi è noto, perché per ogni dado esistono tanti casi quante facce. Tutti questi casi sono egualmente facilmente possibili. Data l’uguale forma delle facce e la simmetria del peso dei dadi, non ci sono ragioni per cui una faccia debba cadere più facilmente dell’altra, come sarebbe il caso se le superfici del dado avessero forma diversa e una parte del dado fosse più pesante dell’altra. Stesso discorso vale per il numero dei casi di possibili estrazioni di una pallina bianca o nera da un’urna nota, da cui tutte le palline possono essere estratte con eguale facilità, in quanto è noto quante palline di ogni tipo sono presenti nell’urna e non si possono addurre ragioni perché sia più facile estrarre una pallina o l’altra. Quale mortale potrebbe determinare il numero di malattie (cioè il numero di casi) che possono capitare al corpo dell’uomo in ogni sua parte e in ogni età e portarlo alla morte – la peste come l’idropisia, l’idropisia come la febbre – per trarne una congettura sul rapporto tra vita e morte nelle generazioni future? O chi potrebbe enumerare gli innumerevoli casi di cambiamento cui giornalmente va incontro l’aria, volendo già da oggi congetturare che tempo farà tra un mese o tra un anno? … Ma qui ci si apre un’altra via per trovare ciò che si cerca e per determinare almeno a posteriori, cioè stabilendolo dall’esito osservato in numerosi casi simili, quel che non possiamo determinare a priori. A tal fine bisogna supporre che ogni singolo evento possa verificarsi o non verificarsi in altrettanti casi quanti sono stati osservati verificarsi o non verificarsi in precedenza nelle stesse circostanze. Per esempio, se si è osservato che di 300 uomini della stessa età e costituzione di Tizio 200 sono morti entro 10 anni, mentre gli altri sono sopravvissuti, allora si può ragionevolmente dedurre che c’è il doppio di casi in cui anche Tizio debba nel prossimo decennio pagare alla natura il tributo dovuto, rispetto ai casi che in questo frangente possono sopravvivere. Analogamente, se qualcuno ha da lungo tempo osservato il tempo atmosferico e notato quante volte è stato sereno e quante piovoso o se qualcuno ha osservato spesso due giocatori e notato quante volte questo o quello abbia vinto, può proprio a partire da ciò determinare il rapporto che probabilmente avranno in seguito i casi in cui gli stessi eventi si possono verificare o non verificare come in precedenza alle stesse condizioni. Questo modo empirico di determinare il numero di casi attraverso l’osservazione non è né nuovo né fuori dal comune. Infatti, già il famoso autore dell’opera l’“arte di pensare”, uomo acuto e talentuoso, ha descritto nel cap. 12 e sg. nell’ultima parte del proprio lavoro un processo del tutto analogo, come tutti gli uomini possono osservare nella vita quotidiana. Inoltre è evidente a tutti che non basta fare questa o quella osservazione per giudicare empiricamente un evento, ma è necessario un gran numero di osservazioni. Talvolta un uomo veramente ingegnoso, dotato di un proprio istinto naturale e senza precedente formazione, ha fatto l’esperienza – davvero meravigliosa – che, tanto più numerose sono le osservazioni pertinenti, tanto minore è il pericolo di deviare dalla verità. Sebbene tutti riconoscano che ciò stia nella natura della cosa, la dimostrazione fondata su principi scientifici non è a portata di mano e mi tocca produrla qui. Ma credo di far poca cosa soffermandomi a dimostrare questi pochi punti, noti a tutti.» Così il grado di certezza è definito dal rapporto tra il numero dei casi favorevoli rispetto a quelli possibili (implicitamente equiprobabili), ma c’è una difficoltà, anzi c’è la difficoltà principale: tale situazione si riesce a dominare solo in pochi casi, quali quelli del gioco d’azzardo. Ciò è insito nei giochi stessi, in quanto invenzione esplicita predisposta perché il gioco sia equo. Ricordando che nei predecessori di Bernoulli si è spesso trattato del gioco dei dadi, traspare il fatto che la regolarità 66 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità della geometria, presente fisicamente nella moneta o nel dado ed anche concettualmente nella cultura matematica, sia la ragione profonda della richiesta di equiprobabilità nei casi elementari. Il (per Bernoulli) recente avvento della geometria cartesiana, con l’irruzione della misura del contesto euclideo, ha permesso di determinare opportune unità di misura per misurare varie grandezze. La misura poi si esplica nella costruzione di multipli e sottomultipli della unità e questa ripartizione in parti uguali può avere ispirato il concetto di equiprobabilità. Ma Bernoulli si vede costretto ad ammettere che se vuole applicare il suo strumento matematico a vari casi concreti o connessi con le scienze umane, questa situazione ‘perfetta’, non è adeguata. Formula poi il principio di ragione sufficiente: non ci sono ragioni perché un dado (non truccato) cada mostrando una faccia piuttosto che un’altra. Siccome si suppone che la parte più matematica dello Ars conjectandi sia stata scritta attorno al 1692, non è improbabile che la presenza in esso del principio di ragione sufficiente sia dovuta alla conoscenza delle idee di Leibniz, in particolare di quelle che vedranno la luce nella Monadologia, in cui il principio di ragione sufficiente viene presentato e sfruttato strumento essenziale per definire l’essere come potenzialmente tale. La soluzione che Bernoulli prospetta è contenuta nella proposta di una probabilità ottenuta a posteriori sulla base della frequenza con cui si presenta un evento. E fa un caso ispirato alle tavole di mortalità che Graunt aveva iniziato a pubblicare. Bernoulli ha però una ‘sorpresa’ in serbo per il lettore. Quella che a questo punto sembra una proposta legata al buon senso, è invece basata scientificamente su un risultato teorico, la Legge dei grandi numeri. La novità ed importanza di questo risultato fa sì che semplice descrizione di casi legati ai giochi divenga una nuova scienza, passaggio che l’opera di Huygens non avrebbe permesso in pieno. Tuttavia Bernoulli si preoccupa che il suo approccio venga accettato e porta a sostegno della sua proposta il fatto che non sia nuovo, né fuori dal comune, che si possa ritrovare nella Logique di Port Royal. In questo, soprattutto nel fatto che l’idea frequentista sia ‘vecchia’ o comune, è in parte non accettabile, almeno se l’autore svizzero si riferisce alla scienza antica. Infatti, e lo si vede bene dai Dialoghi di Galilei, la scienza antica utilizzava la esperienza per riconoscere e confermare ciò che era stato scritto sia nei Testi Sacri, sia nelle opere dei grandi filosofi del passato. Con Galilei, appunto, il ruolo dell’esperienza cambia, divenendo verifica quantitativa del fenomeno che coopera alla costruzione del sapere scientifico non dato, ma in divenire. Il testo contiene anche un riferimento implicito a Francis Bacon sulla corroborazione data dal numero dei casi. Ma dalla intuizione alla proFrancis Bacon 1561 - 1626 va ci vuole una dimostrazione. Il capitolo continua e qui si riportano le affermazioni più rilevanti che spiegano la linea di pensiero ed anche contengono un’esplicita dichiarazione di paternità di questi contenuti innovativi. 67 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità «Bisogna prendere in considerazione molto di più di ciò a cui forse nessuno abbia finora pensato. Infatti, resta da esaminare se l’aumento delle osservazioni porti ad aumentare in modo continuo la probabilità che il numero di osservazioni favorevoli raggiunga il vero rapporto rispetto alle sfavorevoli. E precisamente nella misura in cui o questa probabilità supera definitivamente qualunque grado arbitrario di certezza oppure il problema ha, per così dire, il proprio asintoto, cioè è presente un determinato grado di certezza – il vero rapporto dei casi da trovare – che non si può mai superare comunque si aumentino le osservazioni. Per esempio, non possiamo mai raggiungere una certezza superiore a ½, 2/3, ¾ per determinare il vero rapporto dei casi. Un esempio chiarirà quel che intendo. Supponiamo che in un’urna, senza che tu lo sappia, ci siano 3000 sassolini bianchi e 2000 neri. Procedendo per tentativi tu vuoi determinare il loro rapporto, estraendo un sassolino dopo l’altro (e rimettendolo nell’urna dopo averlo estratto in modo che il numero dei sassolini non diminuisca) e osservando quante volte esce un sassolino bianco e quante uno nero. Ci si chiede se tu puoi ripetere l’operazione tanto spesso, da far sì che diventi dieci, cento, mille volte più probabile (fino a raggiungere la certezza morale) che il numero delle volte in cui estrai un sassolino bianco rispetto al numero delle volte in cui estrai un sassolino nero, assuma lo stesso rapporto di 3/2 che hanno tra loro i sassolini (o i casi), o questi numeri non formino un tutt’altro rapporto diverso da quello. Se non si verifica il primo caso, ammetto che il nostro tentativo di determinare il numero dei casi attraverso osservazioni è mal congegnato. Ma se si verifica e in questo modo [sperimentale] posso ottenere la certezza morale (che sia effettivamente così lo dimostrerò nel prossimo capitolo), allora posso trovare a posteriori il numero di casi esattamente come se lo conoscessi a priori. … A scanso di fraintendimenti, va precisato che il rapporto tra i numeri dei casi [favorevoli e contrari], da determinare attraverso le osservazioni, non viene ottenuto con precisione assoluta, ma solo con una certa approssimazione, cioè racchiuso tra due limiti, che tuttavia possono essere presi arbitrariamente vicini. Se nell’esempio precedente dell’urna piena di sassolini otteniamo due rapporti, per esempio 301/200 e 299/200 (o 3001/2000 e 2999/2000), di cui uno è maggiore e l’altro minore di 3/2, allora si dimostra che con qualsivoglia probabilità è più probabile che, dopo osservazioni ripetute un gran numero di volte, il rapporto trovato giaccia all’interno di questi limiti, posti intorno a 3/2, piuttosto che all’esterno. Questo è il problema che qui mi sono proposto di pubblicare, dopo essermene occupato per vent’anni. La sua novità, insieme alla sua straordinaria utilità, unitamente alla notevole difficoltà, supera in importanza tutti gli altri capitoli di questa teoria.» La parola “approssimazione” che viene usata dall’autore, non è un sinonimo di ‘modo approssimativo’, di ‘pressappoco’, ne di ‘in modo impreciso’ e neppure di ‘erroneamente’, ma è il contenuto della proposta scientifica che Bernoulli sta avanzando, si tratta di definire cosa si debba intendere per approssimazione. È dunque un dato da ottenere in modo corretto e preciso per stimare al meglio possibile il dato preciso che ci è impossibile conoscere. La confessione sulla durata della ricerca e le parole sulla utilità hanno un poco il sapore di spot pubblicitario, oppure sono un avviso che anche se il risultato non sembra immediatamente comprensibile, il lettore si deve fidare che lo troverà importante nelle applicazioni. Però altre scoperte fondamentali per lo sviluppo della scienza hanno impiegato un tempo analogo, quindi c’è da credergli. Analizziamo dappresso l’esempio dei sassolini. «Se nell’esempio precedente dell’urna piena di sassolini otteniamo due rapporti, per esempio 301/200 e 299/200 (o 3001/2000 e 2999/2000), di cui uno è maggiore e l’altro minore di 3/2, allora si dimostra che con qualsivoglia probabilità è più probabile che, dopo osservazioni ripetute un gran numero di volte, il rapporto trovato giaccia all’interno di questi limiti, posti intorno a 3/2, piuttosto che all’esterno. » Detta in termini moderni, sia p la probabilità di sorteggiare un sassolino bianco. Possiamo dire, conoscendo la composizione dell’urna, che p = 3/5. Di conseguenza la probabilità di sorteggiare un sassolino nero è il valore complementare, 1 – p = 2/5, ma non si conosce la composizione dell’urna, tuttavia in base a tale composizione, il rapporto tra le probabilità di estrazione di sassolini di colore 68 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 diverso è dato da Capitolo 2. La nascita della probabilità p 3 5 3 = ⋅ = . Indicata allora con f(n) la frequenza assoluta osservata di estra1− p 5 2 2 zioni di sassolini bianchi in n estrazioni e con essendo f (n ) la frequenza relativa ed essendo n – n f(n) la frequenza assoluta di estrazione di sassolini neri, la frequenza relativa di estrazione di sassolini neri è data da n − f (n ) f (n ) Il rapporto tra le frequenze relative è dato da =1− n n f (n ) f (n ) n = ed è anche uguale al rapporto tra le frequenze assolute delle n estrazioni. La f (n ) n − f (n ) 1− n domanda di Bernoulli è « se l’aumento delle osservazioni porti ad aumentare in modo continuo la probabilità che il numero di osservazioni favorevoli raggiunga il vero rapporto rispetto alle sfavorevoli.», vale a dire se la probabili- f (n ) f (n ) p p n n tà dell’evento , che potremmo scrivere è una funzione creP = = f (n ) 1 − p f (n ) 1 − p 1− 1 − n n scente (e limitata, in quanto probabilità) in dipendenza essendo p quello che Bernoulli chiama 1− p “il vero rapporto”. Mancandogli il concetto di limite, che sarà introdotto in seguito e sfruttato adeguatamente solo nel secolo successivo introduce l’asintoto. Bernoulli poteva conoscere solo parzialmente le Coniche di Apollonio di Perge, dato che la prima edizione latina Apollonio di Perge III sec. a.C. completa in epoca moderna del testo di Apollonio è del 1710 e si deve al grande astronomo inglese Halley. Apollonio aveva Edmund Halley 1656 - 1742 introdotto il concetto di asintoto trattando delle iperboli, e questo concetto era, alla fine del XVII secolo forse l’unico esempio di un limite (all’infinito) o di punto di accumulazione. Quindi Bernoulli opera per analogia, non avendo il costrutto teorico più opportuno, ma giunge al risultato corretto. L’affermazione di Bernoulli è che presi ora due valori r −1 r +1 e , con r e t numeri naturali (e t t nell’esempio essi sono 299/200 e 301/200, oppure 2999/2000 e 3001/2000, per ogni ε > 0, piccolo a 69 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 piacere, esiste un n tale che l’evento Capitolo 2. La nascita della probabilità f (n ) p f (n ) 1 1 abbia probabilità − < < + n − f (n ) t 1 − p n − f (n ) t f (n ) p f (n ) 1 1 P − < < + > 1 − ε . n − f (n ) t 1 − p n − f (n ) t In questa presentazione c’è un sospetto di ritorno della probabilità a priori. Infatti se si esegue un vero sorteggio con le modalità indicate non è detto che i rapporti delle frequenze siano frazioni con lo stesso denominatore che nell’esempio è il numero dei sassolini neri e la giustificazione di Bernoulli «…il rapporto tra i numeri dei casi [favorevoli e contrari], da determinare attraverso le osservazioni, non viene ottenuto con precisione assoluta, ma solo con una certa approssimazione, cioè racchiuso tra due limiti, che tuttavia possono essere presi arbitrariamente vicini». Tuttavia questa posizione sembra richiedere d’avere preventivamente individuato esattamente almeno la probabilità dell’estrazione dei sassolini neri. La difficoltà che Bernoulli cita è effettiva e assai delicata perché nel problema intervengono due tipi di probabilità: La difficoltà concettuale sta in questo doppio riferimento alla probabilità. Con p indichiamo la probabilità dell’evento: “estrarre un sassolino bianco dall’urna” ed essa si può calcolare con 3000/5000, ma soltanto se svuota l’urna e si contano i sassolini contenuti in essa. Ma non basta questa perché c’è da tenere in conto anche la probabilità P dell’evento: “il rapporto trovato giaccia all’interno di questi limiti”, che è una sorta di meta-probabilità, perché fornisce la stima sul ‘comporta- mento’ di una probabilità. Si può osservare che p è legata alla situazione concreta che si sta trattando, mentre P è una probabilità ha per oggetto non il numero di biglie, ma la conoscenza del fenomeno. È questo secondo tipo di probabilità che permette di ipotizzare come dovrebbe essere la composizione dell’urna che si sta analizzando. La trattazione fa intervenire sempre il rapporto tra i numeri di sassolini, e non le sole frequenze delle estrazioni, perché mediante il rapporto ‘sparisce’ la numerosità complessiva dei sassolini contenuti nell’urna. Il Capitolo IV si chiude con alcune considerazioni in risposta a critiche che riguardano, sostanzialmente il rapporto tra finito ed infinito. Quando questo infinito è Dio, Bernoulli rinuncia all’indeterminismo. Ma anche rimanendo a livello umano, visto che ha rinunciato al “valore vero” in favore di un intervallo cui tale valore appartenga, un intorno) sfrutta l’approssimazione per poter gestire l’infinito. 2.2.2.5. Il Capitolo V della Ars conjectandi. Si tratta di un capitolo eminentemente tecnico, con numerosi risultati matematici preordinati alla dimostrazione del teorema preannunciato verso la fine del Capitolo IV. Il titolo apposto al capitolo è «Soluzione del problema precedente ». Il testo letterario in 70 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità questo capitolo occupa poco spazio, essendo di collegamento tra i risultati e di supporto all’articolazione deduttiva. Per darne un esempio si riportano il brano iniziale. «Per abbreviare al massimo la dimostrazione estesa e renderla più chiara, tento di esporre tutto in termini puramente matematici. A tale scopo premetto i seguenti lemmi. Una volta dimostrati, il resto della dimostrazione consiste semplicemente nell’applicare i lemmi. Lemma 1. Sia dato [il tratto iniziale del] la serie dei numeri naturali 0, 1, 2, …, r–1, r, r+1, …, r+s, dove r è un numero qualsiasi intermedio e r–1 e r+1 i numeri contigui a r rispettivamente a sinistra e a destra. Si prolunghi la serie finché l’ultimo termine abbia un rapporto intero arbitrario con r+s, diciamo nr+ns. La nuova serie consisterà dei termini 0, 1, 2, …, nr–n, nr, nr+n, …, nr+ns. Al crescere di n cresce il numero di termini compresi tra nr e nr+n, rispettivamente tra n e nr–n, come anche aumenta il numero di termini compresi tra nr+n, rispettivamente nr–n, e i termini più esterni nr+ns e 0. Tuttavia, per quanto grande si scelga n, il numero di termini superiori a nr+n non supera mai di più di (s–1) volte il numero di termini compresi tra nr e nr+n e il numero di termini minori di nr–n non supera mai di (r–1) volte il numero di termini compresi tra nr–n e n. Dimostrazione. Il numero di termini maggiori di nr+n è pari a n(s–1) e il numero di termini inferiori a nr–n è pari a n(r–1). Il numero di termini compreso tra nr escluso e uno dei due limiti incluso è pari a n. Ma si verifica sempre n(s–1) : n = s–1 : 1 n(r–1) : n = r–1 : 1. Da cui segue ecc. Lemma 2. Elevando il binomio r+s a una potenza intera arbitraria, lo sviluppo ha sempre un termine in più della potenza. Infatti, lo sviluppo del quadrato ha tre termini, del cubo quattro ecc. » Da questo breve estratto si coglie il mutamento di stile usato qui rispetto a quello delle citazioni riportate sopra. Nel Lemma 1 sorprende il fatto che l’enunciato sia assai più lungo della dimostrazione. Di fatto l’enunciato in un qualche modo contiene la dimostrazione, che diviene così assai scarna. La dimostrazione è solo accennata. Le affermazioni da provare hanno un alto grado di evidenza. Si ha infatti (nr + ns) – (nr + n) = ns – n = n(s – 1), quindi nell’elenco da 1 a (nr + ns) ci sono n(s – 1) numeri maggiori di nr + n. Ma anche (nr – n) si può scrivere in una forma analoga: (nr – n) = n(r – 1). Meno chiara è l’affermazione “Il numero di termini compreso tra nr escluso e uno dei due limiti incluso è pari a n”, a meno che non intenda che la differenza (nr + n) – nr = n oppure nr - (nr – n) = n, interpretan- do ‘limite’ come il numero ottenuto da r-1 e da r+1 moltiplicandoli per n. Il discorso di ‘escluso/incluso’ sta a dire che si deve considerare la coppia di relazioni < e ≤, oppure ≤ e <. Le due proporzioni indicate nella dimostrazione sono assai poco significative, come enunciato, per la loro evidenza, molto interessanti perché denotano un retaggio euclideo (non ci sono misure, ma solo rapporti e proporzioni) da cui non sembra si sia affrancato, anche se conosce l’opera di Cartesio che ne prescinde. Interessante la dimostrazione brevissima del Lemma 2, che da un lato si può considerare come una giustificazione data da alcuni esempi. La parola “ecc.” cela l’uso della induzione. Anche in questo caso la dimostrazione, se può dirsi tale, presenta un discorso argomentativo, che non è neppure segnalato con la parola Dimostrazione. Ma procediamo con la presentazione dei Lemmi proposti da Bernoulli 71 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità «Lemma 3. Nello sviluppo della potenza del binomio r+s, la cui potenza sia un multiplo intero di r+s = t, per esempio n(r+s) = nt, il termine M assume il valore massimo solo se il numero dei termini che lo precedono sta al numero di quelli che lo seguono come s sta a r o, equivalentemente, se gli esponenti di r ed s stanno tra loro come r ed s e ciascuno dei termini contigui a M a destra o a sinistra è maggiore di ogni termine più distante dallo stesso lato. Inoltre M ha con un termine contiguo un rapporto inferiore di questo con un termine più distante – a parità di distanza dei termini. … Lemma 4. Nella potenza del binomio con esponente nt il numero n può essere preso così grande che il rapporto del massimo M con i due termini Ln e Rn, che stanno a destra e a sinistra di M nello sviluppo in serie, può assumere un valore maggiore di qualunque valore stabilito. … Lemma 5. Nella potenza di un binomio con esponente nt il numero n può essere scelto tanto grande che il rapporto tra la somma bilaterale di tutti i termini compresi tra il massimo M e i termini Ln e Rn (compresi) e la somma dei termini rimanenti, che giacciono al di fuori dei limiti Ln e Rn, assuma un valore superiore a qualunque valore dato. » Come si coglie dagli enunciati, si tratta di argomenti tecnici che riguardano le potenze di un binomio, ma in un caso particolare, cioè quando i due ‘monomi’ presenti nel binomio sono numeri la cui somma è un numero naturale e l’esponente è multiplo della somma stessa. Si nota, nelle dimostrazioni, un uso costante della nozione di rapporto, che si può ritenere di ascendenza euclidea, ma tale tradizione è in parte violata in quanto manca una chiara introduzione dei termini del discorso. Ad esempio, Ln e Rn, che sono simboli scelti per indicare ciò che sta a sinistra e ciò che sta a destra, basandosi sulla lingua tedesca e non sul latino usato per il testo, vengono introdotti in una dimostrazione e poi usati in modo globale. Nell’enunciato del Lemma 3 compare “il termine M” e dall’enunciato stesso sembra riferirsi a qualcosa detto in precedenza, ma il lettore può controllare che si tratta di un nuovo ‘personaggio’, in quanto si è riportato integralmente il testo che precede il Lemma 3. Non è chiaro dal testo se si tratta di un risultato esistenziale, cioè l’articolo “il” sottintende un quantificatore esistenziale. In realtà si enuncia una affermazione in cui r,s e n sono quantificate universalmente, relativamente agli interi positivi. Con “termine” Bernoulli intende uno degli addendi dello sviluppo del binomio e la questione che si pone è quella di calcolare, comunque assegnati i ‘monomi’ i vari termini che si formano nello sviluppo, in questo caso particolare in cui l’esponente un multiplo intero della somma dei due monomi. Nella dimostrazione, l’autore esplicita che deve prendere in considerazione: nt nt M = r nr s ns = r nr s ns nr ns Di fatto la dimostrazione non prova direttamente quanto enunciato, ma solo il fatto che in questo particolare caso di sviluppo di una somma il termine così individuato è quello che ha valore massimo. Infatti il rapporto tra M e L1 (dove L1 è il termine immediatamente a sinistra di M, nella espres nt nr +1 ns −1 r sione standard dello sviluppo della potenza del binomio L1 = s ) è dato da nt − 1 72 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità nt nr ns r s M (nt )! s(ns − 1)! (nt − (ns − 1))! = s(ns − 1)! (nr + 1)! = s ⋅ (nr + 1) = r ⋅ ns + s > 1 ns = = (nt )! r (( ns )! (nt − ns )! L1 nt nr +1 ns −1 r (ns )! (nr )! r ⋅ ns r ⋅ ns r s ns − 1 Qui si sono usati i simboli attuali. Non sono riuscito a trovare quale simbolo Bernoulli usi per i coefficienti binomiali, sicuramente non gli attuali che furono introdotti nel 1826 da Von Ettinghausen ma non sembra utiAndreas Von Ettinghausen 1796 - 1878 lizzare i fattoriali, scrivendo esplicitamente i fattori del fattoriale con ‘puntini’ in mezzo. In modo analogo si prova che nt nr ns r s (nt )! r (nr − 1)! (nt − (nr − 1))! = r (nr − 1)! (ns + 1)! = r ⋅ (ns + 1) = r ⋅ ns + r > 1 M ns = = R1 nt nr −1 ns +1 (nt )! s(( ns )! (nt − ns )! s(ns )! (nr )! s ⋅ nr s ⋅ nr r s nr − 1 Sempre trattando questo caso particolare si prova anche che detto L2 il termine immediatamente a sinistra di L1 e R2 quello immediatamente a destra di R1, si ha con calcoli analoghi L1 s ⋅ (nr + 2 ) nrs + 2 s R r ⋅ (ns + 2 ) nrs + 2r = = > 1; 1 = = >1 L2 r ⋅ (ns − 1) nrs − r R2 s ⋅ (nr − 1) nrs − s A mio parere, Bernoulli ha avuto ‘conferma’ della bontà della sua indagine proprio dalla evidente regolarità dei termini rispetto al ruolo svolto in essi da r e da s. La conclusione è che M > L1 > L2 e M > R1 > R2. È proprio in base a questa regolarità che l’autore si sente in grado di affermare che M è il massimo, dato che la sua dimostrazione riguarda esplicitamente solo questi termini e il CVD finale devolve la parte ‘sporca’ della dimostrazione al lettore che non dovrà solo mostrare quanto accade coi rapporti, ma osservare le successioni decrescenti ce si ‘irraggiano’ da M. La parte dell’enunciato che riguarda i rapporti sulla numerosità dei termini non ha alcuna rilevanza, dato che si tratta di una dimostrazione diretta, ma è, caso mai un corollario. L’asserto e la dimostrazione, si reggono su una ipotesi implicita, che r e s siano numeri positivi, mentre l’enunciato del Lemma 3 richiede solo che (r + s) sia un intero positivo. La seconda parte dell’enunciato “Inoltre M ha con un termine contiguo un rapporto inferiore di questo con un termine più distante – a parità di distanza dei termini.” È anche ad essa per ogni k e p, con 2k < nr, Ma si ha di altrettanto semplice dimostrazione. In base L M < k . Lk L2 k L M nrs + s nrs + 2 s M L1 = e 1 = . Pure banalmente si ha < in quanto la seconda fraL1 nrs L2 nrs − r L1 L2 zione ha un denominatore minore del denominatore del primo rapporto e il numeratore della seconda frazione è maggiore del numeratore della prima. Se si vuole controllare mediante il ‘prodotto in 73 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità croce’ si ha ha (nrs-r)·(nrs+s) = (nrs)2 – nrs·(r-s) – rs; (nrs)·(nrs+2s) = (nrs)2 – nrs·(2s). Si ha quindi -nrs·(r-s) – rs < nrs·(2s), in quanto –rs < nrs·(r+s). Si ha quindi -nrs·(r-s) – rs < nrs·(2s), in quanto –rs < nrs·(r+s). Per quanto riguarda ciò che succede a destra, si ha stesse ragioni si ha M nrs + r R nrs + 2r e 1 = , quindi per le = R1 nrs R2 nrs − s M R1 < R1 R2 In modo analogo (dice l’autore) si prova che L1 L2 R R < < ... e 1 < 2 < ... . L2 L3 R2 R3 Diventa allora chiaro che con Ln e Rn presenti nel Lemma 4 si indicano un termine a sinistra e a destra di M ma non il generico, come talvolta si usa considerando n nome di una variabile sui numeri naturali, bensì nt nr + n ns − n nt nr − n ns + n r r Ln = s ; Rn = s ns − n nr − n . Per l’induzione sottaciuta nel Lemma precedente, si tratta di termini minori di M. Una volta eseguita la divisione si ha (nr + n ) ⋅ (nr + n − 1) ⋅ ... ⋅ (nr + 1) ⋅ nr ⋅ s n (ns + n ) ⋅ ... ⋅ ns ⋅ r n M M = ; = Ln (ns − n + 1) ⋅ (ns − n + 2) ⋅ ... ⋅ (ns + −n + (n − 1)) ⋅ ns ⋅ r n Rn (nr − n + 1) ⋅ ... ⋅ nr ⋅ s n . In ciascuna delle due frazioni, a numeratore e a denominatore compare il prodotto di n termini, prima della potenza di r o di s, per cui si può distribuire la base della potenza su tutti, osservando che l’ultimo, in ogni caso è il prodotto nrs e che può essere semplificato. Si ottiene così (nrs + ns ) ⋅ (nrs + ns − s ) ⋅ ... ⋅ (nrs + s ) ; M = Ln (nrs − nr + r ) ⋅ (nrs − nr + 2r ) ⋅ ... ⋅ (nrs + r ) (nrs + nr ) ⋅ (nrs + nr − r ) ⋅ ... ⋅ (nrs + r ) M = Rn (nrs − ns + s ) ⋅ (nrs − ns + 2 s ) ⋅ ... ⋅ (nrs + s ) A questo punto Bernoulli scrive quanto segue: «Ma tali rapporti assumono un valore infinitamente grande quando n diventa infinitamente grande. Allora, infatti, spariscono i numeri 1, 2, 3, … rispetto a n e i fattori nr(+/–)n(–/+)1,2,3,… hanno gli stessi valori come nr(+/–)n e i fattori ns(–/+)n(+/–)1,2,3,… hanno gli stessi valori come ns(–/+)n, così che, dividendo numeratore e denominatore per n si ottiene» M (rs + s ) ⋅ (rs + s ) ⋅ ... ⋅ (rs + s ) ⋅ rs M (rs + r ) ⋅ (rs + r ) ⋅ ... ⋅ (rs + r ) ⋅ rs = ; = Ln (rs − r ) ⋅ (rs − r ) ⋅ ...(rs − r ) ⋅ rs Rn (rs − s ) ⋅ (rs − s ) ⋅ ...(rs − s ) ⋅ rs In questo passaggio, non completamente corretto soprattutto nei penultimi termini, è evidente l’utilizzazione del limite per n che tende all’infinito, usato solo a destra dell’uguaglianza. E, ricordando, ancora una volta che il concetto di limite doveva ancora aspettare perché venisse messo in luce e sfruttato adeguatamente, non possiamo che restare ammirati dell’anticipazione che Bernoulli presenta, sia per il limite sia nella trattazione dell’infinito. La citazione poco sopra mostra evidente 74 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità che egli si è avvalso di un ragionamento basato sulla approssimazione. A questo punto il ragionamento prosegue osservando che i rapporti di M con Ln e Rn sono ottenuti come prodotti di n fattori che sono, ciascuno, maggiori o uguali a 1 e di qui conclude che dato che n è arbitrariamente grande, tale prodotto può diventare arbitrariamente grande. Anche in questo caso c’è è presente la nozione di limite infinito all’infinito usata in atto nella forma: per ogni numero positivo K esiste un m tale che f(m) > K. In esso si avverte anche la presenza del Principio di Archimede usato con i numeri razionali. Il Lemma 5 utilizza nella dimostrazione una proprietà delle proporzioni, relativa allo scambio dei medi, ma in presenza non di una proporzione (cioè uguaglianza di due rapporti), ma in caso di diseguaglianza. La cosa è semplice. Siano a,b,c, e d quattro numeri tali che bc ed anche ad < cb; questa relazione si può scrivere come a c < , in tal caso si ha ad < b d a b < . Utilizza poi, un’altra proprietà c d delle proporzioni (il ‘comporre’) ma in contesto di disuguaglianza. Partendo sempre da aggiungendo anche che va che a c < , ed b d c e a e quindi, per proprietà transitiva, < da ad < bc e af < be, si pro< d f b f a a+c+e , dato che a(b+d+f) = ab + ad + af < ba + bc + be = b(a+c+e). < b b+d + f In virtù della seconda pate del Lemma 3 e di quanto appena osservato si ha: M L L L M R R R < 1 < 2 < 3 < .... e < 1 < 2 < 3 < .... Ln Ln +1 Ln + 2 Ln + 3 Rn Rn +1 Rn + 2 Rn + 3 A questo punto, applicando il Lemma 4, Bernoulli può affermare: «Per il lemma 4 per un valore di n infinitamente grande il valore di M/Ln diventa infinitamente grande e di conseguenza i rapporti L1/Ln+1, L2/Ln+2, L3/Ln+3… hanno valori tanto infinitamente più grandi. Ne consegue che:» E scrive una cosa che oggi si indica come L1 + L2 + ... + Ln = ∞ . Ciò è conseguenza del fatto che Ln +1 + Ln + 2 + L2 n M L < 1 e che poi tutti i vari rapporti risultano crescenti, così si può concludere, per il ‘comporLn Ln +1 re’ e la proprietà transitiva dell’ordine che M L1 + L2 + ... + Ln < Ln Ln +1 + Ln + 2 + ... + L2 n . Il passaggio all’infinito è quindi giustificato, ma il brano citato prima contiene un primo accenno di confronto tra infiniti. Il solo fatto di supporre che ci siano infiniti più o meno grandi, è un’anticipazione sorprendente, visto che la concezione dell’infinito in potenza ha come conseguenza l’idea che tutti gli infiniti siano uguali. 75 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità I Lemmi 4 e 5 sono così ‘delicati’ per la presenza dell’infinito che Bernoulli si appresta a giustificare il suo operato con la seguente «Osservazione. Chi non si fosse familiarizzato con il trattamento dell’infinito potrebbe formulare la seguente obiezione ai lemmi 4 e 5. Anche nel caso di un valore infinito del numero n i fattori delle espressioni, che rappresentano i rapporti M/Ln e M/Rn, precisamente nr (+/–) n (–/+) 1,2,3,… e ns (–/+) n (+/–) 1,2,3,… hanno lo stesso valore di nr (+/–) n e ns (–/+) n perché i numeri 1,2,3,…spariscono nei singoli fattori rispetto alla parte rimanente. Pertanto tutti questi numeri moltiplicati tra loro producono come risultato (anche a causa del numero infinito di fattori) un numero infinitamente grande. Quindi dalla potenza infinitamente elevata delle frazioni (rs+s)/(rs–r) e (rs+r)/(rs–s) viene sottratto infinitamente molto, con il risultato che si potrebbe ottenere un numero finito. A queste elucubrazioni non posso contrapporre niente di meglio che eseguire ora effettivamente il calcolo per un valore finito di n. Dimostrerò che anche in una potenza finita del binomio la somma dei termini compresi tra Ln e Rn (inclusi) conserva rispetto alla somma di tutti i termini rimanenti un rapporto, che supera ogni valore c comunque grande sia prefissato. Dimostrato questo, l’obiezione dovrà necessariamente decadere.» Nell’obiezione, che probabilmente si è fatto per primo lui, c’è un primo esempio di forma indeterminata. Da questa osservazione si coglie quale è il vero ostacolo per la costruzione di una teoria della probabilità che si estenda al di là delle situazioni ‘artificiali’ e semplici date dai giochi: l’uso appropriato dell’infinito. Bernoulli dimostra di avere, tramite l’approssimazione, una concezione dell’infinito e per l’affermazione “non posso contrapporre niente di meglio che eseguire ora effettivamente il calcolo per un valore finito di n”, come a dire, comunque si consideri n posso fare vedere quanto affermo, ci fa presumere che si tratti di una concezione potenziale. In modo subdolo aggiunge che ci potrebbe essere un valore infinito di n, spostando quindi l’attenzione ad un infinito in atto. Bernoulli introduce una novità, o meglio introduce di nuovo un personaggio scomodo, l’infinito, che nell’antichità era già stato causa di paradossi e crisi, ma si rende conto che non si può evitare. La trattazione dell’infinito è stata, fino a lui, quasi sempre di tipo filosofico; nella Ars conjectandi diventa concetto matematico imprescindibile. Dopo l’esempio complesso e trattato lungamente, giunge finalmente il risultato che era stato preannunciato nel Capitolo IV. «Teorema. Il numero dei casi favorevoli rispetto al numero di casi sfavorevoli sia esattamente o approssimativamente come r/s, quindi rispetto al numero di tutti i casi come r/(r+s) =r/t, dove t = r+s, essendo tale rapporto compreso tra i limiti (r+1)/t e (r–1)/t. Dimostriamo che si possono fare osservazioni in numero tale che diventa più probabile quanto si vuole, diciamo c volte, che il rapporto tra le osservazioni favorevoli e tutte le osservazioni disponibili stia all’interno di tali limiti piuttosto che all’esterno, cioè non risulti né maggiore di (r+1)/t né minore di (r–1)/t. Dimostrazione. Si ponga uguale a nt il numero delle osservazioni programmate e ci si chieda quanto grande sia la speranza che siano favorevoli rispettivamente tutte le osservazioni, tutte le osservazioni meno una, meno due, meno tre, meno quattro ecc. Poiché per ipotesi in ogni osservazione sono possibili t casi, di cui r favorevoli e s sfavorevoli, e ogni caso della prima osservazione si può combinare con ogni caso della seconda e di nuovo i casi combinati si possono associare con ogni caso della terza, quarta… osservazione, è evidente che deve essere applicata la regola che segue all’osservazione all’esercizio XII della prima parte e il suo secondo comma. In questo modo si trova che la speranza di nessuna osservazione sfavorevole è pari a r nt , di un’osservazione sfavorevole nt s ⋅ r nt −1 , di due ost nt servazioni sfavorevoli nt s 2 ⋅ r nt − 2 , di tre osservazioni sfavorevoli 2 t nt 1 t nt nt s 3 ⋅ r nt − 3 , ecc. Tralasciando il denomina 3 t nt tore comune tnt, il grado di probabilità o il numero di casi in cui si può verificare che tutte le osservazioni, tutte meno una, tutte meno due, tutte meno tre… siano favorevoli è rispettivamente 76 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 nt r nt , s ⋅ r nt −1 , 1 Capitolo 2. La nascita della probabilità nt 2 nt − 2 s ⋅ r , 2 nt 3 nt −3 s ⋅ r , ... 3 Queste espressioni sono i termini nella nt-esima potenza del binomio r+s, già trattato nei lemmi precedenti, e quindi quel che ne consegue è chiaro. Per il modo di formazione di questa serie è evidente che il numero di casi in cui nr osservazioni sono favorevoli e le restanti ns sfavorevoli è esattamente uguale al massimo M (lemma 3), dove ns termini lo precedono e nr lo seguono. È altrettanto evidente che il numero di casi in cui di tutte le nt osservazioni nr+n, rispettivamente nr–n, sono favorevoli e le restanti sfavorevoli, sono dati dai termini Ln e Rn rispettivamente, in quanto distano dal termine massimo M di n termini da entrambi i lati. Di conseguenza il numero di tutti i casi in cui tra tutte le nt osservazioni sono presenti non più di nr+n e non meno di nr–n osservazioni favorevoli è pari alla somma di tutti i termini dello sviluppo di (r+s)nt, che stanno tra Ln e Rn (limiti inclusi). Il numero di tutti i casi rimanenti, in cui sono presenti più di nr+n o meno di nr–n osservazioni favorevoli, è pari alla somma dei termini rimanenti dello sviluppo della potenza, che stanno fuori dall’intervallo compreso tra Ln e Rn. Poiché [l’esponente del]la potenza può essere scelto così grande che la somma dei termini compresi tra Ln e Rn (limiti inclusi) risulti superiore di c volte alla somma dei termini che stanno fuori dai suddetti limiti, segue il principio: Si possono effettuare tante osservazioni che il numero di casi in cui il rapporto tra casi favorevoli e casi totali non superi i valori limite d i nr + n = r + 1 e nr − n = r − 1 sia di c volte maggiore della somma dei casi rimanenti, nt t nt t cioè sia c volte più probabile che il rapporto tra casi favorevoli e casi totali non superi i limiti r + 1 e r − 1 , piutt tosto che li superi. C.V.D. » t Si è riportato per intero il teorema e la sua dimostrazione, per fare sentire al lettore la ‘vicinanza’ di questa deduzione di fine XVII secolo con quanto si trova sui libri oggi. Grazie all’articolazione in lemmi, ciascuno dei quali abbastanza semplice e di natura quasi esclusivamente aritmeticoanalitica, si giunge con poco sforzo al risultato cercato. Il teorema oggi viene chiamato anche col nome di legge (debole) dei grandi numeri, o anche teorema della buona approssimazione. Nella dimostrazione si richiama un risultato che Bernoulli ha provato nella prima parte a commento/integrazione dell’opera di Huygens. In esso afferma: «Si formi il prodotto dei numeri dei casi in cui lo scopo da raggiungere è raggiunto nei prescritti lanci e dei casi in cui non viene raggiunto perché non può essere raggiunto, e lo si divida per il numero di tutti i casi nei lanci complessivi: il quoziente è il valore della speranza cercata» In questo esercizio che generalizza la proposta di Huygens di considerare la media delle vincite come speranza, il nostro autore fa intravedere il concetto di spazio di probabilità prodotto. Si lascia al lettore il compito di trovare su diversi libri attuali del calcolo delle probabilità, il teorema di Bernoulli e di controllare gli strumenti colà usati per la dimostrazione. Per convincere il lettore della bontà della sua ricerca, nella parte finale del capitolo, il matematico di Basilea mostra alcuni esempi numerici, a partire dal “rapporto vero” r/s = 3/2. Considera un’urna con 30 sassolini bianchi e 20 neri, in questo caso t = 50, oppure 300 bianchi e 200 neri, ed in tale caso t = 500. I due ‘limiti’, intesi come estremi dell’intervallo di confidenza, sono 29/50 e 31/50. Sia c = 1.000, vale a dire si voglia che sia 1.000 volte più probabile che il rapporto tra le osservazioni favorevoli e tutte le osservazioni disponibili stia all’interno di tali limiti piuttosto che all’esterno. In questo caso dimostra che sono necessarie 25.50 osservazioni. Se si chiedesse c = 10.000, ci vorrebbero 31.258 osservazioni, mentre per c = 100.000 ne sarebbero necessarie 36.966, 77 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità concludendo che per migliorare di un fattore 10 la probabilità di restare nell’intervallo bisogna aumentare di 5.708 il numero delle osservazioni. In queste considerazioni si scorge una forma di autocompiacimento per l’abilità mostrata nel calcolo. Infatti, sarebbe stato possibile dare solo la conclusione per fare comprendere la potenza del teorema e delle sue conseguenze. I secoli XVII e XVIII sono stati secoli di studiosi ‘calcolatori’, attratti dalla potenza ed utilità del nuovo strumento predisposto, il logaritmo. In queste epoche si compilano tavole per diversi tipi di logaritmi (decimali o naturali) e tavole con sempre maggiore numero di cifre decimali. Ci sono dispute tra studiosi sulla correttezza delle cifre trovate. L’archetipo, costruitosi in tale periodo, del matematico come ‘calcolatore’ è rimasto nell’immaginario comune. Si pensi alle pubblicità dei primi computer che venivano presentati al pubblico come strumenti in grado di eseguire milioni di calcoli al minuto, mentre oggi la pubblicità degli attuali strumenti verte più sulle applicazioni multimediali che permettono. Così la diffusione dell’idea di poter demandare in toto il calcolo allo strumento automatico e l’archetipo dello studioso ‘calcolatore’ hanno contribuito a fare nascere una minore stima nella professione del matematico. Tornando a Bernoulli, bisogna osservare che il risultato anticipato alla fine del Capitolo IV e il teorema non coincidono, in quanto nella prima stesura s voleva provare che “dopo osservazioni ripetute un gran numero di volte, il rapporto trovato giaccia all’interno di questi limiti, posti intorno a 3/2, piuttosto che all’esterno”. Poi il teorema e l’esempio no considerano più il rapporto tra casi favorevoli e sfavorevo- li, ma si confrontano con la nozione che oggi chiamiamo probabilità classica. La conclusione di Bernoulli è, però, una specie di ritorno alla situazione che lo precedeva, quasi che temesse adottare il suo punto di vista innovativo nel campo della scienza: «Se si osservassero per tutta l’eternità tutti gli eventi – nel qual caso la probabilità dovrebbe trasformarsi in certezza completa – si troverebbe che tutto nel mondo avviene su determinate basi e secondo una determinata conformità a leggi, tanto da essere costretti ad assumere una certa necessità, o per così dire, un fato anche per cose che avvengono apparentemente in modo casuale. » L’affermazione sembra riflettere un pensiero di rinuncia al valore conoscitivo “vero” che la probabilità a posteriori potrebbe dare. La critica successiva ha messo n luce i ‘debiti’ di Bernoulli con Leibniz, ad esempio nell’idea che la probabilità sia un grado di certezza, che era stata presentata dal Tedesco in De æstimatione. Un altro ‘debito’ consisterebbe nei metodi puri e misti e nel concetto di certezza morale. Un diverso tipo di analisi riguarda il risultato del teorema finale. Sicuramente per gli strumenti che Bernoulli aveva a disposizione, il risultato trovato mostra il nostro come un grandissimo, fondamentale ricercatore. Sicuramente gli mancano concetti che poi diverranno irrinunciabili come quelli di variabile aleatoria e di stimatore, che chiariranno in pieno, migliorandone la potenza e la portata del suo teorema e delle ulteriori sue generalizzazioni. Ma è proprio grazie all’utilizzazione della ‘dop- 78 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità pia’ probabilità che il concetto di variabile aleatoria e di statistica avranno illoro fondamento. C’è da chiarire la differenza tra credibilità e probabilità. Un diverso tipo di analisi riguarda il risultato del teorema finale. Sicuramente per gli strumenti che Bernoulli aveva a disposizione, il risultato trovato mostra il nostro autore come un grandissimo, fondamentale ricercatore. Sicuramente gli mancano concetti che poi diverranno fondamentali come quello di variabile aleatoria e di stimatore, che chiariranno in pieno migliorandone la potenza e la portata del suo teorema e delle sue generalizzazioni, ma è proprio grazie alla utilizzazione della ‘doppia’ probabilità che il concetto di variabile aleatoria e di statistica avranno il loro fondamento. C’è anche da chiarire la differenza tra credibilità e probabilità. Per fare questo, oggi, possiamo considerare, in modo un po’ grossolano, la frequenza relativa f (n ) n che per semplicità di scrittura scriviamo ora come sn, come una variabile aleatoria ed anche l’intervallo che ad essa è associato F(sn) come una variabile aleatoria che però assume come valori intervalli (intorni della probabilità p) oppure coppie ordinate di numeri reali che ne sono gli estremi. Allora l’affermazione di Bernoulli può essere letta come il fatto che all’aumentare delle prove, Credibilità(p appartenga a F(sn) | sn) > 1 – δ, facendo intervenire il condizionamento sulla base dell’osservazione concreta. Se si accetta che il grado di credenza o credibilità, sia espressa dalla probabilità, si può interpretare la quanto affermato dallo Svizzero, come il fatto che P(p appartenga a F(sn) | sn) > 1 – δ. Ma ciò non è quanto lui dimostra , il suo risultato si può parafrasare come l’affermazione che all’aumentare di n, si abbia P(p∈[sn-ε,sn+ε] | p) > 1 – δ. Certamente la mancanza del concetto di probabilità condizionata non gli ha dato la possibilità di approfondire l’argomento. Nell’ultima disuguaglianza scritta è presente, nel condizionamento la probabilità a priori. Per staccarsi completamente da essa avrebbe dovuto provare che all’aumentare di n, si ha P(p∈[sn-ε,sn+ε] | sn) > 1 – δ. Questo sarà possibile solo circa cinquanta anni dopo, nel 1764, con la pubblicazione (postuma) delle ricerche di Bayes . 79 Thomas Bayes 1702 - 1761 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 2. La nascita della probabilità 80