C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo CAPITOLO 4. PROBABILITÀ NEL XIX SECOLO. 4.1 Laplace. Ancora una volta, l’indicazione cronologica è (parzialmente) sbagliata. Infatti Laplace, nato nel 1749 è una figura di ‘passaggio’ tra il cosiddetto Secolo dei Lumi e il XIX secolo. La sua formazione si è svolta ampiamente nel XVIII secolo, essendosi formato sotto l’impulso e con l’aiuto di D’Alembert ed in tal modo imbevutosi dello spirito della Encyclopédie. Jean-Baptiste Le Rond detto D’Alembert 1717 - 1783 4.1.1. Anticipatori di Laplace. Laplace raccoglie l’eredità di vari studiosi del secolo in cui è nato, ed in vari campi, perché come illuminista, ha svolto attività nell’ambito della Matematica, ma anche della Fisica, della Chimica e della Astronomia. Lo si trova infatti citato come astronomo, per lo studio delle perturbazioni dei moti dei pianeti, come fisico per lo studio della capillarità e dell’elettromagnetismo e la termodinamica. È sicuramente noto ai matematici per lo studio delle equazioni differenziali alle derivate parziali che descrivono quello che poi i fisici chiameranno campi centrali. Il suo più importante contributo alla filosofia è la Esposizione del sistema del mondo, una sorta di storia ideale dell’astronomia in cui riprende e precisa un’ipotesi cosmogonica di Kant, e per questo si parla di Teoria di KantLaplace. Essa postula che a partire da una nebulosa primordiale, sia avvenuta la formazione del sistema solare per una condensazione che ha portato alla separazione delle masse a causa della velocità di rotazione. Immanuel Kant 1724 - 1804 Per quanto riguarda la probabilità, Laplace era assai bene informato dell’opera di Condorcet, di qualche anno più vecchio di lui. Il Marchese di Condorcet ha dato contributi alla Analisi matematica, in particolare sul calcolo integrale; è anche autore (o ispiratore) di alcune voci della Jean-Antoine-Nicolas Caritat De Condorcet 1743 - 1794 Encyclopédie di contenuto matematico. L’aspetto che qui interessa è stato il suo tentativo di applicare la matematica alle scienze sociali e morali. Il suo testo più importante nell’ambito della probabilità è lo Es- sai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, del 1785. Si tratta di un testo di 304 pagine, con una premessa di altre 191 pagine in cui cerca di rendere intelligibili i risultati matematici che gli servono nello Essai, ad un pubblico di non cultori di matematica. Come si vede il problema della comunicazione matematica era vivo ed attivo anche sul finire del XVIII secolo. L’introduzione, o discorso preliminare, inizia con queste parole: «Un grande uomo [Anne-Robert-Jacques Turgot, Barone di Aulnes, 1727 - 1783] delle cui lezioni, esempi e so115 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo prattutto amicizia rimpiangerò sempre la perdita, era persuaso che le verità delle Scienze morali e politiche, siano suscettibili della stessa certezza di quelle che formano il sistema delle Scienze fisiche, ed anche delle branche di quelle scienze che, come l’Astronomia, paiano avvicinarsi alla certezza matematica. Questa opinione gli era cara perché conduce alla speranza consolante che la specie umana farà necessariamente dei progressi verso la felicità e la perfezione, così come li fa nella conoscenza della verità.» In questo brano appare chiaro il legame tra le speranze dell’illuminismo e del successivo positivismo, ma l’attenzione va posta soprattutto sulla dicotomia ‘certezza morale’ e ‘certezza matematica’. Pare chiaro che la prima abbia un grado di complessità e pregio minore della seconda. Infatti nell’idea allora dominante, la matematica grazie al suo impianto rigoroso e deduttivo dava maggiore certezza di quanto non fosse possibile con la Fisica (intesa in senso lato come scienza della Natura) in cui (allora) lo strumento gnoseologico principale era (è?) l’esperimento che corrobori o falsifichi la teoria. In questa prima opera, l’autore si occupa spesso di problemi legati alla votazioni di un’assemblea (e formula anche quello che è noto col nome di Paradosso di Condorcet). Gli strumenti utilizzati sono quelli del calcolo differenziale, ma il testo è oscuro e talvolta anche scorretto, spesso a parole fa delle affermazioni e che traduce in formule che non rispettano quanto scritto. Qualche commentatore ha definito l’opera come una raccolta degli obbrobri che un uso scorretto della matematica è in grado di produrre. E ciò nonostante la sua opera ebbe successo e fu acclamata dai suoi contemporanei 4.1.2. Cenni biografici su Laplace. In nostro autore nasce in una famiglia di agricoltori. Fa gli studi superiori a Caen ed è in questa fase che si sviluppa in lui l’interesse per la scienza. A 22 anni, nel 1771 si trasferisce a Parigi ed porta con sé raccomandazioni per D’Alembert, che non gli risponde. Allora Laplace manda un lavoro matematico e l’impressione che suscita l’abilità mostrata nel testo, convince l’Enciclopedista ad accordargli la sua protezione. Nel 1772 pubblica già sulle Memorie dell’Accademia alcuni risultati sulle serie. L’anno successivo diviene membro dell’Accademia ed inizia a collaborare con altri scienziati a lavori di Chimica e di Fisica. Viene nominato esaminatore del corpo degli artiglieri e così si trova ad esaminare Napoleone (1784). Da questi dati si vede che ha buoni rapporti con gli ambienti della cultura e della corte. Allo scoppio della Rivoluzione, diviene fervente rivoluzionario, conservando il posto all’Accademia. È tra i membri della commissione dei pesi e misure e come tale collabora alla definizione del metro. Diviene Vicepresidente dell’Accademia. Napoleone gli dà incarichi di prestigio, anzi lo nomina ministro degli interni, ma se ne pente subito dopo togliendogli l’incarico. Diventa membro influente del Senato, nel ruolo di cancelliere. Pubblica nel 1803 la sua opera di Meccanica celeste, con una dedica allo “eroe pacificatore dell’Europa”. Propone (ed ottiene) di abolire il calendario rivoluzionario. Nel 1806 le sue aspirazioni sociali sono soddisfate, in quanto Bonaparte lo nomina Conte. Appena cambia il ‘vento’ e nonostante le manifestazioni di stima di Napoleone, è tra i primi a firmare l’atto di destituzione 116 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo dell’imperatore ed è uno dei primi a sottoscrivere l’atto di sottomissione a Luigi XVIII. Conserva così, anzi accresce le sue cariche ufficiali e nel 1817 il Re lo proclama Marchese. All’inizio dell’anno 1827 ha una disputa con i colleghi dell’Accademia e dopo breve malattia muore. 4.1.3. La matematica secondo Laplace. Come si comprende dalla sua breve biografia, la formazione e anche la prima produzione è ampiamente influenzata dalla spirito del Secolo dei Lumi, ma piano piano, come frutto della sua ampia attività, viene a precisarsi in lui un punto di vista sulla natura e il ruolo della matematica che lo distanzia dai suoi contemporanei. Nella frase di Condorcet citata sopra, si presenta l’idea diffusa al suo tempo: « le verità delle Scienze morali e politiche, siano suscettibili della stessa certezza di quelle che formano il sistema delle Scienze fisiche, ed anche delle branche di quelle scienze che, come l’Astronomia, paiano avvicinarsi alla certezza matematica. » Da questa frase e dalla introduzione della “certezza morale” di Bernoulli, cogliamo quale fosse la situazione in quegli anni e dobbiamo anche osservare che, nonostante Galilei, Cartesio e Newton, la Fisica e l’Astronomia erano ritenute, al pari della Politica, dell’Economia e della Probabilità studi in cui si poteva raggiungere solo la certezza morale, perché soggetti alla verifica sperimentale. Si comprende così perché l’opera di Buffon in cui si presenta il problema dell’ago prenda il nome di Aritmetica morale. L’Astronomia, dice Condorcet, aveva uno sviluppo più avanzato (dopo che Newton aveva giustificato sulla base della gravitazione universale le leggi planetarie) perché più ‘intriso’ di matematica. Ma questa posizione ben presto non si trova in accordo con quanto Laplace va sviluppando 1. Egli si rende conto che l’ideale cartesiano, di una Matematica vista come ‘vera’ scienza e basata sulla certezza delle idee chiare e distinte, si trova ad ostacolare lo sviluppo del calcolo infinitesimale in cui al posto della certezza c’è il trattamento approssimato di oggetti che sfuggono and una precisa descrizione George Berkeley 1685 - 1753 (come ha messo in luce Berkeley). Ed infatti quello che sembrava essere il baluardo della scientificità della Matematica, il rigore, come chiarezza dei dati con cui si lavora e delimitazione precisa del problema e dei metodi con cui affrontarlo, è sempre più abbandonato a favore di un’intuizione, anche scorretta. L’analisi infinitesimale usa infatti come strumenti essenziali concetti ‘vietati’, o forse meglio dire ‘rimossi’: si pensi che Anassagora propone in Sulla Natura «Rispetto al piccolo non c'è un minimo, ma c'è sempre un più piccolo perché l'esistente non può essere annullato [per divisione]. Così, rispetto al grande c'è sempre un più grande e il più grande è eguale al piccolo come pluralità, e in se stessa ogni cosa pensata come somma d'infinite parti è insieme grande e piccola» 1 Traggo queste ed altre informazioni di questa parte del Capitolo dal primo volume delle Opere di Laplace, Torino: Utet, 1967, a cura di Orietta Pesenti Cambursano. 117 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo I concetti ‘vietati’ sono infatti quelli di infinito e di infinitesimo e quindi bisogna accettare la divisibilità infinita che permette di giungere all’infinitesimo e poi la somma di infiniti infinitesimi (integrale, serie) che ha un comportamento bizzarro: talvolta con essa si ottiene un numero, talaltra una quantità più grande di qualunque Anassagora 496 – 428 a.C. quantità si scelga, altre volte ancora non fornisce nulla di comprensibile. I motivi, quindi, per accettare queste violazioni dell’ideale cartesiano devono essere cercate al di fuori della matematica, quindi il rapporto favorevole alla nostra scienza rispetto a quelle “morali”, si rovescia perché inizia ad infiltrarsi anche nella disciplina più rigorosa, la ‘impurità’ dell’esperienza che così perde contemporaneamente rigore ed autonomia. Laplace arriva a considerare la nostra disciplina solo come strumento delle altre scienze che, a loro volta, prive come sono di autonomia, sono interpreti di una realtà data. In base alla oggettività della natura, il nostro dichiara di voler bandire l’empirismo dalla teoria, non rinunciando però alla corroborazione per il confronto tra l’osservazione ed i risultati offerti dall’analisi matematica. Non si cerca più il rigore, ma la capacità di ricostruire la realtà attraverso il modello matematico. In questo modo la pretesa delle scienze naturali di essere indipendenti dalla matematica per basarsi solamente sul dato empirico diventa insostenibile in quanto la nostra scienza è in grado di offrire ‘microscopi’ migliori per spiegare lo svolgersi dei fenomeni. Da questa posizione trae spunto Laplace per dirigere la sua ricerca verso quegli aspetti della matematica che risultano essere più facilmente applicate allo studio della natura, ad esempio alla teoria delle serie, che «… è uno degli oggetti più importanti dell’analisi: tutti i problemi si riducono ad approssimazioni e di conseguenza quasi tutte le applicazione della matematica alla natura, dipendono da questa teoria» Da questa posizione si comprende come il nostro veda con sospetto tutte le costruzioni teoriche che altri suoi contemporanei tentano, per chiarire meglio le ipotesi su cui si basa la Matematica (in particolare, ai suoi giorni, l’Analisi e la Geometria). Bolla queste ricerche col termine di ‘curiose’ ritenendole un puro gioco intellettuale, che tuttavia accetta con la speranza che si renda utili nel seguito. Per quanto riguarda la questione del rigore, Laplace non crede più che esso consista nella precisa delimitazione del problema da trattare, dato che anche gli argomenti che mostrano di avere maggiore successo ne sono privi, bensì lo colloca nella perfetta comprensione del fenomeno, quindi nel collegamento di esso fenomeno con altri che siano legati ad esso da relazioni di causalità: «Newton, alla fine dell’ultimo secolo, pubblicò la scoperta della gravitazione terrestre. Da allora, i geometri sono riusciti a ricondurre a questa grande legge della natura tutti i fenomeni conosciuti del sistema del mondo, e a dare così alle teorie ed alle tavole astronomiche una precisione insperata… la legge della gravitazione inversamente proporzionale al quadrato delle distanze rappresenta con un’estrema precisione tutte le ineguaglianze osservate nei movimenti celesti: quest’accordo unito alla semplicità della legge, ci autorizza a pensare che essa sia rigorosamente quella della natura» In questo brano sono presenti due categorie che applicate alla Matematica, con Laplace acquistano un nuovo significato: semplicità e generalità. La semplicità significa la possibilità di capire la natura: 118 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo «Soprattutto nelle applicazioni dell’analisi al sistema del mondo si manifesta la potenza di questo meraviglioso strumento, senza il quale sarebbe stato impossibile penetrare in un meccanismo così complicato nei suoi effetti quanto è semplice nelle sue cause» Ad esempio ritiene “semplici” i metodi di integrazione per approssimazione delle equazioni differenziali perché tramite essi (metodi) si può giungere ad una prima determinazione per approssimazione del movimento dei corpi celesti. Le equazioni che esprimono tali moti «si presentano sotto una forma così complicata da non lasciare alcuna speranza di riuscire ad integrarle rigorosamente». La semplicità, per Laplace, non è una forma di riduzionismo, perché con essa non vuole contrastare la varietà infinita dei fenomeni, ma una forma di ‘soddisfazione personale’ dell’autore quando, come mostra nel Saggio filosofico delle probabilità (1814) riesce ad imbrigliare la varietà dei fenomeni in un sistema ‘semplice’ che permette di penetrare in detta varietà. Quindi la categoria della semplicità è per lui sempre in relazione ad una legge o ad un metodo matematico, in connessione con la natura. L’interdipendenza di empiria e matematica mette ora in discussione l’altra categoria, la generalità. Lui interpreta il termine come generalizzazione, e come tale, la forma di astrazione che prescinde dalla concretezza (accidenti) del problema. Ed infatti per lui il termine diviene qualcosa di analogo a ‘sistemazione’ ed ‘elaborazione’. Ad essa dedica molta cura, principalmente in tutte le sue opere maggiori. Si scopre questo nel so costante atteggiamento di trovare nessi di derivazione tra teorie, con lo scopo di costruire, possibilmente, un’unica teoria da cui le altre possano derivare. Il risultato sarà così una teoria ‘semplice’ nel suo senso ed anche ‘comoda’ perché abbracciando più casi rende inutile la considerazione dei particolari. Con essa è possibile trattare in modo uniforme e sotto uno stesso punto di vista, problemi diversi e metodi diversi per risolversi. La generalizzazione non serve, quindi, soltanto a comprendere la realtà adattandola e spiegandola mediante schemi logici, ma offrendo anche strumenti per la scoperta. E in lui, per la prima volta, questo modo di intendere la scienza prende il nome di “leggi matematiche”, in grado di cogliere apporti ed analogie tra fenomeni diversi, racchiuse in uno stesso concetto. Scrive infatti: «Il mio primo scopo, in questo Libro, è dimostrare nella sola legge di gravitazione universale la sorgente di tutte le ineguaglianze del movimento lunare e di servirmi poi di questa legge come strumento di scoperta per perfezionare la teoria di questo movimento» Quindi attraverso la generalizzazione si ha la possibilità di passare dall’astrazione del simbolismo matematico al mondo dei fenomeni, perché, a suo dire, con essi è in grado sia di spiegarli che di prevederli. Salda in tal modo la possibile frattura tra astrazione ed empiria. 4.1.4. Laplace e la probabilità. Le opere di coloro che hanno preceduto il Nostro nel campo della probabilità, avevano suscitato interesse, avevano mostrato come era possibile utilizzare strumenti matematici di vario genere per analizzare i fenomeni aleatori, avevo trovato applicazioni anche a 119 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo campi non esclusivamente matematici. Tuttavia l’immagine generale della probabilità, anche per la varietà di tecniche e di problemi, lo rendeva difficilmente classificabile come una scienza, perché restavano (e restano) sullo sfondo una serie di problemi poco chiariti per cui veniva a mancare la chiarezza matematica che una scienza doveva avere. E di fatto l’accenno e alla certezza morale e l’utilizzazione in campi in cui tale tipo di certezza è l’unica possibile. Ma la certezza morale, per come conclude Bernoulli, trova la propria garanzia della onniscienza e bontà divina. Così si era diffusa l’idea che la probabilità fosse legata alla incompletezza della conoscenza umana, di un fatto che in sé era assolutamente certo (dal punto di vista dell’essere superiore). Si ha così una sorta di reviviscenza della aristotelica teoria delle due leggi. Da tutto ciò discendeva un impiego limitato della probabilità come strumento e, per lo più, i risultati ottenuti erano visti come esempi di abili argomentazioni per divertire lo spirito in vena di provare la propria abilità ad escogitare situazioni strane o divertenti (i giochi di vario genere). Tutt’al più il calcolo delle probabilità aveva il compito di persuadere con una certa autorevolezza, perché non influenzato da pregiudizi, passioni o debolezze che possono inficiare un giudizio. Il risultato è uno strumento che serva per congetturare, e così eventualmente una indicazione su come agire, ma la congettura è diversa dalla conoscenza, come ha ben stabilito Bernoulli. Nelle prime opere sulla probabilità, a partire da un saggio del 1774, Laplace non sente necessità di un impianto teorico completo dell’argomento, perché il calcolo delle probabilità, nonostante gli avanzamenti avuti, si presentata come metodi di soluzione ad hoc di problemi occasionali e non classificabili in partenza. Questa esigenza si palesa in seguito, nel 1812 con la Teoria analitica della probabilità e, ancora di più si presenta astratta e ‘filosofica’ nel Saggio, di due anni più tardo. Si tratta di due opere della maturità avanzata (Laplace aveva 63 e 65 anni), a compimento ideale della carriera del pensatore. La generalità e la semplicità degli strumenti predisposti dal nostro sarà il primo passo per dare ‘cittadinanza’ alla probabilità, tanto da farla divenire strumento per la fisica, come supporto per l’indagine scientifica quando manca una conoscenza certa, sostituita da una conoscenza probabile, anzi l’esplicita l’affermazione che ogni nostra conoscenza è solo probabile. Il quadro unitario teorico di riferimento che Laplace adopera è quello di un determinismo che non ha più bisogno dell’essere supremo. La definizione di Laplace prescinde dalla certezza, dato che quest’ultima non è che un particolare tipo di probabilità: «La probabilità dell’esistenza di un evento non è che il rapporto tra il numero dei casi favorevoli e il numero di tutti i casi possibili, quando non abbiamo motivo di pensare che si verifichi un caso piuttosto che un altro…Un evento si verifica sicuramente quando tutti i casi possibili gli sono favorevoli e la frazione che esprime la sua probabilità è allora l’unità.» Nella prima parte della citazione compare con evidenza il debito con Leibniz, a proposito di un’esistenza solo possibile e di una ‘indifferenza’ che ricorda i Principio di ragione sufficiente. Nella seconda parte della citazione c’è la subordinazione della certezza alla probabilità e questa, 120 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo nell’indagine tra casi favorevoli e casi possibili, quindi tutti casi noti e dati, trova la sua giustificazione senza fare ricorso alla certezza, risultando così strumento adeguato alla natura dell’uomo. Nel brano riportato si prescinde da una sicurezza (possibile o impossibile all’uomo) ma si ‘oggettivizza’ in modo definitivo la probabilità come un a priori da cui dipenda la certezza stessa. Laplace si è reso conto che il punto di partenza della conoscenza umana non può essere una conoscenza che trascenda l’uomo, ma che l’inquilino del Mondo debba articolare la sua esperienza a partire da solo ciò che gli è ‘raggiungibile’. In questa posizione c’è una reminiscenza kantiana di rinuncia a ciò che ci trascende. Leggendo in successione le varie memorie che hanno per argomento la probabilità, ci si accorge che il calcolo aleatorio viene sempre più spesso impiegato per risolvere problemi di fisica o di astronomia, quali maree, comete, movimenti della Luna, variazione della gravitazione terrestre, assumendo il ruolo di sostituto della matematica ‘pura’. Non trascura i problemi relativi ai giochi, ma essi assumono un ruolo esclusivamente esemplificativo. Il nostro autore, in particolare si pone il problema di determinare che tipo di media debba essere usata per interpretare più osservazioni di uno stesso fenomeno, in modo da ‘individuare’ o più correttamente, restringere al meglio il risultato che sia meno suscettibile di errore. Il calcolo delle probabilità gli offre la possibilità di fare ciò, divenendo tale tipo di calcolo più ‘generale’ e ‘semplice’ per trattare il dato empirico di quanto non fosse lo strumento astratto matematico, abbandonando, di fatto l’ideale purezza cartesiana. Accanto a questi lavori si presentano sempre più frequentemente gli studi sull’approssimazione. Nella ricerca più ‘interna’ del calcolo delle probabilità, l’attenzione di Laplace si sposta sempre di più verso gli eventi futuri e verso il ‘passato’, con gli studi della probabilità delle cause: «…i limiti delle probabilità dei risultati e delle cause, indicati dagli eventi considerati in gran numero, e le leggi secondo le quali questa probabilità s’avvicina a quei limiti, man mano che gli eventi si moltiplicano [sono in grado di mostrare] come la regolarità finisce per stabilirsi anche nelle cose che ci sembrano intieramente abbandonate al caso, e ci svela le cause nascoste, ma costanti da cui dipende tale regolarità. » In conclusione anche la probabilità permette di ottenere risultati ‘esatti’ e dal confronto con ‘esperienza tali risultati debbono ritenersi ‘assoluti’ con la ‘certezza’ conquistata di essere in grado di cogliere le strutture del reale. Attraverso essa è così possibile formulare ‘leggi’ e ‘previsioni’, per cui Laplace ritiene la probabilità come il mediatore privilegiato per applicare la matematica alla esperienza fenomenologica. 4.1.5. Il Saggio del 1774. Il venticinquenne Laplace, appena approdato a Parigi, dedica una memoria interamente alla probabilità dal titolo: Saggio sulla probabilità delle cause in base agli avvenimenti. Si è discusso nel paragrafo precedente di quale sia stato l’approccio alla probabilità del giovane Laplace, rispetto a quello più anziano delle opere del 1812 e 1814. Come dice il titolo è il primo lavoro a stampa che pone grande attenzione a quello che Bayes aveva ottenuto, quasi inciden- 121 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo talmente e senza dare grande rilievo alla cosa: la valutazione delle cause a partire dall’effetto. Nel testo del saggio non compare mai il nome di Bayes. I risultati di questa opera saranno ripresi più volte e confluiranno nella Teoria analitica, ed in quella occasione verrà chiaramente indicato il nome del reverendo inglese. Nel saggio si possono distinguere tre parti, le prime due connesse tra loro: probabilità e medie, la terza del tutto slegata (lo dice anche l’autore) che si occupa delle soluzioni singolari delle equazioni differenziali. Probabilmente il numero delle pagine di questa terza parte poteva non essere sufficiente per una pubblicazione autonoma, oppure l’autore ha voluto dare prova di tutto quanto sapeva o aveva elaborato in quel torno di tempo, anche perché c’era di mezzo una richiesta di raccomandazioLuigi Lagrangia 1736 - 1813 ne a Lagrange per ottenere un possibile salario aggiuntivo da parte dell’Accademia di Berlino ed è forse per questo che appena ha la possibilità di citare il matematico italiano lo appella come “illustre”. Il saggio si apre con le parole: «La teoria dei casi è tra le parti più curiose e più delicate dell’analisi, per mezzo della finezza delle combinazioni che esige e per la difficoltà di sottometterle al calcolo; Moivre credo sia lo scienziato che l’ha affrontata con maggiore successo in un’eccellente opera intitolata Theory of chances…» Da questa breve citazione si individuano alcun aspetti interessanti. Il primo è la necessità, almeno pare tale al giovane Laplace, di sottomettere il calcolo delle probabilità all’Analisi matematica, anzi nelle prime opere sembra dare per scontata questa subordinazione. La seconda ci chiarisce quale sia lo scopo: riprendere un risultato di De Moivre, quello che sarà il teorema del limite centrale. È strana la citazione sbagliata del titolo dell’opera di De Moivre, che fa venire il sospetto che la sua conoscenza non sia del testo originale, ma di qualche versione (ne ebbe molte). Dopo qualche pagina relativa al calcolo alle differenze finite, che afferma possa divenire un metodo generale per la probabilità, riprende l’argomento con queste parole: «L’incertezza delle conoscenze umane verte sugli avvenimenti o sulle cause di essi; se, per esempio, si sa che un’urna racchiude dei biglietti bianchi e neri in un rapporto dato, e si chiede la probabilità di estrarre, a caso, un biglietto bianco, l’avvenimento è incerto, ma non lo è la causa da cui dipende la probabilità della sua esistenza, vale a dire il rapporto tra i biglietti bianchi e quelli neri. Nel seguente problema è noto l’avvenimento, mentre ne è sconosciuta la causa: Data un’urna che racchiude biglietti bianchi e neri in un rapporto non noto, determinare la probabilità che tale rapporto sia di p a q, quando sia stato estratto un biglietto e questo sia bianco. A queste due classi di problemi possono essere ricondotti tutti i problemi che dipendono dalla teoria dei casi; noi però, prenderemo qui in esame solo quelli della seconda classe e stabiliremo il seguente principio: PRINCIPIO – Se un avvenimento può essere prodotto da un numero n di cause diverse, le probabilità dell’esistenza di queste cause derivanti dall’avvenimento stanno tra loro come le probabilità dell’avvenimento derivanti da tali cause, e la probabilità dell’esistenza di ciascuna è uguale alla probabilità dell’avvenimento derivante da essa, divisa per la somma di tutte le probabilità dell’avvenimento derivanti ciascuna da tali cause » Un commento sulle affermazioni contenute nel brano. L’interpretazione del concetto di probabilità che emerge dal richiamo alle conoscenze umane, fa propendere per aspetti soggettivisti, che saranno in vario modo affermati nelle opere più giovanili. È poi interessante la distinzione tra causa nota ed 122 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo avvenimento incerto e causa ignota ed avvenimento certo che ricorda i ragionamenti misti di Leibniz. Riprendendo la distinzione tra probabilità fattuale ed epistemica, è ovvio che il primo caso si usa l’incertezza del caso, mentre la seconda è la meta-probabilità, vale a dire la probabilità che la probabilità fattuale abbia un certo valore. Il principio, così come è formulato, risulta rilevante sia per la ricerca delle cause ed anche come strumento per stimare la possibilità dei casi futuri, di cui i fenomeni attuali si possono considerare cause. Si noti la presenza del retaggio geometrico, nel senso che si preferisce parlare di rapporti e proporzioni. Con esso Laplace si propone di dare una sistemazione razionale sia ad una realtà data sia di impiegarlo come strumento di previsione. Fa tuttavia una certa impressione l’affermazione «la probabilità della sua esistenza, vale a dire il rapporto tra i biglietti bianchi e quelli neri». A prenderla letteralmente, la probabilità potrebbe essere espressa anche da un numero maggiore di 1, perché il rapporto tra i biglietti dell’urna può essere qualunque. Poi nel seguito e negli esempi che propone, tale pensiero viene mutato in rapporto tra favorevoli e possibili. Si può esprimere il principio supponendo che E1, …, En siano le cause (che individuano una partizione di Ω) e che H sia l’avvenimento. Si ha quindi che p(Ej |H) : p(Ek|H) = p(H|Ej): p(H|Ek). Inoltre il principio afferma che p(Ei) = p(H | Ei ) . Questa interpretazione del testo porta a p(H | E1 ) + ... + p(H | E n ) risultati errati. La prima affermazione, letta in modo diversa può divenire corretta: se nel principio ci fosse scritto “le probabilità dell’esistenza di queste cause derivanti dall’avvenimento stanno tra loro come le probabilità dell’avvenimento derivanti da tali cause e la probabilità dell’esistenza di ciascuna” la, allora si potrebbe leggere p(H | E j ) ⋅ p(E j ) p(H | E k ) ⋅ p(E k ) = p(E j | H) p(E k | H) p(H) ⋅ p(E j | H) p(H) ⋅ p(E k | H) = p(H | E j ) ⋅ p(E j ) p(H | E k ) ⋅ p(E k ) omettendo una virgo- , in quanto, per il teorema di Bayes, . La seconda uguaglianza resta però ‘simile’ alla seconda forma del teorema di Bayes che oggi potrebbe essere scritta come p(E j | H) = p(E j ) ⋅ p(H | E j ) ∑ p(E k ) ⋅ p(H | E k ) , a patto k che la probabilità delle cause sia uniformemente distribuita e che invece della “la probabilità dell’esistenza di ciascuna” ci sia la “probabilità dell’esistenza di [questa causa] derivanti dall’avvenimento”. Il primo problema che Laplace propone come applicazione è il seguente: «I Problema – Un’urna racchiude infiniti biglietti bianchi e neri in rapporto ignoto; se ne estraggono p + q, di cui p sono bianchi e q neri; si domanda la probabilità che, estraendo un nuovo biglietto da questa urna, esso sarà bianco. » Il testo merita attenzione: in esso compare un’interpretazione di ‘infinito’ sorprendente. L’autore sembra propendere per la possibilità che gli infiniti siano confrontabili, in quanto parla di rapporto tra i numeri di biglietti di colori diversi. Con l’odierna teoria dei cardinali il testo perde di significa- 123 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo to, dato che i rapporti tra cardinali non sono operazioni consentite. Con la teoria dei limiti infiniti di funzioni, l’argomento potrebbe ‘reggere’, anche se la teoria dei limiti non era, in quel momento, completamente sviluppata. Ma è difficile immaginare il passaggio dal discreto del concetto di quantità che è sottinteso nell’urna e nella numerosità dei biglietti al continuo necessario per fare i limiti. Non è specificata la modalità di estrazione, se contemporanea o in successione, con o senza restituzione. Tuttavia, come si vedrà nello svolgimento del problema, tale infinito è propriamente indispensabile, proprio per realizzare il passaggio dal discreto al continuo. Analizziamo alcuni passi della soluzione che Laplace offre: «Soluzione – Il rapporto tra il numero dei biglietti bianchi e il numero complessivo dei biglietti racchiusi nell’urna può essere uno qualsiasi dei numeri frazionari da 0 a 1; se si prende uno di questi numeri x per rappresentare il rapporto ignoto, la probabilità di estrarre p biglietti bianchi e q neri è, in questo caso, xp(1-x)q; perciò la probabilità che x sia il vero rapporto tra il numero dei biglietti bianchi e il numero totale è per il principio esposto nel paragrafo precedente uguale a x p (1 − x )q dx q p ∫ x (1 − x ) dx essendo l’integrale nullo quando x = 0, e tale che finisca quando x = 1;» Ci siamo fermati nella citazione, anche se il pensiero di Laplace non è concluso, per fare alcune os- servazioni. Quando l’autore propone che la probabilità sia xp(1-x)q, è evidente che sta utilizzando uno schema probabilistico cosiddetto di tipo bernoulliano successo-insuccesso che può realizzarsi anche con lanci ripetuti di una moneta. In questo schema, la situazione che si presenta al secondo lancio è del tutto identica a quella del primo lancio, quindi si potrebbe concludere che il sorteggio di cui parla il testo avviene con restituzione. D’altra parte se nell’urna ci fossero 100 biglietti di cui 60 bianchi e il resto neri, la probabilità dell’evento B1, si sorteggia un biglietto bianco sarebbe p(B1) = 60/100 = 0,6. Operando senza restituzione (e quindi non ritenendo indipendenti i singoli eventi), si avrebbe che detto B2 la probabilità di avere un biglietto bianco al secondo sorteggio, p(B2|B1) = 59/99. Così p(B1∩B2) = p(B1)·p(B2|B1) = (60·59)/(100·99) = 0,357576. Se si facesse il sorteggio con restituzione i due eventi sarebbero indipendenti ed avrebbero la stessa probabilità per cui p(B1∩B2) = 0,36. Se nell’urna ci fossero 100.000 biglietti e di essi 60.000 fossero bianchi, si avrebbe ancora p(B1) = 0,6 e p(B2|B1) = 59.999/99.999, per cui p(B1∩B2) = 0,359998, mentre se gli eventi fossero indipendenti, continuerebbe ad essere p(B1∩B2) = 0,36. Pertanto in presenza di infiniti biglietti nell’urna si può ritenere indifferente se il sorteggio avviene con o senza restituzione, essendo tutto l’ambito della probabilità in rapporto con approssimazioni. Il testo afferma: per il principio esposto nel paragrafo precedente. Fa riferimento alla frase « la probabilità dell’esistenza di ciascuna [causa] è uguale alla probabilità dell’avvenimento derivante da essa, divisa per la somma di tutte le probabilità dell’avvenimento derivanti ciascuna da tali cause». La causa cui fa riferimento è la composizione dell’urna e quindi che sia x la ‘vera’ probabilità da cui dipende la probabilità dell’avvenimento. 124 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo A denominatore della frazione vista in precedenza compare un integrale. La cosa ha senso, ma è difficile da accettare. Comunque si faccia variare x tra 0 e 1, essendo un numero razionale, ci sarebbe da fare la somma, per ogni numero razionale dell’intervallo indicato, del numero razionale xp(1-x)q. Sicuramente è molto più semplice il calcolo dell’integrale ma il passaggio dal discreto a continuo non viene giustificato. Il fatto che nell’urna ci siano infiniti biglietti permette di assumere una grande varietà di valori. Se i biglietti fossero solo 10, x potrebbe essere espresso solo in decimi. L’integrale esprime, quindi, la somma di tutte le probabilità dell’avvenimento derivante da ciascuna causa. A numeratore della stessa frazione compare la probabilità ‘dell’avvenimento’ ma questa viene moltiplicata per un ‘sospetto’ dx che potrebbe avere senso se si trattasse di un’eventuale differenza, ma sempre per la natura di numero razionale di x, non appare evidente. Il tutto appare una ‘forzatura’ giustificata dalla semplicità (categoria cui Laplace tiene molto) ma non dalla chiarezza della giustificazione. Un’ulteriore osservazione. Scrive Laplace «essendo l’integrale nullo quando x = 0, e tale che finisca quando x = 1». Si può considerare questa dizione, spesso ripetuta nel suo testo per indicare l’integrale definito 1 che oggi si scriverebbe ∫ x p (1 − x )q dx , c’è qualcosa di più. Il fatto che finisca in 1 è d’accordo con 0 questa interpretazione, però l’integrale è nullo in 0 per la specificità della funzione integrando. Se 1 ad esempio si trattasse di ∫ − senxdx , sarebbe assai difficile accettare che l’integrale sia nullo quan0 do x = 0. Nel prosieguo si userà la scrittura oggi consueta per l’integrale definito, riportando anche il testo di Laplace. Da tutto questo ricaviamo un principio non esplicitato da Laplace: fare tutto a ragione o a torto con i metodi della Analisi matematica, perché più semplice o forse più generale. Ritorniamo al Problema I, continuando la frase che in precedenza abbiamo troncato «ora, nell’ipotesi che sia x il vero rapporto tra il numero di biglietti bianchi e quello totale, la probabilità di estrarre un biglietto bianco dall’urna è x; moltiplicando questa quantità per la probabilità dell’ipotesi, si otterrà, per la probabilità d’estrarre un biglietto bianco dall’urna in virtù del rapporto x, il valore x p +1(1 − x )q dx 1 p q ∫ x (1 − x ) dx 0 e di conseguenza, indicando con E la probabilità intiera di estrarre un biglietto bianco dall’urna, si avrà 1 p +1 q ∫ x (1 − x ) dx E = 01 q p ∫ x (1 − x ) dx 0 badando a fare iniziare gli integrali quando x = 0 e a porre loro fine quando x = 1» Quindi con restituzione: la probabilità di quest’ulteriore sorteggio è ancora lo stesso. A questo punto non ci si stupisce più delle presenze dei dx. Stavolta gli integrali sono proprio definiti, non po- 125 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo nendosi più condizioni sull’annullamento in 0. Il numero E è l’espressione della probabilità della causa, dato che l’integrale a numeratore di E ‘raccoglie come somma, tutte le possibili probabilità dell’ulteriore sorteggio. Come si vede si hanno due integrali di polinomi e non ci dovrebbero essere problemi per calcolarli, a parte il fatto che essendo p e q parametri, il risultato dipenderà da essi. Ma Laplace prende un’altra strada, con (ripetute) integrazioni per parti in cui il fattore differenziale è xpdx (o xp+1dx) e il fattor finito è (1-x)q. Ad esempio al denominatore calcola 1 1 x p +1 1 p +1 (1 − x )q − ∫ x ⋅ q ⋅ (− 1)(1 − x )q −1dx = q ∫ x p +1(1 − x )q −1dx , ∫ (1 − x ) x dx = p +10 0 p + 1 0 0 p + 1 1 q p essendo il termine in parentesi quadra, calcolato in 0 e in 1, nullo in entrambi i casi. Con questo procedimento appare chiaro che decrescono gli esponenti del fattore (1-x) e decrescono quelli del fattore x. Iterando q-volte scompare il fattore (1-x) e resta con potenza maggiore il fattore x soltanto e l’integrale diviene allora semplice. Nel caso in esame l’integrale a numeratore si può scrivere come q! q! e quello a denominatore , quindi il va( p + 2) ⋅ ( p + 3) ⋅ ... ⋅ ( p + q + 2) ( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1) lore della probabilità della causa E = p +1 . p+q+2 Il risultato può ora essere usato a prevedere nuovi ‘avvenimenti’. Se si volesse conoscere la proba1 q +1 p ∫ x (1 − x ) dx . L’integrale a bilità di estrarre un biglietto nero, basterebbe ora considerare H = 01 q p ∫ x (1 − x ) dx 0 numeratore sarebbe dato ora da (q + 1)! , per cui ( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 2) H= q +1 e così E + H p+q+2 = 1. Più in generale Laplace indica la probabilità di pescare m biglietti bianchi e n biglietti neri data da 1 ∫x p+m (1 − x )q + n dx P=0 1 q p ∫ x (1 − x ) dx = (q + 1) ⋅ (q + 2) ⋅ ... ⋅ (q + n ) ⋅ ( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1) ( p + m + 1) ⋅ ( p + m + 2) ⋅ ... ⋅ ( p + q + m + n + 1) 0 Un modo diverso di scrivere la frazione a secondo membro è dato moltiplicando numeratore e denominatore per un opportuno fattore in modo da rendere più semplice l’espressione: q!·p!·(p+m)!. Così facendo la frazione diviene (q + n )! ⋅ ( p + q + 1)! ⋅ q! p! 126 ( p + m )! . Vediamo ora come tra( p + q + m + n + 1) C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo sformare ciascuna delle tre frazioni, sfruttano le ipotesi che p e q siano ‘grandi’. Si ha, grazie alla formula di Stirling, per s+ s ogni numero naturale s (abbastanza grande) 1 2 s s s! ≅ 2π ⋅ s = 2π ⋅ s , ma il secondo membro approssima per difetto il fattoriale e e e l’errore che si commette decresce lentamente (con un foglio Excel si constata che per s = 10 l’errore è dell’ordine di 8·10-3; per s = 100 è dell’ordine di 8·10-3 , per s = 170 è dell’ordine di 5·10-4, ma con un foglio Excel non è possibile andare oltre essendo 170! = 7,6·10306). Sostituendo i fattoriali con la 1 formula di Stirling, si ha 3 (q + n )! = (q + n )q + n + 2 ; ( p + q + 1) p + q + 2 ; q! enq q+ 1 2 e q +1 p p+ 1 2 1 eq + n +1( p + m ) p + m + 2 ( p + q + m + n + 1) 1 ∫x p+m p + q + m+ n+ 3 2 . (1 − x )q + n dx Si scrive in tal modo la probabilità di sorteggiare m biglietti bianchi e n neri, 0 1 q p ∫ x (1 − x ) dx = 0 1 3 1 (q + n )q + n + 2 ⋅ ( p + q + 1) p + q + 2 ⋅ ( p + m ) p + m + 2 = q+ q 1 2 p+ ⋅p 1 2 3 ⋅ ( p + q + m + n + 1) p + q + m + n + 2 . Le semplificazioni possibili non sono terminate. Infatti, si ha quindi 3 ( p + q + 1) p + q + 2 3 = ( p + q)p+q+ 2 1 ⋅ 1 + p + q p+q+ 3 2 ( p + q + 1) = ( p + q ) ⋅ 1 + 1 , p + q 3 = e ⋅ ( p + q ) p + q + 2 . In questi passaggi si noti la disinvoltura di utilizzare il segno di uguaglianza quando si sottintende il passaggio al limite. 1 Si ha lim1 + p + q p+q = e con p+q che tende all’infinito. Inoltre si trascura il fattore 3 2 1 1 + , dato che il termine in parentesi non è ‘sensibilmente’ diverso da 1. I termini in cui p + q compaiono p+m e q+n, meritano un trattamento a parte. Siccome m è ‘molto’ piccolo rispetto a p ( e 1 m 1 lo stesso n rispetto a q), si ha ( p + m ) = p ⋅ 1 + = p ⋅ 1 + . Quindi ( p + m ) p + m + 2 = p p m 127 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo m p 1 m 1 1 m m+ 2 p + m+ p + m+ 1 m 2 2 . Sono ‘evidenti’ le varie approssimazioni ⋅ 1 + =p ⋅ 1+ =e ⋅p p p m 1 q + n+ 1 2 . Con queste trasformaed i vari passaggi al limite. In modo analogo (q + n )q + n + = e n ⋅ q 2 zioni e quella analoga per il termine con p+q+m+n+1 si ha: 1 1 3 p + m + n q + n + 2 p + q + m 2 2 ⋅e ⋅ p e ⋅ q ⋅ e ⋅ ( p + q) 1 3 1 q +n+ p +q + p + m+ ( q + n) 2 ⋅ ( p + q + 1) 2 ⋅ ( p + m) 2 P= = 1 1 1 1 3 3 q+ p+ q+ p+ q 2 ⋅ p 2 ⋅ ( p + q + m + n + 1) p + q + m + n + 2 q 2 ⋅ p 2 ⋅ e m + n +1 ⋅ ( p + q ) p + q + m + n + 2 da cui P = pm ⋅ qn ( p + q )m+ n . L’impressione che si ha leggendo questa parte della dimostrazione è quella di stare a guardare una macchina complessa, bene oliata che macinando calcoli non semplici, giunge ad un risultato ‘semplice’. Laplace non si pone il problema se approssimando di qua e di là prima i fattoriali con la formula di Stirling, poi introducendo e come limite e tagliando fattori perché p e q sono grandi e gli altri piccoli, non si procurino possibili problemi per cui invece di venire quello che si vuole, si ottenga dell’altro. La ‘bellezza’ della formula finale fa sparire tutti i dubbi. Oggi un calcolo di questi tipo dovrebbe essere accompagnato con stime degli ‘errori’ per garantire che il risultato sia ‘abbastanza’ quello desiderato. Ma Laplace ha un'altra argomentazione che dovrebbe convincere i più scettici. Cosa succede se invece di essere m e n piccoli sono grandi? Prova allora che i numeri p e q possono essere così grandi che la (meta)probabilità che la probabilità di pescare un biglietto bianco sia compresa tra e p −ω p+q p + ω si avvicini alla certezza quanto si vuole. Non si seguirà la dimostrazione di questa afp+q fermazione, ma ci si sofferma su un passaggio delicato ed importante. Nella espressione precedente 1 di E a denominatore compare ∫ x p (1 − x )q dx , integrale che si è sostituito col suo valore 0 q! . Allora nella scrittura della probabilità che il rapporto vero sia x, data ( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1) 128 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo x p (1 − x )q dx da q p ∫ x (1 − x ) dx , si può anche scrivere che tale probabilità è data da ( p + 1) ⋅ ... ⋅ ( p + q + 1) x p (1 − x )q dx . Sviluppando questa informazione, con tecniche viste in preceq! − denza, ad un certo punto compare un fattore e ( p + q )2 z 2 3 p2 che ricorda da vicino la curva di Gauss. Si è mostrato anche in dettagli il primo problema perché sono abbastanza chiari in esso i motivi ispiratori della ricerca di Laplace. Il saggio continua con un secondo problema sulla suddivisione della posta, trattato con metodi di approssimazione analoghi a quelli visti nella soluzione del problema 1. A questo secondo problema segue l’indagine sulle medie, in cui impiega i metodi probabilistici illustrati. 4.1.6. La Teoria analitica (prima parte). Il testo Théorie analytique des Probabilités rappresenta sicuramente il vertice dell’elaborazione della teoria della probabilità in Laplace. La prima edizione comparve nel 1812. Il testo è dedicato a Napoleone e si apre con un grande elogio. «A Napoleone il Grande. Sire, la benevolenza con la quale Vostra Maestà si è degnata d’accogliere l’omaggio del mio trattato di Meccanica Celeste, m’ha ispirato il desiderio di dedicarLe questa Opera sul Calcolo delle Probabilità. Questo calcolo delicato si estende alle questioni più importanti della vita, che non sono, per lo più, che problemi di probabilità. Ciò dovrebbe, sotto questo aspetto, interessare Vostra Maestà il cui genio sa sì degnamente incoraggiare tutto ciò che può contribuire al progresso dei lumi, e della prosperità pubblica. Io oso supplicarLa di gradire questo nuovo omaggio dettato dalla più viva riconoscenza, e dai sentimenti profondi d’ammirazione e rispetto mediante i quali io sono, o Sire, di Vostra Maestà, l’umilissimo ed ubbidientissimo servitore e fedele suddito, Laplace» Nella edizione originale, dopo la prefazione, il testo comprende 455 pagine, seguite da 18 pagine di indice e poi una pagina di errata. La seconda edizione è del 1814 e comprende una nuova introduzione di 106 pagine (numerate con ‘cifre’ romane) e il testo che segue è numerato da 3 a 484, seguito da 21 pagine di indice e due pagine di errata. Nello stesso anno 1814, l’introduzione, verrà stampata a parte, in ottavo, col titolo di Essai philosophique sur les Probabilités. La terza edizione appare nel 1820. In essa, dopo un’introduzione di 142 pagine (numerate con ‘cifre’ romane), il rimanente testo è uguale a quello della seconda edizione. Separatamente, Laplace dopo la prima edizione pubblicò quattro supplementi alla prima edizione. I primi tre di questi supplementi seguirono anche la terza edizione. Le date di pubblicazione di questi supplementi non sono riportate. Alcune pagine della prima edizione non si ritrovano nella seconda e nella terza 2. 2 Todhunter (1865), da cui si traggono queste notizie, indica come le pagine della prima edizione che non compaiono nella seconda edizione come quelle da pagina 9 a pagina 444. Tenuto conto che le pagine del testo della prima edizione erano 446, una simile modifica di testo non avrebbe senso considerarla come seconda edizione. Nel seguito, l’autore inglese specifica che le pagine della prima edizione, modificate e sostituite sono solo le pagine 25, 26, 27, 28, 37, 147, 148. 303, 359, 360, 391 e 392; la seconda versione è sicuramente più credibile. 129 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo Sul web si trova il testo della terza edizione, pubblicato come Tomo VII della ristampa delle opere di Laplace a spese dello Stato francese, nel 1847. In questa ristampa, presentazione, indice ed introduzione sono stampate in 195 pagine (numerate con ‘cifre’ romane), cui seguono 532 pagine di testo ed ulteriori 158 pagine per la stampa dei quattro supplementi. La edizione statale lascia un poco a desiderare in quanto a cura editoriale, ad esempio il secondo supplemento è stampato con gli stessi errori del testo originale. Ovviamente quando Napoleone perse l’impero, Laplace, tra i primi a firmare l’atto di destituzione dell’imperatore, si affrettò ad eliminare la dedica. 4.1.7. Il Saggio filosofico. La scelta di pubblicare l’introduzione della seconda edizione come testo a parte può essere intesa come una volontà di tipo divulgativo, anche perché in tale introduzione, così come avviene per le Ouvertures delle opere liriche, sono riassunti e citati i temi più importanti, sviluppati nel testo della Teoria analitica. Un’analisi più approfondita mostra che tra il trattato matematico e l’introduzione filosofica c’è una importante differenza di impostazione. Il Saggio è un ulteriore ripensamento e quindi il chiarimento di alcuni concetti fondamentali posi alla base del calcolo e che permettevano allo strumento innovativo un’ampia applicazione alla ricerca scientifica. Anche la ‘architettura’ del testo introduttivo, pur avendo precisi riferimenti nella Teoria, si differenzia da quella di quest’ultimo. All’inizio del Saggio Laplace, ricorda che il primo abbozzo dell’Introduzione è lo sviluppo ed approfondimento di una Lezione sulla probabilità, tenuta alla Scuola Normale Superiore (di Parigi) nel 1795. Ciò fa capire che, ancora una volta, come per tante altre opere, la motivazione didattica è quella che spinge all’approfondimento ed al chiarimento delle idee portando ad avanzamenti scientifici importanti. Chiarisce poi che cercherà di presentare le idee della probabilità, senza fare ricorso, come avviene nella Teoria, dei risultati dell’Analisi. Dopo questa premessa, che sembra far prendere tempo allo scrittore ed al lettore, si affronta uno dei punti cui Laplace tiene maggiormente: «Anzi parlando rigorosamente, quasi tutte le nostre conoscenze non sono che probabili; e anche quelle pochissime che stimiamo certe, persino nelle scienze matematiche, ci sono date dall’induzione, dall’analogia, che, strumenti principali per giungere alla verità, si fondano sulla probabilità. Perciò il sistema intero delle conoscenze umane si ricollega alla teoria che esponiamo in questa opera. Si vedrà senza dubbio con interesse che, considerando anche nei princìpi eterni della ragione, della giustizia e dell’umanità soltanto i casi fortunati che sono loro costantemente collegati, vi è un grande vantaggio nel seguire questi princìpi e vi sono notevoli inconvenienti a trascurarli, poiché le loro chances 3, come quelle favorevoli nelle lotterie, finiscono sempre col prevalere tra le oscillazioni del caso. Mi auguro che le riflessioni di questa Introduzione, possano meritare le attenzioni dei filosofi e dirigerla verso un oggetto così degno del loro interesse.» 3 La traduttrice e curatrice del volume UTET, Orietta Pesenti Cambursano, lascia non tradotta questa parola ed in una nota a piede di pagina ci informa dei motivi: «Non abbiamo ritenuto opportuno tradurre il termine chance, perché non abbiamo trovato un equivalente italiano. Il termine caso che più gli si avvicina, corrisponde al francese hasard, nel senso di ciò che non rientra nella regolarità di una legge generale. Chance è invece (citiamo, traducendo dal Dictionaire de l’Académie Française, Septième édition, tome I, Paris, 1878, p. 280, “ogni evento, fortunato o sfortunato, che può risultare da un ordine dato di cose”. » 130 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo Con queste parole Laplace vuole esprimere la sua posizione avversa alle polemiche che il calcolo delle probabilità aveva suscitato, con il risultato che da molti era considerato un esempio di scienza ‘morale’ non degno di paragonarsi alla scienza matematica. La posizione dell’autore è evidente nell’avverbio “rigorosamente”, nell’affermazione che le scienze matematiche si fondano sulla probabilità (e non viceversa). Passa poi in veloce rassegna, il contributo che la probabilità è in grado di dare ai vari aspetti del vivere comune. Di grande interesse gnoseologico l’affermazione che le nostre conoscenze sono probabili. Si riporta per intero il breve capitolo che tratta della probabilità: «La probabilità. Tutti gli avvenimenti, anche quelli che per la loro piccolezza sembrano non ubbidire alle grandi leggi della natura, ne sono una conseguenza necessaria come lo sono le rivoluzioni del Sole. Ignorando i legami che li uniscono al sistema dell’intero universo, li si è fatti dipendere dalle cause finali o dal caso, a seconda che si manifestassero e si succedessero con regolarità o senza ordine apparente; ma queste cause immaginarie sono state successivamente arretrate sino ai limiti delle nostre conoscenze e spariscono del tutto davanti alla sana filosofia la quale non vede in esse che l’espressione dell’ignoranza i cui ci troviamo circa le vere cause. Gli avvenimenti attuali hanno coi precedenti un legame fondato sul principio evidente che nulla può cominciare ad essere senza una causa che lo produca. Quest’assioma, noto sotto il nome di principio di ragione sufficiente, si estende anche alle azioni che giudichiamo indifferenti. Neppure la volontà più libera può dar loro nascita senza un motivo determinante; giacché, se essa stimando perfettamente simili le circostanze di due posizioni, agisse in una e si astenesse dall’agire nell’altra, opererebbe una scelta che sarebbe effetto senza causa; che sarebbe insomma, dice Leibniz, il caso cieco degli epicurei. Ma l’opinione contraria alla nostra è un’illusione dello spirito che, perdendo di vista le ragioni fugaci della scelta della volontà nelle cose indifferenti, si persuade che essa si determini da sé e senza motivo. Dobbiamo dunque considerare lo stato presente dell’universo come l’effetto del suo stato anteriore e come causa del suo stato futuro. Un’Intelligenza che, per un dato istante, conoscesse tutte le forze da cui è animata la natura e la situazione rispettiva degli esseri che la compongono, se per di più fosse abbastanza profonda da sottomettere questi dati all’analisi, abbraccerebbe nella stessa formula i movimenti dei più grandi corpi dell’universo e dell’atomo più leggero: nulla sarebbe incerto per essa e l’avvenire, come il passato, sarebbe presente ai suoi occhi. Lo spirito umano offre, nella perfezione che ha saputo dare all’astronomia, un pallido esempio di quest’Intelligenza. Le sue scoperte in meccanica e in geometria unite a quella della gravitazione universale, l’hanno messo in grado di abbracciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema del mondo. Applicando lo stesso metodo ad altri oggetti delle sue conoscenze, è riuscito a ricondurre a leggi generali i fenomeni osservati ed a prevedere quelli che devono scaturire da circostanze date. Tutti i suoi sforzi nella ricerca della verità tendono ad avvicinarlo continuamente all’Intelligenza che abbiamo immaginato, ma da cui resterà sempre infinitamente lontano. Questo tendere, che è proprio della specie umana, è ciò che ci rende superiori agli animali, ed i progressi nel campo della scienza distinguono le nazioni ed i secoli e rappresentano la loro vera gloria. Ricordiamoci che un tempo, ed in un’epoca che non è ancora molto lontana, una pioggia o una siccità eccessive, una cometa che trascinasse dietro di sé una lunga coda, le eclissi, le aurore boreali ed in genere tutti i fenomeni straordinari, apparivano come altrettanti segni della collera celeste. Si invocava il cielo per allontanare la loro funesta influenza. Non lo si pregava invece di sospendere il corso dei pianeti e del Sole: l’osservazione ben presto fece capire l’inutilità di queste preghiere. Ma, poiché quei fenomeni si manifestavano e sparivano dopo lunghi intervalli, essi sembravano contrari all’ordine della natura; si supponeva che il cielo li facesse nascere e li modificasse a suo Lucio Anneo Seneca piacimento per punire i delitti della Terra. Così la lunga coda della cometa del 1456 4 a.C. – 65 d.C sparse il terrore nell’Europa già prostrata per il rapido successo dei Turchi che avevano abbattuto il Basso Impero. Quest’astro, dopo quattro rivoluzioni ha suscitato in noi un interesse ben diverso. La conoscenza delle leggi del sistema del mondo, acquisita in quest’intervallo di tempo, ha dissipato i timori prodotti dall’ignoranza de veri rapporti dell’uomo con l’universo, ed Halley, riconosciuta l’identità della cometa con quella del 1531, 1607 e 1682, annunziò il suo ritorno per la fine del 1758 o l’inizio del 1759. Gli scienziati attesero con ansia questo ritorno, che doveva confermare una delle più grandi scoperte che fossero mai state fatte nelle scienze e compiere la predizione di Seneca, quando, a proposito della rivoluzione di questi astri che vengono da remote distanze, disse “Verrà un giorno in cui, dopo uno studio di parecchi secoli, le cose attualmente incomprensibili saranno evidenti, e la posterità si meraviglierà che verità così chiare ci siano sfuggite”. Clairaut sottomise allora all’analisi le perturbazioni che la cometa doveva avere provato per 131 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo l’azione dei due maggiori pianeti, Giove e Saturno: dopo lunghi calcoli fissò il suo prossimo passaggio al perielio per l’inizio circa dell’aprile 1759, cosa che l’osservazione non tardò a verificare. La regolarità, che l’astronomia ci presenta nel movimento delle comete, ha luogo, senza dubbio, in tutti i fenomeni. La curva descritta da una semplice molecola di aria o di vapore è regolata con la stessa certezza delle orbite planetarie: non v’è tra esse nessuna differenza, se non quella che vi pone la nostra ignoranza. La probabilità è relativa in parte a questa ignoranza, in parte alle nostre conoscenze. Sappiamo, per esempio, che su tre o più eventi uno solo si verificherà; ma nulla ci porta a credere che uno debba accadere a preferenza degli altri. Data la nostra indecisione, ci è impossibile pronunciarci con certezza sul loro accadere. Tuttavia è probabile che uno solo di essi, preso ad arbitrio, non si verifichi, perché vediamo che più casi Alexis-Claude Clairaut ugualmente possibili ne escludano l’esistenza, mentre uno solo la favorisce. La teoria 1713 - 1765 dei casi consiste nel ridurre tutti gli eventi di uno stesso genere ad un certo numero di casi ugualmente possibili, cioè tali che renderci indecisi circa la loro esistenza, e nel determinare il numero dei casi favorevoli all’evento di cui si ricerca la probabilità. Il rapporto tra questo numero e quello di tutti i casi possibili è la misura della probabilità, la quale perciò non è che una frazione, il cui numeratore è il numero dei casi favorevoli e il cui denominatore è il numero di tutti i casi possibili. » Il lungo brano citato, che non esaurisce il capitolo dedicato alla probabilità, ci permette di fare alcune osservazioni. Intanto lo stile. Il confronto con la Memoria del 1774 è illuminante. Qui Laplace si mette gli abiti dello scrittore divulgatore di scienza e non quelli dello scienziato. Le sue argomentazioni sono presentate in modo ampio con lo scopo di essere convincente anche per un non addetto ai lavori. Gli esempi sono calzanti ed anche dotti, si veda la citazione di Seneca. L’immagine della Intelligenza onnisciente è famosa, ma non originale. Infatti Laplace la deriva da Condorcet che in un saggio sull’Analisi del 1768 scriveva: «Un’intelligenza che conoscesse lo stato di tutti i fenomeni, in un determinato momento, le leggi cui è sottoposta la materia ed il loro effetto alla fine di un intervallo qualsiasi di tempo, avrebbe una conoscenza perfetta del sistema del mondo. Tale conoscenza supera le nostre forze, ma costituisce il fine a cui devono tendere gli sforzi dei geometri filosofi, che ad essa si avvicineranno sempre più, pur senza mai sperare di poterla raggiungere. » Anche se le parole sono molto simili, e sono il risultato di un comune ambiente culturale, Condorcet ritiene che tale conoscenza totale sia puramente ideale. Laplace crede invece in questa Intelligenza e il suo accenno ai limiti della conoscenza è funzionale solo ad una posizione polemica contro la metafisica. Per meglio chiarire, è ovvio che nel nostro non c’è una identificazione tra Intelligenza perfetta con la conoscenza umana. Ma c’è lo sforzo umano di avvicinarsi. Così la completezza della certezza non è appannaggio della conoscenza umana, a tale completezza deve avvicinarsi. Così, nonostante il divario tra le due forme di conoscenza, c’è una identità delle tecniche che permettono di raggiungere la conoscenza. Così anche l’Intelligenza perfetta si avvale degli strumenti dell’Analisi matematica, mediante i quali l’uomo è riuscita ad avvicinarsi alla piena consapevolezza in campo astronomico. Inoltre entrambe le conoscenze hanno uno scopo comune che è quello della comprensione della natura. In questo modo per Laplace l’Intelligenza non è un essere (la cui esistenza richiederebbe la metafisica) ma è solo il simbolo umano della conoscenza razionale che serve di sprone per l’uomo nelle sue indagini. L’accrescimento prodigioso dei risultati scientifici avutosi nel XVIII secolo ed in quello precedente è quasi una garanzia che si arriverà a colmare il divario. Questo lo si desume dal confronto tra l’auspicio di Seneca e i risultati prima di Halley e poi di Clairaut. 132 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo Una volta raggiunto questo ideale, anche se a tappe e per successi parziali, sparirà completamente il bisogno della probabilità, in quanto l’universo è completamente deterministico. La frase che invita a questa conclusione è «Lo spirito umano offre, nella perfezione che ha saputo dare all’astronomia, un pallido esempio di quest’Intelligenza. Le sue scoperte in meccanica e in geometria unite a quella della gravitazione universale, l’hanno messo in grado di abbracciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema del mondo. » Quindi il ‘futuro’ della conoscenza è solamente deterministico. Possiamo però riconoscere nelle parole di Laplace una sottile vena polemica anti-metafisica. Il ruolo della razionalità umana si oppone ad una visione finalistica in base alla quale sarebbe possibile ci sarebbe uno scopo cui tendono le leggi naturali preordinato da un ente o persona. Una conclusione di Leibniz è che le leggi naturali sono preordinate per offrici il migliore dei mondi possibili perché così vuole Dio. Anche Berkeley giunge a ritenere che percezioni ed idee siano (pre)ordinate per i propri fini da Dio. Laplace oppone una conclusione tratta dal principio di ragione sufficiente, in base al quale ogni effetto è generato da una causa. Ma in questo schema la casualità non trova posto, se per casualità intendiamo l’irrazionale o la volontà libera, dato che anche la volontà più libera quando sceglie, la scelta fatta è determinata dalla volontà stessa che si configura come causa. Un altro punto chiave è dato dalla affermazione «La probabilità è relativa in parte a questa ignoranza, in parte alle nostre conoscenze.» La frase mette a confronto due categorie contrapposte: ignoranza e conoscenza. Come si vedrà qualche riga dopo, la probabilità si presenta come numero, che però non esprime quanto la nostra conoscenza si approssimi alla certezza, ma dipende dalla capacità dello scienziato di individuare in modo perfetto casi favorevoli e possibili. Quindi la sua essenza non è basata sulla certezza, ma sulla situazione reale che può venire studiata ed analizzata, più o meno esaurientemente. Quindi di per sé è un dato oggettivo. Tuttavia il concetto di probabilità rimane ambiguo, soprattutto se paragonato a concetti ‘classici’ quali numero e figura che da lungo tempo avevano assunto uno statuto accettato di astrazione, indipendentemente dalla natura intellettuale oppure empirica che si poteva porre alla base della loro conoscenza. La probabilità, così come era (ed è anche oggi presentata) partecipa contemporaneamente all’ambito logico della possibilità ed a quello empirico della misura o identificazione dei dati. Nelle applicazioni pratiche questi due aspetti talvolta sono chiari, ad esempio nei giochi, altre volte restano sfuggenti. Ma è proprio nella natura bicefala della probabilità, che essa può essere utilizzata come ponte tra esperienza e matematica. Il capitolo sulla probabilità continua con vari esempi passando in rassegna altri ‘sinonimi’ di probabilità, discutendo della verosimiglianza, come causa della diversità di opinioni, dei gradi di credito che vengono date ad informazioni e che sono relativi all’atteggiamento ed alla convinzione di chi propone e dall’estensione delle conoscenze degli ascoltatori, l’influenza dei più istruiti su quelli che 133 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo lo sono meno e le conseguenze di queste situazioni che hanno effetti sulla eliminazione di credenze nella magia e nell’astrologia. Sullo sfondo di queste considerazioni, la cultura e le idee dell’illuminismo visto come un progresso dell’umanità, per cui «Dobbiamo essere indulgenti nei riguardi delle opinioni diverse dalle nostre, perché la differenza spesso dipende solo dai punti di vista diversi in cui ci hanno posto le circostanze. Portiamo nostri lumi a coloro che giudichiamo insufficientemente istruiti; ma prima esaminiamo severamente le nostre opinioni e misuriamone con imparzialità le probabilità rispettive. La differenza di opinione dipende anche dal modo con cui si determina l’influenza dei dati che sono noti. La teoria delle probabilità affronta delle questioni così sottili, che non è per niente sorprendente se due persone giungono a risultati diversi, soprattutto in problemi molto delicati, pur avendo gli stessi dati» Questo brano si salda idealmente con la conclusione del Saggio, circa 150 pagine dopo: «Da questo Saggio si vede che la teoria delle probabilità non è in fondo che il buon senso ridotto al calcolo; essa fa valutare con esattezza ciò che gli intelletti acuti avvertono per una sorta di istinto, senza che spesso se ne possano rendere conto. Se si pensa ai metodi analitici ai quali questa teoria ha dato nascita, alla verità dei principi che le sono di base, alla logica sottile e delicata necessaria nel loro impiego per la soluzione dei problemi, alle istituzioni di utilità pubblica che si appoggiano su tale teoria, all’estensione che ha ricevuto e che può ancora ricevere dalla sua applicazione alle questioni più importanti della filosofia naturale e delle scienze morali; se si osserva poi che, anche nei problemi non sottoponibili al calcolo, essa dà i suggerimenti più sicuri atti a guidarci nei nostri giudizi, e ci insegna a guardarci dalle illusioni le quali spesso ci ingannano, si vedrà che non esiste scienza più degna delle nostre meditazioni e che più utilmente debba entrare nell’organizzazione della istruzione pubblica.» La probabilità è vista come strumento per l’istruzione, per portare i lumi a quelli meno istruiti. Inoltre ci si soffermi sull’affermazione che lega la probabilità al buon senso; essa sembra messa apposta per collocare la teoria delle probabilità in accordo con la teoria della Scienza deduttiva di Aristotele (e con l’impostazione generale degli Elementi di Euclide) dando, quindi, una base semantica alla teoria, al di fuori della teoria stessa. Questa impressione è confermata dal capitolo in cui si presentano gli assiomi, che proprio perché non possono essere affermazioni del tutto astratte, ma deve essere chiaro il loro rapporto con una ‘realtà’, prendono il nome di princìpi. Il testo spesso li presenta con qualche esemplificazione o commento. Qui li si riportano in forma stringata, lasciando al lettore l’eventuale integrazione con le parti esplicative del testo di Laplace. «I PRINCIPIO. Il primo principio è la definizione stessa di probabilità, che, come s’è visto, è il rapporto tra il nu- Il mero dei casi favorevoli e quello di tutti i casi possibili. II PRINCIPIO. Ma ciò presuppone che i diversi casi siano ugualmente possibili. Se non lo sono, si determinano prima le loro rispettive possibilità, la cui esatta valutazione è uno dei punti più delicati della teoria dei casi [de la théorie des hasards]. Allora la probabilità sarà la somma delle possibilità di ciascun caso favorevole.» primo principio costruisce immediatamente un’idea ‘numerica’ di probabilità: “la probabilità … è il rapporto” e tale rapporto, per la sua stessa natura, può essere espresso solo con un numero razionale. Laplace è troppo attento per non comprendere che il primo principio, per altro dedotto da tanta letteratura precedente, non basta proprio perché richiede le due categorie di eventi: favorevoli e possibili. Ed anzi la seconda è la più “delicata” perché richiede di essere associata ad un ambito numerico (una misura), dato che si chiede di fare un confronto in base alla condizione di uguale possibilità e soprattutto nel caso che tale condizione non sia soddisfatta, di sommare la possibilità di ciascun ca- 134 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo so favorevole. Gli esempi che seguono il secondo principio occupano ben più spazio di quanto non sia riservato a chiarire il concetto nella Teoria. Ciò dipende dalla difficoltà che si incontra in casi anche non troppo complicati, di valutare l’equipossibilità. Se venisse a cadere questa, sarebbe inficiata tutta la teoria delle probabilità nel suo complesso. Questo secondo principio sposta l’attenzione dagli aspetti analitici che erano stati predominanti negli scritti precedenti, verso direzioni più ‘logiche’ o se si vuole, ‘filosofiche’. «III PRINCIPIO. Uno dei punti più importanti della teoria delle probabilità e che si presta di più alle illusioni, è il modo in cui le probabilità aumentano o diminuiscono per le loro mutue combinazioni. Se gli eventi sono indipendenti gli uni dagli altri, la probabilità del verificarsi del loro insieme è il prodotto delle loro probabilità particolari. » Nell’esempio – commento del principio, Laplace presenta un commento che pone in chiaro ciò che per lui sono certezza matematica e certezza morale. Sta parlando del fatto che il prodotto di due probabilità, per la loro natura di numeri minori di uno, risulta minore o uguale a ciascuno dei due fattori (si “degradano”). Dice quindi «Gli storici non sembrano aver fatto sufficientemente attenzione alla degradazione della probabilità dei fatti, quando sono visti attraverso un gran numero di generazioni successive; parecchi eventi storici, ritenuti certi, risulterebbero per lo meno dubbi, se li si sottomettesse a questa prova. Nelle scienze puramente matematiche, le conseguenze più lontane partecipano delle certezza del principio da cui derivano. Nelle applicazioni dell’analisi alla fisica, le conseguenze hanno tutta la certezza dei fatti o delle esperienze. Ma nelle scienze morali in cui ogni conseguenza è dedotta da ciò che precede in modo puramente verosimile, per probabili che siano le deduzioni, la chance dell’errore cresce con il loro numero e finisce per sorpassare la chance della verità nelle conseguenze molto lontane dal principio» I primi tre principi sono tutti e tre ordinati a chiarire il concetto di probabilità e alcune proprietà/ caratteristiche che ne derivano. Con l’introduzione del successivo principio inizia a rendersi evidente come Laplace tenti di inserire il calcolo delle probabilità all’interno di una struttura scientifica che si basi su una concezione deterministica. Questo aspetto sarà ripreso dopo la presentazione di alcuni altri princìpi. «IV PRINCIPIO. Se due eventi dipendono l’uno dall’altro, la probabilità dell’evento composto è il prodotto della probabilità del primo evento per la probabilità che, verificandosi il primo, si verifichi il secondo. … V PRINCIPIO. Se si calcola a priori la probabilità di un evento composto da questo o da un altro che si aspetta, la seconda probabilità, divisa per la prima, sarò la probabilità dell’evento atteso, derivata dall’evento osservato…. VI PRINCIPIO. Una qualsiasi delle cause alle quali si può attribuire un evento è tanto più verosimile quanto più è probabile che, supposta l’esistenza di tale causa, l’evento abbia luogo. La probabilità dell’esistenza di una qualunque di queste cause è dunque una frazione, il cui numeratore è la probabilità dell’evento risultante dalla causa, ed il cui denominatore è la somma della probabilità simili relativa a tutte le cause. Se queste diverse cause, considerate a priori, hanno un diverso grado di probabilità, bisogna adoperare in luogo della probabilità dell’evento risultante da ciascuna causa, il prodotto di questa probabilità per quella della causa stessa. È il principio fondamentale di quella parte dell’analisi dei casi che consente nel risalire dagli eventi alle cause…. VII PRINCIPIO. La probabilità di un evento futuro è la somma dei prodotti delle probabilità di ciascuna causa dedotta dall’evento osservato, per la probabilità che esistendo tale causa, l’evento futuro abbia luogo. » Questi principi riguardano l’utilizzazione dalla probabilità, o meglio della probabilità assieme alla probabilità condizionata. Il quarto principio introduce la probabilità condizionata, potendosi esprimere come l’uguaglianza p(E1∩E2) = p(E1)·p(E2|E1). Ciò se si interpreta la dizione “evento composto” come intersezione dei due eventi. Oggi siamo sicuramente più abituati alla versione ‘insiemistica’, 135 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo intendendo spesso ‘composto’ come il risultato di applicazioni successive e della composizione funzionale. Il quinto principio si discosta poco dal precedente e potrebbe esprimersi, accettando p(EI H) = p(E | H) . Apparentemente non ci sap(H) l’interpretazione di ‘composto’ come ‘intersecato’, rebbe bisogno di questa postulazione come principio, dato che si tratta di una semplice trasformazione algebrica ottenibile dalla ‘traduzione’ formale del quarto principio, in cui E è l’evento atteso (effetto) e H l’evento osservato (causa). Tuttavia bisogna confrontare più attentamente i testi dei due principi: il quarto parla di contemporaneità di eventi, il secondo prevede un prima, il momento in cui si effettua la stima a priori della probabilità della intersezione e il dopo, la realizzazione dell’effetto. Dice infatti Laplace nel commento al quinto principio: «Si presenta qui la questione discussa da alcuni filosofi a proposito dell’influenza del passato sul futuro.» Il determinismo, come filosofia della causalità ‘stretta’ è sicuramente in questa posizione gnoseologica. L’Intelligenza è in grado di prevedere il futuro basandosi esclusivamente sul passato. Così si rende lecito il passaggio dalla probabilità delle cause a quella degli effetti. Il sesto principio sembra riprendere la seconda parte del principio del Saggio del 1774, ma stavolta Laplace affronta esplicitamente il caso della probabilità uniforme delle cause e poi generalizza alla considerazione che le cause possano avere probabilità diverse. Si avrà p(E j | H) = p(H | E j ) ∑ p(H | E k ) nel k caso di probabilità uniforme delle cause e p(E j | H) = p(E j ) ⋅ p(H | E j ) ∑ p(E k ) ⋅ p(H | E k ) in caso contrario. Si tratta k quindi del teorema di Bayes. Il linguaggio usato è quello di cause ed effetto, con una importante coloritura deterministica. Il settimo principio è ancora formulato col linguaggio delle cause e dell’effetto ed ha il ‘tono’ del cosiddetto teorema delle probabilità totali: p(H) = ∑ p(E k ) ⋅ p(H | E k ) . Anche questo si potrebbe rik cavare dai precedenti princìpi, ma qui, come, altrove è importante il ruolo del tempo. Restano tre ultimi princìpi ma essi non sono solo sulla probabilità, bensì riguardano la speranza. Il concetto di speranza oggi è formulato facendo intervenire le variabili aleatorie. Nel caso di Laplace, c’è una intuizione (tra l’altro la stessa di Pascal quando argomenta sul problema della divisione della posta) ma tale intuizione non è tale da fare diventare il concetto di variabile aleatoria un qualche cosa di matematicamente indipendente, neppure in Huygens che tratta diffusamente del valore atteso. Dice Laplace «La SPERANZA. La probabilità degli eventi serve a determinare la speranza o il timore delle persone interessate alla loro esistenza. La parola speranza ha diversi significati: esprime generalmente il vantaggio di chi si attende 136 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo un bene qualsiasi, in certe ipotesi che sono soltanto probabili. Questo vantaggio, nella teoria dei casi, è il prodotto della somma sperata per la probabilità di ottenerla: è la somma parziale che dobbiamo ottenere se non vogliamo correre i rischi dell’evento, supponendo che la ripartizione si faccia proporzionalmente alle probabilità. Questa ripartizione è la sola equa, quando si faccia astrazione da tutte le circostanze estranee, perché un egual grado di probabilità dà diritto eguale sulla somma sperata. Chiameremo tale vantaggio speranza matematica.» L’aggettivo ‘matematico’, che è spesso usato anche oggi quando si parla di valore atteso di una variabile aleatoria, qui ha un aspetto più pregnante, in quanto dopo i tre princìpi che restano da introdurre, si parlerà anche della “speranza morale”. «VIII PRINCIPIO. Se il vantaggio dipende da più eventi, lo si calcola mediante la somma dei prodotti della probabilità di ciascun evento per il bene collegato al suo verificarsi… IX PRINCIPIO. In una serie di eventi probabili in cui gli uni producano un bene e gli altri una perdita, il vantaggio sarà rappresentato dalla somma dei prodotti della probabilità di ciascun evento favorevole per il bene che procura, alla quale sia stata sottratta la somma di ciascun evento sfavorevole per la perdita che si accompagna loro. Se la seconda somma supera la prima, il beneficio diventa perdita e la speranza si tramuta in timore…. X PRINCIPIO. Il valore relativo di una somma infinitamente piccola è uguale al suo valore assoluto diviso per il bene totale posseduto dalla persona interessata.» I princìpi ottavo e nono sono una cosa sola, e la loro differenziazione è motivata esclusivamente dalla (evidente) scarsa familiarità con in numeri negativi. Essi coincidono con le definizioni che si trovano oggi sui libri di probabilità. Ad esempio P. Baldi (1993). Calcolo delle probabilità e statistica, Milano: McGraw-Hill Libri Italia srl. (p. 47) afferma «Sia X una variabile aleatoria discreta che prenda i valori x1, x2, … ed indichiamo con p la sua densità. Definizione 2.28 Diremo che X ha speranza matematica finita se Σi |xi| p(xi) < + ∞. In questo caso si chiama speranza matematica di X la quantità E[X] = Σi xi p(xi) = Σi xi p{X=xi}. » Nella condizione che risulta importante nel caso la variabile aleatoria assuma infiniti valori, il che farebbe divenire la sommatoria una serie, si impone una condizione di convergenza assoluta; nel caso che i valori assunti dalla variabile aleatoria siano elementi di un insieme finito, banalmente la prima condizione è soddisfatta. In essa intervengono valori assoluti perché sono possibili numeri anche negativi. Il decimo principio sembra del tutto slegato dai precedenti. Esso infatti è motivato da un caso particolare che è noto col nome di Paradosso di San Pietroburgo. Non è del tutto chiaro chi ne sia stato l’autore. Nell’opera di Montmort tale problema viene presentato all’autore da Nicolas Bernoulli e poi discusso da molti altri. Il nome lo si deve perché il problema compare nei Commentarii dell’Accademia di San Pietroburgo. Lo si ritrova qui in Laplace, prima del decimo principio: «Paolo gioca a testa o croce alla condizione di ricevere 2 franchi se uscirà croce al primo lancio, 4 franchi se uscirà solo al secondo, 8 franchi se uscirà solo al terzo e così di seguito. La posta in gioco deve essere, per l’ottavo principio, uguale al numero dei lanci, per cui, se la partita continua all’infinito, la posta deve essere infinita. Ciò nonostante, nessun uomo ragionevole esporrebbe a questo gioco una somma anche modesta, 50 franchi per esempio. A che cosa è dovuta questa differenza tra il risultato del calcolo e l’indicazione del buon senso? Ci si è accorti già da tempo che è dovuta al fatto che il vantaggio morale che un bene ci procura non è proporzionale ad esso, ma dipende da mille circostanze spesso difficili a definirsi, tra cui la più generale e importante è la fortuna. Infatti è chiaro che 1 franco ha molto più valore per colui che e ha solo 100 che per un milionario. Bisogna, perciò, distinguere nel bene che si spera il valore assoluto dal valore relativo: quest’ultimo dipende dai motivi che lo fanno desiderare, mentre il primo ne è indipendente. Non esistono princìpi generali per calcolare il valore relativo.» 137 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo A questo punto Laplace, attribuendolo a Daniele Bernoulli, formula il decimo principio. Il paradosso di San Pietroburgo consiste nel fatto che la speranza di vincita del gioco è data dalla somma dei prodotti delle vincite in caso si realizzino per le riDaniel Bernoulli 1700 - 1782 spettive probabilità di successo ed in questo caso (sempre che la moneta non si alteri nei lanci successivi), essendo ½ la probabilità di ‘croce’ in un lancio singolo, quella di ottenere croce solo al k-esimo lancio è data da (½)k; pertanto la speranza matematica è data come serie 2 ⋅ 1 1 1 2k + 4 ⋅ + 8 ⋅ + .... = ∑ k = ∑1 che è divergente. Oggi tale paradosso lo si usa pro2 4 8 k 2 k prio per giustificare il fatto che si definisca la speranza matematica solo dopo essersi assicurati che essa sia finita (e quindi non si può dire che il paradosso sia stato risolto, ma solo evitato). Il problema del valore relativo è quello che ‘promuove’ quasi tutte le lotterie i cui proventi finiscono poi allo stato. La probabilità di riuscire ad indovinare 5 numeri sorteggiati, senza restituzione, tra 90 è molto piccola, ma anche se appare piccola la somma che serve per puntare su una cinquina è in valore ‘assoluto’ nel senso di Laplace più piccola di quanto non appaia allo scommettitore, attratto dalla cifra messa in palio. Così il valore relativo appare basso, mentre è sicuramente più elevato del valore ‘assoluto’. Ed infatti il vero vincitore dei vari concorsi proposti dallo stato è lo stato stesso. È a questo proposito che Laplace parla di speranza morale, legata al valore relativo, osservando che tal speranza coinciderebbe con quella matematica solo in presenza di un capitale infinito. «Da questo si può giudicare quanto siano immorali quei giochi nei quali la somma sperata è inferiore a quel prodotto [il prodotto della somma sperata per la sua probabilità]. Essi sussistono grazie alle false giustificazioni ed alla cupidigia che fomentano, e che, spingendo il popolo a sacrificare ciò che gli è necessario a delle speranze chimeriche la cui inverosomiglianza non sa giudicare, sono la fonte di un’infinità di mali. » Il testo procede poi illustrando i metodi analitici del calcolo delle probabilità, tra le quali le funzioni generatrici che occupano l’intero primo capitolo della Teoria. A questo seguono le applicazioni ai giochi, ad alcune disuguaglianze. Trattando di quest’ultimo tema (nella terza edizione) si lascia trasportare da un impeto pacifista (ben lontano dal suo pensiero in epoca napoleonica): «Considerate i felici effetti delle istituzioni fondate sulla ragione e sui diritti naturali dell’uomo, presso i popoli che hanno saputo stabilirle e conservarle. Considerate ancora i vantaggi procurati dalla buona fede ai governi che ne hanno fatto il fondamento della loro condotta. Come sono stati ricompensati dei sacrifici che hanno dovuto affrontare per mantenere con scrupolosa esattezza i propri impegni! Quale immenso credito all’interno! Quale influenza all’estero! Pensate invece a quali abissi di sciagure siano stati spesso precipitati i popoli dall’ambizione e dalla perfidia dei loro capi. Ogni volta che una grande potenza, inebriata dal desiderio di conquista, aspira alla dominazione universale, il sentimento di indipendenza produce una coalizione tra le nazioni minacciate, di cui essa diventa quasi sempre la vittima.» La conclusione di questa poetica perorazione si conclude con l’affermazione che il buon governo interno ed esterno deve fare uso del calcolo delle probabilità. Sembra un invito platonico aggiornato a portare al governo i filosofi (del XIX secolo). 138 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo Continua applicando la probabilità al problema delle nascite, alla filosofia naturale, alle testimonianze, alle elezioni ed assemblee, alle sentenze dei tribunali, alle tavole di mortalità. Un capitolo è dedicato alle illusioni nella stima delle probabilità in cui si occupa ancora della ‘immoralità’ delle lotterie. Tra le illusioni cita pure la seGuido Grandi 1671 - 1742 ∞ rie di Grandi ∑ (− 1)k , con le parole k =0 «Calcolo tra le illusioni l’applicazione che Leibniz e Daniele Bernoulli hanno fatto del calcolo delle probabilità alla somma delle serie. Se si sviluppa la frazione il cui numeratore è l’unità e il cui denominatore è l’unità più una variabile, in una serie ordinata in rapporto alle potenze della variabile [cioè 1 = ∞ (− x )k ] è facile notare 1+ x ∑ k =0 che, supponendo la variabile uguale all’unità la frazione diventa ½, e la serie diventa più uno, meno uno, più uno, meno uno, ecc. Sommando i primi due termini, i due successivi, ecc. si trasforma la serie in un’altra in cui ogni termine è zero. Grandi, gesuita italiano, ne aveva concluso la possibilità della creazione, perché, essendo la successione sempre uguale a ½ , vedeva la frazione nascere da un’infinità di zero, cioè dal nulla. Allo stesso modo Leibniz credette di scorgere l’immagine della creazione nella sua aritmetica binaria, in cui egli non adoperava che i due caratteri zero e uno. Egli immaginò che l’unità potesse rappresentare Dio, lo zero il nulla, e che l’essere supremo avesse tratto dal nulla tutti gli esseri esistenti, come l’unità con lo zero esprime tutti i numeri in questo sistema d’aritmetica. L’idea piacque tanto a Leibniz che ne fece parte al gesuita Grimaldi, presidente del tribunale di matematica in Cina, nella speranza che questo simbolo della creazione convertisse al cristianesimo l’imperatore di allora, che amava in modo particolare le scienze. Ho riportato questo episodio per mostrare sino a qual punto i pregiudizi ricevuti dall’infanzia possano indurre in errore gli intelletti più profondi. Leibniz, suggestionato anche questa volta da una metafisica singolare e molto sottile, considerò che la serie più uno, meno uno, più uno, meno uno, ecc. diventa uno o zero a seconda che ci si fermi ad un numero di termini dispari o pari; e siccome nell’infinito non c’è nessun motivo per preferire il numero pari o quello dispari, si deve, secondo le regole della probabilità, prendere la metà dei risultati relativi a queste due specie di numeri, che sono zero e uno: si ottiene ½ per il valore della serie. Daniele Bernoulli ha esteso più tardi questo ragionamento alla somma delle serie formate da termini periodici…. Così la serie più uno, meno uno, più uno, meno uno, ecc. può nascere da frazione il cui numeratore è l’unità più una variabile e il denominatore è il numeratore stesso sommato al quadrato della variabile. Supponendo la variabile uguale all’unità lo sviluppo si tramuta nella serie proposta, e la frazione generatrice diventa uguale a 2/3; le regole della probabilità darebbero allora un falso risultato, è il che prova quanto sarebbe dannoso ricorrere a simili ragionamenti…» Il controesempio è assai interessante dal punto di vista matematico, infatti si può affrontare lo sviluppo della frazione data in più modi. Si può considerare come la somma di una serie geometrica di − x2 1+ x primo termine 1 e ragione in quanto: = 1+ x 1 + x + x2 k − x2 . Come serie ge= ∑ − x 2 k = 0 1 + x 1− 1+ x 1 ∞ ometrica la convergenza si ha quando la ragione, in valore assoluto, è minore di 1 e ciò comporta che x ≠ -1 e x2 < |1+x| e ciò comporta 1− 5 1+ 5 <x< , intervallo cui appartiene 1. In tale serie 2 2 quando x = 1, i coefficienti non assumono i valori più uno e meno uno quando si ponga la variabile uguale all’unità, caso in cui il termine generico diviene una potenza di ½ a segni alternati, quindi si tratta di una serie convergente a 2/3. Ma in questo modo la frazione data si sviluppa non come serie di potenze, bensì come serie di funzioni. 1+ x In altro modo si può scrivere 1 = ( 1 + x ) , quindi come somma di una progressione geometrica di primo 1 − (− x )(1 + x ) 1 + x + x2 139 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo termine 1+ x e ragione (-x)(1+x). Si ha allora converge se |-x(1+x)| < 1 e ciò avviene se 1+ x ∞ = ∑ (− x )k (1 + x )k +1 . In questo caso la serie 2 1+ x + x k =0 −1 − 5 −1+ 5 e in questo caso 1 non appartiene <x< 2 2 all’intervallo. Apparentemente abbiamo ancora una serie di funzioni, ma basta calcolare una somma parziale per rendersi conto che, a parte il modo in cui è scritta, si tratta di una serie di potenze. Si ha 5 infatti ∑ (− x )k (1 + x )k +1 = (1+x) – x(1+x)2 + x2(1+x)3 – x3(1+x)4 + x4(1+x)5 –x5(1+x)6 = 1+x – k =0 x(1+2x+x2) + x2(1+3x+3x2+x3) – x3(1+4x+6x2+4x3+x4) + x4(1+5x+10x2+10x3+5x4+x5) – x5(1+6x+15x2+20x3+15x4+6x5+x6) = 1 + (1-1)x + (-2+1)x2 + (-1+3-1)x3 + (3-4+1)x4 +(1-6+5-1)x5 + (-4+10-6+1)x6 + (-1+10-15+7-1)x7 + (5-20+21-8+1)x8 + (1-15+35-28+9-1)x9 + (-6+35-56+3610+1)x10+(-1+21-70+84-45+11-1)x11 = 1 + 0x - x2 +x3 + 0x4 – x5 + (6-5)x6 + (-6+6)x7 + (-15+14)x8 + (-14+15)x9 + (-6+6)x10 + (-1+0)x11 n +1 n +1− k con la convenzioPiù in generale il coefficiente di xn nella serie è dato da an = ∑ (− 1)k k =0 k ne che quando l’indice inferiore del coefficiente binomiale è maggiore dell’indice superiore, il coefficiente binomiale è 0. Quindi si ha che 1+ x ∞ ∞ = ∑ (− x )k (1 + x )k +1 = ∑ an x n . Si prova con un 2 1+ x + x k =0 n =0 po’ di pazienza che an = 1 se n ≡ 0 (mod. 3), an = 0 se n ≡ 1 (mod. 3) e an = -1 se n ≡ 2 (mod. 3). Di conseguenza anche questa serie per x = 1 si presenta come la serie di Grandi. Riprendendo l’analisi del testo, si trova che Laplace fornisce qualche criterio per “avvicinarsi alla certezza” e conclude il Saggio con un cenno storico sul calcolo delle probabilità. In esso prende le mosse dall’epistolario tra Pascal e Fermat, poi cita Huygens, Hudde, De Witt, Halley e Jacob Bernoulli ed altri della famiglia di Basilea. Passa poi a Montmort e Moivre (lui lo chiama così). Ricorda Stirling e Wallis. Fa poi un elenco ampio: Deparcieux, Kersseboom, Wargentin, Dupré de SaintMaure, Simpson, Sussmilch, Messène, Moheau, Price, Baily e Duvillard. Un posto rilevante è lasciato a Bayes ed al suo procedimento “sottile, ingegnosissimo, anche se un po’ ingarbugliato”. Rilievo dato anche a Lagrange, ma non cita altri italiani e, in questa parte nemmeno Buffon, né Condorcet e neppure D’Alembert. 4.1.8. La Teoria analitica (seconda parte). Lo stile della Teoria analitica è quello tipico e stringato dei saggi precedenti. Un traduttore inglese dell’opera del francese ebbe a dire «Whenever I meet in La Place with the words ‘Thus it plainly appears’ I am sure that hours, and perhaps days of hard study will alone enable me to discover how it plainly appears. » 140 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo Si ha spesso l’impressione che il richiamo alla ovvietà nasconda anche qualche difficoltà (almeno espositiva) di Laplace. Ci sono anche alcune affermazioni erronee, in alcuni casi si tratta di sviste tipografiche. Talvolta Laplace si esprime solo a parole ma risulta poi assai difficile intendere come tradurre le sue affermazioni in formule. L’autore dice che il trattato è diviso in due parti (o libri). Il primo riguarda le funzioni generatrici. Ma oltre ad una prima parte relativo al calcolo con tali funzioni, che è una ristampa di una memoria Mémoire sur les Suites del 1779; c’è poi un’ampia discussione relativi ai calcoli approssimati che vengono utilizzati nel calcolo delle probabilità. Di un certo interessa l’apprezzamento del potere espressivo del calcolo algebrico dopo Cartesio e Wallis. Cita poi l’intuizione di Leibniz di utilizzare in modo nuovo tale calcolo coi differenziali. Le funzioni generatrici che vengono qui studiate, hanno perso molto del loro interesse dopo l’approccio più vicino agli aspetti strutturali proposto da Boole. La parte che riguarda l’approssimazione dei calcoli è di fatto una ristampa della memoria Sur les approximations de Formules qui sont fonctions de très grands nombres del 1782. In questa parte mostra, per la prima volta nella letteratura, il calcolo di integrali abbastanza complessi. Tra essi 2 compare anche l’integrale della funzione e −t e di questo integrale offre diverse approssimazioni sia come serie che come frazioni continue. Passa in seguito allo studio di equazioni alle differenze finite e mostra che nel caso lineare è possibile usare integrali definiti. Nella parte terminale del primo libro si concentra sulle possibili approssimazioni di particolari ed in qualche caso trova soluzioni reali passando al campo complesso. Usa anche espressioni ‘polinomiali’ in cui gli esponenti sono negativi. Alcuni dei suoi risultati, affermati ma non dimostrati, saranno la ‘palestra’ di molti giovani matematici francesi che giungeranno a dimostrare le formule proposte da Laplace. Nel secondo libro, il primo breve capitolo tratta dei principi generali della teoria, con qualche esempio. Nella prima edizione del 1812 il chiarimento sulla posizione matematica e filosofica di Laplace era esplicitato in questa parte, ma l’aggiunta dell’ampia introduzione della seconda edizione ha reso quasi superfluo il capitolo. L’unico interesse consiste nel confrontare se ci sono discrepanze tra le due presentazioni. Sicuramente in questo capitolo il linguaggio è più asciutto e gli esempi sono trattati in modo sintetico. Anche temi importanti come la speranza, prendono poche righe. C’è però esplicitata quasi sempre la ‘traduzione’ in formule dei principi esposti a parole. Il testo passa poi a trattare singoli problemi e ad applicare ad essi i procedimenti analitici approntati. Al tema delle medie è riservato un capitolo a parte, che riprende risultati pubblicati in varie memorie, a partire da quella del 1774. In questo capitolo lo stile è oscuro ed è assai difficile seguire lo svolgimento proposto. Poisson, di fatto ha riscritto questa parte in uno stile più accessibile ed ha anche dimostrato alcuni risultati di Siméon Poisson 1781 - 1840 maggiore generalità. Il grande merito di Laplace è di avere ivi (ri)presentato il me- 141 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo todo dei minimi quadrati, dandone anche uno studio approfondito del tipo di approssimazione che esso permette e le sue generalizzazioni a più variabili (qualche studioso lo attribuisce però a Legendre). In complesso si ritrovano anche nella Teoria analitica gli stessi argomenti che sono stati introdotti ed elencati nell’analisi del Saggio filosofico, ma oltre alla spiegazione a parole, a volte assai ridotta, Laplace nella Teoria dà prova di grande abilità analitica. 4.2. L’impostazione logicista. L’approccio di Laplace trova molti sostenitori, soprattutto sul continente e viene ampliato ed approfondito, condividendo la proposta del matematico francese di trattare i problemi probabilistici in termini analitici e quantitativi. Nel 1854 Boole pubblica il suo trattato sulle leggi del pensiero, ma in esso una parte considerevole è legata alla probabilità, in cui l’approccio alla probabilità cambia notevolmente. Si inizia così una scuola di pensiero che segue e sviluppa la proposta booleana. Nel XIX secolo gli studiosi di probabilità che seguono questa nuova via sono quasi esclusivamente inglesi. 4.2.1. L’ambiente culturale inglese dell’inizio del XIX secolo. Per comprendere meglio l’opera di Boole e di altri matematici che operano nel Regno Unito, bisogna tenere conto della particolarità della cultura Inglese del periodo. Nasce nelle università inglesi più prestigiose un modo di intendere la matematica che piano piano si distacca dagli aspetti esclusivamente quantitativi, per approdare a risultaWilliam Rowan Hamilton 1805 - 1865 ti qualitativi e strutturali. Lo studio di quella che oggi all’università si chiama Algebra trova il suo fondamento nell’opera di giovani matematici inglesi che hanno posto attenzione sulle ‘forme’ e Arthur Cayley 1821 - 1895 che sono giunti anche ad individuare (William Rowan Hamilton) una struttura ‘numerica’ di corpo (campo non commutativo), provocando una sorta di scompiglio nelle idee costituite. Ad un altro inglese, Cayley si devono vari teoremi sui gruppi e le tavole che come le cosiddette tavole pitagoriche, rappresentano le operazioni dei gruppi, ma a differenza di quelle pitagoriche (ordinarie) sono ‘chiuse’. In questa situazione un’indagine come quella intrapresa da Boole sulle leggi del pensiero diviene accettabile anche se, partita con l’idea potesse dare risultati quantitativi, si scopre ben presto che non può rientrare in una aritmetica numerica, ma deve essere trattata con altri strumenti. Per 142 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo qualche pensatore, il risultato di Boole è il primo esempio di struttura matematica astratta. Intanto De Morgan presentava la sua complessa teoria dei sillogismi, ridotta a puntini e parentesi. Si assiste in questo modo ad un ampliamento sostanziale del concetto di matematica, da sempre vista come scienza dei numeri e delle figure, che diviene Augustus De Morgan 1806 - 1871 ora anche studio delle forme. Di fatto l’evoluzione del linguaggio algebrico aveva preparato il terreno, ma è proprio dal potere espressivo e dimostrativo delle formule che nasce la riflessione inglese che porta a Boole. 4.2.2. La definizione di probabilità secondo Boole. Il testo di An Investigation of the Laws of Thought, on which are founded the mathematical Theory of Logic and Probabilities, disponibile in rete web, è quello della prima edizione del 1854. L’opera consta di una prefazione ed indice di 7 pagine numerate alla romana, poi 424 pagine, seguito da una pagina di note ed una di errata. I capitoli dallo XVI allo XXII riguardano le probabilità e le loro applicazioni. Però già nel primo capitolo, una sorta di introduzione generale all’opera, viene affrontato il problema della probabilità. «13. The measure of the probability of an event is usually defined as a fraction, of which the numerator represents the number of cases favourable to the event, and the denominator the whole number of cases favourable and unfavourable; all cases being supposed equally likely to happen. That definition is adopted in the present work. At the same time it is shown that there is another aspect of the subject (shortly to be referred to) which might equally be regarded as fundamental, and which would actually lead to the same system of methods and conclusions. It may be added, that so far as the received conclusions of the theory of Probabilities extend, and so far as they are consequences of its fundamental definitions, they do not differ from the results (supposed to be equally correct in inference) of the method of this work. Again although questions in the theory of Probabilities present themselves under various aspects, and may be variously modified by algebraical and other conditions, there seems to be one general type to which all such questions, or so much of each of them as truly belongs to the theory of Probabilities may be referred. Consider with reference to the data and the quæsitum, that type may be described as follows: -1st The data are the probabilities of one or more given events, each probability being either that of the absolute fulfilment of the event to which it relates, or the probability of its fulfilment under the given supposed conditions. 2ndly. The quæsitum, or object sought, is the probability of the fulfilment, absolutely or conditionally, of some other event differing in expression from those in the data, but more or less involving the same elements. As concerns the data, they are either causally given, - as when the probability of a particular throw of a die is deduced from a knowledge of the constitution of the piece, - or they are derived from observation of repeated instances of the success or failure of events. In the latter case the probability of an event may be defined as the limit toward which the ratio of the favourable to the whole of number observed cases approaches (the uniformity of nature being presupposed) as observations are indefinitely continued. Lastly, as concerns the nature or relation of the event in question, an important distinction remains. Those events are either simple or compound. By a compound event is meant one of which the expression in language, or conception in thought, depends upon the expression or the conception of other events, which, in relation to it, may be regarded as simple events. To say “it rains”, or to say “it thunders”, is to express the occurrence of a simple event; but to say “it rains and thunders”, or to say “it either rains or thunders”, is to express that of a compound events. For the expression of that event depends upon elementary expressions, “it rains”, “it thunders”. The criterion of simple events is not, therefore, any supposed simplicity in their nature. It is founded solely on the mode of their expression in language or conceptions in thought. » Il brano è ricco di interesse. Boole inizia presentando l’approccio classico che si ritrova, ad esempio in Laplace nel Saggio, dicendo che la fa propria. Ma avverte che c’è un altro aspetto fondamentale che può portare alle stesse conclusioni e che è più in sintonia con metodi del suo trattato, il cui argomento è dato dalle leggi del pensiero. Accetta che si possano approfondire le questioni legate alle 143 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo probabilità mediante vari approcci ed anche considera gli aspetti algebrici che intervengono per argomentare sul tema, ma afferma l’esistenza di un tipo generale cui si riferiscono tutte le questioni relative alla probabilità. Distingue tra i dati assegnati e ciò che si deve trovare. Tra i dati comprende le probabilità di uno o più eventi, che poi chiamerà semplici, essendo tali probabilità o la certezza del risultato o la certezze data in certe ipotesi o condizioni. L’oggetto ricercato è la probabilità assoluta o condizionale (e compare qui esplicitamente la nozione di probabilità condizionale) di qualche altro evento. L’approccio logicista a questo punto si rivela appieno: l’evento di cui si deve trovare la probabilità, si presenta con una espressione diversa da quella dei dati. Sulla probabilità degli eventi semplici propone che questi siano o dati come conseguenza causale della situazione ( fa l’esempio della costituzione fisica del dado – approccio deterministico) oppure ricavati a posteriori come limite della frequenza (approccio frequentista). Ma una volta assegnata tale valutazione di probabilità sugli eventi semplici, interviene il linguaggio o la concettualizzazione che opera sulle espressioni linguistiche con cui dagli eventi semplici si costruiscono quelli composti. Anche per riconoscere la ‘semplicità’ degli eventi ci si basa sul modo di esprimere l’evento. Questo aspetto linguistico è del tutto innovativo. L’argomento della probabilità si ripresenta (anzi diviene il tema principale) dal capitolo XVI in poi. Si riporta l’incipit del capitolo XVI: «1. Before the expiration of another year just two centuries will have rolled away since Pascal solved the first known question in the theory of Probabilities, and laid, in its solution, the foundation of a science possessing no common share of the attraction which belongs to the more abstract of mathematical speculations. The problem which the Chevalier de Méré, a reputed gamester proposed to the recluse of Port Royal (not yet withdrawn from the interest of science by the more distracting contemplation of the “greatness and the misery of man”) was the first of a long series of problems destined to call into existence new methods in mathematical analysis, and to render valuable service in the practical concern of life. Nor does the interest of the subject centre merely in its mathematical connexion, or its association of utility. The attention is repaid which is devoted to the theory of Probabilities as an independent object of speculation, - to the fundamental modes in which it has been conceived, - to the great secondary principles which, as in the contemporaneous science of Mechanics, have gradually been annexed to it, - and, lastly, to the estimate of the measure of perfection which has been actually attained. I speak here of that perfection which consists in unity of conception and harmony of processes. Some of these points it is designed very briefly to consider in the present chapter.» Per introdurre la probabilità Boole assume una definizione data da Poisson nella Recherche sur la Probabilité des Jugements, in base alla quale la probabilità di un evento è la ragione che noi abbia- mo di credere che esso abbia avuto luogo, o che esso avrà luogo. La misura della probabilità di un evento è il rapporto del numero di casi favorevoli all’evento, rispetto al numero totale di casi favorevoli o contrari, e tutti ugualmente possibili (uguale possibilità di avere luogo). La definizione classica è però letta da Boole in un modo diverso: «From these definitions in follows that the word probability, in its mathematical acceptation, has reference to the state of our knowledge of the circumstances under which an event may happen or fail. With the degree of information which we possess concerning the circumstances of a event, the reason we have to think that it will occur, or, to use a single term, our expectation of it, will vary. Probability is expectation founded upon partial knowl- 144 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo edge. A perfect acquaintance with all the circumstances affecting the occurrence of an event would change expectation into certainty, and leave neither room nor demand for a theory of probability. » In questo brano è posto l’accento sugli aspetti soggettivi della probabilità, in quanto trova connessioni tra la probabilità e lo stato di conoscenza personale “our knowledge”. Distingue tra probabilità ed aspettativa in quanto ritiene che l’aspettativa in condizioni di completa conoscenza coincide con la certezza, ma fa assumere alla probabilità il ruolo di connessione tra aspettativa e conoscenza incompleta. La scelta soggettivista ha però dei costi che Boole è attento ad indicare, offrendo poi una proposta di soluzione: «Though our expectation of an event grows stronger with the increase of the ratio of the number of the known cases favourable to its occurrence to the whole number of equally possible cases, favourable or unfavourable, it would be unphilosophical to affirm that the strength of that expectation, viewed as an emotion of the mind, is capable of being referred to any numerical standard. The man of sanguine temperament builds high hopes where the timid despair, and the irresolute are lost in doubt. As subject of scientific inquiry, there is some analogy between opinion and sensation. The thermometer and the carefully prepared photographic plate indicated, not the intensity of the sensations of heat and light, but certain physical circumstances which accompany the production of those sensations. So also the theory of probabilities contemplates the numerical measure of the circumstances upon which expectation is founded; and this object embraces the whole range of its legitimate applications.» Si accetta, quindi, l’aspetto quantitativo della probabilità. Dopo alcuni esempi, illustra i tipi di conoscenza che intervengono nella determinazione della probabilità sono di due tipi: la conoscenza delle cause che ne provocano l’avverarsi (approcci causale), oppure l’osservazione delle serie storiche (approccio frequentista) . Ma l’attenzione di Boole si focalizza su la natura degli eventi: «Now in the most general, yet strict meaning of the term “event”, every combination of events constitutes also an event. The simultaneous occurrence of two or more events, or the occurrence of an event under given conditions, or in any conceivable connexion with other events, is still an event. Using the term in this liberty of application, the object of the theory of probabilities might be thus defined. Given the probabilities of any events, of whatever kind, to find the probability of some other event connected with them. » In questo brano Boole pone le fondamenta di quello che sarà l’approccio assiomatico di Kolmogorov. Una volta stabilita la distribuzione di probabilità su certi eventi, il calcolo delle probabilità si svolge in modo uniforme sugli eventi ottenuti da quelli dati in partenza seguendo opportune regole. Non si tratta, quindi, di affrontare ogni volta ciascun singolo problema con un metodo specifico adatto al problema, Andrey Kolmogorov 1903 - 1987 ma di trovare forme generali cui riferirsi. L’approccio del nostro autore è completamente in accordo con la nuova tradizione matematica inglese . L’esempio offerto è quello del dado in cui i dati noti sono che la probabilità del primo evento: ‘esce 1 al primo lancio’ e la probabilità del secondo evento: ‘esce 1 al secondo lancio’ sono entrambe uguali a 1/6. L’evento composto di cui si vuole determinare la probabilità è allora dato da ‘esce uno al primo lancio e non esce uno al secondo lancio, oppure non esce uno al primo lancio ed esce uno al secondo lancio’. L’evento composto afferma essere «a certain disjunctive combination of the simple events involved or implied in the data.» In questo caso, come in molti problemi relativi a giochi d’azzardo e che, a suo dire, hanno ricevuto una immeritata attenzione, si possono individuare gli eventi semplici, le cui probabilità possono essere note a priori. In altri problemi originati da osservazioni di fatti 145 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo naturali o sociali è assai difficile individuare gli eventi (veramente) semplici che entrano a comporre un evento complesso. L’individuazione di un qualche metodo generale risulta non solo essenziale per lo sviluppo perfetto della teoria delle probabilità, ma forse necessario per le applicazioni ad ampie classi di indagini pratiche. Prima di continuare, però gli preme mettere in luce il punto fondamentale del suo approccio: «… to notice that there is another form under which all questions in the theory of probabilities may be viewed; and this form consists in substituting for events the propositions which assert that those events have occurred, or will occur; and viewing the element of numerical probability as having reference to the truth of those propositions, not to occurrence of the events concerning which they make assertion. Thus, instead of considering the numerical fraction p as expressing the probability of the truth of the occurrence of an event E, let it be viewed as representing the probability of the truth of the proposition X, which asserts that the event E will occur. Similarly, instead of any probability, q, being considered as referring to some compound event, such as the concurrence of the events E and F, let it represent the probability of the truth of the proposition which asserts that E and F will jointly occur; and in like manner, let the transformation be made from disjunctive and hypothetical combinations to disjunctive and conditional propositions, Though the new application thus assigned to probability is a necessary concomitant of the old one, its adoption will be attended with a practical advantage drawn from circumstances that we have already discussed the theory of propositions, have defined their principal varieties, and established methods for determining, in every case the amount and the character of their mutual dependence.» Boole, con la proposta di sostituire le proposizioni agli eventi è in grado di fare due cose: la prima è che anche per gli eventi semplici c’è un modo per valutarne la probabilità a priori sulla base della loro verità; la seconda è che una volta assegnata la probabilità agli eventi semplici, o meglio individuata in quali casi c’è la verità per le proposizioni che li descrivono, la determinazione delle probabilità degli eventi composti segue in modo sorprendente la determinazione della verità per le proposizioni che vengono composte con i connettivi come spiegato nella prima parte del testo. Quindi offre un procedimento a priori, legato alla sua analisi della logica. Nel capitolo XVII, dopo avere spiegato il suo approccio alla probabilità propone quello che lui chiama un “metodo generale per risolvere i problemi nella teoria della probabilità”. Per esporre il metodo si richiama ai principi che Laplace ha posto nel Saggio, ma li riformula ed interpreta a modo suo: «I. When it is certain that an event will occur, the probability of that event, in the above mathematical sense, is 1. For the cases which are favourable to the event, and the cases which are possible, are in this instance the same. Hence, also, if p be the probability that an event x will happen, 1-p will be the probability that the said event will not happen. II. The probability of the concurrence of any two events is the product of the probability of either of those event by the probability that if that event occur, the other will occur also. III. The probability that if an event x occur, the event y will, is a fraction whose numerator is the probability of their joint occurrence, and denominator the probability of the occurrence of the event x. IV. The probability of the occurrence of some one of a series of exclusive events is equal to the sum of their separate probabilities» Lasciamo al lettore il confronto con i princìpi di Laplace. Nel IV principio, l’uso del termine “serie” potrebbe fare pensare alla σ-addittività. Poi dagli esempi risulta chiaro che sta trattando il caso finito. A questi, che qui riportiamo in forma stringata, fa seguire, in genere, qualche esempio e spiegazione. Passa alla definizione di eventi indipendenti usando quella proposta da Bayes. Come visto in 146 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo quel caso, la definizione sembra privilegiare l’uno sull’altro e per comprendere che i ruoli si possano scambiare è indispensabile il teorema di Bayes. Poi fornisce come principio quello che in altri contesti si usa come definizione: «V. The probability of the concurrence of two independent events is equal to the product of the separate probabilities of those events.» Avverte che c’è un altro principio, ma prima di introdurlo vuole presentare alcune osservazioni. Intanto ribadisce la necessità di distinguere tra eventi semplici ed eventi composti. Il problema che pone è che frasi semplici come “essere in salute” potrebbe essere il risultato di una molteplicità di eventi. Per districarsi da questa complessa situazione propone di assumere come eventi semplici quelli che, in base all’uso del linguaggio consueto, sono espressi mediante un solo verbo cioè mediante quello che in grammatica viene detto una frase semplice, anche se con questo non si intende attribuire semplicità agli eventi in sé, ma eventi semplici saranno detti quelli che vengono descritti come frasi semplici in termini grammaticali. Questa osservazione pone Boole in una direzione completamente innovativa nell’ambito della probabilità: la sostituzione del concetto non chiaro e non chiarito di ‘evento’ (semplice) con quello linguistico di frase (semplice) universalmente inteso. Allora l’essere un evento semplice o composto non riguarda più la natura del fatto o del fenomeno, ma si riferisce alla sua descrizione verbale. Però Boole non ritiene sufficiente questa opzione linguistica per decidere della dipendenza o indipendenza di due eventi. Cerca di risolvere il problema, chiamando a giustificazione la conoscenza e l’informazione, cosa che non deve stupire data l’attenzione alle leggi del pensiero, ma il suo tentativo è quello di ragionare mediante la logica e non con la probabilità «If my knowledge of two simple events is confined to this particular fact, viz., that the probability of the occurrence of one of them is p, and that of the other q; then I regard the events as independent, and thereupon affirm that the probability of their joint occurrence is pq. But the ground of this affirmation in not that the events are simple ones, but that the data afford no information whatever concerning any connexion or dependence between them. When the probabilities of events are given, but all information respecting their dependence withheld, the mind regards them as independent. And this mode of thought is equally correct whether the events, judged according to actual expression, are simple or compound, i.e., whether each of them is expressed by a single verb or by a combination of verbs…. We must regard the events as independent of any connexion beside that of which we have information, deeming it of no consequence whether such information has been explicitly conveyed to us in the data, or thence deduced by logical inference .» Sulla base di queste scelte formula il successivo principio: «VI. The events whose probabilities are given are to be regarded as independent of any connexion but such as is either expressed, or necessarily implied, in the data; and the mode in which our knowledge of that connexion is to be employed is independent of the nature of the source from which such knowledge has been derived. » Come si può apprezzare, la proposta di Boole si distacca sempre di più da quella classicodeterministica di Laplace. In questo modo, prescindendo dalla natura degli eventi, una volta che sia assegnata ad essi una probabilità, il calcolo delle probabilità diventa una applicazione del calcolo logico, che Boole ha pre- 147 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo sentato nei capitoli precedenti. La soluzione dei problemi così è ricondotta ai puri strumenti logici come quelli visti in 1.1.6, con l’uso dei costituenti. Tutto ciò perché si è posta attenzione non tanto all’evento come fatto, ma all’evento come descritto da una frase. A questo punto il nostro presenta una tavola di ‘conversione’ « EVENTS xy x(1-y) (1-x)y (1-x)(1-y) Concurrence of x and y Occurrence of x without y Occurrence of y without x Conjoint failure of x and y PROBABILITIES pq p(1-q) (1-p)q (1-p)(1-q) » In questa tabella si può vedere una sorta di primo tentativo di tavola di verità, basata sui ‘costituenti’. Da questo momento propone e dimostra alcune proposizioni che, a parte la ‘verniciatura’ probabilistica riguardano proprietà logiche. Ad esempio propone che il risultato di una situazione di eventi composti si possa descrivere e valutare come per determinare la probabilità di un evento composto conoscendo le probabilità dei componenti. Come si vede introduce simboli e scritture che anche sul versante solo logico hanno dato molto filo da torcere ai commentatori di Boole. Queste ‘oscurità’ non hanno giovato alla proposta logicista che è rimasta poco seguita, anche se in essa si colgono i prodromi della sistemazione assiomatica. 4.2.3. Altri logicisti. 4 La opzione logicista è nel XIX secolo quasi una prerogativa degli studiosi inglesi. Tra questi vale la pena di ricordare Jevons che, per altro, si era occuFrancis-Herbert Bradley 1846 - 1924 pato con successo di ‘ripulire’ certe parti dell’opera di Boole. Di maggior rilievo è il trattato The principles of Logic (1883) di Bradley. La scelta logicista di questo autore è il William Jevons 1835 - 1882 risultato di una critica puntuale delle debolezze degli altri approcci alla probabilità, in particolare le opzioni soggettiviste e frequentiste (di cui si dirà in un prossimo paragrafo). Per Bradley i soggettivisti confondono le credenze dell’individuo con la probabilità, ma osserva che tali credenze possono variare nel tempo, ed allora verrebbe completamente a mancare un carattere tipico di una scienza, la 4 Per questa e la successiva parte mi avvalgo abbondantemente di Costantini (1970). 148 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo sua oggettività ed invarianza nel tempo. Se quindi le credenze si situano in un ambito psicologico soggettivo, la probabilità dovrebbe individuare rapporti ‘stabili’ su ipotesi e fatti. Lo sviluppo della Matematica all’epoca in cui Bradley pubblicava The principles of logic, aveva completamente mutato il volto ed i contenuti della disciplina, facendone una scienza assai diversa da quanto si riteneva all’inizio del XIX secolo. Ora erano possibili diverse ‘opzioni’ anche per affrontare argomenti con una lunga ed apparentemente invariata tradizione come la Geometria. L’autore è pertanto conscio che non si può più considerare una unica ‘verità’ matematica, ma bisogna piuttosto evidenziare la natura ipotetico-deduttiva. Pertanto ogni tipo di inferenza prende le mosse da ipotesi e questo, di fatto, è visto dall’autore come l’indebolimento della struttura della probabilità soggettiva, che diventerebbe, piuttosto, una probabilità ‘ipotetica’. Quindi la probabilità ha sì un carattere di soggettività, nella scelta delle ipotesi, che possono essere suggerite dai più svariati motivi e credenze, ma poi diviene completamente oggettiva in quanto relazione logica generata dalle descrizioni verbali degli eventi. Per quanto riguarda l’approccio frequentista, anche se ritiene che l’impostazione di questa interpretazione sia in parte corretta, si basa, purtroppo sull’accettazione dell’infinito, indispensabile per potere parlare di andamento asintotico. L’uso delle serie risulta così solo un artificio ideale che poco impatto ha sul mondo reale nel quale non è possibile eseguire gli infiniti ‘esperimenti’ che sono richiesti dalla nozione di limite. All’obiezione che di fatto basta poter replicare l’esperimento un numero sufficientemente grande, ma finito, di volte, Bradley osserva che se ci si limitasse a questo, che comunque rischia di essere solo un esperimento ideale, non si può avere a certezza che la frequenza relativa si stabilizzi ‘definitivamente’ su di un unico valore da assumere come probabilità. Boole aveva accettato che le probabilità iniziali (degli eventi semplici) potessero essere determinate in vari modi, dato che la sua attenzione si era accentrata sulla gestione ‘successiva’ del calcolo degli eventi composti. Bradley avendo criticato gli approcci dei soggettivisti e dei frequentisti non ha altre strade per definire la probabilità di tali eventi se non sulla base di un principio a priori e per questo non può che fare riferimento al cosiddetto principio di indifferenza (ovvero ad una forma del principio di ragione sufficiente). Si rende ben presto conto che questa posizione è a sua volta debole, ed è il primo che la contesta ritenendola insoddisfacente. Si limita allora a consigliare l’uso del principio di indifferenza solo nei casi ‘conclamati’ in cui gli eventi elementari siano mutuamente esclusivi ed esaustivi, senza però fidarsi delle ‘apparenze’. 149 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo 4.3. Le critiche alla versione classica della probabilità e le proposte alternative. La reputazione di Laplace come matematico ed i risultati analitici da lui ottenuti non furono un sufficiente ‘baluardo’ contro le critiche che vennero avanzate nella seconda metà del XIX secolo da vari pensatori, all’approccio ‘classico’ e deterministico alla probabilità incarnato dal francese. Si assiste in tale periodo ad un generale tentativo di approfondimento delle basi della matematica e il calcolo delle probabilità non è esente da questa attenzione critica. In realtà la necessità di una ‘sistemazione’ si intravede già dal Cours d’Analyse di Cauchy il cui scopo era di porre ordine e dare saldi fondamenti all’Analisi. Ma anche gli altri rami della nostra disciplina non evitano di sottoporsi ad un esame attento. Più o meno contemporaneamente all’opera di Cauchy, infatti, Agustin Louis Cauchy 1789 - 1857 inizia la rivoluzione non-euclidea. In un intorno stretto degli anni di pubblicazione dell’opera principale di Boole, veniva formalizzata la geometria proiettiva. La fisica matematica si poneva il problema dell’esistenza dell’etere e delle equazioni di campo. Il processo di revisione dei concetti fondamentali portava ad una crisi dei fondamenti, tra fine secolo ed inizio del successivo ma anche per quanto riguarda la probabilità, prendevano corpo approcci diversi che tentavano di colmare le lacune lasciate dalla presentazione ‘classica’. La novità del soggetto di cui stiamo parlando in questi appunti, fece sì che l’elaborazione avvenuta nella seconda metà dell’Ottocento non sia paragonabile a quella che si è avuta sull’impianto degli argomenti più tradizionali della matematica, coi loro 2.000 - 3.000 anni di storia. Per questo la disputa (se si vuole, la crisi) si è mantenuta ‘vivace’ anche nel XX secolo e, di fatto, ha portato alla formazione di scuole di pensiero da cui si sono separate calcolo della probabilità e statistica. Anche se sono in atto tentativi di unificazione, ad esempio mediante il (meta-)concetto di modello matematico, non si può dire che questi siano giunti ad uno stadio soddisfacente. Sui vari modi di intendere la probabilità, quindi non c’è finora un unico punto di vista, tuttavia le critiche che una corrente rivolge ai punti fondamentali di una corrente diversa hanno avuto lo scopo e l’effetto di approfondire l’analisi degli scopi e dei metodi di pensiero che trovano spazio nei vari approcci. 4.3.1. L’approccio frequentista nel XIX secolo. Le basi dell’approccio classico alla probabilità possono riconoscersi nella equipossibilità e quindi nella misura della possibilità, nonché sul principio di indifferenza. Questi aspetti vengono messi in luce da alcuni studiosi, già nella prima metà del Antoine Cournot 1801 - 1877 XIX secolo. In particolare si può citare Cournot (Exposition de la théorie des 150 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo chances et de probabilités, 1843, disponibile in rete web). In essa si esprime in questo modo: «Le spiegazioni che ho dato a più riprese sulla indipendenza e sulla solidarietà delle cause, sul doppio significato della parola probabilità, che talora si riferisce ad una certa misura delle nostre conoscenze e talora ad una misura della possibilità delle cose, indipendentemente dalle conoscenze che abbiamo: queste spiegazioni, io dico, mi sembrano opportune per risolvere le difficoltà che hanno reso fino ad oggi sospetta a dei buoni spiriti tutta la teoria della probabilità. [In questo testo] si troveranno definizioni, idee che credo nuove o che, almeno, non sono state chiaramente percepite. Esse mi hanno condotto ad adottare la dottrina delle probabilità a posteriori, e la maggiore parte delle applicazioni che si riferiscono ad essa, in modo completamente diverso da quello che hanno fatto altri uomini giustamente celebri. » Contemporaneamente in Gran Bretagna R.L. Ellis pubblicava On the foundation of the theory of probability, 1843,disponibile in rete web, muovendosi su posizioni analoghe. Di quest’ultimo è in- teressante l’affermazione: «Are we prepared to admit that our confidence in the regularity of nature is merely a corollary from Bernouilli’s theorem?» Lo sviluppo più maturo di questo approccio si ha nell’opera di Venn, The logic of chance, apparsa nel 1866 come prima edizione (disponibile in rete web), affronta questi due caposaldi della proposta di Laplace. Il testo è di 370 pagine, preceduto da 28 pagine tra prefazione, indice ed una pagina di errata. Nella prefazione fa un ‘triste’ quadro della probabilità nell’ambito generale delle scienze. Infatti rileva che solo uno sparuto manipolo di studenti si è dedicato con grande assiduità a coltivare l’argomento e seppure i risultati che hanno ottenuto siano riconosciuti tra i più straordinari prodotti del genio matematico, la reputazione di questi giovani e dell’argomento da parte delle persone colte viene vista con sufficienza, con indifferenza, se non addirittura, con sospetto. Eppure sull’argomento dovrebbe stendersi l’ombra di Laplace di Poisson a garantirne la scientificità. Ma Venn commenta: «Any subject which has been discussed by such men as Laplace and Poisson, and on which they have exhausted all their powers of analysis, could not fail to be profoundly treated, so far as it fell within their province. But from this province the real principles of the science have generally been excluded, or so meagrely discussed that they had better have been omitted altogether. Treating the subjects as mathematicians such writers have naturally taken it up at the point where their mathematics would best come into play, and of course has not been at foundations. In the works of most writers upon the subject we should search in vain for anything like a critical discussion of the fundamental principles upon which its rules rest, the class of inquiries to which it is most properly applicable, or the relation it bears to Logic and the general rules of inductive evidence. Even in the essay of Laplace, a work commonly regarded as the principal philosophical text-book on the subject, the definition as the outset includes the very conception of Probability which it undertakes to explain. In the hands of less systematic writers, especially amongst who have treated the subject in a popular way, such confusion becomes far more serious.» La posizione di Venn è chiara: il calcolo delle probabilità ‘classico’ non è sorto sulla base di princìpi scelti ed approfonditi, ma al contrario i princìpi sono stati modellati sulle esigenze degli strumenti analitici che si volevano applicare. A riprova di questa situazione il fatto che in autori meno abili dal punto di vista matematico, i principi fondamentali invece di risaltare sono occasione di confusione in quanto manca loro una chiarezza intrinseca. Di qui, a causa della vaghezza e delle incertezze che sembrano affliggere l’argomento, si incontra in libri diversi e talora sullo stesso libro di un autore, che la probabilità è una proprietà della mente, l’intensità di una credenza che ci viene sugge- 151 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo rita da una proposizione, qualche altra volta un che di esterno a noi che misura questa intensità, talvolta appare come un numero astratto, cioè come una frazione numerica. Ma tutto ciò denota una carenza filosofica di fondo che rende il soggetto difficile da essere posto alla base di una scienza. Tutto ciò, per Venn, ha introdotto confusione e perplessità nelle applicazioni che paiono importanti alle istituzioni politiche e sociali. Osserva inoltre che gli esempi su cui si basa l’approccio classico sono troppo specifici ed appena i princìpi li si pone in confronto con le situazioni reali, diventano o di scarsa utilità o di difficile applicabilità. In questa critica viene presa anche di mira la proposta di Boole riconoscibile nel ‘un che di esterno a noi che misura questa intensità’. Nel primo capitolo Venn dichiara che non è facile dare all’inizio la definizione di una scienza di cui si vuole trattare. Questo avviene anche per altre scienze naturali, le quali, però possono avere un aiuto dal fatto di avere per oggetti cose reali e anche se la definizione precisa non viene subito fornita, la conoscenza degli oggetti aiuta comprendere dove andare a parare. «But when a science is concerned, not so much with objects directly as with processes and laws, or when it takes for the subject of its enquiry some comparatively obscure feature drawn from phenomena which have little or nothing else in common, the difficulty of giving preliminary information becomes greater.» Il brano giustifica in questo modo il fatto che lo studio della probabilità possa essere ritenuto a buon diritto specifico della matematica, dato che nella accezione inglese, il ruolo della nostra scienza era proprio quello di occuparsi dei processi e delle leggi. Per quanto poi riguarda più specificamente la probabilità, Venn formula la seguente opinione: «Here then we have a class of objects as to individuals of which we feel quite in uncertainty, whilst as we embrace larger numbers in our assertion we attach greater weight to our inference. It is with such classes of objects and such inferences that the science of Probability is concerned. ... In these class of things, which are those with which Probability is concerned, the fundamental conception which the reader has to fix in his mind as clearly as possible, is, I take it, that of a series. But it is a series of a peculiar kind, one of which I can see non better compendious description that that which is given by the statement that it combines individual irregularity with aggregate regularity. » Per chiarire il suo concetto di probabilità considera la frase “alcune mucche non allattano i loro piccoli”. Questa proposizione presenta una situazione indefinita o come afferma la teoria del sillogismo, una proposizione particolare (negativa) ed in essa non si riesce a riconoscere il ruolo e la presenza di una serie. La proposizione contiene solo un’affermazione relativa ad una certa porzione del tutto (la totalità delle mucche). Ma non è con queste proposizioni indefinite che noi dobbiamo trattare. Al contrario si consideri l’affermazione formulata con l’ausilio di carattere numerico, in tal caso risulta difficile escludere la nozione di serie. Qual è, ad esempio, il significato dell’affermazione che una mucca su dieci non allatta il suo piccolo? Sicuramente non ci possiamo aspettare che data una mandria di venti mucche esattamente due di esse non allattino, perché, qualunque sia il puro significato delle parole ciò non è l’aspetto importante dell’affermazione. Piuttosto la frase riguarda 152 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo l’esame un gran numero di mucche e se all’inizio dell’esame la proporzione numerica non sembra corretta, a lungo andare diviene precisa. Questo semplice esempio, oltre a spiegare cosa intenda Venn per serie, ha grande forza di convincimento. In questo modo la frequenza diviene o contribuisce alla probabilità. Questo approccio, da una parte, si oppone all’idea che la probabilità sia un grado di credenza (contro le affermazioni dei soggettivisti) perché non è possibile misurare il grado di credenza dell’affermazione “qualche mucca non allatta il proprio piccolo”. Ma anche qualora fosse possibile individuare mediante un sondaggio individuare in un qualche modo una media di stime basandosi sulle risposte ottenute, questo valore non rappresenterebbe la ‘frazione della certezza’ come vorrebbe l’approccio soggettivista e questo potrebbe essere verificato solo mediante un’indagine su un campione molto numeroso di mucche, quindi, comunque, passando attraverso la frequenza. Tuttavia, in certi casi ben delimitati, è possibile incontrare gradi di certezza e la possibilità di ‘misurarli’ con una scala adeguata. Venn fa l’esempio del lancio della moneta. In questo caso è credenza comune che ½ misuri la credenza della uscita di ‘testa’, pur essendo questo grado di credenza sempre smentito in ogni lancio, dato che o si ottiene ‘testa’, quindi 1, o si ottiene ‘croce’, quindi 0. Come fare allora a giustificare il valore ½. La risposta è semplice, si tratta di un’esperienza ripetuta molte volte, quindi anche in questo caso si è passati attraverso la frequenza. Cosa fare se l’evento, per sua natura, non ammetta una ripetibilità su cui costruire una “serie”? In tali casi, che per Venn sono assai rari, l’unica possibilità è agire come se i propri gradi di credenza fossero quelli giusti, perché è un atteggiamento che se non favorisce il ‘guadagno’, almeno limita le ‘perdite’. Lo scoglio allora ed oggi, contro cui l’approccio frequentista mostra i suoi limiti è quello dei cosiddetti eventi singolari. La risposta di Venn è quella che in tali casi si può cercare di affrontare il problema con l’approccio soggettivista illustrato (e criticato) sopra. Conclude che si tratta di un modo impreciso di procedere, ma che risulta essere l’unico disponibile. 4.3.2. I soggettivisti. Come si è visto, nonostante le critiche metodologiche che Venn premette all’approccio soggettivista, nella fase di determinazione della probabilità degli eventi elementari per cui non sia possibile la ripetitività, anche se a malincuore, si è costretti a ricorrere al grado di fiducia. Però ben presta si preoccupa di rimarcare la diversità tra probabilità (dato sperimentale) e grado di credenza che ha, per sua stessa natura, un valore soggettivo e che può essere usato come ‘temporaneo supporto’ alla teoria della probabilità . Vent’anni prima di Venn, de Morgan aveva presentato un testo importante anche per altri aspetti: Formal logic: or the calculus of inference necessary and probable, 1847 (disponibile in rete web). 153 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo È una delle prime volte, se non la prima, in cui si utilizza l’aggettivo ‘formale’ riferito alla logica. Il testo illustra in grande dettaglio la versione di De Morgan dei sillogismi categorici. Importante un’appendice in cui l’autore presenta il suo punto di vista in una polemica epistolare con Sir William Hamilton, quasi omonimo del matematico, ma di professione filosofo. Questa polemica sarà ricordata da Boole come la causa ispiratrice del suo lavoro innovativo sulla logica. Il nono capitolo del trattato è sulla probabilità ed in esso leggiamo: William Stirling Hamilton 1788 - 1856 «The object of this chapter is the consideration of the degrees of knowledge itself. That which we know, of which we are certain, of which we are well assured nothing could persuade us to contrary, is the existence of our own minds, thoughts, and perceptions, the two last when actually present. This highest knowledge, this absolute certainty, admits of no imagination of possibility of falsehood. We cannot, by stopping to consider, make ourselves more sure that we are already, that we exists, think, see, &c. Next to this, come the things of which we cannot but say at last, we are as certain of them as of our own existence; but of which, nevertheless we are obliged to say that we arrive at them by process, by reflections. These we call necessary truths. …There is no further use in drawing distinction between the knowledge which we have of our existence, and that of two and two amounting to four. This absolute and inassailable feeling we shall call certainty. We have lower grades of knowledge , which we usually call degrees of beliefs, but they are really degree of knowledge…. By degree of probability we really mean, or ought to mean, degree of belief. » De Morgan sposta quindi l’attenzione dalla credenza che ha connotati troppo personali e talvolta irrazionali, alla conoscenza che è più ‘oggettiva’, restando soggettivo quale livello di conoscenza l’individuo abbia raggiunto. «According to common idiom, belief is often a lower degree of knowledge: but it is imperative upon us to drop all the quantitative distinction of common life, or rather to remodel them, when we come to the constructions of a science of quantity» Mantenendo però la dizione ‘grado di credenza’ giunge a dire che si identificano grado di credenza e probabilità. In questo brano, però c’è anche che del grado di credenza si può dare una valutazione esprimibile quantitativamente. Quindi anche se la credenza è il risultato di conoscenze (più o meno complete) e sensazioni, su di essa si può costruire una teorizzazione. Si può dire che più che una esposizione organica sia l’approccio di De Morgan, sia di altri, le posizioni del soggettivisti del XIX secolo appaiono espresse nel testo di Venn, sia per confutarle, sia per riconoscerne in certi casi la necessità. 4.3.3. Conclusione. Lo studio della probabilità nel XIX secolo ha impegnato alcune delle menti più acute del secolo stesso ed ha permesso di delineare quattro approcci, che non sempre è facile identificare: la versione classico-deterministica, quella frequentista, quella soggettivista e il filone logicista. Gli studiosi hanno cercato, con vari mezzi e a partire da idee diverse, di identificare lo specifico che viene indicato col nome di probabilità, ma il risultato non è completamente soddisfacente, in nessun caso. L’approccio classico si scontra col concetto di possibilità che rimane non chiarito e che logicamente non può identificarsi con la probabilità, pena l’introduzione nella definizione di un circolo vizioso. L’approccio frequentista si deve confrontare con eventi isolati e che non sono ripetibi- 154 C Marchini - Appunti di Matematiche complementari AA 2010 – 2011 Capitolo 4. Probabilità nel XIX secolo li, quindi è necessaria un’estensione dell’idea frequentista della probabilità. C’è poi il problema dell’infinito richiesto dalla nozione di limite che sembra inappropriato proprio perché nessun evento, per quanto ripetibile, potrà essere replicato infinite volte. L’approccio soggettivista rende difficile accettare che su di esso si possa costruire una scienza, proprio per l’assunto di base. Il tentativo logicista resta incompleto. Seppure è efficace nel costruire una connessione tra linguaggio ed operazioni probabilistiche, non è del tutto chiarito come sia possibile associare valutazioni di probabilità ad eventi elementari. Boole non si rende conto che accettando, per gli eventi semplici, un’arbitraria interpretazione probabilistica viene in parte a contraddire la possibilità di svolgere una coerente teoria delle probabilità. Bradley si ‘rifugia’ si può dire a malincuore, nel principio di indifferenza. Queste analisi del XIX secolo si trasferiranno, per continuità, nel secolo successivo e daranno luogo a differenti approcci, che manterranno, i nomi proposti dal secolo XIX. 155