CAPITOLO 4. PROBABILITÀ NEL XIX SECOLO.

annuncio pubblicitario
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
CAPITOLO 4. PROBABILITÀ NEL XIX SECOLO.
4.1 Laplace.
Ancora una volta, l’indicazione cronologica è (parzialmente) sbagliata. Infatti Laplace, nato nel
1749 è una figura di ‘passaggio’ tra il cosiddetto Secolo dei Lumi e il XIX secolo. La sua formazione si è svolta ampiamente nel XVIII secolo, essendosi
formato sotto l’impulso e con l’aiuto di D’Alembert ed in tal modo imbevutosi
dello spirito della Encyclopédie.
Jean-Baptiste Le Rond
detto D’Alembert
1717 - 1783
4.1.1. Anticipatori di Laplace. Laplace raccoglie l’eredità di vari studiosi del
secolo in cui è nato, ed in vari campi, perché come illuminista, ha svolto attività
nell’ambito della Matematica, ma anche della Fisica, della Chimica e della Astronomia. Lo si trova
infatti citato come astronomo, per lo studio delle perturbazioni dei moti dei pianeti, come fisico per
lo studio della capillarità e dell’elettromagnetismo e la termodinamica. È sicuramente noto ai matematici per lo studio delle equazioni differenziali alle derivate parziali che descrivono quello che
poi i fisici chiameranno campi centrali. Il suo più importante contributo alla filosofia è la Esposizione del sistema del mondo, una sorta di storia ideale dell’astronomia in cui riprende
e precisa un’ipotesi cosmogonica di Kant, e per questo si parla di Teoria di KantLaplace. Essa postula che a partire da una nebulosa primordiale, sia avvenuta la
formazione del sistema solare per una condensazione che ha portato alla separazione delle masse a causa della velocità di rotazione.
Immanuel Kant
1724 - 1804
Per quanto riguarda la probabilità, Laplace era assai bene informato
dell’opera di Condorcet, di qualche anno più vecchio di lui. Il Marchese
di Condorcet ha dato contributi alla Analisi matematica, in particolare
sul calcolo integrale; è anche autore (o ispiratore) di alcune voci della
Jean-Antoine-Nicolas Caritat
De Condorcet
1743 - 1794
Encyclopédie di contenuto matematico. L’aspetto che qui interessa è
stato il suo tentativo di applicare la matematica alle scienze sociali e
morali. Il suo testo più importante nell’ambito della probabilità è lo Es-
sai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, del
1785. Si tratta di un testo di 304 pagine, con una premessa di altre 191 pagine in cui cerca di rendere intelligibili i risultati matematici che gli servono nello Essai, ad un pubblico di non cultori di matematica. Come si vede il problema della comunicazione matematica era vivo ed attivo anche sul
finire del XVIII secolo. L’introduzione, o discorso preliminare, inizia con queste parole:
«Un grande uomo [Anne-Robert-Jacques Turgot, Barone di Aulnes, 1727 - 1783] delle cui lezioni, esempi e so115
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
prattutto amicizia rimpiangerò sempre la perdita, era persuaso che le verità delle Scienze morali e politiche, siano suscettibili della stessa certezza di quelle che formano il sistema delle Scienze fisiche, ed anche delle branche
di quelle scienze che, come l’Astronomia, paiano avvicinarsi alla certezza matematica. Questa opinione gli era
cara perché conduce alla speranza consolante che la specie umana farà necessariamente dei progressi verso la felicità e la perfezione, così come li fa nella conoscenza della verità.»
In questo brano appare chiaro il legame tra le speranze dell’illuminismo e del successivo positivismo, ma l’attenzione va posta soprattutto sulla dicotomia ‘certezza morale’ e ‘certezza matematica’.
Pare chiaro che la prima abbia un grado di complessità e pregio minore della seconda. Infatti
nell’idea allora dominante, la matematica grazie al suo impianto rigoroso e deduttivo dava maggiore
certezza di quanto non fosse possibile con la Fisica (intesa in senso lato come scienza della Natura)
in cui (allora) lo strumento gnoseologico principale era (è?) l’esperimento che corrobori o falsifichi
la teoria.
In questa prima opera, l’autore si occupa spesso di problemi legati alla votazioni di un’assemblea (e
formula anche quello che è noto col nome di Paradosso di Condorcet). Gli strumenti utilizzati sono
quelli del calcolo differenziale, ma il testo è oscuro e talvolta anche scorretto, spesso a parole fa delle affermazioni e che traduce in formule che non rispettano quanto scritto. Qualche commentatore
ha definito l’opera come una raccolta degli obbrobri che un uso scorretto della matematica è in grado di produrre. E ciò nonostante la sua opera ebbe successo e fu acclamata dai suoi contemporanei
4.1.2. Cenni biografici su Laplace. In nostro autore nasce in una famiglia di agricoltori. Fa gli studi
superiori a Caen ed è in questa fase che si sviluppa in lui l’interesse per la scienza. A 22 anni, nel
1771 si trasferisce a Parigi ed porta con sé raccomandazioni per D’Alembert, che non gli risponde.
Allora Laplace manda un lavoro matematico e l’impressione che suscita l’abilità mostrata nel testo,
convince l’Enciclopedista ad accordargli la sua protezione. Nel 1772 pubblica già sulle Memorie
dell’Accademia alcuni risultati sulle serie. L’anno successivo diviene membro dell’Accademia ed
inizia a collaborare con altri scienziati a lavori di Chimica e di Fisica. Viene nominato esaminatore
del corpo degli artiglieri e così si trova ad esaminare Napoleone (1784). Da questi dati si vede che
ha buoni rapporti con gli ambienti della cultura e della corte. Allo scoppio della Rivoluzione, diviene fervente rivoluzionario, conservando il posto all’Accademia. È tra i membri della commissione
dei pesi e misure e come tale collabora alla definizione del metro. Diviene Vicepresidente
dell’Accademia. Napoleone gli dà incarichi di prestigio, anzi lo nomina ministro degli interni, ma se
ne pente subito dopo togliendogli l’incarico. Diventa membro influente del Senato, nel ruolo di cancelliere. Pubblica nel 1803 la sua opera di Meccanica celeste, con una dedica allo “eroe pacificatore
dell’Europa”. Propone (ed ottiene) di abolire il calendario rivoluzionario. Nel 1806 le sue aspirazioni sociali sono soddisfate, in quanto Bonaparte lo nomina Conte. Appena cambia il ‘vento’ e nonostante le manifestazioni di stima di Napoleone, è tra i primi a firmare l’atto di destituzione
116
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
dell’imperatore ed è uno dei primi a sottoscrivere l’atto di sottomissione a Luigi XVIII. Conserva
così, anzi accresce le sue cariche ufficiali e nel 1817 il Re lo proclama Marchese. All’inizio
dell’anno 1827 ha una disputa con i colleghi dell’Accademia e dopo breve malattia muore.
4.1.3. La matematica secondo Laplace. Come si comprende dalla sua breve biografia, la formazione
e anche la prima produzione è ampiamente influenzata dalla spirito del Secolo dei Lumi, ma piano
piano, come frutto della sua ampia attività, viene a precisarsi in lui un punto di vista sulla natura e il
ruolo della matematica che lo distanzia dai suoi contemporanei. Nella frase di Condorcet citata sopra, si presenta l’idea diffusa al suo tempo:
« le verità delle Scienze morali e politiche, siano suscettibili della stessa certezza di quelle che formano il sistema delle Scienze fisiche, ed anche delle branche di quelle scienze che, come l’Astronomia, paiano avvicinarsi alla certezza matematica. »
Da questa frase e dalla introduzione della “certezza morale” di Bernoulli, cogliamo quale fosse la
situazione in quegli anni e dobbiamo anche osservare che, nonostante Galilei, Cartesio e Newton, la
Fisica e l’Astronomia erano ritenute, al pari della Politica, dell’Economia e della Probabilità studi in
cui si poteva raggiungere solo la certezza morale, perché soggetti alla verifica sperimentale. Si
comprende così perché l’opera di Buffon in cui si presenta il problema dell’ago prenda il nome di
Aritmetica morale. L’Astronomia, dice Condorcet, aveva uno sviluppo più avanzato (dopo che
Newton aveva giustificato sulla base della gravitazione universale le leggi planetarie) perché più ‘intriso’ di matematica.
Ma questa posizione ben presto non si trova in accordo con quanto Laplace va sviluppando 1. Egli si rende conto che l’ideale cartesiano, di una Matematica vista
come ‘vera’ scienza e basata sulla certezza delle idee chiare e distinte, si trova ad
ostacolare lo sviluppo del calcolo infinitesimale in cui al posto della certezza c’è il
trattamento approssimato di oggetti che sfuggono and una precisa descrizione
George Berkeley
1685 - 1753
(come ha messo in luce Berkeley). Ed infatti quello che sembrava essere il baluardo della scientificità della Matematica, il rigore, come chiarezza dei dati con cui si lavora e delimitazione precisa del
problema e dei metodi con cui affrontarlo, è sempre più abbandonato a favore di un’intuizione, anche scorretta. L’analisi infinitesimale usa infatti come strumenti essenziali concetti ‘vietati’, o forse
meglio dire ‘rimossi’: si pensi che Anassagora propone in Sulla Natura
«Rispetto al piccolo non c'è un minimo, ma c'è sempre un più piccolo perché l'esistente non può essere annullato
[per divisione]. Così, rispetto al grande c'è sempre un più grande e il più grande è eguale al piccolo come pluralità, e in se stessa ogni cosa pensata come somma d'infinite parti è insieme grande e piccola»
1
Traggo queste ed altre informazioni di questa parte del Capitolo dal primo volume delle Opere di Laplace, Torino: Utet, 1967, a cura di Orietta Pesenti Cambursano.
117
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
I concetti ‘vietati’ sono infatti quelli di infinito e di infinitesimo e quindi bisogna
accettare la divisibilità infinita che permette di giungere all’infinitesimo e poi la
somma di infiniti infinitesimi (integrale, serie) che ha un comportamento bizzarro:
talvolta con essa si ottiene un numero, talaltra una quantità più grande di qualunque
Anassagora
496 – 428 a.C.
quantità si scelga, altre volte ancora non fornisce nulla di comprensibile. I motivi,
quindi, per accettare queste violazioni dell’ideale cartesiano devono essere cercate
al di fuori della matematica, quindi il rapporto favorevole alla nostra scienza rispetto a quelle “morali”, si rovescia perché inizia ad infiltrarsi anche nella disciplina più rigorosa, la ‘impurità’
dell’esperienza che così perde contemporaneamente rigore ed autonomia.
Laplace arriva a considerare la nostra disciplina solo come strumento delle altre scienze che, a loro
volta, prive come sono di autonomia, sono interpreti di una realtà data.
In base alla oggettività della natura, il nostro dichiara di voler bandire l’empirismo dalla teoria, non
rinunciando però alla corroborazione per il confronto tra l’osservazione ed i risultati offerti
dall’analisi matematica. Non si cerca più il rigore, ma la capacità di ricostruire la realtà attraverso il
modello matematico. In questo modo la pretesa delle scienze naturali di essere indipendenti dalla
matematica per basarsi solamente sul dato empirico diventa insostenibile in quanto la nostra scienza
è in grado di offrire ‘microscopi’ migliori per spiegare lo svolgersi dei fenomeni. Da questa posizione trae spunto Laplace per dirigere la sua ricerca verso quegli aspetti della matematica che risultano essere più facilmente applicate allo studio della natura, ad esempio alla teoria delle serie, che
«… è uno degli oggetti più importanti dell’analisi: tutti i problemi si riducono ad approssimazioni e di conseguenza quasi tutte le applicazione della matematica alla natura, dipendono da questa teoria»
Da questa posizione si comprende come il nostro veda con sospetto tutte le costruzioni teoriche che
altri suoi contemporanei tentano, per chiarire meglio le ipotesi su cui si basa la Matematica (in particolare, ai suoi giorni, l’Analisi e la Geometria). Bolla queste ricerche col termine di ‘curiose’ ritenendole un puro gioco intellettuale, che tuttavia accetta con la speranza che si renda utili nel seguito. Per quanto riguarda la questione del rigore, Laplace non crede più che esso consista nella precisa
delimitazione del problema da trattare, dato che anche gli argomenti che mostrano di avere maggiore successo ne sono privi, bensì lo colloca nella perfetta comprensione del fenomeno, quindi nel
collegamento di esso fenomeno con altri che siano legati ad esso da relazioni di causalità:
«Newton, alla fine dell’ultimo secolo, pubblicò la scoperta della gravitazione terrestre. Da allora, i geometri sono riusciti a ricondurre a questa grande legge della natura tutti i fenomeni conosciuti del sistema del mondo, e a
dare così alle teorie ed alle tavole astronomiche una precisione insperata… la legge della gravitazione inversamente proporzionale al quadrato delle distanze rappresenta con un’estrema precisione tutte le ineguaglianze osservate nei movimenti celesti: quest’accordo unito alla semplicità della legge, ci autorizza a pensare che essa sia
rigorosamente quella della natura»
In questo brano sono presenti due categorie che applicate alla Matematica, con Laplace acquistano un
nuovo significato: semplicità e generalità. La semplicità significa la possibilità di capire la natura:
118
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
«Soprattutto nelle applicazioni dell’analisi al sistema del mondo si manifesta la potenza di questo meraviglioso
strumento, senza il quale sarebbe stato impossibile penetrare in un meccanismo così complicato nei suoi effetti
quanto è semplice nelle sue cause»
Ad esempio ritiene “semplici” i metodi di integrazione per approssimazione delle equazioni differenziali perché tramite essi (metodi) si può giungere ad una prima determinazione per approssimazione del movimento dei corpi celesti. Le equazioni che esprimono tali moti
«si presentano sotto una forma così complicata da non lasciare alcuna speranza di riuscire ad integrarle rigorosamente».
La semplicità, per Laplace, non è una forma di riduzionismo, perché con essa non vuole contrastare
la varietà infinita dei fenomeni, ma una forma di ‘soddisfazione personale’ dell’autore quando, come mostra nel Saggio filosofico delle probabilità (1814) riesce ad imbrigliare la varietà dei fenomeni in un sistema ‘semplice’ che permette di penetrare in detta varietà. Quindi la categoria della semplicità è per lui sempre in relazione ad una legge o ad un metodo matematico, in connessione con la
natura.
L’interdipendenza di empiria e matematica mette ora in discussione l’altra categoria, la generalità.
Lui interpreta il termine come generalizzazione, e come tale, la forma di astrazione che prescinde
dalla concretezza (accidenti) del problema. Ed infatti per lui il termine diviene qualcosa di analogo
a ‘sistemazione’ ed ‘elaborazione’. Ad essa dedica molta cura, principalmente in tutte le sue opere
maggiori. Si scopre questo nel so costante atteggiamento di trovare nessi di derivazione tra teorie,
con lo scopo di costruire, possibilmente, un’unica teoria da cui le altre possano derivare. Il risultato
sarà così una teoria ‘semplice’ nel suo senso ed anche ‘comoda’ perché abbracciando più casi rende
inutile la considerazione dei particolari. Con essa è possibile trattare in modo uniforme e sotto uno
stesso punto di vista, problemi diversi e metodi diversi per risolversi. La generalizzazione non serve, quindi, soltanto a comprendere la realtà adattandola e spiegandola mediante schemi logici, ma
offrendo anche strumenti per la scoperta. E in lui, per la prima volta, questo modo di intendere la
scienza prende il nome di “leggi matematiche”, in grado di cogliere apporti ed analogie tra fenomeni diversi, racchiuse in uno stesso concetto. Scrive infatti:
«Il mio primo scopo, in questo Libro, è dimostrare nella sola legge di gravitazione universale la sorgente di tutte
le ineguaglianze del movimento lunare e di servirmi poi di questa legge come strumento di scoperta per perfezionare la teoria di questo movimento»
Quindi attraverso la generalizzazione si ha la possibilità di passare dall’astrazione del simbolismo
matematico al mondo dei fenomeni, perché, a suo dire, con essi è in grado sia di spiegarli che di
prevederli. Salda in tal modo la possibile frattura tra astrazione ed empiria.
4.1.4. Laplace e la probabilità. Le opere di coloro che hanno preceduto il Nostro nel campo della
probabilità, avevano suscitato interesse, avevano mostrato come era possibile utilizzare strumenti
matematici di vario genere per analizzare i fenomeni aleatori, avevo trovato applicazioni anche a
119
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
campi non esclusivamente matematici. Tuttavia l’immagine generale della probabilità, anche per la
varietà di tecniche e di problemi, lo rendeva difficilmente classificabile come una scienza, perché
restavano (e restano) sullo sfondo una serie di problemi poco chiariti per cui veniva a mancare la
chiarezza matematica che una scienza doveva avere. E di fatto l’accenno e alla certezza morale e
l’utilizzazione in campi in cui tale tipo di certezza è l’unica possibile. Ma la certezza morale, per
come conclude Bernoulli, trova la propria garanzia della onniscienza e bontà divina. Così si era diffusa l’idea che la probabilità fosse legata alla incompletezza della conoscenza umana, di un fatto
che in sé era assolutamente certo (dal punto di vista dell’essere superiore). Si ha così una sorta di
reviviscenza della aristotelica teoria delle due leggi.
Da tutto ciò discendeva un impiego limitato della probabilità come strumento e, per lo più, i risultati
ottenuti erano visti come esempi di abili argomentazioni per divertire lo spirito in vena di provare la
propria abilità ad escogitare situazioni strane o divertenti (i giochi di vario genere). Tutt’al più il
calcolo delle probabilità aveva il compito di persuadere con una certa autorevolezza, perché non influenzato da pregiudizi, passioni o debolezze che possono inficiare un giudizio. Il risultato è uno
strumento che serva per congetturare, e così eventualmente una indicazione su come agire, ma la
congettura è diversa dalla conoscenza, come ha ben stabilito Bernoulli. Nelle prime opere sulla probabilità, a partire da un saggio del 1774, Laplace non sente necessità di un impianto teorico completo dell’argomento, perché il calcolo delle probabilità, nonostante gli avanzamenti avuti, si presentata come metodi di soluzione ad hoc di problemi occasionali e non classificabili in partenza. Questa
esigenza si palesa in seguito, nel 1812 con la Teoria analitica della probabilità e, ancora di più si
presenta astratta e ‘filosofica’ nel Saggio, di due anni più tardo. Si tratta di due opere della maturità
avanzata (Laplace aveva 63 e 65 anni), a compimento ideale della carriera del pensatore. La generalità e la semplicità degli strumenti predisposti dal nostro sarà il primo passo per dare ‘cittadinanza’
alla probabilità, tanto da farla divenire strumento per la fisica, come supporto per l’indagine scientifica quando manca una conoscenza certa, sostituita da una conoscenza probabile, anzi l’esplicita
l’affermazione che ogni nostra conoscenza è solo probabile. Il quadro unitario teorico di riferimento
che Laplace adopera è quello di un determinismo che non ha più bisogno dell’essere supremo.
La definizione di Laplace prescinde dalla certezza, dato che quest’ultima non è che un particolare
tipo di probabilità:
«La probabilità dell’esistenza di un evento non è che il rapporto tra il numero dei casi favorevoli e il numero di
tutti i casi possibili, quando non abbiamo motivo di pensare che si verifichi un caso piuttosto che un altro…Un
evento si verifica sicuramente quando tutti i casi possibili gli sono favorevoli e la frazione che esprime la sua
probabilità è allora l’unità.»
Nella prima parte della citazione compare con evidenza il debito con Leibniz, a proposito di
un’esistenza solo possibile e di una ‘indifferenza’ che ricorda i Principio di ragione sufficiente. Nella seconda parte della citazione c’è la subordinazione della certezza alla probabilità e questa,
120
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
nell’indagine tra casi favorevoli e casi possibili, quindi tutti casi noti e dati, trova la sua giustificazione senza fare ricorso alla certezza, risultando così strumento adeguato alla natura dell’uomo.
Nel brano riportato si prescinde da una sicurezza (possibile o impossibile all’uomo) ma si ‘oggettivizza’ in modo definitivo la probabilità come un a priori da cui dipenda la certezza stessa. Laplace
si è reso conto che il punto di partenza della conoscenza umana non può essere una conoscenza che
trascenda l’uomo, ma che l’inquilino del Mondo debba articolare la sua esperienza a partire da solo
ciò che gli è ‘raggiungibile’. In questa posizione c’è una reminiscenza kantiana di rinuncia a ciò che
ci trascende.
Leggendo in successione le varie memorie che hanno per argomento la probabilità, ci si accorge che
il calcolo aleatorio viene sempre più spesso impiegato per risolvere problemi di fisica o di astronomia, quali maree, comete, movimenti della Luna, variazione della gravitazione terrestre, assumendo
il ruolo di sostituto della matematica ‘pura’. Non trascura i problemi relativi ai giochi, ma essi assumono un ruolo esclusivamente esemplificativo. Il nostro autore, in particolare si pone il problema
di determinare che tipo di media debba essere usata per interpretare più osservazioni di uno stesso
fenomeno, in modo da ‘individuare’ o più correttamente, restringere al meglio il risultato che sia
meno suscettibile di errore. Il calcolo delle probabilità gli offre la possibilità di fare ciò, divenendo
tale tipo di calcolo più ‘generale’ e ‘semplice’ per trattare il dato empirico di quanto non fosse lo
strumento astratto matematico, abbandonando, di fatto l’ideale purezza cartesiana. Accanto a questi
lavori si presentano sempre più frequentemente gli studi sull’approssimazione.
Nella ricerca più ‘interna’ del calcolo delle probabilità, l’attenzione di Laplace si sposta sempre di
più verso gli eventi futuri e verso il ‘passato’, con gli studi della probabilità delle cause:
«…i limiti delle probabilità dei risultati e delle cause, indicati dagli eventi considerati in gran numero, e le leggi
secondo le quali questa probabilità s’avvicina a quei limiti, man mano che gli eventi si moltiplicano [sono in
grado di mostrare] come la regolarità finisce per stabilirsi anche nelle cose che ci sembrano intieramente abbandonate al caso, e ci svela le cause nascoste, ma costanti da cui dipende tale regolarità. »
In conclusione anche la probabilità permette di ottenere risultati ‘esatti’ e dal confronto con ‘esperienza tali risultati debbono ritenersi ‘assoluti’ con la ‘certezza’ conquistata di essere in grado di cogliere le strutture del reale. Attraverso essa è così possibile formulare ‘leggi’ e ‘previsioni’, per cui
Laplace ritiene la probabilità come il mediatore privilegiato per applicare la matematica alla esperienza fenomenologica.
4.1.5. Il Saggio del 1774. Il venticinquenne Laplace, appena approdato a Parigi, dedica una memoria interamente alla probabilità dal titolo: Saggio sulla probabilità delle cause in base agli avvenimenti. Si è discusso nel paragrafo precedente di quale sia stato l’approccio alla probabilità del giovane Laplace, rispetto a quello più anziano delle opere del 1812 e 1814. Come dice il titolo è il primo lavoro a stampa che pone grande attenzione a quello che Bayes aveva ottenuto, quasi inciden-
121
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
talmente e senza dare grande rilievo alla cosa: la valutazione delle cause a partire dall’effetto. Nel
testo del saggio non compare mai il nome di Bayes. I risultati di questa opera saranno ripresi più
volte e confluiranno nella Teoria analitica, ed in quella occasione verrà chiaramente indicato il nome del reverendo inglese. Nel saggio si possono distinguere tre parti, le prime due connesse tra loro:
probabilità e medie, la terza del tutto slegata (lo dice anche l’autore) che si occupa delle soluzioni
singolari delle equazioni differenziali. Probabilmente il numero delle pagine di
questa terza parte poteva non essere sufficiente per una pubblicazione autonoma,
oppure l’autore ha voluto dare prova di tutto quanto sapeva o aveva elaborato in
quel torno di tempo, anche perché c’era di mezzo una richiesta di raccomandazioLuigi Lagrangia
1736 - 1813
ne a Lagrange per ottenere un possibile salario aggiuntivo da parte dell’Accademia
di Berlino ed è forse per questo che appena ha la possibilità di citare il matematico
italiano lo appella come “illustre”.
Il saggio si apre con le parole:
«La teoria dei casi è tra le parti più curiose e più delicate dell’analisi, per mezzo della finezza delle combinazioni
che esige e per la difficoltà di sottometterle al calcolo; Moivre credo sia lo scienziato che l’ha affrontata con
maggiore successo in un’eccellente opera intitolata Theory of chances…»
Da questa breve citazione si individuano alcun aspetti interessanti. Il primo è la necessità, almeno
pare tale al giovane Laplace, di sottomettere il calcolo delle probabilità all’Analisi matematica, anzi
nelle prime opere sembra dare per scontata questa subordinazione. La seconda ci chiarisce quale sia
lo scopo: riprendere un risultato di De Moivre, quello che sarà il teorema del limite centrale. È strana la citazione sbagliata del titolo dell’opera di De Moivre, che fa venire il sospetto che la sua conoscenza non sia del testo originale, ma di qualche versione (ne ebbe molte).
Dopo qualche pagina relativa al calcolo alle differenze finite, che afferma possa divenire un metodo
generale per la probabilità, riprende l’argomento con queste parole:
«L’incertezza delle conoscenze umane verte sugli avvenimenti o sulle cause di essi; se, per esempio, si sa che
un’urna racchiude dei biglietti bianchi e neri in un rapporto dato, e si chiede la probabilità di estrarre, a caso, un
biglietto bianco, l’avvenimento è incerto, ma non lo è la causa da cui dipende la probabilità della sua esistenza,
vale a dire il rapporto tra i biglietti bianchi e quelli neri.
Nel seguente problema è noto l’avvenimento, mentre ne è sconosciuta la causa: Data un’urna che racchiude biglietti bianchi e neri in un rapporto non noto, determinare la probabilità che tale rapporto sia di p a q, quando
sia stato estratto un biglietto e questo sia bianco.
A queste due classi di problemi possono essere ricondotti tutti i problemi che dipendono dalla teoria dei casi; noi
però, prenderemo qui in esame solo quelli della seconda classe e stabiliremo il seguente principio:
PRINCIPIO – Se un avvenimento può essere prodotto da un numero n di cause diverse, le probabilità
dell’esistenza di queste cause derivanti dall’avvenimento stanno tra loro come le probabilità dell’avvenimento
derivanti da tali cause, e la probabilità dell’esistenza di ciascuna è uguale alla probabilità dell’avvenimento derivante da essa, divisa per la somma di tutte le probabilità dell’avvenimento derivanti ciascuna da tali cause »
Un commento sulle affermazioni contenute nel brano. L’interpretazione del concetto di probabilità
che emerge dal richiamo alle conoscenze umane, fa propendere per aspetti soggettivisti, che saranno
in vario modo affermati nelle opere più giovanili. È poi interessante la distinzione tra causa nota ed
122
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
avvenimento incerto e causa ignota ed avvenimento certo che ricorda i ragionamenti misti di Leibniz. Riprendendo la distinzione tra probabilità fattuale ed epistemica, è ovvio che il primo caso si
usa l’incertezza del caso, mentre la seconda è la meta-probabilità, vale a dire la probabilità che la
probabilità fattuale abbia un certo valore.
Il principio, così come è formulato, risulta rilevante sia per la ricerca delle cause ed anche come
strumento per stimare la possibilità dei casi futuri, di cui i fenomeni attuali si possono considerare
cause. Si noti la presenza del retaggio geometrico, nel senso che si preferisce parlare di rapporti e
proporzioni. Con esso Laplace si propone di dare una sistemazione razionale sia ad una realtà data
sia di impiegarlo come strumento di previsione.
Fa tuttavia una certa impressione l’affermazione «la probabilità della sua esistenza, vale a dire il rapporto tra i
biglietti bianchi e quelli neri».
A prenderla letteralmente, la probabilità potrebbe essere espressa anche
da un numero maggiore di 1, perché il rapporto tra i biglietti dell’urna può essere qualunque. Poi nel
seguito e negli esempi che propone, tale pensiero viene mutato in rapporto tra favorevoli e possibili.
Si può esprimere il principio supponendo che E1, …, En siano le cause (che individuano una partizione di Ω) e che H sia l’avvenimento. Si ha quindi che p(Ej |H) : p(Ek|H) = p(H|Ej): p(H|Ek). Inoltre
il principio afferma che p(Ei) =
p(H | Ei )
. Questa interpretazione del testo porta a
p(H | E1 ) + ... + p(H | E n )
risultati errati. La prima affermazione, letta in modo diversa può divenire corretta: se nel principio
ci fosse scritto “le probabilità dell’esistenza di queste cause derivanti dall’avvenimento stanno tra loro come le probabilità dell’avvenimento derivanti da tali cause e la probabilità dell’esistenza di ciascuna”
la, allora si potrebbe leggere
p(H | E j ) ⋅ p(E j )
p(H | E k ) ⋅ p(E k )
=
p(E j | H)
p(E k | H)
p(H) ⋅ p(E j | H)
p(H) ⋅ p(E k | H)
=
p(H | E j ) ⋅ p(E j )
p(H | E k ) ⋅ p(E k )
omettendo una virgo-
, in quanto, per il teorema di Bayes,
. La seconda uguaglianza resta però ‘simile’ alla seconda forma
del teorema di Bayes che oggi potrebbe essere scritta come p(E j | H) =
p(E j ) ⋅ p(H | E j )
∑ p(E k ) ⋅ p(H | E k )
, a patto
k
che la probabilità delle cause sia uniformemente distribuita e che invece della “la probabilità
dell’esistenza di ciascuna”
ci sia la “probabilità dell’esistenza di [questa causa] derivanti dall’avvenimento”.
Il primo problema che Laplace propone come applicazione è il seguente:
«I Problema – Un’urna racchiude infiniti biglietti bianchi e neri in rapporto ignoto; se ne estraggono p + q, di
cui p sono bianchi e q neri; si domanda la probabilità che, estraendo un nuovo biglietto da questa urna, esso sarà bianco. »
Il testo merita attenzione: in esso compare un’interpretazione di ‘infinito’ sorprendente. L’autore
sembra propendere per la possibilità che gli infiniti siano confrontabili, in quanto parla di rapporto
tra i numeri di biglietti di colori diversi. Con l’odierna teoria dei cardinali il testo perde di significa-
123
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
to, dato che i rapporti tra cardinali non sono operazioni consentite. Con la teoria dei limiti infiniti di
funzioni, l’argomento potrebbe ‘reggere’, anche se la teoria dei limiti non era, in quel momento,
completamente sviluppata. Ma è difficile immaginare il passaggio dal discreto del concetto di quantità che è sottinteso nell’urna e nella numerosità dei biglietti al continuo necessario per fare i limiti.
Non è specificata la modalità di estrazione, se contemporanea o in successione, con o senza restituzione. Tuttavia, come si vedrà nello svolgimento del problema, tale infinito è propriamente indispensabile, proprio per realizzare il passaggio dal discreto al continuo. Analizziamo alcuni passi
della soluzione che Laplace offre:
«Soluzione – Il rapporto tra il numero dei biglietti bianchi e il numero complessivo dei biglietti racchiusi
nell’urna può essere uno qualsiasi dei numeri frazionari da 0 a 1; se si prende uno di questi numeri x per rappresentare il rapporto ignoto, la probabilità di estrarre p biglietti bianchi e q neri è, in questo caso, xp(1-x)q; perciò la
probabilità che x sia il vero rapporto tra il numero dei biglietti bianchi e il numero totale è per il principio esposto
nel paragrafo precedente uguale a
x p (1 − x )q dx
q
p
∫ x (1 − x ) dx
essendo l’integrale nullo quando x = 0, e tale che finisca quando x = 1;»
Ci siamo fermati nella citazione, anche se il pensiero di Laplace non è concluso, per fare alcune os-
servazioni. Quando l’autore propone che la probabilità sia xp(1-x)q, è evidente che sta utilizzando
uno schema probabilistico cosiddetto di tipo bernoulliano successo-insuccesso che può realizzarsi
anche con lanci ripetuti di una moneta. In questo schema, la situazione che si presenta al secondo
lancio è del tutto identica a quella del primo lancio, quindi si potrebbe concludere che il sorteggio di
cui parla il testo avviene con restituzione. D’altra parte se nell’urna ci fossero 100 biglietti di cui 60
bianchi e il resto neri, la probabilità dell’evento B1, si sorteggia un biglietto bianco sarebbe p(B1) =
60/100 = 0,6. Operando senza restituzione (e quindi non ritenendo indipendenti i singoli eventi), si
avrebbe che detto B2 la probabilità di avere un biglietto bianco al secondo sorteggio, p(B2|B1) =
59/99. Così p(B1∩B2) = p(B1)·p(B2|B1) = (60·59)/(100·99) = 0,357576. Se si facesse il sorteggio con
restituzione i due eventi sarebbero indipendenti ed avrebbero la stessa probabilità per cui p(B1∩B2)
= 0,36. Se nell’urna ci fossero 100.000 biglietti e di essi 60.000 fossero bianchi, si avrebbe ancora
p(B1) = 0,6 e p(B2|B1) = 59.999/99.999, per cui p(B1∩B2) = 0,359998, mentre se gli eventi fossero
indipendenti, continuerebbe ad essere p(B1∩B2) = 0,36. Pertanto in presenza di infiniti biglietti
nell’urna si può ritenere indifferente se il sorteggio avviene con o senza restituzione, essendo tutto
l’ambito della probabilità in rapporto con approssimazioni.
Il testo afferma: per il principio esposto nel paragrafo precedente. Fa riferimento alla frase « la probabilità dell’esistenza di ciascuna [causa] è uguale alla probabilità dell’avvenimento derivante da essa, divisa per la
somma di tutte le probabilità dell’avvenimento derivanti ciascuna da tali cause».
La causa cui fa riferimento è la
composizione dell’urna e quindi che sia x la ‘vera’ probabilità da cui dipende la probabilità
dell’avvenimento.
124
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
A denominatore della frazione vista in precedenza compare un integrale. La cosa ha senso, ma è difficile da accettare. Comunque si faccia variare x tra 0 e 1, essendo un numero razionale, ci sarebbe
da fare la somma, per ogni numero razionale dell’intervallo indicato, del numero razionale xp(1-x)q.
Sicuramente è molto più semplice il calcolo dell’integrale ma il passaggio dal discreto a continuo
non viene giustificato. Il fatto che nell’urna ci siano infiniti biglietti permette di assumere una grande varietà di valori. Se i biglietti fossero solo 10, x potrebbe essere espresso solo in decimi.
L’integrale esprime, quindi, la somma di tutte le probabilità dell’avvenimento derivante da ciascuna
causa.
A numeratore della stessa frazione compare la probabilità ‘dell’avvenimento’ ma questa viene moltiplicata per un ‘sospetto’ dx che potrebbe avere senso se si trattasse di un’eventuale differenza, ma
sempre per la natura di numero razionale di x, non appare evidente. Il tutto appare una ‘forzatura’
giustificata dalla semplicità (categoria cui Laplace tiene molto) ma non dalla chiarezza della giustificazione.
Un’ulteriore osservazione. Scrive Laplace «essendo l’integrale nullo quando x = 0, e tale che finisca quando x
= 1».
Si può considerare questa dizione, spesso ripetuta nel suo testo per indicare l’integrale definito
1
che oggi si scriverebbe ∫ x p (1 − x )q dx , c’è qualcosa di più. Il fatto che finisca in 1 è d’accordo con
0
questa interpretazione, però l’integrale è nullo in 0 per la specificità della funzione integrando. Se
1
ad esempio si trattasse di ∫ − senxdx , sarebbe assai difficile accettare che l’integrale sia nullo quan0
do x = 0. Nel prosieguo si userà la scrittura oggi consueta per l’integrale definito, riportando anche
il testo di Laplace.
Da tutto questo ricaviamo un principio non esplicitato da Laplace: fare tutto a ragione o a torto con i
metodi della Analisi matematica, perché più semplice o forse più generale.
Ritorniamo al Problema I, continuando la frase che in precedenza abbiamo troncato
«ora, nell’ipotesi che sia x il vero rapporto tra il numero di biglietti bianchi e quello totale, la probabilità di estrarre un biglietto bianco dall’urna è x; moltiplicando questa quantità per la probabilità dell’ipotesi, si otterrà,
per la probabilità d’estrarre un biglietto bianco dall’urna in virtù del rapporto x, il valore
x p +1(1 − x )q dx
1
p
q
∫ x (1 − x ) dx
0
e di conseguenza, indicando con E la probabilità intiera di estrarre un biglietto bianco dall’urna, si avrà
1
p +1
q
∫ x (1 − x ) dx
E = 01
q
p
∫ x (1 − x ) dx
0
badando a fare iniziare gli integrali quando x = 0 e a porre loro fine quando x = 1»
Quindi con restituzione: la probabilità di quest’ulteriore sorteggio è ancora lo stesso. A questo punto non ci si stupisce più delle presenze dei dx. Stavolta gli integrali sono proprio definiti, non po-
125
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
nendosi più condizioni sull’annullamento in 0. Il numero E è l’espressione della probabilità della
causa, dato che l’integrale a numeratore di E ‘raccoglie come somma, tutte le possibili probabilità
dell’ulteriore sorteggio.
Come si vede si hanno due integrali di polinomi e non ci dovrebbero essere problemi per calcolarli,
a parte il fatto che essendo p e q parametri, il risultato dipenderà da essi. Ma Laplace prende
un’altra strada, con (ripetute) integrazioni per parti in cui il fattore differenziale è xpdx (o xp+1dx) e il
fattor finito è (1-x)q. Ad esempio al denominatore calcola
1
1
 x p +1
 1 p +1
(1 − x )q  − ∫ x ⋅ q ⋅ (− 1)(1 − x )q −1dx = q ∫ x p +1(1 − x )q −1dx ,
∫ (1 − x ) x dx = 
p +10
0
 p + 1
 0 0 p + 1
1
q p
essendo il termine in parentesi quadra, calcolato in 0 e in 1, nullo in entrambi i casi. Con questo procedimento appare chiaro che decrescono gli esponenti del fattore (1-x) e decrescono quelli del fattore x. Iterando q-volte scompare il fattore (1-x) e resta con potenza maggiore il fattore x soltanto e
l’integrale diviene allora semplice. Nel caso in esame l’integrale a numeratore si può scrivere come
q!
q!
e quello a denominatore
, quindi il va( p + 2) ⋅ ( p + 3) ⋅ ... ⋅ ( p + q + 2)
( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1)
lore della probabilità della causa E =
p +1
.
p+q+2
Il risultato può ora essere usato a prevedere nuovi ‘avvenimenti’. Se si volesse conoscere la proba1
q +1
p
∫ x (1 − x ) dx
. L’integrale a
bilità di estrarre un biglietto nero, basterebbe ora considerare H = 01
q
p
∫ x (1 − x ) dx
0
numeratore sarebbe dato ora da
(q + 1)!
, per cui
( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 2)
H=
q +1
e così E + H
p+q+2
= 1.
Più in generale Laplace indica la probabilità di pescare m biglietti bianchi e n biglietti neri data da
1
∫x
p+m
(1 − x )q + n dx
P=0 1
q
p
∫ x (1 − x ) dx
=
(q + 1) ⋅ (q + 2) ⋅ ... ⋅ (q + n ) ⋅ ( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1)
( p + m + 1) ⋅ ( p + m + 2) ⋅ ... ⋅ ( p + q + m + n + 1)
0
Un modo diverso di scrivere la frazione a secondo membro è dato moltiplicando numeratore e denominatore per un opportuno fattore in modo da rendere più semplice l’espressione: q!·p!·(p+m)!.
Così facendo la frazione diviene
(q + n )! ⋅ ( p + q + 1)! ⋅
q!
p!
126
( p + m )!
. Vediamo ora come tra( p + q + m + n + 1)
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
sformare ciascuna delle tre frazioni, sfruttano le ipotesi che p e q siano ‘grandi’. Si ha, grazie alla
formula
di
Stirling,
per
s+
s
ogni
numero
naturale
s
(abbastanza
grande)
1
2
s
s
s! ≅ 2π ⋅ s   = 2π ⋅ s , ma il secondo membro approssima per difetto il fattoriale e
e
e
l’errore che si commette decresce lentamente (con un foglio Excel si constata che per s = 10 l’errore
è dell’ordine di 8·10-3; per s = 100 è dell’ordine di 8·10-3 , per s = 170 è dell’ordine di 5·10-4, ma con
un foglio Excel non è possibile andare oltre essendo 170! = 7,6·10306). Sostituendo i fattoriali con la
1
formula di Stirling, si ha
3
(q + n )! = (q + n )q + n + 2 ; ( p + q + 1) p + q + 2 ;
q!
enq
q+
1
2
e q +1 p
p+
1
2
1
eq + n +1( p + m ) p + m + 2
( p + q + m + n + 1)
1
∫x
p+m
p + q + m+ n+
3
2
.
(1 − x )q + n dx
Si scrive in tal modo la probabilità di sorteggiare m biglietti bianchi e n neri, 0 1
q
p
∫ x (1 − x ) dx
=
0
1
3
1
(q + n )q + n + 2 ⋅ ( p + q + 1) p + q + 2 ⋅ ( p + m ) p + m + 2
=
q+
q
1
2
p+
⋅p
1
2
3
⋅ ( p + q + m + n + 1) p + q + m + n + 2
.
Le semplificazioni possibili non sono terminate. Infatti, si ha
quindi
3
( p + q + 1) p + q + 2
3
= ( p + q)p+q+ 2

1 

⋅ 1 +
p + q 

p+q+
3
2
( p + q + 1) = ( p + q ) ⋅ 1 +

1 
 ,
p + q 
3
= e ⋅ ( p + q ) p + q + 2 . In questi passaggi si
noti la disinvoltura di utilizzare il segno di uguaglianza quando si sottintende il passaggio al limite.

1 
Si ha lim1 +

p + q 

p+q
= e con p+q che tende all’infinito. Inoltre si trascura il fattore
3
2

1
1 +
 , dato che il termine in parentesi non è ‘sensibilmente’ diverso da 1. I termini in cui
p + q 

compaiono p+m e q+n, meritano un trattamento a parte. Siccome m è ‘molto’ piccolo rispetto a p ( e



1
 m
1
lo stesso n rispetto a q), si ha ( p + m ) = p ⋅ 1 +  = p ⋅ 1 +  . Quindi ( p + m ) p + m + 2 =
p
p




m

127
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
m
p



1

m
1
1

  m m+ 2
p + m+  
p + m+
1
m
2
2 . Sono ‘evidenti’ le varie approssimazioni


 ⋅ 1 + 
=p
⋅ 1+
=e ⋅p
p   
p
 

 
m  


1
q + n+
1
2 . Con queste trasformaed i vari passaggi al limite. In modo analogo (q + n )q + n + = e n ⋅ q
2
zioni e quella analoga per il termine con p+q+m+n+1 si ha:
1
1

3 
p + m + 
 n q + n + 2  
p + q +   m
2
2  ⋅e ⋅ p
e ⋅ q
 ⋅  e ⋅ ( p + q)

1
3
1
q +n+
p +q +
p + m+





 
(
q + n)
2 ⋅ ( p + q + 1)
2 ⋅ ( p + m)
2



P=
=
1
1
1
1
3
3
q+
p+
q+
p+ 
q 2 ⋅ p 2 ⋅ ( p + q + m + n + 1) p + q + m + n + 2
q 2 ⋅ p 2 ⋅  e m + n +1 ⋅ ( p + q ) p + q + m + n + 2 


da cui P =
pm ⋅ qn
( p + q )m+ n
.
L’impressione che si ha leggendo questa parte della dimostrazione è quella di stare a guardare una
macchina complessa, bene oliata che macinando calcoli non semplici, giunge ad un risultato ‘semplice’. Laplace non si pone il problema se approssimando di qua e di là prima i fattoriali con la formula di Stirling, poi introducendo e come limite e tagliando fattori perché p e q sono grandi e gli altri piccoli, non si procurino possibili problemi per cui invece di venire quello che si vuole, si ottenga dell’altro. La ‘bellezza’ della formula finale fa sparire tutti i dubbi. Oggi un calcolo di questi tipo
dovrebbe essere accompagnato con stime degli ‘errori’ per garantire che il risultato sia ‘abbastanza’
quello desiderato.
Ma Laplace ha un'altra argomentazione che dovrebbe convincere i più scettici. Cosa succede se invece di essere m e n piccoli sono grandi? Prova allora che i numeri p e q possono essere così grandi
che la (meta)probabilità che la probabilità di pescare un biglietto bianco sia compresa tra
e
p
−ω
p+q
p
+ ω si avvicini alla certezza quanto si vuole. Non si seguirà la dimostrazione di questa afp+q
fermazione, ma ci si sofferma su un passaggio delicato ed importante. Nella espressione precedente
1
di E a denominatore compare ∫ x p (1 − x )q dx , integrale che si è sostituito col suo valore
0
q!
. Allora nella scrittura della probabilità che il rapporto vero sia x, data
( p + 1) ⋅ ( p + 2) ⋅ ... ⋅ ( p + q + 1)
128
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
x p (1 − x )q dx
da
q
p
∫ x (1 − x ) dx
,
si
può
anche
scrivere
che
tale
probabilità
è
data
da
( p + 1) ⋅ ... ⋅ ( p + q + 1) x p (1 − x )q dx . Sviluppando questa informazione, con tecniche viste in preceq!
−
denza, ad un certo punto compare un fattore e
( p + q )2 z 2
3 p2
che ricorda da vicino la curva di Gauss.
Si è mostrato anche in dettagli il primo problema perché sono abbastanza chiari in esso i motivi ispiratori della ricerca di Laplace.
Il saggio continua con un secondo problema sulla suddivisione della posta, trattato con metodi di
approssimazione analoghi a quelli visti nella soluzione del problema 1.
A questo secondo problema segue l’indagine sulle medie, in cui impiega i metodi probabilistici illustrati.
4.1.6. La Teoria analitica (prima parte). Il testo Théorie analytique des Probabilités rappresenta sicuramente il vertice dell’elaborazione della teoria della probabilità in Laplace. La prima edizione
comparve nel 1812. Il testo è dedicato a Napoleone e si apre con un grande elogio.
«A Napoleone il Grande. Sire, la benevolenza con la quale Vostra Maestà si è degnata d’accogliere l’omaggio
del mio trattato di Meccanica Celeste, m’ha ispirato il desiderio di dedicarLe questa Opera sul Calcolo delle Probabilità. Questo calcolo delicato si estende alle questioni più importanti della vita, che non sono, per lo più, che
problemi di probabilità. Ciò dovrebbe, sotto questo aspetto, interessare Vostra Maestà il cui genio sa sì degnamente incoraggiare tutto ciò che può contribuire al progresso dei lumi, e della prosperità pubblica. Io oso supplicarLa di gradire questo nuovo omaggio dettato dalla più viva riconoscenza, e dai sentimenti profondi
d’ammirazione e rispetto mediante i quali io sono, o Sire, di Vostra Maestà, l’umilissimo ed ubbidientissimo
servitore e fedele suddito, Laplace»
Nella edizione originale, dopo la prefazione, il testo comprende 455 pagine, seguite da 18 pagine di
indice e poi una pagina di errata. La seconda edizione è del 1814 e comprende una nuova introduzione di 106 pagine (numerate con ‘cifre’ romane) e il testo che segue è numerato da 3 a 484, seguito da 21 pagine di indice e due pagine di errata. Nello stesso anno 1814, l’introduzione, verrà stampata a parte, in ottavo, col titolo di Essai philosophique sur les Probabilités. La terza edizione appare nel 1820. In essa, dopo un’introduzione di 142 pagine (numerate con ‘cifre’ romane), il rimanente testo è uguale a quello della seconda edizione. Separatamente, Laplace dopo la prima edizione
pubblicò quattro supplementi alla prima edizione. I primi tre di questi supplementi seguirono anche
la terza edizione. Le date di pubblicazione di questi supplementi non sono riportate. Alcune pagine
della prima edizione non si ritrovano nella seconda e nella terza 2.
2
Todhunter (1865), da cui si traggono queste notizie, indica come le pagine della prima edizione che non compaiono
nella seconda edizione come quelle da pagina 9 a pagina 444. Tenuto conto che le pagine del testo della prima edizione
erano 446, una simile modifica di testo non avrebbe senso considerarla come seconda edizione. Nel seguito, l’autore
inglese specifica che le pagine della prima edizione, modificate e sostituite sono solo le pagine 25, 26, 27, 28, 37, 147,
148. 303, 359, 360, 391 e 392; la seconda versione è sicuramente più credibile.
129
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
Sul web si trova il testo della terza edizione, pubblicato come Tomo VII della ristampa delle opere
di Laplace a spese dello Stato francese, nel 1847. In questa ristampa, presentazione, indice ed introduzione sono stampate in 195 pagine (numerate con ‘cifre’ romane), cui seguono 532 pagine di testo ed ulteriori 158 pagine per la stampa dei quattro supplementi. La edizione statale lascia un poco
a desiderare in quanto a cura editoriale, ad esempio il secondo supplemento è stampato con gli stessi errori del testo originale.
Ovviamente quando Napoleone perse l’impero, Laplace, tra i primi a firmare l’atto di destituzione
dell’imperatore, si affrettò ad eliminare la dedica.
4.1.7. Il Saggio filosofico. La scelta di pubblicare l’introduzione della seconda edizione come testo
a parte può essere intesa come una volontà di tipo divulgativo, anche perché in tale introduzione,
così come avviene per le Ouvertures delle opere liriche, sono riassunti e citati i temi più importanti,
sviluppati nel testo della Teoria analitica. Un’analisi più approfondita mostra che tra il trattato matematico e l’introduzione filosofica c’è una importante differenza di impostazione. Il Saggio è un
ulteriore ripensamento e quindi il chiarimento di alcuni concetti fondamentali posi alla base del calcolo e che permettevano allo strumento innovativo un’ampia applicazione alla ricerca scientifica.
Anche la ‘architettura’ del testo introduttivo, pur avendo precisi riferimenti nella Teoria, si differenzia da quella di quest’ultimo. All’inizio del Saggio Laplace, ricorda che il primo abbozzo
dell’Introduzione è lo sviluppo ed approfondimento di una Lezione sulla probabilità, tenuta alla
Scuola Normale Superiore (di Parigi) nel 1795. Ciò fa capire che, ancora una volta, come per tante
altre opere, la motivazione didattica è quella che spinge all’approfondimento ed al chiarimento delle
idee portando ad avanzamenti scientifici importanti. Chiarisce poi che cercherà di presentare le idee
della probabilità, senza fare ricorso, come avviene nella Teoria, dei risultati dell’Analisi.
Dopo questa premessa, che sembra far prendere tempo allo scrittore ed al lettore, si affronta uno dei
punti cui Laplace tiene maggiormente:
«Anzi parlando rigorosamente, quasi tutte le nostre conoscenze non sono che probabili; e anche quelle pochissime che stimiamo certe, persino nelle scienze matematiche, ci sono date dall’induzione, dall’analogia, che,
strumenti principali per giungere alla verità, si fondano sulla probabilità. Perciò il sistema intero delle conoscenze umane si ricollega alla teoria che esponiamo in questa opera. Si vedrà senza dubbio con interesse che, considerando anche nei princìpi eterni della ragione, della giustizia e dell’umanità soltanto i casi fortunati che sono loro costantemente collegati, vi è un grande vantaggio nel seguire questi princìpi e vi sono notevoli inconvenienti a
trascurarli, poiché le loro chances 3, come quelle favorevoli nelle lotterie, finiscono sempre col prevalere tra le
oscillazioni del caso. Mi auguro che le riflessioni di questa Introduzione, possano meritare le attenzioni dei filosofi e dirigerla verso un oggetto così degno del loro interesse.»
3
La traduttrice e curatrice del volume UTET, Orietta Pesenti Cambursano, lascia non tradotta questa parola ed in una
nota a piede di pagina ci informa dei motivi: «Non abbiamo ritenuto opportuno tradurre il termine chance, perché non abbiamo
trovato un equivalente italiano. Il termine caso che più gli si avvicina, corrisponde al francese hasard, nel senso di ciò che non rientra
nella regolarità di una legge generale. Chance è invece (citiamo, traducendo dal Dictionaire de l’Académie Française, Septième édition, tome I, Paris, 1878, p. 280, “ogni evento, fortunato o sfortunato, che può risultare da un ordine dato di cose”. »
130
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
Con queste parole Laplace vuole esprimere la sua posizione avversa alle polemiche che il calcolo
delle probabilità aveva suscitato, con il risultato che da molti era considerato un esempio di scienza
‘morale’ non degno di paragonarsi alla scienza matematica. La posizione dell’autore è evidente
nell’avverbio “rigorosamente”, nell’affermazione che le scienze matematiche si fondano sulla probabilità (e non viceversa). Passa poi in veloce rassegna, il contributo che la probabilità è in grado di
dare ai vari aspetti del vivere comune. Di grande interesse gnoseologico l’affermazione che le nostre conoscenze sono probabili.
Si riporta per intero il breve capitolo che tratta della probabilità:
«La probabilità. Tutti gli avvenimenti, anche quelli che per la loro piccolezza sembrano non ubbidire alle grandi
leggi della natura, ne sono una conseguenza necessaria come lo sono le rivoluzioni del Sole. Ignorando i legami
che li uniscono al sistema dell’intero universo, li si è fatti dipendere dalle cause finali o dal caso, a seconda che si
manifestassero e si succedessero con regolarità o senza ordine apparente; ma queste cause immaginarie sono state successivamente arretrate sino ai limiti delle nostre conoscenze e spariscono del tutto davanti alla sana filosofia la quale non vede in esse che l’espressione dell’ignoranza i cui ci troviamo circa le vere cause.
Gli avvenimenti attuali hanno coi precedenti un legame fondato sul principio evidente che nulla può cominciare
ad essere senza una causa che lo produca. Quest’assioma, noto sotto il nome di principio di ragione sufficiente,
si estende anche alle azioni che giudichiamo indifferenti. Neppure la volontà più libera può dar loro nascita senza un motivo determinante; giacché, se essa stimando perfettamente simili le circostanze di due posizioni, agisse
in una e si astenesse dall’agire nell’altra, opererebbe una scelta che sarebbe effetto senza causa; che sarebbe insomma, dice Leibniz, il caso cieco degli epicurei. Ma l’opinione contraria alla nostra è un’illusione dello spirito
che, perdendo di vista le ragioni fugaci della scelta della volontà nelle cose indifferenti, si persuade che essa si
determini da sé e senza motivo.
Dobbiamo dunque considerare lo stato presente dell’universo come l’effetto del suo stato anteriore e come causa
del suo stato futuro. Un’Intelligenza che, per un dato istante, conoscesse tutte le forze da cui è animata la natura
e la situazione rispettiva degli esseri che la compongono, se per di più fosse abbastanza profonda da sottomettere
questi dati all’analisi, abbraccerebbe nella stessa formula i movimenti dei più grandi corpi dell’universo e
dell’atomo più leggero: nulla sarebbe incerto per essa e l’avvenire, come il passato, sarebbe presente ai suoi occhi. Lo spirito umano offre, nella perfezione che ha saputo dare all’astronomia, un pallido esempio di
quest’Intelligenza. Le sue scoperte in meccanica e in geometria unite a quella della gravitazione universale,
l’hanno messo in grado di abbracciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema del mondo.
Applicando lo stesso metodo ad altri oggetti delle sue conoscenze, è riuscito a ricondurre a leggi generali i fenomeni osservati ed a prevedere quelli che devono scaturire da circostanze date. Tutti i suoi sforzi nella ricerca della verità tendono ad avvicinarlo continuamente all’Intelligenza che abbiamo immaginato, ma da cui resterà sempre infinitamente lontano. Questo tendere, che è proprio della specie umana, è ciò che ci rende superiori agli animali, ed i progressi nel campo della scienza distinguono le nazioni ed i secoli e rappresentano la loro vera gloria. Ricordiamoci che un tempo, ed in un’epoca che non è ancora molto lontana, una
pioggia o una siccità eccessive, una cometa che trascinasse dietro di sé una lunga coda,
le eclissi, le aurore boreali ed in genere tutti i fenomeni straordinari, apparivano come
altrettanti segni della collera celeste. Si invocava il cielo per allontanare la loro funesta
influenza. Non lo si pregava invece di sospendere il corso dei pianeti e del Sole:
l’osservazione ben presto fece capire l’inutilità di queste preghiere. Ma, poiché quei fenomeni si manifestavano e sparivano dopo lunghi intervalli, essi sembravano contrari
all’ordine della natura; si supponeva che il cielo li facesse nascere e li modificasse a suo
Lucio Anneo Seneca
piacimento per punire i delitti della Terra. Così la lunga coda della cometa del 1456
4 a.C. – 65 d.C
sparse il terrore nell’Europa già prostrata per il rapido successo dei Turchi che avevano
abbattuto il Basso Impero. Quest’astro, dopo quattro rivoluzioni ha suscitato in noi un
interesse ben diverso. La conoscenza delle leggi del sistema del mondo, acquisita in quest’intervallo di tempo, ha
dissipato i timori prodotti dall’ignoranza de veri rapporti dell’uomo con l’universo, ed Halley, riconosciuta
l’identità della cometa con quella del 1531, 1607 e 1682, annunziò il suo ritorno per la fine del 1758 o l’inizio
del 1759. Gli scienziati attesero con ansia questo ritorno, che doveva confermare una delle più grandi scoperte
che fossero mai state fatte nelle scienze e compiere la predizione di Seneca, quando, a proposito della rivoluzione di questi astri che vengono da remote distanze, disse “Verrà un giorno in cui, dopo uno studio di parecchi secoli, le cose attualmente incomprensibili saranno evidenti, e la posterità si meraviglierà che verità così chiare ci
siano sfuggite”. Clairaut sottomise allora all’analisi le perturbazioni che la cometa doveva avere provato per
131
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
l’azione dei due maggiori pianeti, Giove e Saturno: dopo lunghi calcoli fissò il suo prossimo passaggio al perielio per l’inizio circa dell’aprile 1759, cosa che l’osservazione non tardò a verificare. La regolarità, che
l’astronomia ci presenta nel movimento delle comete, ha luogo, senza dubbio, in tutti i fenomeni. La curva descritta da una semplice molecola di aria o di vapore è regolata con la stessa certezza
delle orbite planetarie: non v’è tra esse nessuna differenza, se non quella che vi pone
la nostra ignoranza.
La probabilità è relativa in parte a questa ignoranza, in parte alle nostre conoscenze.
Sappiamo, per esempio, che su tre o più eventi uno solo si verificherà; ma nulla ci
porta a credere che uno debba accadere a preferenza degli altri. Data la nostra indecisione, ci è impossibile pronunciarci con certezza sul loro accadere. Tuttavia è probabile che uno solo di essi, preso ad arbitrio, non si verifichi, perché vediamo che più casi
Alexis-Claude Clairaut
ugualmente possibili ne escludano l’esistenza, mentre uno solo la favorisce. La teoria
1713 - 1765
dei casi consiste nel ridurre tutti gli eventi di uno stesso genere ad un certo numero di
casi ugualmente possibili, cioè tali che renderci indecisi circa la loro esistenza, e nel determinare il numero dei
casi favorevoli all’evento di cui si ricerca la probabilità. Il rapporto tra questo numero e quello di tutti i casi possibili è la misura della probabilità, la quale perciò non è che una frazione, il cui numeratore è il numero dei casi
favorevoli e il cui denominatore è il numero di tutti i casi possibili. »
Il lungo brano citato, che non esaurisce il capitolo dedicato alla probabilità, ci permette di fare alcune osservazioni. Intanto lo stile. Il confronto con la Memoria del 1774 è illuminante. Qui Laplace si
mette gli abiti dello scrittore divulgatore di scienza e non quelli dello scienziato. Le sue argomentazioni sono presentate in modo ampio con lo scopo di essere convincente anche per un non addetto ai
lavori. Gli esempi sono calzanti ed anche dotti, si veda la citazione di Seneca.
L’immagine della Intelligenza onnisciente è famosa, ma non originale. Infatti Laplace la deriva da
Condorcet che in un saggio sull’Analisi del 1768 scriveva:
«Un’intelligenza che conoscesse lo stato di tutti i fenomeni, in un determinato momento, le leggi cui è sottoposta
la materia ed il loro effetto alla fine di un intervallo qualsiasi di tempo, avrebbe una conoscenza perfetta del sistema del mondo. Tale conoscenza supera le nostre forze, ma costituisce il fine a cui devono tendere gli sforzi
dei geometri filosofi, che ad essa si avvicineranno sempre più, pur senza mai sperare di poterla raggiungere. »
Anche se le parole sono molto simili, e sono il risultato di un comune ambiente culturale, Condorcet
ritiene che tale conoscenza totale sia puramente ideale. Laplace crede invece in questa Intelligenza e
il suo accenno ai limiti della conoscenza è funzionale solo ad una posizione polemica contro la metafisica. Per meglio chiarire, è ovvio che nel nostro non c’è una identificazione tra Intelligenza perfetta con la conoscenza umana. Ma c’è lo sforzo umano di avvicinarsi. Così la completezza della
certezza non è appannaggio della conoscenza umana, a tale completezza deve avvicinarsi. Così, nonostante il divario tra le due forme di conoscenza, c’è una identità delle tecniche che permettono di
raggiungere la conoscenza. Così anche l’Intelligenza perfetta si avvale degli strumenti dell’Analisi
matematica, mediante i quali l’uomo è riuscita ad avvicinarsi alla piena consapevolezza in campo
astronomico. Inoltre entrambe le conoscenze hanno uno scopo comune che è quello della comprensione della natura. In questo modo per Laplace l’Intelligenza non è un essere (la cui esistenza richiederebbe la metafisica) ma è solo il simbolo umano della conoscenza razionale che serve di
sprone per l’uomo nelle sue indagini. L’accrescimento prodigioso dei risultati scientifici avutosi nel
XVIII secolo ed in quello precedente è quasi una garanzia che si arriverà a colmare il divario. Questo lo si desume dal confronto tra l’auspicio di Seneca e i risultati prima di Halley e poi di Clairaut.
132
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
Una volta raggiunto questo ideale, anche se a tappe e per successi parziali, sparirà completamente il
bisogno della probabilità, in quanto l’universo è completamente deterministico.
La frase che invita a questa conclusione è
«Lo spirito umano offre, nella perfezione che ha saputo dare all’astronomia, un pallido esempio di
quest’Intelligenza. Le sue scoperte in meccanica e in geometria unite a quella della gravitazione universale,
l’hanno messo in grado di abbracciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema del mondo. »
Quindi il ‘futuro’ della conoscenza è solamente deterministico. Possiamo però riconoscere nelle parole di Laplace una sottile vena polemica anti-metafisica. Il ruolo della razionalità umana si oppone
ad una visione finalistica in base alla quale sarebbe possibile ci sarebbe uno scopo cui tendono le
leggi naturali preordinato da un ente o persona. Una conclusione di Leibniz è che le leggi naturali
sono preordinate per offrici il migliore dei mondi possibili perché così vuole Dio. Anche Berkeley
giunge a ritenere che percezioni ed idee siano (pre)ordinate per i propri fini da Dio.
Laplace oppone una conclusione tratta dal principio di ragione sufficiente, in base al quale ogni effetto è generato da una causa. Ma in questo schema la casualità non trova posto, se per casualità intendiamo l’irrazionale o la volontà libera, dato che anche la volontà più libera quando sceglie, la
scelta fatta è determinata dalla volontà stessa che si configura come causa.
Un altro punto chiave è dato dalla affermazione
«La probabilità è relativa in parte a questa ignoranza, in parte alle nostre conoscenze.»
La frase mette a confronto due categorie contrapposte: ignoranza e conoscenza. Come si vedrà
qualche riga dopo, la probabilità si presenta come numero, che però non esprime quanto la nostra
conoscenza si approssimi alla certezza, ma dipende dalla capacità dello scienziato di individuare in
modo perfetto casi favorevoli e possibili. Quindi la sua essenza non è basata sulla certezza, ma sulla
situazione reale che può venire studiata ed analizzata, più o meno esaurientemente. Quindi di per sé
è un dato oggettivo. Tuttavia il concetto di probabilità rimane ambiguo, soprattutto se paragonato a
concetti ‘classici’ quali numero e figura che da lungo tempo avevano assunto uno statuto accettato
di astrazione, indipendentemente dalla natura intellettuale oppure empirica che si poteva porre alla
base della loro conoscenza. La probabilità, così come era (ed è anche oggi presentata) partecipa
contemporaneamente all’ambito logico della possibilità ed a quello empirico della misura o identificazione dei dati. Nelle applicazioni pratiche questi due aspetti talvolta sono chiari, ad esempio nei
giochi, altre volte restano sfuggenti. Ma è proprio nella natura bicefala della probabilità, che essa
può essere utilizzata come ponte tra esperienza e matematica.
Il capitolo sulla probabilità continua con vari esempi passando in rassegna altri ‘sinonimi’ di probabilità, discutendo della verosimiglianza, come causa della diversità di opinioni, dei gradi di credito
che vengono date ad informazioni e che sono relativi all’atteggiamento ed alla convinzione di chi
propone e dall’estensione delle conoscenze degli ascoltatori, l’influenza dei più istruiti su quelli che
133
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
lo sono meno e le conseguenze di queste situazioni che hanno effetti sulla eliminazione di credenze
nella magia e nell’astrologia. Sullo sfondo di queste considerazioni, la cultura e le idee
dell’illuminismo visto come un progresso dell’umanità, per cui
«Dobbiamo essere indulgenti nei riguardi delle opinioni diverse dalle nostre, perché la differenza spesso dipende
solo dai punti di vista diversi in cui ci hanno posto le circostanze. Portiamo nostri lumi a coloro che giudichiamo
insufficientemente istruiti; ma prima esaminiamo severamente le nostre opinioni e misuriamone con imparzialità
le probabilità rispettive. La differenza di opinione dipende anche dal modo con cui si determina l’influenza dei
dati che sono noti. La teoria delle probabilità affronta delle questioni così sottili, che non è per niente sorprendente se due persone giungono a risultati diversi, soprattutto in problemi molto delicati, pur avendo gli stessi dati»
Questo brano si salda idealmente con la conclusione del Saggio, circa 150 pagine dopo:
«Da questo Saggio si vede che la teoria delle probabilità non è in fondo che il buon senso ridotto al calcolo; essa
fa valutare con esattezza ciò che gli intelletti acuti avvertono per una sorta di istinto, senza che spesso se ne possano rendere conto. Se si pensa ai metodi analitici ai quali questa teoria ha dato nascita, alla verità dei principi
che le sono di base, alla logica sottile e delicata necessaria nel loro impiego per la soluzione dei problemi, alle istituzioni di utilità pubblica che si appoggiano su tale teoria, all’estensione che ha ricevuto e che può ancora ricevere dalla sua applicazione alle questioni più importanti della filosofia naturale e delle scienze morali; se si osserva poi che, anche nei problemi non sottoponibili al calcolo, essa dà i suggerimenti più sicuri atti a guidarci nei
nostri giudizi, e ci insegna a guardarci dalle illusioni le quali spesso ci ingannano, si vedrà che non esiste scienza
più degna delle nostre meditazioni e che più utilmente debba entrare nell’organizzazione della istruzione pubblica.»
La probabilità è vista come strumento per l’istruzione, per portare i lumi a quelli meno istruiti. Inoltre ci si soffermi sull’affermazione che lega la probabilità al buon senso; essa sembra messa apposta
per collocare la teoria delle probabilità in accordo con la teoria della Scienza deduttiva di Aristotele
(e con l’impostazione generale degli Elementi di Euclide) dando, quindi, una base semantica alla teoria, al di fuori della teoria stessa.
Questa impressione è confermata dal capitolo in cui si presentano gli assiomi, che proprio perché
non possono essere affermazioni del tutto astratte, ma deve essere chiaro il loro rapporto con una
‘realtà’, prendono il nome di princìpi.
Il testo spesso li presenta con qualche esemplificazione o commento. Qui li si riportano in forma
stringata, lasciando al lettore l’eventuale integrazione con le parti esplicative del testo di Laplace.
«I PRINCIPIO. Il primo principio è la definizione stessa di probabilità, che, come s’è visto, è il rapporto tra il nu-
Il
mero dei casi favorevoli e quello di tutti i casi possibili.
II PRINCIPIO. Ma ciò presuppone che i diversi casi siano ugualmente possibili. Se non lo sono, si determinano
prima le loro rispettive possibilità, la cui esatta valutazione è uno dei punti più delicati della teoria dei casi [de la
théorie des hasards]. Allora la probabilità sarà la somma delle possibilità di ciascun caso favorevole.»
primo principio costruisce immediatamente un’idea ‘numerica’ di probabilità: “la probabilità … è il
rapporto”
e tale rapporto, per la sua stessa natura, può essere espresso solo con un numero razionale.
Laplace è troppo attento per non comprendere che il primo principio, per altro dedotto da tanta letteratura precedente, non basta proprio perché richiede le due categorie di eventi: favorevoli e possibili. Ed anzi la seconda è la più “delicata” perché richiede di essere associata ad un ambito numerico
(una misura), dato che si chiede di fare un confronto in base alla condizione di uguale possibilità e
soprattutto nel caso che tale condizione non sia soddisfatta, di sommare la possibilità di ciascun ca-
134
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
so favorevole. Gli esempi che seguono il secondo principio occupano ben più spazio di quanto non
sia riservato a chiarire il concetto nella Teoria. Ciò dipende dalla difficoltà che si incontra in casi
anche non troppo complicati, di valutare l’equipossibilità. Se venisse a cadere questa, sarebbe inficiata tutta la teoria delle probabilità nel suo complesso. Questo secondo principio sposta
l’attenzione dagli aspetti analitici che erano stati predominanti negli scritti precedenti, verso direzioni più ‘logiche’ o se si vuole, ‘filosofiche’.
«III PRINCIPIO. Uno dei punti più importanti della teoria delle probabilità e che si presta di più alle illusioni, è il
modo in cui le probabilità aumentano o diminuiscono per le loro mutue combinazioni. Se gli eventi sono indipendenti gli uni dagli altri, la probabilità del verificarsi del loro insieme è il prodotto delle loro probabilità particolari. »
Nell’esempio – commento del principio, Laplace presenta un commento che pone in chiaro ciò che
per lui sono certezza matematica e certezza morale. Sta parlando del fatto che il prodotto di due
probabilità, per la loro natura di numeri minori di uno, risulta minore o uguale a ciascuno dei due
fattori (si “degradano”). Dice quindi
«Gli storici non sembrano aver fatto sufficientemente attenzione alla degradazione della probabilità dei fatti,
quando sono visti attraverso un gran numero di generazioni successive; parecchi eventi storici, ritenuti certi, risulterebbero per lo meno dubbi, se li si sottomettesse a questa prova.
Nelle scienze puramente matematiche, le conseguenze più lontane partecipano delle certezza del principio da cui
derivano. Nelle applicazioni dell’analisi alla fisica, le conseguenze hanno tutta la certezza dei fatti o delle esperienze. Ma nelle scienze morali in cui ogni conseguenza è dedotta da ciò che precede in modo puramente verosimile, per probabili che siano le deduzioni, la chance dell’errore cresce con il loro numero e finisce per sorpassare la chance della verità nelle conseguenze molto lontane dal principio»
I primi tre principi sono tutti e tre ordinati a chiarire il concetto di probabilità e alcune proprietà/ caratteristiche che ne derivano. Con l’introduzione del successivo principio inizia a rendersi evidente
come Laplace tenti di inserire il calcolo delle probabilità all’interno di una struttura scientifica che
si basi su una concezione deterministica. Questo aspetto sarà ripreso dopo la presentazione di alcuni
altri princìpi.
«IV PRINCIPIO. Se due eventi dipendono l’uno dall’altro, la probabilità dell’evento composto è il prodotto della
probabilità del primo evento per la probabilità che, verificandosi il primo, si verifichi il secondo. …
V PRINCIPIO. Se si calcola a priori la probabilità di un evento composto da questo o da un altro che si aspetta, la
seconda probabilità, divisa per la prima, sarò la probabilità dell’evento atteso, derivata dall’evento osservato….
VI PRINCIPIO. Una qualsiasi delle cause alle quali si può attribuire un evento è tanto più verosimile quanto più è
probabile che, supposta l’esistenza di tale causa, l’evento abbia luogo. La probabilità dell’esistenza di una qualunque di queste cause è dunque una frazione, il cui numeratore è la probabilità dell’evento risultante dalla causa,
ed il cui denominatore è la somma della probabilità simili relativa a tutte le cause. Se queste diverse cause, considerate a priori, hanno un diverso grado di probabilità, bisogna adoperare in luogo della probabilità dell’evento
risultante da ciascuna causa, il prodotto di questa probabilità per quella della causa stessa. È il principio fondamentale di quella parte dell’analisi dei casi che consente nel risalire dagli eventi alle cause….
VII PRINCIPIO. La probabilità di un evento futuro è la somma dei prodotti delle probabilità di ciascuna causa dedotta dall’evento osservato, per la probabilità che esistendo tale causa, l’evento futuro abbia luogo. »
Questi principi riguardano l’utilizzazione dalla probabilità, o meglio della probabilità assieme alla
probabilità condizionata. Il quarto principio introduce la probabilità condizionata, potendosi esprimere come l’uguaglianza p(E1∩E2) = p(E1)·p(E2|E1). Ciò se si interpreta la dizione “evento composto”
come intersezione dei due eventi. Oggi siamo sicuramente più abituati alla versione ‘insiemistica’,
135
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
intendendo spesso ‘composto’ come il risultato di applicazioni successive e della composizione
funzionale.
Il quinto principio si discosta poco dal precedente e potrebbe esprimersi, accettando
p(EI H)
= p(E | H) . Apparentemente non ci sap(H)
l’interpretazione di ‘composto’ come ‘intersecato’,
rebbe bisogno di questa postulazione come principio, dato che si tratta di una semplice trasformazione algebrica ottenibile dalla ‘traduzione’ formale del quarto principio, in cui E è l’evento atteso
(effetto) e H l’evento osservato (causa). Tuttavia bisogna confrontare più attentamente i testi dei
due principi: il quarto parla di contemporaneità di eventi, il secondo prevede un prima, il momento
in cui si effettua la stima a priori della probabilità della intersezione e il dopo, la realizzazione
dell’effetto. Dice infatti Laplace nel commento al quinto principio:
«Si presenta qui la questione discussa da alcuni filosofi a proposito dell’influenza del passato sul futuro.»
Il determinismo, come filosofia della causalità ‘stretta’ è sicuramente in questa posizione gnoseologica. L’Intelligenza è in grado di prevedere il futuro basandosi esclusivamente sul passato. Così si
rende lecito il passaggio dalla probabilità delle cause a quella degli effetti.
Il sesto principio sembra riprendere la seconda parte del principio del Saggio del 1774, ma stavolta
Laplace affronta esplicitamente il caso della probabilità uniforme delle cause e poi generalizza alla
considerazione che le cause possano avere probabilità diverse. Si avrà p(E j | H) =
p(H | E j )
∑ p(H | E k )
nel
k
caso di probabilità uniforme delle cause e p(E j | H) =
p(E j ) ⋅ p(H | E j )
∑ p(E k ) ⋅ p(H | E k )
in caso contrario. Si tratta
k
quindi del teorema di Bayes. Il linguaggio usato è quello di cause ed effetto, con una importante coloritura deterministica.
Il settimo principio è ancora formulato col linguaggio delle cause e dell’effetto ed ha il ‘tono’ del
cosiddetto teorema delle probabilità totali: p(H) = ∑ p(E k ) ⋅ p(H | E k ) . Anche questo si potrebbe rik
cavare dai precedenti princìpi, ma qui, come, altrove è importante il ruolo del tempo.
Restano tre ultimi princìpi ma essi non sono solo sulla probabilità, bensì riguardano la speranza. Il
concetto di speranza oggi è formulato facendo intervenire le variabili aleatorie. Nel caso di Laplace,
c’è una intuizione (tra l’altro la stessa di Pascal quando argomenta sul problema della divisione della posta) ma tale intuizione non è tale da fare diventare il concetto di variabile aleatoria un qualche
cosa di matematicamente indipendente, neppure in Huygens che tratta diffusamente del valore atteso. Dice Laplace
«La SPERANZA. La probabilità degli eventi serve a determinare la speranza o il timore delle persone interessate
alla loro esistenza. La parola speranza ha diversi significati: esprime generalmente il vantaggio di chi si attende
136
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
un bene qualsiasi, in certe ipotesi che sono soltanto probabili. Questo vantaggio, nella teoria dei casi, è il prodotto della somma sperata per la probabilità di ottenerla: è la somma parziale che dobbiamo ottenere se non vogliamo correre i rischi dell’evento, supponendo che la ripartizione si faccia proporzionalmente alle probabilità. Questa ripartizione è la sola equa, quando si faccia astrazione da tutte le circostanze estranee, perché un egual grado
di probabilità dà diritto eguale sulla somma sperata. Chiameremo tale vantaggio speranza matematica.»
L’aggettivo ‘matematico’, che è spesso usato anche oggi quando si parla di valore atteso di una variabile aleatoria, qui ha un aspetto più pregnante, in quanto dopo i tre princìpi che restano da introdurre, si parlerà anche della “speranza morale”.
«VIII PRINCIPIO. Se il vantaggio dipende da più eventi, lo si calcola mediante la somma dei prodotti della probabilità di ciascun evento per il bene collegato al suo verificarsi…
IX PRINCIPIO. In una serie di eventi probabili in cui gli uni producano un bene e gli altri una perdita, il vantaggio
sarà rappresentato dalla somma dei prodotti della probabilità di ciascun evento favorevole per il bene che procura, alla quale sia stata sottratta la somma di ciascun evento sfavorevole per la perdita che si accompagna loro. Se
la seconda somma supera la prima, il beneficio diventa perdita e la speranza si tramuta in timore….
X PRINCIPIO. Il valore relativo di una somma infinitamente piccola è uguale al suo valore assoluto diviso per il
bene totale posseduto dalla persona interessata.»
I princìpi ottavo e nono sono una cosa sola, e la loro differenziazione è motivata esclusivamente
dalla (evidente) scarsa familiarità con in numeri negativi. Essi coincidono con le definizioni che si
trovano oggi sui libri di probabilità. Ad esempio P. Baldi (1993). Calcolo delle probabilità e statistica, Milano: McGraw-Hill Libri Italia srl. (p. 47) afferma
«Sia X una variabile aleatoria discreta che prenda i valori x1, x2, … ed indichiamo con p la sua densità.
Definizione 2.28 Diremo che X ha speranza matematica finita se Σi |xi| p(xi) < + ∞. In questo caso si chiama
speranza matematica di X la quantità E[X] = Σi xi p(xi) = Σi xi p{X=xi}. »
Nella condizione che risulta importante nel caso la variabile aleatoria assuma infiniti valori, il che
farebbe divenire la sommatoria una serie, si impone una condizione di convergenza assoluta; nel caso che i valori assunti dalla variabile aleatoria siano elementi di un insieme finito, banalmente la
prima condizione è soddisfatta. In essa intervengono valori assoluti perché sono possibili numeri
anche negativi.
Il decimo principio sembra del tutto slegato dai precedenti. Esso infatti è motivato da un caso particolare che è noto col nome di Paradosso di San Pietroburgo. Non è del tutto chiaro chi ne sia stato
l’autore. Nell’opera di Montmort tale problema viene presentato all’autore da Nicolas Bernoulli e
poi discusso da molti altri. Il nome lo si deve perché il problema compare nei Commentarii
dell’Accademia di San Pietroburgo. Lo si ritrova qui in Laplace, prima del decimo principio:
«Paolo gioca a testa o croce alla condizione di ricevere 2 franchi se uscirà croce al primo lancio, 4 franchi se uscirà solo al secondo, 8 franchi se uscirà solo al terzo e così di seguito. La posta in gioco deve essere, per l’ottavo
principio, uguale al numero dei lanci, per cui, se la partita continua all’infinito, la posta deve essere infinita. Ciò
nonostante, nessun uomo ragionevole esporrebbe a questo gioco una somma anche modesta, 50 franchi per esempio. A che cosa è dovuta questa differenza tra il risultato del calcolo e l’indicazione del buon senso? Ci si è
accorti già da tempo che è dovuta al fatto che il vantaggio morale che un bene ci procura non è proporzionale ad
esso, ma dipende da mille circostanze spesso difficili a definirsi, tra cui la più generale e importante è la fortuna.
Infatti è chiaro che 1 franco ha molto più valore per colui che e ha solo 100 che per un milionario. Bisogna, perciò, distinguere nel bene che si spera il valore assoluto dal valore relativo: quest’ultimo dipende dai motivi che lo
fanno desiderare, mentre il primo ne è indipendente. Non esistono princìpi generali per calcolare il valore relativo.»
137
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
A questo punto Laplace, attribuendolo a Daniele Bernoulli, formula il decimo
principio.
Il paradosso di San Pietroburgo consiste nel fatto che la speranza di vincita del
gioco è data dalla somma dei prodotti delle vincite in caso si realizzino per le riDaniel Bernoulli
1700 - 1782
spettive probabilità di successo ed in questo caso (sempre che la moneta non si alteri nei lanci successivi), essendo ½ la probabilità di ‘croce’ in un lancio singolo,
quella di ottenere croce solo al k-esimo lancio è data da (½)k; pertanto la speranza matematica è data
come serie 2 ⋅
1
1
1
2k
+ 4 ⋅ + 8 ⋅ + .... = ∑ k = ∑1 che è divergente. Oggi tale paradosso lo si usa pro2
4
8
k 2
k
prio per giustificare il fatto che si definisca la speranza matematica solo dopo essersi assicurati che
essa sia finita (e quindi non si può dire che il paradosso sia stato risolto, ma solo evitato).
Il problema del valore relativo è quello che ‘promuove’ quasi tutte le lotterie i cui proventi finiscono poi allo stato. La probabilità di riuscire ad indovinare 5 numeri sorteggiati, senza restituzione, tra
90 è molto piccola, ma anche se appare piccola la somma che serve per puntare su una cinquina è in
valore ‘assoluto’ nel senso di Laplace più piccola di quanto non appaia allo scommettitore, attratto
dalla cifra messa in palio. Così il valore relativo appare basso, mentre è sicuramente più elevato del
valore ‘assoluto’. Ed infatti il vero vincitore dei vari concorsi proposti dallo stato è lo stato stesso. È
a questo proposito che Laplace parla di speranza morale, legata al valore relativo, osservando che
tal speranza coinciderebbe con quella matematica solo in presenza di un capitale infinito.
«Da questo si può giudicare quanto siano immorali quei giochi nei quali la somma sperata è inferiore a quel prodotto [il prodotto della somma sperata per la sua probabilità]. Essi sussistono grazie alle false giustificazioni ed
alla cupidigia che fomentano, e che, spingendo il popolo a sacrificare ciò che gli è necessario a delle speranze
chimeriche la cui inverosomiglianza non sa giudicare, sono la fonte di un’infinità di mali. »
Il testo procede poi illustrando i metodi analitici del calcolo delle probabilità, tra le quali le funzioni
generatrici che occupano l’intero primo capitolo della Teoria. A questo seguono le applicazioni ai
giochi, ad alcune disuguaglianze. Trattando di quest’ultimo tema (nella terza edizione) si lascia trasportare da un impeto pacifista (ben lontano dal suo pensiero in epoca napoleonica):
«Considerate i felici effetti delle istituzioni fondate sulla ragione e sui diritti naturali dell’uomo, presso i popoli
che hanno saputo stabilirle e conservarle. Considerate ancora i vantaggi procurati dalla buona fede ai governi che
ne hanno fatto il fondamento della loro condotta. Come sono stati ricompensati dei sacrifici che hanno dovuto affrontare per mantenere con scrupolosa esattezza i propri impegni! Quale immenso credito all’interno! Quale influenza all’estero! Pensate invece a quali abissi di sciagure siano stati spesso precipitati i popoli dall’ambizione e
dalla perfidia dei loro capi. Ogni volta che una grande potenza, inebriata dal desiderio di conquista, aspira alla
dominazione universale, il sentimento di indipendenza produce una coalizione tra le nazioni minacciate, di cui
essa diventa quasi sempre la vittima.»
La conclusione di questa poetica perorazione si conclude con l’affermazione che il buon governo
interno ed esterno deve fare uso del calcolo delle probabilità. Sembra un invito platonico aggiornato
a portare al governo i filosofi (del XIX secolo).
138
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
Continua applicando la probabilità al problema delle nascite, alla filosofia naturale,
alle testimonianze, alle elezioni ed assemblee, alle sentenze dei tribunali, alle tavole di mortalità. Un capitolo è dedicato alle illusioni nella stima delle probabilità in
cui si occupa ancora della ‘immoralità’ delle lotterie. Tra le illusioni cita pure la seGuido Grandi
1671 - 1742
∞
rie di Grandi ∑ (− 1)k , con le parole
k =0
«Calcolo tra le illusioni l’applicazione che Leibniz e Daniele Bernoulli hanno fatto del calcolo delle probabilità
alla somma delle serie. Se si sviluppa la frazione il cui numeratore è l’unità e il cui denominatore è l’unità più
una variabile, in una serie ordinata in rapporto alle potenze della variabile [cioè 1 = ∞ (− x )k ] è facile notare
1+ x
∑
k =0
che, supponendo la variabile uguale all’unità la frazione diventa ½, e la serie diventa più uno, meno uno, più uno,
meno uno, ecc. Sommando i primi due termini, i due successivi, ecc. si trasforma la serie in un’altra in cui ogni
termine è zero. Grandi, gesuita italiano, ne aveva concluso la possibilità della creazione, perché, essendo la successione sempre uguale a ½ , vedeva la frazione nascere da un’infinità di zero, cioè dal nulla. Allo stesso modo
Leibniz credette di scorgere l’immagine della creazione nella sua aritmetica binaria, in cui egli non adoperava
che i due caratteri zero e uno. Egli immaginò che l’unità potesse rappresentare Dio, lo zero il nulla, e che l’essere
supremo avesse tratto dal nulla tutti gli esseri esistenti, come l’unità con lo zero esprime tutti i numeri in questo
sistema d’aritmetica. L’idea piacque tanto a Leibniz che ne fece parte al gesuita Grimaldi, presidente del tribunale di matematica in Cina, nella speranza che questo simbolo della creazione convertisse al cristianesimo
l’imperatore di allora, che amava in modo particolare le scienze. Ho riportato questo episodio per mostrare sino a
qual punto i pregiudizi ricevuti dall’infanzia possano indurre in errore gli intelletti più profondi. Leibniz, suggestionato anche questa volta da una metafisica singolare e molto sottile, considerò che la serie più uno, meno uno,
più uno, meno uno, ecc. diventa uno o zero a seconda che ci si fermi ad un numero di termini dispari o pari; e
siccome nell’infinito non c’è nessun motivo per preferire il numero pari o quello dispari, si deve, secondo le regole della probabilità, prendere la metà dei risultati relativi a queste due specie di numeri, che sono zero e uno: si
ottiene ½ per il valore della serie. Daniele Bernoulli ha esteso più tardi questo ragionamento alla somma delle serie formate da termini periodici…. Così la serie più uno, meno uno, più uno, meno uno, ecc. può nascere da frazione il cui numeratore è l’unità più una variabile e il denominatore è il numeratore stesso sommato al quadrato
della variabile. Supponendo la variabile uguale all’unità lo sviluppo si tramuta nella serie proposta, e la frazione
generatrice diventa uguale a 2/3; le regole della probabilità darebbero allora un falso risultato, è il che prova
quanto sarebbe dannoso ricorrere a simili ragionamenti…»
Il controesempio è assai interessante dal punto di vista matematico, infatti si può affrontare lo sviluppo della frazione data in più modi. Si può considerare come la somma di una serie geometrica di
− x2
1+ x
primo termine 1 e ragione
in quanto:
=
1+ x
1 + x + x2
k
 − x2 
 . Come serie ge= ∑ 
 − x 2  k = 0  1 + x 

1− 
1+ x 


1
∞
ometrica la convergenza si ha quando la ragione, in valore assoluto, è minore di 1 e ciò comporta
che x ≠ -1 e x2 < |1+x| e ciò comporta
1− 5
1+ 5
<x<
, intervallo cui appartiene 1. In tale serie
2
2
quando x = 1, i coefficienti non assumono i valori più uno e meno uno quando si ponga la variabile
uguale all’unità, caso in cui il termine generico diviene una potenza di ½ a segni alternati, quindi si
tratta di una serie convergente a 2/3. Ma in questo modo la frazione data si sviluppa non come serie
di
potenze,
bensì
come
serie
di
funzioni.
1+ x
In
altro
modo
si
può
scrivere
1
=
(
1
+
x
)
, quindi come somma di una progressione geometrica di primo
1 − (− x )(1 + x )
1 + x + x2
139
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
termine 1+ x e ragione (-x)(1+x). Si ha allora
converge se |-x(1+x)| < 1 e ciò avviene se
1+ x
∞
= ∑ (− x )k (1 + x )k +1 . In questo caso la serie
2
1+ x + x
k =0
−1 − 5
−1+ 5
e in questo caso 1 non appartiene
<x<
2
2
all’intervallo. Apparentemente abbiamo ancora una serie di funzioni, ma basta calcolare una somma
parziale per rendersi conto che, a parte il modo in cui è scritta, si tratta di una serie di potenze. Si ha
5
infatti ∑ (− x )k (1 + x )k +1 = (1+x) – x(1+x)2 + x2(1+x)3 – x3(1+x)4 + x4(1+x)5 –x5(1+x)6 = 1+x –
k =0
x(1+2x+x2)
+
x2(1+3x+3x2+x3)
–
x3(1+4x+6x2+4x3+x4)
+
x4(1+5x+10x2+10x3+5x4+x5)
–
x5(1+6x+15x2+20x3+15x4+6x5+x6) = 1 + (1-1)x + (-2+1)x2 + (-1+3-1)x3 + (3-4+1)x4 +(1-6+5-1)x5 +
(-4+10-6+1)x6 + (-1+10-15+7-1)x7 + (5-20+21-8+1)x8 + (1-15+35-28+9-1)x9 + (-6+35-56+3610+1)x10+(-1+21-70+84-45+11-1)x11 = 1 + 0x - x2 +x3 + 0x4 – x5 + (6-5)x6 + (-6+6)x7 + (-15+14)x8
+ (-14+15)x9 + (-6+6)x10 + (-1+0)x11
n +1
n +1− k 
 con la convenzioPiù in generale il coefficiente di xn nella serie è dato da an = ∑ (− 1)k 
k =0
 k

ne che quando l’indice inferiore del coefficiente binomiale è maggiore dell’indice superiore, il coefficiente binomiale è 0. Quindi si ha che
1+ x
∞
∞
= ∑ (− x )k (1 + x )k +1 = ∑ an x n . Si prova con un
2
1+ x + x
k =0
n =0
po’ di pazienza che an = 1 se n ≡ 0 (mod. 3), an = 0 se n ≡ 1 (mod. 3) e an = -1 se n ≡ 2 (mod. 3). Di
conseguenza anche questa serie per x = 1 si presenta come la serie di Grandi.
Riprendendo l’analisi del testo, si trova che Laplace fornisce qualche criterio per “avvicinarsi alla
certezza” e conclude il Saggio con un cenno storico sul calcolo delle probabilità. In esso prende le
mosse dall’epistolario tra Pascal e Fermat, poi cita Huygens, Hudde, De Witt, Halley e Jacob Bernoulli ed altri della famiglia di Basilea. Passa poi a Montmort e Moivre (lui lo chiama così). Ricorda Stirling e Wallis. Fa poi un elenco ampio: Deparcieux, Kersseboom, Wargentin, Dupré de SaintMaure, Simpson, Sussmilch, Messène, Moheau, Price, Baily e Duvillard. Un posto rilevante è lasciato a Bayes ed al suo procedimento “sottile, ingegnosissimo, anche se un po’ ingarbugliato”. Rilievo dato
anche a Lagrange, ma non cita altri italiani e, in questa parte nemmeno Buffon, né Condorcet e neppure D’Alembert.
4.1.8. La Teoria analitica (seconda parte). Lo stile della Teoria analitica è quello tipico e stringato
dei saggi precedenti. Un traduttore inglese dell’opera del francese ebbe a dire
«Whenever I meet in La Place with the words ‘Thus it plainly appears’ I am sure that hours, and perhaps days of
hard study will alone enable me to discover how it plainly appears. »
140
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
Si ha spesso l’impressione che il richiamo alla ovvietà nasconda anche qualche difficoltà (almeno
espositiva) di Laplace. Ci sono anche alcune affermazioni erronee, in alcuni casi si tratta di sviste
tipografiche. Talvolta Laplace si esprime solo a parole ma risulta poi assai difficile intendere come
tradurre le sue affermazioni in formule. L’autore dice che il trattato è diviso in due parti (o libri). Il
primo riguarda le funzioni generatrici. Ma oltre ad una prima parte relativo al calcolo con tali funzioni, che è una ristampa di una memoria Mémoire sur les Suites del 1779; c’è poi un’ampia discussione relativi ai calcoli approssimati che vengono utilizzati nel calcolo delle probabilità. Di un certo
interessa l’apprezzamento del potere espressivo del calcolo algebrico dopo Cartesio e Wallis. Cita
poi l’intuizione di Leibniz di utilizzare in modo nuovo tale calcolo coi differenziali. Le funzioni generatrici che vengono qui studiate, hanno perso molto del loro interesse dopo l’approccio più vicino
agli aspetti strutturali proposto da Boole.
La parte che riguarda l’approssimazione dei calcoli è di fatto una ristampa della memoria Sur les
approximations de Formules qui sont fonctions de très grands nombres del 1782. In questa parte
mostra, per la prima volta nella letteratura, il calcolo di integrali abbastanza complessi. Tra essi
2
compare anche l’integrale della funzione e −t e di questo integrale offre diverse approssimazioni
sia come serie che come frazioni continue. Passa in seguito allo studio di equazioni alle differenze
finite e mostra che nel caso lineare è possibile usare integrali definiti. Nella parte terminale del primo libro si concentra sulle possibili approssimazioni di particolari ed in qualche caso trova soluzioni reali passando al campo complesso. Usa anche espressioni ‘polinomiali’ in cui gli esponenti sono
negativi. Alcuni dei suoi risultati, affermati ma non dimostrati, saranno la ‘palestra’ di molti giovani
matematici francesi che giungeranno a dimostrare le formule proposte da Laplace.
Nel secondo libro, il primo breve capitolo tratta dei principi generali della teoria, con qualche esempio. Nella prima edizione del 1812 il chiarimento sulla posizione matematica e filosofica di Laplace era esplicitato in questa parte, ma l’aggiunta dell’ampia introduzione della seconda edizione
ha reso quasi superfluo il capitolo. L’unico interesse consiste nel confrontare se ci sono discrepanze
tra le due presentazioni. Sicuramente in questo capitolo il linguaggio è più asciutto e gli esempi sono trattati in modo sintetico. Anche temi importanti come la speranza, prendono poche righe. C’è
però esplicitata quasi sempre la ‘traduzione’ in formule dei principi esposti a parole.
Il testo passa poi a trattare singoli problemi e ad applicare ad essi i procedimenti analitici approntati.
Al tema delle medie è riservato un capitolo a parte, che riprende risultati pubblicati in varie memorie, a partire da quella del 1774. In questo capitolo lo stile è oscuro ed è assai difficile seguire lo svolgimento proposto. Poisson, di fatto ha riscritto
questa parte in uno stile più accessibile ed ha anche dimostrato alcuni risultati di
Siméon Poisson
1781 - 1840
maggiore generalità. Il grande merito di Laplace è di avere ivi (ri)presentato il me-
141
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
todo dei minimi quadrati, dandone anche uno studio approfondito del tipo di approssimazione che
esso permette e le sue generalizzazioni a più variabili (qualche studioso lo attribuisce però a Legendre).
In complesso si ritrovano anche nella Teoria analitica gli stessi argomenti che sono stati introdotti
ed elencati nell’analisi del Saggio filosofico, ma oltre alla spiegazione a parole, a volte assai ridotta,
Laplace nella Teoria dà prova di grande abilità analitica.
4.2. L’impostazione logicista.
L’approccio di Laplace trova molti sostenitori, soprattutto sul continente e viene ampliato ed approfondito, condividendo la proposta del matematico francese di trattare i problemi probabilistici in
termini analitici e quantitativi.
Nel 1854 Boole pubblica il suo trattato sulle leggi del pensiero, ma in esso una parte considerevole
è legata alla probabilità, in cui l’approccio alla probabilità cambia notevolmente. Si inizia così una
scuola di pensiero che segue e sviluppa la proposta booleana. Nel XIX secolo gli studiosi di probabilità che seguono questa nuova via sono quasi esclusivamente inglesi.
4.2.1. L’ambiente culturale inglese dell’inizio del XIX secolo. Per comprendere meglio l’opera di
Boole e di altri matematici che operano nel Regno Unito, bisogna tenere
conto della particolarità della cultura Inglese del periodo.
Nasce nelle università inglesi più prestigiose un modo di
intendere la matematica che piano piano si distacca dagli
aspetti esclusivamente quantitativi, per approdare a risultaWilliam Rowan Hamilton
1805 - 1865
ti qualitativi e strutturali. Lo studio di quella che oggi
all’università si chiama Algebra trova il suo fondamento
nell’opera di giovani matematici inglesi che hanno posto attenzione sulle ‘forme’ e
Arthur Cayley
1821 - 1895
che sono giunti anche ad individuare (William Rowan Hamilton) una struttura ‘numerica’ di corpo
(campo non commutativo), provocando una sorta di scompiglio nelle idee costituite. Ad un altro inglese, Cayley si devono vari teoremi sui gruppi e le tavole che come le cosiddette tavole pitagoriche, rappresentano le operazioni dei gruppi, ma a differenza di quelle pitagoriche (ordinarie) sono
‘chiuse’. In questa situazione un’indagine come quella intrapresa da Boole sulle leggi del pensiero
diviene accettabile anche se, partita con l’idea potesse dare risultati quantitativi, si scopre ben presto
che non può rientrare in una aritmetica numerica, ma deve essere trattata con altri strumenti. Per
142
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
qualche pensatore, il risultato di Boole è il primo esempio di struttura matematica astratta. Intanto De Morgan presentava la sua complessa teoria dei sillogismi, ridotta a puntini e parentesi.
Si assiste in questo modo ad un ampliamento sostanziale del concetto di matematica, da sempre vista come scienza dei numeri e delle figure, che diviene
Augustus De Morgan
1806 - 1871
ora anche studio delle forme. Di fatto l’evoluzione del linguaggio algebrico
aveva preparato il terreno, ma è proprio dal potere espressivo e dimostrativo
delle formule che nasce la riflessione inglese che porta a Boole.
4.2.2. La definizione di probabilità secondo Boole. Il testo di An Investigation of the Laws of
Thought, on which are founded the mathematical Theory of Logic and Probabilities, disponibile in
rete web, è quello della prima edizione del 1854. L’opera consta di una prefazione ed indice di 7
pagine numerate alla romana, poi 424 pagine, seguito da una pagina di note ed una di errata. I capitoli dallo XVI allo XXII riguardano le probabilità e le loro applicazioni. Però già nel primo capitolo,
una sorta di introduzione generale all’opera, viene affrontato il problema della probabilità.
«13. The measure of the probability of an event is usually defined as a fraction, of which the numerator represents the number of cases favourable to the event, and the denominator the whole number of cases favourable
and unfavourable; all cases being supposed equally likely to happen. That definition is adopted in the present
work. At the same time it is shown that there is another aspect of the subject (shortly to be referred to) which
might equally be regarded as fundamental, and which would actually lead to the same system of methods and
conclusions. It may be added, that so far as the received conclusions of the theory of Probabilities extend, and so
far as they are consequences of its fundamental definitions, they do not differ from the results (supposed to be
equally correct in inference) of the method of this work.
Again although questions in the theory of Probabilities present themselves under various aspects, and may be
variously modified by algebraical and other conditions, there seems to be one general type to which all such
questions, or so much of each of them as truly belongs to the theory of Probabilities may be referred. Consider
with reference to the data and the quæsitum, that type may be described as follows: -1st The data are the probabilities of one or more given events, each probability being either that of the absolute fulfilment of the event to
which it relates, or the probability of its fulfilment under the given supposed conditions. 2ndly. The quæsitum, or
object sought, is the probability of the fulfilment, absolutely or conditionally, of some other event differing in
expression from those in the data, but more or less involving the same elements. As concerns the data, they are
either causally given, - as when the probability of a particular throw of a die is deduced from a knowledge of the
constitution of the piece, - or they are derived from observation of repeated instances of the success or failure of
events. In the latter case the probability of an event may be defined as the limit toward which the ratio of the favourable to the whole of number observed cases approaches (the uniformity of nature being presupposed) as observations are indefinitely continued. Lastly, as concerns the nature or relation of the event in question, an important distinction remains. Those events are either simple or compound. By a compound event is meant one of
which the expression in language, or conception in thought, depends upon the expression or the conception of
other events, which, in relation to it, may be regarded as simple events. To say “it rains”, or to say “it thunders”,
is to express the occurrence of a simple event; but to say “it rains and thunders”, or to say “it either rains or
thunders”, is to express that of a compound events. For the expression of that event depends upon elementary
expressions, “it rains”, “it thunders”. The criterion of simple events is not, therefore, any supposed simplicity in
their nature. It is founded solely on the mode of their expression in language or conceptions in thought. »
Il brano è ricco di interesse. Boole inizia presentando l’approccio classico che si ritrova, ad esempio
in Laplace nel Saggio, dicendo che la fa propria. Ma avverte che c’è un altro aspetto fondamentale
che può portare alle stesse conclusioni e che è più in sintonia con metodi del suo trattato, il cui argomento è dato dalle leggi del pensiero. Accetta che si possano approfondire le questioni legate alle
143
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
probabilità mediante vari approcci ed anche considera gli aspetti algebrici che intervengono per argomentare sul tema, ma afferma l’esistenza di un tipo generale cui si riferiscono tutte le questioni
relative alla probabilità. Distingue tra i dati assegnati e ciò che si deve trovare. Tra i dati comprende
le probabilità di uno o più eventi, che poi chiamerà semplici, essendo tali probabilità o la certezza
del risultato o la certezze data in certe ipotesi o condizioni. L’oggetto ricercato è la probabilità assoluta o condizionale (e compare qui esplicitamente la nozione di probabilità condizionale) di qualche
altro evento.
L’approccio logicista a questo punto si rivela appieno: l’evento di cui si deve trovare la probabilità,
si presenta con una espressione diversa da quella dei dati. Sulla probabilità degli eventi semplici
propone che questi siano o dati come conseguenza causale della situazione ( fa l’esempio della costituzione fisica del dado – approccio deterministico) oppure ricavati a posteriori come limite della
frequenza (approccio frequentista). Ma una volta assegnata tale valutazione di probabilità sugli eventi semplici, interviene il linguaggio o la concettualizzazione che opera sulle espressioni linguistiche con cui dagli eventi semplici si costruiscono quelli composti. Anche per riconoscere la ‘semplicità’ degli eventi ci si basa sul modo di esprimere l’evento.
Questo aspetto linguistico è del tutto innovativo.
L’argomento della probabilità si ripresenta (anzi diviene il tema principale) dal capitolo XVI in poi.
Si riporta l’incipit del capitolo XVI:
«1. Before the expiration of another year just two centuries will have rolled away since Pascal solved the first
known question in the theory of Probabilities, and laid, in its solution, the foundation of a science possessing no
common share of the attraction which belongs to the more abstract of mathematical speculations. The problem
which the Chevalier de Méré, a reputed gamester proposed to the recluse of Port Royal (not yet withdrawn from
the interest of science by the more distracting contemplation of the “greatness and the misery of man”) was the
first of a long series of problems destined to call into existence new methods in mathematical analysis, and to
render valuable service in the practical concern of life. Nor does the interest of the subject centre merely in its
mathematical connexion, or its association of utility. The attention is repaid which is devoted to the theory of
Probabilities as an independent object of speculation, - to the fundamental modes in which it has been conceived,
- to the great secondary principles which, as in the contemporaneous science of Mechanics, have gradually been
annexed to it, - and, lastly, to the estimate of the measure of perfection which has been actually attained. I speak
here of that perfection which consists in unity of conception and harmony of processes. Some of these points it is
designed very briefly to consider in the present chapter.»
Per introdurre la probabilità Boole assume una definizione data da Poisson nella Recherche sur la
Probabilité des Jugements, in base alla quale la probabilità di un evento è la ragione che noi abbia-
mo di credere che esso abbia avuto luogo, o che esso avrà luogo. La misura della probabilità di un
evento è il rapporto del numero di casi favorevoli all’evento, rispetto al numero totale di casi favorevoli o contrari, e tutti ugualmente possibili (uguale possibilità di avere luogo).
La definizione classica è però letta da Boole in un modo diverso:
«From these definitions in follows that the word probability, in its mathematical acceptation, has reference to the
state of our knowledge of the circumstances under which an event may happen or fail. With the degree of information which we possess concerning the circumstances of a event, the reason we have to think that it will occur,
or, to use a single term, our expectation of it, will vary. Probability is expectation founded upon partial knowl-
144
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
edge. A perfect acquaintance with all the circumstances affecting the occurrence of an event would change expectation into certainty, and leave neither room nor demand for a theory of probability. »
In questo brano è posto l’accento sugli aspetti soggettivi della probabilità, in quanto trova connessioni tra la probabilità e lo stato di conoscenza personale “our knowledge”. Distingue tra probabilità
ed aspettativa in quanto ritiene che l’aspettativa in condizioni di completa conoscenza coincide con
la certezza, ma fa assumere alla probabilità il ruolo di connessione tra aspettativa e conoscenza incompleta. La scelta soggettivista ha però dei costi che Boole è attento ad indicare, offrendo poi una
proposta di soluzione:
«Though our expectation of an event grows stronger with the increase of the ratio of the number of the known
cases favourable to its occurrence to the whole number of equally possible cases, favourable or unfavourable, it
would be unphilosophical to affirm that the strength of that expectation, viewed as an emotion of the mind, is capable of being referred to any numerical standard. The man of sanguine temperament builds high hopes where
the timid despair, and the irresolute are lost in doubt. As subject of scientific inquiry, there is some analogy between opinion and sensation. The thermometer and the carefully prepared photographic plate indicated, not the
intensity of the sensations of heat and light, but certain physical circumstances which accompany the production
of those sensations. So also the theory of probabilities contemplates the numerical measure of the circumstances
upon which expectation is founded; and this object embraces the whole range of its legitimate applications.»
Si accetta, quindi, l’aspetto quantitativo della probabilità. Dopo alcuni esempi, illustra i tipi di conoscenza che intervengono nella determinazione della probabilità sono di due tipi: la conoscenza delle
cause che ne provocano l’avverarsi (approcci causale), oppure l’osservazione delle serie storiche
(approccio frequentista) . Ma l’attenzione di Boole si focalizza su la natura degli eventi:
«Now in the most general, yet strict meaning of the term “event”, every combination of events constitutes also
an event. The simultaneous occurrence of two or more events, or the occurrence of an event under given conditions, or in any conceivable connexion with other events, is still an event. Using the term in this liberty of application, the object of the theory of probabilities might be thus defined. Given the probabilities of any events, of
whatever kind, to find the probability of some other event connected with them. »
In questo brano Boole pone le fondamenta di quello che sarà l’approccio assiomatico di Kolmogorov. Una volta stabilita la distribuzione di probabilità su certi eventi, il calcolo
delle probabilità si svolge in modo uniforme sugli eventi ottenuti da quelli dati
in partenza seguendo opportune regole. Non si tratta, quindi, di affrontare ogni
volta ciascun singolo problema con un metodo specifico adatto al problema,
Andrey Kolmogorov
1903 - 1987
ma di trovare forme generali cui riferirsi. L’approccio del nostro autore è completamente in accordo con la nuova tradizione matematica inglese .
L’esempio offerto è quello del dado in cui i dati noti sono che la probabilità del primo evento: ‘esce
1 al primo lancio’ e la probabilità del secondo evento: ‘esce 1 al secondo lancio’ sono entrambe uguali a 1/6. L’evento composto di cui si vuole determinare la probabilità è allora dato da ‘esce uno al
primo lancio e non esce uno al secondo lancio, oppure non esce uno al primo lancio ed esce uno al
secondo lancio’. L’evento composto afferma essere «a certain disjunctive combination of the simple events
involved or implied in the data.»
In questo caso, come in molti problemi relativi a giochi d’azzardo e
che, a suo dire, hanno ricevuto una immeritata attenzione, si possono individuare gli eventi semplici, le cui probabilità possono essere note a priori. In altri problemi originati da osservazioni di fatti
145
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
naturali o sociali è assai difficile individuare gli eventi (veramente) semplici che entrano a comporre
un evento complesso. L’individuazione di un qualche metodo generale risulta non solo essenziale
per lo sviluppo perfetto della teoria delle probabilità, ma forse necessario per le applicazioni ad ampie classi di indagini pratiche.
Prima di continuare, però gli preme mettere in luce il punto fondamentale del suo approccio:
«… to notice that there is another form under which all questions in the theory of probabilities may be viewed;
and this form consists in substituting for events the propositions which assert that those events have occurred, or
will occur; and viewing the element of numerical probability as having reference to the truth of those propositions, not to occurrence of the events concerning which they make assertion. Thus, instead of considering the
numerical fraction p as expressing the probability of the truth of the occurrence of an event E, let it be viewed as
representing the probability of the truth of the proposition X, which asserts that the event E will occur. Similarly,
instead of any probability, q, being considered as referring to some compound event, such as the concurrence of
the events E and F, let it represent the probability of the truth of the proposition which asserts that E and F will
jointly occur; and in like manner, let the transformation be made from disjunctive and hypothetical combinations
to disjunctive and conditional propositions, Though the new application thus assigned to probability is a necessary concomitant of the old one, its adoption will be attended with a practical advantage drawn from circumstances that we have already discussed the theory of propositions, have defined their principal varieties, and established methods for determining, in every case the amount and the character of their mutual dependence.»
Boole, con la proposta di sostituire le proposizioni agli eventi è in grado di fare due cose: la prima è
che anche per gli eventi semplici c’è un modo per valutarne la probabilità a priori sulla base della
loro verità; la seconda è che una volta assegnata la probabilità agli eventi semplici, o meglio individuata in quali casi c’è la verità per le proposizioni che li descrivono, la determinazione delle probabilità degli eventi composti segue in modo sorprendente la determinazione della verità per le proposizioni che vengono composte con i connettivi come spiegato nella prima parte del testo. Quindi offre un procedimento a priori, legato alla sua analisi della logica.
Nel capitolo XVII, dopo avere spiegato il suo approccio alla probabilità propone quello che lui
chiama un “metodo generale per risolvere i problemi nella teoria della probabilità”. Per esporre il
metodo si richiama ai principi che Laplace ha posto nel Saggio, ma li riformula ed interpreta a modo suo:
«I. When it is certain that an event will occur, the probability of that event, in the above mathematical sense, is
1. For the cases which are favourable to the event, and the cases which are possible, are in this instance the same.
Hence, also, if p be the probability that an event x will happen, 1-p will be the probability that the said event will
not happen.
II. The probability of the concurrence of any two events is the product of the probability of either of those event
by the probability that if that event occur, the other will occur also.
III. The probability that if an event x occur, the event y will, is a fraction whose numerator is the probability of
their joint occurrence, and denominator the probability of the occurrence of the event x.
IV. The probability of the occurrence of some one of a series of exclusive events is equal to the sum of their
separate probabilities»
Lasciamo al lettore il confronto con i princìpi di Laplace. Nel IV principio, l’uso del termine “serie”
potrebbe fare pensare alla σ-addittività. Poi dagli esempi risulta chiaro che sta trattando il caso finito.
A questi, che qui riportiamo in forma stringata, fa seguire, in genere, qualche esempio e spiegazione. Passa alla definizione di eventi indipendenti usando quella proposta da Bayes. Come visto in
146
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
quel caso, la definizione sembra privilegiare l’uno sull’altro e per comprendere che i ruoli si possano scambiare è indispensabile il teorema di Bayes. Poi fornisce come principio quello che in altri
contesti si usa come definizione:
«V. The probability of the concurrence of two independent events is equal to the product of the separate probabilities of those events.»
Avverte che c’è un altro principio, ma prima di introdurlo vuole presentare alcune osservazioni.
Intanto ribadisce la necessità di distinguere tra eventi semplici ed eventi composti. Il problema che
pone è che frasi semplici come “essere in salute” potrebbe essere il risultato di una molteplicità di
eventi. Per districarsi da questa complessa situazione propone di assumere come eventi semplici
quelli che, in base all’uso del linguaggio consueto, sono espressi mediante un solo verbo cioè mediante quello che in grammatica viene detto una frase semplice, anche se con questo non si intende
attribuire semplicità agli eventi in sé, ma eventi semplici saranno detti quelli che vengono descritti
come frasi semplici in termini grammaticali.
Questa osservazione pone Boole in una direzione completamente innovativa nell’ambito della probabilità: la sostituzione del concetto non chiaro e non chiarito di ‘evento’ (semplice) con quello linguistico di frase (semplice) universalmente inteso.
Allora l’essere un evento semplice o composto non riguarda più la natura del fatto o del fenomeno,
ma si riferisce alla sua descrizione verbale. Però Boole non ritiene sufficiente questa opzione linguistica per decidere della dipendenza o indipendenza di due eventi. Cerca di risolvere il problema,
chiamando a giustificazione la conoscenza e l’informazione, cosa che non deve stupire data
l’attenzione alle leggi del pensiero, ma il suo tentativo è quello di ragionare mediante la logica e
non con la probabilità
«If my knowledge of two simple events is confined to this particular fact, viz., that the probability of the occurrence of one of them is p, and that of the other q; then I regard the events as independent, and thereupon affirm
that the probability of their joint occurrence is pq. But the ground of this affirmation in not that the events are
simple ones, but that the data afford no information whatever concerning any connexion or dependence between
them. When the probabilities of events are given, but all information respecting their dependence withheld, the
mind regards them as independent. And this mode of thought is equally correct whether the events, judged according to actual expression, are simple or compound, i.e., whether each of them is expressed by a single verb or
by a combination of verbs…. We must regard the events as independent of any connexion beside that of which
we have information, deeming it of no consequence whether such information has been explicitly conveyed to us
in the data, or thence deduced by logical inference .»
Sulla base di queste scelte formula il successivo principio:
«VI. The events whose probabilities are given are to be regarded as independent of any connexion but such as is
either expressed, or necessarily implied, in the data; and the mode in which our knowledge of that connexion is
to be employed is independent of the nature of the source from which such knowledge has been derived. »
Come si può apprezzare, la proposta di Boole si distacca sempre di più da quella classicodeterministica di Laplace.
In questo modo, prescindendo dalla natura degli eventi, una volta che sia assegnata ad essi una probabilità, il calcolo delle probabilità diventa una applicazione del calcolo logico, che Boole ha pre-
147
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
sentato nei capitoli precedenti. La soluzione dei problemi così è ricondotta ai puri strumenti logici
come quelli visti in 1.1.6, con l’uso dei costituenti. Tutto ciò perché si è posta attenzione non tanto
all’evento come fatto, ma all’evento come descritto da una frase.
A questo punto il nostro presenta una tavola di ‘conversione’
«
EVENTS
xy
x(1-y)
(1-x)y
(1-x)(1-y)
Concurrence of x and y
Occurrence of x without y
Occurrence of y without x
Conjoint failure of x and y
PROBABILITIES
pq
p(1-q)
(1-p)q
(1-p)(1-q)
»
In questa tabella si può vedere una sorta di primo tentativo di tavola di verità, basata sui ‘costituenti’.
Da questo momento propone e dimostra alcune proposizioni che, a parte la ‘verniciatura’ probabilistica riguardano proprietà logiche. Ad esempio propone che il risultato di una situazione di eventi
composti si possa descrivere e valutare come
per determinare la probabilità di un evento composto conoscendo le probabilità dei componenti.
Come si vede introduce simboli e scritture che anche sul versante solo logico hanno dato molto filo
da torcere ai commentatori di Boole.
Queste ‘oscurità’ non hanno giovato alla proposta logicista che è rimasta poco seguita, anche se in
essa si colgono i prodromi della sistemazione assiomatica.
4.2.3. Altri logicisti. 4 La opzione logicista è nel XIX secolo quasi una prerogativa degli studiosi inglesi. Tra questi
vale la pena di ricordare Jevons che, per altro, si era occuFrancis-Herbert Bradley
1846 - 1924
pato con successo di ‘ripulire’ certe parti dell’opera di Boole. Di maggior rilievo è il trattato The principles of Logic
(1883) di Bradley. La scelta logicista di questo autore è il
William Jevons
1835 - 1882
risultato di una critica puntuale delle debolezze degli altri approcci alla probabilità, in particolare le
opzioni soggettiviste e frequentiste (di cui si dirà in un prossimo paragrafo). Per Bradley i soggettivisti confondono le credenze dell’individuo con la probabilità, ma osserva che tali credenze possono
variare nel tempo, ed allora verrebbe completamente a mancare un carattere tipico di una scienza, la
4
Per questa e la successiva parte mi avvalgo abbondantemente di Costantini (1970).
148
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
sua oggettività ed invarianza nel tempo. Se quindi le credenze si situano in un ambito psicologico
soggettivo, la probabilità dovrebbe individuare rapporti ‘stabili’ su ipotesi e fatti.
Lo sviluppo della Matematica all’epoca in cui Bradley pubblicava The principles of logic, aveva
completamente mutato il volto ed i contenuti della disciplina, facendone una scienza assai diversa
da quanto si riteneva all’inizio del XIX secolo. Ora erano possibili diverse ‘opzioni’ anche per affrontare argomenti con una lunga ed apparentemente invariata tradizione come la Geometria.
L’autore è pertanto conscio che non si può più considerare una unica ‘verità’ matematica, ma bisogna piuttosto evidenziare la natura ipotetico-deduttiva. Pertanto ogni tipo di inferenza prende le
mosse da ipotesi e questo, di fatto, è visto dall’autore come l’indebolimento della struttura della
probabilità soggettiva, che diventerebbe, piuttosto, una probabilità ‘ipotetica’. Quindi la probabilità
ha sì un carattere di soggettività, nella scelta delle ipotesi, che possono essere suggerite dai più svariati motivi e credenze, ma poi diviene completamente oggettiva in quanto relazione logica generata
dalle descrizioni verbali degli eventi.
Per quanto riguarda l’approccio frequentista, anche se ritiene che l’impostazione di questa interpretazione sia in parte corretta, si basa, purtroppo sull’accettazione dell’infinito, indispensabile per potere parlare di andamento asintotico. L’uso delle serie risulta così solo un artificio ideale che poco
impatto ha sul mondo reale nel quale non è possibile eseguire gli infiniti ‘esperimenti’ che sono richiesti dalla nozione di limite. All’obiezione che di fatto basta poter replicare l’esperimento un numero sufficientemente grande, ma finito, di volte, Bradley osserva che se ci si limitasse a questo,
che comunque rischia di essere solo un esperimento ideale, non si può avere a certezza che la frequenza relativa si stabilizzi ‘definitivamente’ su di un unico valore da assumere come probabilità.
Boole aveva accettato che le probabilità iniziali (degli eventi semplici) potessero essere determinate
in vari modi, dato che la sua attenzione si era accentrata sulla gestione ‘successiva’ del calcolo degli
eventi composti. Bradley avendo criticato gli approcci dei soggettivisti e dei frequentisti non ha altre strade per definire la probabilità di tali eventi se non sulla base di un principio a priori e per questo non può che fare riferimento al cosiddetto principio di indifferenza (ovvero ad una forma del
principio di ragione sufficiente). Si rende ben presto conto che questa posizione è a sua volta debole, ed è il primo che la contesta ritenendola insoddisfacente. Si limita allora a consigliare l’uso del
principio di indifferenza solo nei casi ‘conclamati’ in cui gli eventi elementari siano mutuamente
esclusivi ed esaustivi, senza però fidarsi delle ‘apparenze’.
149
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
4.3. Le critiche alla versione classica della probabilità e le proposte alternative.
La reputazione di Laplace come matematico ed i risultati analitici da lui ottenuti non furono un sufficiente ‘baluardo’ contro le critiche che vennero avanzate nella seconda metà del XIX secolo da
vari pensatori, all’approccio ‘classico’ e deterministico alla probabilità incarnato dal francese.
Si assiste in tale periodo ad un generale tentativo di approfondimento delle basi della matematica e
il calcolo delle probabilità non è esente da questa attenzione critica. In realtà
la necessità di una ‘sistemazione’ si intravede già dal Cours d’Analyse di
Cauchy il cui scopo era di porre ordine e dare saldi fondamenti all’Analisi.
Ma anche gli altri rami della nostra disciplina non evitano di sottoporsi ad un
esame attento. Più o meno contemporaneamente all’opera di Cauchy, infatti,
Agustin Louis Cauchy
1789 - 1857
inizia la rivoluzione non-euclidea. In un intorno stretto degli anni di pubblicazione dell’opera principale di Boole, veniva formalizzata la geometria
proiettiva. La fisica matematica si poneva il problema dell’esistenza dell’etere e delle equazioni di
campo.
Il processo di revisione dei concetti fondamentali portava ad una crisi dei fondamenti, tra fine secolo ed inizio del successivo ma anche per quanto riguarda la probabilità, prendevano corpo approcci
diversi che tentavano di colmare le lacune lasciate dalla presentazione ‘classica’.
La novità del soggetto di cui stiamo parlando in questi appunti, fece sì che l’elaborazione avvenuta
nella seconda metà dell’Ottocento non sia paragonabile a quella che si è avuta sull’impianto degli
argomenti più tradizionali della matematica, coi loro 2.000 - 3.000 anni di storia.
Per questo la disputa (se si vuole, la crisi) si è mantenuta ‘vivace’ anche nel XX secolo e, di fatto,
ha portato alla formazione di scuole di pensiero da cui si sono separate calcolo della probabilità e
statistica. Anche se sono in atto tentativi di unificazione, ad esempio mediante il (meta-)concetto di
modello matematico, non si può dire che questi siano giunti ad uno stadio soddisfacente. Sui vari
modi di intendere la probabilità, quindi non c’è finora un unico punto di vista, tuttavia le critiche
che una corrente rivolge ai punti fondamentali di una corrente diversa hanno avuto lo scopo e
l’effetto di approfondire l’analisi degli scopi e dei metodi di pensiero che trovano spazio nei vari
approcci.
4.3.1. L’approccio frequentista nel XIX secolo. Le basi dell’approccio classico alla probabilità possono riconoscersi nella equipossibilità e quindi nella misura della
possibilità, nonché sul principio di indifferenza.
Questi aspetti vengono messi in luce da alcuni studiosi, già nella prima metà del
Antoine Cournot
1801 - 1877
XIX secolo. In particolare si può citare Cournot (Exposition de la théorie des
150
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
chances et de probabilités, 1843, disponibile in rete web). In essa si esprime in questo modo:
«Le spiegazioni che ho dato a più riprese sulla indipendenza e sulla solidarietà delle cause, sul doppio significato
della parola probabilità, che talora si riferisce ad una certa misura delle nostre conoscenze e talora ad una misura
della possibilità delle cose, indipendentemente dalle conoscenze che abbiamo: queste spiegazioni, io dico, mi
sembrano opportune per risolvere le difficoltà che hanno reso fino ad oggi sospetta a dei buoni spiriti tutta la teoria della probabilità. [In questo testo] si troveranno definizioni, idee che credo nuove o che, almeno, non sono
state chiaramente percepite. Esse mi hanno condotto ad adottare la dottrina delle probabilità a posteriori, e la
maggiore parte delle applicazioni che si riferiscono ad essa, in modo completamente diverso da quello che hanno
fatto altri uomini giustamente celebri. »
Contemporaneamente in Gran Bretagna R.L. Ellis pubblicava On the foundation of the theory of
probability, 1843,disponibile in rete web, muovendosi su posizioni analoghe. Di quest’ultimo è in-
teressante l’affermazione:
«Are we prepared to admit that our confidence in the regularity of nature is merely a corollary from Bernouilli’s
theorem?»
Lo sviluppo più maturo di questo approccio si ha nell’opera di Venn, The logic of chance, apparsa
nel 1866 come prima edizione (disponibile in rete web), affronta questi due caposaldi della proposta
di Laplace. Il testo è di 370 pagine, preceduto da 28 pagine tra prefazione, indice ed una pagina di
errata. Nella prefazione fa un ‘triste’ quadro della probabilità nell’ambito generale delle scienze. Infatti rileva che solo uno sparuto manipolo di studenti si è dedicato con grande assiduità a coltivare
l’argomento e seppure i risultati che hanno ottenuto siano riconosciuti tra i più straordinari prodotti
del genio matematico, la reputazione di questi giovani e dell’argomento da parte delle persone colte
viene vista con sufficienza, con indifferenza, se non addirittura, con sospetto.
Eppure sull’argomento dovrebbe stendersi l’ombra di Laplace di Poisson a garantirne la scientificità. Ma Venn commenta:
«Any subject which has been discussed by such men as Laplace and Poisson, and on which they have exhausted
all their powers of analysis, could not fail to be profoundly treated, so far as it fell within their province. But
from this province the real principles of the science have generally been excluded, or so meagrely discussed that
they had better have been omitted altogether. Treating the subjects as mathematicians such writers have naturally
taken it up at the point where their mathematics would best come into play, and of course has not been at foundations. In the works of most writers upon the subject we should search in vain for anything like a critical discussion of the fundamental principles upon which its rules rest, the class of inquiries to which it is most properly
applicable, or the relation it bears to Logic and the general rules of inductive evidence. Even in the essay of
Laplace, a work commonly regarded as the principal philosophical text-book on the subject, the definition as the
outset includes the very conception of Probability which it undertakes to explain. In the hands of less systematic
writers, especially amongst who have treated the subject in a popular way, such confusion becomes far more serious.»
La posizione di Venn è chiara: il calcolo delle probabilità ‘classico’ non è sorto sulla base di princìpi scelti ed approfonditi, ma al contrario i princìpi sono stati modellati sulle esigenze degli strumenti
analitici che si volevano applicare. A riprova di questa situazione il fatto che in autori meno abili
dal punto di vista matematico, i principi fondamentali invece di risaltare sono occasione di confusione in quanto manca loro una chiarezza intrinseca. Di qui, a causa della vaghezza e delle incertezze che sembrano affliggere l’argomento, si incontra in libri diversi e talora sullo stesso libro di un
autore, che la probabilità è una proprietà della mente, l’intensità di una credenza che ci viene sugge-
151
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
rita da una proposizione, qualche altra volta un che di esterno a noi che misura questa intensità, talvolta appare come un numero astratto, cioè come una frazione numerica. Ma tutto ciò denota una
carenza filosofica di fondo che rende il soggetto difficile da essere posto alla base di una scienza.
Tutto ciò, per Venn, ha introdotto confusione e perplessità nelle applicazioni che paiono importanti
alle istituzioni politiche e sociali.
Osserva inoltre che gli esempi su cui si basa l’approccio classico sono troppo specifici ed appena i
princìpi li si pone in confronto con le situazioni reali, diventano o di scarsa utilità o di difficile applicabilità. In questa critica viene presa anche di mira la proposta di Boole riconoscibile nel ‘un che
di esterno a noi che misura questa intensità’.
Nel primo capitolo Venn dichiara che non è facile dare all’inizio la definizione di una scienza di cui
si vuole trattare. Questo avviene anche per altre scienze naturali, le quali, però possono avere un
aiuto dal fatto di avere per oggetti cose reali e anche se la definizione precisa non viene subito fornita, la conoscenza degli oggetti aiuta comprendere dove andare a parare.
«But when a science is concerned, not so much with objects directly as with processes and laws, or when it takes
for the subject of its enquiry some comparatively obscure feature drawn from phenomena which have little or
nothing else in common, the difficulty of giving preliminary information becomes greater.»
Il brano giustifica in questo modo il fatto che lo studio della probabilità possa essere ritenuto a buon
diritto specifico della matematica, dato che nella accezione inglese, il ruolo della nostra scienza era
proprio quello di occuparsi dei processi e delle leggi.
Per quanto poi riguarda più specificamente la probabilità, Venn formula la seguente opinione:
«Here then we have a class of objects as to individuals of which we feel quite in uncertainty, whilst as we embrace larger numbers in our assertion we attach greater weight to our inference. It is with such classes of objects
and such inferences that the science of Probability is concerned. ... In these class of things, which are those with
which Probability is concerned, the fundamental conception which the reader has to fix in his mind as clearly as
possible, is, I take it, that of a series. But it is a series of a peculiar kind, one of which I can see non better compendious description that that which is given by the statement that it combines individual irregularity with aggregate regularity. »
Per chiarire il suo concetto di probabilità considera la frase “alcune mucche non allattano i loro piccoli”. Questa proposizione presenta una situazione indefinita o come afferma la teoria del sillogismo, una proposizione particolare (negativa) ed in essa non si riesce a riconoscere il ruolo e la presenza di una serie. La proposizione contiene solo un’affermazione relativa ad una certa porzione del
tutto (la totalità delle mucche). Ma non è con queste proposizioni indefinite che noi dobbiamo trattare. Al contrario si consideri l’affermazione formulata con l’ausilio di carattere numerico, in tal caso risulta difficile escludere la nozione di serie. Qual è, ad esempio, il significato dell’affermazione
che una mucca su dieci non allatta il suo piccolo? Sicuramente non ci possiamo aspettare che data
una mandria di venti mucche esattamente due di esse non allattino, perché, qualunque sia il puro significato delle parole ciò non è l’aspetto importante dell’affermazione. Piuttosto la frase riguarda
152
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
l’esame un gran numero di mucche e se all’inizio dell’esame la proporzione numerica non sembra
corretta, a lungo andare diviene precisa.
Questo semplice esempio, oltre a spiegare cosa intenda Venn per serie, ha grande forza di convincimento. In questo modo la frequenza diviene o contribuisce alla probabilità.
Questo approccio, da una parte, si oppone all’idea che la probabilità sia un grado di credenza (contro le affermazioni dei soggettivisti) perché non è possibile misurare il grado di credenza
dell’affermazione “qualche mucca non allatta il proprio piccolo”. Ma anche qualora fosse possibile
individuare mediante un sondaggio individuare in un qualche modo una media di stime basandosi
sulle risposte ottenute, questo valore non rappresenterebbe la ‘frazione della certezza’ come vorrebbe l’approccio soggettivista e questo potrebbe essere verificato solo mediante un’indagine su un
campione molto numeroso di mucche, quindi, comunque, passando attraverso la frequenza.
Tuttavia, in certi casi ben delimitati, è possibile incontrare gradi di certezza e la possibilità di ‘misurarli’ con una scala adeguata. Venn fa l’esempio del lancio della moneta. In questo caso è credenza
comune che ½ misuri la credenza della uscita di ‘testa’, pur essendo questo grado di credenza sempre smentito in ogni lancio, dato che o si ottiene ‘testa’, quindi 1, o si ottiene ‘croce’, quindi 0. Come fare allora a giustificare il valore ½. La risposta è semplice, si tratta di un’esperienza ripetuta
molte volte, quindi anche in questo caso si è passati attraverso la frequenza.
Cosa fare se l’evento, per sua natura, non ammetta una ripetibilità su cui costruire una “serie”? In
tali casi, che per Venn sono assai rari, l’unica possibilità è agire come se i propri gradi di credenza
fossero quelli giusti, perché è un atteggiamento che se non favorisce il ‘guadagno’, almeno limita le
‘perdite’.
Lo scoglio allora ed oggi, contro cui l’approccio frequentista mostra i suoi limiti è quello dei cosiddetti eventi singolari. La risposta di Venn è quella che in tali casi si può cercare di affrontare il problema con l’approccio soggettivista illustrato (e criticato) sopra. Conclude che si tratta di un modo
impreciso di procedere, ma che risulta essere l’unico disponibile.
4.3.2. I soggettivisti. Come si è visto, nonostante le critiche metodologiche che Venn premette
all’approccio soggettivista, nella fase di determinazione della probabilità degli eventi elementari per
cui non sia possibile la ripetitività, anche se a malincuore, si è costretti a ricorrere al grado di fiducia. Però ben presta si preoccupa di rimarcare la diversità tra probabilità (dato sperimentale) e grado
di credenza che ha, per sua stessa natura, un valore soggettivo e che può essere usato come ‘temporaneo supporto’ alla teoria della probabilità .
Vent’anni prima di Venn, de Morgan aveva presentato un testo importante anche per altri aspetti:
Formal logic: or the calculus of inference necessary and probable, 1847 (disponibile in rete web).
153
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
È una delle prime volte, se non la prima, in cui si utilizza l’aggettivo ‘formale’ riferito alla logica. Il
testo illustra in grande dettaglio la versione di De Morgan dei sillogismi categorici. Importante un’appendice in cui l’autore presenta il suo punto di vista in una polemica epistolare con Sir William Hamilton, quasi omonimo
del matematico, ma di professione filosofo. Questa polemica sarà ricordata
da Boole come la causa ispiratrice del suo lavoro innovativo sulla logica.
Il nono capitolo del trattato è sulla probabilità ed in esso leggiamo:
William Stirling Hamilton
1788 - 1856
«The object of this chapter is the consideration of the degrees of knowledge itself. That which we know, of
which we are certain, of which we are well assured nothing could persuade us to contrary, is the existence of our
own minds, thoughts, and perceptions, the two last when actually present. This highest knowledge, this absolute
certainty, admits of no imagination of possibility of falsehood. We cannot, by stopping to consider, make ourselves more sure that we are already, that we exists, think, see, &c. Next to this, come the things of which we
cannot but say at last, we are as certain of them as of our own existence; but of which, nevertheless we are
obliged to say that we arrive at them by process, by reflections. These we call necessary truths. …There is no
further use in drawing distinction between the knowledge which we have of our existence, and that of two and
two amounting to four. This absolute and inassailable feeling we shall call certainty. We have lower grades of
knowledge , which we usually call degrees of beliefs, but they are really degree of knowledge…. By degree of
probability we really mean, or ought to mean, degree of belief. »
De Morgan sposta quindi l’attenzione dalla credenza che ha connotati troppo personali e talvolta irrazionali, alla conoscenza che è più ‘oggettiva’, restando soggettivo quale livello di conoscenza
l’individuo abbia raggiunto.
«According to common idiom, belief is often a lower degree of knowledge: but it is imperative upon us to drop
all the quantitative distinction of common life, or rather to remodel them, when we come to the constructions of
a science of quantity»
Mantenendo però la dizione ‘grado di credenza’ giunge a dire che si identificano grado di credenza
e probabilità. In questo brano, però c’è anche che del grado di credenza si può dare una valutazione
esprimibile quantitativamente. Quindi anche se la credenza è il risultato di conoscenze (più o meno
complete) e sensazioni, su di essa si può costruire una teorizzazione.
Si può dire che più che una esposizione organica sia l’approccio di De Morgan, sia di altri, le posizioni del soggettivisti del XIX secolo appaiono espresse nel testo di Venn, sia per confutarle, sia per
riconoscerne in certi casi la necessità.
4.3.3. Conclusione. Lo studio della probabilità nel XIX secolo ha impegnato alcune delle menti più
acute del secolo stesso ed ha permesso di delineare quattro approcci, che non sempre è facile identificare: la versione classico-deterministica, quella frequentista, quella soggettivista e il filone logicista. Gli studiosi hanno cercato, con vari mezzi e a partire da idee diverse, di identificare lo specifico
che viene indicato col nome di probabilità, ma il risultato non è completamente soddisfacente, in
nessun caso. L’approccio classico si scontra col concetto di possibilità che rimane non chiarito e che
logicamente non può identificarsi con la probabilità, pena l’introduzione nella definizione di un circolo vizioso. L’approccio frequentista si deve confrontare con eventi isolati e che non sono ripetibi-
154
C Marchini - Appunti di Matematiche complementari AA 2010 – 2011
Capitolo 4. Probabilità nel XIX secolo
li, quindi è necessaria un’estensione dell’idea frequentista della probabilità. C’è poi il problema
dell’infinito richiesto dalla nozione di limite che sembra inappropriato proprio perché nessun evento, per quanto ripetibile, potrà essere replicato infinite volte. L’approccio soggettivista rende difficile accettare che su di esso si possa costruire una scienza, proprio per l’assunto di base. Il tentativo
logicista resta incompleto. Seppure è efficace nel costruire una connessione tra linguaggio ed operazioni probabilistiche, non è del tutto chiarito come sia possibile associare valutazioni di probabilità
ad eventi elementari. Boole non si rende conto che accettando, per gli eventi semplici, un’arbitraria
interpretazione probabilistica viene in parte a contraddire la possibilità di svolgere una coerente teoria delle probabilità. Bradley si ‘rifugia’ si può dire a malincuore, nel principio di indifferenza.
Queste analisi del XIX secolo si trasferiranno, per continuità, nel secolo successivo e daranno luogo
a differenti approcci, che manterranno, i nomi proposti dal secolo XIX.
155
Scarica