La Teoria (epistemica) della conferma bayesiana La teoria della probabilità fornisce alcuni strumenti potenti anche in senso epistemico, per valutare argomentazioni e decisioni in cui sono usati dei metodi inferenziali incerti quali, ad esempio, l’analogia o l’induzione. In questi casi, dato che la verità delle premesse non viene trasmessa alle conclusioni, ci si può interessare al grado di attendibilità che le conclusioni hanno sulla base delle premesse poste a loro sostegno ed entrano in gioco nozioni come la “probabilità induttiva" delle conclusioni, la loro “plausibilità”, o ancora il loro “grado di credenza”. L’utilizzo di una concezione epistemica della probabilità, assieme alle conseguenze del teorema di Bayes, porta così a costruire una teoria della conferma che permette di descrivere la forza di argomentazioni incerte. L’approccio bayesiano propone di valutare la coerenza argomentativa basandosi sulla probabilità piuttosto che sulla deduzione, fornendo regole di inferenza probabilistiche che non si applicano alle credenze, bensì ai gradi di credenza. Supponiamo che sia definita una funzione di probabilità p su una classe di enunciati, con l’interpretazione che p misuri la probabilità di un enunciato di essere vero e che soddisfi le condizioni: 1. 0≤ 𝑝(𝐴) ≤ 1, per ogni A, 2. se A è vera allora 𝑝 𝐴 = 1, 3. se A1 e A2 sono enunciati incompatibili, allora 𝑝 𝐴! ∨ 𝐴! = 𝑝 𝐴! ) + 𝑝(𝐴! . Accanto alle probabilità assolute possiamo inoltre introdurre le probabilità condizionali, con la seguente definizione 4. se 𝑝(𝐡) ≠ 0 allora 𝑝 𝐴 𝐡 =
𝑝(𝐴&𝐡)
𝑝(𝐡)
in cui 𝑝 𝐴 𝐡 esprime la probabilità dell’ipotesi espressa dall’enunciato A a condizione che sia verificato un enunciato B. La probabilità 𝑝 𝐴 𝐡 può essere allora interpretata epistemicamente come la plausibilità di A a fronte della conoscenza di B, o ancora come il grado di conferma o il grado credenza di A relativamente all’evidenza B disponibile. Questa interpretazione epistemica (nota come principio di condizionalizzazione) porta a riguardare la probabilità 𝑝 𝐴 come la probabilità a priori, iniziale di A, e la probabilità 𝑝 𝐴 𝐡 come la probabilità a posteriori, o finale, di A, ovvero la sua probabilità una volta noto B. Ricordiamo che, nella sua versione più semplice, il teorema di Bayes è esprimibile con 𝑝 𝐴𝐡 =
𝑝 𝐴 𝑝(𝐡|𝐴)
𝑝 𝐡
e, in caso di eventi mutuamente esclusivi come A e ~𝐴, attraverso 𝑝 𝐴𝐡 =
𝑝 𝐴 𝑝(𝐡|𝐴)
𝑝 𝐴 𝑝 𝐡 𝐴 + 𝑝 ~𝐴 𝑝(𝐡|~𝐴)
e ciò rimane valido indipendentemente dalla posizione probabilistica assunta (sia essa frequentista, soggettivistica, ecc.). La centralità del teorema di Bayes per valutare la credenza di un’ipotesi dipende dal fatto che esso permette di calcolare più incisivamente come la credenza sia aggiornata alla luce di nuove informazioni. In questo senso, se chiamiamo H l’ipotesi al vaglio, sviluppata a partire da informazioni precedenti, ed E l’evento che viene conosciuto in seguito, è possibile calcolare in che modo la conoscenza di E aggiorni la credenza o la probabilità dell’ipotesi H, ovvero 1 𝑝 𝐻𝐸 =
𝑝 𝐻 𝑝(𝐸|𝐻)
𝑝 𝐸
Un esempio paradigmatico è quello dei test per la diagnosi clinica. Supponiamo che una malattia sia contratta dall’1% della popolazione e che abbiamo a disposizione un test diagnostico che dà risultato positivo nel 90% dei malati e nel 5% dei non malati. Supponiamo ancora che il test, somministrato ad una persona, abbia dato esito positivo. Con che probabilità la persona ha effettivamente contratto la malattia? O, in altri termini, com’è l’argomento seguente? Il test diagnostico mi dà esito positivo. :. Ho contratto la malattia. Intuitivamente si sarebbe indotti a rispondere che l’argomento sia forte e che la probabilità che la persona abbia contratto la malattia sia del 90%. In realtà le cose stanno diversamente ed è proprio il teorema di Bayes che permette di calcolare cosa accade. Innanzitutto racchiudiamo i dati significativi del problema in una tabella (ved. a destra) che illustra tutte le probabilità. Siano ora M=”malato” e P=“positivo al test”, ciò che vogliamo conoscere è 𝑝 𝑀 𝑃 : 𝑝 𝑀𝑃 =
𝑝 𝑀 𝑝(𝑃|𝑀)
. 01 βˆ™ .9
=
= .1538 𝑝 𝑀 𝑝 𝑃 𝑀 + 𝑝 ~𝑀 𝑝(𝑃|~𝑀) . 01 βˆ™ .9 + .99 βˆ™ .05
Dunque la probabilità di contrazione della malattia (l’ipotesi M), a fronte dell’esito positivo del test (l’evidenza P), risulta essere solamente del 15% circa, perciò molto bassa.
Si tenga invece conto che, nel caso di test negativo, la probabilità di non aver contratto la malattia nel nostro esempio è un’ipotesi molto forte, infatti 𝑝 ~𝑀 ~𝑃 =
𝑝 ~𝑀 𝑝(~𝑃|~𝑀)
. 99 βˆ™ .95
=
= .9989 𝑝 ~𝑀 𝑝 ~𝑃 ~𝑀 + 𝑝 𝑀 𝑝(~𝑃|𝑀) . 99 βˆ™ .95 + .01 βˆ™ .1
In entrambi i casi, però, l’ulteriore conoscenza (la positività o la non positività al test) porta ad aggiornare la credenza ipotizzata: nel primo caso (positività al test) passando dall’1% al 15.38% come probabilità di aver contratto la malattia, nel secondo caso (non positività al test) passando dal 99% al 99.89% come probabilità di non aver contratto la malattia. Avvalendoci del teorema di Bayes e delle sue conseguenze, è così possibile costruire una teoria della conferma, in cui un agente razionale può assegnare a ciascuna proposizione un unico grado di credenza. In tale situazione, possiamo definire le seguenti nozioni: -­β€
-­β€
-­β€
un’evidenza E conferma un’ipotesi H se e solo se 𝑝 𝐻 𝐸 > 𝑝(𝐻), un’evidenza E disconferma un’ipotesi H se e solo se 𝑝 𝐻 𝐸 < 𝑝(𝐻), un’evidenza E è neutra rispetto ad un’ipotesi H se e solo se 𝑝 𝐻 𝐸 = 𝑝(𝐻). Dunque possiamo dire che una conclusione ha un’alta probabilità induttiva, o che un’ipotesi è plausibile, quando ha un certo grado di conferma bayesiana, ed è tanto più accreditata quanto più alto è il suo grado di conferma. Si tratta di una nozione qualitativa di conferma. Infatti non c’è un accordo generale su come misurarla quantitativamente C’è da notare, inoltre, che proprio in virtù del teorema di Bayes, dalla relazione 𝑝 𝐻𝐸
𝑝(𝐸|𝐻)
=
𝑝 𝐻
𝑝 𝐸
2 ottenuta dividendo ambo i membri per p(H), le nozioni di conferma, disconferma e neutralità possono essere associate anche alla p(E) e a p(E|H), infatti ! !!
-­β€
E conferma l’ipotesi H se e solo se -­β€
-­β€
𝑝 𝐸 𝐻 > 𝑝(𝐸). Analogamente, E disconferma l’ipotesi H se e solo se 𝑝 𝐸 𝐻 < 𝑝(𝐸), e E è neutra rispetto ad H se e solo se 𝑝 𝐸 𝐻 = 𝑝(𝐸). ! !
!(!|!)
> 1, ovvero se e solo se ! !
> 1 da cui Attraverso l’approccio probabilistico è dunque possibile indagare il grado di credibilità di una ipotesi in situazione d’incertezza (o di una conclusione argomentativa) in quanto esso ci offre la possibilità di orientarci in modo razionale facendo appello alla conoscenza posseduta. Un’illuminante sviluppo della teoria della conferma bayesiana è fornito da G. Polya. Secondo Polya, il modello di ragionamento seguente, sebbene nella logica deduttiva dia luogo ad una fallacia classica, nella logica induttiva fornisce un criterio di adeguatezza delle conclusioni. Modello fondamentale 𝐻 → 𝐸 E :. H è più credibile Questo modello si discosta dalla classica fallacia dell’affermazione del conseguente perché si colloca su un piano logico diverso, non dimostrativo, e come tale formalizza una credenza che è difficile da mettere in dubbio: il verificarsi di una conseguenza di H rende l’ipotesi H più credibile. Ciò deriva dal fatto che l’evidenza E conferma l’ipotesi H. Vediamo nel dettaglio. Dal teorema di Bayes, moltiplicando entrambi i membri per 𝑝(𝐸) abbiamo 𝑝 𝐸 𝑝 𝐻 𝐸 = 𝑝 𝐻 𝑝(𝐸|𝐻) e sostituendo il valore 1 a 𝑝(𝐸|𝐻) in quanto E è conseguenza di H, otteniamo 𝑝 𝐸 𝑝 𝐻 𝐸 = 𝑝 𝐻 ma se E non è un evento impossibile o certo, allora 𝑝 𝐸 è compresa tra 0 ed 1 per cui 0 < 𝑝 𝐻 < 𝑝 𝐻|𝐸 ovvero 𝑝 𝐻|𝐸 > 𝑝 𝐻 , da cui evinciamo che: in presenza del verificarsi di E la probabilità dell’ipotesi H aumenta. Accanto a questo modello fondamentale si possono sviluppare altri modelli di ragionamento che illustrano altri principi induttivi e che si dimostrano all’interno della teoria della conferma bayesiana. Vediamone alcuni. Supponiamo che siano state verificate le conseguenze E1 , E2 , … , En dell’ipotesi H. A questo punto consideriamo il verificarsi di un’ulteriore evidenza 𝐸!!! che è conseguenza di H. Possiamo concludere che tanto più la nuova evidenza 𝐸!!! differisce dalle evidenze E1 , … , En accertate in precedenza, tanto più essa aumenterà la credibilità di H. In forma canonica, questo principio induttivo si può esprimere in modo duplice: Modello della conseguenza diversa Le conseguenze E1 , … , En di H (𝐻 → 𝐸! , … , 𝐻 → 𝐸! ) sono state verificate (E1 , … , En sono vere) È stata verificata l’ulteriore conseguenza En+1 di H (𝐻 → 𝐸!!! e 𝐸!!! è vera) En+1 è molto diversa da E1 , … , En :. H è molto più credibile Modello della conseguenza simile Le conseguenze E1 , … , En di H (𝐻 → 𝐸! , … , 𝐻 → 𝐸! ) sono state verificate (E1 , … , En sono vere) È stata verificata l’ulteriore conseguenza En+1 di H (𝐻 → 𝐸!!! e 𝐸!!! è vera) 3 En+1 è molto simile a E1 , … , En :. H è di poco più credibile Analogamente, si può considerare la maggiore o minore probabilità delle conseguenze. Il presentarsi di una conseguenza molto improbabile aumenta di molto la credibilità dell’ipotesi, viceversa se la conseguenza che si presenta è molto probabile la credibilità dell’ipotesi aumenta meno. In forma canonica, questo principio induttivo dice che: Modello della conseguenza improbabile La conseguenza E di H (𝐻 → 𝐸) è molto improbabile E si è verificata :. H è molto più credibile Modello della conseguenza probabile La conseguenza E di H (𝐻 → 𝐸) è molto probabile E si è verificata :. H è di poco più credibile Nel caso dell’inferenza per analogia accade che il verificarsi o la maggiore probabilità di una ipotesi analoga rende l’ipotesi di partenza più credibile, ovvero: Modello dell’analogia A è analoga a B B si è verificata (oppure B è più credibile) :. A è più credibile così come nel modello successivo, in cui dall’incompatibilità tra due ipotesi, la falsità o la minore credibilità di una di esse rende l’altra ipotesi più credibile Modello dell’incompatibilità A è incompatibile con B B è falsa (oppure B è meno credibile) :. A è più credibile Variazioni del modello fondamentale sono poi i seguenti: 1a variazione del Modello fondamentale 𝐻 → 𝐸 E è meno credibile :. H è meno credibile 2a variazione del Modello fondamentale 𝐻 → 𝐸 E è più credibile :. H è più credibile Se da un lato l’approccio di Polya ha un ambito di applicazione molto ampio, che va dal discorso quotidiano a quello scientifico in generale, esso ha però dei limiti evidenti, nello specifico: -­β€
-­β€
-­β€
aiuta a trattare solo forme di ragionamento eristico, incerto, provvisorio; è un tipo di ragionamento che ha una sua specifica logica, diversa da quella deduttiva; non sempre è possibile il confronto numerico tra ipotesi diverse. Ma anche la presenza di tali limiti, ed anche se a volte la plausibilità viene stabilita in modo non probabilistico, dunque in modo verbale e non formale, al di fuori di una qualsivoglia teoria della credenza, questo approccio è un momento fondamentale e uno strumento importante per la conferma di ipotesi e conclusioni argomentative. La nozione di conferma 4 illustrata si basa sulla nozione di probabilità e questa, interpretata in senso epistemico, è atta anche a misurare il grado di credenza di un agente. Ma c’è di più. L’uso della probabilità è giustificato da un noto teorema (teorema di Cox), secondo il quale ogni misura ragionevole della credenza è teoreticamente isomorfa alla misura probabilistica. Ciò sta ad indicare che le proprietà poste alla base di un qualsivoglia sistema di misura per la credenza devono essere le stesse dell’apparato probabilistico. Filosoficamente, ciò porta a ritenere la concezione probabilistica come l’unico sistema di misura coerente per valutare la credibilità all’interno di un sistema inferenziale incerto. 5