Glantz_2007.book Page XV Monday, February 5, 2007 12:53 PM
Prefazione
Mi sono sempre considerato come qualcosa di simile a un outsider e a un
“seccatore”, pertanto è con umiltà che preparo la sesta edizione di questo
libro, 24 anni dopo la pubblicazione della prima. Allora, come oggi, il libro
aveva una prospettiva inusuale: molti lavori nella letteratura medica contenevano degli errori evitabili. A quel tempo, l’editore, McGraw-Hill, espresse l’opinione che questo “approccio basato sul confronto” avrebbe disorientato il lettore e danneggiato le vendite. Ci si preoccupò anche del fatto
che il libro non fosse organizzato come un tradizionale testo di statistica.
Il tempo ha dimostrato che la comunità biomedica era pronta per un
simile approccio, e il libro ha ottenuto un successo notevole. Nel corso degli anni, si è evoluto includendo progressivamente nuovi argomenti: potenza del test, calcolo della dimensione campionaria, approfondimenti
sulle procedure per i confronti multipli e analisi della sopravvivenza.
Piuttosto che aggiungere ulteriori test statistici in questa edizione ho
preferito espandere la discussione di aspetti qualitativi dell’utilizzo della
statistica, come per esempio la spiegazione di che cosa sia un campione
casuale, perché è importante, la differenza tra studi sperimentali e osservazionali, trattando infine il problema delle distorsioni e di come evitarle.
Ho anche riscritto completamente la presentazione del concetto di
potenza, nel tentativo di rendere intuitivo questo argomento scoraggiante. Questa edizione continua anche il processo di aggiornamento degli
esempi e dei problemi al fine di utilizzare materiale più attuale. Allo
stesso tempo molti degli esempi originari della prima edizione rimangono; essi hanno funzionato bene nel tempo e quindi hanno prevalso sul
desiderio di rinnovare.
Il cambiamento più grande in questa sesta edizione* è la completa revisione delle illustrazioni del libro con utilizzo dei colori. Avrei voluto utilizzare i colori in questo libro sin dall’inizio poiché ritengo che i colori
rendono più facile la comunicazione di importanti concetti intuitivi come
* Si fa qui riferimento alla edizione originale USA (N.d.E.).
Glantz_2007.book Page XVI Monday, February 5, 2007 12:53 PM
XVI • PREFAZIONE
quello di popolazione, del campionamento, della casualità e di distribuzione campionaria che sono alla base della biostatistica applicata. L’aggiunta dei colori è più che un aspetto cosmetico; essa migliora sostanzialmente la presentazione delle idee nel libro.
Questo libro nasce nel 1973, quando, ancora ricercatore universitario, molti amici e colleghi si rivolgevano a me per consigli e spiegazioni
riguardo alla biostatistica. Poiché parecchi di loro avevano una conoscenza della statistica più limitata della mia, cercai di imparare ciò di
cui avevano bisogno per aiutarli. La necessità di fornire spiegazioni rapide e intuitive, e nel contempo corrette, dei vari test e procedure, ha
lentamente portato alla formazione di un bagaglio di risposte e alla preparazione di un corso audiovisivo di due ore sugli errori statistici più
frequenti nella letteratura biomedica e sul modo di evitarli. Il successo
di questo corso spinse molte persone a consigliarmi di estenderlo in un
libro di introduzione alla biostatistica; ciò mi ha portato alla prima edizione di “Statistica per Discipline Biomediche”, nel 1981.
È nato così questo volume, destinato sia all’autodidatta – studente, ricercatore, professore o professionista – sia agli studenti di corsi regolari.
Questo libro può essere usato a vari livelli. È stato il testo di biostatistica
richiesto per il corso di epidemiologia e biostatistica, frequentato da tutti
gli studenti di medicina. Questo corso, organizzato in otto lezioni di un’ora
ciascuna, si basa sul contenuto dei primi otto capitoli. Il libro è anche usato per una serie più breve di lezioni di biostatistica (basate sui primi tre capitoli), impartita agli studenti di odontoiatria. Inoltre è stato utilizzato in
modo soddisfacente da me e da altri in un corso trimestrale, durante il
quale vengono svolti approfonditamente tutti gli argomenti che esso tratta.
Il corso consiste di quattro ore di lezione e di un’ora di discussione ed è frequentato da un’ampia tipologia di studenti: dalle matricole fino agli studenti di dottorato e post-dottorato e talvolta da personale della Facoltà.
In questo volume sono contenuti gli argomenti tecnici trattati in qualunque corso introduttivo di statistica, perciò risulta adatto come testo
principale o ausiliario per tutti i corsi di tipo introduttivo (questo, infatti, è il livello al quale la statistica viene insegnata nelle Facoltà biomediche). È destinato in modo particolare agli insegnanti che cercano di interessare alla statistica gli studenti di medicina e biologia.
Questo libro differisce per diversi aspetti da altri testi introduttivi di
biostatistica e queste differenze sono forse la ragione del suo successo.
In primo luogo, è basato sulla premessa che gran parte della letteratura
biomedica usa procedure statistiche discutibili, cosicché il lettore acritico
rischia di apprendere nozioni errate. La maggior parte degli errori (nel
campo dell’inferenza statistica) riguarda il cattivo uso del test t, forse perché i ricercatori non hanno familiarità con altre procedure. Il test t è di solito il primo metodo presentato nei testi di statistica che fornisce il tanto
Glantz_2007.book Page XVII Monday, February 5, 2007 12:53 PM
PREFAZIONE • XVII
desiderato valore P di significatività. L’analisi della varianza, se viene introdotta, è rimandata alla fine del testo e destinata così a essere ignorata
o esposta affrettatamente alla fine del corso. Ora, molti dei dati biomedici
pubblicati dovrebbero probabilmente essere elaborati con l’analisi della
varianza; pertanto, poiché questa procedura è veramente il paradigma di
tutti i test statistici parametrici, ho preferito trattarla per prima, esponendo successivamente il test t come un caso particolare.
In secondo luogo, viene presentata una discussione sul test dei confronti
multipli, problema che ho rilevato molto frequentemente in letteratura.
In terzo luogo, questo testo è centrato sulla verifica del test di ipotesi e
sulla stima quantitativa degli effetti di un trattamento clinico, diversamente
dall’impostazione tradizionale (derivata dalla teoria statistica) che prende
avvio dalla stima di un campione per trattare quella di due o più campioni
e i criteri di verifica delle ipotesi. Credo che il mio approccio si indirizzi più
specificamente al genere di problemi che si incontrano più frequentemente
nella letteratura biomedica o conducendo ricerche in questo settore.
Gli esempi sono per lo più basati su interessanti studi tratti dalla letteratura e sono ragionevolmente fedeli ai dati originali. Tuttavia, talvolta mi sono preso la libertà di modificare i dati grezzi per semplificare i
problemi statistici (per esempio, ho reso uguali le dimensioni dei campioni). In questo modo ho potuto focalizzare l’attenzione sulle idee
intuitive importanti, che sottendono i criteri di elaborazione statistica,
piuttosto che sui calcoli. Laddove il testo si limita a discutere il caso di
campioni di uguali dimensioni, le formule per trattare il caso generale di
campioni diseguali sono poste in Appendice.
Voglio anche menzionare alcune parti che non ho aggiunto. Alcuni mi
hanno suggerito di inserire una trattazione esplicita sul calcolo delle
probabilità e i valori attesi, al posto di quella implicita della precedente
edizione. Altri hanno suggerito di precisare meglio la distinzione fra P e
(nella prima edizione, di proposito, non misi in evidenza questa distinzione). Sono stato anche tentato di strumentalizzare il successo di questo libro fra i ricercatori per propagandare nella comunità biomedica i
metodi statistici multivarianti, in particolare la regressione multipla.
Questi metodi sono stati impiegati ampiamente, e con buoni risultati,
nelle scienze sociali e li ho trovati molto utili nel mio lavoro sulla funzionalità cardiaca e il controllo del tabacco. Ho tuttavia deciso di non apportare questi cambiamenti, poiché avrebbero profondamente mutato
l’impostazione e il tono del libro che sono le ragioni del suo successo.*
* Questi suggerimenti, comunque, hanno portato alla pubblicazione di un nuovo
libro sulla regressione multipla e sull’analisi della varianza, scritto con lo stesso approccio seguito in questo testo. Si intitola: Primer of Applied Regression and Analysis of Variance, 2a ed., S.A. Glantz e B.K. Slinker, New York, McGraw-Hill, 2000.
Glantz_2007.book Page XVIII Monday, February 5, 2007 12:53 PM
XVIII • PREFAZIONE
Come in ogni libro, sono molte le persone che meritano dei ringraziamenti. Julien Hoffman mi ha impartito il primo corso di biostatistica veramente chiaro e orientato alle applicazioni che mi ha permesso di saperne un po’ di più delle persone che si rivolgono a me per una consulenza
statistica. Il suo interesse costante e il suo continuo discutere i problemi
statistici mi hanno aiutato ad apprendere abbastanza per progettare di
scrivere questo libro. Philip Wilkinson e Marion Nestle hanno suggerito
alcuni degli esempi migliori e apportato al manoscritto critiche molto utili. Mary Giammona, Bryan Slinker, Jim Lightwood, Kristina Thayer, Joaquin Barnoyal e Jennifer Ibrahim hanno contribuito alla stesura dei problemi. Virginia Ernster e Susan Sacks, oltre ai molti suggerimenti utili,
hanno fatto lavorare i loro trecento studenti del primo e del secondo anno
della Facoltà di Medicina sul manoscritto della prima edizione quando si
sono offerte cortesemente di utilizzarlo come testo per il loro corso.
Dalla prima edizione di questo libro, nel 1981, sono cambiate molte
cose. C’è una maggiore consapevolezza della necessità di usare metodi
statistici appropriati nella ricerca biomedica. Molte riviste hanno esplicitamente incluso analisi biostatistiche nell’itinerario di revisione dei
manoscritti, riconoscendo così l’importanza di tener conto dei progressi
della statistica. A riprova di ciò, sono stato onorato di svolgere il ruolo di
Associate Editor del Journal of the American College of Cardiology per 10
anni (1991-2001), con il compito di controllare la correttezza statistica
dei testi. Circa la metà degli articoli esaminati presentava ancora problemi di varia gravità, ma molti di essi li abbiamo corretti prima della pubblicazione.
Ringrazio anche molti altri, sia studenti sia insegnanti di biostatistica, che hanno usato il libro e mi hanno scritto formulando domande,
commenti e suggerimenti su come migliorarlo. Da parte mia ho fatto del
mio meglio per tener conto delle loro osservazioni nella preparazione di
questa sesta edizione.
Molti dei grafici di questo libro derivano direttamente dalle mie diapositive. Del resto, il lettore è invitato a pensare a questo libro come a un corso audiovisivo stampato. La maggior parte delle persone che assistono al
mio corso finisce per assumere un atteggiamento più critico nei confronti
di quanto legge nella letteratura biomedica. Dopo averlo presentato ai
dottorandi in medicina dell’Università di California, mi è stato riferito che
essi hanno criticato duramente l’uso dell’errore standard della media come misura di dispersione e l’abuso del test t fatti dagli oratori che mi avevano seguito. Niente potrebbe gratificarmi di più. Spero che questo libro
renderà i lettori più critici e aiuterà a migliorare la qualità della letteratura biomedica e, quindi, in ultima analisi, le prestazioni mediche.
Stanton A. Glantz
Glantz_2007.book Page XIX Monday, February 5, 2007 12:53 PM
Presentazione dell’edizione italiana
Il Glantz ha sempre privilegiato la trattazione di metodi statistici che,
per la loro ampia diffusione nella letteratura scientifica, risultano anche
con maggior frequenza applicati in modo erroneo. Anche questa sesta
edizione, aggiornata e rivista in tutti i dodici capitoli di cui si compone
il volume, rimane fedele a questa impostazione. Le modifiche apportate,
oltre che alla riformulazione qua e là di alcuni passaggi effettuata con lo
scopo di rendere più chiaro il testo, si sono sostanziate nell’aggiunta di
alcuni paragrafi e nella riscrittura totale di altri con l’obbiettivo di meglio approfondire l’importanza di certe metodologie statistiche e i possibili vizi interpretativi che possono derivare da un loro uso inappropriato. In particolare notevoli integrazioni caratterizzano: l’intero capitolo 2,
il capitolo 4 con l’inserimento del test di Holm-Sidak e di un paragrafo
sul confronto tra rilevanza clinica e significatività statistica, il capitolo
6, dove consistenti modifiche sono state apportate ai paragrafi relativi
alla definizione dell’errore di tipo I e alla potenza e dimensione del campione nel confronto tra due proporzioni e il capitolo 7, dove appropriatamente è stato aggiunto un paragrafo sulla meta-analisi.
Questa nuova edizione è stata inoltre arricchita di nuovi esempi chiarificatori particolarmente stimolanti, che ampliano il già vasto repertorio della precedente edizione, e di nuovi esercizi al termine di ogni capitolo, corredati in Appendice da ampie e articolate soluzioni. Anche gli
svolgimenti di molti dei problemi già presenti nell’edizione precedente
sono stati completamente riformulati.
La scelta dell’Autore di rinunciare a una trattazione esplicita del calcolo delle probabilità e delle più comuni funzioni di distribuzione, che
usualmente occupano gran parte dei testi di introduzione al metodo statistico, anche se a tratti costringe a far affidamento sull’intuizione e sulle
capacità logiche del lettore, risulta ancora la formula vincente di questo
volume. Lo sfrondamento di questa parte teorica, parte che usualmente
costituisce il vero ostacolo che si frappone tra la riconosciuta utilità del
metodo statistico, sempre più diffusa anche tra clinici e biologi, e l’acqui-
Glantz_2007.book Page XX Monday, February 5, 2007 12:53 PM
XX • PRESENTAZIONE DELL’EDIZIONE ITALIANA
sizione di elementi sufficienti a fornire la capacità pratica di farne un uso
corretto, rende questo volume prezioso per l’autodidatta, per il ricercatore e per lo studente dei corsi universitari e post-universitari. In questo periodo in cui più vivace è il dibattito sul ruolo e la collocazione della Statistica Medica nell’ambito delle nuove e delle riformate lauree del settore
sanitario, il pragmatico approccio del Glantz rappresenta una proposta
originale che colloca implicitamente la disciplina ai piani alti del percorso formativo, privilegiando il know how rispetto al know why, cioè alle
basi logico-matematiche del metodo statistico. Questo approccio può
non essere condiviso, ma è indubitabile che la proposta didattica sottesa
al Glantz sia da considerare con attenzione, soprattutto alla luce del vivo
interesse che ha da sempre circondato il libro fin dal suo apparire.
Coniugando semplicità di esposizione a rigore scientifico, attraverso
l’uso di un’ampia esemplificazione per l’approfondimento di ogni singolo argomento affrontato, il libro fornisce gli strumenti per formulare risposte statisticamente corrette a domande cliniche ben poste. Compito
essenziale e sufficiente quando ci si riferisca a un mondo permeato da
un approccio pragmatico e quantitativo quale dovrebbe divenire quello
delle discipline medico-biologiche. Per tale motivo, a nostro avviso, anche questa edizione costituisce un riferimento per la realtà accademica
italiana nell’attuale dibattito mirato a definire il ruolo che le discipline
statistiche debbono interpretare nell’ambito delle lauree e delle specializzazioni del comparto medico-biologico.
Adriano Decarli