Elementi introduttivi di statistica descrittiva

Estratto della pubblicazione
Estratto della pubblicazione
PUBBLICAZIONI DELLA FACOLTÀ DI SCIENZE DELL’EDUCAZIONE
DELL’UNIVERSITÀ PONTIFICIA SALESIANA
ENCICLOPEDIA
DELLE SCIENZE DELL’EDUCAZIONE
116.
MARCO BAY
ELEMENTI INTRODUTTIVI DI STATISTICA DESCRITTIVA
Estratto della pubblicazione
MARCO BAY
ELEMENTI INTRODUTTIVI
DI STATISTICA DESCRITTIVA
LAS - ROMA
Estratto della pubblicazione
In copertina: Statua di Servio Tullio che sovrasta uno degli ingressi dell’Istituto
Nazionale di Statistica - Roma.
© 2012 by LAS - Libreria Ateneo Salesiano
Piazza dell’Ateneo Salesiano, 1 - 00139 ROMA
Tel. 06 87290626 - Fax 06 87290629
e-mail: [email protected] - http://las.unisal.it
ISBN 978-88-213-0815-4
–––––––––––––
Elaborazione elettronica: LAS  Stampa: Tip. Giammarioli - Via Enrico Fermi, 8-10 - Frascati (Roma)
Estratto della pubblicazione
Sai ched’è la statistica? È na’ cosa
che serve pe fà un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che spósa.
Ma pè me la statistica curiosa
è dove c’entra la percentuale,
pè via che, lì, la media è sempre eguale
puro co’ la persona bisognosa.
Me spiego: da li conti che se fanno
seconno le statistiche d’adesso
risurta che te tocca un pollo all’anno:
e, se nun entra nelle spese tue,
t’entra ne la statistica lo stesso
perch’è c’è un antro che ne magna due.
di Carlo Alberto Salustri
meglio conosciuto con
lo pseudonimo di Trilussa
Estratto della pubblicazione
INTRODUZIONE
«Egli infatti stabilì il censo, la più salutare di tutte le
istituzioni per un popolo destinato a tanta grandezza, col
quale i carichi fiscali in materia civile e militare non sarebbero più ripartiti pro capite, come nel passato, ma a
seconda del reddito. Il censo distribuì le classi, le centurie e quell’ordinamento che forma l’ornamento di Roma
in tempo di pace e la sua forza durante la guerra»
(TITO LIVIO, Ab Urbe Condita, Libro I, Par. 41-50).1
Nella citazione del passo di Tito Livio, che si sta riferendo al re Servio
Tullio, le parole «ordinamento che forma l’ornamento di Roma in tempo di
pace», anche se sono riferite al censo, le vorrei immaginare come un’essenza
che si nasconde all’interno della statistica come metodologia e come disciplina da collocare nell’orchestrazione delle scienze dell’educazione. Il ricercatore che esplora, indaga e tenta di scoprire modelli efficaci attorno al fatto
educativo non può trascurare di mettere in ordine le informazioni che osserva usando i numeri, non può evitare di descrivere la realtà umana e relazionale alla quale si adegua attraverso strumenti positivi. L’ordine che viene
dalla pratica e dall’applicazione degli strumenti della statistica offre garanzie
all’educatore ricercatore che eleva il buon senso a scienza. Infatti, come affermava Vincenzo Castellano, in fondo «la metodologia statistica studia il
processo di formazione dei concetti, li schematizza e li inquadra nel più vasto processo induttivo-deduttivo che costituisce la ricerca scientifica… la
Statistica è il punto di passaggio dal buonsenso alla Scienza».
Questo volume affronta alcuni elementi introduttivi di una parte della disciplina. È destinato a studenti che frequentano curricoli universitari di
Scienze dell’educazione e della formazione che hanno la necessità di conoscere gli elementi di base della statistica descrittiva, di saper leggere tabelle
e grafici statistici che spesso appaiono su articoli scientifici, rapporti di ricerca, annuari, di saper pubblicare in modo metodologicamente corretto le
sintesi degli esiti di una ricerca empirica contenente semplici elaborazioni.
1
Parte di questa citazione costituisce una epigrafe collocata ad uno degli ingressi dell’Istituto
Nazionale di Statistica di via Balbo a Roma.
Estratto della pubblicazione
8
Introduzione
Gli obiettivi prefissati e indicati ad ogni capitolo si ritiene siano conseguibili in modo ottimale se – come integrazione alla lettura del testo – si fa
pratica e ci si esercita ulteriormente attraverso l’apprendimento di un programma informatico di elaborazione dati come, ad esempio, il foglio elettronico.
Il linguaggio formale proprio dell’algebra, della matematica e della statistica
è ridotto alle formule principali che nella quasi totalità delle definizioni è completato da esempi svolti nei passaggi procedurali principali. Non ci si sofferma
in dimostrazioni, ma si preferisce offrire il più delle volte, quando si trattano
concetti e definizioni specifiche, il punto di vista analitico, quello geometrico o
grafico e quello interpretativo collegati tra loro.
Gli argomenti proposti sono preceduti dagli obiettivi che si intende raggiungere per anticipare al lettore gli orientamenti di ciascun capitolo.
Dopo la trattazione dei temi i capitoli contengono alcuni paragrafi che richiamano in sintesi la tematica del capitolo, i termini da ricordare, alcuni
esercizi da svolgere e alcune letture di approfondimento e offrono qualche
domanda stimolo per l’autovalutazione.
Ciascun paragrafo ha un’icona, come le seguenti, che richiama la finalità.
Obiettivi
Sintesi
Termini da ricordare
Esercizi
Lettura di approfondimento
Domande per l’autovalutazione
Gli argomenti sono distinti nei capitoli secondo quest’ordine.
Il primo capitolo introduce il lettore affinché possa individuare la fase
dell’applicazione statistica entro il processo di ricerca quantitativa ed empirica, riesca a definire che cosa si intende per statistica, possa distinguere i
principali ambiti caratteristici della statistica e conoscere alcune tappe storiche dello sviluppo della disciplina.
Estratto della pubblicazione
Introduzione
9
Nel secondo capitolo si procede nel definire i termini popolazione e campione, nel distinguere le tipologie di dati e scale per comprendere le variabili
e le modalità dei caratteri.
Nel terzo capitolo si inizia a definire il concetto di frequenza e ad eseguire i calcoli preliminari; si fa l’uso delle tabelle e si evidenziano le parti principali.
Il quarto capitolo mostra come procedere per saper raggruppare i dati in
classi e calcolare le frequenze relative, percentuali e cumulate; illustra e descrive i principali tipi di grafico e indica gli usi ricorrenti in base ai tipi di
variabile e quelli impropri o errati, considerando anche alcuni aspetti caratteristici delle forme geometriche.
Nel quinto capitolo sono presentati gli indicatori di tendenza centrale. Si
offre un quadro sintetico che permette di confrontare la media aritmetica e le
principali proprietà, la moda e la mediana in una distribuzione, per arrivare
anche a far comprendere i vantaggi nell’uso di indicatori di posizione come
decili, centili o percentili.
Il sesto capitolo è focalizzato sulla variabilità e la dispersione. Infatti introduce e approfondisce l’importanza della varianza e dello scarto quadratico medio, presenta il calcolo della asimmetria e della curtosi per individuare
la forma della distribuzione. Inoltre, si sofferma a riconoscere campo di variazione e coefficiente di variazione per attuare confronti e relazioni tra i dati
e le distribuzioni.
L’intero settimo capitolo introduce il concetto di normalità, descrive a livello generale la distribuzione normale e il suo utilizzo, abilita il lettore con
procedure ed esempi a saper attuare la trasformazione di valori nelle misure
di posizione relativa come i punteggi z e T. Alcuni paragrafi sono dedicati
all’utilizzo e ai vantaggi della distribuzione normale standardizzata.
Nell’ottavo capitolo si mostrano esempi di analisi bivariata, si indicano
relazioni tra tipologie di variabili diverse e come rappresentare i dati in tabelle di contingenza. Inoltre, si prende in considerazione il diagramma di dispersione e si analizzano i calcoli più semplici e l’interpretazione dei coefficienti di correlazione lineare.
Il nono capitolo è molto pratico. Presenta e descrive l’analisi descrittiva
completa dei dati di un questionario somministrato ad un campione di soggetti. Scandisce le fasi per la procedura di realizzazione del libro codice in
base al questionario, la successiva costruzione della matrice “casi per variabili” e l’inserimento dati tratti dai questionari compilati. Cenni di riepilogo
sono dati per una corretta rappresentazione dei dati in tabelle e grafici per
item secondo analisi monovariate, bivariate o multivariate.
L’ultimo capitolo, il decimo, passa in rassegna alcune tra le principali
Estratto della pubblicazione
10
Introduzione
fonti ufficiali di dati internazionali, indica anche banche dati, in particolare
nazionali ed europee e richiama l’importanza di alcune pubblicazioni cartacee fondamentali, come ad esempio gli annuari.
Oltre alla bibliografia, che contiene non soltanto le indicazioni delle opere consultate, ma anche titoli di testi di approfondimento e indirizzi di siti internet ufficiali a diversi livelli, sono predisposte alcune appendici. La prima
contiene richiami di algebra della scuola secondaria superiore, la seconda le
tavole principali per utilizzare alcune distribuzioni teoriche e la terza raccoglie in un glossario multilingue la terminologia specifica tradotta dall’italiano.
***
I ringraziamenti più doverosi vanno ad alcuni maestri della Facoltà di
Scienze dell’Educazione dell’Università Pontificia Salesiana, in particolare,
Silvano Sarti, Albino Ronco, Michele Pellerey, Renato Mion; agli appassionati esperti Giovanni Sgritta, Enrica Aureli, Domenica Iezzi, Fiorenza Deriu,
Luca Giuliano, Sergio Bolasco e ai docenti e collaboratori del Master Meters
in «Fonti, strumenti e metodi per la ricerca sociale» dell’Università degli
studi di Roma “La Sapienza”.
I ringraziamenti più sinceri sono poi, in primo luogo per gli studenti, soprattutto quelli provenienti da nazioni lontane, più pazienti, laboriosi e tenaci, che mi hanno offerto negli ultimi anni numerosi suggerimenti preziosi e
intelligenti, nonostante la fatica dell’apprendimento e, in secondo luogo, per
i colleghi dell’Istituto di Metodologia Didattica e della Comunicazione sociale.
Ringrazio infine Nicolò Suffi e Matteo Cavagnero dell’Editrice LAS per
la disponibilità e la competenza a livello editoriale.
Marco Bay SDB
FACOLTÀ DI SCIENZE DELL’EDUCAZIONE
UNIVERSITÀ PONTIFICIA SALESIANA DI ROMA
8 settembre 2011
Capitolo 1
RICERCA EMPIRICA QUANTITATIVA,
INDAGINE SCIENTIFICA E STATISTICA
Obiettivi del capitolo
– Indicare cenni storici dello sviluppo della statistica.
– Presentare alcune finalità principali della disciplina.
– Individuare la fase dell’applicazione statistica entro il processo di ricerca quantitativa ed empirica.
– Definire che cosa si intende per statistica.
– Distinguere i principali ambiti caratteristici della statistica.
Prima di definire i concetti basilari della statistica si cerca attraverso alcuni paragrafi introduttivi di presentare un breve quadro di riferimento che
ha l’intenzione di indicare al lettore le origini della statistica e a che punto
del processo di ricerca si può fare ricorso agli specifici vantaggi della disciplina. Ecco alcune premesse di ordine storico, metodologico e scientifico.
1. Cenni storici
Secondo Vittorio Castellano,1 nel 1589 in Italia Ghislini utilizza il termine «statistica» per indicare il complesso di conoscenze che descrivono le
qualità che caratterizzano uno Stato e gli elementi che lo compongono. La
1
V. CASTELLANO, Istituzioni di statistica, Roma, [dattiloscritto], 1962, p. 3.
Estratto della pubblicazione
12
Capitolo 1
disciplina nel tempo si è dedicata alla descrizione e all’investigazione di fenomeni sociali e naturali.
1.1. La statistica come attività di natura pratica
Nell’antichità, anche se non veniva chiamata statistica, esisteva l’attività
pratica volta a soddisfare le esigenze del corpo sociale oltre che gli individui.
Sono molteplici i metodi e le tecniche che sono conferiti progressivamente nell’ambito della Statistica, ma essenzialmente questa si è sempre caratterizzata per il suo porsi da un punto di vista globale e sintetico che è proprio
della collettività e non dei fatti individuali.
Nei secoli il gruppo umano organizzato e quindi la società amministrata e
gestita si sono sempre, in modo più o meno esplicito, serviti di attività pratiche per la visione sociale dei fatti. Si pensi alle conquiste, alle guerre, a vincitori e vinti, o al conteggio di materie prime (prodotti del suolo o esiti della
caccia), di schiavi o alla riscossione di tasse, pedaggi, ma anche alla misura
dell’estensione del territorio.
Ad esempio, nell’antico Egitto (circa nel 3000 a.C.) si può rintracciare la
pratica di contare gli individui che costituiscono la popolazione (si tratta di
primordiali censimenti). Inoltre si hanno a disposizione elenchi che riguardano gli ufficiali, le merci, i transiti da o verso depositi oppure i passaggi oltre i confini. A migliaia di anni di distanza questi elenchi ci pongono di fronte ad una società organizzata con uno Stato particolarmente attento all’autorità, al potere, al commercio, ecc.
Dai libri contabili egiziani si può passare alle vicende del popolo ebreo.
Si trovano all’interno della Bibbia, in particolare nel libro dei Numeri, collocato nell’Antico Testamento, le enumerazioni per stirpe che il profeta Mosè
prepara prima della fuga dall’Egitto e degli anni dell’esodo nel deserto.
Anche nell’impero cinese si fanno rilevazioni sul numero degli abitanti e
su estensioni territoriali. Una fonte «dalla quale possiamo ricavare alcune informazioni su tale attività è lo Shu-King – raccolta dei testi sacri del confucianesimo – che racconta come, nel 2200 a.C., dopo una grave inondazione,
il ministro Yu dell’imperatore Yao, per conoscere i confini dell’impero e per
richiedere appropriati ed equi tributi, divide il territorio della Cina in 9 province, ne misura le terre, ne determina la natura dei prodotti, rileva il numero degli abitanti, distinguendoli per attività e mestieri esercitati. Successivamente si ha notizia di censimenti attuati circa ogni tre anni e, durante l’epoca
Ming (1368-1644), ogni dieci anni».2
2
M.P. PERELLI D’ARGENZIO, Storia della statistica: i momenti decisivi, in «L’insegnamento
Estratto della pubblicazione
Ricerca empirica quantitativa
13
Nel 1200 a.C. in India in particolare nel codice civile e religioso, il Darmasastra, sono indicate non solo le regole riguardanti la vita dei Principi, ma
anche aspetti generali informativi dell’economia delle regioni, regolamentazioni delle autorità statali, industriali e commerciali.
Gli scrittori greci, principali fra gli altri Erodoto (484-425 a.C.) ed Aristotele (383-322 a.C.), ci forniscono notizie preziose, solo in forma descrittiva, del popolo greco e degli altri popoli che con esso venivano in contatto.
Tuttavia si conoscono durante il regno di Solone (594-593 a.C.) le relazioni
che con il censimento danno informazioni sugli elettori, sul valore dei possedimenti terrieri e di natura fiscale.
In Mesopotamia (450 a.C.) era d’uso a livello privato, aziendale e agricolo tenere sotto controllo con iscrizioni su tavolette proprietà, operazioni bancarie, prestiti, interessi sul piano locale e regionale.
Enumerazioni sistematiche e periodiche relative ad abitanti, cittadini e beni
si trovano alla base dell’Impero romano. Si può citare il celebre censimento
«per decreto di Cesare Augusto quando Quirinio era governatore della Siria»
– così riportano i vangeli, nella seconda parte della Bibbia che è il Nuovo Testamento – che documenta e colloca la nascita di Gesù Cristo nella storia.
Particolarmente importante è Servio Tullio, secondo la tradizione sesto re di
Roma (555 a.C.), il quale «si occupa di ciò che aveva la precedenza assoluta in
campo civile: come Numa aveva codificato i regolamenti in materia di religione, così Servio è passato ai posteri per aver stabilito a Roma il sistema delle divisioni in classi con il quale si differenziavano nettamente i diversi gradi di dignità sociale e di possibilità economiche. Stabilì, cioè, il censo, cosa utilissima
per un regno destinato a enormi ampliamenti, col quale i carichi fiscali in materia civile e militare non sarebbero più stati ripartiti pro capite, come in passato,
ma a seconda del reddito. Quindi divise la popolazione in classi e centurie secondo questa distribuzione basata sul censo e valida tanto in tempo di pace
quanto in tempo di guerra».3
Nel periodo dell’Impero romano che va all’incirca dal 96 al 193 d.C. con
i cosiddetti Antonini oltre al censimento si richiede la denuncia delle nascite.
E con Diocleziano (intorno al 302 d.C.) si hanno esempi di statistica economica sul «costo della vita» e sui prezzi. Importanti sono state le analisi fiscali, militari oltre a quelle amministrative.
Con Carlo Magno (742-814) si inizia a tenere in considerazione informazioni di carattere finanziario. Egli «istituisce nei possedimenti sottoposti alla
sua autorità il “breviarium fiscalium” per rilevare e aggiornare l’entità e il
della matematica e delle scienze integrate», vol. 25a-b (6) 2002, p. 525.
3
Si veda LIVIO, Ab Urbe Condita, Liber I, Par. 41-50 [n.t.].
14
Capitolo 1
valore delle terre poste sotto autorità imperiale, i benefici della Chiesa, i benefici dei feudatari. Inventari dei latifondi regi e delle grandi proprietà terriere private furono poi ordinate»4 successivamente. Con Guglielmo I (10281087) cominciano a rilevarsi dati – diremmo oggi – catastali.
Dal 1370 si forma uno dei più importanti organi di governo della Repubblica di Venezia: il maggior consiglio o consiglio dei dieci. Nel 1440 a Venezia si stabilisce un censimento della popolazione che rileva dati su variabili interessanti come il sesso, la professione, la nazionalità, la condizione sociale. Per alcuni è da considerarsi un primo censimento «moderno».
Non bisogna trascurare l’apporto della Chiesa e dei suoi organismi. Le
registrazioni e gli archivi custoditi in abazie e monasteri sono ancora oggi un
patrimonio indiscusso. Soprattutto dopo il Concilio di Trento (1545-1563)
gli atti obbligatori di nascita, di matrimonio, e di morte sono fonti (oltre ai
registri sui beni) rilevanti e di utilità.
Nel XIII secolo si hanno riferimenti e dati statistici in «Nuova Cronaca» di
Giovanni Villani (1280-1348) e nel «Tesoro» di Brunetto Latini (1220-1295).
Sebastian Munster (1488-1552), Francesco Sansovino (1521-1586) con
«Del governo et amministrazione di diversi Regni et Repubbliche così antiche come moderne», Giovanni Botero (1544-1617) e Joannes De Laet
(1581-1649) riportano nelle loro opere una massa notevole di notizie sulla
organizzazione statale.5
1.2. Dall’attività pratica ad un metodo proprio
La necessità di rendere lo studio e la descrizione di aspetti propri dello Stato qualcosa di autonomo e indipendente viene a formalizzarsi in una disciplina
vera e propria come lo sono la storia e la geografia. A partire dal XVII secolo
alcuni personaggi illustri contribuiscono a quella che può essere reputata la
nascita della statistica metodologica. Hermann Conring (1606-1681) nell’Università di Helmstedt, nella Bassa Sassonia in Germania, in qualità di apprezzato consigliere politico, sostenne l’autonomia della scienza giuridica dai presupposti teologici e l’importanza della statistica storica. Nel 1660 fece un corso di lezioni sulla descrizione sistematica della vita degli Stati dando il nome
di «Staatskunde» alle sue lezioni. In seguito, altre cattedre vennero istituite in
Università germaniche, tanto che venne l’uso di chiamare il nuovo indirizzo
«Statistica Universitaria».
4
5
M.P. PERELLI D’ARGENZIO, Storia della statistica: i momenti decisivi, p. 530.
Cfr. V. CASTELLANO, Istituzioni di statistica, p. 10.
Estratto della pubblicazione
Ricerca empirica quantitativa
15
John Graunt (1620-1674), commerciante di tessuti, capitano delle milizie
civiche e socio della Società reale di Londra, pubblica nel 1662 a Londra la
memoria «Osservazioni naturali e politiche elencate nell’indice seguente ed
eseguite sui bollettini della mortalità, dal capitano J. Graunt, socio della società Reale con riguardo al governo, alla religione, al commercio, allo sviluppo, al clima, alle malattie e ai vari mutamenti della detta città».
J. Graunt è innovativo perché mira a «utilizzare nelle scienze sociali oggetto dei suoi studi, metodi logici e tecnici di tipo naturalistico, classificatorio ed induttivo che costituiscono il primo abbozzo scientifico della Statistica modernamente intesa. Egli si può quindi considerare l’iniziatore di una
statistica “riflessa” che non si accontenta più di contare ma indaga, con metodi propri, per ottenere ulteriori informazioni».6
G. Anchenwell (1719-1772), professore a Gottinga, succede a Conring e
struttura organicamente l’impostazione del predecessore dando origine alla
Statistica universitaria; mentre continuatore di J. Graunt è William Petty
(1623-1687) che produce calcoli sistematici con i metodi di Graunt sulle popolazioni di Londra e Dublino.
A certe regolarità, riscontrate nella popolazione da J. Graunt, da W. Petty
e da altri aritmetici politici, attribuisce, qualche decennio dopo, un carattere
di generalità Johann Peter Süssmilch (1707-1767), considerato il fondatore
della Demografia.
Nel 1741 lo storico danese J. P. Anchersen pubblica un’opera intitolata
«Descriptio statuum cultiorum in tabulis» che diede un notevole impulso alla diffusione dei quadri sinottici ed all’uso delle cifre. Tra i difensori del metodo tabellare è bene citare August Friedrich Wilhelm Crome (1753-1833),
che pubblica opere ricche di prospetti, ed August Ludwig von Schlözer
(1735-1809), fondatore del giornalismo tedesco, il quale diede notevoli contributi all’organizzazione delle rilevazioni ufficiali.
Christiaan Huygens (1629-1695), Johan de Witt (1625-1672) e J. van W.
Hudde (1628-1704), esponenti dell’aritmetica politica, fanno studi sulla valutazione delle rendite sulle tavole di mortalità, speranza di vita, curva di
mortalità.
Edmond Halley (1656-1742), astronomo inglese, raccoglie le tabelle di
mortalità della città di Breslavia per regolare il valore delle assicurazioni
sulla vita, dando origine alla matematica assicurativa.
Abraham De Moivre (1667-1754), matematico francese, sviluppa in Inghilterra il calcolo della probabilità, consigliando i giocatori d’azzardo che a lui si
rivolgevano. A tal proposito pubblica, nel 1733, un saggio sulla distribuzione
6
M.P. PERELLI D’ARGENZIO, Storia della statistica: i momenti decisivi, p. 536.
Estratto della pubblicazione
16
Capitolo 1
binomiale e sulla transizione concettuale delle colonne dell’istogramma alla
curva continua e formula l’equazione della curva normale.
Numerosi studiosi diedero il loro contributo all’indirizzo enciclopedicomatematico. Ricordiamo Blaise Pascal (1623-1662), Pierre de Fermat (16011665), Christian Huygens (1629-1695), Jakob o Jacques Bernoulli (16541705), Jean-Antoine-Nicolas de Caritat o marchese di Condorcet (17431794), Abraham De Moivre (1667-1754), Pierre Simon Laplace (17491827), Carl Friedrich Gauss (1777-1855), Siméon Denis Poisson (17811840).
Ma soprattutto il nuovo indirizzo ebbe notevole impulso dalle opere di
due insigni autori: il belga Adolphe Quetelet (1796-1874) ed il francese Antoine Augustin Cournot (1801-1877).
Adolphe Quetelet si è dedicato alla matematica, all’astronomia, alla fisica e
alla meteorologia. Importanti iniziative quali la fondazione dell’osservatorio
di Bruxelles, l’organizzazione dei Congressi Internazionali di Statistica e
l’ordinamento della Statistica ufficiale belga lo hanno visto protagonista. Il
volume «Sur l’homme et le développement de ses facultés, ou Essai de physique sociale» (Parigi 1838) contiene argomenti sui caratteri demografici, fisici,
intellettuali e morali delle popolazioni; propone la teoria relativa all’uomo
medio, sostenendo che il tipo fisico di una popolazione è rappresentato dalle
medie aritmetiche di vari caratteri fisici calcolate su tutti i componenti la popolazione. Ma la sua opera di pregio è «Lettres sur la theorie des probabilités
appliquées aux sciences morales et politiques» (Bruxelles 1846) nella quale
sviluppa la legge binomiale dei caratteri umani. Infatti dimostra come i caratteri di una popolazione omogenea si distribuiscano secondo una curva le cui
ordinate sono proporzionali ai termini successivi dello sviluppo del binomio di
Newton.
Anche A.A. Cournot utilizzò il calcolo delle probabilità per effettuare indagini, ma sul versante dei fenomeni economici.
Non si può trascurare nella storia della statistica il ministro presbiteriano
britannico e matematico Thomas Bayes (1702-1761). Può essere reputato il
precursore della statistica induttiva e della teoria del campionamento. Il saggio «Essay towards solving a Problem in the doctrine of chances» traccia le
concordanze tra le ipotesi e l’esperienza, cioè come la verifica dinamica delle ipotesi si possa correggere in base alle informazioni che si ottengono nel
corso dell’esperienza. Si è reso famoso anche per il suo teorema, detto della
probabilità inversa.
Nel secolo seguente Francis Galton (1822-1911), esploratore, antropologo, climatologo, biologo, criminologo, cominciò a progettare scale di misurazione per tutte le caratteristiche fisiche anche per la psicometria e altre di-
Estratto della pubblicazione
Ricerca empirica quantitativa
17
scipline sperimentali. Continuando sui passi di Quételet con saggi scritti tra
il 1886 e il 1888, introduce la regressione lineare, la correlazione e costruisce le tavole di Galton.
A seguire è Karl Pearson (1875-1936) l’illustre matematico e statistico
britannico che con i suoi lavori influenzò notevolmente la teoria statistica.
Concetti come la legge normale multidimensionale, la correlazione parziale,
il test del χ² (“chi quadro”), i metodi per massimizzare la verisomiglianza
sono solo alcuni tra i temi più famosi.
Anche se forse viene meno citata, è da ricordare l’infermiera britannica
Florence Nightingale (1820-1910), fondatrice dell’assistenza infermieristica
moderna. Questa donna ebbe il coraggio e la lungimiranza di suggerire e applicare l’insegnamento della statistica a partire dalla scuola di base, sottolineando l’importanza della disciplina ai fini di prendere decisioni ragionevoli. È tra le prime donne ad essere associata alla Società di Statistica, ad applicare l’osservazione sistematica nella cura dei malati e degli indigenti, pur
dimostrando una religiosità cristiana molto profonda e una vita di dedizione
come risposta ad una vocazione.
William Sealy Gosset (1876-1937), diversamente da altri colleghi statistici famosi, al posto di dedicarsi alla carriera nella vita accademica, inizia con
l’elaborare dati nella famosissima birreria Guinnes. Si rende conto delle
condizioni con le quali vengono raccolti i dati come per esempio temperatura, umidità, origine del malto, ecc. Queste condizioni cambiando di continuo
e il fatto di avere pochi dati con le stesse condizioni sperimentali non consentono al ricercatore di applicare il teorema del limite centrale che permette
di far riferimento alla distribuzione gaussiana nei vari test statistici. Nel
1908 pubblica con lo pseudonimo di Student – poiché la birreria Guinness
vietava la pubblicazione di articoli per evitare la divulgazione dei segreti di
produzione della birra – l’articolo nel quale dimostra la distribuzione t, oggi
conosciuta a livello internazionale come distribuzione t di Student.
Uno statistico del XX secolo di importanza internazionale è l’inglese Ronald Aylmer Fisher (1890-1962). Cominciò con mostrare matematicamente
come i caratteri genetici (argomento di fondamentale interesse per il neodarwinismo) seguissero le regole indicate da Mendel e si distribuissero secondo un andamento a curva di Gauss. Comprese inoltre i vantaggi del campionamento casuale e propose l’analisi della varianza. Nel 1935 aggiorna la
verifica delle ipotesi statistiche introducendo i concetti di ipotesi nulla e alternativa.
Estratto della pubblicazione
18
Capitolo 1
1.3. La statistica in Italia
Antesignani della statistica descrittiva sono Francesco Maria Sansovino
(1521-1586), Giovanni Botero (1544-1617), Santorio Santorio (1561-1636).
«La prima Università italiana ad aver una cattedra di Statistica fu quella di
Napoli nel 1812; subito dopo anche l’impero austriaco la introduce nelle
università di Padova e di Pavia. A tale disciplina era attribuito comunque solo il compito di descrivere i fenomeni collettivi e non l’investigare sulle leggi che li possono governare, sulla loro interdipendenza e riproduzione. Un
programma così orientato portava, di fatto, all’esclusione della statistica come scienza: nelle opere dei docenti di quel periodo la finalità più importante
(cioè quella investigativa) veniva passata sotto silenzio. Così la Statistica,
pur introdotta nell’insegnamento in antiche e prestigiose Università italiane,
rimase isolata dal vero e proprio progresso e dibattito scientifico».7
Angelo Messedaglia (1820-1901), dopo Padova, passò all’Università di
Roma, scrisse interessanti monografie ed in particolare un’importante memoria sul calcolo dei valori medi e sulle sue applicazioni statistiche.
Oltre a Luigi Bodio (1840-1920) e Rodolfo Benini (1862-1956), notevole
importanza assume anche Antonio Gabaglio (1840-1909), uno degli studiosi
ai quali si deve la trasformazione della statistica da pura descrizione di fatti
in metodo scientifico basato sulla matematica. La sua opera principale è
«Storia e teoria generale della statistica» (1880).
Con la costituzione nel 1861 del Regno d’Italia, «fu avvertita la necessità
di creare un ufficio nazionale di statistica che doveva costituire per il Governo lo strumento per l’adozione delle misure più idonee a favorire lo sviluppo della Nazione, a cui era stato dato, solo allora, l’assetto unitario. Fu
quindi costituita a Torino una Divisione di Statistica Generale che fu incaricata della preparazione dei piani di rilevazione, dell’elaborazione dei dati
raccolti e della loro diffusione».8
Da annoverare tra i più importanti statistici italiani degli inizi del XX secolo è Corrado Gini (1884-1965). Nel 1927 fu creatore e primo presidente
dell’Istituto Centrale di Statistica. Bruno De Finetti (1906-1985), invece,
acquistò una solida fama di studioso internazionalmente noto per i suoi con7
M.P. PERELLI D’ARGENZIO, Storia della statistica: i momenti decisivi, p. 547.
G. LETI - L. CERBARA, Elementi di statistica descrittiva, Bologna, il Mulino, 2009, p. 20-21.
Si vedano anche i seguenti contributi citati in nota dello stesso volume: G. LETI, L’Istat e il Consiglio Superiore di Statistica dal 1926 al 1945, in «Annali di Statistica», anno 125, serie X, vol. 8,
Roma, 1996, Istituto Nazionale di Statistica; G. LETI, La statistica pubblica italiana dalle origini
ad oggi, in «Bollettino della Unione Matematica Italiana», (8), 3-A, aprile 2000 (La matematica
nella società e nella cultura), pp. 1-39.
8
Estratto della pubblicazione