Renato Guseo
STATISTICA
Terza edizione, (2006), CEDAM, PADOVA.
INDICE




















1 Statistica 1
1.1 Natura ed origini della Statistica . . . . . . . . . . . . . . . . . . . 1
1.1.1 Etimologia della parola Statistica . . . . . . . . . . . . . . . . . . 2
1.1.2 Origini storiche della Statistica . . . . . . . . . . . . . . . . . . 2
1.1.3 Statistica moderna e contemporanea . . . . . . . . . . . . . . . . . . 6
1.2 Variabilità e modelli statistici . . . . . . . . . . . . . . . . . 8
1.3 Alcuni esempi applicativi . . . . . . . . . . . . . . . . . . . . . . .12
1.3.1 La terra tende a scaldarsi? . . . . . . . . . . . . . . . . . . . . .12
1.3.2 Ottima lavorabilità di leghe polimeriche . . . . . . . . . . . .13
1.3.3 Previsione delle vendite di prodotti . . . . . . . . . . . . . . . . .14
1.3.4 Il campionamento . . . . . . . . . . . . . . . . . . . . . . . . . . .15
1.3.5 Strategia ottimale di semina . . . . . . . . . . . . . . . . . . . . .16
1.3.6 Caratterizzazione quantitativa di uno stile . . . . . . . . . . . . . .16
1.3.7 Le rilevazioni ufficiali e l'ISTAT . . . . . . . . . . . . . . . . . .17
1.3.8 Alcune proposte di riflessione e di lavoro . . . . . . . . . . 18
1.4 Le strutture statistiche di base . . . . . . . . . . . . . . . . . . . 22
1.4.1 Identificabiltà e rumore . . . . . . . . . . . . . . . . . . . 23
1.4.2 Fonti di incertezza e gradi di identificabilità . . . . . . . . 25
1.4.3 Struttura del modello descrittivo . . . . . . . . . . . . . . 26
1.4.4 Struttura del modello stocastico . . . . . . . . . . . . . . 30













2 Popolazioni e caratteri 33
2.1 Caratteri e scale di modalità . . . . . . . . . . . . . . . . . . . . 33
2.2 Rilevazione, spoglio univariato e bivariato . . . . . . . . . . . . . 35
2.3 Serie, caso qualitativo univariato . . . . . . . . . . . . . . . . . . 40
2.3.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 42
2.3.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 46
2.4 Serie, caso qualitativo bivariato e multivariato . . . . . . . . . . . 47
2.4.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 48
2.4.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 49
2.5 Serie, seriazioni, caso quantitativo univariato . . . . . . . . . . . 49
2.5.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 51
2.5.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 55
2.6 Serie, seriazioni, caso quantitativo bivariato . . . . . . . . . . . . 56


2.6.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 56
2.6.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 56

































3 Caratteri qualitativi 61
3.1 Caso univariato, indicatori . . . . . . . . . . . . . . . . . . . . . . 61
3.2 Indici di localizzazione . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.1 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.3 Indici di mutabilità . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.1 Indice di Gini . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3.2 Entropia di Shannon . . . . . . . . . . . . . . . . . . . . . 67
3.3.3 Programmazione del calcolo di H e di G . . . . . . . . . . 75
3.4 Normalizzazione in distribuzione . . . . . . . . . . . . . . . . . . 77
3.5 Trasformazioni delle serie . . . . . . . . . . . . . . . . . . . . . . 80
3.6 Casi bivariato e multivariato, indicatori . . . . . . . . . . . . . . 81
3.6.1 Localizzazione e mutabilitµa congiunte . . . . . . . . . . . 84
3.7 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 86
3.7.1 Trasformazioni ed indipendenza . . . . . . . . . . . . . . . 89
3.8 Associazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.8.1 Associazione nelle tabelle 2 x 2 . . . . . . . . . . . . . . . 90
3.8.2 Indici di associazione di Edwards . . . . . . . . . . . . . . 92
3.8.3 Indice di associazione di Yule . . . . . . . . . . . . . . . . 93
3.8.4 Associazione in tabelle n x m . . . . . . . . . . . . . . . . 95
3.9 Connessione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.9.1 Indice di Mortara . . . . . . . . . . . . . . . . . . . . . . . 97
3.9.2 Indice di Pearson . . . . . . . . . . . . . . . . . . . . . . . 99
3.10 Analisi dell'entropia bivariata . . . . . . . . . . . . . . . . . . . . 101
3.10.1 Entropia residua . . . . . . . . . . . . . . . . . . . . . . . 101
3.10.2 Scomposizione dell'entropia marginale; informazione . . . 102
3.10.3 Indici di connessione e di dipendenza entropici. . . . . . . 105
3.10.4 Dipendenza, normalizzazione in distribuzione . . . . . . . 106
3.10.5 Indici di dipendenza entropica: programmi . . . . . . . . 107
3.11 Cograduazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3.12 Analisi dell'entropia trivariata . . . . . . . . . . . . . . . . . . . . 117
3.12.1 Connessione tra tre caratteri. . . . . . . . . . . . . . . . . 117
3.12.2 Dipendenza multipla e dipendenza parziale . . . . . . . . 121










4 Caratteri quantitativi: caso univariato 127
4.1 Variabili statistiche e loro indicatori . . . . . . . . . . . . . . . . 127
4.1.1 Momenti dall'origine . . . . . . . . . . . . . . . . . . . . . 127
4.1.2 Momenti centrali . . . . . . . . . . . . . . . . . . . . . . . 130
4.2 Localizzazione di una variabile . . . . . . . . . . . . . . . . . . . 131
4.2.1 Medie lasche; moda, mediana e quantili . . . . . . . . . . 132
4.2.2 Grafici box e whiskers . . . . . . . . . . . . . . . . . . . . 141
4.2.3 Medie potenziate . . . . . . . . . . . . . . . . . . . . . . . 142
4.2.4 Media aritmetica e valor medio . . . . . . . . . . . . . . . 146
4.2.5 Media armonica . . . . . . . . . . . . . . . . . . . . . . . 148













4.2.6 Media geometrica . . . . . . . . . . . . . . . . . . . . . . . 149
4.2.7 Media quadratica . . . . . . . . . . . . . . . . . . . . . . . 150
4.2.8 Criteri di selezione e principio di Chisini . . . . . . . . . . 150
4.2.9 Centri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.3 Trasformazioni e diseguaglianza di Jensen . . . . . . . . . . . . . 154
4.4 Variabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.4.1 Scostamenti medi assoluti . . . . . . . . . . . . . . . . . . 158
4.4.2 Differenze medie assolute . . . . . . . . . . . . . . . . . . 159
4.4.3 Disuguaglianze di Tchebychev e di Markov . . . . . . . . 161
4.4.4 Confronti di variabilità, normalizzazioni . . . . . . . . . . 164
4.5 Concentrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
4.6 Relazioni tra i concetti di variabilità . . . . . . . . . . . . . . . . 179
4.7 Asimmetria e curtosi . . . . . . . . . . . . . . . . . . . . . . . . . 181






















5 Caratteri quantitativi: caso bivariato 185
5.1 Variabili statistiche doppie e indicatori . . . . . . . . . . . . . . . 185
5.1.1 Momenti delle distribuzioni marginali e condizionate . . . 188
5.2 Funzione di regressione ed indipendenza in media . . . . . . . . . 189
5.2.1 Prima proprietà della funzione di regressione . . . . . . . 190
5.2.2 Scomposizione della varianza . . . . . . . . . . . . . . . . 191
5.2.3 Connessione e dipendenza: il rapporto di correlazione . . 194
5.3 Momenti misti ordinari e centrali . . . . . . . . . . . . . . . . . . 197
5.3.1 Covarianza e coefficiente di correlazione di Bravais-Pearson 198
5.4 Nozioni di dipendenza e di indipendenza . . . . . . . . . . . . . . 206
5.5 Criterio dei minimi quadrati . . . . . . . . . . . . . . . . . . . . . 211
5.5.1 Seconda proprietà della funzione di regressione . . . . . . 211
5.5.2 Modelli regressivi e criterio dei minimi quadrati . . . . . . 211
5.5.3 Equazioni normali, soluzioni e devianza residua . . . . . . 213
5.5.4 Retta di regressione e indice di Bravais-Pearson . . . . . 217
5.6 Devianze per famiglie monotone di modelli . . . . . . . . . . . . 221
5.6.1 Polinomio di grado massimo e sua devianza residua . . . . 224
5.6.2 Indici di miglioramento o di adattamento relativo . . . . . 225
5.7 Regressione non lineare nei parametri . . . . . . . . . . . . . . . 232
5.7.1 Minimi quadrati e metodo di Gauss-Newton . . . . . . . 233
5.7.2 Modelli linearizzabili e linearizzazioni . . . . . . . . . . . 235
5.8 Confronto tra modelli di classi non monotone . . . . . . . . . . . 237










6 Caratteri quantitativi: caso multiplo 241
6.1 Matrice di varianze e covarianze, nozioni preliminari . . . . . . . 241
6.2 Criterio dei minimi quadrati: regressione multipla . . . . . . . . . 243
6.2.1 Equazioni normali, forma diretta, devianza residua . . . . 244
6.2.2 Equazioni normali, forma indiretta, varianza residua . . . 245
6.2.3 Teorema di monotonia delle devianze residue . . . . . . . 249
6.2.4 Indici di miglioramento o di adattamento relativo . . . . . 250
6.3 Interpretazione geometrica del modello lineare . . . . . . . . . . . 252
6.3.1 Teorema di Pitagora . . . . . . . . . . . . . . . . . . . . . 256
6.3.2 Proiezione ortogonale in sottospazi nidificati. . . . . . . . 256


















6.3.3 Proiezioni ortogonali in sottospazi comuni . . . . . . . . . 259
6.3.4 Rapporto di correlazione multipla . . . . . . . . . . . . . 261
6.3.5 Trasformazioni e riparametrizzazioni . . . . . . . . . . . . 262
6.3.6 Forme equivalenti delle equazioni normali . . . . . . . . . 263
6.3.7 Regressione con variabili esplicative standardizzate . . . . 264
6.4 Regressione e correlazione parziale . . . . . . . . . . . . . . . . . 267
6.4.1 I modelli interpretativi . . . . . . . . . . . . . . . . . . . . 267
6.4.2 La regressione parziale . . . . . . . . . . . . . . . . . . . . 267
6.4.3 Selezione stepwise . . . . . . . . . . . . . . . . . . . . . . 272
6.4.4 Regressione multipla parziale . . . . . . . . . . . . . . . . 274
6.5 Correlazione parziale e correlazione ecologica . . . . . . . . . . . 274
6.5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . 274
6.5.2 Scomposizione della covarianza . . . . . . . . . . . . . . . 276
6.5.3 Scomposizione della covarianza ecologica . . . . . . . . . . 277
6.5.4 Scomposizione della covarianza in tre termini e covarianza parziale . 278
6.5.5 Correlazione parziale con una variabile concomitante . . . 279
6.5.6 Confronti tra correlazione parziale e correlazione ecologica 280
6.5.7 Modello a due livelli . . . . . . . . . . . . . . . . . . . . . 282




7 Struttura della matrice di covarianze 285
7.1 La matrice di covarianze e la regressione . . . . . . . . . . . . . . 285
7.2 Singolarità, aspetti interpretativi ed operativi . . . . . . . . . . . 289
7.3 Autovalori ed autovettori di §K . . . . . . . . . . . . . . . . . . . 298







8 Componenti principali 301
8.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
8.2 Definizione delle componenti principali . . . . . . . . . . . . . . . 303
8.3 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . 311
8.4 Il caso bivariato . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
8.5 Interpretazione delle componenti principali . . . . . . . . . . . . 319
8.6 Un esempio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321













9 Elementi di calcolo delle probabilità 327
9.1 Variabilitµa accidentale . . . . . . . . . . . . . . . . . . . . . . . . 327
9.2 Spazio campionario ed eventi . . . . . . . . . . . . . . . . . . . . 329
9.3 Teoria degli insiemi: nozioni . . . . . . . . . . . . . . . . . . . . . 329
9.4 Calcolo delle probabilità: postulati . . . . . . . . . . . . . . . . . 332
9.5 Probabilità condizionata . . . . . . . . . . . . . . . . . . . . . . . 338
9.6 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 340
9.6.1 Formula di Bayes . . . . . . . . . . . . . . . . . . . . . . . 341
9.7 Variabile casuale . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
9.7.1 Variabili casuali discrete . . . . . . . . . . . . . . . . . . . 343
9.7.2 Variabili casuali continue . . . . . . . . . . . . . . . . . . 344
9.7.3 Vettore casuale . . . . . . . . . . . . . . . . . . . . . . . . 345
9.7.4 Vettore casuale discreto . . . . . . . . . . . . . . . . . . . 346











9.7.5 Vettore casuale continuo . . . . . . . . . . . . . . . . . . . 347
9.7.6 Distribuzioni di probabilità marginali e condizionate . . . 347
9.8 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 348
9.9 Trasformazioni di variabili casuali . . . . . . . . . . . . . . . . . . 351
9.10 Trasformate univariate di vettori casuali . . . . . . . . . . . . . . 354
9.10.1 Trasformate univariate di variabili casuali doppie . . . . . 354
9.11 Valori segnaletici di una distribuzione . . . . . . . . . . . . . . . 358
9.11.1 Valor medio o valore atteso . . . . . . . . . . . . . . . . . 358
9.11.2 Applicazioni del valor medio . . . . . . . . . . . . . . . . 360
9.11.3 Funzione generatrice dei momenti . . . . . . . . . . . . . . 364
9.12 Successioni di variabili casuali: convergenze . . . . . . . . . . . . 366


























10 Modelli teorici di distribuzioni 369
10.1 Principali distribuzioni discrete univariate . . . . . . . . . . . . . 369
10.1.1 Distribuzione uniforme discreta . . . . . . . . . . . . . . . 370
10.1.2 Distribuzione triangolare simmetrica discreta . . . . . . . 372
10.1.3 Distribuzione binomiale elementare . . . . . . . . . . . . . 376
10.1.4 Distribuzione binomiale . . . . . . . . . . . . . . . . . . . 377
10.1.5 Distribuzione di Poisson . . . . . . . . . . . . . . . . . . . 382
10.1.6 Distribuzione ipergeometrica . . . . . . . . . . . . . . . . 389
10.2 Principali distribuzioni continue univariate . . . . . . . . . . . . . 393
10.2.1 Distribuzione uniforme continua . . . . . . . . . . . . . . 394
10.2.2 Distribuzione normale o gaussiana . . . . . . . . . . . . . 395
10.2.3 Teorema del limite centrale . . . . . . . . . . . . . . . . . 402
10.2.4 Distribuzione gamma . . . . . . . . . . . . . . . . . . . . . 406
10.2.5 Distribuzione esponenziale . . . . . . . . . . . . . . . . . . 408
10.2.6 Distribuzione chi quadrato . . . . . . . . . . . . . . . . . . 410
10.2.7 Distribuzione t di Student . . . . . . . . . . . . . . . . . . 412
10.2.8 Distribuzione F di Snedecor . . . . . . . . . . . . . . . . . 413
10.3 Alcuni esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
10.4 Distribuzioni discrete bivariate . . . . . . . . . . . . . . . . . . . 425
10.4.1 Distribuzione uniforme discreta bivariata . . . . . . . . . 426
10.4.2 Un esempio di composizione . . . . . . . . . . . . . . . . . 429
10.5 Distribuzioni continue bivariate . . . . . . . . . . . . . . . . . . . 430
10.5.1 Distribuzione uniforme continua bivariata . . . . . . . . . 431
10.5.2 Distribuzione normale bivariata . . . . . . . . . . . . . . . 434
10.5.3 Composizione di distribuzioni miste . . . . . . . . . . . . 444
10.6 Appendice: Tavole statistiche . . . . . . . . . . . . . . . . . . . . 446








11 Elementi di stima puntuale e intervallare 455
11.1 Inferenza statistica . . . . . . . . . . . . . . . . . . . . . . . . . . 455
11.2 Statistiche campionarie . . . . . . . . . . . . . . . . . . . . . . . 457
11.2.1 Distribuzione della media campionaria: ¹X . . . . . . . . . 458
11.2.2 Distribuzione della varianza campionaria: S2 . . . . . . . 459
11.2.3 Distribuzione della media campionaria: mu ignoto . . . . . 460
11.2.4 Distribuzione della differenza di due medie campionarie . 461
11.2.5 Rapporto di due varianze . . . . . . . . . . . . . . . . . . 461

















11.3 Stima puntuale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
11.3.1 Proprietà asintotiche . . . . . . . . . . . . . . . . . . . . . 464
11.4 Metodo della massima verosimiglianza . . . . . . . . . . . . . . . 474
11.4.1 Stima di massima verosimiglianza . . . . . . . . . . . . . 475
11.4.2 Proprietµa degli stimatori di massima verosimiglianza . . . 477
11.5 Metodo dei momenti . . . . . . . . . . . . . . . . . . . . . . . . . 479
11.6 Intervalli di confidenza . . . . . . . . . . . . . . . . . . . . . . . . 479
11.6.1 Metodo generale per la costruzione di regioni di confidenza 483
11.6.2 Intervalli di confidenza asintotici . . . . . . . . . . . . . . 484
11.7 Verifica d'ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . 484
11.8 Test di adattamento . . . . . . . . . . . . . . . . . . . . . . . . . 491
11.9 Alcuni esempi operativi . . . . . . . . . . . . . . . . . . . . . . . 494
11.10La regressione: generalità . . . . . . . . . . . . . . . . . . . . . . 501
11.11La regressione lineare . . . . . . . . . . . . . . . . . . . . . . . . 501
11.11.1 La stima puntuale: minimi quadrati . . . . . . . . . . . . 501
11.11.2 La stima per intervallo e la verifica d'ipotesi . . . . . . . . 503
11.12La regressione lineare multipla . . . . . . . . . . . . . . . . . . . 506













12 Elementi di algebra lineare 509
12.1 Vettori e spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . 509
12.2 Prodotto interno, norma e proiezione . . . . . . . . . . . . . . . . 511
12.3 Indipendenza lineare, basi . . . . . . . . . . . . . . . . . . . . . . 513
12.4 Scomposizioni ortogonali su sottospazi . . . . . . . . . . . . . . . 517
12.5 Spazio lineare delle matrici . . . . . . . . . . . . . . . . . . . . . 520
12.6 Prodotto righe per colonne di matrici . . . . . . . . . . . . . . . . 521
12.7 Norme e determinanti . . . . . . . . . . . . . . . . . . . . . . . . 523
12.8 Non singolarità, inversa, rango . . . . . . . . . . . . . . . . . . . 525
12.9 Trasformazioni e ortogonalizzazioni . . . . . . . . . . . . . . . . . 528
12.10Soluzioni di un sistema lineare omogeneo . . . . . . . . . . . . . . 531
12.11Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . 531
12.12Autovalori ed autovettori . . . . . . . . . . . . . . . . . . . . . . 533

13 Temi 541











14 Appendice matematica 699
14.1 Relazioni e funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 699
14.2 Numeri cardinali . . . . . . . . . . . . . . . . . . . . . . . . . . . 703
14.3 Indici e successioni univariate . . . . . . . . . . . . . . . . . . . . 706
14.4 Operatore sommatoria in Rn . . . . . . . . . . . . . . . . . . . . 710
14.5 Indici e successioni bivariate . . . . . . . . . . . . . . . . . . . . . 712
14.6 Operatore sommatoria doppia . . . . . . . . . . . . . . . . . . . . 715
14.7 Operatore sommatoria doppia vincolata . . . . . . . . . . . . . . 716
14.8 Logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719
14.9 Principio di induzione . . . . . . . . . . . . . . . . . . . . . . . . 725
14.10Media aritmetica, diseguaglianza di Jensen . . . . . . . . . . . . 728





Bibliografia 733
Elenco delle figure 737
Elenco delle tabelle 743
Indice analitico 745
Abbreviazioni 761
Renato Guseo Homepage
Homepage del Dipartimento di Scienze Statistiche
Homepage dell'Università di Padova