Renato Guseo STATISTICA Terza edizione, (2006), CEDAM, PADOVA. INDICE 1 Statistica 1 1.1 Natura ed origini della Statistica . . . . . . . . . . . . . . . . . . . 1 1.1.1 Etimologia della parola Statistica . . . . . . . . . . . . . . . . . . 2 1.1.2 Origini storiche della Statistica . . . . . . . . . . . . . . . . . . 2 1.1.3 Statistica moderna e contemporanea . . . . . . . . . . . . . . . . . . 6 1.2 Variabilità e modelli statistici . . . . . . . . . . . . . . . . . 8 1.3 Alcuni esempi applicativi . . . . . . . . . . . . . . . . . . . . . . .12 1.3.1 La terra tende a scaldarsi? . . . . . . . . . . . . . . . . . . . . .12 1.3.2 Ottima lavorabilità di leghe polimeriche . . . . . . . . . . . .13 1.3.3 Previsione delle vendite di prodotti . . . . . . . . . . . . . . . . .14 1.3.4 Il campionamento . . . . . . . . . . . . . . . . . . . . . . . . . . .15 1.3.5 Strategia ottimale di semina . . . . . . . . . . . . . . . . . . . . .16 1.3.6 Caratterizzazione quantitativa di uno stile . . . . . . . . . . . . . .16 1.3.7 Le rilevazioni ufficiali e l'ISTAT . . . . . . . . . . . . . . . . . .17 1.3.8 Alcune proposte di riflessione e di lavoro . . . . . . . . . . 18 1.4 Le strutture statistiche di base . . . . . . . . . . . . . . . . . . . 22 1.4.1 Identificabiltà e rumore . . . . . . . . . . . . . . . . . . . 23 1.4.2 Fonti di incertezza e gradi di identificabilità . . . . . . . . 25 1.4.3 Struttura del modello descrittivo . . . . . . . . . . . . . . 26 1.4.4 Struttura del modello stocastico . . . . . . . . . . . . . . 30 2 Popolazioni e caratteri 33 2.1 Caratteri e scale di modalità . . . . . . . . . . . . . . . . . . . . 33 2.2 Rilevazione, spoglio univariato e bivariato . . . . . . . . . . . . . 35 2.3 Serie, caso qualitativo univariato . . . . . . . . . . . . . . . . . . 40 2.3.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 42 2.3.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 46 2.4 Serie, caso qualitativo bivariato e multivariato . . . . . . . . . . . 47 2.4.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 48 2.4.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 49 2.5 Serie, seriazioni, caso quantitativo univariato . . . . . . . . . . . 49 2.5.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 51 2.5.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 55 2.6 Serie, seriazioni, caso quantitativo bivariato . . . . . . . . . . . . 56 2.6.1 Rappresentazioni grafiche . . . . . . . . . . . . . . . . . . 56 2.6.2 Trasformazioni . . . . . . . . . . . . . . . . . . . . . . . . 56 3 Caratteri qualitativi 61 3.1 Caso univariato, indicatori . . . . . . . . . . . . . . . . . . . . . . 61 3.2 Indici di localizzazione . . . . . . . . . . . . . . . . . . . . . . . . 61 3.2.1 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.2.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.3 Indici di mutabilità . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3.1 Indice di Gini . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3.2 Entropia di Shannon . . . . . . . . . . . . . . . . . . . . . 67 3.3.3 Programmazione del calcolo di H e di G . . . . . . . . . . 75 3.4 Normalizzazione in distribuzione . . . . . . . . . . . . . . . . . . 77 3.5 Trasformazioni delle serie . . . . . . . . . . . . . . . . . . . . . . 80 3.6 Casi bivariato e multivariato, indicatori . . . . . . . . . . . . . . 81 3.6.1 Localizzazione e mutabilitµa congiunte . . . . . . . . . . . 84 3.7 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 86 3.7.1 Trasformazioni ed indipendenza . . . . . . . . . . . . . . . 89 3.8 Associazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 3.8.1 Associazione nelle tabelle 2 x 2 . . . . . . . . . . . . . . . 90 3.8.2 Indici di associazione di Edwards . . . . . . . . . . . . . . 92 3.8.3 Indice di associazione di Yule . . . . . . . . . . . . . . . . 93 3.8.4 Associazione in tabelle n x m . . . . . . . . . . . . . . . . 95 3.9 Connessione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 3.9.1 Indice di Mortara . . . . . . . . . . . . . . . . . . . . . . . 97 3.9.2 Indice di Pearson . . . . . . . . . . . . . . . . . . . . . . . 99 3.10 Analisi dell'entropia bivariata . . . . . . . . . . . . . . . . . . . . 101 3.10.1 Entropia residua . . . . . . . . . . . . . . . . . . . . . . . 101 3.10.2 Scomposizione dell'entropia marginale; informazione . . . 102 3.10.3 Indici di connessione e di dipendenza entropici. . . . . . . 105 3.10.4 Dipendenza, normalizzazione in distribuzione . . . . . . . 106 3.10.5 Indici di dipendenza entropica: programmi . . . . . . . . 107 3.11 Cograduazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 3.12 Analisi dell'entropia trivariata . . . . . . . . . . . . . . . . . . . . 117 3.12.1 Connessione tra tre caratteri. . . . . . . . . . . . . . . . . 117 3.12.2 Dipendenza multipla e dipendenza parziale . . . . . . . . 121 4 Caratteri quantitativi: caso univariato 127 4.1 Variabili statistiche e loro indicatori . . . . . . . . . . . . . . . . 127 4.1.1 Momenti dall'origine . . . . . . . . . . . . . . . . . . . . . 127 4.1.2 Momenti centrali . . . . . . . . . . . . . . . . . . . . . . . 130 4.2 Localizzazione di una variabile . . . . . . . . . . . . . . . . . . . 131 4.2.1 Medie lasche; moda, mediana e quantili . . . . . . . . . . 132 4.2.2 Grafici box e whiskers . . . . . . . . . . . . . . . . . . . . 141 4.2.3 Medie potenziate . . . . . . . . . . . . . . . . . . . . . . . 142 4.2.4 Media aritmetica e valor medio . . . . . . . . . . . . . . . 146 4.2.5 Media armonica . . . . . . . . . . . . . . . . . . . . . . . 148 4.2.6 Media geometrica . . . . . . . . . . . . . . . . . . . . . . . 149 4.2.7 Media quadratica . . . . . . . . . . . . . . . . . . . . . . . 150 4.2.8 Criteri di selezione e principio di Chisini . . . . . . . . . . 150 4.2.9 Centri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 4.3 Trasformazioni e diseguaglianza di Jensen . . . . . . . . . . . . . 154 4.4 Variabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 4.4.1 Scostamenti medi assoluti . . . . . . . . . . . . . . . . . . 158 4.4.2 Differenze medie assolute . . . . . . . . . . . . . . . . . . 159 4.4.3 Disuguaglianze di Tchebychev e di Markov . . . . . . . . 161 4.4.4 Confronti di variabilità, normalizzazioni . . . . . . . . . . 164 4.5 Concentrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 4.6 Relazioni tra i concetti di variabilità . . . . . . . . . . . . . . . . 179 4.7 Asimmetria e curtosi . . . . . . . . . . . . . . . . . . . . . . . . . 181 5 Caratteri quantitativi: caso bivariato 185 5.1 Variabili statistiche doppie e indicatori . . . . . . . . . . . . . . . 185 5.1.1 Momenti delle distribuzioni marginali e condizionate . . . 188 5.2 Funzione di regressione ed indipendenza in media . . . . . . . . . 189 5.2.1 Prima proprietà della funzione di regressione . . . . . . . 190 5.2.2 Scomposizione della varianza . . . . . . . . . . . . . . . . 191 5.2.3 Connessione e dipendenza: il rapporto di correlazione . . 194 5.3 Momenti misti ordinari e centrali . . . . . . . . . . . . . . . . . . 197 5.3.1 Covarianza e coefficiente di correlazione di Bravais-Pearson 198 5.4 Nozioni di dipendenza e di indipendenza . . . . . . . . . . . . . . 206 5.5 Criterio dei minimi quadrati . . . . . . . . . . . . . . . . . . . . . 211 5.5.1 Seconda proprietà della funzione di regressione . . . . . . 211 5.5.2 Modelli regressivi e criterio dei minimi quadrati . . . . . . 211 5.5.3 Equazioni normali, soluzioni e devianza residua . . . . . . 213 5.5.4 Retta di regressione e indice di Bravais-Pearson . . . . . 217 5.6 Devianze per famiglie monotone di modelli . . . . . . . . . . . . 221 5.6.1 Polinomio di grado massimo e sua devianza residua . . . . 224 5.6.2 Indici di miglioramento o di adattamento relativo . . . . . 225 5.7 Regressione non lineare nei parametri . . . . . . . . . . . . . . . 232 5.7.1 Minimi quadrati e metodo di Gauss-Newton . . . . . . . 233 5.7.2 Modelli linearizzabili e linearizzazioni . . . . . . . . . . . 235 5.8 Confronto tra modelli di classi non monotone . . . . . . . . . . . 237 6 Caratteri quantitativi: caso multiplo 241 6.1 Matrice di varianze e covarianze, nozioni preliminari . . . . . . . 241 6.2 Criterio dei minimi quadrati: regressione multipla . . . . . . . . . 243 6.2.1 Equazioni normali, forma diretta, devianza residua . . . . 244 6.2.2 Equazioni normali, forma indiretta, varianza residua . . . 245 6.2.3 Teorema di monotonia delle devianze residue . . . . . . . 249 6.2.4 Indici di miglioramento o di adattamento relativo . . . . . 250 6.3 Interpretazione geometrica del modello lineare . . . . . . . . . . . 252 6.3.1 Teorema di Pitagora . . . . . . . . . . . . . . . . . . . . . 256 6.3.2 Proiezione ortogonale in sottospazi nidificati. . . . . . . . 256 6.3.3 Proiezioni ortogonali in sottospazi comuni . . . . . . . . . 259 6.3.4 Rapporto di correlazione multipla . . . . . . . . . . . . . 261 6.3.5 Trasformazioni e riparametrizzazioni . . . . . . . . . . . . 262 6.3.6 Forme equivalenti delle equazioni normali . . . . . . . . . 263 6.3.7 Regressione con variabili esplicative standardizzate . . . . 264 6.4 Regressione e correlazione parziale . . . . . . . . . . . . . . . . . 267 6.4.1 I modelli interpretativi . . . . . . . . . . . . . . . . . . . . 267 6.4.2 La regressione parziale . . . . . . . . . . . . . . . . . . . . 267 6.4.3 Selezione stepwise . . . . . . . . . . . . . . . . . . . . . . 272 6.4.4 Regressione multipla parziale . . . . . . . . . . . . . . . . 274 6.5 Correlazione parziale e correlazione ecologica . . . . . . . . . . . 274 6.5.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . 274 6.5.2 Scomposizione della covarianza . . . . . . . . . . . . . . . 276 6.5.3 Scomposizione della covarianza ecologica . . . . . . . . . . 277 6.5.4 Scomposizione della covarianza in tre termini e covarianza parziale . 278 6.5.5 Correlazione parziale con una variabile concomitante . . . 279 6.5.6 Confronti tra correlazione parziale e correlazione ecologica 280 6.5.7 Modello a due livelli . . . . . . . . . . . . . . . . . . . . . 282 7 Struttura della matrice di covarianze 285 7.1 La matrice di covarianze e la regressione . . . . . . . . . . . . . . 285 7.2 Singolarità, aspetti interpretativi ed operativi . . . . . . . . . . . 289 7.3 Autovalori ed autovettori di §K . . . . . . . . . . . . . . . . . . . 298 8 Componenti principali 301 8.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 8.2 Definizione delle componenti principali . . . . . . . . . . . . . . . 303 8.3 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . 311 8.4 Il caso bivariato . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 8.5 Interpretazione delle componenti principali . . . . . . . . . . . . 319 8.6 Un esempio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 9 Elementi di calcolo delle probabilità 327 9.1 Variabilitµa accidentale . . . . . . . . . . . . . . . . . . . . . . . . 327 9.2 Spazio campionario ed eventi . . . . . . . . . . . . . . . . . . . . 329 9.3 Teoria degli insiemi: nozioni . . . . . . . . . . . . . . . . . . . . . 329 9.4 Calcolo delle probabilità: postulati . . . . . . . . . . . . . . . . . 332 9.5 Probabilità condizionata . . . . . . . . . . . . . . . . . . . . . . . 338 9.6 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 340 9.6.1 Formula di Bayes . . . . . . . . . . . . . . . . . . . . . . . 341 9.7 Variabile casuale . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 9.7.1 Variabili casuali discrete . . . . . . . . . . . . . . . . . . . 343 9.7.2 Variabili casuali continue . . . . . . . . . . . . . . . . . . 344 9.7.3 Vettore casuale . . . . . . . . . . . . . . . . . . . . . . . . 345 9.7.4 Vettore casuale discreto . . . . . . . . . . . . . . . . . . . 346 9.7.5 Vettore casuale continuo . . . . . . . . . . . . . . . . . . . 347 9.7.6 Distribuzioni di probabilità marginali e condizionate . . . 347 9.8 Indipendenza stocastica . . . . . . . . . . . . . . . . . . . . . . . 348 9.9 Trasformazioni di variabili casuali . . . . . . . . . . . . . . . . . . 351 9.10 Trasformate univariate di vettori casuali . . . . . . . . . . . . . . 354 9.10.1 Trasformate univariate di variabili casuali doppie . . . . . 354 9.11 Valori segnaletici di una distribuzione . . . . . . . . . . . . . . . 358 9.11.1 Valor medio o valore atteso . . . . . . . . . . . . . . . . . 358 9.11.2 Applicazioni del valor medio . . . . . . . . . . . . . . . . 360 9.11.3 Funzione generatrice dei momenti . . . . . . . . . . . . . . 364 9.12 Successioni di variabili casuali: convergenze . . . . . . . . . . . . 366 10 Modelli teorici di distribuzioni 369 10.1 Principali distribuzioni discrete univariate . . . . . . . . . . . . . 369 10.1.1 Distribuzione uniforme discreta . . . . . . . . . . . . . . . 370 10.1.2 Distribuzione triangolare simmetrica discreta . . . . . . . 372 10.1.3 Distribuzione binomiale elementare . . . . . . . . . . . . . 376 10.1.4 Distribuzione binomiale . . . . . . . . . . . . . . . . . . . 377 10.1.5 Distribuzione di Poisson . . . . . . . . . . . . . . . . . . . 382 10.1.6 Distribuzione ipergeometrica . . . . . . . . . . . . . . . . 389 10.2 Principali distribuzioni continue univariate . . . . . . . . . . . . . 393 10.2.1 Distribuzione uniforme continua . . . . . . . . . . . . . . 394 10.2.2 Distribuzione normale o gaussiana . . . . . . . . . . . . . 395 10.2.3 Teorema del limite centrale . . . . . . . . . . . . . . . . . 402 10.2.4 Distribuzione gamma . . . . . . . . . . . . . . . . . . . . . 406 10.2.5 Distribuzione esponenziale . . . . . . . . . . . . . . . . . . 408 10.2.6 Distribuzione chi quadrato . . . . . . . . . . . . . . . . . . 410 10.2.7 Distribuzione t di Student . . . . . . . . . . . . . . . . . . 412 10.2.8 Distribuzione F di Snedecor . . . . . . . . . . . . . . . . . 413 10.3 Alcuni esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 10.4 Distribuzioni discrete bivariate . . . . . . . . . . . . . . . . . . . 425 10.4.1 Distribuzione uniforme discreta bivariata . . . . . . . . . 426 10.4.2 Un esempio di composizione . . . . . . . . . . . . . . . . . 429 10.5 Distribuzioni continue bivariate . . . . . . . . . . . . . . . . . . . 430 10.5.1 Distribuzione uniforme continua bivariata . . . . . . . . . 431 10.5.2 Distribuzione normale bivariata . . . . . . . . . . . . . . . 434 10.5.3 Composizione di distribuzioni miste . . . . . . . . . . . . 444 10.6 Appendice: Tavole statistiche . . . . . . . . . . . . . . . . . . . . 446 11 Elementi di stima puntuale e intervallare 455 11.1 Inferenza statistica . . . . . . . . . . . . . . . . . . . . . . . . . . 455 11.2 Statistiche campionarie . . . . . . . . . . . . . . . . . . . . . . . 457 11.2.1 Distribuzione della media campionaria: ¹X . . . . . . . . . 458 11.2.2 Distribuzione della varianza campionaria: S2 . . . . . . . 459 11.2.3 Distribuzione della media campionaria: mu ignoto . . . . . 460 11.2.4 Distribuzione della differenza di due medie campionarie . 461 11.2.5 Rapporto di due varianze . . . . . . . . . . . . . . . . . . 461 11.3 Stima puntuale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462 11.3.1 Proprietà asintotiche . . . . . . . . . . . . . . . . . . . . . 464 11.4 Metodo della massima verosimiglianza . . . . . . . . . . . . . . . 474 11.4.1 Stima di massima verosimiglianza . . . . . . . . . . . . . 475 11.4.2 Proprietµa degli stimatori di massima verosimiglianza . . . 477 11.5 Metodo dei momenti . . . . . . . . . . . . . . . . . . . . . . . . . 479 11.6 Intervalli di confidenza . . . . . . . . . . . . . . . . . . . . . . . . 479 11.6.1 Metodo generale per la costruzione di regioni di confidenza 483 11.6.2 Intervalli di confidenza asintotici . . . . . . . . . . . . . . 484 11.7 Verifica d'ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . 484 11.8 Test di adattamento . . . . . . . . . . . . . . . . . . . . . . . . . 491 11.9 Alcuni esempi operativi . . . . . . . . . . . . . . . . . . . . . . . 494 11.10La regressione: generalità . . . . . . . . . . . . . . . . . . . . . . 501 11.11La regressione lineare . . . . . . . . . . . . . . . . . . . . . . . . 501 11.11.1 La stima puntuale: minimi quadrati . . . . . . . . . . . . 501 11.11.2 La stima per intervallo e la verifica d'ipotesi . . . . . . . . 503 11.12La regressione lineare multipla . . . . . . . . . . . . . . . . . . . 506 12 Elementi di algebra lineare 509 12.1 Vettori e spazi vettoriali . . . . . . . . . . . . . . . . . . . . . . . 509 12.2 Prodotto interno, norma e proiezione . . . . . . . . . . . . . . . . 511 12.3 Indipendenza lineare, basi . . . . . . . . . . . . . . . . . . . . . . 513 12.4 Scomposizioni ortogonali su sottospazi . . . . . . . . . . . . . . . 517 12.5 Spazio lineare delle matrici . . . . . . . . . . . . . . . . . . . . . 520 12.6 Prodotto righe per colonne di matrici . . . . . . . . . . . . . . . . 521 12.7 Norme e determinanti . . . . . . . . . . . . . . . . . . . . . . . . 523 12.8 Non singolarità, inversa, rango . . . . . . . . . . . . . . . . . . . 525 12.9 Trasformazioni e ortogonalizzazioni . . . . . . . . . . . . . . . . . 528 12.10Soluzioni di un sistema lineare omogeneo . . . . . . . . . . . . . . 531 12.11Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . 531 12.12Autovalori ed autovettori . . . . . . . . . . . . . . . . . . . . . . 533 13 Temi 541 14 Appendice matematica 699 14.1 Relazioni e funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . 699 14.2 Numeri cardinali . . . . . . . . . . . . . . . . . . . . . . . . . . . 703 14.3 Indici e successioni univariate . . . . . . . . . . . . . . . . . . . . 706 14.4 Operatore sommatoria in Rn . . . . . . . . . . . . . . . . . . . . 710 14.5 Indici e successioni bivariate . . . . . . . . . . . . . . . . . . . . . 712 14.6 Operatore sommatoria doppia . . . . . . . . . . . . . . . . . . . . 715 14.7 Operatore sommatoria doppia vincolata . . . . . . . . . . . . . . 716 14.8 Logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719 14.9 Principio di induzione . . . . . . . . . . . . . . . . . . . . . . . . 725 14.10Media aritmetica, diseguaglianza di Jensen . . . . . . . . . . . . 728 Bibliografia 733 Elenco delle figure 737 Elenco delle tabelle 743 Indice analitico 745 Abbreviazioni 761 Renato Guseo Homepage Homepage del Dipartimento di Scienze Statistiche Homepage dell'Università di Padova