C Indice L’Autore Ringraziamenti dell’Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione 1 Introduzione XI XI XIII 1 FAQ e qualcos’altro, da leggere prima 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 Questo è un libro di Statistica Serve un sacco di Matematica? Perché devo studiare la Statistica? Questo esame, io, non lo passerò mai! Ma questa Statistica, di preciso, che cos’è? Un po’ di storia (aiuta sempre) Come usare questo libro Ringraziamenti Un’aggiunta di ringraziamenti 2 Definizioni e notazione (simboli) di base 1 1 2 3 3 4 5 5 6 7 Perché da qualche parte si deve pur iniziare 2.1 2.2 2.3 2.4 2.5 La Statistica Fenomeno, unità e popolazione Numerosità di U Analisi statistica di un fenomeno Le due funzioni della Statistica 3 Rilevazione 7 7 9 10 11 13 Cioè come si creano i dati per partire con l’esplorazione statistica 3.1 3.2 3.3 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità Parte I STRUMENTI di STATISTICA DESCRITTIVA MONOVARIATA 4 Distribuzioni di frequenze, tabelle e grafici 13 15 17 23 25 Cioè come si strutturano i dati grezzi, perché è da qui che inizia l’analisi statistica 4.1 Distribuzione di frequenze e variabili statistiche 26 VI Indice 4.2 4.3 4.4 4.5 4.6 Frequenze relative e percentuali Frequenze cumulate Densità di frequenza Rappresentazioni grafiche Densità e istogrammi 5 Valori medi 27 30 32 35 39 45 Cioè come passare dai dati a un singolo indicatore 5.1 5.2 5.3 5.4 5.5 5.6 Moda Mediana Generalizzazioni della mediana: quartili, decili e percentili Sintesi in 5 numeri e box-plot Media aritmetica Moda, mediana e media aritmetica: qual è il valore medio giusto? 6 Approfondimenti sui valori medi 45 49 55 57 61 64 67 Cioè come usare le medie più consapevolmente 6.1 6.2 6.3 Proprietà formali: le proprietà della media aritmetica Ottimizzazione: funzioni di perdita e proprietà di minimo Invariante e medie di Chisini 7 Variabilità 67 74 79 83 Cioè la vera ragione per cui esiste la Statistica 7.1 7.2 7.3 7.4 Esiste la Statistica perché il mondo è vario: Trilussa e l’esempio del pollo Misura della variabilità: deviazione standard, varianza e devianza Valutazione e confronti di variabilità: il coefficiente di variazione Come si costruisce una percentuale di variabilità: normalizzazione e massima variabilità 8 Numeri indice 83 84 89 92 97 Cioè un assaggio di analisi statistica temporale 8.1 8.2 8.3 8.4 Serie storiche Numeri indice (semplici) Variazioni percentuali Tasso di variazione medio annuo Parte II STRUMENTI di STATISTICA DESCRITTIVA BIVARIATA 9 Tabelle a doppia entrata 97 98 99 100 105 107 Cioè come si creano e si strutturano i dati per partire con l’analisi statistica di una coppia di fenomeni 9.1 9.2 9.3 Rilevazione congiunta di una coppia di fenomeni statistici: tabelle a doppia entrata Frequenze congiunte e marginali Distribuzioni e frequenze condizionate 10 Indipendenza, connessione e associazione 107 109 111 115 Cioè l’analisi statistica congiunta di una coppia di fenomeni qualitativi 10.1 10.2 Indipendenza statistica Connessione 115 119 Indice 10.3 10.4 10.5 10.6 Indice di connessione normalizzato Associazione (locale) fra coppie di modalità Dicotomizzazione della tabella osservata Odds e Odds Ratio 11 Dipendenza e correlazione VII 122 124 128 128 133 Cioè l’analisi statistica congiunta di una coppia di fenomeni quantitativi 11.1 11.2 11.3 11.4 11.5 11.6 11.7 11.8 11.9 11.10 Medie e varianze marginali e condizionate Associatività delle medie condizionate Scomposizione della varianza marginale: varianza FRA e NEI gruppi Indipendenza in media e dipendenza di un fenomeno dall’altro Implicazione tra indipendenza statistica e indipendenza in media Indice di dipendenza di un fenomeno dall’altro Coppie di fenomeni quantitativi: momento misto e covarianza Diagramma a dispersione (scatter plot) Interpretazione geometrica della covarianza Correlazione lineare: concetto e misura 12 Approfondimenti sulle relazioni fra variabili statistiche 133 136 137 140 141 142 146 149 151 153 159 Cioè come si legano fra loro le diverse relazioni statistiche tra coppie di fenomeni 12.1 12.2 Situazioni limite di assenza di relazione Situazioni limite di perfetta relazione 13 Regressione 159 162 167 Cioè un assaggio di modelli statistici 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9 Modellare la relazione statistica fra due fenomeni quantitativi: perché e come Regressione Retta di regressione dei minimi quadrati Analisi dei residui della retta di regressione dei minimi quadrati Scomposizione della devianza: devianza spiegata e residua Bontà di adattamento della retta dei minimi quadrati Si può andare oltre? Cenni alle analisi successive alla retta di regressione Scelta del modello Regressione logistica per fenomeni qualitativi Parte III STRUMENTI di INFERENZA STATISTICA 14 Dalla descrizione all’inferenza 167 167 169 173 174 177 181 181 182 189 191 Cioè come cambiano obiettivi e strumenti 14.1 14.2 Rilevazione campionaria: perché solo una parte e non tutto? Inferenza e rappresentatività: quando il caso gioca a favore 15 Caso, probabilità e variabili casuali 191 192 195 Cioè gli ingredienti matematici per fare buona inferenza statistica 15.1 15.2 15.3 15.4 Determinismo e casualità Definizioni di base Probabilità Variabile casuale 195 196 198 200 VIII Indice 15.5 15.6 15.7 15.8 15.9 15.10 15.11 Variabile casuale binomiale Variabile casuale continua Variabile casuale Normale Standardizzazione di una variabile casuale Variabile casuale Normale standard(izzata) Come si leggono le tavole della Normale standard Come si calcola la probabilità di un (qualunque) intervallo di una (qualunque) Normale 15.12 Intervalli tipici della Normale Tavola della v.c. normale standardizzata 16 Campionamento ed errore campionario 204 207 209 213 214 214 215 217 220 221 Cioè dove si inizia e dove si va a finire 16.1 16.2 16.3 16.4 Dalla popolazione al campione giocando con il caso 221 Variabilità campionaria ed errore campionario: come tenerli sotto controllo usando il campione casuale 222 Formalizzazione della variabilità campionaria 224 Inferenza statistica: oggetto, funzioni e le diverse facce dell’errore campionario 225 17 Stime e stimatori 227 Cioè come trasformare i dati campionari in informazioni 17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8 17.9 17.10 17.11 17.12 17.13 17.14 Stima puntuale Stima della media Proprietà degli stimatori: non distorsione Non distorsione della media campionaria Precisione o accuratezza di uno stimatore: errore quadratico medio Errore quadratico medio della media campionaria Proprietà degli stimatori: consistenza Consistenza della media campionaria Proprietà degli stimatori: efficienza relativa Efficienza della media campionaria Stima della varianza σ2 Stima della precisione (accuracy) di uno stimatore: standard error Stima della percentuale (frequenza relativa) p Stima della retta di regressione 18 Intervalli di confidenza 227 229 229 230 232 233 235 235 235 236 237 239 241 244 255 Cioè come trarre ancora più informazioni dai dati campionari 18.1 18.2 18.3 18.4 18.5 18.6 18.7 18.8 Stima puntuale e stima intervallare: pro e contro Intervallo di confidenza per la media μ con popolazione normale e σ2 nota Studentizzazione e variabile casuale T di Student Intervallo di confidenza per la media μ con popolazione normale e σ2 ignota Intervalli di confidenza (approssimati) per grandi campioni per la media e per la percentuale Intervalli di confidenza per la previsione estrapolata dal modello lineare Istruzioni d’uso e avvertenze per gli intervalli di confidenza (IC) Precisione degli intervalli di confidenza 255 257 261 262 264 267 270 271 Indice IX Relazione fra livello di confidenza, numerosità campionaria e precisione dell’intervallo di confidenza 18.10 Errore assoluto di stima e come decidere l’ampiezza del campione 18.11 Pianificazione di n per la stima della media e della percentuale Tavola della v.c. T di Student con g gradi di libertà 272 273 274 279 18.9 19 Test statistici 281 Cioè come verificare ipotesi statistiche utilizzando i dati campionari 19.1 19.2 19.3 Ipotesi statistica e ipotesi nulla Errore campionario e livello di significatività Z-test per la verifica di ipotesi su μ per popolazione normale con σ2 nota 19.4 T -test per la verifica di ipotesi su μ per popolazione normale e σ2 ignota 19.5 Test a una coda 19.6 Ipotesi uni- o bilaterali e test a una o due code: riepilogo 19.7 Test approssimati per grandi campioni 19.8 Z-test per grandi campioni per la verifica di ipotesi sulla frequenza relativa p (o sulla percentuale 100 ⋅ p) 19.9 Concetto di p-value 19.10 Avvertenze e osservazioni sul p-value 19.11 Dati campionari qualitativi bivariati: tabelle di contingenza 19.12 Variabile casuale Chi quadrato 19.13 Test Chi quadrato di indipendenza statistica 19.14 Dati campionari quantitativi bivariati: T -test sul coefficiente angolare del modello lineare o test di incorrelazione 19.15 Avvertenza finale Tavola della v.c. Chi quadrato con g gradi di libertà Indice analitico Eserciziario 281 282 284 288 291 294 295 295 298 299 300 302 303 306 310 311 313 E1