Andrea Bonanomi Università Cattolica del Sacro Cuore Principi di Statistica Descrittiva Milano, 9 gennaio 2015 Camera di Commercio Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma RIPETIBILITA’ ATTUALE RIPETIBILITA’ VIRTUALE RILEVAZIONE TOTALE RILEVAZIONE PARZIALE UNIVERSO CAMPIONE INSIEME UNITA’ STATISTICHE RILEVATE Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 REALTA’ Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma FENOMENI NON COSTANTI (attitudine a variare) RILEVAZIONE 1. Individuazione di uno o più CARATTERI sui quali acquisire le informazioni 2. Individuazione delle UNITA’ STATISTICHE portatori del carattere in studio 3. Procedimento di misurazione del carattere che porta alla individuazione delle MODALITA’ con cui il carattere si presenta Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Esempio di rilevazione di dati in Excel Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica BRANCHE DELLA STATISTICA Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma statistica descrittiva sintesi delle osservazioni campionarie o dei dati censuari statistica probabilistica studio del meccanismo generatore delle realizzazioni campionarie (modello campione) statistica inferenziale dal campione al suo meccanismo generatore (campione modello) Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica FASI RICERCA STATISTICA Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma - Identificazione del problema - Astrazione - individuazione variabili osservabili/ proxy - Rilevazione - sperimentazione, questionari, … - Spoglio dei dati - organizzazione dati - classificazione Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma - Elaborazione dei dati - sintesi - interpretazione - inferenza osservazione: una prima statistica consiste nel costruire le tabelle riassuntive Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Data – Set Esempio: Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 94 immobili venduti in un anno da un’agenzia immobiliare. Vengono rilevate le seguenti variabili: Codice, Indirizzo, Valore, Categoria Energetica, Giorni sul mercato, Metratura, Numero di Stanze. Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica TABELLE DI FREQUENZA Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma organizzazione dei dati elementari prospetti/elenchi delle osservazioni se i dati sono tanti è utile riorganizzarli in TABELLE utilizzando la nozione fondamentale di FREQUENZA Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Non ha molto senso…meglio raggruppare i valori in classi! Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Gli indici si posizione sono misure sintetiche (‘valori caratteristici’) che descrivono la tendenza centrale di un fenomeno La tendenza centrale è, in prima approssimazione, la modalità della relativa variabile verso la quale i casi tendono a gravitare, ossia il ‘baricentro’ della distribuzione Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 ALCUNI INDICI TIPICI Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma - moda - percentili di ordine p non analitici - mediana - medie potenziate aritmetica armonica geometrica quadratica……. analitici Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma da qualitativi in su MODA (o norma) da qualitativi ordinati in su MEDIANA (o percentili) da quantitativi MEDIE Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 MODA Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma MODALITA’ A CUI E’ ASSOCIATA LA MAGGIOR FREQUENZA O DENSITA’ DI FREQUENZA • può essere calcolata sia per caratteri qualitativi che quantitativi • può non essere unica •VANTAGGI: può essere sempre calcolata •SVANTAGGI: - perdita di informazioni - no confronti Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Max frequenza: 28 Moda: “Bunker Hill Dr” Utile per i caratteri qualitativi non ordinabili. Per gli altri caratteri non è informativa Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica ESEMPIO Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma VARIABILE QUANTITATIVA RAGGRUPPATA IN CLASSI: si calcolano le densità di frequenza classi età numero lettori classi età numero lettori 6-|11 11-|14 14-|20 20-|25 25-|35 35-!45 45-|55 55-|65 65 -|80 totale 6-|11 11-|14 14-|20 20-|25 25-|35 35-!45 45-|55 55-|65 65 -|80 totale 221 573 2883 2864 5449 5384 4607 3692 2694 28367 221 573 2883 2864 5449 5384 4607 3692 2694 28367 ai 5 3 6 5 10 10 10 10 15 Fonte; ISTAT, indagine sulla lettura e su altro impiego del tempo libero, 1986 Classe modale: 20-|25 Mo=(20+25)/2=22.5 Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 li 44.2 191 480.5 572.8 544.9 538.4 460.7 369.2 179.6 MEDIANA Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma MODALITA’ CHE OCCUPA LA POSIZIONE CENTRALE NELLA SEQUENZA ORDINATA DEI DATI •può essere calcolata sia per caratteri qualitativi che quantitativi purchè ordinabili • percentile di ordine 0.5 •VANTAGGI: non risente dei valori estremi •SVANTAGGI: solo per caratteri ordinabili - perdita di informazioni - no confronti Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Formule operative di calcolo per i vari tipi di caratteri ordinabili Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma numerosità dei dati n = pari/dispari esempio caso carattere quantitativo discreto: n = dispari Me = x0.5 = valore di posizione (n+1)/2 n = pari Me = x0.5 = semisomma dei valori di posto n/2 ed (n/2+1) Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma caso n=94 pari n/2=47 e (n/2+1)=48 sulle Ni=53 con le frequenze relative sulle Fi=0.564 Mediana= 4 4 stanze per abitazione Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 PERCENTILE di ordine p Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma MODALITA’ CHE DIVIDE LA DISTRIBUZIONE ORDINATA DEI DATI IN PIU’ PARTI • può essere calcolato sia per caratteri qualitativi che quantitativi purché ordinabili • 0<p<1 • valore preceduto da almeno il p% dei casi e seguito da almeno il (1-p)% dei casi Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Alcuni esempi sono Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma dividono in 4 parti la distribuzione quartili xmin xmax decili dividono in 10 parti la distribuzione percentili dividono in 100 parti la distribuzione Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Per i QUARTILI Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma x0.25 = Q1 = 1° quartile (lascia alla sua sinistra il 25% e alla sua destra il 75%) x0.50 = Q2 = 2° quartile (lascia alla sua sinistra il 50% e alla sua destra il 50%) x0.75 = Q3 = 3° quartile (lascia alla sua sinistra il 75% e alla sua destra il 25%) Q1 xmin Q2 Q3 xmax Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma In generale: il percentile xp di ordine p è quella modalità che è: - preceduta da almeno p% dei casi - superata da almeno (1p)% dei casi Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Grafici BOX–PLOT Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma (o BOX&WHISKERS) GRAFICO RIASSUNTIVO DEI MAGGIORI INDICI DESCRITTIVI UNIVARIATI CHE CONSENTE CONFRONTI “VISIVI” TRA DIVERSE VARIABILI Per ogni variabile vengono rappresentate: - mediana (Q2) - I e III quartile (Q1 e Q3) - Differenza interquartile H = Q3 – Q1 - minimo e massimo Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica 500 Il BOX è la scatola rossa. Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 400 Q3 300 BOX 200 Q2 Q1 100 0 E’ delimitata da Q1 e Q3 mentre la linea nera al suo interno indica la mediana Q2. Tra Q3 e Q1 si trova il 50% delle unità statistiche. -100 N= 406 Cilindrata in cc Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica 500 Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma W H I S K E R S Q3 + 1.5(Q3Q1) o xmax 400 300 Q3 200 Q2 100 Q1 Q1 1.5(Q3Q1) o xmin 0 -100 N= 406 Cilindrata in cc Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica xmax 300 Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 200 Valori anomali 124 9 20 103 7 8 32 102 Q3 + 1.5(Q3Q1) 100 (outliers) 0 N= 400 Potenza (CV) Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica MEDIA ARITMETICA Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma •La media è il valore caratteristico più noto fra quelli che rilevano la tendenza centrale •E’ il valore atteso di una successiva rilevazione •E’ la parte del totale delle intensità che spetta a ciascuna unità Può essere calcolata solo per variabili quantitative ATTENZIONE: Molto spesso è comodo associare alle modalità qualitative codici numerici (es. numero di matricola, codice identificativo cliente). Nonostante la ricodifica, la variabile rimane connotata secondo la caratteristica intrinseca del fenomeno di cui essa è rilevazione. NON HA SENSO FARE LA MEDIA DEL NUMERO DI CODICE!!!!!!!!!! Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma •VANTAGGI: - molto immediata - la più conosciuta e usata - è lo stimatore ottimale della media di una popolazione nella stima puntuale e intervallare •SVANTAGGI: - assume anche valori non osservati - risente dei valori estremi e degli outliers 1 n x ( ) xi n i 1 Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica La mediana varia maggiormente passando da un campione all’altro, mentre la media è più stabile Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma La media può essere utilizzata per la statistica induttiva mentre la mediana non può essere utilizzata La mediana è stabile rispetto ai valori estremi, mentre la media non lo è. Questo può comportare vantaggi e svantaggi a seconda dei casi Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica INDICI DI VARIABILITA’ Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma - indice sintetico di posizione è utile per alcuni confronti - appare tuttavia insufficiente - sintesi troppo spinta, perde informazioni - interessano anche indicatori della diversità (molteplicità) dei valori di un carattere Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma ..senza variabilità non ci sarebbe la statistica… Se tutti votassimo lo stesso partito alle elezioni (=moda), non ci sarebbero i sondaggi, ne le previsioni elettorali…il voto politico sarebbe una unica modalità… Se tutte le persone fossero alte uguali (=media) non esisterebbe la variabile altezza, perché non la misureremmo… La statistica si basa sulla diversità, studia l’attitudine a variare dei fenomeni Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 MUTABILITA’ Principi di Statistica LA VARIABILITA’ DEI FENOMENI QUALITATIVI Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Per misurarla si usano gli indici di eterogeneità •Sono indici che si basano sulla frequenze relative o percentuali •Non sono vincolati da un particolare ordinamento delle modalità •Quindi possono essere calcolati per qualsiasi tipo di fenomeno Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica MUTABILITA’ Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma LA VARIABILITA’ DEI FENOMENI QUALITATIVI Proprietà degli indici di eterogeneità •Sono sempre positivi •Sono massimi quando ad ogni modalità assunta dal fenomeno corrisponde la stessa frequenza, cioè fi=1/k per ogni i •Sono minimi quando il fenomeno assume una sola modalità, cioè una pi è uguale a 1 e tutte le altre (k-1) sono uguali a 0 Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 MUTABILITA’ Principi di Statistica LA VARIABILITA’ DEI FENOMENI QUALITATIVI Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Indice di eterogeneità di Gini k E1 1 pi2 i 1 Assume valori compresi tra 0 (minimo) e (k-1)/k (massimo) Per normalizzarlo in modo che vari tra 0 e 1 bisogna dividerlo per il suo massimo: E1* k E1 k 1 Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Altissima eterogeneità, valore prossimo a uno. Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 VARIABILITA’ Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma LA VARIABILITA’ DEI FENOMENI QUANTITATIVI Per misurarla si usano •gli indici di variabilità globale si basano sulle differenze tra i valori delle modalità •gli indici di dispersione si basano sulle differenze tra i valori delle modalità e un prefissato indice di posizione Entrambi possono essere calcolati solo per fenomeni quantitativi Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 VARIABILITA’ Principi di Statistica LA VARIABILITA’ DEI FENOMENI QUANTITATIVI Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Proprietà degli indici di variabilità e di dispersione •Sono sempre positivi •Sono uguali a zero quando tutte le unità osservate assumono la stessa modalità, la variabile statistica in tal caso si dice degenere •Sono invarianti per traslazione, cioè se ad ogni xi viene aggiunta una quantità c costante, la variabilità di X non cambia NOTA: per gli indici di variabilità e dispersione non è immediata la determinazione del loro valore massimo, tralasceremo il calcolo dei valori normalizzati degli indici Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica VARIABILITA’ Descrittiva LA VARIABILITA’ DEI FENOMENI QUANTITATIVI Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 1700 1400 2000 1700 1650 1750 Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica VARIABILITA’ Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma LA VARIABILITA’ DEI FENOMENI QUANTITATIVI Indici di variabilità globale Differenza Interquartile D.I. = Q3-Q1 Campo di Variazione K= xmax-xmin Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica VARIABILITA’ Descrittiva LA VARIABILITA’ DEI FENOMENI QUANTITATIVI Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Indici di dispersione Varianza Si basa sulla differenze tra i valori delle modalità e la loro media. xi x xi x Si considerano gli scostamenti al quadrato per evitare compensazioni tra distanze positive e negative. Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma VARIANZA Se si considera una tabella di rilevazione, la varianza aritmetica è data dalla seguente formula n 2 n 1 1 2 xi x xi2 x n i 1 n i 1 2 FORMULA OPERATIVA Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 VARIANZA: problemi Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Elevando al quadrato si perde l’unità di misura del fenomeno Ex. Se si è partiti dal peso, la varianza risulta espressa in kg2 SCARTO QUADRATICO MEDIO 2 E’ un indice assoluto, cioè risente dell’unità di misura del fenomeno, e ciò impedisce di fare confronti di variabilità E’ lo stimatore ottimale della variabilità nella stima puntuale e intervallare E’ un numero puro, non risente della scala di misurazione COEFFICIENTE DI VARIAZIONE CV x Indice relativo Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 SIMMETRIA Principi di Statistica Una v.s. è simmetrica rispetto ad un centro c se: Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma - per ogni xi = c k - esiste un xj = c k (simmetrico) con stessa frequenza: f(xi) = f(xj) 8 7 6 5 4 3 2 1 0 N= 23 X Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica • ASIMMETRIA POSITIVA (a sinistra) 8 Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 7 6 5 4 3 2 1 0 N= 23 X curva obliqua a sinistra Mo < Me < Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 • ASIMMETRIA NEGATIVA (a destra) Principi di Statistica 8 Descrittiva 7 Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma 6 5 4 3 2 1 0 N= 23 X curva obliqua a destra <Me < Mo Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Indici di simmetria o asimmetria Indice di FISHER o di SKEWNESS Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma (più comunemente usato) -3 M[(X)3] 1 3 3 se asimmetria sinistra se asimmetria destra se simmetria NB 1 > 0 1 < 0 1 = 0 ( = 0 ) è solo sintomo di simmetria !! Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Indici di curtosi Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Se una distribuzione è simmetrica o quasi simmetrica allora può esser più o meno appuntita o più o meno appiattita rispetto alla distribuzione normale (o di Gauss) Se la curva è • più appuntita si dice curva Leptocurtica • più appiattita si dice curva Platicurtica - K < + Se K = 0 distribuzione normale se K > 0 curva leptocurtica Se K < 0 curva platicurtica. 4 x x f i i 1 i K 4 3 i f i Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Indice di curtosi Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma IMPORTANTE Si può utilizzare anche lo strumento di excel “Strumenti>analisi dati>statistica descrittiva” Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana DISTRIBUZIONE NORMALE o gaussiana Y X Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana • La curva normale o curva di Gauss è una distribuzione teorica di punteggi in una popolazione • Riguarda solo le variabili metriche continue, quindi le misure almeno su scale a intervalli equivalenti • L’importanza di questa distribuzione è dovuta al fatto che molti dei fenomeni osservati si distribuiscono normalmente o con forme che si approssimano alla curva normale • Inoltre gran parte della statistica inferenziale si basa sulle proprietà di questa distribuzione • La curva NORMALE è interamente definita dai parametri (la media che corrisponde al valore x con la frequenza massima) e (dev. st.) • Poiché la distribuzione normale varia al variare di e si può parlare di famiglia di distribuzioni normali con medie e deviazioni standard diverse Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Funzione di densità Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana E’ definita dalla seguente funzione di densità: Y f x 1 2 2 e 1 x 2 dove: =media della popolazione =dev. st. della popolazione =costante (=3.14) e=costante (=2.718) Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana Qualsiasi siano i parametri e , l’AREA sottesa dall’intera curva è = 1 Area(, ) f(X)dX 1 L’area sottesa alla curva normale rappresenta la PROBABILITA’ degli intervalli! Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana la porzione di curva delimitata dalla media e un’ordinata espressa in termini di deviazioni standard è costante += 34.13% della distribuzione +2= 47.73% della distribuzione +3= 49.86% della distribuzione Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Porzioni della distribuzione comprese tra 1,2,3 deviazioni standard da (in %) Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana Y 99.73% 95.46% 68.26% -3 -2 - + +2 +3 X Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana Per gli usi pratici della distribuzione normale si ricorre alla CURVA NORMALE STANDARDIZZATA l’equazione della curva dipende da un solo parametro, zeta; Y f z 1 2 e 1 z2 2 I valori di questa distribuzione sono tabulati z X X X Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15 Principi di Statistica Per testare che una distribuzione ha un andamento «simile» o «approssimabile» a quello della Normale: Descrittiva Distrib. di frequenza Indici di posizione Indici di dispersione Indici di forma Distribuzione gaussiana 1)Test appositi (Kolmogorov-Smirnov)molto complessi e di difficilissima accettazione 2)Valutazione degli indici di asimmetria e curtosi: Se gli indici di asimmetria e curtosi sono compresi tra -1 e +1, allora la distribuzione è approssimabile con la normale/gaussiana Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica, Milano, 09/01/15