02/03/2015 Statistica (Dr. Elvira Di Nardo) 80 ore = 10 crediti Orario: lun, mar,mer 9.30-11.30 Sede: AULA MAGNA (ex Fac. SMFN) Ricevimento: mer. 11.30-13.30 Esame: prova scritta (+ eventuale prova orale) Materiale didattico e altro: http://oldwww.unibas.it/utenti/dinardo/stateconomia.html E. Di Nardo, a.a. 15/16 1 Introduzione alla Statistica E. Di Nardo, a.a. 15/16 2 1 02/03/2015 Che cosa è la Statistica? La statistica indaga su fenomeni collettivi, ossia fenomeni che coinvolgono un insieme di individui, oggetti, beni. Tale indagine è condotta raccogliendo informazioni relative a tali collettivi e traducendo tali informazioni in un modello numerico che possa essere analizzato semplicemente. Popolazione = il collettivo preso in esame Unità statistica = il singolo elemento della popolazione E. Di Nardo, a.a. 15/16 3 Che cosa è una variabile statistica? Una variabile statistica è una caratteristica oggetto di indagine. Esempio: E. Di Nardo, a.a. 15/16 4 2 02/03/2015 Tipologie di analisi statistiche Insieme di tecniche per organizzare, riassumere e presentare i dati. Ma non si tratta solo di grafici…. ESEMPI: o Il 2% delle lavatrici vendute da un negozio X presenta difetti di funzionamento. o In questa classe, il voto medio è 25/30. o Lo studente più anziano in questa classe ha 27 anni. o Tra le adolescenti il colore maggiormente diffuso degli abiti è il nero. E. Di Nardo, a.a. 15/16 5 Insieme di tecniche che consentono di generalizzare all’intera popolazione e con un certo margine di errore i risultati ottenuti da un sottoinsieme della popolazione, detto campione. Esempio: Se in questa classe l’altezza media è 172cm, è possibile asserire che 172 cm è l’altezza media della popolazione costituita dagli studenti UNIBAS? Qualora la risposta fosse positiva, sono sicuro al 100% della validità di questa asserzione? E. Di Nardo, a.a. 15/16 6 3 02/03/2015 Esempi: A) Se gli studenti in questa classe si disponessero per altezza, come i signori di questa fotografia, potremmo «proiettare» il profilo di questa curva su tutta la popolazione di studenti UNIBAS? B) Petrolio si o petrolio no? E. Di Nardo, a.a. 15/16 7 Classificazione delle variabili statistiche Variabili qualitative (o mutabili statistiche) : i valori assunti sono non-numerici. Esempi: il colore degli occhi; la nazionalità; lo stato civile; l’affidabilità; l’attitudine ai lavori manuali; fasce di reddito… Variabili (quantitative): i valori assunti sono numeri. Esempi: la statura; il peso; il numero di stanze di un appartamento; il numero di figli… Sconnessi (Nominali) Qualitative Modalità Ordinali Valori Discreti Classi di Modalità Continui Quantitative E. Di Nardo, a.a. 15/16 Modalità Discreti 8 4 02/03/2015 *Elaborata dallo psicofisico Stanley Smith Stevens (1946) Scala Nominale I dati sono organizzati in categorie e non possono essere ordinati. 1. Indicare il genere Maschio Mutuamente esclusive Femmina Questo è un primo esempio di RILEVAZIONE DEI DATI 2. Quale è il colore dei tuoi capelli? Castani Neri Biondi Esaustive Bianchi Non so Schede Questionari Interviste (anche telefoniche) Exit Poll 3. Dove abiti? Centro città Periferia città Contrade Totale (censimento) Parziale (campionaria) Occasionale (sondaggi) Periodica Tipo E. Di Nardo, a.a. 15/16 9 Scala Ordinale I dati sono organizzati in categorie che possiedono un criterio di ordinamento. Ogni categoria esprime un rango (ossia una posizione) La distanza tra ranghi non necessariamente è quantificabile Non sono possibili operazioni numeriche tra ranghi, ma solo confronti (relazioni di ordine) 1. Il tuo giudizio all’esame di III media è stato: Sufficiente Distinto Buono Ottimo Eccellente 2. A quale fascia ISEE appartieni? I (0-4.500,01) II (4.500,01-7.000) III (7.000,01-12.000) IV (12.000,01-18.000) … Non sono in fascia ISEE E. Di Nardo, a.a. 15/16 10 5 02/03/2015 L’istituto nazionale di statistica (ISTAT: http://www.istat.it/it/ ) mette a disposizione banche dati sulle indagini effettuate sul territorio nazionale. E. Di Nardo, a.a. 15/16 11 Scala Intervallare La distanza tra ranghi è quantificabile La distanza tra ranghi non rispetto ad un intervallo preso come unità necessariamente è quantificabile di misura. Scale che misurano la stessa grandezza ma con unità di misura diverse possono associare allo stesso oggetto più numeri. 0 Celsius = 32 Fahrenheit La temperatura Nei test psicoattidunali non necessariamente lo zero corrisponde a nessuna attitudine. E. Di Nardo, a.a. 15/16 Operazioni di Standardizzazione 12 6 02/03/2015 Scala Rapporto Per questo tipo di misure, lo zero non è arbitrario e corrisponde all’elemento di intensità nulla (assenza di proprietà) rispetto all’unità misurata. L’altezza Il peso La velocità Il tempo E. Di Nardo, a.a. 15/16 13 Come rappresentare i dati? Il modo più semplice ed immediato per rappresentare i dati è costituito da tabelle. carattere Colore capelli (carattere) Neri modalità N° persone (frequenza assoluta) 10 Castani 6 Rossi 1 biondi 5 22 totale Frequenze assolute La frequenza assoluta indica quante volte la MODALITÀ di un carattere si ripete 7 02/03/2015 Come rappresentare i dati? Seriazione statistica: Carattere quantitativo Con classi di modalità Frequenza assoluta: numero di volte in cui si verifica la modalità i # stanze # appartamenti 1 300 2 500 3 2.000 4 3.000 5 150 6 100 7 300 Peso (in grammi) # neonati 1.800-2.200 10 2.200-2.600 32 2.600-3.000 120 3.000-3.400 254 3.400-3.800 134 3.800-4.200 40 4.200-4.600 10 Con modalità E. Di Nardo, a.a. 15/16 15 Dalle modalità alle classi di modalità In caso di modalità numerose, è preferibile una rappresentazione in classi di modalità. Peso (kg) Freq.Assoluta 52 1 54 1 Classi di Modalità Freq.Assoluta 55 2 [50;60) 4 61 1 [60;70) 7 63 1 [70;80) 4 68 2 Totale 15 69 3 71 1 73 1 75 1 76 1 Totale 15 E. Di Nardo, a.a. 15/16 16 8 02/03/2015 Come rappresentare i dati? Serie statistica: Carattere qualitativo N.PERSONE 2 TITOLO DI STUDIO N.PERSONE lic.elementare 2.000 3.000 lic. Media 6.000 4.000 diploma 10.000 7.000 laurea 2.000 11.000 La frequenza assoluta non consente di confrontare due insiemi di dati anche se si riferiscono alla stessa specie, poiché il numero di casi complessivo è diverso. Frequenza relativa ANNO VENDITE AUTO 1996 10.000 1997 15.000 1998 20.000 1999 18.000 2000 17.000 2001 22.000 2002 23.000 2003 10.000 Serie storica: variabile quantitativa rilevata per modalità temporale. Taglia: è il numero di unità statistiche esaminate E. Di Nardo, a.a. 15/16 17 La frequenza relativa di una certa modalità è data dal rapporto tra la frequenza assoluta di tale modalità ed il numero totale dei casi. Quando moltiplicate per 100 si dicono percentuali. Consideriamo i dati presenti nella seguente tabella Colore capelli frequenze (carattere) assolute neri 10 castani 6 rossi 1 biondi 5 TOTALE 22 E. Di Nardo, a.a. 15/16 Calcolo FREQUENZE RELATIVE 10 ×100 = 45,45 22 6 ×100 = 27,27 22 1 ×100 = 4,54 22 5 ×100 = 22,72 22 Colore capelli frequenze assolute frequenze relative % neri 10 45,46 castani 6 27,27 rossi 1 4,55 biondi 5 22,72 TOTALE 22 100 18 9 02/03/2015 # stanze # appartamenti 1 300 300/6350=0,047 0,047*100=4,7% 2 500 500/6350=0,079 7,9% 3 2.000 0,315 31,5% 4 3.000 0,472 47,2% 5 150 0,024 2,4% 6 100 0,016 1,6% 7 300 0,047 4,7% Freq.rel Perc. 300+500+2000+3000+150+100+300= 6350 (taglia) Peso (in grammi) # neonati Peso (in grammi) # neonati 1.800-2.200 10 10/600=0,017 1,7% 2.200-2.600 32 32/600=0,053 5,3% 2.600-3.000 120 0,2 20% 3.000-3.400 254 0,423 … 3.400-3.800 134 0,223 … 3.800-4.200 40 0,067 … 4.200-4.600 10 0,017 .. Completare la tabella E. Di Nardo, a.a. 15/16 19 Frequenze cumulate Talvolta può essere utile calcolare anche la frequenza cumulata (percentuale o relativa) # stanze # appartamenti %Relativa Freq.Cum. Freq.Cum.% 1 300 4,7% 0,047 4,7% 2 500 7,9% 0,126 12,6% 3 2.000 31,5% 0,441 44,1% 4 3.000 47,2% 0,913 91,3% 5 150 2,4% 0,937 93,7% 6 100 1,6% 0,953 95,3% 7 300 4,7% 1,000 100,0% Come si leggono i risultati in tabella relativi alla freq. cumulata? Il 12,6% degli intervistati ha appartamenti con un massimo di 2 stanze. Il 31,5% degli intervistati ha appartamenti con 3 stanze. Meno del 3% degli intervistati ha appartamenti con 5 stanze. Che percentuale di intervistati ha appartamenti con 5 stanze o più? Che percentuale di intervistati ha 3 o 4 stanze? E. Di Nardo, a.a. 15/16 20 10