19 febbraio 2014 LEZIONE 1: Nozioni introduttive di statistica descrittiva Dott.ssa Rita Allais PhD Dipartimento di Scienze economico-sociali e matematico-statistiche Dipartimento di Management Università degli Studi di Torino PER USO DIDATTICO INTERNO STATISTICA La Statistica è la disciplina che elabora i principi e le metodologie atti alla rilevazione, alla raccolta e all’analisi dei dati per studiare, in maniera quantitativa, fenomeni collettivi, ovvero quei fenomeni che possono essere percepiti solo mediante numerose osservazioni su unità elementari. Ad esempio gli effetti delle politiche del governo a favore dell’occupazione giovanile, l’incidenza del fumo sulla salute degli Italiani, la capacità ricettiva delle aziende turistiche piemontesi, la conformità alle specifiche di pezzi meccanici prodotti in grande serie, la correttezza della voce contabile “scorte di magazzino” composta da 15.000 voci, l’analisi dei dati concernenti gli esercizi concorrenti localizzati nell’area prescelta per l’apertura di un nuovo punto vendita di una catena di supermercati … La Statistica trae il suo nome dalle definizioni di alcuni studiosi del XVI / XVII secolo come scienza atta a descrivere le qualità che caratterizzano e gli elementi che compongono uno Stato. 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 2 Le applicazioni della Statistica Sono sempre più numerose le applicazioni delle metodologie statistiche nei più disparati casi. Ad esempio: Sondaggi demoscopici Voi conoscete altre applicazioni della Statistica? Demografia Marketing Modelli econometrici Ricerca scientifica Controllo qualità Revisione contabile Analisi dei testi Previsioni metereologiche …. 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 3 Fasi dell’indagine statistica Definizione obiettivi ricerca Formulazione delle ipotesi Elaborazione piano di ricerca Rilevazione dei dati Si procede alla raccolta completa o campionaria dei dati diretta oppure indiretta Spoglio dei dati Elaborazione dei dati Si fonda su calcoli di indici statistici Analisi dei dati e verifica delle ipotesi Interpretazione dei risultati Presentazione dei dati 19 febbraio 2014 Individuare soggetti, informazioni e modalità Spiegazione provvisoria che sarà accettata o rifiutata Si decide come studiare la variabili Si procede alla classificazione dei dati Report statistici e grafici Nozioni introduttive di Statistica Descrittiva 4 Statistica Descrittiva Collezionare i dati Presentare i dati Esempio: sondaggio Esempio: tabelle e grafici Sintetizzare i dati Esempio: media campionaria = 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 1 n ∑ x n i=1 i 5 Statistica Inferenziale Laddove ve ne siano le condizioni, la Statistica elabora i principi e le metodologie che presiedono alla generalizzazione delle evidenze osservate Calcolo delle probabilità Stima Ad esempio, stimare il peso medio della popolazione usando il peso medio campionario Verifica delle ipotesi Ad esempio, verificare l’affermazione che il peso medio della popolazione è 70 Kg 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 6 Fonti statistiche italiane •ISTAT (Istituto Nazionale di Statistica) E’ l’istituto preposto in Italia alla produzione e diffusione delle statistiche relative a tutti gli aspetti della vita del Paese . E’ posto al vertice del SISTAN (sistema statistico nazionale) •ENTI PUBBLICI O PRIVATI ACI, INPS, INAIL, INPDAP,.., MINISTERI, …, BANCA d’ITALIA,.. •BANCHE DATI CERVED, SARIN, NIELSEN, Centrale dei Bilanci, Pagine Gialle,… 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 7 Esempio tabelle dati Presidi residenziali socio-assistenziali secondo l'utenza e la tipologia di presidio < 1950 TIPOLOGIA DI PRESIDIO 1950-1979 1980-1989 1990-1999 2000-2006 Totale presidi (b) VALORI ASSOLUTI Centro di pronta accoglienza Centro di accoglienza notturna Comunità familiare Comunità socio-educativa per minori Comunità socio-riabilitativa Comunità alloggio Istituto per minori Residenza assistenziale per anziani autosufficienti Residenza socio-sanitaria per anziani Residenza sanitaria assistenziale (Rsa) Centro di accoglienza immigrati Altro TOTALE 14 9 42 131 32 59 36 266 259 295 0 28 1.170 7 6 51 92 67 105 32 351 212 213 1 17 1.152 34 15 103 92 115 165 7 517 340 156 13 40 1.597 63 31 297 212 230 435 10 405 387 371 133 66 2.640 54 35 349 187 200 452 2 222 219 273 122 41 2.157 181 104 856 729 658 1.252 89 1.823 1.457 1.330 284 201 8.964 8,14 9,38 4,99 18,37 4,97 4,85 41,86 15,11 18,27 22,55 0,00 14,51 13,42 4,07 6,25 6,06 12,90 10,40 8,63 37,21 19,94 14,95 16,28 0,37 8,81 13,22 19,77 15,63 12,23 12,90 17,86 13,57 8,14 29,38 23,98 11,93 4,83 20,73 18,32 36,63 32,29 35,27 29,73 35,71 35,77 11,63 23,01 27,29 28,36 49,44 34,20 30,29 31,40 36,46 41,45 26,23 31,06 37,17 2,33 12,61 15,44 20,87 45,35 21,24 24,75 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 VALORI PERCENTUALI (c) Centro di pronta accoglienza Centro di accoglienza notturna Comunità familiare Comunità educativa per minori Comunità socio-riabilitativa Comunità alloggio Istituto per minori Residenza assistenziale per anziani Residenza socio-sanitaria per anziani Residenza sanitaria assistenziale (Rsa) Centro di accoglienza immigrati Altro TOTALE 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 8 Collettivo statistico e caratteri Collettivo statistico Ω Si definisce collettivo statistico o popolazione, l’insieme delle entità mediante le quali è possibile ottenere informazioni sul fenomeno stesso. I suoi elementi sono detti unità statistiche. La sua numerosità è indicata con n. Carattere Si definisce carattere la grandezza che, rilevata su ciascuna unità statistica, sarà di aiuto nella comprensione del fenomeno collettivo in esame. Insieme delle modalità di un carattere Si definisce insieme delle modalità di un carattere l’insieme M di tutte le possibili espressioni con cui il carattere può manifestarsi. 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 9 Collettivo statistico e caratteri CARATTERI Ω ωn COLLETTIVO Persone residenti nel comune di Torino ω3 ω2 ω1 Ω COLLETTIVO Ricette farmaceutiche a carico SSN 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva oColore degli occhi oSesso oLivello di istruzione oTemperatura corporea oEtà in anni compiuti oReddito CARATTERI oCodice fiscale oCodice ricetta oEtà paziente oEsenzione (Si/no) oCodice prodotto oTicket (in Euro) 10 Classificazione dei caratteri Carattere qualitativo: un carattere viene detto qualitativo o mutabile se le sue modalità sono espresse in termini di attributi. caratteri qualitativi sconnessi: quando le modalità non presentano alcuna relazione d’ordine naturale, per cui la scala impiegata è nominale. caratteri qualitativi ordinali: quando le modalità presentano una relazione d’ordine naturale, per cui la scala impiegata è quella ordinale. Carattere quantitativo: un carattere viene detto quantitativo o variabile se le sue modalità sono espresse in termini numerici. caratteri quantitativi discreti: quando fissata una modalità esiste un intervallo all’interno del quale nessun altro valore costituisce una modalità. caratteri quantitativi continui: qualora comunque scelte due possibili modalità tra loro esistono infiniti valori che sono altrettante modalità. In entrambi i casi le scale impiegate possono essere a intervalli o a rapporti a seconda della natura del carattere esaminato. 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 11 Caratteri, modalità, scale di misura Modalità: Modalità: CARATTERI ATTRIBUTI QUALITATIVI (MUTABILI) Sconnessi 19 febbraio 2014 Ordinali NUMERI QUANTITATIVI (VARIABILI) Discreti Nozioni introduttive di Statistica Descrittiva Continui 12 Scale di misura Scale nominale: Un carattere è misurato su scala nominale se le sue modalità si identificano in “attributi” tra i quali è impossibile individuare una relazione d’ordine naturale Scala ordinale: Un carattere è misurato su scala ordinale o per ranghi se le sue modalità si identificano in “attributi” che presentano una relazione d’ordine naturale. Scala ad intervalli: Un carattere è misurato su scala per intervalli se le sue modalità si identificano con numeri nell’ambito di un sistema di riferimento dotato di origine arbitraria. Scala a rapporti: Un carattere è misurato su scala per rapporti se le sue modalità si identificano con numeri di un sistema di riferimento dotato di origine assoluta, valore quest’ultimo cui è associata l’assenza di carattere. 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 13 Livelli di Misurazione Rapporti fra misurazioni, esiste lo zero assoluto Differenze fra misurazioni, ma non esiste lo zero assoluto Categorie Ordinate (ranghi, ordine, o scala) Scala a Rapporti Dati Quantitativi Scala ad Intervallo Scala ordinale Dati Qualitativi Categorie (no ordine o direzione) 19 febbraio 2014 Scala nominale Nozioni introduttive di Statistica Descrittiva 14 Riassumendo… Vogliamo studiare un fenomeno collettivo Dobbiamo individuare il collettivo statistico Ω Dobbiamo determinare i caratteri da rilevare Dobbiamo scegliere la scala di misura per ciascun carattere Dobbiamo individuare l’insieme M delle modalità per ciascun carattere SOLO ORA POSSIAMO … 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 15 Rilevazione dei caratteri RILEVARE I CARATTERI SU CIASCUNA UNITA’ STATISTICA ovvero Individuare una corrispondenza fra le unità statistiche appartenenti a Ω e gli elementi dell’insieme delle modalità M Ω 19 febbraio 2014 M Nozioni introduttive di Statistica Descrittiva 16 Mutabile e variabile statistica L’applicazione che associa a ciascun elemento del collettivo statistico uno ed uno solo elemento dell’insieme M delle modalità del carattere in esame viene detta mutabile statistica se gli elementi di M sono rappresentati da attributi, variabile statistica se l’insieme M è costituito da numeri reali. Ω A(⋅) Ω M X (⋅) R 180 170 M 150 F Mutabile statistica (sesso) 19 febbraio 2014 Variabile statistica (altezza) Nozioni introduttive di Statistica Descrittiva 17 Rilevazioni di uno o più caratteri Ω Ω R 180 170 Anno imm. 2007 150 R2 2003 Rilevazione di un carattere 2000 2000 4000 Rilevazione di due caratteri (ES:altezza in cm) 9000 Prezzo dell’usato (ES:anno immatricolazione, prezzo del’usato) 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 18 La matrice dei dati grezzi 19 febbraio 2014 Nozioni introduttive di Statistica Descrittiva 19