Giovanni Boscaino Dipartimento di Scienze Statistiche e Matematiche “S. Vianelli” Facoltà di Economia Tel. 0916626334 Email [email protected] Pagina web: www.unipa.it/gioboscaino Elementi di Statistica I Master II Livello Neuropsicologia Clinica 1 Obiettivo Fornire le conoscenze e gli strumenti utili per: Individuare e descrivere una o più variabili e le sue caratteristiche principali (scale di misura, rappresentazioni sintetiche, …) Determinare gli opportuni indici sintetici di posizione (intensità) e di variabilità Costruire e descrivere tabelle a una e a due vie Individuare e descrivere la relazione tra due variabili 2 Università degli Studi di Palermo Facoltà di Medicina e Chirurgia Elementi di Statistica I Master di II livello in Neuropsicologia Clinica Introduzione alla statistica Le scale di misura delle variabili: i dati numerici e non numerici. - definizione di dati nominali, ordinali, intervallari e di rapporto. Descrivere una variabile alla volta (analisi univariata): - l'organizzazione dei dati in tabelle; - le distribuzioni di frequenza: costruzione per dati numerici e non numerici; - le sintesi numeriche attraverso indici di: - posizione e intensità: moda, mediana e quartili e media; - variabilità assoluta e relativa: eterogeneità assoluta e relativa, range, differenza interquartile, scarto semplice medio, deviazione standard, varianza, coefficiente di variazione; - le rappresentazioni grafiche: diagramma a barre, di composizione, grafico a settori circolari, istogramma, box plot. Capire ed esplorare due variabili simultaneamente (analisi bivariata): - l'organizzazione dei dati bivariati in tabelle; - le tabelle di frequenze assolute e relative congiunte, marginali e condizionate; - rappresentazioni grafiche; - studio di relazioni simmetriche e asimmetriche tra due variabili: - indagare la forma, la direzione e l’intensità della relazione: - il diagramma di dispersione/scatterplot; - associazione: proporzioni, odds, odds condizionati, oddsratio; - la correlazione lineare semplice; - la regressione lineare semplice. Testi consigliati: - M. Fraire e A. Rizzi (1995), Elementi di Statistica, NIS. - W. Daniel (1995), Biostatistica: Concetti di base per l'analisi statistica delle scienze dell'area medico-sanitaria, (edizione italiana a cura di M. Attanasio e V. Capursi). Edises. - Leti G., Statistica Descrittiva, Il Mulino, Bologna - Corbetta P., Gasperoni G. e Pisati M. (2001), Statistica per la ricerca sociale, Il Mulino, Manuali 3 Cos’è la Statistica? Branca della Matematica Applicata, il cui scopo è lo studio e la descrizione della realtà fenomenica attraverso la rilevazione di informazioni dall’osservazione della realtà o di suoi ipotetici funzionamenti Oggetto della Statistica sono dunque quei fenomeni che presentano caratteri di variabilità all’interno di un collettivo di riferimento (popolazione statistica), costituito da unità statistiche o elementari 4 Il “dilemma” di TRILUSSA “Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo all'anno: e, se nun entra ne le spese tue, t'entra ne la statistica lo stesso perché c'è un antro che ne magna due” La Statistica, attraverso misure di sintesi (indici o parametri), non ci dice solo quanti “polli mangia” in media una popolazione, ma anche se esistono differenze “alimentari” tra gli individui… INDICI di POSIZIONE INDICI di DISPERSIONE 5 I due grandi rami della Statistica • • • • Statistica Descrittiva Metodo deduttivo (dal generale al particolare) Raccolta dei dati Sintesi dei dati di popolazione o del campione Presentazione dei risultati (Analisi esplorativa) → • • • • ← • Statistica Inferenziale Metodo induttivo (dal particolare al generale) Rilevazioni parziali Stima dei parametri di popolazione Verifica delle ipotesi Previsione 6 Schema Logico 7 La STATISTICA si occupa di utilizzare DATI per ottenere INFORMAZIONI circa problemi e FENOMENI REALI. OBIETTIVO PRIMARIO: - FORMAZIONE dei DATI; - RIDUZIONE dei SINTESI); DATI (ovvero - ANALISI dei DATI (descrivere, indagare, prevedere, …); - DIFFUSIONE delle INFORMAZIONI (grafici, presentazione, data-base). 8 IN QUESTO PROCESSO TENER PRESENTE: BISOGNA come trattare la variabilità non controllabile ovvero la casualità OVVERO IMPLEMENTARE STRATEGIE DI INFERENZA (SE POSSIBILE) 9 DATO UN PARTICOLARE GRUPPO DI ELEMENTI, È POSSIBILE DESCRIVERLI SECONDO UNA O PIÙ CARATTERISTICHE O CARATTERI… CONCETTI FONDAMENTALI - COSTANTE Caratteristica che non cambia nelle diverse osservazioni - VARIABILE Manifestazione, misurabile su una scala predefinita, del fenomeno oggetto di studio o del concetto oggetto di studio - UNITÀ STATISTICA Elemento portatore della/e variabile/i in esame. Ogni unità statistica può essere portatrice di: 1. una variabile (caso Univariato); 2. più variabili (Multivariato); 10 - OSSERVAZIONE Determinazione numerica, o stato, della variabile effettivamente rilevata sulle unità statistiche. X (VARIABILE) - X1, X2, …, XN (OSSERVAZIONI) MODALITÀ insieme di stati significativamente distinti tra loro assumibili della variabile in oggetto (esaustivi non sovrapposti) - UNIVERSO (POPOLAZIONE) Insieme di unità statistiche in studio cui si vogliono riferire i risultati dell’analisi - CAMPIONE Sottoinsieme di unità statistiche (dette unità campionarie) estratte dalla popolazione. Il CAMPIONE può essere: i. Probabilistico ii. Non Probabilistico. 11 - DATI CENSUARI VS DATI CAMPIONARI SE L’AGGREGATO IN ESAME È, O PUÒ ESSERE CONSIDERATO, L’INTERA POPOLAZIONE DI INTERESSE, SI DICE CHE I DATI A DISPOSIZIONE SONO CENSUARI, ALTRIMENTI CHE SONO CAMPIONARI. DATI CENSUARI STATISTICA DESCRITTIVA DATI CAMPIONARI INFERENZIALE STATISTICA ESEMPIO: DIMENSIONE DELLE AZIENDE METALMECCANICHE DELLA PROVINCIA DI PADOVA AL 31.12.2006 IN BASE AL NUMERO DI ADDETTI VARIABILE=? UNITA’ STATISTICA=? DATI CENSUARI O CAMPIONARI? VARIABILE = NUMERO DI ADDETTI UNITA’ STATISTICA= AZIENDA DATI CENSUARI O CAMPIONARI 12 DIPENDE! STESSO CARATTERE → DIFFERENTI MODALITÀ ALTEZZA: 1. METRO 2. ALTO – MEDIO – BASSO MODALITÀ → TIPO DI DATO → CLASSIFICAZIONE MODALITÀ ESPRESSE DA ETICHETTE, CATEGORIE… ESPRESSE DA VALORI O CLASSI DI VALORI CARATTERE → QUALITATIVO ESEMPIO GENERE STATO CIVILE CONDIZIONE… → QUANTITATIVO ETÀ PRESSIONE ARTERIOSA TEMPERATURA ↓ OPERAZIONI DIFFERENTI (LIVELLI DI MISURA DIVERSI) 13 MISURARE?? STABILIRE E APPLICARE REGOLE DI ASSEGNAZIONE DI NUMERI O ETICHETTE A PROPRIETÀ DI OGGETTI O EVENTI IN MODO TALE DA POTER ATTRIBUIRE ALCUNE DELLE CARATTERISTICHE DEI NUMERI ALLE PROPRIETÀ STESSE MISURE DIRETTA: AZIONE ATTA A RILEVARE PROPRIETÀ DI OGGETTI O EVENTI IN BASE A REGOLE STANDARD MISURA INDIRETTA: AZIONE ATTA A RILEVARE PROPRIETÀ DI UN OGGETTO O UN EVENTO IN BASE A REGOLE AD HOC LUNGHEZZA PESO INTELLIGENZA → → → METRO GRAMMO ?? 14 BELLEZZA → ?? QUALITÀ DELLA VITA → ?? ULTERIORE CLASSIFICAZIONE (STEVENS , 1946) VARIABILI QUALITATIVE MODALITÀ SENZA ORDINE DI SUCCESSIONE E SENZA NESSUNA SPECIFICA RELAZIONE TRA DI ESSE (MISURA SU SCALA NOMINALE) ES.: GENERE / STATO CIVILE / RELIGIONE OPERAZIONI AMMISSIBILI: = ≠ MODALITÀ CON ORDINAMENTO DI SUCCESSIONE MA SENZA ORDINE DI GRANDEZZA (MISURA SU SCALA ORDINALE) ES.: TITOLO DI STUDIO / MESI / STATURA (IN CLASSI: ALTO, MEDIO, BASSO) OPERAZIONI AMMISSIBILI: = ≠ > < PRIMA DOPO MIGLIORE PEGGIORE 15 VARIABILI QUANTITATIVE MODALITÀ DI NATURA METRICA (NUMERI REALI) ESPRESSE IN VALORI SINGOLI O IN CLASSI DI VALORI, IN CUI IL VALORE “ZERO” È CONVENZIONALE (MISURA SU SCALA INTERVALLI) ES.: TEMPERATURA °C / °F QI ANNO CALENDARIO TEMPERATURA: GRANDEZZA CHE MISURA LO STATO TERMICO O DI ENERGIA INTERNA (CIOÈ IL GRADO DI AGITAZIONE MOLECOLARE) DI UN CORPO O DI UN SISTEMA, E CHE ESPRIME L'ATTITUDINE DI UN CORPO A SCAMBIARE CALORE CON L'AMBIENTE E CON GLI ALTRI CORPI: 0 °C → FUSIONE DEL GHIACCIO OPERAZIONI AMMISSIBILI: = ≠ > < … 16 DIFFERENZA: X-Y RAPPORTO DIFFERENZE: (X-Y)/(Z-L) MODALITÀ DI NATURA METRICA (NUMERI REALI) ESPRESSE IN VALORI SINGOLI O IN CLASSI DI VALORI, IN CUI IL VALORE “ZERO” NON È CONVENZIONALE MA IMPLICA L’ASSENZA DELLA PROPRIETÀ (MISURA SU SCALA RAPPORTI) ES.: LUNGHEZZA ETÀ TEMPERATURA IN °K (0 °K = -273,15 °C) NUMEROSITÀ OPERAZIONI AMMISSIBILI: < … DIFFERENZA: X-Y = ≠ > RAPPORTO DIFFERENZE: (X-Y)/(Z-L) RAPPORTO: X/Y → X=KY 17 18