Giovanni Boscaino

annuncio pubblicitario
Giovanni Boscaino
Dipartimento di Scienze Statistiche e
Matematiche “S. Vianelli”
Facoltà di Economia
Tel. 0916626334
Email [email protected]
Pagina web: www.unipa.it/gioboscaino
Elementi di Statistica I
Master II Livello
Neuropsicologia Clinica
1
Obiettivo
Fornire le conoscenze e gli strumenti utili per:




Individuare e descrivere una o più variabili e
le sue caratteristiche principali (scale di
misura, rappresentazioni sintetiche, …)
Determinare gli opportuni indici sintetici di
posizione (intensità) e di variabilità
Costruire e descrivere tabelle a una e a due vie
Individuare e descrivere la relazione tra due
variabili
2
Università degli Studi di Palermo
Facoltà di Medicina e Chirurgia
Elementi di Statistica I
Master di II livello in Neuropsicologia Clinica

Introduzione alla statistica

Le scale di misura delle variabili: i dati numerici e non numerici.
- definizione di dati nominali, ordinali, intervallari e di rapporto.

Descrivere una variabile alla volta (analisi univariata):
- l'organizzazione dei dati in tabelle;
- le distribuzioni di frequenza: costruzione per dati numerici e non
numerici;
- le sintesi numeriche attraverso indici di:
- posizione e intensità: moda, mediana e quartili e media;
- variabilità assoluta e relativa: eterogeneità assoluta e relativa,
range, differenza interquartile, scarto semplice medio,
deviazione standard, varianza, coefficiente di variazione;
- le rappresentazioni grafiche: diagramma a barre, di composizione,
grafico a settori circolari, istogramma, box plot.

Capire ed esplorare due variabili simultaneamente (analisi bivariata):
- l'organizzazione dei dati bivariati in tabelle;
- le tabelle di frequenze assolute e relative congiunte, marginali e
condizionate;
- rappresentazioni grafiche;
- studio di relazioni simmetriche e asimmetriche tra due variabili:
- indagare la forma, la direzione e l’intensità della relazione:
- il diagramma di dispersione/scatterplot;
- associazione: proporzioni, odds, odds condizionati, oddsratio;
- la correlazione lineare semplice;
- la regressione lineare semplice.
Testi consigliati:
- M. Fraire e A. Rizzi (1995), Elementi di Statistica, NIS.
- W. Daniel (1995), Biostatistica: Concetti di base per l'analisi
statistica delle scienze dell'area medico-sanitaria, (edizione italiana a
cura di M. Attanasio e V. Capursi). Edises.
- Leti G., Statistica Descrittiva, Il Mulino, Bologna
- Corbetta P., Gasperoni G. e Pisati M. (2001), Statistica per la ricerca
sociale, Il Mulino, Manuali
3
Cos’è la Statistica?
Branca
della
Matematica
Applicata, il cui scopo è lo studio e
la
descrizione
della
realtà
fenomenica
attraverso
la
rilevazione
di
informazioni
dall’osservazione della realtà o di
suoi ipotetici funzionamenti
Oggetto della Statistica sono
dunque quei fenomeni che
presentano caratteri di variabilità
all’interno di un collettivo di
riferimento
(popolazione
statistica), costituito da unità
statistiche o elementari
4
Il “dilemma” di TRILUSSA
“Me spiego: da li conti che se fanno
seconno le statistiche d'adesso
risurta che te tocca un pollo all'anno:
e, se nun entra ne le spese tue,
t'entra ne la statistica lo stesso
perché c'è un antro che ne magna due”
La Statistica, attraverso misure di sintesi (indici o
parametri), non ci dice solo quanti “polli mangia” in
media una popolazione, ma anche se esistono
differenze “alimentari” tra gli individui…
INDICI di POSIZIONE
INDICI di DISPERSIONE
5
I due grandi rami della Statistica
•
•
•
•
Statistica
Descrittiva
Metodo deduttivo
(dal generale al
particolare)
Raccolta dei dati
Sintesi dei dati di
popolazione o del
campione
Presentazione dei
risultati
(Analisi
esplorativa)
→
•
•
•
•
←
•
Statistica
Inferenziale
Metodo induttivo
(dal particolare
al generale)
Rilevazioni
parziali
Stima dei
parametri di
popolazione
Verifica delle
ipotesi
Previsione
6
Schema Logico
7
La STATISTICA si occupa di
utilizzare DATI per ottenere
INFORMAZIONI circa problemi e
FENOMENI REALI.
OBIETTIVO PRIMARIO:
- FORMAZIONE dei DATI;
- RIDUZIONE dei
SINTESI);
DATI
(ovvero
- ANALISI dei DATI (descrivere,
indagare, prevedere, …);
- DIFFUSIONE
delle
INFORMAZIONI
(grafici,
presentazione, data-base).
8
IN QUESTO PROCESSO
TENER PRESENTE:
BISOGNA
come trattare la variabilità non
controllabile ovvero la casualità
OVVERO

IMPLEMENTARE
STRATEGIE
DI
INFERENZA
(SE POSSIBILE)
9
DATO UN PARTICOLARE GRUPPO DI ELEMENTI, È
POSSIBILE DESCRIVERLI SECONDO UNA O PIÙ
CARATTERISTICHE O CARATTERI…
CONCETTI FONDAMENTALI
- COSTANTE
Caratteristica che non cambia nelle
diverse osservazioni
- VARIABILE
Manifestazione, misurabile su una scala
predefinita, del fenomeno oggetto di
studio o del concetto oggetto di studio
- UNITÀ STATISTICA
Elemento portatore della/e variabile/i in
esame. Ogni unità statistica può essere
portatrice di:
1. una variabile (caso Univariato);
2. più variabili (Multivariato);
10
- OSSERVAZIONE
Determinazione numerica, o stato, della
variabile effettivamente rilevata sulle
unità statistiche.
X
(VARIABILE)
-

X1, X2, …, XN
 (OSSERVAZIONI)
MODALITÀ
insieme di stati significativamente distinti
tra loro assumibili della variabile in
oggetto (esaustivi non sovrapposti)
- UNIVERSO (POPOLAZIONE)
Insieme di unità statistiche in studio cui
si vogliono riferire i risultati dell’analisi
- CAMPIONE
Sottoinsieme di unità statistiche (dette
unità
campionarie)
estratte
dalla
popolazione.
Il CAMPIONE può essere:
i. Probabilistico
ii. Non Probabilistico.
11
- DATI CENSUARI VS DATI CAMPIONARI
SE L’AGGREGATO IN ESAME È, O PUÒ ESSERE
CONSIDERATO, L’INTERA POPOLAZIONE DI
INTERESSE, SI DICE CHE I DATI A
DISPOSIZIONE SONO CENSUARI, ALTRIMENTI
CHE SONO CAMPIONARI.
DATI CENSUARI  STATISTICA DESCRITTIVA
DATI
CAMPIONARI
INFERENZIALE

STATISTICA
ESEMPIO:
DIMENSIONE
DELLE
AZIENDE
METALMECCANICHE DELLA PROVINCIA DI
PADOVA AL 31.12.2006 IN BASE AL NUMERO
DI ADDETTI
VARIABILE=?
UNITA’ STATISTICA=?
DATI CENSUARI O CAMPIONARI?
VARIABILE = NUMERO DI ADDETTI
UNITA’ STATISTICA= AZIENDA
DATI CENSUARI O CAMPIONARI
12
DIPENDE!
STESSO CARATTERE → DIFFERENTI MODALITÀ
ALTEZZA:
1. METRO
2. ALTO – MEDIO – BASSO
MODALITÀ → TIPO DI DATO → CLASSIFICAZIONE
MODALITÀ
ESPRESSE DA
ETICHETTE,
CATEGORIE…
ESPRESSE DA
VALORI O
CLASSI DI
VALORI
CARATTERE
→
QUALITATIVO
ESEMPIO
 GENERE
 STATO CIVILE
 CONDIZIONE…

→
QUANTITATIVO


ETÀ
PRESSIONE
ARTERIOSA
TEMPERATURA
↓
OPERAZIONI DIFFERENTI
(LIVELLI DI MISURA DIVERSI)
13
MISURARE??
STABILIRE
E
APPLICARE
REGOLE
DI
ASSEGNAZIONE DI NUMERI O ETICHETTE A
PROPRIETÀ DI OGGETTI O EVENTI IN MODO TALE
DA
POTER
ATTRIBUIRE
ALCUNE
DELLE
CARATTERISTICHE DEI NUMERI ALLE PROPRIETÀ
STESSE


MISURE DIRETTA:
AZIONE
ATTA
A
RILEVARE PROPRIETÀ DI
OGGETTI O EVENTI IN
BASE
A
REGOLE
STANDARD
MISURA INDIRETTA: AZIONE
ATTA
A
RILEVARE PROPRIETÀ DI
UN OGGETTO O UN
EVENTO IN BASE A
REGOLE AD HOC
LUNGHEZZA
PESO
INTELLIGENZA
→
→
→
METRO
GRAMMO
??
14
BELLEZZA
→
??
QUALITÀ DELLA VITA
→ ??
ULTERIORE CLASSIFICAZIONE
(STEVENS , 1946)

VARIABILI QUALITATIVE
 MODALITÀ
SENZA
ORDINE
DI
SUCCESSIONE
E
SENZA
NESSUNA
SPECIFICA RELAZIONE TRA DI ESSE
(MISURA SU SCALA NOMINALE)
ES.: GENERE / STATO CIVILE / RELIGIONE
OPERAZIONI AMMISSIBILI:
=

≠
MODALITÀ CON ORDINAMENTO DI
SUCCESSIONE MA SENZA ORDINE DI
GRANDEZZA
(MISURA SU SCALA ORDINALE)
ES.: TITOLO DI STUDIO / MESI / STATURA
(IN CLASSI: ALTO, MEDIO, BASSO)
OPERAZIONI AMMISSIBILI:
= ≠ > < PRIMA DOPO
MIGLIORE PEGGIORE
15

VARIABILI QUANTITATIVE
 MODALITÀ
DI
NATURA
METRICA
(NUMERI REALI) ESPRESSE IN VALORI
SINGOLI O IN CLASSI DI VALORI, IN CUI IL
VALORE “ZERO” È CONVENZIONALE
(MISURA SU SCALA INTERVALLI)
ES.: TEMPERATURA °C / °F
QI
ANNO CALENDARIO
TEMPERATURA:
GRANDEZZA CHE MISURA LO STATO
TERMICO O DI ENERGIA INTERNA (CIOÈ IL
GRADO DI AGITAZIONE MOLECOLARE) DI
UN CORPO O DI UN SISTEMA, E CHE
ESPRIME L'ATTITUDINE DI UN CORPO A
SCAMBIARE CALORE CON L'AMBIENTE E
CON GLI ALTRI CORPI:
0 °C → FUSIONE DEL GHIACCIO
OPERAZIONI AMMISSIBILI:
=
≠
>
<
…
16

DIFFERENZA: X-Y
RAPPORTO DIFFERENZE: (X-Y)/(Z-L)
MODALITÀ
DI
NATURA
METRICA
(NUMERI REALI) ESPRESSE IN VALORI
SINGOLI O IN CLASSI DI VALORI, IN CUI IL
VALORE “ZERO” NON È CONVENZIONALE
MA
IMPLICA
L’ASSENZA
DELLA
PROPRIETÀ
(MISURA SU SCALA RAPPORTI)
ES.: LUNGHEZZA
ETÀ
TEMPERATURA IN °K
(0 °K = -273,15 °C)
NUMEROSITÀ
OPERAZIONI AMMISSIBILI:
< …
DIFFERENZA: X-Y
=
≠
>
RAPPORTO DIFFERENZE: (X-Y)/(Z-L)
RAPPORTO: X/Y → X=KY
17
18
Scarica