Titolo della lezione
Introduzione
Informazioni sul corso - 1
Obiettivi
Nel corso verranno approfonditi gli argomenti relativi alla
statistica descittiva di base e alla statistica inferenziale; particolare
attenzione verrà dedicata alle indagini campionarie, che verranno
analizzata nelle sue diverse fasi, dalla formazione del campione,
alla investigazione delle unità statistiche, fino alla stima dei
parametri di interesse e alla verifica di ipotesi sui parametri della
popolazione.
Informazioni sul corso - 2
Prima parte: Statistica descrittiva e modelli probabilistici
Concetti introduttivi: la rilevazione dei fenomeni statistici.
Distribuzione di un carattere e rappresentazione: distribuzioni di
frequenza; frequenze relative e percentuali; rappresentazioni
grafiche.
Sintesi delle distribuzioni - le medie analitiche: moda; mediana;
media aritmetica.
Sintesi delle distribuzioni – la variabilità: varianza; scarto
quadratico medio; indici relativi di variabilità; standardizzazione.
Concetti di base della probabilità.
Cenni sulle variabili casuali: le distribuzioni normale e t di
student.
Informazioni sul corso - 3
Prima parte: Statistica inferenziale
Campionamento e distribuzioni campionarie.
Teoria della stima - stima puntuale e per intervallo: intervallo di
confidenza per la media aritmetica; intervallo di confidenza per una
proporzione; determinazione della numerosità campionaria.
La verifica di ipotesi statistiche: test parametrici per la media e
per la proporzione.
La verifica di ipotesi statistiche: cenni sui test non parametrici.
Analisi dell’associazione tra caratteri: distribuzioni doppie;
dipendenza, indipendenza, interdipendenza; misure
dell’associazione per caratteri qualitativi e quantitativi: il Chiquadrato.
Informazioni sul corso - 3
Modalità d’esame
Esame orale
Libro di testo
Triola M. M., Triola M. F., Statistica per le discipline biosanitarie,
Pearson-Addison Wesley.
Altri testi consigliati
Pagano M., Gauvreau K., (2003), Biostatistica, Idelson-Gnocchi,
Napoli.
Bland M. (2009), Statistica medica, Apogeo, Milano.
Soliani L. (2005), Manuale di statistica per la ricerca e la
professione (Statistica univariata e bivariata, parametrica e non
parametrica per le discipline ambientali e biologiche), disponibile all’indirizzo
internet: http://www.dsa.unipr.it/soliani/soliani.html.
Contatti
Per qualsiasi problema, comunicazione, consiglio,
proposta, ecc …:
Andrea Ciccarelli:
[email protected]
(Ma ditemi chi siete, Facoltà, CDL, che cosa vi serve,
etc. (?!))
La Statistica - 1
Statistica vs Matematica
Approccio diretto, semplice, poco formale
Capire e non studiare (a memoria …)
Necessità di spiegare le “funzioni” della statistica (per
capire bene cosa andremo a fare ...)
Necessità di imparare un linguaggio comune (essenziale
non solo per “capirci” ma anche, come vedremo, per
utilizzare le opportune metodologie quantitative)
La Statistica - 2
Obiettivo della statistica è quello fornire informazioni di
carattere quantitativo sugli aspetti economici, sociali,
demografici, avendo come fine principale quello di
approssimare la realtà.
Non esistono informazioni “certe”, ma solo informazioni
(se possibile …) di “buona qualità”, in termini di:
a) corrispondenza tra l’informazione finale e l’aggregato che si
vuole misurare;
b) di classificazione e definizione degli aggregati stessi;
c) di metodologie quantitative predisposte al fine di stimare gli
aggregati;
d) di modalità con le quali l’informazione viene resa fruibile per
l’utente finale.
La Statistica - 3
La statistica deve fornirci le necessarie metodologie
quantitative che ci consentano di:
Raccogliere le informazioni
Descrivere le informazioni
Sintetizzare
Fornire indicazioni (tendenze) quantitative (e,
dunque, oggettive)
Statistica Descrittiva e Inferenziale
Statistica Descrittiva
La statistica descrittiva si occupa di descrivere e sintetizzare (con
tabelle, grafici, indici sintetici, ecc..) le informazioni (qualitative e
quantitative) relative ad un certo gruppo di “soggetti” al fine di far
emergere caratteristiche, andamento e le eventuali relazioni che si
verificano all’interno del fenomeno analizzato.
Statistica Inferenziale
La statistica inferenziale utilizza le informazioni raccolte da
un’indagine campionaria e le “manipola” (grazie all’utilizzo di
opportuni “modelli”) in modo da poter generalizzare le indicazioni
tratte dal gruppo investigato a tutta la popolazione dal quale tale
gruppo è stato estratto.
Popolazione e Campione
Popolazione
Per popolazione si intende l’insieme di tutte le unità che
compongono un collettivo. Sono esempi di popolazione:
Tutti i cittadini italiani
Tutti gli studenti dell’Università di Teramo
Tutte i cavalli di una certa razza presenti in un territorio
Tutti i cani presenti nei canili della regione Abruzzo
Tutte le donne sposate con almeno un figlio
Campione
Una parte della popolazione (Deve avere “certe” caratteristiche …)
Indagini censuarie e campionarie - 1
Indagine censuaria
(o Totale)
Effettuata su TUTTI i
componenti della popolazione
Indagine campionaria
Effettuata solo su ALCUNI
componenti della popolazione
Pregi e difetti
Esaustività
Ricchezza informazioni
Maggior dettaglio
Costi elevati
Lunghi tempi elaborazione
Difficoltà a raggiungere tutti
Qualità informazioni (?)
Economicità
Possibilità di ripetere le indagini
continuamente nel tempo
Indagini mirate in base ad
esigenze anche improvvise
Errore campionario
Minor livello di dettaglio
Titolo della lezione
Distribuzione di un
carattere e sua
rappresentazione
Le Distribuzioni Statistiche –
Distribuzione Unitaria
Esempio: indagine effettuata su 300 laureati di una certa
università; distribuzione unitaria.
Unità
1
2
3
4
5
6
7
8
9
10
Sesso
M
F
F
M
F
F
M
M
M
F
Unità
statistiche
Età
24
25
24
27
29
24
25
27
26
26
Laurea
Economia
Economia
Matematica
Statistica
Economia
Statistica
Matematica
Statistica
Economia
Statistica
Caratteri
Voto
109
110
107
103
95
107
105
105
110
110
Componenti
2
5
3
4
3
6
4
3
2
4
Modalità
Reddito
25.100
26.500
17.500
35.600
76.200
14.700
19.350
22.300
18.640
45.020
Le modalità del carattere
Modalità
Qualitative
Non Ordinabili
(Sconnesse)
Non posso
esprimere
“preferenza”
(Sesso, Laurea,
ecc…)
Ordinabili
Posso esprimere
“preferenza”
(Titolo di studio,
Gradi militari,
Qualifica
lavorativa, ecc…)
Quantitative
Discrete
Numeri interi
(senza decimali)
Continue
Numeri reali
(decimali)
Le frequenze
Assolute (ni):
rappresentano il numero di volte in cui una determinata modalità
del carattere si presenta
Relative (fi):
sono date dal rapporto tra le frequenze assolute e la numerosità
totale: fi = ni/N
Percentuali (pi):
sono date dal prodotto tra le frequenze relative e 100: pi = fi x 100.
Le Distribuzioni Statistiche
Le distribuzioni statistiche descrivono il modo in cui
uno o più caratteri si manifestano (distribuiscono) in
un dato collettivo.
distribuzioni semplici (un solo carattere)
distribuzioni doppie (due caratteri)
distribuzioni multiple (molti caratteri)
Si costruiscono associando ad ogni modalità il
numero di volte in cui questa si è presentata
Distribuzione di Frequenze –
Esempio
Esempio: indagine effettuata su 300 laureati di una certa
università; distribuzione di frequenze.
Unità
1
2
3
4
5
6
7
8
9
10
Sesso
M
F
F
M
F
F
M
M
M
F
Xi
Maschi
Femmine
ni
170
130
300
Distribuzione di Frequenze – 2
Esempio
Unità
1
2
3
4
5
6
7
8
9
10
Laurea
Economia
Economia
Matematica
Statistica
Economia
Statistica
Matematica
Statistica
Economia
Statistica
ni
fi =
n
N1 = n 1
N 2 = N1 + n 2
Componenti
2
5
3
4
3
6
4
3
2
4
Xi
Economia
Statistica
Matematica
Xi
1
2
3
4
5
ni
120
100
80
300
ni
50
80
90
60
20
300
fi
0,400
0,333
0,267
1,000
Ni
50
130
220
280
300
N3 = N 2 + n 3
19
Le Distribuzioni doppie
Unità
1
2
3
4
5
6
7
8
9
10
Laurea
Economia
Economia
Matematica
Statistica
Economia
Statistica
Matematica
Statistica
Economia
Statistica
Sesso
M
F
F
M
F
F
M
M
M
F
Economia
Statistica
Matematica
M
75
35
60
170
F
45
65
20
130
20
Riferimenti sul testo
di Triola M. M., Triola M. F.
Statistica per le discipline biosanitarie,
Pearson-Addison Wesley
Paragrafi da studiare: 1.1, 1.2, 1.3, 2.1, 2.2. Esercizi alla
fine dei paragrafi.
Paragrafi da leggere: 2.3. Esercizi alla fine dei paragrafi.
21