Parametri, stimatori e stime, aspetti esplicativi dell`Inferenza Statistica1

annuncio pubblicitario
Parametri, stimatori e stime,
aspetti esplicativi dell'Inferenza Statistica1
Maria Felicia Andriani – Francesco Maria Dellisanti
Oronzo Filippi
Sunto: In questa esperienza vengono analizzati gli aspetti semantici e
algebrici di un noto Teorema dell'Inferenza statistica, per una comprensione più consapevole della disciplina.
Abstract: In this experience we analyse the semantic and algebric aspects of a well-known theorem about statistics, for a reading literacy
of the subject.
Parole chiave: Inferenza campionaria, media della distribuzione campionaria media, varianza della distribuzione campionaria media.
1
Lavoro tratto da uno studio di Francesco Maria Dellisanti.
89
1. INTRODUZIONE
Il progresso scientifico, l’osservazione, lo studio e la descrizione
dei fenomeni naturali, intesi questi nell’accezione più ampia, necessitano della conoscenza anche della statistica e della probabilità, ambiti
disciplinari già facenti parte del nucleo Dati e Previsioni2. Tali conoscenze, affrontate in forma applicativa nei due bienni precedenti, possono essere riprese, in questo particolare anno scolastico, con un obiettivo diverso: la reading literacy, ossia con una lettura consapevole.
Si propone dunque un’attività di laboratorio, da effettuarsi anche
con l'ausilio del foglio elettronico che, attraverso una metodologia di
cooperative learning, permetta agli studenti la comprensione, sul piano metacognitivo, di terminologie specifiche e delle corrispondenti
espressioni matematiche tipiche dell'inferenza statistica.
A titolo di esempio sarà esaminato il seguente Teorema:
Il valore medio della media campionaria X , in caso di campionamento bernulliano, è uguale alla media µ della popolazione, mentre la varianza della media campionaria X è uguale
!
alla varianza della popolazione divisa
per la dimensione del
campione, cioè:
Media(X ) = µ X = µ
!
(1)
"2
(2)
Var( X ) = " =
n
Mentre in caso di campionamento senza ripetizione, risulterà:
2
X
!
Media(X ) = µ X = µ
!
"2 N # n
(3)
Var(X ) = " =
*
n N #1
Sarà compito di questa proposta di lavoro contribuire a chiarire il
significato di termini ed espressioni caratteristici di questa disciplina.
2
X
!
(1)
!
2
Protocollo MIUR-Mathesis, La Matematica per il cittadino [2].
90
2. NOTE STORICHE SULL'INFERENZA STATISTICA3
Si definisce inferenza statistica il procedimento mediante il quale,
dall'analisi dei dati osservati sul campione, si traggono informazioni
relative all'intera popolazione. Si possono distinguere due aspetti principali dell'inferenza statistica:
 la stima campionaria, quando dallo studio dei parametri del campione, quali la media, la varianza, etc si può stimare il corrispondente parametro della popolazione che non è noto;
 la verifica delle ipotesi, quando dall'esame del campione si vuole
decidere se un'ipotesi fatta su una data popolazione è accettabile o
rifiutabile; la decisione è presa ad un dato livello di probabilità di
commettere un errore nell'accettare l'ipotesi quando questa è falsa
o nel rifiutarla quando questa è vera.
I primi tentativi di estrapolare dati statistici riguardanti fenomeni
economici e sociali, risalgono in Francia e in Inghilterra ai secoli XVII
e XVIII, con la nascita del calcolo delle probabilità. Si deve però
giungere all'inizio del XX secolo, con le opere di R. A. Fisher (18901960), di R. Pearson (1857-1936), di E. S. Pearson (1895-1980) e di J.
Neyman (1894-1961) per lo sviluppo della teoria della stima e della
verifica delle ipotesi. Successivamente sotto l'influenza dello studioso
di calcolo delle probabilità, Bruno de Finetti (1906-1985), si è sviluppata una nuova impostazione: l'inferenza bayesiana, dove sono stati
introdotti e affinati nuovi test statistici.
3. ATTIVITÀ DI LAVORO
Si vuole chiarire attraverso degli esempi il significato dei termini:
parametro, stimatore e stima, rispettivamente costante, funzione di
variabili campionarie e valore della funzione campionaria e delle espressioni: il valore medio della media campionaria e la varianza
della media campionaria, mediante anche l'utilizzo di un applicativo
realizzato in Excel4.
3
4
I contenuti esposti, con i dovuti riadattamenti, sono tratti dal cap 11 del volume CONOSCERE E
APPLICARE LA MATEMATICA, Ed. Tramontana, Aut. A. Gambotto Manzone - B. Consolini. [3].
L'applicativo inferenza_esempio1.xls può essere richiesto direttamente agli autori.
91
I voti riportati da 10 studenti della classe V B, negli esami di stato dello scorso anno scolastico, in una delle tre prove scritte, sono i
seguenti: 10, 11, 9, 8, 12, 10, 11, 15, 13 e 14.
Quando calcoliamo la media e la varianza dei voti riportati dagli
studenti negli Esami di stato stiamo misurando due parametri dei dati
rilevati, ossia della popolazione dei dati; questi valori, che identificano
la popolazione sono sempre costanti in quanto ottenuti dalle seguenti
relazioni e con gli stessi valori:
N
10
"x "x
i
µ=
i=1
N
=
!
!
$( x
=
10
10 + ...+ 14
= 11,3
10
2
N
2
i
i=1
i
# µ)
(10 # 11,3)
=
2
+ ...+ (14 # 11,3)2
= 4,41
N
10
I valori dei due parametri sarebbero stati diversi se avessimo operato su un'altra popolazione di dati, quali i risultati della stessa prova
in un'altra classe o i risultati degli stessi studenti in altre prove.
Pertanto: i parametri di una popolazione di dati sono grandezze
costanti, essi vengono sempre indicati con lettere minuscole greche e
caratterizzano la popolazione stessa.
Ricordiamo brevemente alcuni termini che saranno richiamati in
seguito. La popolazione (o universo statistico) è l'insieme di unità statistiche che condividono una o più caratteristiche, ciascuna delle quali
è la determinazione di una stessa variabile, ad esempio l'insieme dei
voti conseguiti dagli studenti nella terza prova. Tale determinazione
può essere numerica, in caso di variabile e può essere non numerica in
caso di mutabile. La popolazione può essere finita o infinita, anche se
quest'ultima è un'astrazione utilizzata per avere formule più semplici.
Per campione statistico s'intende un sottoinsieme proprio, di unità
statistiche, facenti parte della popolazione ed estratte casualmente da
essa. La dimensione n del campione rappresenta la sua ampiezza. Si
definisce universo (o spazio) dei campioni, l'insieme di tutti i possibili
campioni che si possono estrarre dalla popolazione. Un campione può
essere composto mediante una estrazione bernulliana se ogni unità
" =
92
i=1
statistica, dopo l'estrazione, viene rimessa nella popolazione da cui è
stata estratta, per essere nuovamente sorteggiata: in questo caso la
probabilità di ogni unità di essere sorteggiata non varia ed è pari a:
1/N. Il numero dei campioni distinti, ciascuno di ampiezza n, che si
possono estrarre da una popolazione di numerosità N è uguale al numero di Disposizioni con ripetizione di N elementi di classe n, ossia:
D'N,n=Nn.Un campione può essere composto mediante una estrazione
in blocco se ogni unità statistica dopo l'estrazione non viene rimessa
nella popolazione da cui è stata estratta, oppure le unità vengono estratte in blocco. Le unità statistiche, pertanto, non hanno tutte la stessa probabilità di essere sorteggiate; la prima, infatti, è pari a: 1/N la
seconda: 1/(N-1) e l'ultima: 1/(N-n-1). Il numero dei campioni distinti,
ciascuno di ampiezza n, che si possono estrarre da una popolazione di
numerosità N, senza tener conto dell'ordine delle unità5, è uguale al
numero di Combinazioni semplici di N elementi di classe n, ossia:
"N %
N!
$ '=
# n & n!( N ( n)!
!
Relativamente all'esempio proposto per calcolare l'universo dei campioni, di dimensione n=2, nel caso di estrazione bernoulliana, dobbiamo far riferimento alla formula precedente e quindi: Nn=102=100.
Nel caso di estrazioni in blocco o senza ripetizione, invece, il risultato
sarà il seguente:
"N %
10!
3628800
=
= 45 .
$ '=
# n & 2!(10 ( 2)! 2* 40320
3.1 VERIFICA PER CAMPIONI BERNULLIANI
!
Estraiamo con ripetizione dalla nostra popolazione tutti i possibili
campioni di dimensione 2 e per ciascun campione ci calcoliamo la
media. I risultati sono riportati nel prospetto seguente:
5
È possibile formare il campione anche tenendo conto dell'ordine, in questo caso il numero
dei campioni è pari alle Disposizioni semplici di N elementi di classe n, ossia: DN,n, ma questo caso non sarà trattato.
93
Tabella n° 1 - Universo dei campioni, di dimensione n=2, estratti con
ripetizione da una popolazione di 10 elementi.
Campione
1°
2°
3°
4°
5°
6°
7°
8°
9°
10°
11°
12°
13°
14°
15°
16°
17°
18°
19°
20°
21°
22°
23°
24°
25°
26°
27°
28°
29°
30°
31°
32°
33°
34°
35°
36°
37°
38°
39°
94
Composizione
10
10
10
10
10
10
10
10
10
10
11
11
11
11
11
11
11
11
11
11
9
9
9
9
9
9
9
9
9
9
8
8
8
8
8
8
8
8
8
10
11
9
!8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
13
X
Campione
10,0
10,5
9,5
9,0
11,0
10,0
10,5
12,5
11,5
12,0
10,5
11,0
10,0
9,5
11,5
10,5
11,0
13,0
12,0
12,5
9,5
10,0
9,0
8,5
10,5
9,5
10,0
12,0
11,0
11,5
9,0
9,5
8,5
8,0
10,0
9,0
9,5
11,5
10,5
40°
41°
42°
43°
44°
45°
46°
47°
48°
49°
50°
51°
52°
53°
54°
55°
56°
57°
58°
59°
60°
61°
62°
63°
64°
65°
66°
67°
68°
69°
70°
71°
72°
73°
74°
75°
76°
77°
78°
Composizione
8
12
12
12
12
12
12
12
12
12
12
10
10
10
10
10
10
10
10
10
10
11
11
11
11
11
11
11
11
11
11
15
15
15
15
15
15
15
15
14
10
11
!9
8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
13
14
10
11
9
8
12
10
11
15
X
11,0
11,0
11,5
10,5
10,0
12,0
11,0
11,5
13,5
12,5
13,0
10,0
10,5
9,5
9,0
11,0
10,0
10,5
12,5
11,5
12,0
10,5
11,0
10,0
9,5
11,5
10,5
11,0
13,0
12,0
12,5
12,5
13,0
12,0
11,5
13,5
12,5
13,0
15,0
Campione
79°
80°
81°
82°
83°
84°
85°
86°
87°
88°
89°
!
Composizione
15
15
13
13
13
13
13
13
13
13
13
13
14
10
!11
9
8
12
10
11
15
13
X
Campione
14,0
14,5
11,5
12,0
11,0
10,5
12,5
11,5
12,0
14,0
13,0
90°
91°
92°
93°
94°
95°
96°
97°
98°
99°
100°
Composizione
13
14
14
14
14
14
14
14
14
14
14
14
10
11
!9
8
12
10
11
15
13
14
X
13,5
12,0
12,5
11,5
11,0
13,0
12,0
12,5
14,5
13,5
14,0
Nella colonna relativa alla media aritmetica dei campioni, denotata x osserviamo come questi valori variano; essi, infatti, sono legati
alle unità che compongono il campione, quindi questa variabile campionaria si presenta con una varietà specifica, la cui distribuzione di
frequenza è la seguente.
Tabella n° 2 - Distribuzione di frequenza della variabile campionaria: media aritmetica dei campioni
Modalità
Freq.
8,00
8,50
9,00
9,50
10,00
10,50
11,00
11,50
12,00
12,50
13,00
13,50
14,00
14,50
15,00
1
2
5
8
10
12
12
12
11
10
7
4
3
2
1
100
Mentre la conseguente rappresentazione grafica è la seguente.
95
Grafico n° 1 - Rappresentazione grafica della variabile campionaria:
media aritmetica dei campioni.
15,00
14,00
13,00
12,00
11,00
10,00
9,00
8,00
0 1 2 3 4 5 6 7 8 9 10 11 12
Per comprendere appieno il significato algebrico delle espressioni
(1), (2) e (3) del Teorema, oggetto della nostra attività, dobbiamo calcolarci la media e la varianza, di questa variabile campionaria. Con
riferimento alla Tabella n° 2 i valori x1 , ..., x15 rappresentano le modalità della variabile X , ossia le determinazioni numeriche della variabile campionaria; i valori fr rappresentano le corrispondenti frequenze.
Il valore medio ponderato di!tutte le medie campionarie, pertanto, è
!
15
Media(X ) = µ X =
"X
r
* fr
r =1
"f
r =1
che corrisponderà a:
!
96
=
15
r
(8,00 * 1) + ... + (15,00 * 1)
= 11,3
1 + ... + 1
abbiamo così verificato come la media della distribuzione campionaria
media è uguale al corrispondente parametro della popolazione, ossia:
=
Media(X ) = µ X = 11,3 = µ
!
Calcoliamo anche la varianza della variabile campionaria:
2
15
!
2
X
Varianza(X ) = " =
$( X
# µX ) * fr
r
r =1
=
15
$f
r
r =1
(8,00 " 11,3)
=
!
2
2
* 1 + ...+ (15,00 " 11,3) * 1
= 2,205
1 + ...+ 1
Anche in questo caso risulta verificato come la varianza della distribuzione campionaria, media campionaria, è uguale alla varianza della popolazione
divisa per l'ampiezza dei campioni, ossia:
!
Varianza(X ) = " 2X = 2,205 =
" 2 4,410
=
= 2,205
n
2
3.2 VERIFICA PER CAMPIONI CON ESTRAZIONI IN BLOCCO
!
Estraiamo dalla nostra popolazione tutti i possibili campioni di
dimensione 2, senza riutilizzare le unità statistiche già estratte e per
ciascun campione ci calcoliamo la media. I risultati sono riportati nel
prospetto seguente:
Tabella n° 3 - Universo dei campioni, di dimensione n=2, estratti senza ripetizione da una popolazione di 10 elementi.
Campione
1°
2°
3°
4°
5°
Composizione
10
11
10
9
10
8
!12
10
10
10
X
10,5
9,5
9,0
11,0
10,0
Campione
6°
7°
8°
9°
10°
Composizione
10
11
10
15
10
13
!14
10
11
9
X
10,5
12,5
11,5
12,0
10,0
97
Campione
11°
12°
13°
14°
15°
16°
17°
18°
19°
20°
21°
22°
23°
24°
25°
26°
27°
28°
Composizione
11
8
11
12
11
10
!11
11
11
15
11
13
11
14
9
8
9
12
9
10
9
11
9
15
9
13
9
14
8
12
8
10
8
11
8
15
X
9,5
11,5
10,5
11,0
13,0
12,0
12,5
8,5
10,5
9,5
10,0
12,0
11,0
11,5
10,0
9,0
9,5
11,5
Campione
29°
30°
31°
32°
33°
34°
35°
36°
37°
38°
39°
40°
41°
42°
43°
44°
45°
Composizione
8
13
8
14
12
10
!11
12
12
15
12
13
12
14
10
11
10
15
10
13
10
14
11
15
11
13
11
14
15
13
15
14
13
14
X
10,5
11,0
11,0
11,5
13,5
12,5
13,0
10,5
12,5
11,5
12,0
13,0
12,0
12,5
14,0
14,5
13,5
Dalla tabella osserviamo come, anche in questo caso, la variabile
campionaria, media aritmetica dei campioni, si presenta con una varietà specifica, la cui distribuzione è la seguente:
Tabella n° 4 - Distribuzione di frequenza della variabile campionaria: media aritmetica dei campioni.
Modalità
8,00
8,50
9,00
9,50
10,00
10,50
11,00
11,50
12,00
12,50
13,00
13,50
14,00
14,50
15,00
98
Freq.
0
1
2
4
4
6
5
6
5
5
3
2
1
1
0
45
Grafico n° 2 - Rappresentazione grafica della variabile campionaria:
media aritmetica dei campioni.
15,00
14,00
13,00
12,00
11,00
10,00
9,00
8,00
0
1
2
3
4
5
6
Anche in questo caso, per comprendere il significato delle espressioni (1), (2) e (3) contenute nel Teorema, dobbiamo calcolare la media e la varianza della variabile campionaria, pertanto il valore medio
ponderato di tutte le medie campionarie corrisponderà a:
13
Media(X ) = µ X =
"X
r
* fr
r =1
=
13
"f
r
r =1
(8,50* 1) + ...+ (14,50* 1)
= 11,3
1 + ...+ 1
verificando, ancora una volta, come la media della distribuzione campionaria media, anche in questo caso, è uguale alla media della popolazione, ossia:
=
!
!
Media(X ) = µ X = 11,3 = µ
!
99
Anche il calcolo della varianza della variabile campionaria:
2
13
2
X
Varianza(X ) = " =
$( x
r =1
r
# µX ) * fr
=
13
$f
r
r =1
(8,50 " 11,3)
=
!
2
2
* 1 + ...+ (14,50 " 11,3) * 1
= 1,96
1 + ...+ 1
verificherà quanto affermato nel Teorema, ossia la varianza della distribuzione campionaria è uguale alla varianza della popolazione, divisa per!l'ampiezza dei campioni e moltiplicata per il fattore corrispondente, ossia:
" 2 N # n 4,410 10 - 2
8
*
=
*
= 2,205* = 1,96
n N #1
2
10 - 1
9
Utilizzando il software inferenza_esempio1.xls è possibile verificare come, limitatamente ad una popolazione di 10 elementi e ad un
campione di ampiezza 2, il variare delle modalità del carattere produce sempre le uguaglianze enunciate nel Teorema.
Varianza(X ) = " 2X =
!
4. PARAMETRI, STIMATORI E STIME
Abbiamo chiarito in precedenza il significato di parametro di una
popolazione e abbiamo visto come questa grandezza è costante, genericamente essa è indicata con la lettera greca ϑ (leggasi theta).
Abbiamo visto come, al variare del campione, la distribuzione
campionaria assume valori sempre diversi, perché legati alle unità statistiche che formano il campione. Questa variabile è chiamata Stimatore o statistica Test, ed è indicata con la lettera latina T; essa è una
variabile casuale ed è funzione, nel nostro esempio, delle medie campionarie, ossia:
T = f ( x1 ,x 2 ,...,x N n )
oppure
!
100
T = f(x1 ,...,x" N % )
$ '
#n &
!
a seconda del tipo di campionamento interessato.
Il valore che questo stimatore assume, quando si assegnano alle
variabili X i i valori del campione estratto, si chiama Stima o Statistica Calcolata ed è un numero reale.
Riteniamo pertanto di aver contribuito, con questo esempio, ad
una conoscenza più consapevole di questa parte dell'Inferenza statisti!ca. Siamo consapevoli, tuttavia, che la verifica di un teorema non può
essere effettuata attraverso l'aspetto numerico, ma richiede un'argomentazione più ampia.
A titolo di esempio, quindi, presentiamo la dimostrazione di un parametro che se il docente lo riterrà opportuno potrà discuterne in classe.
5. LE DIMOSTRAZIONI
Abbiamo compreso il significato delle affermazioni (1), (2) e (3)
contenute nel Teorema enunciato in precedenza, ci accingiamo, ora, a
verificare le uguaglianze sotto il profilo algebrico e assiomatico.
Sia P={ x1, …, x10} l'insieme delle osservazioni, ossia i voti riportati dai dieci studenti nella terza prova, relativamente al carattere osservato, ossia: X voto conseguito nella terza prova, e siano
C1={ x1, x1} , C2={ x1, x2} ,…, C100={ x10, x10}
i campioni di ampiezza 2, estratti bernullianamente dalla popolazione
e sia !
U l'universo dei campioni, ossia: U={ C1, …, C100} la media della popolazione corrisponde, com'è noto, a:
x1 + ... + x10
10
mentre la variabile campionaria, corrisponde a:
µ=
!
X = { x1 ,..., x100 }
dove ogni elemento, o determinazione numerica, rappresenta la media
degli elementi facenti parte del campione, ossia:
!
101
x1 =
x + x10
x + x10
x1 + x1
, ... , x100 = 10
, ... , x50 = 5
2
2
2
5.1 La media della variabile campionaria: media aritmetica dei cam-
!
pioni, nel caso
! di campionamento
! con ripetizione, invece, corrisponderà a:
Media( X ) =
x1 + ... + x50 + ... + x100
100
dove:
!
!
x1 + x1
x + x10
x + x10
+ ...+ 5
+ ...+ 10
2
2
2
=
100
da cui semplificando:
1 x + x1 + ...+ x5 + x10 + ...+ x10 + x10
= * 1
2
100
e raggruppando, successivamente gli elementi simili, si ottiene:
!
!
1 20x1 + ...+ 20x10
= *
2
100
Va osservato che ogni unità statistica si presenta 20 volte poiché
interviene 10 volte in prima posizione in un campione e 10 volte in
seconda posizione nei successivi 90 raggruppamenti.
L'espressione precedente può essere scritta in forma equivalente:
1 2* 10(x1 + ...+ x10 )
= *
2
100
la cui successiva semplificazione porta all'uguaglianza cercata:
!
!
=
(x1 + ...+ x10 )
=µ
10
In generale, per una popolazione di dimensione N e per un campione di ampiezza n, le relazioni precedenti possono essere scritte
come di seguito:
102
x1 + ...+ x N
N
mentre per la variabile campionaria, si ottiene:
µ=
!
!
!
X = { x1 ,...,x N n }
dove:
x n + ...+ x N n
x1 + ...+ x1
x + ...+ xk
,..., xi = i
,...,x N n = N
n
n
n
La media di questa variabile campionaria risulta:
x1 =
Media(X ) =
x1 + ...+ x N n
Nn
ossia:
x n + ...+ x N n
x1 + ...+ x1
x + ...+ xk
+ ...+ i
+ ...+ N
n
n
n
=
n
N
Possiamo sintetizzare le somme di ciascuna unità statistica con l'espressione: nN n"1 xi in quanto ogni unità sarà presente N n"1 volte, in
!
prima posizione, in un raggruppamento e altre N n"1 volte, in varie posizioni, in ciascuno degli N n"1 *(N-1) successivi raggruppamenti; poiché
di ciascun raggruppamento è n,!ogni valore risulta ap! l'ampiezza
n"1
punto nN .
!
Dalla sostituzione, pertanto, si ottiene:
!
1 nN n -1 x1 + ...+ nN n -1 x N
= *
!
n
Nn
da cui, raccogliendo il fattore comune,
!
!
!
!
1 nN n -1 (x1 + ...+ x N )
= *
n
Nn
e semplificando, si ottiene l'uguaglianza da verificare:
=
x1 + ...+ x N
=µ
N
103
ossia:
c.v.d.
µx = µ
!
Rimane verificato, pertanto, come la media della distribuzione (o
variabile) campionaria media dei campioni è uguale alla media della
popolazione dei dati.
5.2 Verifichiamo ora il Teorema nel caso di campionamento senza ri-
petizione. Sia P={ x1, …, x10} l'insieme delle osservazioni, ossia i voti
riportati dai dieci studenti nella terza prova; siano: C1={ x1, x2} ,
C2={ x1, x3} ,…, C45={ x9, x10} i campioni di ampiezza 2, estratti in
blocco dalla popolazione e sia U l'universo dei campioni, ossia:
U={ C1, …, C45} , la media della popolazione è:
x1 + ...+ x10
10
mentre la media della distribuzione campionaria, risulta:
µ=
Media(X ) =
!
x1 + ...+ x45
45
dove:
x1 =
!
x1 + x2
2
x45 =
x9 + x10
2
da cui sostituendo, si ottiene:
!
x1 + x2
x9 + x10
+ ...+
!
2
2
=
45
e l'ulteriore semplificazione, porta alle seguenti espressioni:
!
!
1 9x + ... + 9x10
= * 1
2
45
1 9(x1 + ...+ x10 )
= *
2
45
!
104
dove ogni unità statistica si presenta 9 volte, in varie posizioni e nei 45
raggruppamenti. Dopo l'ulteriore semplificazione, si ottiene la relazione che si voleva dimostrare:
(x1 + ...+ x10 )
=µ
10
Anche in quest'esempio, le relazioni precedenti possono essere generalizzate, come di seguito, nel caso di una popolazione di dimensione N e per un campione di ampiezza n.
La media della popolazione corrisponde a:
=
!
µ=
x1 + ...+ x N
N
mentre la variabile distribuzione campionaria risulta:
!
(
+
X = ) x1 ,...,x" N % ,
$ '
*
#n &-
dove:
!
!
x" N % =
$ '
#n &
x N -n +1 + ...+ x N
n
x1 =
x1 + ...+ xn
n
la media della distribuzione campionaria corrisponde, invece, alla seguente espressione:
x + ...+!x
1
Media(X ) =
"N %
$ '
#n &
"N %
$ '
#n &
e, quindi, dopo la sostituzione risulta:
!
x1 + ...+ xn
x
+ ...+ x N
+ ...+ N -n +1
n
n
.
=
"N %
$ '
#n &
Sintetizzando le somme di ciascuna unità con l'espressione:
!
105
n "N %
$ ' xi
N #n &
e raccogliendo il fattore comune, si ottiene:
1 ( n "N%
n "N % +
* * $ ' x1 + ...+ $ ' x N n ) N #n &
N #n & ,
"N%
$ '
#n &
!
la cui ulteriore elaborazione porta alla seguente espressione:
!
1 n "N %
* $ '(x1 + ...+ x N )
n N #n &
=
"N%
$ '
#n &
e la successiva semplificazione verifica l'uguaglianza:
!
=
x1 + ...+ x N
=µ
N
In generale, dunque, anche in questa situazione rimane verificata
l'affermazione del Teorema, ossia:
!
µX = µ
!
106
c.v.d.
BIB LI OG RA FI A
[1] www.pianetascuola.it/resonline/Res_carta.
[2] MATEMATICA 2003, Attività didattiche e prove di verifica per
un nuovo curricolo di matematica, Ciclo secondario, Liceo
Scientifico Statale "A. Vallisneri", Lucca, 2004.
[3] GAMBOTTO MANZONE A., CONSOLINI B., Conoscere e applicare la matematica, Ed. Tramontana.
[4] DELLISANTI FRANCESCO MARIA, Sintassi e semantica di un
linguaggio: il sistema operativo MS-DOS (cap. 7 Analisi delle
verifiche), d'Agostino Editore, Barletta, 1991.
[5] DELLISANTI FRANCESCO MARIA, “L'accelerazione gravitazionale e la verifica dei dati sperimentali” in Induzioni Demografia, probabilità, statistica, Istituti Editoriali e Poligrafici Internazionali, Pisa, n° 28 (2004), 65-74.
107
Scarica