Corso di
Statistica Aziendale
1
Bibliografia Lucidi
(materiale reperibile via Internet)
•
•
•
•
•
•
D’Ambra – Università di Napoli
Sarnacchiaro – Università del Sannio
Simonetti – Università del Sannio
Giommi – Università di Firenze
Davino – Università di Macerata
Morale – Università di Milano
2
Statistica aziendale: insieme di metodi
statistici utilizzabili per l’organizzazione e
l’analisi dei dati aziendali di supporto a quelle
decisioni manageriali prese per lo più in
condizioni di incertezza.
Sfera Micro-Economica
Statistica Aziendale
Sfera Macro-Economica
Statistica Economica
Affermazione
troppo generica
• Statistica metodologica
• Statistica applicata
• Enfasi sul metodo
• Prescinde dal contesto applicativo
 Scelta e interpretazione del
metodo all’interno di un
contesto applicativo
3
Statistica aziendale per la ricerca scientifica e per l’azienda
Nella ricerca scientifica
Per l’azienda
 Comunicazione risultati a
esperti e enfasi sugli
aspetti metodologici
 Verifica empirica di ipotesi
di lavoro
 Cura della qualità dei dati
 Generalizzazione dei
risultati
 Comunicazione risultati a
non esperti e non
interessati al metodo
 Rapidità di analisi per
esigenze di tempestività
 Frequente impiego di dati
statistici secondari o
amministrativi
 Interesse su ordine di
grandezza dei risultati
4
Nuovi approcci, orientamenti e necessità del settore industriale
•Globalizzazione  più ampio il mercato di riferimento e
quindi la competizione è più ampia
•Orientamento al cliente  focalizzazione sulla qualità a
tutti i livelli (stakeholder model)
•Orientamento al processo focalizzazione sulle attività
chiave e ricorso all’outsourcing, reingenerizzazione del
processo (necessità di operazioni di benchmarking)
•Elevata produttività  rapporto output/input
5
La performance di un sistema aziendale
• Controllo di gestione: tecniche di budget, migliorare
efficienza e efficacia dei processi gestionali, monitorare la
capacità di creare valore economico.
• Efficacia  quanto realizzato/quanto atteso
• Efficienza utilizzazione ottimale delle risorse
• Qualità e customer satisfaction rispondenza alle
esigenze e/o a quanto dichiarato
• Sistema di gestione delle risorse umane: valutazione
efficacia dei corsi formazione, prestazioni, motivazioni,
piani retributivi e di carriera….
• Campo di attività dell’azienda: strategie, posizione
competitiva, ecc.
6
Informazione ed elaborazione statistica
L’informazione è una risorsa essenziale per il decisore d’azienda
La bontà di una decisione dipende, in larga misura, dalla Quantità e dalla Qualità
dell’informazione disponibile
Definizione di Informazione
Dato, trasformato in forma utile per il ricevente, che possiede un valore
reale o potenziale sulle decisioni attuali o future
7
Il dato non costituisce di per sé un’informazione, ma richiede un’elaborazione.
Connessione Stretta tra Statistica e Informazione
Il metodo Statistico consente di:
•Generare informazione, elaborando dati grezzi inizialmente privi di valori informativi
•Valorizzare l’informazione esistente mediante indici sintetici
•Leggere e impiegare in modo razionale le informazioni probabilistiche ottenute
•Generare informazioni prospettiche (previsioni, modelli di simulazione)
8
Ruolo della statistica
• Analisi delle relazioni di causa-effetto fra variabili
aziendali possibilmente ricondotte a schemi contabili
• Descrizione e valutazione delle condizioni di mercato in
cui l’azienda opera
• Previsione dell’andamento del mercato e delle vendite
dell’azienda
• Valutazione dei risultati economici raggiunti in termini
di performance
• Messa a punto e validazione delle strategie di marketing
• …
9
Esempio. Schema di struttura aziendale: Area, Attività e Metodi Statistici
Area
Attività
Metodi Statistici
Produzione
Previsioni della Produzione Regressioni, Analisi delle Serie Storiche
Acquisti
Pianificazione
Campionamento per Accettazione
(manodopera, acquisti)
Controllo di qualità
Carte di Controllo, Studio di Process Capability
Contabilità
e Finanza
Formulazione del Bilancio
Controllo di gestione
Metodi di Campionamento
Servizi alla
Produzione
Modelli Finanziari
Analisi dei dati
Disegni sperimentali
Analisi delle Serie Storiche e Studio di Regressione
Metodi Fattoriali
Marketing
e Vendite
Previsioni delle Vendite
Ricerche di mercato
Misurazione della
Customer Satisfaction
Analisi delle Serie Storiche
Metodi Fattoriali, Cluster Analisys
SERVQUAL, SERVPERF, QUALITOMETRO
Ricerca e
Sviluppo
Analisi di dati sperimentali
Simulazione
Metodi Fattoriali, Analisi in Componenti Principali
Metodo Montecarlo
10
Total quality management
E’ rivolto al miglioramento della qualità (rispondenza alle
specifiche) di un prodotto servizio e al monitoraggio del
funzionamento di tutta l’attività aziendale e della
customer satisfaction
Total: perché si interessa delle modalità di svolgimento
di tutti i processi aziendali
Fasi di azione
Progettazione dei prodotti/servizi
Individuazione dei problemi
Individuazione dei possibili miglioramenti
Monitoraggio continuo
11
Certificazione della qualità: normativa ISO (norma
UNI_ISO 9004-4)
“un’organizzazione dovrebbe sviluppare un sistema di
misurazione che si adatti alla natura delle proprie
attività … per identificare e diagnosticare le
opportunità di miglioramento e per quantificare i
risultati delle attività di miglioramento della qualità”
“quando possibile le decisioni circa i miglioramenti
della qualità dovrebbero essere basate su dati
numerici. Le decisioni circa differenze, andamenti e
cambiamenti nei dati numerici dovrebbero essere
basate su appropriate interpretazioni statistiche”
12
Certificazione della qualità: normativa
VISION 2000
(la nuova edizione delle norme ISO)
“…. una delle principali implicazioni della Vision 2000
sarà la crescente importanza da attribuirsi alla
raccolta e all’analisi statistica dei dati quantitativi
relativi allo svolgimento dei processi gestionali
aziendali ….” (De Qualitate, 2001)
13
La misurazione dei fenomeni aziendali
Poiché la statistica aziendale è di tipo applicato, essa
ha a che fare spesso con la misurazione di costrutti
o concetti
es. efficienza, redditività, fedeltà alla marca, etc.
Ai fini della misurazione occorre:
1) definizione del contenuto del concetto
2) definizione operativa
14
Definizione del contenuto e definizione operativa
Definizione di contenuto
• Collocazione del concetto all’interno di una
teoria, e sua relazione con altri concetti
Definizione operativa
 Modalità di misurazione del concetto attraverso
la definizione di eventi rilevabili
statisticamente, e la predisposizione dello
strumento di rilevazione (es. questionario)
15
Esempio: fedeltà alla marca B
Definizione di contenuto: atteggiamento di
preferenza e risposta comportamentale del
consumatore verso la marca B, in un dato
intervallo di tempo e per una data
categoria di prodotti
Definizione operativa: si decide di rilevare gli
acquisti di marca B della categoria di
prodotti definita, in un intervallo di tempo
(es. 1 mese), fatti da un panel di individui
Si misura davvero la fedeltà di marca ?
16
Supponiamo che un individuo abbia effettuato 5
acquisti, e tutti della marca B; è un cliente fedele?
B B
B
B B
|_____|__|__________|_____|___|___|
NON è detto, perché il pattern può dipendere anche
da:
1. Non disponibilità di prodotti sostitutivi
2. Indifferenza alla marca
3. Prezzo basso
La definizione operativa non ha tenuto conto
del contenuto del concetto
17
Errori di misurazione
Componente teorica o metodologica
Errore nella definizione e/o individuazione del
carattere o attributo da osservare
Errore specifico
Introdotto dall’osservatore o dallo strumento
nella fase di misurazione o osservazione
La qualità del dato deve essere valutata rispetto a
questi due elementi
18
Qualità del dato
Qualità (garanzie) di progettazione
 Rilevanza
teorica (adeguatezza alle necessità
informative)
effettiva (quanta informazione viene
effettivamente usata)
 Tempestività, puntualità
 Trasparenza
 Confrontabilità
 Tutela riservatezza
Rilevanza teorica: componente teorica
o metodologica
Qualità (garanzie) di tolleranza
Accuratezza: grado di corrispondenza fra la stima ottenuta dall'indagine
e il vero (ma ignoto) valore
 Errori campionari
 Errori non campionari
- Copertura
- Mancate risposte
- Totali
- Parziali
- Misurazione
19
Errori variabili bassi
Assenza errori sistematici
Errori variabili bassi
Presenza errori sistematici
Errori variabili alti
Assenza errori sistematici
Errori variabili alti
Presenza errori sistematici
20
Le Fonti dei dati
Dati Primari
Informazioni che devono essere raccolte per la prima volta mediante:
1) Osservazioni ; 2) Esperimenti; 3) Questionari (metodi appositamente
predisposti per risolvere un dato problema)
Dati Secondari
Informazioni già esistenti, utili per scopi scientifici ed economici:
Disponibili Internamente o Esternamente
Pregi
Difetti possibili
Economicità
Rilevanza (effettiva idoneità)
Velocità d’acquisizione
Assenza di controllo nella fase di progettazione della
rilevazione e di raccolta delle informazioni
Tutela della privacy
Accuratezza (capacità di descrivere il fenomeno)
21
Informazioni aziendali su:
Dati Secondari
•Produzione
Interni
•Costi
•Vendite
•Distribuzione
Statistiche e rapporti pubblicati da:
Esterni
•Enti pubblici
•Associazioni commerciali di
categoria
•Altre organizzazioni
22
Tipi di analisi e problemi decisionali
A fini classificatori, si tende a distinguere le seguenti tipologie di analisi (Kinnear e
Taylor, 1996):
•analisi o ricerche di tipo esplorativo
•analisi o ricerche di tipo conclusivo, distinte in ricerche
descrittive e causali
•analisi o ricerche di monitoraggio e di valutazione.
23
Ricerca descrittiva
Scopo: descrivere l’ammontare, la composizione delle
grandezze relative ad un certo fenomeno
•
•
•
•
Quota di mercato posseduta e dei concorrenti
Qualità del prodotto
Nr. di reclami dei clienti
Associazioni fra variabili (no causa-effetto)
Struttura dei dati: cross section
60%
50%
40%
30%
20%
10%
0%
Frequente
Talvolta
Mai
24
Ricerca esplicativa
Vengono formulate precise ipotesi sui legami di causa-effetto
di alcuni fenomeni
Scopi:
- individuare le variabili che influenzano un dato fenomeno
che interessa spiegare;
- individuare la forma funzionale di tale legame (es.
lineare, non lineare, ecc.)
Struttura dei dati: cross section, sperimentali
25
Il monitoraggio
E’ presente la variabile tempo rispetto alla quale si controlla
l’andamento di un determinato fenomeno
Struttura dei dati:
- serie storiche: dati di intensità o frequenza ordinati rispetto al
tempo
- dati longitudinali o panel: campione fisso di unità sul quale si
eseguono misure ripetute delle medesime variabili
40%
35%
30%
25%
20%
15%
10%
5%
0%
Frequente
Talvolta
Mai
26
N.B. Differenza fra indagini cross section ripetute e
indagini panel
CROSS SECTION RIPETUTE
Nr Acquirenti
MARCA A
MARCA B
MARCA A
MARCA B
Totale
Tempo 2
100
400
100
400
Tempo 2
DATI PANEL
Tempo 1
Tempo 1
MARCA A
100
100
MARCA B
100
300
400
TOTALE
100
400
500
27
Le principali Fonti di dati in Italia
Fonti Istituzionali
•Ministero dell’Economia e delle Finanze: Relazione previsionale e programmatica
•Banca d’Italia
Fonti Statistiche Ufficiali (ISTAT)
•Annuario Statistico Italiano
•Annuario di statistiche industriali
•Bollettino mensile di Statistica
Enti per la ricerca economica e sociale
•ISAE
•CENSIS (Centro Studi Investimenti Sociali): Rapporto sulla situazione sociale del paese
•INDIS (Istituto nazionale distribuzione e servizi)
Associazioni di Categoria
Camere di Commercio
Istituti di ricerca Privati
Annuari (Kompass, Seat)
Quotidiani e Riviste (ilsole24ore, mondo economico)
28
DISTRIBUZIONI SPERIMENTALI , RAPPRESENTAZIONI
1. Terminologia
popolazione, individui, variabile, censimento, sondaggio, campione
Popolazione: tutto l’insieme degli elementi oggetto di studio
Individui: gli elementi di una popolazione
ESEMPI:
I libri di una biblioteca
Gli studenti di una classe
I consumi mensili di elettricità
Ciascun individuo è descritto da un insieme di caratteristiche chiamate caratteri o
variabili
Continue
•Variabili Quantitative
•Variabili Qualitative
Discrete
Nominali
Ordinali
Osservazione
Con l’aiuto di una codifica
una variabile quantitativa
può essere arbitrariamente
trasformata in qualitativa e
viceversa
29
Censimento: lo studio di tutti gli individui di una popolazione finita
Sondaggio: lo studio di una parte della popolazione
Campione: la parte studiata
E   e1 , e2 ,...., ei ,...., en 
X : x1 , x2 ,...., xi ,...., xn
Come selezionare gli individui di un campione?
Perché i campioni?
1. Risorse limitate
2. Rarità
3. Prove distruttive
4. Il campionamento può essere più esatto
30
Sondaggio elementare
Si tratta di un sondaggio nel quale gli individui sono tirati a sorte dall’insieme
degli individui della popolazione
L’utilizzo delle tavole di numeri casuali permette di effettuare più facilmente
questa operazione
Costruzione delle tavole
•Dati
•Sperimentazione fisica
•Generatori di numerosità pseudo-aleatori
•Esperienza completamente aleatoria
Come si utilizza una tavola
Si vogliono estrarre 100 individui da una popolazione comprendente 1000
individui. Si numerano questi ultimi da 000 a 999. Poi da una tabella di
numerosità casuale si prendono i primi 100 numeri di 3 cifre eliminando le
ripetizioni
31
2. Rappresentazione di una serie statistica sottoforma di tabelle e grafici
X
variabile
x1 , x2 ,..., xi ,..., xn
serie statistica
2.1 Le tabelle statistiche
a) Variabili discrete
x1 , x2 ,..., xi ,..., xn
i valori distinti k  n
(1  i  h)
ni l' effettivo di xi (o frequenza assoluta)
ni
fi 
frequenza
n
k
 ni  n
i 1
xi
ni
f i Distribuzione sperimentale
k
 fi  1
xi
i 1
32
b) Variabili continue o assimilate
X continua
•Un grande numero di righe per la tabella degli effettivi
•Dei numeri di effettivi di scarsa ampiezza
Rimedio: raggruppare le osservazioni in classi
k classi di estremi: c0, c1, …., ck
ci 1; ci 
ni
fi
Ni
Fi
Ci
ni effettivi della classe
ni
fi 
frequenza della classe
n
N i  n1  ....  ni effettivi cumulati
Fi  f1  ....  f i frequenze cumulate
33
2.2 Rappresentazioni grafiche
Variabili qualitative:
•Diagramma a barre
•Diagramma circolare
•Diagramma a blocchi
Variabili discrete:
•Diagramma a canne d’organo
Variabili continue:
•Istogrammi
•Poligoni
34
3. Indici di sintesi
3.1 Caratteristiche della tendenza centrale
x
La media :
1n
x   xi
n i 1
La mediana:
Me
h
x   f i ci
i 1
a)
se n  2m  1
 xm 1
Me  
( xm  xm 1 ) / 2 se n  2m
b)
ci 1; ci 
classe mediana
Fi 1  0,5
Fi  0,5
0,5  Fi 1
M e  ci 1  ai
fi
dove
ai  ci  ci 1 ampiezza della classe
35
I quantili: X 
(0    1)
X min
prop.  X  X α
X max
prop. 1 -  X  X α
X 0, 25  Q1 1o quartile
X 0,5  Q2 2o quartile
X 0, 75  Q3 3 quartile
o
X min
25%
Q1
Q2
25%
25%
  0,1 ; 0,2 ;....; 0,9
decili
  0,01 ; 0,02 ;....; 0,99 centili
3.2 Caratteristiche di dispersione
Il Range:
La varianza:
R  X max  X min
1n
2
S   ( xi  x ) 2
n i 1
1 n
2
2
 ( xi  x )
s 
n  1 i 1
L’intervallo interquartile:
Lo scarto:
Q3
X max
25%
Q3  Q1
S  S2
s  s2
36
Perché La statistica Inferenziale
37
Filosofia della scienza
Secondo Aristotele, vi sono due vie attraverso le
quali riusciamo a formare le nostre
conoscenze:
(1) la deduzione
(2) l’induzione.
38
Problema dell’induzione
Tutte le inferenze tratte dall’esperienza
suppongono, come loro fondamento, che il
futuro rassomiglierà al passato e che poteri simili
saranno uniti a simili qualità sensibili. Se ci fosse
qualche sospetto che il corso della natura
potesse cambiare e che il passato non servisse di
regola per il futuro, ogni esperienza diverrebbe
inutile e non potrebbe dare origine ad alcuna
inferenza o conclusione.
39
Teoria della Falsificazione
Popper afferma che il metodo che consente agli
scienziati di trovare le teorie vere è: falsificare le
teorie false sulla base delle evidenze empiriche.
40
Falsificazionismo e inferenza
statistica
L’approccio “falsificazionista” di Popper viene usato nella
statistica per formulare delle inferenze che, sulla base
delle informazioni fornite da un campione di
osservazioni, ci consentono di descrivere le
caratteristiche della popolazione da cui quel campione è
stato tratto.
41
Soluzione pragmatica al problema
dell’induzione
Ovviamente, si può cercare di superare questo problema cercando
di mostrare che non è vero che le inferenze induttive siano
ingiustificate. La soluzione moderna a questo problema è la
concezione probabilistica dell’induzione. Quando un certo carattere
ricorre in una certa proporzione di osservazioni, si può assumere
che questa proporzione valga per tutti gli altri esempi del caso,
salvo prova contraria.
42
Esempio 1
Il responsabile controllo qualità di un’azienda che
produce bibite, sospetta che il macchinario di
riempimento delle lattine, sia fuori taratura,
immette cioè maggior prodotto di quanto
riportato sulla etichetta.
43
Esempio 2
Il proprietario di un’azienda vinicola, sospetta che
alcune bottiglie siano state chiuse male e che
quindi il sapore del vino di queste bottiglie sia
alterato….
44
Alcune definizioni
Eventi incompatibili
Dati due eventi A e B, sono detti incompatibili se il verificarsi dell’uno esclude
l’altro
Lancio di una moneta
Evento A: Testa
Evento B: Croce
La probabilità del verificarsi dell’uno O dell’altro evento è data dalla somma delle
probabilità dei singoli eventi:
P(A U B)= P(A) + P(B) (principio delle probabilità totali)
La probabilità del verificarsi dell’uno E dell’altro evento:
P(A  B)= P(A) P(B)=0
E’ possibile generalizzare questi risultati ad n eventi
45
Eventi Incompatibili
P(A)
P(B)
Eventi Compatibili
P(A)
P(B)
Si estrae una carta da un mazzo francese (52 carte, 4 semi)
Evento A=carta di cuori
Evento B= sette
P(AUB)=P(A)+P(B)
13/52
4/52
Conteggiamo l’evento comune due volte
Quindi per eventi compatibili
P(A U B)=P(A)+P(B)-P(A B)
P(Cuori o Sette)= P(Cuori)+P(Sette)-P(Sette di Cuori)=
=4/13
1/4 + 1/13 1/52
46
ESERCIZIO
Prendendo un mazzo di carte francesi ben mescolato e
pescando a caso da questo, si valutino le
seguenti probabilità:
a) di ottenere l’asso di quadri;
b) di ottenere un asso;
c) di ottenere un asso come seconda carta, ammesso di
avere già pescato una figura (senza
reintrodurla nel mazzo);
d) di ottenere tre figure (sempre senza reimmissione delle
carte estratte nel mazzo).
47
Probabilità condizionata
Dati due eventi A e B appartenenti allo spazio campionario , compatibili
tra di loro.
La probabilità che l’evento A si verifichi, una volta verificatosi l’evento B,
o in altri termini , la probabilità condizionata di A dato B, è pari a :
P( A  B)
P( A | B) 
P( B)

B
P(AB)
A
48
Esempio
Si lanci una coppia di dadi. Se la somma è 6 (evento B), si calcoli la probabilità
che uno dei due dadi abbia dato l’esito 2.
B  somma  6  1,5  ,  2, 4  ,  3,3 ,  4, 2  ,  5,1
A= un 2 su un dado


(A B)=  2, 4  ,  4, 2 
Poiche lo spazio campionario è costituito da 36 elementi
P(A B)=2/36
P(B)=5/36
2
P( A  B)
2
36
P( A | B) 


5
P( B)
5
36
49
Nel caso in cui siano indipendenti (e non mutualmente
escludentesi)
P( A | B)  P( A)
Poiché
P( A  B)  P( A) P ( B )
In modo analogo
P( A | B)  P( A)
50
Differente utilizzo delle probabilità
condizionate
P( A  B)
P( A | B) 
P( B)
P( A  B)  P( B) P( A | B)  P( A) P( B | A)
51
Diagrammi ad Albero
Uno strumento efficace e di facile costruzione per calcolare le
probabilità di ogni evento è rappresentato dal diagramma ad
albero.
Esempio
Una moneta,modificata in modo che P(T)=2/3 e P(C)=1/3,
Viene lanciata. Se si presenta croce, viene scelto a caso un numero
tra 1 e 5, se si presenta testa, viene scelto un numero a caso tra 1
e 9.
Si determini la probabilità che venga scelto un numero pari.
52
53
Teorema di Bayes
Siano H1, H2 ,…,Hn una partizione dello spazio campionario , cioè che
gli eventi Ai siano incompatibili e che la loro unione sia .
La probabilità condizionata che si verifichi l’evento Hi dato l’evento A è
pari a
P( H i ) P( A | H i )
P( H i | A) 
P ( H1 ) P ( A | H 1 )   P ( H n ) P ( A | H n )
P(Hi|A) probabilità a posteriori
P(Hi) probabilità a priori
P(A|Hi) probabilità probativa
54
Esempio
Dei ragazzi fanno uno scherzo ad un amico, accompagnandolo ad
una festa a tema dove tutti, uomini e donne sono vestiti da
donne e sono indistinguibili a vista.
Alla festa partecipa il 20% di donne
Il 40% delle donne ed il 70% degli uomini sono favorevoli ad una
love story.
Il ragazzo mentre balla con un partecipante alla festa
(uomo/donna??), lo invita a bere qualcosa e si appartano nel
privé del locale.
All’uscita della festa, gli amici gli raccontano dello scherzo. Il
ragazzo, preoccupato si rivolge ad uno statistico e gli chiede: “
Qual è la probabilità che, dato che abbia avuto una relazione con
questa persona, sia donna?”
55
VARIABILI ALEATORIE REALI
Nozioni generali: variabile aleatoria, legge di probabilità, funzione di ripartizione,
funzione di densità di probabilità, speranza matematica, varianza, scarto, etc.
1. Introduzione
Esempio: gioco di “testa o croce” in tre tiri in cui il giocatore riceve 1€ per ogni croce.
  CCC , CCT ,..., TTT  8 risultati possibili
X  " variabile aleatoria" numero di croci
Variabile: perché il valore varia da un risultato all’altro
Aleatoria: perché il risultato stesso dipende dal caso
X  0 X  1 X  2 X  3
X  0,1,2,3
X  0  TTT  PX  0  PTTT   1 8
X  1  CTT , TCT , TTC  PX  1  3 8
X  2  CCT , CTC , TCC PX  2  3 8
X  3  CCC PX  3  1 8
Legge di probabilità di X:
Val. X
Prob.
0
1
2
3
1/8 3/8 3/8 1/8
Distribuzione di probabilità di X
X i  Pi  PX  X i 
56
f  X i , P X i , PX  X i , Pi , f x  xi 
Notazioni:
Esercizio
PX  1  1 2 PX  1  1 2
PX  0  7 8 PX  4  0
PX  4  1 P1  X  2  6 8
P2  X  4  1 2
Generalizzazione
x  
X  x  evento
PX  x  numero reale tra 0 e 1
In questo modo si può definire una funzione:
Esempio:
F  x   PX  x
F  x   Funzione di ripartizione della variabile aleatoria
X=v.a. nr. di croci
F  x   PX  x
0
1 8

F x  
4 8

7 8
se
x0
se
0  x 1
se
1 x  2
se
2 x3
57
Caso continuo
X variabile aleatoria
•V.a. discreta (es. X v.a. numero di croci)
•V.a. continua
L’insieme dei valori di X è un intervallo di R
2. Definizione di una variabile aleatoria
“E” – prova
Ω – l’insieme dei risultati possibili
A – l’insieme degli eventi
P – legge di probabilità
“E” è modellizzata attraverso (Ω, A, P)
2.1 Ω finito
Ciascuna funzione reale definita sull’insieme degli eventi elementari è chiamata variabile
aleatoria
Esempio:
“E”= si lancia una moneta
  C , T   w1 , w2 
A  P 
X w1   0
X : 
w  X  w
X w2   1
P : pw1   1 2
pw2   1 2
X v.a. numero di croci
58
Legge di probabilità di una variabile aleatoria
(Ω, A, P) spazio di probabilità finito
X : 
w  X  w
X
  w1 ,...., wn  
X w1 ,...., X wn 
X wi   xi
1  i  n 
x1 , x2 ,....., xn
i valori distinti presi da X
Ai  w   / X w  xi  1  i  k 
Ai  X  xi 
Ai  A
PX  xi   P Ai  1  i  k 
La funzione Px definita su x1 ,...., xk  attraverso :
Px  xi   PX  xi 
è chiamata distribuzi one di probabilit à (o legge)
della variabile aleatoria X
pi  0
k

i 1
1  i  k 
pi  1
59
60
Generalizzazione
Si può generalizzare la nozione dell’evento
X  xi 
e definire:
a  X  b  X prende i suoi valori nell' intervallo a, b
a, b  
ab
a  X  b  w   / a  X w  b
Pa  X  b  Pw   / a  X w  b
61
Proprietà di F(x):
F  x   PX  x
x  
1) F(x) è una funzione non decrescente
x2  x1
2)
x  
lim
x 
F  x2   F  x1 

0  F x  1
F x  0
lim
x  
F x  1
3) F(x) è continua a destra

4) P a  X
Osservazione:
 b  F b   F a 
ab
Per le variabili aleatorie discrete F(x) è una funzione a scalini
62
63
Sintesi numeriche:
   E X  


x p x  dx


  2  V X  
  V  X 


x 2 p x  dx  E  x 
2
Proprietà di E(X), V(X):
1) Se X=c allora E(X)=c
2)
V(X)=0
   X v.a. E  X ,V  X  esistono
E X   E  X 
V X   2V  X 
3) X
1
, X2
E  X i ,V  X i  esistono
i  1, 2
E X1  X 2   E X1   E X 2 
V  X1  X 2   V  X1   V  X 2 
indipendenti
64
Legami tra X1 e X2:
X1, X 2
E  X i ,V  X i  esistono
i  1, 2
cov  X 1 , X 2   E X 1  E  X 1  X 2  E  X 2 
rX X
1
2
cov  X 1 , X 2 

X X
1
2
65
Distribuzione Uniforme
Discreta e Continua
66
67
68
69
Distribuzione Normale
70
Valori importanti:
X  N  ;  
 P    X       0,6826
 P  2  X    2   0,9546
 P  3  X    3   0,9973
 P  1,64  X    1,64   0,9
 P  1,96  X    1,96   0,95
 P  3,09  X    3,09   0,998
71
Normale Standardizzata
72
Proprietà:
1) Z  N 0;1 c   c  0
 Pz  c  Pz  c  1  Pz  c
 P c  z  c  2 Pz  c  1
73
2) Siano X 1 , X 2 ,..., X i ,..., X n variabili aleatorie normali indipenden ti :
E  X i   i
V  X i    i2 1  i  n 
Y  N  ;  
Y  X 1  ....  X n
n
   i
i 1
dove
 2   12   22  ....   n2
Teorema del Limite Centrale
X 1 , X 2 ,..., X i ,..., X n variabili aleatorie normali indipenden ti :
E  X i   i
V  X i    i2 1  i  n 
Y  X 1  ....  X n
n
Y   i
i 1
n
N 0 ;1
 i
2
i 1
74
Chi Quadrato
75
T di Student
76
F di Fisher Snedecor
77
78
79
La Stima
80
81
82
83
84
85
Verifica delle Ipotesi
86
87
88
89
90
91
92
93
94