Corso di Statistica Aziendale 1 Bibliografia Lucidi (materiale reperibile via Internet) • • • • • • D’Ambra – Università di Napoli Sarnacchiaro – Università del Sannio Simonetti – Università del Sannio Giommi – Università di Firenze Davino – Università di Macerata Morale – Università di Milano 2 Statistica aziendale: insieme di metodi statistici utilizzabili per l’organizzazione e l’analisi dei dati aziendali di supporto a quelle decisioni manageriali prese per lo più in condizioni di incertezza. Sfera Micro-Economica Statistica Aziendale Sfera Macro-Economica Statistica Economica Affermazione troppo generica • Statistica metodologica • Statistica applicata • Enfasi sul metodo • Prescinde dal contesto applicativo Scelta e interpretazione del metodo all’interno di un contesto applicativo 3 Statistica aziendale per la ricerca scientifica e per l’azienda Nella ricerca scientifica Per l’azienda Comunicazione risultati a esperti e enfasi sugli aspetti metodologici Verifica empirica di ipotesi di lavoro Cura della qualità dei dati Generalizzazione dei risultati Comunicazione risultati a non esperti e non interessati al metodo Rapidità di analisi per esigenze di tempestività Frequente impiego di dati statistici secondari o amministrativi Interesse su ordine di grandezza dei risultati 4 Nuovi approcci, orientamenti e necessità del settore industriale •Globalizzazione più ampio il mercato di riferimento e quindi la competizione è più ampia •Orientamento al cliente focalizzazione sulla qualità a tutti i livelli (stakeholder model) •Orientamento al processo focalizzazione sulle attività chiave e ricorso all’outsourcing, reingenerizzazione del processo (necessità di operazioni di benchmarking) •Elevata produttività rapporto output/input 5 La performance di un sistema aziendale • Controllo di gestione: tecniche di budget, migliorare efficienza e efficacia dei processi gestionali, monitorare la capacità di creare valore economico. • Efficacia quanto realizzato/quanto atteso • Efficienza utilizzazione ottimale delle risorse • Qualità e customer satisfaction rispondenza alle esigenze e/o a quanto dichiarato • Sistema di gestione delle risorse umane: valutazione efficacia dei corsi formazione, prestazioni, motivazioni, piani retributivi e di carriera…. • Campo di attività dell’azienda: strategie, posizione competitiva, ecc. 6 Informazione ed elaborazione statistica L’informazione è una risorsa essenziale per il decisore d’azienda La bontà di una decisione dipende, in larga misura, dalla Quantità e dalla Qualità dell’informazione disponibile Definizione di Informazione Dato, trasformato in forma utile per il ricevente, che possiede un valore reale o potenziale sulle decisioni attuali o future 7 Il dato non costituisce di per sé un’informazione, ma richiede un’elaborazione. Connessione Stretta tra Statistica e Informazione Il metodo Statistico consente di: •Generare informazione, elaborando dati grezzi inizialmente privi di valori informativi •Valorizzare l’informazione esistente mediante indici sintetici •Leggere e impiegare in modo razionale le informazioni probabilistiche ottenute •Generare informazioni prospettiche (previsioni, modelli di simulazione) 8 Ruolo della statistica • Analisi delle relazioni di causa-effetto fra variabili aziendali possibilmente ricondotte a schemi contabili • Descrizione e valutazione delle condizioni di mercato in cui l’azienda opera • Previsione dell’andamento del mercato e delle vendite dell’azienda • Valutazione dei risultati economici raggiunti in termini di performance • Messa a punto e validazione delle strategie di marketing • … 9 Esempio. Schema di struttura aziendale: Area, Attività e Metodi Statistici Area Attività Metodi Statistici Produzione Previsioni della Produzione Regressioni, Analisi delle Serie Storiche Acquisti Pianificazione Campionamento per Accettazione (manodopera, acquisti) Controllo di qualità Carte di Controllo, Studio di Process Capability Contabilità e Finanza Formulazione del Bilancio Controllo di gestione Metodi di Campionamento Servizi alla Produzione Modelli Finanziari Analisi dei dati Disegni sperimentali Analisi delle Serie Storiche e Studio di Regressione Metodi Fattoriali Marketing e Vendite Previsioni delle Vendite Ricerche di mercato Misurazione della Customer Satisfaction Analisi delle Serie Storiche Metodi Fattoriali, Cluster Analisys SERVQUAL, SERVPERF, QUALITOMETRO Ricerca e Sviluppo Analisi di dati sperimentali Simulazione Metodi Fattoriali, Analisi in Componenti Principali Metodo Montecarlo 10 Total quality management E’ rivolto al miglioramento della qualità (rispondenza alle specifiche) di un prodotto servizio e al monitoraggio del funzionamento di tutta l’attività aziendale e della customer satisfaction Total: perché si interessa delle modalità di svolgimento di tutti i processi aziendali Fasi di azione Progettazione dei prodotti/servizi Individuazione dei problemi Individuazione dei possibili miglioramenti Monitoraggio continuo 11 Certificazione della qualità: normativa ISO (norma UNI_ISO 9004-4) “un’organizzazione dovrebbe sviluppare un sistema di misurazione che si adatti alla natura delle proprie attività … per identificare e diagnosticare le opportunità di miglioramento e per quantificare i risultati delle attività di miglioramento della qualità” “quando possibile le decisioni circa i miglioramenti della qualità dovrebbero essere basate su dati numerici. Le decisioni circa differenze, andamenti e cambiamenti nei dati numerici dovrebbero essere basate su appropriate interpretazioni statistiche” 12 Certificazione della qualità: normativa VISION 2000 (la nuova edizione delle norme ISO) “…. una delle principali implicazioni della Vision 2000 sarà la crescente importanza da attribuirsi alla raccolta e all’analisi statistica dei dati quantitativi relativi allo svolgimento dei processi gestionali aziendali ….” (De Qualitate, 2001) 13 La misurazione dei fenomeni aziendali Poiché la statistica aziendale è di tipo applicato, essa ha a che fare spesso con la misurazione di costrutti o concetti es. efficienza, redditività, fedeltà alla marca, etc. Ai fini della misurazione occorre: 1) definizione del contenuto del concetto 2) definizione operativa 14 Definizione del contenuto e definizione operativa Definizione di contenuto • Collocazione del concetto all’interno di una teoria, e sua relazione con altri concetti Definizione operativa Modalità di misurazione del concetto attraverso la definizione di eventi rilevabili statisticamente, e la predisposizione dello strumento di rilevazione (es. questionario) 15 Esempio: fedeltà alla marca B Definizione di contenuto: atteggiamento di preferenza e risposta comportamentale del consumatore verso la marca B, in un dato intervallo di tempo e per una data categoria di prodotti Definizione operativa: si decide di rilevare gli acquisti di marca B della categoria di prodotti definita, in un intervallo di tempo (es. 1 mese), fatti da un panel di individui Si misura davvero la fedeltà di marca ? 16 Supponiamo che un individuo abbia effettuato 5 acquisti, e tutti della marca B; è un cliente fedele? B B B B B |_____|__|__________|_____|___|___| NON è detto, perché il pattern può dipendere anche da: 1. Non disponibilità di prodotti sostitutivi 2. Indifferenza alla marca 3. Prezzo basso La definizione operativa non ha tenuto conto del contenuto del concetto 17 Errori di misurazione Componente teorica o metodologica Errore nella definizione e/o individuazione del carattere o attributo da osservare Errore specifico Introdotto dall’osservatore o dallo strumento nella fase di misurazione o osservazione La qualità del dato deve essere valutata rispetto a questi due elementi 18 Qualità del dato Qualità (garanzie) di progettazione Rilevanza teorica (adeguatezza alle necessità informative) effettiva (quanta informazione viene effettivamente usata) Tempestività, puntualità Trasparenza Confrontabilità Tutela riservatezza Rilevanza teorica: componente teorica o metodologica Qualità (garanzie) di tolleranza Accuratezza: grado di corrispondenza fra la stima ottenuta dall'indagine e il vero (ma ignoto) valore Errori campionari Errori non campionari - Copertura - Mancate risposte - Totali - Parziali - Misurazione 19 Errori variabili bassi Assenza errori sistematici Errori variabili bassi Presenza errori sistematici Errori variabili alti Assenza errori sistematici Errori variabili alti Presenza errori sistematici 20 Le Fonti dei dati Dati Primari Informazioni che devono essere raccolte per la prima volta mediante: 1) Osservazioni ; 2) Esperimenti; 3) Questionari (metodi appositamente predisposti per risolvere un dato problema) Dati Secondari Informazioni già esistenti, utili per scopi scientifici ed economici: Disponibili Internamente o Esternamente Pregi Difetti possibili Economicità Rilevanza (effettiva idoneità) Velocità d’acquisizione Assenza di controllo nella fase di progettazione della rilevazione e di raccolta delle informazioni Tutela della privacy Accuratezza (capacità di descrivere il fenomeno) 21 Informazioni aziendali su: Dati Secondari •Produzione Interni •Costi •Vendite •Distribuzione Statistiche e rapporti pubblicati da: Esterni •Enti pubblici •Associazioni commerciali di categoria •Altre organizzazioni 22 Tipi di analisi e problemi decisionali A fini classificatori, si tende a distinguere le seguenti tipologie di analisi (Kinnear e Taylor, 1996): •analisi o ricerche di tipo esplorativo •analisi o ricerche di tipo conclusivo, distinte in ricerche descrittive e causali •analisi o ricerche di monitoraggio e di valutazione. 23 Ricerca descrittiva Scopo: descrivere l’ammontare, la composizione delle grandezze relative ad un certo fenomeno • • • • Quota di mercato posseduta e dei concorrenti Qualità del prodotto Nr. di reclami dei clienti Associazioni fra variabili (no causa-effetto) Struttura dei dati: cross section 60% 50% 40% 30% 20% 10% 0% Frequente Talvolta Mai 24 Ricerca esplicativa Vengono formulate precise ipotesi sui legami di causa-effetto di alcuni fenomeni Scopi: - individuare le variabili che influenzano un dato fenomeno che interessa spiegare; - individuare la forma funzionale di tale legame (es. lineare, non lineare, ecc.) Struttura dei dati: cross section, sperimentali 25 Il monitoraggio E’ presente la variabile tempo rispetto alla quale si controlla l’andamento di un determinato fenomeno Struttura dei dati: - serie storiche: dati di intensità o frequenza ordinati rispetto al tempo - dati longitudinali o panel: campione fisso di unità sul quale si eseguono misure ripetute delle medesime variabili 40% 35% 30% 25% 20% 15% 10% 5% 0% Frequente Talvolta Mai 26 N.B. Differenza fra indagini cross section ripetute e indagini panel CROSS SECTION RIPETUTE Nr Acquirenti MARCA A MARCA B MARCA A MARCA B Totale Tempo 2 100 400 100 400 Tempo 2 DATI PANEL Tempo 1 Tempo 1 MARCA A 100 100 MARCA B 100 300 400 TOTALE 100 400 500 27 Le principali Fonti di dati in Italia Fonti Istituzionali •Ministero dell’Economia e delle Finanze: Relazione previsionale e programmatica •Banca d’Italia Fonti Statistiche Ufficiali (ISTAT) •Annuario Statistico Italiano •Annuario di statistiche industriali •Bollettino mensile di Statistica Enti per la ricerca economica e sociale •ISAE •CENSIS (Centro Studi Investimenti Sociali): Rapporto sulla situazione sociale del paese •INDIS (Istituto nazionale distribuzione e servizi) Associazioni di Categoria Camere di Commercio Istituti di ricerca Privati Annuari (Kompass, Seat) Quotidiani e Riviste (ilsole24ore, mondo economico) 28 DISTRIBUZIONI SPERIMENTALI , RAPPRESENTAZIONI 1. Terminologia popolazione, individui, variabile, censimento, sondaggio, campione Popolazione: tutto l’insieme degli elementi oggetto di studio Individui: gli elementi di una popolazione ESEMPI: I libri di una biblioteca Gli studenti di una classe I consumi mensili di elettricità Ciascun individuo è descritto da un insieme di caratteristiche chiamate caratteri o variabili Continue •Variabili Quantitative •Variabili Qualitative Discrete Nominali Ordinali Osservazione Con l’aiuto di una codifica una variabile quantitativa può essere arbitrariamente trasformata in qualitativa e viceversa 29 Censimento: lo studio di tutti gli individui di una popolazione finita Sondaggio: lo studio di una parte della popolazione Campione: la parte studiata E e1 , e2 ,...., ei ,...., en X : x1 , x2 ,...., xi ,...., xn Come selezionare gli individui di un campione? Perché i campioni? 1. Risorse limitate 2. Rarità 3. Prove distruttive 4. Il campionamento può essere più esatto 30 Sondaggio elementare Si tratta di un sondaggio nel quale gli individui sono tirati a sorte dall’insieme degli individui della popolazione L’utilizzo delle tavole di numeri casuali permette di effettuare più facilmente questa operazione Costruzione delle tavole •Dati •Sperimentazione fisica •Generatori di numerosità pseudo-aleatori •Esperienza completamente aleatoria Come si utilizza una tavola Si vogliono estrarre 100 individui da una popolazione comprendente 1000 individui. Si numerano questi ultimi da 000 a 999. Poi da una tabella di numerosità casuale si prendono i primi 100 numeri di 3 cifre eliminando le ripetizioni 31 2. Rappresentazione di una serie statistica sottoforma di tabelle e grafici X variabile x1 , x2 ,..., xi ,..., xn serie statistica 2.1 Le tabelle statistiche a) Variabili discrete x1 , x2 ,..., xi ,..., xn i valori distinti k n (1 i h) ni l' effettivo di xi (o frequenza assoluta) ni fi frequenza n k ni n i 1 xi ni f i Distribuzione sperimentale k fi 1 xi i 1 32 b) Variabili continue o assimilate X continua •Un grande numero di righe per la tabella degli effettivi •Dei numeri di effettivi di scarsa ampiezza Rimedio: raggruppare le osservazioni in classi k classi di estremi: c0, c1, …., ck ci 1; ci ni fi Ni Fi Ci ni effettivi della classe ni fi frequenza della classe n N i n1 .... ni effettivi cumulati Fi f1 .... f i frequenze cumulate 33 2.2 Rappresentazioni grafiche Variabili qualitative: •Diagramma a barre •Diagramma circolare •Diagramma a blocchi Variabili discrete: •Diagramma a canne d’organo Variabili continue: •Istogrammi •Poligoni 34 3. Indici di sintesi 3.1 Caratteristiche della tendenza centrale x La media : 1n x xi n i 1 La mediana: Me h x f i ci i 1 a) se n 2m 1 xm 1 Me ( xm xm 1 ) / 2 se n 2m b) ci 1; ci classe mediana Fi 1 0,5 Fi 0,5 0,5 Fi 1 M e ci 1 ai fi dove ai ci ci 1 ampiezza della classe 35 I quantili: X (0 1) X min prop. X X α X max prop. 1 - X X α X 0, 25 Q1 1o quartile X 0,5 Q2 2o quartile X 0, 75 Q3 3 quartile o X min 25% Q1 Q2 25% 25% 0,1 ; 0,2 ;....; 0,9 decili 0,01 ; 0,02 ;....; 0,99 centili 3.2 Caratteristiche di dispersione Il Range: La varianza: R X max X min 1n 2 S ( xi x ) 2 n i 1 1 n 2 2 ( xi x ) s n 1 i 1 L’intervallo interquartile: Lo scarto: Q3 X max 25% Q3 Q1 S S2 s s2 36 Perché La statistica Inferenziale 37 Filosofia della scienza Secondo Aristotele, vi sono due vie attraverso le quali riusciamo a formare le nostre conoscenze: (1) la deduzione (2) l’induzione. 38 Problema dell’induzione Tutte le inferenze tratte dall’esperienza suppongono, come loro fondamento, che il futuro rassomiglierà al passato e che poteri simili saranno uniti a simili qualità sensibili. Se ci fosse qualche sospetto che il corso della natura potesse cambiare e che il passato non servisse di regola per il futuro, ogni esperienza diverrebbe inutile e non potrebbe dare origine ad alcuna inferenza o conclusione. 39 Teoria della Falsificazione Popper afferma che il metodo che consente agli scienziati di trovare le teorie vere è: falsificare le teorie false sulla base delle evidenze empiriche. 40 Falsificazionismo e inferenza statistica L’approccio “falsificazionista” di Popper viene usato nella statistica per formulare delle inferenze che, sulla base delle informazioni fornite da un campione di osservazioni, ci consentono di descrivere le caratteristiche della popolazione da cui quel campione è stato tratto. 41 Soluzione pragmatica al problema dell’induzione Ovviamente, si può cercare di superare questo problema cercando di mostrare che non è vero che le inferenze induttive siano ingiustificate. La soluzione moderna a questo problema è la concezione probabilistica dell’induzione. Quando un certo carattere ricorre in una certa proporzione di osservazioni, si può assumere che questa proporzione valga per tutti gli altri esempi del caso, salvo prova contraria. 42 Esempio 1 Il responsabile controllo qualità di un’azienda che produce bibite, sospetta che il macchinario di riempimento delle lattine, sia fuori taratura, immette cioè maggior prodotto di quanto riportato sulla etichetta. 43 Esempio 2 Il proprietario di un’azienda vinicola, sospetta che alcune bottiglie siano state chiuse male e che quindi il sapore del vino di queste bottiglie sia alterato…. 44 Alcune definizioni Eventi incompatibili Dati due eventi A e B, sono detti incompatibili se il verificarsi dell’uno esclude l’altro Lancio di una moneta Evento A: Testa Evento B: Croce La probabilità del verificarsi dell’uno O dell’altro evento è data dalla somma delle probabilità dei singoli eventi: P(A U B)= P(A) + P(B) (principio delle probabilità totali) La probabilità del verificarsi dell’uno E dell’altro evento: P(A B)= P(A) P(B)=0 E’ possibile generalizzare questi risultati ad n eventi 45 Eventi Incompatibili P(A) P(B) Eventi Compatibili P(A) P(B) Si estrae una carta da un mazzo francese (52 carte, 4 semi) Evento A=carta di cuori Evento B= sette P(AUB)=P(A)+P(B) 13/52 4/52 Conteggiamo l’evento comune due volte Quindi per eventi compatibili P(A U B)=P(A)+P(B)-P(A B) P(Cuori o Sette)= P(Cuori)+P(Sette)-P(Sette di Cuori)= =4/13 1/4 + 1/13 1/52 46 ESERCIZIO Prendendo un mazzo di carte francesi ben mescolato e pescando a caso da questo, si valutino le seguenti probabilità: a) di ottenere l’asso di quadri; b) di ottenere un asso; c) di ottenere un asso come seconda carta, ammesso di avere già pescato una figura (senza reintrodurla nel mazzo); d) di ottenere tre figure (sempre senza reimmissione delle carte estratte nel mazzo). 47 Probabilità condizionata Dati due eventi A e B appartenenti allo spazio campionario , compatibili tra di loro. La probabilità che l’evento A si verifichi, una volta verificatosi l’evento B, o in altri termini , la probabilità condizionata di A dato B, è pari a : P( A B) P( A | B) P( B) B P(AB) A 48 Esempio Si lanci una coppia di dadi. Se la somma è 6 (evento B), si calcoli la probabilità che uno dei due dadi abbia dato l’esito 2. B somma 6 1,5 , 2, 4 , 3,3 , 4, 2 , 5,1 A= un 2 su un dado (A B)= 2, 4 , 4, 2 Poiche lo spazio campionario è costituito da 36 elementi P(A B)=2/36 P(B)=5/36 2 P( A B) 2 36 P( A | B) 5 P( B) 5 36 49 Nel caso in cui siano indipendenti (e non mutualmente escludentesi) P( A | B) P( A) Poiché P( A B) P( A) P ( B ) In modo analogo P( A | B) P( A) 50 Differente utilizzo delle probabilità condizionate P( A B) P( A | B) P( B) P( A B) P( B) P( A | B) P( A) P( B | A) 51 Diagrammi ad Albero Uno strumento efficace e di facile costruzione per calcolare le probabilità di ogni evento è rappresentato dal diagramma ad albero. Esempio Una moneta,modificata in modo che P(T)=2/3 e P(C)=1/3, Viene lanciata. Se si presenta croce, viene scelto a caso un numero tra 1 e 5, se si presenta testa, viene scelto un numero a caso tra 1 e 9. Si determini la probabilità che venga scelto un numero pari. 52 53 Teorema di Bayes Siano H1, H2 ,…,Hn una partizione dello spazio campionario , cioè che gli eventi Ai siano incompatibili e che la loro unione sia . La probabilità condizionata che si verifichi l’evento Hi dato l’evento A è pari a P( H i ) P( A | H i ) P( H i | A) P ( H1 ) P ( A | H 1 ) P ( H n ) P ( A | H n ) P(Hi|A) probabilità a posteriori P(Hi) probabilità a priori P(A|Hi) probabilità probativa 54 Esempio Dei ragazzi fanno uno scherzo ad un amico, accompagnandolo ad una festa a tema dove tutti, uomini e donne sono vestiti da donne e sono indistinguibili a vista. Alla festa partecipa il 20% di donne Il 40% delle donne ed il 70% degli uomini sono favorevoli ad una love story. Il ragazzo mentre balla con un partecipante alla festa (uomo/donna??), lo invita a bere qualcosa e si appartano nel privé del locale. All’uscita della festa, gli amici gli raccontano dello scherzo. Il ragazzo, preoccupato si rivolge ad uno statistico e gli chiede: “ Qual è la probabilità che, dato che abbia avuto una relazione con questa persona, sia donna?” 55 VARIABILI ALEATORIE REALI Nozioni generali: variabile aleatoria, legge di probabilità, funzione di ripartizione, funzione di densità di probabilità, speranza matematica, varianza, scarto, etc. 1. Introduzione Esempio: gioco di “testa o croce” in tre tiri in cui il giocatore riceve 1€ per ogni croce. CCC , CCT ,..., TTT 8 risultati possibili X " variabile aleatoria" numero di croci Variabile: perché il valore varia da un risultato all’altro Aleatoria: perché il risultato stesso dipende dal caso X 0 X 1 X 2 X 3 X 0,1,2,3 X 0 TTT PX 0 PTTT 1 8 X 1 CTT , TCT , TTC PX 1 3 8 X 2 CCT , CTC , TCC PX 2 3 8 X 3 CCC PX 3 1 8 Legge di probabilità di X: Val. X Prob. 0 1 2 3 1/8 3/8 3/8 1/8 Distribuzione di probabilità di X X i Pi PX X i 56 f X i , P X i , PX X i , Pi , f x xi Notazioni: Esercizio PX 1 1 2 PX 1 1 2 PX 0 7 8 PX 4 0 PX 4 1 P1 X 2 6 8 P2 X 4 1 2 Generalizzazione x X x evento PX x numero reale tra 0 e 1 In questo modo si può definire una funzione: Esempio: F x PX x F x Funzione di ripartizione della variabile aleatoria X=v.a. nr. di croci F x PX x 0 1 8 F x 4 8 7 8 se x0 se 0 x 1 se 1 x 2 se 2 x3 57 Caso continuo X variabile aleatoria •V.a. discreta (es. X v.a. numero di croci) •V.a. continua L’insieme dei valori di X è un intervallo di R 2. Definizione di una variabile aleatoria “E” – prova Ω – l’insieme dei risultati possibili A – l’insieme degli eventi P – legge di probabilità “E” è modellizzata attraverso (Ω, A, P) 2.1 Ω finito Ciascuna funzione reale definita sull’insieme degli eventi elementari è chiamata variabile aleatoria Esempio: “E”= si lancia una moneta C , T w1 , w2 A P X w1 0 X : w X w X w2 1 P : pw1 1 2 pw2 1 2 X v.a. numero di croci 58 Legge di probabilità di una variabile aleatoria (Ω, A, P) spazio di probabilità finito X : w X w X w1 ,...., wn X w1 ,...., X wn X wi xi 1 i n x1 , x2 ,....., xn i valori distinti presi da X Ai w / X w xi 1 i k Ai X xi Ai A PX xi P Ai 1 i k La funzione Px definita su x1 ,...., xk attraverso : Px xi PX xi è chiamata distribuzi one di probabilit à (o legge) della variabile aleatoria X pi 0 k i 1 1 i k pi 1 59 60 Generalizzazione Si può generalizzare la nozione dell’evento X xi e definire: a X b X prende i suoi valori nell' intervallo a, b a, b ab a X b w / a X w b Pa X b Pw / a X w b 61 Proprietà di F(x): F x PX x x 1) F(x) è una funzione non decrescente x2 x1 2) x lim x F x2 F x1 0 F x 1 F x 0 lim x F x 1 3) F(x) è continua a destra 4) P a X Osservazione: b F b F a ab Per le variabili aleatorie discrete F(x) è una funzione a scalini 62 63 Sintesi numeriche: E X x p x dx 2 V X V X x 2 p x dx E x 2 Proprietà di E(X), V(X): 1) Se X=c allora E(X)=c 2) V(X)=0 X v.a. E X ,V X esistono E X E X V X 2V X 3) X 1 , X2 E X i ,V X i esistono i 1, 2 E X1 X 2 E X1 E X 2 V X1 X 2 V X1 V X 2 indipendenti 64 Legami tra X1 e X2: X1, X 2 E X i ,V X i esistono i 1, 2 cov X 1 , X 2 E X 1 E X 1 X 2 E X 2 rX X 1 2 cov X 1 , X 2 X X 1 2 65 Distribuzione Uniforme Discreta e Continua 66 67 68 69 Distribuzione Normale 70 Valori importanti: X N ; P X 0,6826 P 2 X 2 0,9546 P 3 X 3 0,9973 P 1,64 X 1,64 0,9 P 1,96 X 1,96 0,95 P 3,09 X 3,09 0,998 71 Normale Standardizzata 72 Proprietà: 1) Z N 0;1 c c 0 Pz c Pz c 1 Pz c P c z c 2 Pz c 1 73 2) Siano X 1 , X 2 ,..., X i ,..., X n variabili aleatorie normali indipenden ti : E X i i V X i i2 1 i n Y N ; Y X 1 .... X n n i i 1 dove 2 12 22 .... n2 Teorema del Limite Centrale X 1 , X 2 ,..., X i ,..., X n variabili aleatorie normali indipenden ti : E X i i V X i i2 1 i n Y X 1 .... X n n Y i i 1 n N 0 ;1 i 2 i 1 74 Chi Quadrato 75 T di Student 76 F di Fisher Snedecor 77 78 79 La Stima 80 81 82 83 84 85 Verifica delle Ipotesi 86 87 88 89 90 91 92 93 94