Alessandro Benedetti UniCAM-SSIS-FIM.08/1 Appunti di statistica descrittiva – Versione provvisoria (v. allegato foglio Excel LDS8_DISCRCONT.xls) Dal discreto al continuo Definizioni frequenza _ relativa ampiezza _ della _ classe freq_relativa = area di un rettangolo di larghezza Dx = densità di frequenza ° Dx densità _ di _ frequenza = prob_teorica = areola di un rettangolo di larghezza dx = densità di probabilità f(x) ° dx Generazione di un numero casuale Si desidera generare un numero casuale compreso tra 0,00 e 0,99 e calcolare la probabilità che p. es. sia estratto 0,67. 1. I numeri compresi tra i numeri con due cifre decimali 0,00 e 0,99 sono 100; quindi la probabilità che sia estratto 0,67 è 1/100 ossia 0,01 2. I numeri reali compresi tra 0,00 e 0,99 sono infiniti; quindi la probabilità di estrarre esattamente 0,67 è nulla 3. La probabilità di estrarre un numero X tale che 0,665000… < X < 0,675000… è data dal calcolo dell’area di base dx = 0,01 moltiplicata per la funzione di densità di probabilità f(x); poiché tutti i valori sono equiprobabili, f(x) = 1, e quindi la probabilità risulta f(x) ° dx = 1° 0,01 = 0,01 Generazione di una distribuzione normale di numeri casuali Ripetere il procedimento con lo scopo di ottenere una distribuzione normale. Allo scopo, per generare numeri casuali da una distribuzione normale si può usare la formula: INV.NORM(probabilità;media;dev_standard) che restituisce l'inversa della distribuzione normale cumulativa per la media e la deviazione standard specificate. probabilità è la probabilità corrispondente alla distribuzione normale. media è la media aritmetica della distribuzione. dev_standard è la deviazione standard della distribuzione. Quindi, sostituendo al parametro probabilità la funzione Casuale() si otterrà un numero casuale tratto da una distribuzione normale di date media e deviazione standard. Se la media è 0 e la deviazione standard è 1, allora si può usare direttamente la funzione INV.NORM.ST(probabilità) probabilità è la probabilità corrispondente alla distribuzione normale. Un altro modo di produrre numeri casuali tratti da una data distribuzione è l’uso di Strumenti | Analisi dati … | Generazione di un numero casuale. 1 Alessandro Benedetti UniCAM-SSIS-FIM.08/1 Distribuzione dei numeri casuali generati dalle funzioni precedenti Analisi della distribuzione di 500 numeri generati dalle funzioni Excel precedenti. Generare 500 numeri con l’uso di Riempimento | Serie nella zona A11:A510 (v. sk. LDS7_DISTPOISSON) B11: =CASUALE() C11: =INV.NORM(CASUALE();0;1) D11: =INV.NORM.ST(CASUALE()) Marcare da B11 a D11; posizionarsi sulla maniglia di riempimento (il cursore assume la forma di croce) e fare doppio clic. Excel riempie la zona B11:D510. Per effettuare un altro calcolo di numeri casuali premere il tasto F9. Nella zona E11:E510 utilizzeremo Strumenti | Analisi dati … | Generazione di un numero casuale. Predisporre la finestra che si presenta in modo simile alla fig. a fianco. Passeranno alcuni secondi prima che Excel produca i suoi risultati. Notare anche che alla pressione del tasto F9 i valori della colonna E non vengono ricalcolati. Ora si possono calcolare le frequenze per raggruppamenti dei dati in classi: 40; 20;10; 5 con la funzione =FREQUENZA (matrice_dati; matrice_classi) Traccia per raggruppamenti in 40 classi: La distribuzione uniforme generata da CASUALE() ha come intervallo 0÷1. La suddivisione dell’intervallo 0÷1 in 40 parti può essere fatta con l’uso di Riempimento | Serie ponendo in F11 il valore 0, e riempiendo per colonna con un incremento di 1/40 = 0,025 fino al valore terminale di 1. Per le diverse formule usate per la distribuzione normale standard, si può assumere come intervallo –4÷+4 e quindi l’incremento vale 0,2. Usare come casella di partenza G11. Per calcolare le frequenze della distribuzione uniforme, marcare la zona H11:H51, scrivere su H11 la formula =FREQUENZA(B11:B510;F11:F51) e premere contemporaneamente i tasti Ctrl+Shift+Invio. Per calcolare le frequenze delle tre colonne della distribuzione normale standard, marcare dapprima la zona I11:I51 e scrivere la formula =FREQUENZA(C11:C510;$G$11:$G$51); premere contemporaneamente i tasti Ctrl+Shift+Invio e trascinare la zona marcata nelle due colonne a fianco. Costruire gli istogrammi relativi e commentarli premendo ripetutamente il tasto F9; (mentre la distribuzione relativa alla colonna B approssima una distribuzione uniforme, le altre C, D, E approssimano una campana di Gauss; l’approssimazione è più stabile per i raggruppamenti in classi più piccole). 2