Appunti di statistica descrittiva – Versione provvisoria

annuncio pubblicitario
Alessandro Benedetti
UniCAM-SSIS-FIM.08/1
Appunti di statistica descrittiva – Versione provvisoria
(v. allegato foglio Excel LDS8_DISCRCONT.xls)
Dal discreto al continuo
Definizioni
frequenza _ relativa
ampiezza _ della _ classe
freq_relativa = area di un rettangolo di larghezza Dx = densità di frequenza ° Dx
densità _ di _ frequenza =
prob_teorica = areola di un rettangolo di larghezza dx = densità di probabilità f(x) ° dx
Generazione di un numero casuale
Si desidera generare un numero casuale compreso tra 0,00 e 0,99 e calcolare la probabilità che p. es.
sia estratto 0,67.
1. I numeri compresi tra i numeri con due cifre decimali 0,00 e 0,99 sono 100; quindi la probabilità
che sia estratto 0,67 è 1/100 ossia 0,01
2. I numeri reali compresi tra 0,00 e 0,99 sono infiniti; quindi la probabilità di estrarre esattamente
0,67 è nulla
3. La probabilità di estrarre un numero X tale che 0,665000… < X < 0,675000… è data dal calcolo
dell’area di base dx = 0,01 moltiplicata per la funzione di densità di probabilità f(x); poiché tutti
i valori sono equiprobabili, f(x) = 1, e quindi la probabilità risulta f(x) ° dx = 1° 0,01 = 0,01
Generazione di una distribuzione normale di numeri casuali
Ripetere il procedimento con lo scopo di ottenere una distribuzione normale.
Allo scopo, per generare numeri casuali da una distribuzione normale si può usare la formula:
INV.NORM(probabilità;media;dev_standard)
che restituisce l'inversa della distribuzione normale cumulativa per la media e la deviazione
standard specificate.
probabilità è la probabilità corrispondente alla distribuzione normale.
media è la media aritmetica della distribuzione.
dev_standard è la deviazione standard della distribuzione.
Quindi, sostituendo al parametro probabilità la funzione Casuale() si otterrà un numero casuale
tratto da una distribuzione normale di date media e deviazione standard.
Se la media è 0 e la deviazione standard è 1, allora si può usare direttamente la funzione
INV.NORM.ST(probabilità)
probabilità è la probabilità corrispondente alla distribuzione normale.
Un altro modo di produrre numeri casuali tratti da una data distribuzione è l’uso di Strumenti | Analisi
dati … | Generazione di un numero casuale.
1
Alessandro Benedetti
UniCAM-SSIS-FIM.08/1
Distribuzione dei numeri casuali generati dalle funzioni precedenti
Analisi della distribuzione di 500 numeri generati dalle funzioni Excel precedenti.
Generare 500 numeri con l’uso di Riempimento | Serie nella zona A11:A510 (v. sk.
LDS7_DISTPOISSON)
B11: =CASUALE()
C11: =INV.NORM(CASUALE();0;1)
D11: =INV.NORM.ST(CASUALE())
Marcare da B11 a D11; posizionarsi sulla maniglia di riempimento (il cursore assume la forma di
croce) e fare doppio clic. Excel riempie la zona B11:D510.
Per effettuare un altro calcolo di numeri casuali premere il tasto F9.
Nella zona E11:E510 utilizzeremo
Strumenti | Analisi dati … |
Generazione di un numero casuale.
Predisporre la finestra che si
presenta in modo simile alla fig. a
fianco.
Passeranno alcuni secondi prima
che Excel produca i suoi risultati.
Notare anche che alla pressione
del tasto F9 i valori della colonna
E non vengono ricalcolati.
Ora si possono calcolare le
frequenze per raggruppamenti dei
dati in classi: 40; 20;10; 5 con la
funzione
=FREQUENZA (matrice_dati;
matrice_classi)
Traccia per raggruppamenti in 40
classi:
La distribuzione uniforme
generata da CASUALE() ha come intervallo 0÷1. La suddivisione dell’intervallo 0÷1 in 40 parti
può essere fatta con l’uso di Riempimento | Serie ponendo in F11 il valore 0, e riempiendo per
colonna con un incremento di 1/40 = 0,025 fino al valore terminale di 1. Per le diverse formule
usate per la distribuzione normale standard, si può assumere come intervallo –4÷+4 e quindi
l’incremento vale 0,2. Usare come casella di partenza G11.
Per calcolare le frequenze della distribuzione uniforme, marcare la zona H11:H51, scrivere su H11
la formula =FREQUENZA(B11:B510;F11:F51) e premere contemporaneamente i tasti
Ctrl+Shift+Invio.
Per calcolare le frequenze delle tre colonne della distribuzione normale standard, marcare dapprima
la zona I11:I51 e scrivere la formula =FREQUENZA(C11:C510;$G$11:$G$51); premere
contemporaneamente i tasti Ctrl+Shift+Invio e trascinare la zona marcata nelle due colonne a fianco.
Costruire gli istogrammi relativi e commentarli premendo ripetutamente il tasto F9; (mentre la
distribuzione relativa alla colonna B approssima una distribuzione uniforme, le altre C, D, E
approssimano una campana di Gauss; l’approssimazione è più stabile per i raggruppamenti in classi
più piccole).
2
Scarica