la statistica

annuncio pubblicitario
MAΘHMA
scienza conoscenza
2Acls
statistica
e
probabilità
RIVISTA III LICEO DA VIGO
INDICE
LA STATISTICA
RAPPRESENTAZIONE
GRAFICA DEI DAI E LA
MEDIA
LA MEDIANA LA MODA E LO
SCARTO
GLI EVENTI E LA
PROBABILITÀ
LA PROBABILITÀ
CONDIZIONATA
,
STATISTICA
INDICE
•
•
•
•
•
•
•
•
•
•
•
Introduzione alla statistica
Storia della statistica
Applicazioni
Unità e popolazione
Caratteri e modalità
Statistica distributiva e inferenziale
Distribuzioni di frequenza
Distribuzione cumulata
Dalle frequenze relative alle frequenze
Tabelle a doppia entrata
Serie statistiche
Cecilia B.
Glori P.
Rosita T.
la statistica
e’ la scienza che si occupa della raccolta e
dell’elaborazione dei dati relativi ad un
certo gruppo di persone o di oggetti per
trarne conclusioni o fare previsioni.
La statistica è utilizzata da organismi statali
anche da molti enti privati come organi di
informazione, aziende, partiti politici, ecc…
La statistica, in origine, si occupava di
rispondere a quesiti che riguardano il governo
e la vita di uno stato (es. quante persone
abitano la Toscana?).
Il termine statistica deriva proprio dalla parola
“stato”.
Cenni storici
La misura quantitativa dei fenomeni sociali ha
una storia antica.
I n
Anche l'immenso impero cinese ha sempre
curato i censimenti.
Non si hanno invece notizie di censimenti nella
Grecia antica, ma venivano registrati ogni
anno i nati dell'anno precedente.
La rilevazione dei cittadini e dei loro beni ebbe
grande importanza nella Roma antica. Il primo
censimento fu ordinato da Servio Tullio e si
ebbero poi censimenti con periodicità
quinquennale dalla fine del VI secolo a.C.,
decennale a partire da Augusto.
Applicazioni della statistica
La statistica è utile ovunque sia necessaria una
delle seguenti condizioni:
procedere ad una raccolta
ordinata, ad una stesura
comprensibile e ad una
elaborazione dei dati più
svariati;
scoprire eventuali leggi che regolano i dati
spesso solo in apparenza disordinati ed
operarne il confronto;
Fasi di un’indagine statistica
• -rilevamento dei dati
• -trascrizione dei dati raccolti
• -elaborazione e interpretazione dei dati.
Come si rilevano i dati?
I metodi variano in relazione all’oggetto
dell’immagine:
-intervista diretta
-intervista indiretta mediante questionari
anonimi.
-misurazioni strumentali
una volta raccolti i questionari compilati
Egitto
si rilevava l'ammontare della popolazione già
ai tempi della prima dinastia.
In Israele il primo censimento fu fatto ai tempi
del soggiorno nel Sinai (da cui il libro dei
Numeri della Bibbia) e altri ne seguirono.
-li si conta per sapere il numero effettivo
delle unità costituenti il campione;
-si contano le diverse risposte date per ogni
domanda predisponendo tabelle di spoglio
-si rappresentano graficamente i dati
-si elaborano i dati con i metodi matematici
più opportuni
-si interpretano i dati e vengono tratte
conclusioni che possono essere valide per tutta
la popolazione, oggetto di indagine.
esempio
In prossimità
delle elezioni i mezzi di
informazione presentano spesso dei sondaggi
sulle intenzioni di voto dei cittadini.
Tali sondaggi sono indagini statistiche in cui il
rilevamento dei dati avviene solitamente
mediante interviste.
Popolazione e unità
statistica
Il gruppo preso in considerazione viene anche
detto popolazione o universo o collettivo
Ciascun elemento della popolazione è
chiamato
unità statistica
Se la rilevazione dei dati viene effettuata su
tutta la popolazione si definisce “censimento”
Spesso viene presa in esame soltanto una parte
della popolazione, detta
campione
scelta in modo che rappresenti l’intero gruppo
e indica una parte rappresentativa di una
totalità.
esempio
In un’indagine statistica che si propone di
studiare le stature degli studenti di una classe,
la popolazione è costituita dagli elementi della
classe e ogni studente è un’unità statistica.
caratteri e modalità
in un indagine statistica si considerano, di ogni
unità statistica, uno o più aspetti, i caratteri
ciascuno dei quali si può presentare in diverse
modalità .
i caratteri possono essere di due tipi :
-caratteri quantitativi: le cui modalità sono
numeri o grandezze
-caratteri qualitativi: le cui modalità sono
descritte da attributi diversi da numeri
esempio
In un’indagine statistica sugli studenti di una
classe può essere preso in considerazione il
carattere statura.
Tale carattere è quantitativo infatti per lo
studente Mario Rossi la modalità del carattere
statura è 1,76 cm mentre per la studentessa
Lucia Bianchi la modalità del carattere statura
è 1,64 cm.
esempio
In un’indagine statistica
per esempio il
carattere “sesso” è qualitativo e le sue modalità
sono:
femminile e maschile
statistica descrittiva e statistica inferenziale
La statistica descrittiva
studia i metodi di rilevazione e di elaborazione
dei dati raccolti su un’intera popolazione,in
questi casi l’indagine
viene svolta su un campione.
La statistica inferenziale o induttiva
studia le modalità con cui è possibile estendere
all’intero universo statistico le conclusioni
di un indagine svolta su di un campione e
permette di valutare il grado di attendibilità di
tali conclusioni, utilizza il calcolo delle
probabilità e altri strumenti matematici
complessi
•
Un esempio di statistica inferenziale si ha
nei sondaggi, c.d. exit poll, i cui risultati
vengono resi noti immediatamente dopo
la conclusione di una consultazione
Le distribuzioni possono essere semplici se si
rileva un solo carattere, multiple se si rilevano
più caratteri sullo stesso collettivo.
Frequenze cumulate
in una modalità quantitativa, la somma delle
frequenze di una data classe e di tutte quelle
che la precedono si chiama frequenza
cumulata.
elettorale
e molto prima della diffusione dei dati
ufficiali degli scrutini.
Per calcolare una frequenza cumulata delle
province italiane con numero di residenti
minore o uguale a 400.000 basta sommare le
frequenze riportate alla seconda colonna nelle
prime quattro righe
dalle frequenze relative alle frequenze
•
•
Tali sondaggi vengono effettuati con il
metodo dell’intervista diretta di un
campione di elettori all’uscita dei seggi e
hanno lo scopo di anticipare i risultati
elettorali.
I dati degli exit poll vengono comunicati
insieme alla percentuale possibile di
errore.
se vengono forniti le frequenze relative f e il
numero totale T delle unità statistiche è
possibile calcolare le frequenze F di ogni
modalità con la formula F=f x T
Esempio
Se sappiamo che, in un campione di 3500
persone, il 27% ha guardato una certa
trasmissione televisiva, il numero delle persone
del campione che ha guardato la trasmissione è
0,27 x 3500 = 945
distribuzione di frequenza.
Tabelle a doppia entrata
In una tabella di frequenze a ogni modalità di
un carattere è associato un numero che
rappresenta la frequenza assoluta di quella data
modalità.
La distribuzione di frequenza in una tabella è
l’insieme delle coppie ordinate di cui il primo
elemento è la modalità e il secondo la
frequenza corrispondente.
La distribuzione è la funzione che associa a
ogni modalità di un dato carattere la sua
frequenza.
Il dominio di una distribuzione di frequenza è
l’insieme delle modalità di un carattere.
talvolta in un’indagine statistica è necessario
considerare contemporaneamente due caratteri
distinti
in tal caso anziché rappresentare le frequenze
dei due caratteri in due tabelle separate è più
utile utilizzare una tabella a doppia entrata.
In una tale tabella le righe corrispondono alle
modalità di uno dei due caratteri presi in
considerazione e le colonne corrispondono alle
modalità dell’altro carattere.
In ogni cella è riportata la frequenza con cui
due caratteri si presentano con le modalità
corrispondenti alla riga e alla colonna a cui
appartiene la cella.
Tali frequenze sono dette frequenze congiunte.
Solitamente le tabelle a doppia entrata vengono
completate con una riga che riporta il totale di
ogni colonna e con una colonna questi
totali ,frequenze marginali, sono le frequenze
di ciascuno dei caratteri esaminati.i totali delle
frequenze marginali sono il numero di unità
statistiche che compongono la popolazione.
Serie statistiche
sono successioni di valori di una data quantità
statistica; vi sono diversi tipi, i più importanti
sono :
-le distribuzioni di frequenza rappresentano
serie statistiche che associano alle diverse
modalità di un carattere le rispettive frequenze.
-le serie territoriali o geografiche associano
l’intensità di un fenomeno a diverse ripartizioni
territoriali
-le serie storiche o serie temporali associano a
diversi periodi di tempo l’intensità di un
fenomeno
le seriazioni statistiche
le tabelle che presentano nella prima colonna
un carattere quantitativo sono definite
seriazioni statistiche.
Le modalità un carattere quantitativo possono
essere discrete se possono assumere soltanto
valori ben definiti o continue se possono
assumere un qualsiasi valor all’interno di un
intervallo preso nell’insieme dei numeri reali .
nella seconda colonna compare
la frequenza
cioè il numero di volte in cui si presenta la
relativa modalità.
le seriazioni statistiche
le tabelle che presentano nella prima colonna
un carattere quantitativo sono definite
seriazioni statistiche.
Le modalità di un carattere quantitativo
possono essere discrete
se possono assumere soltanto valori ben
definiti o continue se possono assumere un
qualsiasi valor all’interno di un intervallo preso
nell’insieme dei numeri reali .
nella seconda colonna compare
la frequenza
cioè il numero di volte in cui si presenta la
relativa modalità.
classe !
frequenza! frequenza frequenza
di altezza ! assoluta ! cumulata ! cumulata
1°:
7!
1,57-1,60!
2°:!
9!
1,61-1,64!
3°:!
12!
1,65-1,68!
!
4°!
15!
1,69-1,72!
5°!
13!
1,73-1,76!
6°!
4!
1,77-1,80!
7!
9+7=16!
calcolo della frequenza
cumulata e della
percentuale!
frequenza cumulata
7:60x100=! percentuale di ragazze che
11,7%!
in altezza non superano
16:60x100
1,68 m
=!
26,7%!
16+12=28! 28:60x100
=!
46,7%!
numero
assenze !
frequenza
assoluta!
frequenza
frequenza
percentuale! cumulata!
0!
1!
1!
1!
3-1=2!
3!
2!
8-3-1=4!
8!
3!
15!
4!
19!
5!
24!
totale!
niente !
completa la
tabella
di frequenza
relativa
all’indagine sul
numero di
assenze mensili
fatte dalle
ragazze di una
classe seconda.
Rappresentazione grafica dei dati e media
Introduzione
E' possibile rappresentare dei dati con dei grafici, oltre che con delle tabelle. Il più famoso è
l'istogramma, ma ce ne sono molti. Ne verranno spiegati alcuni in queste pagine, insieme a due dei
modi più usati per calcolare la media di un gruppo di numeri.
Indice
Introduzione ai grafici
Ortogramma
Istogramma
Poligono delle frequenze
Areogramma
Diagramma cartesiano
Ideogramma
Cartogramma
Indici di Posizione Centrale
Esercizi
Letizia A. Tiziana D. Corinna L.
R appresentazione grafica dei dati e media
GRA PHICA L REPRESENTA TION OF DA TA A ND A V ERA GES.
RA PPRESENTA ZIONE GRA FICA DEI DA TI
Esistono modi differenti di sintetizzare i dati statistici. Nei seguenti paragrafi illustreremo i tipi
di grafici che caratterizzano la raffigurazione di valori precedentemente scelti. Questo avviene
con l’utilizzo di due assi; l’asse orizzontale, detto delle ascisse e contrassegnato dalla lettera
“x”, e quello verticale, detto delle ordinate e contrassegnato dalla lettera “y”. Questi due assi
nascono da un punto detto “Origine”.
ORTOGRA MMA
L ’ortogramma è una tipologia di grafico che pone sull’asse delle ascisse le modalità, e su quello
delle ordinate la frequenza; le modalità sono raffigurate da rettangoli distanziati tra loro, di altezza
variabile a seconda del numero di frequenza a esse corrispondente.
L ’Ortogramma può inoltre essere rappresentato in orizzontale.
ISTOGRA MMA
Si tratta di una variante dell’ortogramma che riporta sull’asse delle ascisse l’unità di misura del
carattere e sull’asse delle ordinate la frequenza. I rettangoli sono adiacenti per mostrare la continuità
del carattere, e la loro altezza è proporzionale alla frequenza della classe.
POL IGONO DE L LE FREQUENZE
Se si congiungono i punti medi dei lati superiori dei rettangoli si ottiene una linea spezzata chiamata
“poligono delle frequenze”. per tracciare questa linea si contano anche i punti corrispondenti ai
medi delle classi immediatamente precedenti e successive alle classi con frequenza diversa da 0.
V iene utilizzato per evidenziare la forma della distribuzione del fenomeno.
A EREOGRA MMA
L ’areogramma, detto anche diagramma a torta, è utilizzato per rappresentare le frequenze relative
percentuali. E’composto da un cerchio suddiviso in diversi settori circolari, ognuno dei quali
rappresenta una classe.
Quando si desidera rappresentare un un areogramma, occorre fare una proporzione per determinare
l’ampiezza dell’angolo corrispondente a ciascuna classe: x:360=(frequenza ):100
DISEGNA RE UN A ERE OGRA MMA
per calcolare l’ampiezza dell’angolo che rappresenta l’educazione fisica, dobbiamo svolgere questi
calcoli.
x:360=20:100 x=(360x20):100=72
L ’angolo quindi sarà di 72°
DIA GRA MMA CA RTESIA NO
è una tipologia di grafico utilizzata principalmente per registrare fenomeni storici. In questo
diagramma i dati sono
ono riportati sull’asse orizzontale, mentre le frequenze su quello verticale. Si
tracciano dei punti dove si incontrano il dato e la frequenza che si corrispondono, a al termine di
questa operazione si uniscono per creare una linea spezzata.
IDEOGRA MMA
L ’ideogramma è utilizzato per avere una visione diretta del contenuto del fenomeno attraverso
figure rappresentanti l’entità dello stesso.
CA RTOGRA MMA
Il cartogramma si usa solo per dati geografici, ed è quindi costituito dalla carta geograf
geografica stessa,
con l’aggiunta di simboli o colori relazionati alle frequenze.
GL I INDICI DI POSIZIONE CENTRA L E
Il valore medio di una serie di dati è detto “indice di posizione centrale” o “media”. V iene usato per
riassumere una serie di dati, ed è calcolato grazie alle “medie di calcolo” (aritmetica, ponderata,
geometrica, armonica e quadrata) e “medie di posizione” (mediana e moda).
MEDIA A RITMETICA
per calcolare la media aritmetica, occorre sommare tutti i valori e dividerli per la quantità di
quest’ultimi.
ESEMPIO
dati i numeri: 7, 5, 9, 3
occorre fare: (7+5+9+3):4= 24:4= 6
quindi la media aritmetica tra questi numeri è 6
MEDIA PONDERA TA
per calcolare la media ponderata tra più numeri è necessario conoscere il loro peso. In questo
metodo ciascun numero ha una determinata importanza che influisce sul calcolo. il valore della
media ponderata è dato dalla somma tra il prodotto di ciascun numero e il suo peso fratto la somma
dei pesi.
esempio per capire:
6 12 8 5 7
i loro pesi sono:
5 3 4 11 1
quindi si farà:
6x5+12x3+8x4+5x11+7x1=160
la somma dei pesi invece è :
5+3+4+11+1=24
la loro media ponderata è data da: 160 :24= 6,7
ESERCIZI
Negli ortogrammi a cosa è proporzionale l’altezza dei rettangoli?
frequenza.
E’proporzionale alla
In un cartogramma a cosa corrispondono le frequenze di un fenomeno? Corrispondono a simboli o
colori.
Che tipo di grafico si presenta con una linea spezzata?
Il diagramma cartesiano.
Cosa rappresentano i settori circolari di un areogramma?
classe.
Ogni settore rappresenta una
Trasforma questi dati in un ortogramma
Numero di alunni che praticano uno sport
Calcio: 90
60
Tennis: 30
Basket: 20
Pallavolo: 50
Danza: 10
Nuoto:
Rappresenta graficamente questi dati nella maniera più opportuna
Temperature Roma
Gennaio: 8° Febbraio: 9° Marzo: 12° A prile: 17° Maggio:21° Giugno:
25° Luglio: 29° A gosto: 30°
Donatori di sangue Gruppo A : 40 Gruppo b: 32 Gruppo A B: 20 Gruppo 0: 9
Uno studente ha sostenuto 6 esami, riportando i seguenti voti: 21; 20; 20; 30; 22; 25.
Calcola la media dei voti nel modo più opportuno.
Si tratta di una distribuzione semplice e pertanto si utilizza la formula della media aritmetica
semplice : x = (21+20+20+30+22+25):6= 138:6= 23
A vendo questa tabella, calcola la media dei gelati mangiati dagli intervis
intervistati
tati nel modo più
opportuno
L a media in questo caso, è una media ponderata, che calcoliamo in questo modo:
0x9+1x53+2x21+3x15+4x0+5x2:9+53+21+15+0+2= 53+42+45+10:100= 150:100= 1,5
Rappresenta con un diagramma cartesiano i seguenti dati:
Pioggia (mm)
Gennaio 10
Febbraio 60
Marzo 40
A prile 240
Maggio 65
Giugno 120
Glossario
Rappresentazione grafica dei dati: Graphical representation of data
Media:Average
Istogramma: Histogram
Areogramma: Pie Chart
Diagramma Cartesiano: Cartesian diagram
Ideogramma: Ideogram
Cartogramma: Cartogram
Media aritmetica: Arithmetic average
Media ponderata: Ponderate average
LA MEDIANA, LA
MODA, GLI SCARTI
INDICE:
















A cura di:
 Daniela C.
 Chiara M.
 Carlotta T.



Definizione di mediana
Calcolo della mediana
Storia della mediana
Esempi della mediana
Definizione di moda
Calcolo della moda
Derivazione del termine
moda
Esempio della moda
Definizione indici di
variazione
Definizione scarto semplice
medio
Calcolo scarto semplice
medio
Esempio scarto semplice
medio
Definizione deviazione
standard
Storia deviazione standard
Calcolo deviazione standard
Esempio deviazione
standard
Piccolo glossario inglese
Esercizi
Soluzioni
LA MODA, LA MEDIANA, LO
SCARTO SEMPLICE MEDIO E
LA DEVIAZIONE STANDARD
Nella statistica descrittiva la mediana è
il valore assunto dalle unità statistiche
che si trovano nel mezzo della
distribuzione
di
un
carattere
quantitativo o qualitativo ordinabile, è
quindi un indice di posizione, il cui
simbolo è Me. Questa bipartisce gli
elementi presi in considerazione in due
gruppi: quello a sinistra comprende i
numeri minori o uguali alla mediana,
mentre quello a destra comprende gli
elementi maggiori della mediana. Per
calcolarla dobbiamo mettere i numeri
in ordine crescente o decrescente e, se
il numero di dati è dispari, è il valore
centrale, mentre se il numero dei dati
è pari è la media aritmetica dei due
valori centrali. La parola meridiano è
stata introdotta da Antoine Augustin
Cournot e adottata da Francis Galton;
fu utilizzata poi da Gustav Theodor
Fechner per sostituire il calcolo della
media, più impegnativo rispetto a
quello della mediana.
Esempio con numero di dati dispari:
Da u ’i dagi e statisti a su sette
studenti abbiamo ricavato le loro
altezze: 1,62m- 1,60m- 1,71m- 1,78m1,64m- 1,74m-1,68m.
Mettiamo in ordine i dati: 1,60m1,62m- 1,64m- 1,68m- 1,71m- 1,74m1,78m.
Il numero centrale tra i sette è: 1,68m
perciò la mediana è: 1,68m.
Esempio con numero di dati pari:
Abbiamo ricavato le età di sei ragazzi
che freque ta o l’u ive sità di
medicina: 24, 21, 26, 23, 25, 22.
Mettiamo in ordine i dati: 21, 22, 23,
24, 25, 26.
I numeri con i quali dobbiamo fare la
media aritmetica sono: 23, 24.
Facciamo la media: (23+24):2= 23,5.
Quindi la mediana è: 23,5.
La moda di un insieme di dati è il dato
che si presenta con la frequenza
maggiore; non è detto che in un
insieme di dati ci sia per forza una
moda, infatti se non ci sono elementi
ripetuti non è presente; ci può però
essere anche più di una moda, se
appaiono più elementi con la stessa
frequenza: infatti una distribuzione è
detta unimodale se ammette un solo
valore modale, è detta bimodale se ne
ammette due. Si può calcolare la moda
anche nel caso di distribuzioni di
frequenze i cui valori sono raggruppati
in classi: si parla quindi di classe
modale, che può essere determinata
anche da un istogramma, individuando
l’i te vallo di altezza
assi a. Pe
calcolarla prima si mettono tutti i
numeri in ordine crescente, poi si
individuano i numeri che appaiono con
maggiore frequenza all'interno della
serie: questi costituiscono la moda. Il
termine moda deriva dal latino
«modus» che significa «maniera» o
«norma»; nel linguaggio comune
indica le usanze che attualmente
godono di maggior popolarità.
Esempio: Intervistando una classe di
25 persone del liceo classico abbiamo
calcolato la classe modale delle
materie preferite: matematica, inglese,
matematica, greco, italiano, inglese,
latino,
matematica,
matematica,
italiano,
latino,
greco,
greco,
matematica, inglese, latino, italiano,
matematica, greco, inglese, italiano,
greco, inglese, matematica, greco.
Perciò: latino=3; italiano=4; inglese=5;
greco=6; matematica=7. La classe
modale è quindi la matematica.
Se in due sequenze di numeri con la
stessa media in una i valori sono più
lo ta i da essa e t e ell’alt a so o
più vicini a questa, si dice che le due
sequenze hanno diversa variazione o
dispersione; per misurarla si usano
indici di dispersione: il campo di
variazione, lo scarto semplice medio e
la deviazione standard.
In statistica il campo di variazione
(anche detto intervallo di variabilità o
gamma) è dato dalla differenza tra il
valore massimo ed il valore minimo di
una sequenza di numeri; è il più
semplice tra gli indici di dispersione,
ma anche il meno accurato, in quanto
tiene conto soltanto del primo e
dell’ulti o valo e e o di uelli
intermedi.
Esempio: Co u ’i dagi e statisti a
abbiamo ricavato le misure del peso di
un gruppo di studenti: 50, 48, 51, 45,
60, 53, 55, 47, 58.
Mettiamo in ordine questi dati: 45, 47,
48, 50, 51, 53, 55, 58, 60.
Facciamo ora la differenza tra il valore
massimo e quello minimo: 60-45= 15,
che è il campo di variazione.
Lo scarto semplice medio, o scarto
medio assoluto, si utilizza quando due
serie di dati hanno lo stesso numero di
valori, la stessa media e lo stesso
campo di variazione, ma con gli altri
numeri diversi; si calcola per primo lo
scarto assoluto della media, ossia la
differenza della media con ognuno
degli altri valori il cui risultato è
sempre positivo in quanto gli scarti
della media vanno presi in valore
assoluto, e poi si calcola la media
aritmetica degli scarti e si ottiene così
lo scarto semplice medio.
Esempio:
numeri:
Abbiamo
due
serie
di
 3, 4, 7, 10, 15, 21
 3, 6, 8, 10, 12, 21
Esse hanno lo stesso numero di valori
(6), la stessa media (60:6=10) e lo
stesso campo di variazione (21-3=18).
Per ogni valore calcoliamo lo scarto
assoluto della media della prima serie:
3-10=7; 4-10=6; 7-10=3; 10-10=0; 1510=5; 21-10=11 e della seconda serie:
3-10=7; 6-10=4; 8-10=2; 10-10=0; 1210=2; 21-10=11. Adesso calcoliamo la
media aritmetica di entrambe le serie,
ottenendo così lo scarto semplice
medio: (7+6+3+0+5+11):6=5,3
e
(7+4+2+0+2+11):6=4,3.
La deviazione standard (detta anche
scarto quadratico medio o scarto tipo)
è la radice quadrata della media
aritmetica dei quadrati degli scarti dei
numeri presi in considerazione dalla
loro media matematica. Fu Pearson ad
introdurla nel mondo della statistica
nel 1894, rappresentandola con σ
(sigma); fu comunemente tradotta con
deviazio e sta da d , a he se l’E te
Nazionale Italiano la tradusse con
s a to tipo , ossia la adi e uad ata
della varianza, che è la media
aritmetica dei quadrati dei loro scarti
dalla media. Per calcolare la deviazione
standard bisogna fare la media
aritmetica dei valori presi in
considerazione, calcolare lo scarto
semplice medio di ogni valore, elevare
il risultato alla seconda ottenendo gli
scarti quadratici, calcolare la varianza e
infine fare la radice quadrata del
risultato.
Esempio: Abbiamo una sequenza di
cinque numeri: 21,22,25,28,30.
Facciamo la media aritmetica:
(20+22+25+28+30):5=25.
Calcoliamo gli scarti quadratici:
(20-25)²=25; (22-25)²=9; (25-25)²=0;
(28-25)²=9; (30-25)²=25.
Calcoliamo la varianza:
(25+9+0+9+25):5=13,6.
Eseguiamo
la
radice
quadrata
ottenendo la deviazione standard:
σ=3,68.
Se il numero di dati di cui disponiamo
è pari, la mediana è la media dei due
valori centrali.
V. F.?
MINI-GLOSSARIO INGLESE
Mediana= median
Moda= mode
Campo di variazione= field of variation
Scarto semplice
avarage gap
Deviazione
deviation
medio=
standard=
simple
standard
Varianza= variance
Se il numero di dati di cui disponiamo
è dispari, la mediana è il dato centrale.
V. F.?
La parola mediana è sinonimo di
media.
V. F.?
Da u ’i dagi e statisti a svolta su un
campione di cinque ragazzi sulla
quantità di vacanze annue svolte, sono
risultati questi dati: 3, 2, 4, 1, 5. Come
bisogna procedere per trovare la
mediana e qual è tra questi dati?
ESERCIZI
MEDIANA
Nella sequenza di numeri 4, 7, 10, 11,
15, 17, 20 la mediana è 11.
V. F.?
La mediana è il dato che si presenta
con
la
frequenza
maggiore.
V. F.?
Pe
al ola e la
edia a l’ulti o
passaggio è quello di mettere in ordine
i dati.
V. F.?
La mediana è un indice di posizione.
V. F.?
Da u ’i dagi e statisti a svolta su die i
ragazzi sono stati ricavati i minuti che
essi impiegano per andare a scuola: 5,
20, 45, 30, 15, 40, 25, 10, 35, 50. Come
bisogna procedere per trovare la
mediana e qual è tra questi dati?
Da u ’i dagi e statisti a su ui di i
persone si è ricavato il numero di libri
che ognuna di esse possiede: 30, 60,
55, 40, 20, 35, 57, 23, 32, 44, 56, 29,
51, 35, 22. Come bisogna procedere
per trovare la mediana, e qual è?
Cos’alt o si ota all’i te o di uesta
distribuzione di numeri?
MODA
Nella sequenza di numeri 3, 5, 5, 8, 10
la moda è 5.
V. F.?
In ogni insieme di dati è sempre
presente una moda.
V. F.?
E’ stata svolta u ’i dagi e statisti a sul
numero di animali posseduti da venti
persone, e i risultati sono questi: 3, 5,
0, 2, 5, 4, 1, 6, 3, 7, 2, 0, 4, 1, 6, 0, 2, 5,
1, 2. Trova la/e moda/e e la mediana e
rappresenta i dati sotto forma di
grafico.
Non esiste che in un insieme di dati vi
sia più di una moda.
V. F.?
Si dice classe modale quando la moda
è calcolata fra valori raggruppati in
classi.
V. F.?
Si dice che una distribuzione di valori è
bimodale se ci sono due numeri con la
frequenza massima.
V. F.?
Da u ’i dagi e statisti a si so o
ricavati i gusti di gelato preferiti da
otto persone: crema, cioccolato,
fragola, frutti di bosco, pistacchio,
cioccolato, nocciola, cioccolato. Qual è
la moda dei gusti di gelato preferiti?
Da u ’i dagi e statisti a si so o
ricavate le taglie di pantaloni portate
da dodici ragazze: 40, 38, 42, 40, 38,
40, 44, 36, 38, 46, 42, 36. Qual è la
oda delle taglie di pa talo i? Ce ’è
più di una? Quindi questa che tipo di
distribuzione
è:
unimodale,
i odale,…?
INDICI DI VARIABILITA’
Nell’ele o dei segue ti u e i: 6, ,
15, 18, 20 il campo di variazione è 15.
V. F.?
Il campo di variazione è la differenza
tra il valore maggiore e quello minore
di una distribuzione di numeri.
V. F.?
Per calcolare lo scarto semplice medio
si calcola lo scarto assoluto della
media, cioè la differenza fra la media e
ogni valore.
V. F.?
Lo scarto semplice medio è la media
aritmetica degli scarti.
V. F.?
Il risultato dello scarto assoluto della
media può essere sia positivo sia
negativo.
V. F.?
Per calcolare la deviazione standard è
necessaria la radice quadrata.
V. F.?
Il primo passaggio per calcolare la
deviazione standard è la media
aritmetica dei valori.
V. F.?
L’ulti o passaggio pe al ola e la
deviazione standard è la varianza.
V. F.?
Avendo la seguente sequenza di
numeri: 35, 20, 40, 25, 27, 30 qual è il
campo di variazione?
Calcola il campo di variazione della
seguente sequenza di numeri: 35, 46,
54, 48, 32, 60, 43, 71, 67, 79.
Della seguente sequenza di numeri
calcola il campo di variazione, trova la
mediana e la moda: 100, 98, 74, 46,
72, 64, 98, 33, 88, 45, 51.
Avendo queste due sequenze di
numeri, calcola lo scarto semplice
medio:
 1, 6, 6, 7, 8, 10, 11, 11, 12;
 1, 3, 8, 8, 9, 9, 10, 12, 12.
Calcola lo scarto semplice medio delle
seguenti sequenze di numeri:
 52, 57, 64, 66, 73, 79, 84, 85;
 52, 58, 67, 69, 70, 77, 82, 85.
Calcola la deviazione standard della
seguente sequenza di numeri: 9, 12,
16, 19, 24, 25, 28.
Calcola la deviazione standard della
seguente sequenza di numeri: 20, 21,
22, 25, 26, 28, 30, 36.
Calcola la deviazione standard della
seguente sequenza di numeri: 51, 63,
72, 84, 95, 103.
SOLUZIONI
MEDIANA
VERO O FALSO
1= vero
Avendo queste sequenze di numeri,
calcolane lo scarto semplice medio:
 30, 36, 38, 40, 41, 45, 50;
 30, 37, 39, 40, 41, 43, 50.
2= falso
3= falso
4= vero
5= vero
6= vero
7= falso
PROBLEMI
1= 3
2= 27,5
3= 35; moda= 35
MODA
VERO O FALSO
1= vero
2= falso
3= falso
4= vero
5= vero
PROBLEMI
1=
cioccolato
2= 30, 40;
distribuzione
bimodale
3= 2, 2,5
INDICI DI VARIABILITA’
VERO O FALSO
1= falso
2= vero
3= falso
4= vero
5= falso
6= vero
7= vero
8= falso
PROBLEMI
1= 20
2= 47
3= campo di variazione 67;
mediana 72; moda 98
1= 2,6, 2,6
2= 4,5, 4
3= 10,25, 8,5
1= 6,54
2= 4,97
3= 17,98.
GLI EVENTI
E
LA PROBABILITA'
– INTRODUZIONE ALLA PROBABILITA'
– EVENTI CERTI, IMPOSSIBILI E CASUALI
– EVENTI UNICI E RIPETIBILI
– LA FREQUENZA
– EVENTI DIPENDENTI E INDIPENDENTI
– EVENTI COMPATIBILI E INCOMPATIBILI
Lavinia L., Caterina C., Martina L.
ESEMPIO:“l'Italia vincerà il campionato
mondiale di calcio del 2018?” questo è
Il termine probabilità deriva dal verbo
un evento unico: l'esperimento che può
latino probare “provare” o “valutare”,
verificare tale evento non può essere
attraverso l'aggettivo probabilis “degno
ripetuto.
di prababità” e quindi “verosimile”.
-EVENTO RIPETIBILE:
Nella vita di tutti i giorni si incontrano
Se tale esperimento può essere
spesso affermazioni la cui verità non si
eseguito un numero indefinito di volte,
può stabilire con certezza (es.domani
l'evento si dice ripetibile.
pioverà); tali affermazioni sono relative
ESEMPIO:“lanciando un dado esce 6” è
a eventi che potrebbero accadere
ripetibile perchè l'esperimento in
oppure no, mentre altri eventi sono
questione, ossia il lancio del dado, può
misurabili con l'applicazione della
essere ripetuto quante volte si vuole.
matematica, essa infatti utilizza un
La frequenza di un evento ripetibile è il
modo più preciso per misurare il grado
rapporto tra un numero di successi e il
di fiducia nel verificarsi di un evento: il
numero di prove:
calcolo delle probabilità nasce per
f=m/n
rispondere a queste esigenze.
Gli eventi si dividono in tre tipi in base La probabilità di un evento p(E) è
sempre un numero compreso fra 0 e 1:
alla probabilita':
0 <= p(E) <= 1
-EVENTO CERTO: è uguale allo spazio
Un evento che ha probabilità 0 è detto
dei risultati ossia l'insieme di tutti i
evento impossibile.Un evento che ha
possibili esiti di una osservazione.(es.
se una scatola contiene soltanto palline probabilità 1 è detto evento certo.
nere, estraendone una a caso siamo
Esempio 1. Estraendo una carta da un
sicuri che sia nera.)
mazzo di 40, qual è la probabilità che
-EVENTO IMPOSSIBILE: è l'insieme è sia un 10 di cuori?
vuoto.
I casi possibili sono 40 i casi favorevoli
(es. se una scatola contiene soltanto
sono 0, perché nei mazzi da 40 carte
palline nere, l'estrazione di una pallina non ci sono i numeri 8, 9, 10.
bianca è impossibile)
p(10 di cuori) = 0/40 = 0
LA PROBABILITA'
-EVENTO CASUALE: si verifica oppure
non si verifica.
(es. se una scatola contiene palline
bianche e nere, l’estrazione di una
pallina nera è un evento possibile ma
non certo, cosi come l’estrazione di una
pallina bianca).
Possiamo inoltre suddividere l'evento in:
-EVENTO UNICO:
Si dice evento unico se l'esperimento
cui si riferisce può essere eseguito una
sola volta.
La probabilità di un evento si può
esprimere:
a) come frazione, ad esempio 3/4
b) come numero decimale, ad esempio
3/4 = 3 : 4 = 0,75
c) come percentuale, ad esempio 0,75
= 75%
Nota. Per trasformare un rapporto in
una percentuale si divide il numeratore
per il denominatore e si moltiplica il
risultato per 100.
EVENTI DIPENDENTI E
INDIPENDENTI:
-Due eventi casuali A e B sono
indipendenti se la probabilità del
verificarsi dell'evento A non dipende dal
fatto che l'evento B si sia verificato o
no, e viceversa.
Esempio 1. Abbiamo due mazzi di carte
da 40. Estraendo una carta da ciascun
mazzo, i due eventi:
E1 = "La carta estratta dal primo
mazzo è un asso"
E2 = "La carta estratta dal secondo
mazzo è una carta di fiori"
sono indipendenti.
-Un evento casuale A è dipendente da
un altro evento B se la probabilità
dell'evento A dipende dal fatto che
l'evento B si sia verificato o meno.
Esempio 1. Abbiamo un mazzo di carte
da 40. Estraendo due carte in
successione, senza rimettere la prima
carta estratta nel mazzo, i due eventi:
E1 = "La prima carta estratta è un
asso"
E2 = "La seconda carta estratta è un
asso"
sono dipendenti. Per la precisione la
probabilità di E2 dipende dal verificarsi
o meno di E1.
EVENTI COMPATIBILI E
INCOMPATIBILI:
Si dicono incompatibili quegli eventi
aleatori che non possono verificarsi
simultaneamente in una data prova.
Due eventi sono, invece, compatibili se
c’è anche una sola possibilità che
possano verificarsi simultaneamente, in
una data prova.
ESERCIZI..
1) Un sacchetto contiene 10 palline
bianche, 5 rosse e 3 nere. un secondo
sacchetto contiene 15 palline bianche e
10 rosse. Qual è la probabilità che
estraendo una pallina dal primo e una
dal secondo , siano entrambe bianche?
[Risultato : 1/3 ]
2) Da un mazzo di carte napoletane
viene estratta una carta che viene
rimessa nel mazzo ;
si effettuano poi , altre 3 estrazioni
rimettendo sempre la carta estratta
nel mazzo .
Qual è la probabilità di estrarre 4
carte con semi diversi? [Risultato:
3/32 ]
3) In un cassetto sono conservati 5
quaderni azzurri , 4 gialli e 3 rossi.
Prendendo a caso due quaderni
successivamente , senza riporre il
primo a posto , calcola la probabilità di
prenderli :
a- Entrambi rossi [Risultato : 1/22]
b- Il primo azzurro e il secondo giallo
[Risultato : 5/33]
c- Entrambi azzurri [Risultato : 5/33]
La
probabilità
condizionata
INDICE
La probabilità condizionata
pag. 1
Il teorema del prodotto per
eventi
dipendenti
e
indipendenti
pag. 2
Calcolare la probabilità con
Excel
Esercizi
Giada M.
Manuela M.
Laura C.
pag. 3
pag. 4-6
La probabilità
condizionata
La probabilità condizionata di E1
rispetto a E2 è la probabilità che si
verifichi l’E1 sapendo che E2 è
verificato.
The conditional probability of E1 is the
probability that the event will occur given
the knowledge that E2 has already
occurred.
P(E1|E2) = P(E1∩E2)/P(E2)
Esempio:
Calcola la probabilità che estraendo una
carta da un mazzo di 40, questa sia una
figura, sapendo che la carta estratta è
rossa.
E1 = la carta estratta è una figura
E2 = la carta estratta è rossa
Dobbiamo calcolare P(E1|E2).
L’insieme E1∩E2 è costituito dalle
figure rosse e contiene quindi 6
elementi.
P(E1∩E2) = 6/40 = 3/20
L’insieme E2 è costituito dalle carte rosse
e contiene 20 elementi.
P(E2) = 20/40 = ½
Quindi si ha:
P(E1|E2) = P(E1∩E2)/P(E2)
P(A/B) = 3/20 : ½ = 3/10
Se P(E1) è diversa dalla probabilità
condizionata P(E1|E2), i due eventi sono
dipendenti,
altrimenti
sono
indipendenti.
If P(E1) is different from the conditional
probability P(E1|E2), the two events are
independent,
otherwise
they’re
independent.
Il teorema del prodotto
per eventi indipendenti
Il teorema del prodotto
per eventi dipendenti
Due eventi A e B si dicono indipendenti
se il verificarsi dell’uno non influenza il
verificarsi dell’altro.
Two events A and B are called
independent if the occurrence of one
doesn’t influence the occurrence of the
other one.
Due eventi A e B si dicono dipendenti se
il verificarsi dell’uno influenza il
verificarsi dell’altro.
Two events A and B are called dependent
if the occurrence of one influences the
occurrence of the other one.
Se due eventi (E1 ed E2) sono
indipendenti, la probabilità del loro
evento intersezione è uguale al prodotto
delle loro probabilità.
If two events (E1 and E2) are independent;
the probability of their occurrence
intersection is equal to the product of their
probabilities.
P(E1∩E2) = P(E1) ⋅ P(E2)
Esempio:
Si lanciano contemporaneamente una
moneta e un dado e si considerano i due
eventi “esce testa” ed “esce il numero 6”.
Fra i due eventi non c’è nessun legame,
ognuno
si
può
verificare
indipendentemente dall’altro, infatti la
probabilità che esca testa sulla moneta non
influenza la probabilità che esca il numero
6 sul dado, poiché si tratta di eventi
indipendenti.
P(E1∩E2) = P(E1) ⋅ P(E2)
P(E1∩E2) = ½ ⋅ ⅙ = 1/12
Se due eventi (E1 ed E2) sono
dipendenti, la probabilità del loro
evento intersezione è uguale al prodotto
della probabilità di E1 per la
probabilità E2 condizionata a E1.
If two events (E1 and E2) are dependent,
the probability of their occurrence
intersection is equal to the product of the
probability of E1 multiplied by the
probability of E2 conditioned by E1.
P(E1∩E2) = P(E1) ⋅ P(E2|E1)
Esempio:
Da un bussolotto contenente cinque tessere
numerate da 1 a 5 estraiamo un pezzo (1),
ma non lo rimettiamo al suo posto.
Successivamente ne estraiamo un altro
pezzo (4). Qual è la probabilità che
possano essere estratti l’1 e poi il 4?
P(E1∩E2) = P(E1) ⋅ P(E2|E1)
P(1∩4) = P(1) ⋅ P(4|1)
P(1∩4) = ⅕ ⋅ ¼ = 1/20
Calcolare la probabilità con Excel
E’ possibile calcolare la probabilità in un
problema anche dal computer.
Il programma che viene usato è Microsoft
Excel:
- Aprire un foglio elettronico
- Inserire le didascalie
- Digitiamo le seguenti funzioni per
il controllo dei dati:
D4​ = SE(C4>0; "accettabile,";"errato,")
D5​ = SE(C5>C4; "errato,";"accettabile,")
D6​ = SE(C6>C4-C5;
"errato.";"accettabile.")
D7​ = SE(O(D4 = "errato,"; D5 = "errato,";
D6​ = "errato.");"";"=")
C7​ = C4-(C5+C6)
C9​ = SE(D7 = ""; "non è calcolabile";
C7/C4)
- Il modulo è pronto per aggiungere i
dati; per ottenere la probabilità in
percentuale basta selezionare C9,
andare su Formato > Numero e
cliccare su Percentuale.
PROBLEMI
1
Due urne contengono:
Urna 1 = 5 palline rosse e 5 blu
Urna 2 = 8 palline rosse e 4 blu
Viene estratta una pallina da ogni urna.
Qual è la probabilità che siano entrambe
blu?
2
Da un mazzo di 40 carte si estraggono
successivamente 2 carte. Calcola la
probabilità di estrarre 2 carte di fiori nel
caso di reimmissione nel mazzo della
prima carta estratta.
3
Da un’urna contenente 18 palline numerate
(da 1 a 18) si estrae una pallina, sia:
A = numero divisibile per 2 (pari)
B = numero divisibile per 3
Stabilisci se i due eventi sono
indipendenti.
6
In un sacchetto ci sono 4 foglietti, A, B, C
e D. Qual è la probabilità che venga
estratto prima il foglietto A e poi il
foglietto D se il foglietto A è stato rimosso
dal sacchetto?
VERO/FALSO
1.
2.
3.
1.
4
In una classe ci sono 28 ragazzi che
devono essere interrogati di greco.
Vengono estratti dei bigliettini con i
numeri di registro degli studenti.
Qual è la probabilità che venga estratto il
bigliettino n° 3 e, senza rimetterlo al suo
posto, anche quello n°28?
5
Durante l’estrazione del lotto la probabilità
che possa uscire un numero è di 1/90.
Qual è la probabilità che venga estratto
prima il 12 e poi il 75?
2.
3.
1.
2.
7
Due eventi si dicono indipendenti
se il verificarsi dell’uno non
influenza il verificarsi dell’altro.
Se due eventi (E1 ed E2) sono
indipendenti, la probabilità del loro
evento intersezione è uguale al
prodotto della probabilità di E1 per
la probabilità E2 condizionata a
E1.
La
formula
degli
eventi
indipendenti è P(E1UE2) =
P(E1) ⋅ P(E2)
8
Se due eventi (E1 ed E2) sono
indipendenti, la probabilità del loro
evento intersezione è uguale al
prodotto delle loro probabilità.
La
formula
degli
eventi
indipendenti è P(E1∩E2) =
P(E1) ⋅ P(E2)
Due eventi si dicono indipendenti
se il verificarsi dell’uno influenza il
verificarsi dell’altro.
9
Due eventi (E1 e E2) si dicono
dipendenti se P(E1∩E2) =
P(E1) ⋅ P(E2)
Due eventi (E1 e E2) si dicono
dipendenti se P(E1∩E2) =
P(E1) ⋅ P(E2|E1)
3.
1.
2.
3.
Due eventi (E1 e E2) si dicono
dipendenti se il verificarsi dell’uno
non influenza il verificarsi
dell’altro.
10
Tre eventi (E1, E2 e E3) si dicono
dipendenti se il verificarsi di uno
influenza il verificarsi degli altri
due.
Quattro eventi (E1, E2, E3 e E4) si
dicono dipendenti se il verificarsi
di uno influenza il verificarsi
soltanto di un altro.
Due eventi (E1 e E2) si dicono
dipendenti se P(E1∩E2) =
P(E1) ⋅ P(E1|E2)
PROBLEMA A RISPOSTA
MULTIPLA
11
Ci sono tre numeri, 1, 2 e 3. Estraendone
uno dispari e tenendolo da parte, la
possibilità che estraendone un altro i due
numeri siano entrambi dispari è:
1. ⅙
2.
3.
PROBLEMA DA RISOLVERE SU
EXCEL
12
In un cesto ci sono in totale 20 frutti: 10
clementine e 7 arance, il resto mele.
Calcola la probabilità di estrarre una mela.
LA REDAZIONE
LETIZIA A
CECILIA B
CATERINA C
ROSA C
DANIELA C
LAURA IVANA C
TIZIANA D A
CORINNA L
MARTINA L
LAVINIA L
GIADA ELISA M
CHIARA M
MANUELA M
GLORIA P
CARLOTTA T
ROSITA T
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
PROF SSA CLAUDIA C
.
.
Scarica