MAΘHMA scienza conoscenza 2Acls statistica e probabilità RIVISTA III LICEO DA VIGO INDICE LA STATISTICA RAPPRESENTAZIONE GRAFICA DEI DAI E LA MEDIA LA MEDIANA LA MODA E LO SCARTO GLI EVENTI E LA PROBABILITÀ LA PROBABILITÀ CONDIZIONATA , STATISTICA INDICE • • • • • • • • • • • Introduzione alla statistica Storia della statistica Applicazioni Unità e popolazione Caratteri e modalità Statistica distributiva e inferenziale Distribuzioni di frequenza Distribuzione cumulata Dalle frequenze relative alle frequenze Tabelle a doppia entrata Serie statistiche Cecilia B. Glori P. Rosita T. la statistica e’ la scienza che si occupa della raccolta e dell’elaborazione dei dati relativi ad un certo gruppo di persone o di oggetti per trarne conclusioni o fare previsioni. La statistica è utilizzata da organismi statali anche da molti enti privati come organi di informazione, aziende, partiti politici, ecc… La statistica, in origine, si occupava di rispondere a quesiti che riguardano il governo e la vita di uno stato (es. quante persone abitano la Toscana?). Il termine statistica deriva proprio dalla parola “stato”. Cenni storici La misura quantitativa dei fenomeni sociali ha una storia antica. I n Anche l'immenso impero cinese ha sempre curato i censimenti. Non si hanno invece notizie di censimenti nella Grecia antica, ma venivano registrati ogni anno i nati dell'anno precedente. La rilevazione dei cittadini e dei loro beni ebbe grande importanza nella Roma antica. Il primo censimento fu ordinato da Servio Tullio e si ebbero poi censimenti con periodicità quinquennale dalla fine del VI secolo a.C., decennale a partire da Augusto. Applicazioni della statistica La statistica è utile ovunque sia necessaria una delle seguenti condizioni: procedere ad una raccolta ordinata, ad una stesura comprensibile e ad una elaborazione dei dati più svariati; scoprire eventuali leggi che regolano i dati spesso solo in apparenza disordinati ed operarne il confronto; Fasi di un’indagine statistica • -rilevamento dei dati • -trascrizione dei dati raccolti • -elaborazione e interpretazione dei dati. Come si rilevano i dati? I metodi variano in relazione all’oggetto dell’immagine: -intervista diretta -intervista indiretta mediante questionari anonimi. -misurazioni strumentali una volta raccolti i questionari compilati Egitto si rilevava l'ammontare della popolazione già ai tempi della prima dinastia. In Israele il primo censimento fu fatto ai tempi del soggiorno nel Sinai (da cui il libro dei Numeri della Bibbia) e altri ne seguirono. -li si conta per sapere il numero effettivo delle unità costituenti il campione; -si contano le diverse risposte date per ogni domanda predisponendo tabelle di spoglio -si rappresentano graficamente i dati -si elaborano i dati con i metodi matematici più opportuni -si interpretano i dati e vengono tratte conclusioni che possono essere valide per tutta la popolazione, oggetto di indagine. esempio In prossimità delle elezioni i mezzi di informazione presentano spesso dei sondaggi sulle intenzioni di voto dei cittadini. Tali sondaggi sono indagini statistiche in cui il rilevamento dei dati avviene solitamente mediante interviste. Popolazione e unità statistica Il gruppo preso in considerazione viene anche detto popolazione o universo o collettivo Ciascun elemento della popolazione è chiamato unità statistica Se la rilevazione dei dati viene effettuata su tutta la popolazione si definisce “censimento” Spesso viene presa in esame soltanto una parte della popolazione, detta campione scelta in modo che rappresenti l’intero gruppo e indica una parte rappresentativa di una totalità. esempio In un’indagine statistica che si propone di studiare le stature degli studenti di una classe, la popolazione è costituita dagli elementi della classe e ogni studente è un’unità statistica. caratteri e modalità in un indagine statistica si considerano, di ogni unità statistica, uno o più aspetti, i caratteri ciascuno dei quali si può presentare in diverse modalità . i caratteri possono essere di due tipi : -caratteri quantitativi: le cui modalità sono numeri o grandezze -caratteri qualitativi: le cui modalità sono descritte da attributi diversi da numeri esempio In un’indagine statistica sugli studenti di una classe può essere preso in considerazione il carattere statura. Tale carattere è quantitativo infatti per lo studente Mario Rossi la modalità del carattere statura è 1,76 cm mentre per la studentessa Lucia Bianchi la modalità del carattere statura è 1,64 cm. esempio In un’indagine statistica per esempio il carattere “sesso” è qualitativo e le sue modalità sono: femminile e maschile statistica descrittiva e statistica inferenziale La statistica descrittiva studia i metodi di rilevazione e di elaborazione dei dati raccolti su un’intera popolazione,in questi casi l’indagine viene svolta su un campione. La statistica inferenziale o induttiva studia le modalità con cui è possibile estendere all’intero universo statistico le conclusioni di un indagine svolta su di un campione e permette di valutare il grado di attendibilità di tali conclusioni, utilizza il calcolo delle probabilità e altri strumenti matematici complessi • Un esempio di statistica inferenziale si ha nei sondaggi, c.d. exit poll, i cui risultati vengono resi noti immediatamente dopo la conclusione di una consultazione Le distribuzioni possono essere semplici se si rileva un solo carattere, multiple se si rilevano più caratteri sullo stesso collettivo. Frequenze cumulate in una modalità quantitativa, la somma delle frequenze di una data classe e di tutte quelle che la precedono si chiama frequenza cumulata. elettorale e molto prima della diffusione dei dati ufficiali degli scrutini. Per calcolare una frequenza cumulata delle province italiane con numero di residenti minore o uguale a 400.000 basta sommare le frequenze riportate alla seconda colonna nelle prime quattro righe dalle frequenze relative alle frequenze • • Tali sondaggi vengono effettuati con il metodo dell’intervista diretta di un campione di elettori all’uscita dei seggi e hanno lo scopo di anticipare i risultati elettorali. I dati degli exit poll vengono comunicati insieme alla percentuale possibile di errore. se vengono forniti le frequenze relative f e il numero totale T delle unità statistiche è possibile calcolare le frequenze F di ogni modalità con la formula F=f x T Esempio Se sappiamo che, in un campione di 3500 persone, il 27% ha guardato una certa trasmissione televisiva, il numero delle persone del campione che ha guardato la trasmissione è 0,27 x 3500 = 945 distribuzione di frequenza. Tabelle a doppia entrata In una tabella di frequenze a ogni modalità di un carattere è associato un numero che rappresenta la frequenza assoluta di quella data modalità. La distribuzione di frequenza in una tabella è l’insieme delle coppie ordinate di cui il primo elemento è la modalità e il secondo la frequenza corrispondente. La distribuzione è la funzione che associa a ogni modalità di un dato carattere la sua frequenza. Il dominio di una distribuzione di frequenza è l’insieme delle modalità di un carattere. talvolta in un’indagine statistica è necessario considerare contemporaneamente due caratteri distinti in tal caso anziché rappresentare le frequenze dei due caratteri in due tabelle separate è più utile utilizzare una tabella a doppia entrata. In una tale tabella le righe corrispondono alle modalità di uno dei due caratteri presi in considerazione e le colonne corrispondono alle modalità dell’altro carattere. In ogni cella è riportata la frequenza con cui due caratteri si presentano con le modalità corrispondenti alla riga e alla colonna a cui appartiene la cella. Tali frequenze sono dette frequenze congiunte. Solitamente le tabelle a doppia entrata vengono completate con una riga che riporta il totale di ogni colonna e con una colonna questi totali ,frequenze marginali, sono le frequenze di ciascuno dei caratteri esaminati.i totali delle frequenze marginali sono il numero di unità statistiche che compongono la popolazione. Serie statistiche sono successioni di valori di una data quantità statistica; vi sono diversi tipi, i più importanti sono : -le distribuzioni di frequenza rappresentano serie statistiche che associano alle diverse modalità di un carattere le rispettive frequenze. -le serie territoriali o geografiche associano l’intensità di un fenomeno a diverse ripartizioni territoriali -le serie storiche o serie temporali associano a diversi periodi di tempo l’intensità di un fenomeno le seriazioni statistiche le tabelle che presentano nella prima colonna un carattere quantitativo sono definite seriazioni statistiche. Le modalità un carattere quantitativo possono essere discrete se possono assumere soltanto valori ben definiti o continue se possono assumere un qualsiasi valor all’interno di un intervallo preso nell’insieme dei numeri reali . nella seconda colonna compare la frequenza cioè il numero di volte in cui si presenta la relativa modalità. le seriazioni statistiche le tabelle che presentano nella prima colonna un carattere quantitativo sono definite seriazioni statistiche. Le modalità di un carattere quantitativo possono essere discrete se possono assumere soltanto valori ben definiti o continue se possono assumere un qualsiasi valor all’interno di un intervallo preso nell’insieme dei numeri reali . nella seconda colonna compare la frequenza cioè il numero di volte in cui si presenta la relativa modalità. classe ! frequenza! frequenza frequenza di altezza ! assoluta ! cumulata ! cumulata 1°: 7! 1,57-1,60! 2°:! 9! 1,61-1,64! 3°:! 12! 1,65-1,68! ! 4°! 15! 1,69-1,72! 5°! 13! 1,73-1,76! 6°! 4! 1,77-1,80! 7! 9+7=16! calcolo della frequenza cumulata e della percentuale! frequenza cumulata 7:60x100=! percentuale di ragazze che 11,7%! in altezza non superano 16:60x100 1,68 m =! 26,7%! 16+12=28! 28:60x100 =! 46,7%! numero assenze ! frequenza assoluta! frequenza frequenza percentuale! cumulata! 0! 1! 1! 1! 3-1=2! 3! 2! 8-3-1=4! 8! 3! 15! 4! 19! 5! 24! totale! niente ! completa la tabella di frequenza relativa all’indagine sul numero di assenze mensili fatte dalle ragazze di una classe seconda. Rappresentazione grafica dei dati e media Introduzione E' possibile rappresentare dei dati con dei grafici, oltre che con delle tabelle. Il più famoso è l'istogramma, ma ce ne sono molti. Ne verranno spiegati alcuni in queste pagine, insieme a due dei modi più usati per calcolare la media di un gruppo di numeri. Indice Introduzione ai grafici Ortogramma Istogramma Poligono delle frequenze Areogramma Diagramma cartesiano Ideogramma Cartogramma Indici di Posizione Centrale Esercizi Letizia A. Tiziana D. Corinna L. R appresentazione grafica dei dati e media GRA PHICA L REPRESENTA TION OF DA TA A ND A V ERA GES. RA PPRESENTA ZIONE GRA FICA DEI DA TI Esistono modi differenti di sintetizzare i dati statistici. Nei seguenti paragrafi illustreremo i tipi di grafici che caratterizzano la raffigurazione di valori precedentemente scelti. Questo avviene con l’utilizzo di due assi; l’asse orizzontale, detto delle ascisse e contrassegnato dalla lettera “x”, e quello verticale, detto delle ordinate e contrassegnato dalla lettera “y”. Questi due assi nascono da un punto detto “Origine”. ORTOGRA MMA L ’ortogramma è una tipologia di grafico che pone sull’asse delle ascisse le modalità, e su quello delle ordinate la frequenza; le modalità sono raffigurate da rettangoli distanziati tra loro, di altezza variabile a seconda del numero di frequenza a esse corrispondente. L ’Ortogramma può inoltre essere rappresentato in orizzontale. ISTOGRA MMA Si tratta di una variante dell’ortogramma che riporta sull’asse delle ascisse l’unità di misura del carattere e sull’asse delle ordinate la frequenza. I rettangoli sono adiacenti per mostrare la continuità del carattere, e la loro altezza è proporzionale alla frequenza della classe. POL IGONO DE L LE FREQUENZE Se si congiungono i punti medi dei lati superiori dei rettangoli si ottiene una linea spezzata chiamata “poligono delle frequenze”. per tracciare questa linea si contano anche i punti corrispondenti ai medi delle classi immediatamente precedenti e successive alle classi con frequenza diversa da 0. V iene utilizzato per evidenziare la forma della distribuzione del fenomeno. A EREOGRA MMA L ’areogramma, detto anche diagramma a torta, è utilizzato per rappresentare le frequenze relative percentuali. E’composto da un cerchio suddiviso in diversi settori circolari, ognuno dei quali rappresenta una classe. Quando si desidera rappresentare un un areogramma, occorre fare una proporzione per determinare l’ampiezza dell’angolo corrispondente a ciascuna classe: x:360=(frequenza ):100 DISEGNA RE UN A ERE OGRA MMA per calcolare l’ampiezza dell’angolo che rappresenta l’educazione fisica, dobbiamo svolgere questi calcoli. x:360=20:100 x=(360x20):100=72 L ’angolo quindi sarà di 72° DIA GRA MMA CA RTESIA NO è una tipologia di grafico utilizzata principalmente per registrare fenomeni storici. In questo diagramma i dati sono ono riportati sull’asse orizzontale, mentre le frequenze su quello verticale. Si tracciano dei punti dove si incontrano il dato e la frequenza che si corrispondono, a al termine di questa operazione si uniscono per creare una linea spezzata. IDEOGRA MMA L ’ideogramma è utilizzato per avere una visione diretta del contenuto del fenomeno attraverso figure rappresentanti l’entità dello stesso. CA RTOGRA MMA Il cartogramma si usa solo per dati geografici, ed è quindi costituito dalla carta geograf geografica stessa, con l’aggiunta di simboli o colori relazionati alle frequenze. GL I INDICI DI POSIZIONE CENTRA L E Il valore medio di una serie di dati è detto “indice di posizione centrale” o “media”. V iene usato per riassumere una serie di dati, ed è calcolato grazie alle “medie di calcolo” (aritmetica, ponderata, geometrica, armonica e quadrata) e “medie di posizione” (mediana e moda). MEDIA A RITMETICA per calcolare la media aritmetica, occorre sommare tutti i valori e dividerli per la quantità di quest’ultimi. ESEMPIO dati i numeri: 7, 5, 9, 3 occorre fare: (7+5+9+3):4= 24:4= 6 quindi la media aritmetica tra questi numeri è 6 MEDIA PONDERA TA per calcolare la media ponderata tra più numeri è necessario conoscere il loro peso. In questo metodo ciascun numero ha una determinata importanza che influisce sul calcolo. il valore della media ponderata è dato dalla somma tra il prodotto di ciascun numero e il suo peso fratto la somma dei pesi. esempio per capire: 6 12 8 5 7 i loro pesi sono: 5 3 4 11 1 quindi si farà: 6x5+12x3+8x4+5x11+7x1=160 la somma dei pesi invece è : 5+3+4+11+1=24 la loro media ponderata è data da: 160 :24= 6,7 ESERCIZI Negli ortogrammi a cosa è proporzionale l’altezza dei rettangoli? frequenza. E’proporzionale alla In un cartogramma a cosa corrispondono le frequenze di un fenomeno? Corrispondono a simboli o colori. Che tipo di grafico si presenta con una linea spezzata? Il diagramma cartesiano. Cosa rappresentano i settori circolari di un areogramma? classe. Ogni settore rappresenta una Trasforma questi dati in un ortogramma Numero di alunni che praticano uno sport Calcio: 90 60 Tennis: 30 Basket: 20 Pallavolo: 50 Danza: 10 Nuoto: Rappresenta graficamente questi dati nella maniera più opportuna Temperature Roma Gennaio: 8° Febbraio: 9° Marzo: 12° A prile: 17° Maggio:21° Giugno: 25° Luglio: 29° A gosto: 30° Donatori di sangue Gruppo A : 40 Gruppo b: 32 Gruppo A B: 20 Gruppo 0: 9 Uno studente ha sostenuto 6 esami, riportando i seguenti voti: 21; 20; 20; 30; 22; 25. Calcola la media dei voti nel modo più opportuno. Si tratta di una distribuzione semplice e pertanto si utilizza la formula della media aritmetica semplice : x = (21+20+20+30+22+25):6= 138:6= 23 A vendo questa tabella, calcola la media dei gelati mangiati dagli intervis intervistati tati nel modo più opportuno L a media in questo caso, è una media ponderata, che calcoliamo in questo modo: 0x9+1x53+2x21+3x15+4x0+5x2:9+53+21+15+0+2= 53+42+45+10:100= 150:100= 1,5 Rappresenta con un diagramma cartesiano i seguenti dati: Pioggia (mm) Gennaio 10 Febbraio 60 Marzo 40 A prile 240 Maggio 65 Giugno 120 Glossario Rappresentazione grafica dei dati: Graphical representation of data Media:Average Istogramma: Histogram Areogramma: Pie Chart Diagramma Cartesiano: Cartesian diagram Ideogramma: Ideogram Cartogramma: Cartogram Media aritmetica: Arithmetic average Media ponderata: Ponderate average LA MEDIANA, LA MODA, GLI SCARTI INDICE: A cura di: Daniela C. Chiara M. Carlotta T. Definizione di mediana Calcolo della mediana Storia della mediana Esempi della mediana Definizione di moda Calcolo della moda Derivazione del termine moda Esempio della moda Definizione indici di variazione Definizione scarto semplice medio Calcolo scarto semplice medio Esempio scarto semplice medio Definizione deviazione standard Storia deviazione standard Calcolo deviazione standard Esempio deviazione standard Piccolo glossario inglese Esercizi Soluzioni LA MODA, LA MEDIANA, LO SCARTO SEMPLICE MEDIO E LA DEVIAZIONE STANDARD Nella statistica descrittiva la mediana è il valore assunto dalle unità statistiche che si trovano nel mezzo della distribuzione di un carattere quantitativo o qualitativo ordinabile, è quindi un indice di posizione, il cui simbolo è Me. Questa bipartisce gli elementi presi in considerazione in due gruppi: quello a sinistra comprende i numeri minori o uguali alla mediana, mentre quello a destra comprende gli elementi maggiori della mediana. Per calcolarla dobbiamo mettere i numeri in ordine crescente o decrescente e, se il numero di dati è dispari, è il valore centrale, mentre se il numero dei dati è pari è la media aritmetica dei due valori centrali. La parola meridiano è stata introdotta da Antoine Augustin Cournot e adottata da Francis Galton; fu utilizzata poi da Gustav Theodor Fechner per sostituire il calcolo della media, più impegnativo rispetto a quello della mediana. Esempio con numero di dati dispari: Da u ’i dagi e statisti a su sette studenti abbiamo ricavato le loro altezze: 1,62m- 1,60m- 1,71m- 1,78m1,64m- 1,74m-1,68m. Mettiamo in ordine i dati: 1,60m1,62m- 1,64m- 1,68m- 1,71m- 1,74m1,78m. Il numero centrale tra i sette è: 1,68m perciò la mediana è: 1,68m. Esempio con numero di dati pari: Abbiamo ricavato le età di sei ragazzi che freque ta o l’u ive sità di medicina: 24, 21, 26, 23, 25, 22. Mettiamo in ordine i dati: 21, 22, 23, 24, 25, 26. I numeri con i quali dobbiamo fare la media aritmetica sono: 23, 24. Facciamo la media: (23+24):2= 23,5. Quindi la mediana è: 23,5. La moda di un insieme di dati è il dato che si presenta con la frequenza maggiore; non è detto che in un insieme di dati ci sia per forza una moda, infatti se non ci sono elementi ripetuti non è presente; ci può però essere anche più di una moda, se appaiono più elementi con la stessa frequenza: infatti una distribuzione è detta unimodale se ammette un solo valore modale, è detta bimodale se ne ammette due. Si può calcolare la moda anche nel caso di distribuzioni di frequenze i cui valori sono raggruppati in classi: si parla quindi di classe modale, che può essere determinata anche da un istogramma, individuando l’i te vallo di altezza assi a. Pe calcolarla prima si mettono tutti i numeri in ordine crescente, poi si individuano i numeri che appaiono con maggiore frequenza all'interno della serie: questi costituiscono la moda. Il termine moda deriva dal latino «modus» che significa «maniera» o «norma»; nel linguaggio comune indica le usanze che attualmente godono di maggior popolarità. Esempio: Intervistando una classe di 25 persone del liceo classico abbiamo calcolato la classe modale delle materie preferite: matematica, inglese, matematica, greco, italiano, inglese, latino, matematica, matematica, italiano, latino, greco, greco, matematica, inglese, latino, italiano, matematica, greco, inglese, italiano, greco, inglese, matematica, greco. Perciò: latino=3; italiano=4; inglese=5; greco=6; matematica=7. La classe modale è quindi la matematica. Se in due sequenze di numeri con la stessa media in una i valori sono più lo ta i da essa e t e ell’alt a so o più vicini a questa, si dice che le due sequenze hanno diversa variazione o dispersione; per misurarla si usano indici di dispersione: il campo di variazione, lo scarto semplice medio e la deviazione standard. In statistica il campo di variazione (anche detto intervallo di variabilità o gamma) è dato dalla differenza tra il valore massimo ed il valore minimo di una sequenza di numeri; è il più semplice tra gli indici di dispersione, ma anche il meno accurato, in quanto tiene conto soltanto del primo e dell’ulti o valo e e o di uelli intermedi. Esempio: Co u ’i dagi e statisti a abbiamo ricavato le misure del peso di un gruppo di studenti: 50, 48, 51, 45, 60, 53, 55, 47, 58. Mettiamo in ordine questi dati: 45, 47, 48, 50, 51, 53, 55, 58, 60. Facciamo ora la differenza tra il valore massimo e quello minimo: 60-45= 15, che è il campo di variazione. Lo scarto semplice medio, o scarto medio assoluto, si utilizza quando due serie di dati hanno lo stesso numero di valori, la stessa media e lo stesso campo di variazione, ma con gli altri numeri diversi; si calcola per primo lo scarto assoluto della media, ossia la differenza della media con ognuno degli altri valori il cui risultato è sempre positivo in quanto gli scarti della media vanno presi in valore assoluto, e poi si calcola la media aritmetica degli scarti e si ottiene così lo scarto semplice medio. Esempio: numeri: Abbiamo due serie di 3, 4, 7, 10, 15, 21 3, 6, 8, 10, 12, 21 Esse hanno lo stesso numero di valori (6), la stessa media (60:6=10) e lo stesso campo di variazione (21-3=18). Per ogni valore calcoliamo lo scarto assoluto della media della prima serie: 3-10=7; 4-10=6; 7-10=3; 10-10=0; 1510=5; 21-10=11 e della seconda serie: 3-10=7; 6-10=4; 8-10=2; 10-10=0; 1210=2; 21-10=11. Adesso calcoliamo la media aritmetica di entrambe le serie, ottenendo così lo scarto semplice medio: (7+6+3+0+5+11):6=5,3 e (7+4+2+0+2+11):6=4,3. La deviazione standard (detta anche scarto quadratico medio o scarto tipo) è la radice quadrata della media aritmetica dei quadrati degli scarti dei numeri presi in considerazione dalla loro media matematica. Fu Pearson ad introdurla nel mondo della statistica nel 1894, rappresentandola con σ (sigma); fu comunemente tradotta con deviazio e sta da d , a he se l’E te Nazionale Italiano la tradusse con s a to tipo , ossia la adi e uad ata della varianza, che è la media aritmetica dei quadrati dei loro scarti dalla media. Per calcolare la deviazione standard bisogna fare la media aritmetica dei valori presi in considerazione, calcolare lo scarto semplice medio di ogni valore, elevare il risultato alla seconda ottenendo gli scarti quadratici, calcolare la varianza e infine fare la radice quadrata del risultato. Esempio: Abbiamo una sequenza di cinque numeri: 21,22,25,28,30. Facciamo la media aritmetica: (20+22+25+28+30):5=25. Calcoliamo gli scarti quadratici: (20-25)²=25; (22-25)²=9; (25-25)²=0; (28-25)²=9; (30-25)²=25. Calcoliamo la varianza: (25+9+0+9+25):5=13,6. Eseguiamo la radice quadrata ottenendo la deviazione standard: σ=3,68. Se il numero di dati di cui disponiamo è pari, la mediana è la media dei due valori centrali. V. F.? MINI-GLOSSARIO INGLESE Mediana= median Moda= mode Campo di variazione= field of variation Scarto semplice avarage gap Deviazione deviation medio= standard= simple standard Varianza= variance Se il numero di dati di cui disponiamo è dispari, la mediana è il dato centrale. V. F.? La parola mediana è sinonimo di media. V. F.? Da u ’i dagi e statisti a svolta su un campione di cinque ragazzi sulla quantità di vacanze annue svolte, sono risultati questi dati: 3, 2, 4, 1, 5. Come bisogna procedere per trovare la mediana e qual è tra questi dati? ESERCIZI MEDIANA Nella sequenza di numeri 4, 7, 10, 11, 15, 17, 20 la mediana è 11. V. F.? La mediana è il dato che si presenta con la frequenza maggiore. V. F.? Pe al ola e la edia a l’ulti o passaggio è quello di mettere in ordine i dati. V. F.? La mediana è un indice di posizione. V. F.? Da u ’i dagi e statisti a svolta su die i ragazzi sono stati ricavati i minuti che essi impiegano per andare a scuola: 5, 20, 45, 30, 15, 40, 25, 10, 35, 50. Come bisogna procedere per trovare la mediana e qual è tra questi dati? Da u ’i dagi e statisti a su ui di i persone si è ricavato il numero di libri che ognuna di esse possiede: 30, 60, 55, 40, 20, 35, 57, 23, 32, 44, 56, 29, 51, 35, 22. Come bisogna procedere per trovare la mediana, e qual è? Cos’alt o si ota all’i te o di uesta distribuzione di numeri? MODA Nella sequenza di numeri 3, 5, 5, 8, 10 la moda è 5. V. F.? In ogni insieme di dati è sempre presente una moda. V. F.? E’ stata svolta u ’i dagi e statisti a sul numero di animali posseduti da venti persone, e i risultati sono questi: 3, 5, 0, 2, 5, 4, 1, 6, 3, 7, 2, 0, 4, 1, 6, 0, 2, 5, 1, 2. Trova la/e moda/e e la mediana e rappresenta i dati sotto forma di grafico. Non esiste che in un insieme di dati vi sia più di una moda. V. F.? Si dice classe modale quando la moda è calcolata fra valori raggruppati in classi. V. F.? Si dice che una distribuzione di valori è bimodale se ci sono due numeri con la frequenza massima. V. F.? Da u ’i dagi e statisti a si so o ricavati i gusti di gelato preferiti da otto persone: crema, cioccolato, fragola, frutti di bosco, pistacchio, cioccolato, nocciola, cioccolato. Qual è la moda dei gusti di gelato preferiti? Da u ’i dagi e statisti a si so o ricavate le taglie di pantaloni portate da dodici ragazze: 40, 38, 42, 40, 38, 40, 44, 36, 38, 46, 42, 36. Qual è la oda delle taglie di pa talo i? Ce ’è più di una? Quindi questa che tipo di distribuzione è: unimodale, i odale,…? INDICI DI VARIABILITA’ Nell’ele o dei segue ti u e i: 6, , 15, 18, 20 il campo di variazione è 15. V. F.? Il campo di variazione è la differenza tra il valore maggiore e quello minore di una distribuzione di numeri. V. F.? Per calcolare lo scarto semplice medio si calcola lo scarto assoluto della media, cioè la differenza fra la media e ogni valore. V. F.? Lo scarto semplice medio è la media aritmetica degli scarti. V. F.? Il risultato dello scarto assoluto della media può essere sia positivo sia negativo. V. F.? Per calcolare la deviazione standard è necessaria la radice quadrata. V. F.? Il primo passaggio per calcolare la deviazione standard è la media aritmetica dei valori. V. F.? L’ulti o passaggio pe al ola e la deviazione standard è la varianza. V. F.? Avendo la seguente sequenza di numeri: 35, 20, 40, 25, 27, 30 qual è il campo di variazione? Calcola il campo di variazione della seguente sequenza di numeri: 35, 46, 54, 48, 32, 60, 43, 71, 67, 79. Della seguente sequenza di numeri calcola il campo di variazione, trova la mediana e la moda: 100, 98, 74, 46, 72, 64, 98, 33, 88, 45, 51. Avendo queste due sequenze di numeri, calcola lo scarto semplice medio: 1, 6, 6, 7, 8, 10, 11, 11, 12; 1, 3, 8, 8, 9, 9, 10, 12, 12. Calcola lo scarto semplice medio delle seguenti sequenze di numeri: 52, 57, 64, 66, 73, 79, 84, 85; 52, 58, 67, 69, 70, 77, 82, 85. Calcola la deviazione standard della seguente sequenza di numeri: 9, 12, 16, 19, 24, 25, 28. Calcola la deviazione standard della seguente sequenza di numeri: 20, 21, 22, 25, 26, 28, 30, 36. Calcola la deviazione standard della seguente sequenza di numeri: 51, 63, 72, 84, 95, 103. SOLUZIONI MEDIANA VERO O FALSO 1= vero Avendo queste sequenze di numeri, calcolane lo scarto semplice medio: 30, 36, 38, 40, 41, 45, 50; 30, 37, 39, 40, 41, 43, 50. 2= falso 3= falso 4= vero 5= vero 6= vero 7= falso PROBLEMI 1= 3 2= 27,5 3= 35; moda= 35 MODA VERO O FALSO 1= vero 2= falso 3= falso 4= vero 5= vero PROBLEMI 1= cioccolato 2= 30, 40; distribuzione bimodale 3= 2, 2,5 INDICI DI VARIABILITA’ VERO O FALSO 1= falso 2= vero 3= falso 4= vero 5= falso 6= vero 7= vero 8= falso PROBLEMI 1= 20 2= 47 3= campo di variazione 67; mediana 72; moda 98 1= 2,6, 2,6 2= 4,5, 4 3= 10,25, 8,5 1= 6,54 2= 4,97 3= 17,98. GLI EVENTI E LA PROBABILITA' – INTRODUZIONE ALLA PROBABILITA' – EVENTI CERTI, IMPOSSIBILI E CASUALI – EVENTI UNICI E RIPETIBILI – LA FREQUENZA – EVENTI DIPENDENTI E INDIPENDENTI – EVENTI COMPATIBILI E INCOMPATIBILI Lavinia L., Caterina C., Martina L. ESEMPIO:“l'Italia vincerà il campionato mondiale di calcio del 2018?” questo è Il termine probabilità deriva dal verbo un evento unico: l'esperimento che può latino probare “provare” o “valutare”, verificare tale evento non può essere attraverso l'aggettivo probabilis “degno ripetuto. di prababità” e quindi “verosimile”. -EVENTO RIPETIBILE: Nella vita di tutti i giorni si incontrano Se tale esperimento può essere spesso affermazioni la cui verità non si eseguito un numero indefinito di volte, può stabilire con certezza (es.domani l'evento si dice ripetibile. pioverà); tali affermazioni sono relative ESEMPIO:“lanciando un dado esce 6” è a eventi che potrebbero accadere ripetibile perchè l'esperimento in oppure no, mentre altri eventi sono questione, ossia il lancio del dado, può misurabili con l'applicazione della essere ripetuto quante volte si vuole. matematica, essa infatti utilizza un La frequenza di un evento ripetibile è il modo più preciso per misurare il grado rapporto tra un numero di successi e il di fiducia nel verificarsi di un evento: il numero di prove: calcolo delle probabilità nasce per f=m/n rispondere a queste esigenze. Gli eventi si dividono in tre tipi in base La probabilità di un evento p(E) è sempre un numero compreso fra 0 e 1: alla probabilita': 0 <= p(E) <= 1 -EVENTO CERTO: è uguale allo spazio Un evento che ha probabilità 0 è detto dei risultati ossia l'insieme di tutti i evento impossibile.Un evento che ha possibili esiti di una osservazione.(es. se una scatola contiene soltanto palline probabilità 1 è detto evento certo. nere, estraendone una a caso siamo Esempio 1. Estraendo una carta da un sicuri che sia nera.) mazzo di 40, qual è la probabilità che -EVENTO IMPOSSIBILE: è l'insieme è sia un 10 di cuori? vuoto. I casi possibili sono 40 i casi favorevoli (es. se una scatola contiene soltanto sono 0, perché nei mazzi da 40 carte palline nere, l'estrazione di una pallina non ci sono i numeri 8, 9, 10. bianca è impossibile) p(10 di cuori) = 0/40 = 0 LA PROBABILITA' -EVENTO CASUALE: si verifica oppure non si verifica. (es. se una scatola contiene palline bianche e nere, l’estrazione di una pallina nera è un evento possibile ma non certo, cosi come l’estrazione di una pallina bianca). Possiamo inoltre suddividere l'evento in: -EVENTO UNICO: Si dice evento unico se l'esperimento cui si riferisce può essere eseguito una sola volta. La probabilità di un evento si può esprimere: a) come frazione, ad esempio 3/4 b) come numero decimale, ad esempio 3/4 = 3 : 4 = 0,75 c) come percentuale, ad esempio 0,75 = 75% Nota. Per trasformare un rapporto in una percentuale si divide il numeratore per il denominatore e si moltiplica il risultato per 100. EVENTI DIPENDENTI E INDIPENDENTI: -Due eventi casuali A e B sono indipendenti se la probabilità del verificarsi dell'evento A non dipende dal fatto che l'evento B si sia verificato o no, e viceversa. Esempio 1. Abbiamo due mazzi di carte da 40. Estraendo una carta da ciascun mazzo, i due eventi: E1 = "La carta estratta dal primo mazzo è un asso" E2 = "La carta estratta dal secondo mazzo è una carta di fiori" sono indipendenti. -Un evento casuale A è dipendente da un altro evento B se la probabilità dell'evento A dipende dal fatto che l'evento B si sia verificato o meno. Esempio 1. Abbiamo un mazzo di carte da 40. Estraendo due carte in successione, senza rimettere la prima carta estratta nel mazzo, i due eventi: E1 = "La prima carta estratta è un asso" E2 = "La seconda carta estratta è un asso" sono dipendenti. Per la precisione la probabilità di E2 dipende dal verificarsi o meno di E1. EVENTI COMPATIBILI E INCOMPATIBILI: Si dicono incompatibili quegli eventi aleatori che non possono verificarsi simultaneamente in una data prova. Due eventi sono, invece, compatibili se c’è anche una sola possibilità che possano verificarsi simultaneamente, in una data prova. ESERCIZI.. 1) Un sacchetto contiene 10 palline bianche, 5 rosse e 3 nere. un secondo sacchetto contiene 15 palline bianche e 10 rosse. Qual è la probabilità che estraendo una pallina dal primo e una dal secondo , siano entrambe bianche? [Risultato : 1/3 ] 2) Da un mazzo di carte napoletane viene estratta una carta che viene rimessa nel mazzo ; si effettuano poi , altre 3 estrazioni rimettendo sempre la carta estratta nel mazzo . Qual è la probabilità di estrarre 4 carte con semi diversi? [Risultato: 3/32 ] 3) In un cassetto sono conservati 5 quaderni azzurri , 4 gialli e 3 rossi. Prendendo a caso due quaderni successivamente , senza riporre il primo a posto , calcola la probabilità di prenderli : a- Entrambi rossi [Risultato : 1/22] b- Il primo azzurro e il secondo giallo [Risultato : 5/33] c- Entrambi azzurri [Risultato : 5/33] La probabilità condizionata INDICE La probabilità condizionata pag. 1 Il teorema del prodotto per eventi dipendenti e indipendenti pag. 2 Calcolare la probabilità con Excel Esercizi Giada M. Manuela M. Laura C. pag. 3 pag. 4-6 La probabilità condizionata La probabilità condizionata di E1 rispetto a E2 è la probabilità che si verifichi l’E1 sapendo che E2 è verificato. The conditional probability of E1 is the probability that the event will occur given the knowledge that E2 has already occurred. P(E1|E2) = P(E1∩E2)/P(E2) Esempio: Calcola la probabilità che estraendo una carta da un mazzo di 40, questa sia una figura, sapendo che la carta estratta è rossa. E1 = la carta estratta è una figura E2 = la carta estratta è rossa Dobbiamo calcolare P(E1|E2). L’insieme E1∩E2 è costituito dalle figure rosse e contiene quindi 6 elementi. P(E1∩E2) = 6/40 = 3/20 L’insieme E2 è costituito dalle carte rosse e contiene 20 elementi. P(E2) = 20/40 = ½ Quindi si ha: P(E1|E2) = P(E1∩E2)/P(E2) P(A/B) = 3/20 : ½ = 3/10 Se P(E1) è diversa dalla probabilità condizionata P(E1|E2), i due eventi sono dipendenti, altrimenti sono indipendenti. If P(E1) is different from the conditional probability P(E1|E2), the two events are independent, otherwise they’re independent. Il teorema del prodotto per eventi indipendenti Il teorema del prodotto per eventi dipendenti Due eventi A e B si dicono indipendenti se il verificarsi dell’uno non influenza il verificarsi dell’altro. Two events A and B are called independent if the occurrence of one doesn’t influence the occurrence of the other one. Due eventi A e B si dicono dipendenti se il verificarsi dell’uno influenza il verificarsi dell’altro. Two events A and B are called dependent if the occurrence of one influences the occurrence of the other one. Se due eventi (E1 ed E2) sono indipendenti, la probabilità del loro evento intersezione è uguale al prodotto delle loro probabilità. If two events (E1 and E2) are independent; the probability of their occurrence intersection is equal to the product of their probabilities. P(E1∩E2) = P(E1) ⋅ P(E2) Esempio: Si lanciano contemporaneamente una moneta e un dado e si considerano i due eventi “esce testa” ed “esce il numero 6”. Fra i due eventi non c’è nessun legame, ognuno si può verificare indipendentemente dall’altro, infatti la probabilità che esca testa sulla moneta non influenza la probabilità che esca il numero 6 sul dado, poiché si tratta di eventi indipendenti. P(E1∩E2) = P(E1) ⋅ P(E2) P(E1∩E2) = ½ ⋅ ⅙ = 1/12 Se due eventi (E1 ed E2) sono dipendenti, la probabilità del loro evento intersezione è uguale al prodotto della probabilità di E1 per la probabilità E2 condizionata a E1. If two events (E1 and E2) are dependent, the probability of their occurrence intersection is equal to the product of the probability of E1 multiplied by the probability of E2 conditioned by E1. P(E1∩E2) = P(E1) ⋅ P(E2|E1) Esempio: Da un bussolotto contenente cinque tessere numerate da 1 a 5 estraiamo un pezzo (1), ma non lo rimettiamo al suo posto. Successivamente ne estraiamo un altro pezzo (4). Qual è la probabilità che possano essere estratti l’1 e poi il 4? P(E1∩E2) = P(E1) ⋅ P(E2|E1) P(1∩4) = P(1) ⋅ P(4|1) P(1∩4) = ⅕ ⋅ ¼ = 1/20 Calcolare la probabilità con Excel E’ possibile calcolare la probabilità in un problema anche dal computer. Il programma che viene usato è Microsoft Excel: - Aprire un foglio elettronico - Inserire le didascalie - Digitiamo le seguenti funzioni per il controllo dei dati: D4 = SE(C4>0; "accettabile,";"errato,") D5 = SE(C5>C4; "errato,";"accettabile,") D6 = SE(C6>C4-C5; "errato.";"accettabile.") D7 = SE(O(D4 = "errato,"; D5 = "errato,"; D6 = "errato.");"";"=") C7 = C4-(C5+C6) C9 = SE(D7 = ""; "non è calcolabile"; C7/C4) - Il modulo è pronto per aggiungere i dati; per ottenere la probabilità in percentuale basta selezionare C9, andare su Formato > Numero e cliccare su Percentuale. PROBLEMI 1 Due urne contengono: Urna 1 = 5 palline rosse e 5 blu Urna 2 = 8 palline rosse e 4 blu Viene estratta una pallina da ogni urna. Qual è la probabilità che siano entrambe blu? 2 Da un mazzo di 40 carte si estraggono successivamente 2 carte. Calcola la probabilità di estrarre 2 carte di fiori nel caso di reimmissione nel mazzo della prima carta estratta. 3 Da un’urna contenente 18 palline numerate (da 1 a 18) si estrae una pallina, sia: A = numero divisibile per 2 (pari) B = numero divisibile per 3 Stabilisci se i due eventi sono indipendenti. 6 In un sacchetto ci sono 4 foglietti, A, B, C e D. Qual è la probabilità che venga estratto prima il foglietto A e poi il foglietto D se il foglietto A è stato rimosso dal sacchetto? VERO/FALSO 1. 2. 3. 1. 4 In una classe ci sono 28 ragazzi che devono essere interrogati di greco. Vengono estratti dei bigliettini con i numeri di registro degli studenti. Qual è la probabilità che venga estratto il bigliettino n° 3 e, senza rimetterlo al suo posto, anche quello n°28? 5 Durante l’estrazione del lotto la probabilità che possa uscire un numero è di 1/90. Qual è la probabilità che venga estratto prima il 12 e poi il 75? 2. 3. 1. 2. 7 Due eventi si dicono indipendenti se il verificarsi dell’uno non influenza il verificarsi dell’altro. Se due eventi (E1 ed E2) sono indipendenti, la probabilità del loro evento intersezione è uguale al prodotto della probabilità di E1 per la probabilità E2 condizionata a E1. La formula degli eventi indipendenti è P(E1UE2) = P(E1) ⋅ P(E2) 8 Se due eventi (E1 ed E2) sono indipendenti, la probabilità del loro evento intersezione è uguale al prodotto delle loro probabilità. La formula degli eventi indipendenti è P(E1∩E2) = P(E1) ⋅ P(E2) Due eventi si dicono indipendenti se il verificarsi dell’uno influenza il verificarsi dell’altro. 9 Due eventi (E1 e E2) si dicono dipendenti se P(E1∩E2) = P(E1) ⋅ P(E2) Due eventi (E1 e E2) si dicono dipendenti se P(E1∩E2) = P(E1) ⋅ P(E2|E1) 3. 1. 2. 3. Due eventi (E1 e E2) si dicono dipendenti se il verificarsi dell’uno non influenza il verificarsi dell’altro. 10 Tre eventi (E1, E2 e E3) si dicono dipendenti se il verificarsi di uno influenza il verificarsi degli altri due. Quattro eventi (E1, E2, E3 e E4) si dicono dipendenti se il verificarsi di uno influenza il verificarsi soltanto di un altro. Due eventi (E1 e E2) si dicono dipendenti se P(E1∩E2) = P(E1) ⋅ P(E1|E2) PROBLEMA A RISPOSTA MULTIPLA 11 Ci sono tre numeri, 1, 2 e 3. Estraendone uno dispari e tenendolo da parte, la possibilità che estraendone un altro i due numeri siano entrambi dispari è: 1. ⅙ 2. 3. PROBLEMA DA RISOLVERE SU EXCEL 12 In un cesto ci sono in totale 20 frutti: 10 clementine e 7 arance, il resto mele. Calcola la probabilità di estrarre una mela. LA REDAZIONE LETIZIA A CECILIA B CATERINA C ROSA C DANIELA C LAURA IVANA C TIZIANA D A CORINNA L MARTINA L LAVINIA L GIADA ELISA M CHIARA M MANUELA M GLORIA P CARLOTTA T ROSITA T . . . . . . . . . . . . . . . . . PROF SSA CLAUDIA C . .