NOZIONI DI STATISTICA E. Rosin Definizione : La parola “statistica” significa studio delle caratteristiche di un gruppo, più o meno numeroso, per darne una descrizione generale. Per fare questo ci si disinteressa delle caratteristiche di un singolo, ad esempio l’altezza media di una classe di alunni può risultare di 1,70 m senza che nessun alunno sia alto proprio 1,70 m. Ancora, si può interpretare questo dato statistico dicendo che, misurando degli alunni presi a caso, risulterà improbabile che tutte le loro altezze si scostino molto da 1,70 m. Si può intuire bene il significato dell’aggettivo “statistico” considerando il suo contrario cioè “deterministico” che vuol dire esattamente definito ed esattamente attribuito. L’esempio più semplice è dire: “L’alunno Carletto Barilotti (proprio lui) è alto 1,38 m e pesa 82,35 Kg”. Talvolta si sente dire “stocastico” ma non ci si deve preoccupare perché stocastico è sinonimo di statistico nel senso che non si può prevedere il risultato esatto di una misura ma se ne sa la media. La parola statistica prende origine da “stato” perché, nel 18° secolo, i vari sovrani hanno cominciato ad ordinare degli studi per sapere quanto grano si poteva produrre, oppure quanti soldati si potevano arruolare e via dicendo, appunto nei loro stati. Indicatori statistici : Si tratta di tutte quelle grandezze che servono a caratterizzare, ovvero descrivere, una moltitudine, un gruppo numeroso, una popolazione ecc. Gli indicatori statistici più comuni, ma non i soli, sono la media, la moda e la mediana che poi saranno definiti. Esempio n°1 Si abbia una produzione di pasticcini e un cliente si è lagnato del loro peso scarso, come si può verificare se ha ragione o meno? Evidentemente, non essendo i pasticcini tutti rigorosamente uguali, non ha senso pesarne uno per verificare il peso ma bisogna ricorrere alla statistica. L’intuizione suggerisce di mettere sulla bilancia molti pasticcini e dividere il peso per il numero di essi. Così facendo, senza saperlo, si applica l’indicatore statistico “media” per rispondere alla contestazione del cliente. Si immagini che, per contratto, il peso del pasticcino debba essere di 65 grammi e che 125 pasticcini, presi a caso e messi sulla bilancia, pesino 8113 g. Risulta Pmedio= 8113/125= 64,9 g Ora, la protesta del cliente può essere accettata se nel contratto si prevedeva che il peso medio dei pasticcini variasse meno di un decimo di grammo. Esempio n°2 Le galline del vostro pollaio, tutte diverse tra loro, cominciano a deporre alcune uova leggere e sospettate che ciò possa dipendere da un certo nuovo mangime. Per accertarvene prendete 50 uova deposte al tempo del vecchio mangime e ne confrontate il peso con quello di 60 deposte con il nuovo, a parità delle altre condizioni, e risulta P1 medio = 3550/50= 71 g P2 medio = 4230/60= 70,5 g Ora la differenza di peso tra un uovo e l’altro può essere, per un’infinità di motivi, maggiore di 0,5 g e quindi la differenza tra 71 e 70,5 g non è significativa. Si può dire il nuovo mangime non ha effetto e che il calo del peso di alcune uova dipende da altro. Esempio n°3 Cento persone si ammalano di peste e vengono curate in ospedale dove 70 guariscono e le altre 30 restano ammalate. Tutti sono stati curati con lo stesso farmaco e ci si chiede come mai non siano guariti tutti. Da un’indagine risulta che, dei 70 guariti, 60 bevono grappa in abbondanza mentre dei 30 rimasti ammalati nessuno ne beve. Per il resto non è stato possibile ricostruire i comportamenti dei pazienti. Si può dire, con buona probabilità, che la grappa rende più efficace il farmaco. LE MEDIE Il lettore attento avrà notato che negli esempi precedenti si sono viste delle medie, in omaggio alla definizione della statistica che non si interessa dei ”casi singoli”. Media aritmetica. Si tratta della media più comune e quando non si precisa nulla si sottintende appunto questo tipo di media. Vale la formula m=(a1+a2+……………..+an)/n dove gli a indicano le grandezze da mediare ed n è il numero delle misure. Esiste anche un’altra formula del tutto equivalente m=(a)/n dove il simbolo (sigma) significa “sommate tutti i valori seguenti”. Esempio n°1 Si calcoli l’altezza media fra queste sette persone h1=1,75 m h2=1,85 m h3=1,83 m h4=1,48 m h5=1,73 m h6=1,81 m h7=1,88 -- h=(1,75+1,85+1,83+1,48+1,73+1,81+1,88)/7=1,76 m il trattino sopra la h significa valor medio Esempio n°2 Si esegua una misura del diametro di un oggetto con uno strumento molto preciso e si abbiano i seguenti risultati 20 15 17 32 volte volte volte volte 1,546 1,544 1,542 1,547 cm cm cm cm Si calcoli il diametro medio. -- d=(20*1,546+15*1,544+17*1,542+32*1,547)/(20+15+17+32) -- d=1,545 cm La media ponderata Quando leggete la vostra pagella fate la media aritmetica dei voti e vedete che prendere un bel voto in una materia piuttosto che in un’altra, oppure prendere un votaccio in una materia piuttosto che in un’altra, non cambia il risultato ma, in realtà ci sono materie più difficili di altre che dovrebbero quindi “pesare” di più sulla media. Per risolvere questo problema è stata inventata la media ponderata in cui ad ogni valore è associato un numero detto “peso”. La formula è Mp=(p1*v1+p2*v2+……………+pn*vn)/(p1+p2+…………….+pn) dove v indica i valori da mediare (i voti per esempio) e p indica i pesi. Esempio Nella scuola di Harry Potter si insegnano diverse materie, di diversa importanza, e la tabella che segue è una pagella Materia Inglese Matematica Storia Francese Stregoneria Malefici Spiritismo Malocchio | voto | 8 | 7 | 7 | 7 | 5 | 6 | 6 | 7 | peso | 3 | 2 | 4 | 2 | 9 | 12 | 11 | 10 Il voto medio ponderato risulta -- vp=(3*8+2*7+4*7+2*7+9*5+12*6+11*6+10*7)/(3+2+4+2+9+12+11+10) -- vp= 6,3 la media risulta bassa perché nelle materie “professionali”, stregoneria in particolare, i voti non sono alti. La media geometrica Di questo tipo di media si dà solo la formula per informazione n__________________________________ mg= √a1*a2*a3*........an _ Si ricorda che il simbolo √d =f (radice ennesima di d uguale f) significa che fn=d cioè trovate quel numero che moltiplicato per sé stesso n volte dia proprio d. n La media armonica Questa specie di media è utile agli elettricisti per calcolare la resistenza elettrica complessiva se i resistori sono collegati in parallelo. Vale la formula ma=1/(1/a1+1/a2+1/a3........+1/an) Esempio Sia il seguente un circuito elettrico con le resistenze da 2 Ω, 4 Ω, 5 Ω e 6 Ω, se ne calcoli la resistenza complessiva. 2 Ω 4 Ω 5 Ω 6 Ω Risulta R=1/(1/2+1/4+1/5+1/6)= 1/(0,50+0,25+0,20+0,167)=0,89 Ω La stessa formula vale per i condensatori connessi in serie. Esercizi Calcolate la media ponderata dei vostri voti dando un peso 8 ai moduli professionali, 4 all’italiano e all’inglese e 2 alle altre materie e poi confrontatela con la media aritmetica. Calcolate il numero medio di abitanti per ogni casa nel vostro vicinato dando peso 1 agli umani, peso 0,6 ai cani e peso 0,5 ai gatti. Calcolate il peso medio armonico nella vostra classe e confrontatelo con quello medio aritmetico. La moda Nel parlare comune si dice che un oggetto è di moda se molti lo utilizzano e in statistica questo vocabolo ha quasi lo stesso significato volendo dire che è il valore seguito dal sottogruppo più numeroso di una popolazione. Esempio n°1 Osservando la tabella si vede che, in un certo periodo, sono state vendute delle scatole, di vario peso, di cibo per gatti. Peso delle scatolette Scatolette vendute 50 g 25 100 g 30 150 g 60 200 g 80 250 g 75 300 g 64 350 g 50 Le scatolette più vendute sono state quelle da 200 grammi e allora si dice che 200 è il valore “modale” o di moda. Esempio n°2 Nello stesso periodo si è fatta stessa osservazione riguardo le scatolette di cibo per cani. Peso delle scatolette Scatolette vendute 50 g 12 100 g 17 150 g 50 200 g 70 250 g 76 300 g 82 350 g 60 Il valore di moda è stato 300 grammi. A cosa può servire confrontare le mode? In questo caso si può dedurre, dal confronto delle mode, che il “cane medio” dei clienti di quel negozio consuma 1,5 (300/200) volte la quantità di cibo mangiata dal “gatto medio” ovvero le famiglie possiedono dei cani che, in maggioranza, non sono molto più grandi dei gatti, almeno nell’ipotesi che i cani mangino in proporzione alla loro stazza. Ancora, la moda di 200 grammi per i gatti corrisponde ad 80 scatolette vendute e quella per i cani a 82 così si conclude che il numero di famiglie che ha il cane è quasi pari a quello di famiglie che ha il gatto. Esercizi Guarda gli astucci dei tuoi compagni e vedi qual é il valore modale del numero di penne poi confrontalo con il valor medio. Ricava, dalla tabella, l’anno di moda del grano e del mais. Anno Grano in tonn. Mais in tonn. 1950 20,0 7,5 1951 18,5 9,0 1952 22,5 10,0 1953 25,0 8,5 1954 24,0 8,0 1955 19,5 10,0 1956 21,0 11,0 1957 22,5 10,5 1958 25,0 9,5 1959 23,0 11,0 1960 23,5 10,0 La mediana E’ molto facile farsi ingannare dal nome e credere che “mediana” sia sinonimo di valore medio ma non è così. La mediana è quel valore, fra i tanti disponibili dalle tabelle o misurabili in una popolazione, tale che metà della popolazione corrisponda a valori inferiori e, ovviamente, l’altra metà corrisponda a valori superiori. Esempio Si calcoli la mediana nel gruppo di queste foglie di alloro. Lunghezza in mm Numero di foglie 118126 3 127135 5 136144 9 145153 12 154162 5 136171 4 172180 2 Totale 40 foglie Occorre cercare quel valore di lunghezza delle foglie tale che venti di esse, cioè la metà, siano più corte e si può provare per tentativi. Ora, un valore compreso tra i 127 e i 135 mm non può essere una mediana perché solo tre foglie gli sono minori e quindi bisogna tentare con il successivo. Neppure un valore compreso tra i 136 e i 144 mm può esser preso come mediana perché sotto di esso ci sono solo 3+5=8 foglie e allora occorre ritentare. L’intervallo di 145-153 mm, non è raggiunto da 3+5+9=17 foglie (poche) e quello successivo, 154-162 mm, non è raggiunto da 3+5+9+12=29 foglie (troppe) quindi quel valore di lunghezza che divide l’insieme di foglie in due parti da venti ciascuna deve essere per forza compreso tra 145 e 154 mm. A cosa serve la mediana? Osservando il valore della mediana si può avere un’idea di come è distribuita una popolazione, per esempio un alto valore di mediana della statura farà pensare ad un gruppo di scandinavi e, in più, confrontando la mediana con la media si vede se la popolazione è ripartita uniformemente in altezza o meno. Esercizi Inventate un modo per calcolare più precisamente la mediana nell’esempio precedente. Trovate la mediana di questa serie di numeri 18,3 20,6 19,3 22,4 20,2 18,8 19,7 20,0 Qual è il peso mediano della tua classe? Qual è il voto mediano della tua classe in inglese?