Università degli Studi di Ferrara
Facoltà di Scienze MM.FF.NN.
CdL in Tecnologie Fisiche Innovative
Sistemi di Qualità, collaudi e controlli
Prof. Eliana Grossi
Prof. Renato Barbieri
Statistica: le grandezze, i sette strumenti, i controlli
Statistica: cosa è e a cosa serve
Etimologicamente statistico è un aggettivo per indicare attinente allo Stato.
Da G. BERNARDONI, Elenco di alcune parole oggidì frequentemente in uso … - Milano
1812:
“Descrizione di un paese in tutte le sue parti di amministrazione sì
pubblica che privata”
Da Dizionario politico, nuovamente compilato ad uso della gioventù italiana - Torino 1849:
“ … prima la chiamavano talvolta Aritmetica politica.”
Da Dizionario politico popolare - Torino 1851:
“… offre le cifre della popolazione di un paese in date epoche, il numero
dei ricchi e dei poveri, degli istruiti e degl’idioti, degli operai, degli oziosi,
dei vagabondi, dei carcerati, dei pazzi, di ogni genere di delitti, di suicidi
… studia nelle ragioni di queste proporzioni di trovare le radici dei mali e
di attivare i rimedi”
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: cosa è e a cosa serve
Da Dizionario enciclopedico italiano - Roma 1960:
“… legge probabilistica di distribuzione delle particelle d’un sistema
che permette di definire le proprietà del sistema stesso quando
l’elevato numero delle particelle non consente lo studio di ognuna
di esse.”
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: funzioni
Riassumendo:
• … trovare le radici dei mali e di attivare i rimedi
• … definire le proprietà del sistema … [nel caso di] elevato numero
[di] particelle
Tipo di statistica
STATISTICA DESCRITTIVA
Aggregazione di molti dati di dettaglio in pochi dati consuntivi
STATISTICA INFERENZIALE
Estensione ragionata delle informazione tratte dalle particelle all’intero
sistema
Nota: Inferenziale etimologicamente è proprio di chi porta dentro
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: come si studia in Italia
Le facoltà di Scienze Statistiche si trovano presso:
• Università di Milano - Bicocca
• Università di Padova
• Università di Bologna
• Università di Roma – La Sapienza
• Università di Messina
In tutte sono previsti:
• Corsi triennali di Laurea
• Corsi biennali di Laurea Magistrale
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: oggetto
Per Popolazione si intende tutti gli elementi, attraverso i quali un
fenomeno si può presentare.
Per esempio, tutti i valori di una grandezza oppure tutti i pezzi della produzione in
esame.
Per Campione di una Popolazione si intende una parte più o meno
grande degli elementi della Popolazione in esame, attraverso i
quali si possono ottenere conoscenze attribuibili a tutti gli elementi.
Campione (da campo) era il cavaliere cui veniva affidato la difesa di una dama o,
più in generale di una comunità.
E’ evidente la delicatezza della scelta della quantità e della qualità
dei campioni (compromesso tra costi e rappresentatività).
E’ un tema ben noto a chi si occupa di sondaggi.
L’attributo campionario sta ad indicare che una grandezza si
riferisce solo ai campioni rilevati e non all’intera popolazione.
Per esempio Media campionaria o Varianza campionaria.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: le grandezze
•
•
•
•
•
•
•
Percentuale
Media
Altre grandezze centrali
Dispersione
Scarto
Varianza
Deviazione
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Percentuale
La Percentuale è un particolare tipo di Proporzione.
La Proporzione rappresenta l’eguaglianza di due rapporti tra
quattro elementi:
A sta a B come A’ sta a B’
ossia
A/B=A’/B’
Note:
• da Euclide (Elementi) gli studi sulle Proporzioni
• da Cicerone il nome (“davanti alla parte” come il greco “analogia”)
Se B=100, A è la rappresentazione percentuale del rapporto degli
elementi A’ e B’, calcolata come:
A=A’/B’*100
Il simbolo % identifica il valore A come Percentuale
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Percentuale (continua)
La Percentuale relativa agli elementi A’ e B’ è significativa se:
1.A’ è una porzione di B’ (parte di un tutto)
A’ sono gli elettori del candidato X e B’ sono tutti i partecipanti al voto.
Se i votanti sono stati 20.000 ed i voti per X sono stati 10.800, si può dire che
la percentuale di voti ottenuta dal candidato X è il 54%.
2.A’ è la differenza di due valori di B’
B1’ è il prezzo normale del biglietto di uno spettacolo e B2’ è il prezzo dello
stesso biglietto per uno studente o un anziano. A’= B1’-B2’ è la differenza del
prezzo del biglietto intero e di quello del biglietto ridotto.
Se il biglietto intero costa 50 Euro e quello ridotto 35 Euro, si può dire che la
percentuale di sconto è il 30% (naturalmente rispetto al prezzo intero B1’).
3.A’ e B’ sono due misure diverse della stessa grandezza
A’ è il costo attuale di un barile di petrolio e B’ il costo che il barile di petrolio
aveva un anno fa. Se il costo attuale è 35$ e quello di un anno fa 140$, si può
dire che il costo attuale è il 25% del precedente.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Percentuale (continua)
Vantaggi e significatività della Percentuale:
• è una forma standard compatta
• comunica una quantità di informazioni a chiunque
• non è sensibile alle variazioni delle grandezze a cui si riferisce
Il candidato che ha avuto 10.800 voti può esaltarsi per la vittoria o amareggiarsi per
la sconfitta?
E quando sa che ha avuto il 54% dei voti?
15 Euro in meno sono un consistente risparmio per uno studente o un anziano?
Ed uno sconto del 30%?
105 $ di variazione di prezzo unitario sono molti?
Quanto vale il fatto che il nuovo prezzo sia il 25% di quello precedente?
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Percentuale (continua)
Significatività della Percentuale: è funzione della granulosità del
rapporto di cui è rappresentazione.
Tutte le informazioni statistiche hanno senso per i grandi numeri.
Esempio: Analisi delle percentuali di non conformità su una data produzione
N. Prodotti
N. Non Conformità
Percentuale
- 1
0 oppure 1
0% oppure 100%
- 2
0, 1, 2
0%, 50%,100%
- …
- 10
0,1,2,….,10
0%,10%,20%, …, 100%
- …
- 100
0,1,…..,99,100
0%,1%,2%, …, 99%,100%
Nota: Solo dopo 100 campioni ha senso l’utilizzo dell’unità nella Percentuale e solo dopo
1000 campioni quello di un decimale.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Media
Dati n campioni di una variabile misurabile, la Media è la somma dei
valori degli n campioni, divisa per il numero dei campioni.
Si chiama Media aritmetica o anche
Media campionaria.
E’ uno degli strumenti fondamentali per ottenere da una nuvola di
valori il loro baricentro.
Gli esempi di utilizzo della media nella vita quotidiana sono infiniti: l’altezza media, il
peso medio, l’età media, la votazione media, etc.
Si potrebbe dire che, visto che c’è chi ha avuto di più e chi ha avuto di meno, si mettono
insieme tutte le risorse in un unico contenitore e poi si suddivide il contenuto, in modo
equo, tra tutti i partecipanti.
In inglese Arithmetic mean (in uso anche Average dall’arabo Awar)
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Media (continua)
Quello che la Media non sa dire (dispersione dei campioni):
La stessa Media può essere ottenuta con valori di campioni molto
diversi.
A: n campioni di valore 1 ed n campioni di valore -1 (Media=0)
B: n campioni di valore 1000 ed n campioni di valore -1000 (Media=0)
C: n campioni di valore 1.000.000 ed n campioni di valore -1.000.000 (Media=0)
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Media (continua)
Quello che la Media non sa dire (frequenza dei campioni):
Progetto di Enrico IV di Francia: “sa poule-au-pot”
“Voglio che alla domenica ciascun abitante abbia il suo pollo in pentola”.
La situazione dei polli in un villaggio di 10 capi-famiglia poteva essere:
8 senza polli
1 con un pollo
1 con nove polli
che produce una Media=1, secondo i desideri di Enrico IV, con parecchi abitanti
insoddisfatti.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Altre grandezze centrali - Mediana
Dati n campioni di una variabile misurabile, la Mediana è il valore che
occupa la posizione centrale, ove si siano messi in ordine crescente
gli n valori.
Campioni: 2, 8, 3, 1, 9 - In ordine crescente: 1, 2, 3, 8, 9
Mediana=3 perché lascia 2 valori (1 e 2) prima e 2 valori (8 e 9) dopo di sé.
Media=4.6
Nota: Nel caso di n pari, la Mediana è la media aritmetica dei due valori centrali.
La Mediana viene definita anche come il 50-esimo Percentile,
perché, nella sequenza ordinata di n campioni, ha 50% campioni che
lo precedono e 50% campioni che lo seguono.
Più in generale l’m-esimo Percentile è il valore che nella sequenza
ha m% campioni che lo precedono e (100-m)% campioni che lo
seguono.
Il 25-esimo Percentile viene anche detto Primo Quartile.
Il 75-esimo Percentile viene anche detto Terzo Quartile.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Altre grandezze centrali - Moda
Dati n campioni di una variabile misurabile, la Moda è il valore che
si presenta con la maggiore frequenza.
Tornando al progetto di Enrico IV:
• senza polli: 8 campioni hanno valore 0
• con un pollo: 1 campione ha valore 1
• con nove polli: 1 campione ha valore 9
Media=1 e Moda=0
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Altre grandezze centrali – Media troncata
Dati n campioni di una variabile misurabile, la Media troncata è il
valore che si ottiene, eliminando una certa percentuale dei
campioni (quelli alle estremità, con i valori più grandi ed i valori più
piccoli), prima di farne la media aritmetica.
Media troncata all’80% di 20 campioni
-54 -43 4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25 26 27
Si ottiene eliminando i campioni 26, 27, -54, -43 ottenendo la Media Troncata=13.4
(Media Aritmetica=8.5)
ATTENZIONE AI TRONCAMENTI!
E’ utile quando si ha il sospetto che alcuni campioni caduti molto
lontani da quelli in posizione centrale siano affetti da errori.
Si chiama anche Trimmed Mean o Media Sfrondata.
La Media olimpica è un particolare tipo di troncamento
(eliminazione del massimo e del minimo).
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Altre grandezze centrali – Massimo e Minimo
L’utilizzo di Massimo e Minimo dei valori di n campioni può dare
un’idea grossolana di dove si posiziona il centro.
Se Max è il valore massimo e Min è il valore minimo si ipotizza che
il valore centrale sia
(Max+Min)/2
In inglese sarebbe un valore Average.
Per i 20 campioni
-54 -43 4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25 26 27
Max=27 e Min=-54 quindi (Max+Min)/2=-13.5
Se si fossero utilizzati i 16 campioni centrali della Media Troncata
4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25
Max=25 e Min=4 quindi (Max+Min)/2=14.5
Risultato paragonabile alla Media Troncata=13.4
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Dispersione dei campioni
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Range
Il Range (intervallo o gamma di variazione) dà informazione della
dispersione di n campioni attorno al loro centro.
Se Max è il valore massimo e Min è il valore minimo vale
Range = Max - Min
A valori di Range più elevati corrispondono maggiori dispersioni.
per -1000, -500, -100, 0, 100, 500, 1000 (Media=0 e Range=2000)
per -10, -5, -1, 0, 1, 5, 10 (Media=0 e Range=20)
Il calcolo del Range è estremamente rapido.
Non tiene conto di quanto i singoli campioni siano distanti dal
valore medio.
per -10, -5, -1, 0, 1, 5, 10 (Media=0 e Range=20)
per -10, -9, -9, 0, 9, 9, 10 (Media=0 e Range=20)
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Scarto rispetto alla media
Per ognuno degli n campioni si può valutare la distanza rispetto alla loro
Media.
Se è la Media aritmetica, lo scarto del campione i-esimo è
La somma degli scarti è nulla perché l’entità dei valori inferiori alla
media è compensata da quella dei valori superiori.
Da
quindi
ossia
e
Un valido indice della dispersione è il quadrato degli scarti, nella cui
somma il segno non pesa più.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Varianza
La somma dei quadrati degli scarti di n campioni divisa per (n – 1)
si chiama Varianza campionaria. Più alta è la Varianza e
maggiore è la dispersione dei campioni rispetto al loro centro.
per -10, -5, -1, 0, 1, 5, 10 (Media=0, Varianza=42 e Range=20)
per -10, -9, -9, 0, 9, 9, 10 (Media=0, Varianza=87.33 e Range=20)
Rispetto al Range (in cui si tiene conto solo del Max e del Min), in
questo caso ogni campione contribuisce a definire il valore
risultante.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Varianza (continua)
Notare per il calcolo
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Deviazione standard
Nota la Varianza campionaria si ottiene rapidamente la
Deviazione standard campionaria dalla
La Deviazione standard non dipende dal valore centrale dei
campioni ma solo dalle loro distanze da tale valore.
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Calcolo ricorsivo della Media
Per non essere costretti alla memorizzazione degli n campioni si può
ricorrere al metodo ricorsivo del calcolo della Media.
Al campione k -1 la Media è
Al k è
quindi
che si può scrivere
La media al passo k è funzione solo del k-esimo campione e della
Media al passo (k-1)
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
Statistica: Calcolo ricorsivo della Varianza
Anche per la Varianza esiste un metodo ricorsivo di calcolo.
Al campione k la Varianza è
Ossia
Sostituendo
a
e per k – 1
Sottraendo le due espressioni
Sostituendo
la Media ricorsiva
Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE
con