Università degli Studi di Ferrara Facoltà di Scienze MM.FF.NN. CdL in Tecnologie Fisiche Innovative Sistemi di Qualità, collaudi e controlli Prof. Renato Barbieri Statistica: le grandezze, i sette strumenti, i controlli Statistica: cosa è e a cosa serve Etimologicamente statistico è un aggettivo per indicare attinente allo Stato. Da G. BERNARDONI, Elenco di alcune parole oggidì frequentemente in uso … - Milano 1812: “Descrizione di un paese in tutte le sue parti di amministrazione sì pubblica che privata” Da Dizionario politico, nuovamente compilato ad uso della gioventù italiana - Torino 1849: “ … prima la chiamavano talvolta Aritmetica politica.” Da Dizionario politico popolare - Torino 1851: “… offre le cifre della popolazione di un paese in date epoche, il numero dei ricchi e dei poveri, degli istruiti e degl’idioti, degli operai, degli oziosi, dei vagabondi, dei carcerati, dei pazzi, di ogni genere di delitti, di suicidi … studia nelle ragioni di queste proporzioni di trovare le radici dei mali e di attivare i rimedi” Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: cosa è e a cosa serve Da Dizionario enciclopedico italiano - Roma 1960: “… legge probabilistica di distribuzione delle particelle d’un sistema che permette di definire le proprietà del sistema stesso quando l’elevato numero delle particelle non consente lo studio di ognuna di esse.” Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: funzioni Riassumendo: • … trovare le radici dei mali e di attivare i rimedi • … definire le proprietà del sistema … [nel caso di] elevato numero [di] particelle Tipo di statistica STATISTICA DESCRITTIVA Aggregazione di molti dati di dettaglio in pochi dati consuntivi STATISTICA INFERENZIALE Estensione ragionata delle informazione tratte dalle particelle all’intero sistema Nota: Inferenziale etimologicamente è proprio di chi porta dentro Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: come si studia in Italia Le facoltà di Scienze Statistiche si trovano presso: • Università di Milano - Bicocca • Università di Padova • Università di Bologna • Università di Roma – La Sapienza • Università di Messina In tutte sono previsti: • Corsi triennali di Laurea • Corsi biennali di Laurea Magistrale Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: oggetto Per Popolazione si intende tutti gli elementi, attraverso i quali un fenomeno si può presentare. Per esempio, tutti i valori di una grandezza oppure tutti i pezzi della produzione in esame. Per Campione di una Popolazione si intende una parte più o meno grande degli elementi della Popolazione in esame, attraverso i quali si possono ottenere conoscenze attribuibili a tutti gli elementi. Campione (da campo) era il cavaliere cui veniva affidato la difesa di una dama o, più in generale di una comunità. E’ evidente la delicatezza della scelta della quantità e della qualità dei campioni (compromesso tra costi e rappresentatività). E’ un tema ben noto a chi si occupa di sondaggi. L’attributo campionario sta ad indicare che una grandezza si riferisce solo ai campioni rilevati e non all’intera popolazione. Per esempio Media campionaria o Varianza campionaria. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: le grandezze • • • • • • • Percentuale Media Altre grandezze centrali Dispersione Scarto Varianza Deviazione Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Percentuale La Percentuale è un particolare tipo di Proporzione. La Proporzione rappresenta l’eguaglianza di due rapporti tra quattro elementi: A sta a B come A’ sta a B’ ossia A/B=A’/B’ Note: • da Euclide (Elementi) gli studi sulle Proporzioni • da Cicerone il nome (“davanti alla parte” come il greco “analogia”) Se B=100, A è la rappresentazione percentuale del rapporto degli elementi A’ e B’, calcolata come: A=A’/B’*100 Il simbolo % identifica il valore A come Percentuale Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Percentuale (continua) La Percentuale relativa agli elementi A’ e B’ è significativa se: 1.A’ è una porzione di B’ (parte di un tutto) A’ sono gli elettori del candidato X e B’ sono tutti i partecipanti al voto. Se i votanti sono stati 20.000 ed i voti per X sono stati 10.800, si può dire che la percentuale di voti ottenuta dal candidato X è il 54%. 2.A’ è la differenza di due valori di B’ B1’ è il prezzo normale del biglietto di uno spettacolo e B2’ è il prezzo dello stesso biglietto per uno studente o un anziano. A’= B1’-B2’ è la differenza del prezzo del biglietto intero e di quello del biglietto ridotto. Se il biglietto intero costa 50 Euro e quello ridotto 35 Euro, si può dire che la percentuale di sconto è il 30% (naturalmente rispetto al prezzo intero B1’). 3.A’ e B’ sono due misure diverse della stessa grandezza A’ è il costo attuale di un barile di petrolio e B’ il costo che il barile di petrolio aveva un anno fa. Se il costo attuale è 35$ e quello di un anno fa 140$, si può dire che il costo attuale è il 25% del precedente. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Percentuale (continua) Vantaggi e significatività della Percentuale: • è una forma standard compatta • comunica una quantità di informazioni a chiunque • non è sensibile alle variazioni delle grandezze a cui si riferisce Il candidato che ha avuto 10.800 voti può esaltarsi per la vittoria o amareggiarsi per la sconfitta? E quando sa che ha avuto il 54% dei voti? 15 Euro in meno sono un consistente risparmio per uno studente o un anziano? Ed uno sconto del 30%? 105 $ di variazione di prezzo unitario sono molti? Quanto vale il fatto che il nuovo prezzo sia il 25% di quello precedente? Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Percentuale (continua) Significatività della Percentuale: è funzione della granulosità del rapporto di cui è rappresentazione. Tutte le informazioni statistiche hanno senso per i grandi numeri. Esempio: Analisi delle percentuali di non conformità su una data produzione N. Prodotti N. Non Conformità Percentuale - 1 0 oppure 1 0% oppure 100% - 2 0, 1, 2 0%, 50%,100% - … - 10 0,1,2,….,10 0%,10%,20%, …, 100% - … - 100 0,1,…..,99,100 0%,1%,2%, …, 99%,100% Nota: Solo dopo 100 campioni ha senso l’utilizzo dell’unità nella Percentuale e solo dopo 1000 campioni quello di un decimale. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Media Dati n campioni di una variabile misurabile, la Media è la somma dei valori degli n campioni, divisa per il numero dei campioni. Si chiama Media aritmetica o anche Media campionaria. E’ uno degli strumenti fondamentali per ottenere da una nuvola di valori il loro baricentro. Gli esempi di utilizzo della media nella vita quotidiana sono infiniti: l’altezza media, il peso medio, l’età media, la votazione media, etc. Si potrebbe dire che, visto che c’è chi ha avuto di più e chi ha avuto di meno, si mettono insieme tutte le risorse in un unico contenitore e poi si suddivide il contenuto, in modo equo, tra tutti i partecipanti. In inglese Arithmetic mean (in uso anche Average dall’arabo Awar) Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Media (continua) Quello che la Media non sa dire (dispersione dei campioni): La stessa Media può essere ottenuta con valori di campioni molto diversi. A: n campioni di valore 1 ed n campioni di valore -1 (Media=0) B: n campioni di valore 1000 ed n campioni di valore -1000 (Media=0) C: n campioni di valore 1.000.000 ed n campioni di valore -1.000.000 (Media=0) Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Media (continua) Quello che la Media non sa dire (frequenza dei campioni): Progetto di Enrico IV di Francia: “sa poule-au-pot” “Voglio che alla domenica ciascun abitante abbia il suo pollo in pentola”. La situazione dei polli in un villaggio di 10 capi-famiglia poteva essere: 8 senza polli 1 con un pollo 1 con nove polli che produce una Media=1, secondo i desideri di Enrico IV, con parecchi abitanti insoddisfatti. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Altre grandezze centrali - Mediana Dati n campioni di una variabile misurabile, la Mediana è il valore che occupa la posizione centrale, ove si siano messi in ordine crescente gli n valori. Campioni: 2, 8, 3, 1, 9 - In ordine crescente: 1, 2, 3, 8, 9 Mediana=3 perché lascia 2 valori (1 e 2) prima e 2 valori (8 e 9) dopo di sé. Media=4.6 Nota: Nel caso di n pari, la Mediana è la media aritmetica dei due valori centrali. La Mediana viene definita anche come il 50-esimo Percentile, perché, nella sequenza ordinata di n campioni, ha 50% campioni che lo precedono e 50% campioni che lo seguono. Più in generale l’m-esimo Percentile è il valore che nella sequenza ha m% campioni che lo precedono e (100-m)% campioni che lo seguono. Il 25-esimo Percentile viene anche detto Primo Quartile. Il 75-esimo Percentile viene anche detto Terzo Quartile. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Altre grandezze centrali - Moda Dati n campioni di una variabile misurabile, la Moda è il valore che si presenta con la maggiore frequenza. Tornando al progetto di Enrico IV: • senza polli: 8 campioni hanno valore 0 • con un pollo: 1 campione ha valore 1 • con nove polli: 1 campione ha valore 9 Media=1 e Moda=0 Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Altre grandezze centrali – Media troncata Dati n campioni di una variabile misurabile, la Media troncata è il valore che si ottiene, eliminando una certa percentuale dei campioni (quelli alle estremità, con i valori più grandi ed i valori più piccoli), prima di farne la media aritmetica. Media troncata all’80% di 20 campioni -54 -43 4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25 26 27 Si ottiene eliminando i campioni 26, 27, -54, -43 ottenendo la Media Troncata=13.4 (Media Aritmetica=8.5) ATTENZIONE AI TRONCAMENTI! E’ utile quando si ha il sospetto che alcuni campioni caduti molto lontani da quelli in posizione centrale siano affetti da errori. Si chiama anche Trimmed Mean o Media Sfrondata. La Media olimpica è un particolare tipo di troncamento (eliminazione del massimo e del minimo). Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Altre grandezze centrali – Massimo e Minimo L’utilizzo di Massimo e Minimo dei valori di n campioni può dare un’idea grossolana di dove si posiziona il centro. Se Max è il valore massimo e Min è il valore minimo si ipotizza che il valore centrale sia (Max+Min)/2 In inglese sarebbe un valore Average. Per i 20 campioni -54 -43 4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25 26 27 Max=27 e Min=-54 quindi (Max+Min)/2=-13.5 Se si fossero utilizzati i 16 campioni centrali della Media Troncata 4 4 5 8 9 11 11 13 15 16 16 16 18 21 22 25 Max=25 e Min=4 quindi (Max+Min)/2=14.5 Risultato paragonabile alla Media Troncata=13.4 Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Dispersione dei campioni Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Range Il Range (intervallo o gamma di variazione) dà informazione della dispersione di n campioni attorno al loro centro. Se Max è il valore massimo e Min è il valore minimo vale Range = Max - Min A valori di Range più elevati corrispondono maggiori dispersioni. per -1000, -500, -100, 0, 100, 500, 1000 (Media=0 e Range=2000) per -10, -5, -1, 0, 1, 5, 10 (Media=0 e Range=20) Il calcolo del Range è estremamente rapido. Non tiene conto di quanto i singoli campioni siano distanti dal valore medio. per -10, -5, -1, 0, 1, 5, 10 (Media=0 e Range=20) per -10, -9, -9, 0, 9, 9, 10 (Media=0 e Range=20) Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Scarto rispetto alla media Per ognuno degli n campioni si può valutare la distanza rispetto alla loro Media. Se è la Media aritmetica, lo scarto del campione i-esimo è La somma degli scarti è nulla perché l’entità dei valori inferiori alla media è compensata da quella dei valori superiori. Da quindi ossia e Un valido indice della dispersione è il quadrato degli scarti, nella cui somma il segno non pesa più. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Varianza La somma dei quadrati degli scarti di n campioni divisa per (n – 1) si chiama Varianza campionaria. Più alta è la Varianza e maggiore è la dispersione dei campioni rispetto al loro centro. per -10, -5, -1, 0, 1, 5, 10 (Media=0, Varianza=42 e Range=20) per -10, -9, -9, 0, 9, 9, 10 (Media=0, Varianza=87.33 e Range=20) Rispetto al Range (in cui si tiene conto solo del Max e del Min), in questo caso ogni campione contribuisce a definire il valore risultante. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Varianza (continua) Notare per il calcolo Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Deviazione standard Nota la Varianza campionaria si ottiene rapidamente la Deviazione standard campionaria dalla La Deviazione standard non dipende dal valore centrale dei campioni ma solo dalle loro distanze da tale valore. Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Calcolo ricorsivo della Media Per non essere costretti alla memorizzazione degli n campioni si può ricorrere al metodo ricorsivo del calcolo della Media. Al campione k -1 la Media è Al k è quindi che si può scrivere La media al passo k è funzione solo del k-esimo campione e della Media al passo (k-1) Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE Statistica: Calcolo ricorsivo della Varianza Anche per la Varianza esiste un metodo ricorsivo di calcolo. Al campione k la Varianza è Ossia Sostituendo a e per k – 1 Sottraendo le due espressioni Sostituendo la Media ricorsiva Corso Sistemi di Qualità, collaudi e controlli – Tecnologie Fisiche Innovative - UNIFE con