POLITECNICO DI MILANO DOTTORATO DI RICERCA IN GEOMATICA E INFRASTRUTTURE ANALISI STATISTICA del DISCO DI FESTO Le due facce del Disco di Festo Dottorando: Tutor: Coordinatore: Ettore Scorsetti Prof. Luigi Mussio Prof. Fernando Sansò Analisi Statistica del Disco di Festo INDICE Introduzione Il ritrovamento del Disco di Festo Caratteristiche del Disco La decifrazione p. p. p. p. 4 4 5 7 Statistica descrittiva dei simboli del Disco di Festo Breve accenno teorico Il trattamento dei dati relativi al Disco di Festo Studio della variabile statistica semplice La posizione dei simboli nei segmenti Analisi di dipendenza della variabile doppia Connessione e regressione: indici di Bonferroni e Pearson Correlazione: dipendenza lineare p. p. p. p. p. p. p. p. 12 12 13 16 23 24 41 42 Inferenza statistica sui risultati delle variabili semplici e doppie p. Test parametrici sulla variabile semplice p. - Test su due medie normali con varianze note p. - Test su due medie con varianze incognite uguali p. - Test su due medie con varianze incognite diverse p. - Test su due varianze p. Test non parametrici sulla variabile semplice p. - Test di Rango p. Test di Mann-Whitney p. Test di Siegel-Tuckey p. - Test di Segno p. Test di Thomson: test del segno per i valori centrali p. Test del segno per i valori di dispersione p. - Test di Kolmogorov-Smirnov p. - Test di Pearson p. Test sulla variabile doppia p. - Test parametrico sul coefficiente di correlazione tra le due facce p. - Test non parametrico sul coefficiente di correlazione di Spearman tra le due facce p. - Test parametrico sul coefficiente di correlazione della regressione lineare sulle successioni di sillabe nelle due facce p. - Test della regressione lineare sulla successione di sillabe nelle due facce p. 60 60 60 61 62 63 65 65 65 66 68 68 68 69 70 72 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 72 73 75 78 2 Analisi Statistica del Disco di Festo Grafi per la visualizzazione delle successioni tra sillabe nelle due facce p. 85 Visualizzazione di frequenze tematiche nelle due facce con Cluster Analysis p. 88 Piani 2K K Piani 2 : prima prova Piani 2K: seconda prova p. 108 p. 109 p. 153 Conclusione I commenti di un’archeologa filologa e linguista Giocando con le prime otto terzine dell’Inferno e con una prima pagina del New York Times p. 195 p. 195 Appendice Controllo statistico della qualità p. 204 p. 205 Bibliografia di riferimento p. 281 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture p. 200 3 Analisi Statistica del Disco di Festo INTRODUZIONE IL RITROVAMENTO DEL DISCO DI FESTO Il Disco di Festo è un reperto ritrovato nell'omonima città di Festo sull'isola di Creta, sotto un muro di un palazzo minoico di età ellenistica, durante una spedizione archeologica guidata da Luigi Pernier nel mese di luglio dell’anno 1908. E’ un disco di terracotta non perfettamente rotondo, di dimensioni variabili tra 158 – 166 mm di diametro e 16 – 21 mm di spessore, cosparso di simboli figurali rimasti indecifrati, impressi con stampino quando l’argilla era ancora fresca e disposti a spirale su entrambe le facce. La datazione stratigrafica ne attribuisce l’età al 1700 a.C. In effetti, il Disco di Festo fu trovato all’interno della cerchia delle mura del primo palazzo che si trovava ad un livello inferiore rispetto alla cinta muraria del secondo palazzo, come si può facilmente capire dalla Figura 1. Figura 1: Pianta del palazzo minoico in cui fu ritrovato il Disco di Festo. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4 Analisi Statistica del Disco di Festo Il palazzo di Festo, eretto sull’orlo di una ripida collina con una superba vista sulla pianura di Messarà ad Est, e sul massiccio dell’Ida a Nord, godeva di una invidiabile posizione. Secondo, per dimensioni, solo a quello di Cnosso, era, rispetto a questo, avvantaggiato per la sua posizione incantevole e per l’aria e il clima. L’oggetto per le sue caratteristiche e per il luogo in cui è stato ritrovato è sempre stato considerato come un qualcosa di unico e antichissimo; inoltre gli si può attribuire una funzione importante, sacrale, strategica o legata al messaggio che contiene. Molteplici e illustri studiosi si sono cimentati nel corso degli anni nella sua interpretazione, proponendo soluzioni più o meno logiche e coerenti, affascinanti o paradossali; e in effetti, sono quasi cent’anni che il Disco di Festo ha dato vita a un proliferare di storie e di teorie, quasi fosse un oggetto magico che le contenga davvero tutte e che, dotato di una propria anima, si diverta a raccontarne volta per volta una diversa. Per questo motivo, e data l’esiguità del campione, non è possibile fare un’unica traduzione del contenuto del Disco, né smentire qualsiasi traduzione proposta, seppure di fantasia. CARATTERISTICHE DEL DISCO Il disco di Festo non è perfettamente circolare: il suo diametro varia tra 158 e 166 mm, mentre lo spessore tra 16 e 21 mm, elementi che fanno supporre che sia stato ottenuto per compressione da un’argilla di ottima qualità. Entrambe le facce sono coperte di linee graffite (a mano, probabilmente mediante uno stilo dalla punta dura e sottile) e di caratteri impressi a stampa quando l’argilla era ancora fresca. Il disco presenta un’iscrizione a spirale caratterizzata da segni radunati in gruppi, separati l’uno dall’altro da un trattino che collega fra di loro i giri della spirale. Convenzionalmente abbiamo definito A e B le due facce di cui è composto: sulla faccia A sono contenuti 31 gruppi di segni per un totale di 123 segni, mentre sulla faccia B vi sono 30 gruppi di segni per un totale di 119 segni. Il numero di segni differenti leggibili sul disco è pari a 45. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5 Analisi Statistica del Disco di Festo Il punto di origine per la lettura del disco è indicato da una linea verticale affiancata da 5 puntini collocata nella parte più esterna sia nella faccia A che B. I caratteri del disco di Festo sono stati impressi con una serie di 45 punzoni e rappresentano probabilmente il primo caso nella storia di un’iscrizione realizzata con caratteri mobili, purtroppo andati persi. Faccia A Figura 2: Rappresentazione grafica della faccia A del Disco di Festo. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 6 Analisi Statistica del Disco di Festo Faccia B Figura 3: Rappresentazione grafica della faccia B del Disco di Festo. LA DECIFRAZIONE Il Disco di Festo, già sotto questo profilo, presenta una sua singolarità. Le varie "sezioni" del "testo" sono nettamente distinte e separate le une dalle altre, con un sistema di barrette verticali che, unite alla linea della spirale, finiscono con l'incasellare ogni unità semantica in uno spazio fortemente delimitato che poco concede al libero dipanarsi della parola. Dall’analisi dei segni si nota che essi (123 sul lato A, e 119 sul lato B) non appaiono assimilabili ad alcuna forma nota di scrittura, ed anche la loro cifra linguistica è discutibile. Vediamo di capirne il perché. Chi ha sostenuto la tesi che si tratti di scrittura ha dovuto affermare, a cominciare da Ventris e Chadwick nel loro Documents in Mycenaean Greek, che trattasi verosimilmente di una scrittura di tipo egeo, e comunque sillabica. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 7 Analisi Statistica del Disco di Festo D'altra parte finora nessuno ha messo in dubbio che si tratti di una forma di scrittura, ma nonostante ciò nessuno è riuscito a "decifrare" l'oscuro messaggio che ci viene da un tempo tanto remoto né, peraltro, a riconoscere il registro di una tale forma di comunicazione. Non sappiamo che valenza abbiano i segni, se acrofonica o d'altro tipo, né sappiamo se trattasi di lingua affine al ceppo ie.; ma un'analisi linguistica può anche prescindere da codesti elementi. Si nota che solo un paio di "parole" su entrambi i lati del disco finiscono con il medesimo segno, e questo denota che se si tratta di lingua non è del tipo flessivo. Questa caratteristica appare quanto meno strana in quell'area geo-linguistica che va dai Balcani ai limiti delle regioni microasiatiche. Inoltre anche altri elementi ci fanno dubitare che si tratti di un linguaggio. Si potrebbe ipotizzare un linguaggio di tipo sillabico, ma diverse sezioni presentano una serie di 6 o addirittura 7 segni, il che indicherebbe la presenza di parole eccessivamente lunghe. E’ bene sottolineare che dall’analisi interna dei segni per ogni sezione appare strano, ad esempio, che il segno del "guerriero con elmo" appaia soltanto all'inizio di ogni sequenza in entrambi i lati del disco; che esistano serie di due segni ripetuti ma mai all'inizio della sequenza e che esistano varianti di "posizione" di taluni segni, posti ruotati talvolta di 45° o di altri che sono stati sfasati senza, perciò, indicare una atipica loro specificità. Insomma, la singolarità della cifra semantica delle varie sequenze del Disco di Festo impedisce agli studiosi di credere che si tratti di linguaggio. In sintesi, il fatto che ogni “parola”, ovvero ogni sequenza, presenti un impianto strutturale e morfologico sempre diverso, nel quale si individuano ben 33 "suffissi" diversi (23 A / 10 B), in un "testo" tutto sommato cosi breve, rafforza l'ipotesi che non si tratta di scrittura. Proprio per questo si sono sviluppate altre ipotesi interpretative, tra cui quella iniziale secondo la quale il Disco di Festo altro non è che un "normalissimo" calendario-diario ad uso e consumo, forse, dei giovani (o della gente in genere) di quel tempo; per cui altro dev'essere il codice di lettura del reperto per poterne valutare esattamente lo spessore. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 8 Analisi Statistica del Disco di Festo Quello che colpisce è il numero delle sezioni in cui è divisa ogni faccia del disco: 31 sul lato A, e 30 sul lato B. E' una singolarità troppo evidente per essere trascurata, né può trattarsi di semplice coincidenza. Qui, la circolarità dell'oggetto è in relazione al circolo solare ed al suo moto durante l'anno e appare configurare l'immagine del cielo e quindi il computo del tempo in relazione agli eventi astrali o stagionali. Questo si legge, si intuisce, immediatamente al primo approccio; quindi, analizzando il "testo", inizia a prendere forma la consapevolezza che il cerchio voglia esprimere, rappresentare in maniera immediata e simbolica, conoscenze geomatematiche che attengono alla figura. Si tratta, fra l'altro, di un oggetto didattico, come tanti altri in uso in antichità; come le anforette etrusche che recano graffito l'alfabeto, quelle di Graviscae, di Formello, di Viterbo, e di Cerveteri. All'inizio si pensò erroneamente che il mese potesse essere suddiviso per "settimane". Considerando che potevano essere, ad esempio, di 31 giorni i mesi estivi e di 30 quelli invernali, era intuitivo domandarsi se c'era un numero distintivo di quella cultura per il quale il mese potesse essere suddiviso. Ponendo, difatti, il 5, le serie che si formano sono. 19, 20, 19, 23, 19, 19, 3 20, 19, 19, 19, 19, 21. Il 19, come insieme di attività da compiere per "settimana", ritorna con una certa frequenza. Ma una suddivisione del mese in periodi, per quel tempo, non è assolutamente ipotizzabile. Ma v'è un'altra analisi che appare ancor più sconvolgente. Se si assume come "diagonale" del disco il raggio, la sezione, che individua il cerchio presso il punto d'inizio del "testo", si vede chiaramente che per ogni "spira" v'è (per ambo i lati) una sola serie che appare, multipla del 3. 12 , 9 , 6 , 3 , 1 (lato A) 12 , 9 , 6 , 3 (lato B). Il che è ancora più straordinario, in quanto dimostra che a quel tempo il calcolo (sia pure in un sistema a base dieci) era già basato sul 3 e sui suoi multipli. L'immagine esplosa delle due facce appena vista lo indica chiaramente. Per cui anche l'anno doveva essere, anzi già era di dodici mesi. Difatti: 6 mesi di 31 gg. = 186 gg. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 9 Analisi Statistica del Disco di Festo 6 mesi di 30 gg. = 180 gg. totale 366 gg. Per quanto riguarda i segni, tutte e due le facce iniziano con la stessa immagine, quella del guerriero con l'elmo : segno che l'attività guerresca era primaria e fondamentale per la comunità. Altre attività appaiono chiaramente identificabili, come quella dell'esercitarsi con l'arco o corazze , quella di saper andar per mare , di costruire elmi , di dedicarsi poi alla concia delle pelli usare la raspa, il trapano e l’ascia addirittura di fare musica . , del saper , o di dedicarsi all'agricoltura, o Altri segni sono meno facilmente identificabili, e dalla capacità che si avrà di poterli riconoscere dipenderà la possibilità di poter tracciare un quadro delle abitudini e della cultura di tale popolo, il quale fu anche pescatore, curò le attività ginniche, fu dedito alla pastorizia, introdusse la coltura del fico e stabilì probabilmente rapporti particolari con l'altro sesso, infatti la figurina di donna deve pur avere un suo particolare significato, anche se ancora esso non ci appare chiaro. Così come non sono chiari altri segni, la cui valenza e cifra devono essere riconosciute. Altri segni, poi, sembrano richiamarci ad alcuni elementi che troviamo nella scrittura Lineare B, di cui il Disco di Festo deve essere coevo; perché, se la scrittura Lineare B è testimoniata in tavolette stilate intorno al XVI sec. a.C., essa è così bene e compiutamente strutturata che la sua formazione deve risalire per forza di cose a secoli precedenti, per cui il disco in questione, in questo caso, altro non fa che testimoniare la presenza di elementi pittografici che, nel linguaggio, assumono intanto la valenza di fonogrammi. Questi sono il cerchio puntato appare nettamente stilizzata e l'ascia bipenne che nel miceneo nel segno che anticipa il moderno fonema T. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 10 Analisi Statistica del Disco di Festo Nonostante ciò che è stato detto fino ad ora, in questo lavoro è stata presa in considerazione l’ipotesi che i simboli presenti nelle due facce siano lettere e che ciascun gruppo sia una parola; facendo uso di note specifiche di matematica discreta, si è quindi sviluppata un’analisi statistica sulle sequenze dei caratteri contenuti. Il lavoro presentato nel seguito è stato così strutturato: si è innanzitutto sviluppato uno studio di tipo prettamente statistico dei dati forniti, partendo dalla statistica descrittiva generale, affrontando l’analisi della variabile statistica semplice e successivamente di quella doppia. Sono stati costruiti, di volta in volta, grafici sulle frequenze dei simboli sia dal punto di vista globale che considerando le due facce prese singolarmente. Si è valutata la dipendenza tra i diversi caratteri di ciascuna faccia del Disco di Festo – ognuna analizzata prima dall’interno verso l’esterno e poi viceversa – tramite il coefficiente di Bonferroni e un’analisi di correlazione lineare attraverso un apposito programma, che ci ha permesso di disegnare le rette di regressione dei dati. Abbiamo poi proseguito con i test di buon adattamento sugli indici statistici provenienti da quest’ultima analisi, test di indipendenza classici e di KolmogorovSmirnov, test di Pearson per la normalità, test chi quadro sulla varianza, test t su ciascun parametro delle rette e test sul coefficiente di correlazione. Lo studio dei grafi per la visualizzazione delle successioni tra sillabe, la Cluster Analysis per la visualizzazione delle frequenze tematiche nelle due facce e in conclusione lo studio dei piani 2k. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 11 Analisi Statistica del Disco di Festo STATISTICA DESCRITTIVA DEI SIMBOLI DEL DISCO DI FESTO BREVE ACCENNO TEORICO Parliamo di statistica descrittiva quando si raccolgono, ordinano, riassumono, presentano e analizzano dati relativi a una popolazione o a un campione. Un discorso preciso sulla statistica descrittiva si avvia con la definizione di variabile statistica e di variabile casuale, la postulazione di un’identità formale fra le stesse e la presentazione delle loro principali statistiche. Le variabili statistiche sono il risultato di esperimenti e, pertanto, sono concrete (ovvero costruite da dati reali od osservazioni), finite (perché qualsiasi esperimento incontra evidenti limiti di spazio, tempo ed altre condizioni limitative) e discrete (perché qualsiasi esperimento è eseguito con una determinata accuratezza). Conseguentemente esse sono caratterizzate da un insieme di valori argomentali (eventualmente raggruppati in classi), associati a frequenze elementari (assolute, come risultato di un conteggio, oppure relative, se la totalità è normalizzata a uno) ed alle frequenze cumulate delle frequenze elementari. Le variabili casuali sono modelli interpretativi e, pertanto, sono astratte (ovvero costituite da dati ideali od osservabili) e, in generale, illimitate e continue (anche se raramente, a eccezione della teoria dei giochi, esse possono essere finite e discrete). Di conseguenza sono caratterizzate da un campo d’esistenza associato a una funzione densità di probabilità e a una funzione distribuzione di probabilità (comunemente detta probabilità). L’identità formale fra le variabili statistiche e variabili casuali discende dalla loro completa indistinguibilità, a valle della loro definizione. Allora la presentazione delle principali statistiche può essere eseguita congiuntamente per entrambe. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 12 Analisi Statistica del Disco di Festo IL TRATTAMENTO DEI DATI RELATIVI AL DISCO DI FESTO Il Disco di Festo presenta sulla faccia A 31 gruppi di segni, per un totale di 122 segni, e sulla faccia B 30 gruppi di segni per un totale di 119 segni (tabella 1). Il numero di segni differenti e leggibili sul Disco è pari a 45. Per poter effettuare la nostra analisi, si sono infatti numerati i simboli dall’1 al 45 come indicato in Figura 4 e sulla base di questi, si sono costruiti tutti i principali indici statistici, nonché le varie distribuzioni di frequenze assolute (Figura 5). Figura 4: I 45 simboli raffigurati sul Disco di Festo secondo la numerazione di riferimento utilizzata nel presente lavoro. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 13 Analisi Statistica del Disco di Festo Caratteri Presenze Faccia A Presenze Faccia B 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 totale 6 14 2 1 0 2 3 1 0 4 1 15 3 1 0 0 1 6 3 0 2 0 5 1 2 5 10 2 3 0 5 2 2 1 5 0 2 3 1 3 2 0 0 1 2 122 5 5 0 0 1 2 15 4 2 0 0 2 3 1 1 2 0 6 0 2 0 5 6 5 5 1 5 0 8 1 0 1 4 2 6 4 2 1 3 3 0 1 1 0 4 119 Presenze Faccia A+B 11 19 2 1 1 4 18 5 2 4 1 17 6 2 1 2 1 12 3 2 2 5 11 6 7 6 15 2 11 1 5 3 6 3 11 4 4 4 4 6 2 1 1 1 6 241 Tabella 1: Frequenze assolute dei simboli sulle due facce. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 14 Analisi Statistica del Disco di Festo Istogramma dei caratteri simbolici 20 18 16 14 12 f1 10 f2 f1+f2 8 6 4 2 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 Figura 5: Istogramma delle frequenze assolute dei simboli su ciascuna faccia separatamente e complessivamente. Per dare un aspetto più regolare all’istogramma sopra riportato sono stati riordinati i dati, attribuendo il valore 1 al carattere che compare con la frequenza maggiore e valori crescenti al diminuire delle presenze, come riassunto in tabella 2 e, in seguito, sono stati realizzati i corrispondenti istogrammi (riportati nelle figure 5, 6 e 7). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 15 Analisi Statistica del Disco di Festo STUDIO DELLA VARIABILE STATISTICA SEMPLICE Per le variabili a una dimensione (rappresentabili con diagrammi di frequenza o istogrammi, come pure con istogrammi cumulati o cumulogrammi), le principali statistiche rispondono alla quantizzazione delle idee di: centro, ovvero la determinazione, attraverso opportune procedure, di moda e mediana e, attraverso algoritmi, della media (aritmetica, geometrica, armonica, ponderata, potata, ecc.); dispersione, descrivibile ricorrendo al calcolo di ampiezza, mav e varianza; forma, ovvero al calcolo dell’indice di simmetria e della curtosi (comportamento delle code). Per poterci riferire ad una distribuzione approssimabile ad una normale, abbiamo proceduto allo sdoppiamento dei dati, ovvero abbiamo alternativamente attribuito valori negativi ai dati presenti, in modo da ottenere i seguenti istogrammi a campana; abbiamo poi calcolato le principali statistiche relative alle due facce del Disco. Sono stati quindi valutati alcuni indici di posizione (media, mediana, moda), di dispersione (varianza, m.a.v. e M.A.V.) e di forma (asimmetria e curtosi) relativamente ai dati precedentemente riordinati (i risultati sono riportati nella tabella 3). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 16 Analisi Statistica del Disco di Festo simbolo lato A nuovo ordinamento 12 1 2 2 27 3 1 4 18 5 23 6 26 7 31 8 35 9 10 10 7 11 13 12 19 13 29 14 38 15 40 16 3 17 6 18 21 19 25 20 28 21 32 22 33 23 37 24 41 25 45 26 4 27 8 28 11 29 14 30 17 31 24 32 34 33 39 34 44 35 5 36 9 37 15 38 16 39 20 40 22 41 30 42 36 43 42 44 43 45 simbolo lato B nuovo ordinamento simbolo disco totale nuovo ordinamento 7 1 2 1 29 2 7 2 18 3 12 3 23 4 27 4 35 5 18 5 1 6 1 6 2 7 23 7 22 8 29 8 24 9 35 9 25 10 25 10 27 11 13 11 8 12 24 12 33 13 26 13 36 14 33 14 45 15 40 15 13 16 45 16 39 17 8 17 40 18 22 18 6 19 31 19 9 20 6 20 12 21 10 21 16 22 36 22 20 23 37 23 34 24 38 24 37 25 39 25 5 26 19 26 14 27 32 27 15 28 34 28 26 29 3 29 30 30 9 30 32 31 14 31 38 32 16 32 42 33 20 33 43 34 21 34 3 35 28 35 4 36 41 36 10 37 4 37 11 38 5 38 17 39 11 39 19 40 15 40 21 41 17 41 28 42 30 42 31 43 42 43 41 44 43 44 44 45 44 45 Tabella 2:. Corrispondenze tra i simboli e il nuovo ordinamento. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 17 Analisi Statistica del Disco di Festo presenza Presenza in A su dati ordinati 16 14 12 10 8 6 4 2 0 Presenze in A su dati ordinati 1 5 9 13 17 21 25 29 33 37 41 45 nuova numerazione Figura 5: Frequenze del nuovo ordinamento per la faccia A. presenze Presenze in B su dati ordinati 16 14 12 10 8 6 4 2 0 Presenze in B su dati ordinati 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 nuovo ordinamento Figura 6: Frequenze del nuovo ordinamento per la faccia B. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 18 Analisi Statistica del Disco di Festo Presenze totali su dati ordinati presenza 20 15 10 Presenze totali su dati ordinati 5 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 nuovo ordinamento Figura 7: Frequenze del nuovo ordinamento considerando entrambe le facce del disco. INDICI DI POSIZIONE Media Mediana Moda 1° quartile 3°quartile INDICI DI DISPERSIONE Varianza s.q.m. M.A.V. m.a.v. INDICI DI FORMA Asimmetria Curtosi Faccia A Faccia B Disco totale 10,40 7,50 1,00 3,00 10,97 9,00 1,00 4,00 12,67 9,00 1,00 4,00 16,00 16,00 19,00 84,37 9,19 7,25 74,80 8,65 6,94 115,87 10,76 8,39 5,50 6,00 6,00 0,92 0,79 1,01 2,81 2,74 3,19 Tabella 3: Indici statistici ottenuti a partire dalle distribuzioni delle frequenze dei dati del nuovo ordinamento. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 19 Analisi Statistica del Disco di Festo Dai dati riportati in tabella 3, sono state formulate alcune considerazioni: la curtosi fornisce un’informazione sull’allontanamento dalla normalità distributiva, quindi, per quanto riguarda i valori relativi alle facce A e B risulta, benchè vicini al valore di 3, ancora platicurtica, cioè risulta più “piatta” di una normale, mentre, considerando il disco nel suo complesso, risulta leptocurtica, cioè più “appuntita” di una normale. In statistica una distribuzione, una funzione di probabilità, una funzione di densità o comunque una variabile casuale si dicono simmetriche quando esiste un valore X m (che coincide con la media aritmetica ovvero con il valore atteso) per il quale a tutti i valori minori Xa (con Xa = Xm − Δ, Δ > 0) corrisponde una frequenza o funzione di probabilità o funzione di densità identica a quella che corrisponde al valore Xb = Xm + Δ. Il risultato ottenuto per le distribuzioni delle facce A, B e del disco nel complesso è positivo, quindi con coda a destra: ciò era intuibile anche osservando gli istogrammi riportati nelle figure 5, 6 e 7. Ribaltando il grafico delle frequenze riportate nelle figure 5, 6 e 7 rispetto all’asse delle ordinate, ossia generando una distribuzione speculare rispetto all’asse delle ordinate, si ottiene un andamento simmetrico degli istogrammi e, quindi, è lecito considerare il grafico ottenuto come una discretizzazione della distribuzione normale (tali distribuzioni sono riportate nelle figure 8, 9 e 10). raddoppio faccia A 0,07 freq. relative 0,06 0,05 0,04 frequenze relative 0,03 Distribuzione normale 0,02 0,01 0 -45 -38 -31 -24 -17 -10 -3 5 12 19 26 33 40 simbolo Figura 8: Distribuzione delle frequenze della faccia A dopo il ribaltamento rispetto all’asse delle ordinate. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 20 Analisi Statistica del Disco di Festo raddoppio faccia B 0,07 freq. relative 0,06 0,05 0,04 frequenze relative 0,03 Distribuzione normale 0,02 0,01 40 34 28 22 16 10 4 -3 -9 -15 -21 -27 -33 -39 -45 0 simbolo Figura 9: Distribuzione delle frequenze della faccia B dopo il ribaltamento rispetto all’asse delle ordinate. raddoppio totale 0,07 frequenza relativa 0,06 0,05 0,04 frequenze relative Distribuzione normale 0,03 0,02 0,01 0 -45 -39 -33 -27 -21 -15 -9 -3 4 10 16 22 28 34 40 simbolo Figura 10: Distribuzione delle frequenze totale dopo il ribaltamento rispetto all’asse delle ordinate. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 21 Analisi Statistica del Disco di Festo Sono stati infine valutati gli indici di posizione, dispersione e forma anche per la distribuzione di dati raddoppiata, come riassunto in tabella 4. INDICI DI POSIZIONE 1° quartile 3°quartile Faccia A Faccia B Disco totale -7,25 7,25 -9 9 -8 8 INDICI DI DISPERSIONE Varianza M.A.V. m.a.v. s.q.m. 192,67 10,40 7,50 13,88 195,25 10,97 9,00 13,97 193,54 10,68 8,00 13,91 INDICI DI FORMA Asimmetria Curtosi 0 0 0 3,13 2,77 2,96 Tabella 4: Indici statistici ottenuti a partire dalle distribuzioni delle frequenze dopo il raddoppio dei dati. Dopo il raddoppio della distribuzione, i valori di m.a.v. e M.A.V. risultano ancora vicini a quelli riportati in tabella 3: ciò per definizione stessa dei due indici, ossia rispettivamente di deviazione mediana dei moduli rispetto alla mediana e di deviazione media assoluta dalla mediana. I valori di varianza, e quindi di s.q.m., risultano superiori a quelli riportati in tabella 3, poiché raddoppiando la distribuzione aumenta la sua dispersione. Il valore di asimmetria riportati in tabella 4 risultano pressoché nulli poiché, raddoppiando la distribuzione, si è ottenuta una distribuzione esattamente simmetrica. Infine, per quanto riguarda la curtosi, benché si avvicini in tutti e tre i casi al valore 3 e, quindi, alla normalità, la faccia A risulta leptocurtica, la B e il disco nel complesso platicurtici. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 22 Analisi Statistica del Disco di Festo LA POSIZIONE DEI SIMBOLI NEI SEGMENTI Per questo tipo di studio, si sono numerati i segmenti di ogni faccia del Disco dall’interno verso l’esterno. Nella faccia A sono presenti 31 segmenti, indicati con A1, A2…A31, mentre sulla faccia B si possono contare 30 segmenti, denominati B1,B2…B30. La lunghezza dei segmenti varia sia fra le due facce che all’interno di ognuna di esse. Sul segmento A si possono osservare segmenti formati da un minimo di 2 simboli ad un massimo di 7, mentre il lato B presenta sequenze lunghe da 2 a 5 caratteri. L’analisi consiste nel trovare se su ogni faccia sono ripetute sequenze di simboli. La numerazione dei caratteri è sempre quella fornita inizialmente. Dall’osservazione diretta si è evidenziato quanto segue: A1-A4 segmenti identici formati dalla sequenza 38-3-10 A6-A31 segmenti identici formati dalla sequenza 1-13-12-2 A11-A17 segmenti identici formati dalla sequenza 1-28 A3-A15 segmenti identici formati dalla sequenza 21-37-35-27-12-2 A9-A24 segmenti identici formati dalla sequenza 2-12-28 (il segmento A9 ha in comune con A3 e A15 la sequenza 27-12-2) A12-A18 segmenti identici formati dalla sequenza 18-23-10-25-27-2 A10-A13-A6 segmenti identici formati dalla sequenza 26-31-12-2 A7 segmento che ha in comune con A10, A13, e A16 i simboli 12, 26 e 31. Inoltre sono presenti molte altre ripetizioni di sequenze formate da due simboli. Dalla faccia B si evince invece: B1-B7-B11-B29 segmenti in cui si ripete la sequenza 7-45 B2-B9 segmenti in cui si ripete la sequenza 25-23-34 B5-B10-B13 segmenti in cui si ripete la sequenza 8-7-36-29 (i segmenti B5-B10 sono uguali) Anche in questo lato del disco si notano ripetizioni di sequenze di due simboli. Confrontando le due facce del disco tuttavia non si riscontrano particolari sequenze ripetute in entrambi i lati, ad esclusione della coppia A29-B11. Questa differenza supporta quindi l’idea che le due facce del disco si riferiscano a periodi diversi (cioè le stagioni), in cui probabilmente si svolgevano attività del tutto differenti. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 23 Analisi Statistica del Disco di Festo ANALISI DI DIPENDENZA DELLA VARIABILE DOPPIA Lo studio della variabile statistica doppia è stato condotto a partire dalla realizzazione di matrici 45 x 45 contenenti all’interno di ogni cella la frequenza assoluta con cui una determinata successione di simboli si ripete all’interno della medesima faccia del disco. Si è scelto di individuare dapprima la frequenza con cui due simboli adiacenti si ripresentano (indicando con k+1 tale analisi); successivamente sono state realizzate analoghe matrici considerando il passo tra le sillabe pari a k+2. Dal momento che, come precedentemente illustrato, i simboli riportati sul disco sono suddivisi in gruppi mediante linee verticali, si è scelto dapprima di individuare la ricorrenza delle sole sillabe all’interno della medesima “parola” (non considerando quindi i simboli adiacenti appartenenti a segmenti differenti) e, in una seconda fase, di rilevare tale ricorrenza per le sole sillabe iniziali di parola. Inoltre dal momento che il “discorso” presente sul disco è strutturato secondo una spirale, queste elaborazioni sono state sviluppate, sia per la faccia A che B, leggendo le combinazioni dei simboli sia dall’esterno del disco verso l’interno, che viceversa. Si riportano tutte le matrici realizzate della variabile doppia relative ai passi k+1 e k+2 (successione di 2 e 3 simboli). Si sarebbero potute realizzare analoghe matrici considerando i passi tra le sillabe pari a k+3, k+4, k+5, k+6 (in quanto le “parole” sono costituite da un minimo di 2 a un massimo di 7 simboli) ma queste ultime sono state tralasciate per scarsità di ricorrenze rendendole poco rappresentative. A maggior ragione ha poco senso e significato un’analisi delle ricorrenze tra le “parole” (in tutto rispettivamente 31 e 30 per le facce A e B). Infatti uno studio della variabile doppia richiede quantomeno un centinaio di dati ed evidentemente un terzo di questi non costituisce un campione capace di fornire stime consistenti. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 24 Analisi Statistica del Disco di Festo Lato A esterno → interno t tutte le parole (k+1) A et (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 25 Analisi Statistica del Disco di Festo Lato A esterno → interno t tutte le parole (k+2) A et (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 26 Analisi Statistica del Disco di Festo Lato A interno → esterno t tutte le parole (k+1) A it (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 27 Analisi Statistica del Disco di Festo Lato A interno → esterno t tutte le parole (k+2) A it (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 28 Analisi Statistica del Disco di Festo Lato A esterno →interno 1 iniziale (k+1) A e1 (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 29 Analisi Statistica del Disco di Festo Lato A esterno →interno 1iniziale (k+2) A e1 (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 30 Analisi Statistica del Disco di Festo Lato A interno → esterno 1 iniziale (k+1) A i1 (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 31 Analisi Statistica del Disco di Festo Lato A interno → esterno 1 iniziale (k+2) A i1 (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 32 Analisi Statistica del Disco di Festo Lato B esterno → interno t tutte le parole (k+1) B et (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 33 Analisi Statistica del Disco di Festo Lato B esterno → interno t tutte le parole (k+2) B et (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 34 Analisi Statistica del Disco di Festo Lato B interno → esterno t tutte le parole (k+1) B it (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 35 Analisi Statistica del Disco di Festo Lato B interno → esterno t tutte le parole (k+2) B it (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 36 Analisi Statistica del Disco di Festo Lato B esterno →interno 1 iniziale (k+1) B e1 (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 37 Analisi Statistica del Disco di Festo Lato B esterno →interno 1 iniziale (k+2) B e1 (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 38 Analisi Statistica del Disco di Festo Lato B interno → esterno 1 iniziale (k+1) B i1 (k+1) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 39 Analisi Statistica del Disco di Festo Lato B interno → esterno 1 iniziale (k+2) B i1 (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 40 Analisi Statistica del Disco di Festo CONNESSIONE E REGRESSIONE: INDICI DI BONFERRONI E PEARSON Per individuare l’eventuale presenza di una connessione all’interno della variabile doppia sono stati calcolati gli indici di Bonferroni e di Pearson (unilaterali e bilaterali). Gli indici di Bonferroni ottenuti sono i seguenti: A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) βx 0.931 0.894 0.924 0.815 0.989 0.978 0.968 0.905 0.888 0.863 0.892 0.868 0.897 0.847 0.885 0.941 βy 0.924 0.819 0.931 0.888 0.931 0.719 0.944 0.908 0.892 0.868 0.888 0.863 0.836 0.798 0.867 0.909 β0 0.928 0.856 0.928 0.851 0.960 0.839 0.956 0.906 0.890 0.866 0.890 0.866 0.866 0.822 0.876 0.925 β-1 0.928 0.855 0.928 0.850 0.959 0.829 0.956 0.906 0.890 0.866 0.890 0.866 0.865 0.822 0.876 0.925 Gli indici di Pearson ottenuti sono i seguenti: A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) 0.640 0.175 0.650 0.755 0.904 0.419 0.717 0.778 0.452 0.459 0.482 0.413 0.500 0.529 0.674 0.373 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 0.650 0.772 0.640 0.175 0.971 0.983 0.800 0.364 0.482 0.413 0.452 0.459 0.653 0.558 0.550 0.719 0.645 0.508 0.645 0.497 0.937 0.696 0.755 0.586 0.467 0.438 0.467 0.438 0.572 0.542 0.613 0.580 41 Analisi Statistica del Disco di Festo CORRELAZIONE: DIPENDENZA LINEARE A causa dell’elevato valore degli indici di Bonferroni precedentemente ottenuti, è possibile affermare che non sussiste indipendenza all’interno della variabile doppia, tuttavia la presenza di una connessione non è sufficiente per determinare il tipo di dipendenza esistente. Volendo considerare la possibilità di un’eventuale dipendenza lineare all’interno della variabile doppia, mediante un apposito programma sono stati riorganizzati i dati in modo tale da valutare se effettivamente essi si distribuiscono approssimativamente secondo una retta. Sono riportate le rette di regressione ottenute relative al lato A e B riferite ai 16 casi precedentemente considerati. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 42 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 43 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 44 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 45 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 46 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 47 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 48 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 49 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 50 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 51 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 52 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 53 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 54 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 55 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 56 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 57 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 58 Analisi Statistica del Disco di Festo A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) r = coeff. di correlazione lineare 0.94 0.90 0.94 0.89 0.96 0.85 0.96 0.94 0.86 0.87 0.87 0.88 0.92 0.83 0.94 0.94 2.178 1.668 2.754 3.228 0.820 1.376 0.713 0.884 3.981 3.111 3.652 2.438 0.997 1.429 1.045 0.849 3.310 3.436 2.611 1.854 0.524 2.207 0.684 0.856 3.973 2.700 4.368 3.300 1.685 2.299 0.959 1.037 Avendo ottenuto dei valori di r elevati è possibile affermare che i dati sono ben distribuiti attorno alle rette stimate. Per completezza si riportano anche gli indici di Pearson (unilaterali e bilaterali), calcolati sui dati riordinati. A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) 0.975 0.937 0.956 0.919 0.997 0.991 0.995 0.984 0.823 0.863 0.863 0.870 0.967 0.915 0.962 0.978 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 0.951 0.942 0.977 0.934 0.994 0.854 0.992 0.982 0.861 0.841 0.824 0.860 0.943 0.834 0.959 0.975 0.960 0.941 0.964 0.922 0.996 0.889 0.993 0.983 0.840 0.854 0.842 0.864 0.949 0.856 0.960 0.976 59 Analisi Statistica del Disco di Festo INFERENZA STATISTICA SUI RISULTATI DELLE VARIABILI SEMPLICI E DOPPIE TEST PARAMETRICI SULLA VARIABILE SEMPLICE Le analisi svolte nella seguente sezione sono finalizzate a confrontare le distribuzioni dei simboli tra le due facce. Infatti se esse si rivelassero simili, si potrebbero trarre significative conclusioni relative a un analogo comportamento delle distribuzioni dei simboli su entrambi i lati del disco. Molti studiosi del disco di Festo hanno finora supportato le ipotesi che il contenuto di questo reperto possa essere sia di tipo discorsivo (interpretazione dei simboli come sillabe di un alfabeto attualmente sconosciuto) che astronomico. Quest’ultima interpretazione si basa sul considerare i simboli come gruppi di attività da svolgere secondo una precisa successione. Di conseguenza nel caso in cui si dimostrasse che le distribuzioni sono confrontabili, si potrebbe supporre che entrambe le facce del disco trattino il medesimo argomento, oppure che ognuna di esse rappresenti analoghe attività da svolgere con una data frequenza in un mese, ma seguendo un ordine differente. Per effettuare tale confronto sono stati svolti test di confronto su medie e varianze, ai quali seguono test di verifica della normalità dei dati in esame. TEST SU DUE MEDIE NORMALI CON VARIANZE NOTE Supponiamo che le distribuzioni delle due facce del disco abbiano media uguale e varianza nota; allora il test sulle differenze delle medie fa uso della distribuzione normale. Quindi, l’ipotesi nulla è: con = incognite mentre la statistica test è data dalla seguente relazione: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 60 Analisi Statistica del Disco di Festo z x y x dove 2 x 2 A 2 B nA nB Eseguendo i calcoli si ottengono i seguenti risultati: statistica normale 0,4915 5% ± 1,96 1% ± 2,57 Il test, quindi, ci porta a non rifiutare l’ipotesi nulla e ci porta inoltre a dire che le attività venivano svolte con la stessa frequenza in entrambi i mesi oppure che sulle due facce viene trattato lo stesso argomento, a seconda dell’interpretazione che si vuole dare al disco. TEST SU DUE MEDIE CON VARIANZE INCOGNITE UGUALI Qualora non fossero note le varianze delle due facce del disco, il test sulla media diventa un test facente uso della distribuzione t-student. Ipotizzando che le due varianze incognite siano uguali l’ipotesi nulla diventa: con σA = σB incognite La statistica test è data dalla seguente relazione: t Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture x y ˆ x 61 Analisi Statistica del Disco di Festo dove ˆ x n A nB n A nB nA 1 ˆ A2 nA nB nB 1 ˆ B2 2 Eseguendo i calcoli e conoscendo i gradi di libertà della t-student, μ = nA + nB - 2, si ottengono i seguenti risultati: statistica 0,4912 t-student (239) 5% ± 1,96 1% ± 2,57 Anche in questo caso il test ci porta a non rifiutare l’ipotesi nulla. TEST SU DUE MEDIE CON VARIANZE INCOGNITE DIVERSE Nel caso in cui, invece, le due varianze fossero non solo incognite ma anche diverse tra di loro, allora il test sulla media diventa un test di Welch (ovvero sempre un test facente uso della distribuzione t-student, ma dove i gradi di libertà sono opportunamente calcolati) in cui l’ipotesi nulla è: con σA ≠ σB incognite La statistica test è data dalla seguente relazione: t x y ˆ x dove Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 62 Analisi Statistica del Disco di Festo ˆ 2 x ˆ A2 nA ˆ B2 nB In questo caso i gradi di libertà della t-student sono stati ottenuti dalla seguente relazione: Eseguendo i calcoli si ottengono i seguenti risultati: statistica gdl (μ) 0,4915 241 t-student (241) 5% ± 1,96 1% ± 2,57 Ancora una volta il test ci porta a non rifiutare l’ipotesi nulla. TEST SU DUE VARIANZE Si suppone che le distribuzioni delle due facce del disco abbiano varianza uguale. In questo caso l’ipotesi nulla è: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 63 Analisi Statistica del Disco di Festo La statistica test è data dalla seguente relazione: F 1, 2 ˆ A2 ˆ B2 È confrontata con i valori teorici ricavati della distribuzione Fdi Fisher . I gradi di libertà della distribuzione sono: per il numeratore μ1 = nA – 1; per il denominatore μ2 = nB – 1. Eseguendo i calcoli si ottengono i seguenti risultati: statistica 1,128 F+ F- 5% 1,39 0,72 1% 1,59 0,63 Anche il test sulle due varianze ci porta a non rifiutare l’ipotesi nulla. I test effettuati ci portano a pensare che possa essere ragionevole supporre che ci sia coerenza tra le due facce del disco e ciò è valido qualunque sia l’ipotesi interpretativa che si voglia avanzare. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 64 Analisi Statistica del Disco di Festo TEST NON PARAMETRICI SULLA VARIABILE SEMPLICE I test non parametrici o Distribution-Free sono caratterizzati dall’assenza dell’ipotesi di normalità sulla distribuzione della popolazione in esame. Si distinguono in Test di Rango in cui si suppone che i campioni siano indipendenti e Test di Segno, in cui tale ipotesi non è necessariamente verificata. I test non parametrici presentano alcuni vantaggi rispetto ai test statistici classici, in quanto risultano di comprensione immediata ed elementare, sono caratterizzati da condizioni di validità meno forti (più generali) e i calcoli necessari non presentano in genere difficoltà computazionali. E’ importante però evidenziare anche l’esistenza di svantaggi quali lo spreco di informazione e la bassa potenza del test (fattore che renderebbe il test troppo conservativo, situazione in cui l’ipotesi nulla verrebbe accettata anche quando dovrebbe valere l’ipotesi alternativa). TEST DI RANGO TEST DI MANN-WHITNEY Consente il confronto dei valori centrali di due campioni X e Y indipendenti, nel caso in esame costituiti dai simboli presenti sulla faccia A e B del Disco. Dopo aver ordinato in senso crescente i dati di entrambi i campioni, si assegnano i ranghi, attribuendo a dati con lo stesso numero d’ordine lo stesso rango pari al valor medio del numero d’ordine di tali dati. In seguito si calcola la somma dei ranghi di X e Y pari a R̂ X e R̂ y , e le ampiezze campionarie N̂ X e N̂ y . Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 65 Analisi Statistica del Disco di Festo Rˆ x Nx Nx Ny 1 2 NxNy Nx Ny 1 z 12 dove Nx Nx Ny 1 2 e NxNy Nx Ny 1 rappresentano la media e la varianza dei 12 ranghi. Nel caso in esame si ottiene: z = -0,133 che, confrontato con i valori della distribuzione normale al 1% e 5% di significatività, evidenzia che il test è passato, in quanto: - z teo< z spe< + z teo essendo: 5% 1% z teorica ± 1,96 ± 2,57 TEST DI SIEGEL-TUCKEY Consente il confronto dei valori di dispersione di due campioni X e Y indipendenti, nel caso in esame coincidenti con i simboli presenti sulla faccia A e B del Disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 66 Analisi Statistica del Disco di Festo Il test viene effettuato calcolando e ordinando in senso crescente gli scarti in valore assoluto dei singoli dati rispetto alla mediana del campione. In seguito si assegnano i ranghi (in modo analogo a quanto illustrato nel test di Mann-Whitney), attribuendo valore 1 al dato il cui scarto rispetto alla mediana è nullo e via via crescendo. In seguito si calcola la somma dei ranghi di X e Y pari a R̂ X e R̂ y , e le ampiezze campionarie N̂ X e N̂ y . Rˆ x Nx Nx Ny 1 2 NxNy Nx Ny 1 z 12 Nel caso in esame si ottiene: z = 0,734 che, confrontato con i valori della distribuzione normale al 1% e 5% di significatività, evidenzia che il test è passato, in quanto: - z teo< z spe< + z teo essendo: 5% 1% Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture z teorica ± 1,96 ± 2,57 67 Analisi Statistica del Disco di Festo TEST DI SEGNO TEST DI THOMSON: TEST DEL SEGNO PER I VALORI CENTRALI Consente di confrontare i valori centrali di due campioni non indipendenti assegnando un segno “più” o “meno” a seconda del valore assunto dalla differenza tra i valori argomentali di X e Y e scartando i dati con differenza nulla (sospettati di essere non indipendenti). Definiti quindi Np (numero dei segni “più”), Nm (numero dei segni “meno”), Ntot = Np + Nm e fˆ = Np/Ntot si ha: fˆ 0,5 0,5 Ntot z Si è ottenuto: z = 0,447 che confrontato con i valori teorici di z relativi alla normale al 1% e 5% di significatività indica che il test è passato. 5% 1% z teorica ± 1,96 ± 2,57 TEST DEL SEGNO PER I VALORI DI DISPERSIONE Consente di confrontare i valori di dispersione di due campioni non indipendenti. Occorre calcolare dapprima lo scarto in valore assoluto di ogni dato rispetto alla mediana relativa al campione a cui appartiene il dato stesso; si procede quindi assegnando un segno “più” o “meno” a seconda del valore assunto dalla differenza di ogni coppia di scarti appena calcolati ed ancora scartando i dati con differenza nulla (sospettati di essere non indipendenti). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 68 Analisi Statistica del Disco di Festo Definiti quindi Np (numero dei segni “più”), Nm (numero dei segni “meno”), Ntot = Np + Nm e fˆ = Np/Ntot si ha: fˆ 0,5 0,5 Ntot 5% 1% z z teorica ± 1,96 ± 2,57 TEST DI KOLMOGOROV-SMIRNOV Il test di Kolmogorov-Smirnov è un test di buon adattamento fra la distribuzione di probabilità e l’istogramma delle frequenze cumulate. L’obiettivo è quindi quello di testare l’ipotesi che su entrambe le facce si abbia una distribuzione delle frequenze di tipo normale. Si sono quindi effettuati i seguenti passaggi (sulle facce A e B del disco): • ordinamento del campione in senso decrescente; • analisi di frequenza (dapprima relativa poi cumulata) della variabile x (ovvero i simboli presenti sul disco) ponendo il simbolo più frequente come valore centrale e i successivi alternativamente alla sua destra ed alla sua sinistra; • standardizzazione della variabile x rispetto al suo scarto quadratico medio; • calcolo della massima deviazione | t - p |, dove t è la frequenza relativa cumulata e p le probabilità cumulate date dalla distribuzione teorica; Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 69 Analisi Statistica del Disco di Festo • esecuzione del test di buon adattamento. La Funzione di Kolmogorov è: K( ) ( 1) k e 2k 2 2 ; 0 dove λ1-α è il quantile di ordine 1- α relativo alla distribuzione di Kolmogorov. I risultati del test per le due facce del disco sono riportati nelle tabelle sottostanti. FACCIA A max |t - P| 5% 1% Il test è passato poiché: 0,100196 ASCISSA CRITICA 1 coda 0,12312 0,14757 max |t - P| < ascissa critica FACCIA B max |t - P| 5% 1% Il test è passato poiché: 0,128317 ASCISSA CRITICA 1 coda 0,124671 0,149422 max |t - P| < ascissa critica TEST DI PEARSON Il test di Pearson è un test potente utilizzato per testare la normalità della distribuzione delle frequenze dei dati considerati. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 70 Analisi Statistica del Disco di Festo H0 = il campione è estratto da una popolazione con distribuzione normale Il test confronta i valori stimati dei coefficienti di asimmetria e curtosi con quelli teorici della distribuzione normale: γ ≈ N(0; 6/n) β ≈ N(3; 24/n) ˆ2 6 N Asimmetria γ Curtosi β 2 Χ2 osservata Χ22 teorica α=0,01 Χ22 teorica α=0,05 ˆ 3 24 N Lato A 0,024446 3,153466 2 2 2 Lato B -0,055674 2,796276 Lato A 0,131873503 9,21 10,6 Disco totale (A+B) -0,015487 2,974668 Lato B Disco totale (A+B) 0,267263 0,016077736 9,21 9,21 10,6 10,6 Il test passa sia per quanto riguarda il lato A, B che il disco totale. Da questo test e dal precedente si può affermare che gli istogrammi delle frequenze dei simboli su ciascuna faccia del disco (oltre che complessivamente) abbiano distribuzione approssimativamente normale. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 71 Analisi Statistica del Disco di Festo TEST SULLA VARIABILE DOPPIA I test sulla variabile doppia accertano la dipendenza o meno e, nel caso di dipendenza lineare, la correlazione. Per questo motivo si verifica la correlazione tra le due facce e quella determinata dalle successioni di sillabe nelle due facce, nonché la bontà delle regressioni lineari effettuate. TEST PARAMETRICO SUL COEFFICIENTE DI CORRELAZIONE TRA LE DUE FACCE Il coefficiente di correlazione è dato dall’espressione: Dove è la covarianza e σx , σy gli sqm. Svolgendo i conti è stato ottenuto un valore = - 0,081 rxy 2 1 r xy N 2 t osservata t teorica (119-2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture tN 2 - 0.881 1.96 (5%) 2.57 (1%) 72 Analisi Statistica del Disco di Festo Confrontando il valore osservato con quello teorico, si può affermare che il test passa e quindi non si può rifiutare l’ipoteso H0. Ciò significa che esiste indipendenza tra le due facce del disco. TEST NON PARAMETRICO SUL COEFFICIENTE DI CORRELAZIONE DI SPEARMAN TRA LE DUE FACCE Per il calcolo del coefficiente di correlazione sui ranghi è necessario assegnare i ranghi separatamente ai simboli ordinati dei due lati del disco (secondo l’ordine crescente dei valori argomentali) e valutare in seguito le differenze Δi fra i ranghi delle due componenti. E’ possibile quindi calcolare il coefficiente di correlazione sui ranghi di Spearman mediante la seguente formula: rxy 1 6 N 2 n(n 2 1) 1 1 i dove n = 119, avendo eliminato 3 valori più frequenti nella faccia A Svolgendo i conti è stato ottenuto un valore di rxy pari a 0,073. rxy 2 1 r xy N 2 t osservata t teorica (119) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture tN 2 0.787 1.96 (5%) 2.57 (1%) 73 Analisi Statistica del Disco di Festo Confrontando il valore osservato con quello teorico, si può affermare che il test passa e quindi non si rigetta l’ipotesi H0. Ciò significa che esiste indipendenza tra le 2 facce del disco. Prima di passare ai test che riguardano lo studio delle ricorrenze tra sillabe, all’interno delle parole o nell’intero discorso, è opportuno fare qualche osservazione: - I test parametrici e non parametrici sulla variabile semplice, confrontando fra loro medie e varianze, passano tutti (se i parametrici passano, allora i non parametrici passano certamente), provando che il linguaggio è unico tra le due facce del disco. - I test parametrici e non parametrici sulla variabile doppia, avendo calcolato la correlazione, passano (ancora se quello parametrico passa, allora quello non parametrico passa certamente), provando che il discorso è diverso tra le due facce del disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 74 Analisi Statistica del Disco di Festo TEST PARAMETRICO SUL COEFFICIENTE DI CORRELAZIONE DELLA REGRESSIONE LINEARE SULLE SUCCESSIONI DI SILLABE NELLE DUE FACCE Si è scelto di testare i valori del coefficiente di correlazione, di seguito riportati, ottenuti mediante la procedura di regressione lineare precedentemente condotta sulla variabile doppia. A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) r = coeff. di correlazione lineare 0.94 0.90 0.94 0.89 0.96 0.85 0.96 0.94 0.86 0.87 0.87 0.88 0.92 0.83 0.94 0.94 N = numero di connessioni 61 46 61 46 27 25 34 27 74 53 74 53 32 27 30 32 Poiché i valori del coefficiente di correlazione lineare sono abbastanza elevati è stata assunta come ipotesi nulla Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 75 Analisi Statistica del Disco di Festo 1 1 rˆXY ln 2 1 rˆXY 1 1 ln 2 1 0 Zˆ Z 0 1 z Z N 3 Di seguito si riportano i risultati ottenuti dall’applicazione di questo test. Si noti come in tutti i casi il test passi; ciò è rappresentativo del fatto che fra i dati esiste una forte correlazione. Per questo motivo si è ipotizzata una dipendenza di tipo lineare dei dati. z- teo< z spe< z+ teo α 0,05 0,01 A et (k+1) A et (k+2) A it (k+1) A it (k+2) A e1 (k+1) A e1 (k+2) A i1 (k+1) A i1 (k+2) B et (k+1) B et (k+2) B it (k+1) B it (k+2) B e1 (k+1) B e1 (k+2) B i1 (k+1) B i1 (k+2) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture z t e o r i c a ± 1,96 ± 2,57 Z spe 2,02 0,00 2,02 -0,33 2,32 -1,01 2,64 1,30 -1,51 -0,98 -1,17 -0,68 0,63 -1,39 1,38 1,43 76 Analisi Statistica del Disco di Festo L’esecuzione dei test è l’occasione per disegnare carte di controllo per variabili e/o attributi. Infatti mentre la teoria statistica dell’inferenza è un capitolo della matematica applicata e le tabelle dei test statistici sono tipiche delle applicazioni tecnologiche ingegneristiche, la comunicazione ai più (ad esempio, naturalisti, scienziati umanisti, ecc.) diventa espressiva se accompagnata da visualizzazioni oltreché da commenti. Allora con specifico riferimento ai test di buon adattamento alla distribuzione normale, così come più oltre ai test sulle regressioni lineari, carte di controllo di variabili statistiche permettono di evidenziare il risultato dei test statistici andando oltre le tabelle tradizionali. Da queste carte il giudizio critico deriva si come un commento, e tuttavia quest’ultimo è sostenuto per tutti dall’evidenza grafica e non rimane una certificazione, nascosta ai più tra formule e tabelle. La seguente carta di controllo visualizza i valori sperimentali prevalentemente collocati all’interno delle linee fiduciarie, evidenziando così il generale soddisfacimento dell’ipotesi nulla. 1,00 0,95 0,90 0,85 0,80 5% 5% 1% 1% r 0,75 casi Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 77 Analisi Statistica del Disco di Festo Si noti che, fatta eccezione per due valori appena sotto alla linea fiduciaria inferiore, i quattro valori sopra la linea fiduciaria superiore dimostrano una correlazione superiore a quella dell’ipotesi nulla, in questo caso conservativa. TEST DELLA REGRESSIONE LINEARE SULLA SUCCESSIONE DI SILLABE NELLE DUE FACCE. E’ stato condotto un test χ2 sui valori di ottenuti a seguito della procedura di linearizzazione. Si è scelto di spiegare con le medie di fissando così l’ipotesi nulla . Le suddette medie, riferite nell’ordine seguente Axt, Bxt, Ayt, Byt (t = tutte le parole) e Ax1, Bx1, Ay1, By1 ( 1 = iniziali di parola) hanno valori: Axt 6.383 Bxt 11.202 Ayt 8.254 Byt 13.261 Ax1 0.964 Bx1 1.212 Ay1 1.587 By1 2.530 Di seguito si riportano i valori di e Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture associati alle rette di regressione. 78 Analisi Statistica del Disco di Festo x 2.178 1.668 2.754 3.228 0.820 1.376 0.713 0.884 3.981 3.111 3.652 2.438 0.997 1.429 1.045 0.849 Aet(k+1) Aet(k+2) Ait (k+1) Ait (k+2) Ae1(k+1) Ae1(k+2) Ai1(k+1) Ai1(k+2) Bet (k+1) Bet (k+2) Bit (k+1) Bit (k+2) Be1(k+1) Be1(k+2) Bi1 (k+1) Bi1 (k+2) y 4.744 2.782 7.585 10.420 0.672 1.893 0.508 0.781 15.848 9.678 13.337 5.944 0.994 2.042 1.092 0.721 3.310 3.436 2.611 1.854 0.524 2.207 0.684 0.856 3.973 2.700 4.368 3.300 1.685 2.299 0.959 1.037 x Aet(k+1) Aet(k+2) Ait (k+1) Ait (k+2) Ae1(k+1) Ae1(k+2) Ai1(k+1) Ai1(k+2) Bet (k+1) Bet (k+2) Bit (k+1) Bit (k+2) Be1(k+1) Be1(k+2) Bi1 (k+1) Bi1 (k+2) intervallo confidenza (1%) 92.0 – 35.5 79.5 – 28.0 92.0 – 35.5 79.5 – 28.0 49.6 – 11.8 46.9 – 10.5 53.7 – 13.8 49.6 – 11.8 104.2 – 43.3 79.5 – 28.0 104.2 – 43.3 79.5 – 28.0 53.7 – 13.8 49.6 – 11.8 53.7 – 13.8 53.7 – 13.8 intervallo confidenza (5%) 83.3 – 40.5 71.4 – 32.4 83.3 – 40.5 71.4 – 32.4 43.2 – 14.6 40.6 – 13.1 47.0 – 16.8 43.2 – 14.6 95.0 – 48.8 71.4 – 32.4 95.0 – 48.8 71.4 – 32.4 47.0 – 16.8 43.2 – 14.6 47.0 – 16.8 47.0 – 16.8 10.956 11.806 6.817 3.437 0.275 4.871 0.468 0.733 15.785 7.290 19.079 10.890 2.839 5.285 0.920 1.075 y 44.6 19.6 71.3 73.5 18.1 47.1 17.4 21.1 103.3 44.9 86.9 27.6 25.4 43.8 26.1 18.4 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture intervallo confidenza (1%) 92.0 – 35.5 79.5 – 28.0 92.0 – 35.5 79.5 – 28.0 49.6 – 11.8 46.9 – 10.5 53.7 – 13.8 49.6 – 11.8 104.2 – 43.3 79.5 – 28.0 104.2 – 43.3 79.5 – 28.0 53.7 – 13.8 49.6 – 11.8 53.7 – 13.8 53.7 – 13.8 intervallo confidenza (5%) 83.3 – 40.5 71.4 – 32.4 83.3 – 40.5 71.4 – 32.4 43.2 – 14.6 40.6 – 13.1 47.0 – 16.8 43.2 – 14.6 95.0 – 48.8 71.4 – 32.4 95.0 – 48.8 71.4 – 32.4 47.0 – 16.8 43.2 – 14.6 47.0 – 16.8 47.0 – 16.8 79.6 64.4 49.6 18.7 4.5 73.7 9.7 12.0 86.9 28.6 105.0 42.7 34.8 54.3 10.5 13.2 79 Analisi Statistica del Disco di Festo Dal confronto dei valori di σ02 con i rispettivi intervalli di confidenza calcolati, emerge che il test passa per la maggior parte dei casi o comunque il valore ipotizzato non si discosta molto da quelli definiti dall’intervallo. Le seguenti carte di controllo visualizzano i valori sperimentali prevalentemente collocati all’interno delle linee fiduciarie, evidenziando così il generale soddisfacimento delle ipotesi nulle. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 80 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 81 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 82 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 83 Analisi Statistica del Disco di Festo Un’osservazione conclusiva relativa allo studio delle ricorrenze tra tutte le sillabe all’interno delle parole e le sole sillabe iniziali, rileva che elevati valori di correlazione provano l’intavolarsi di un discorso, probabilmente significativo, anche se purtroppo intraducibile. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 84 Analisi Statistica del Disco di Festo GRAFI PER LA VISUALIZZAZIONE DELLE SUCCESSIONI TRA SILLABE NELLE DUE FACCE L’idea utilizzata per analizzare con la tecnica dei grafi il Disco di Festo è quella di rappresentare come nodi i simboli disegnati sul disco e collegarli con archi in base alle ricorrenze tra sillabe all’interno di una parola. Per facilitarne la lettura, in ogni grafo sono rappresentati solo alcuni nodi (quelli relativi ai simboli che soddisfano le richieste dei criteri) e sono numerati secondo la seguente tabella di corrispondenze numero-carattere: Figura 1: corrispondenze numero-carattere. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 85 Analisi Statistica del Disco di Festo Si traccia un arco dal nodo i al nodo j solo se il numero di volte che il simbolo j segue il simbolo i, all’interno di una stessa parola, è maggiore di una soglia prestabilita. Di conseguenza non vengono conteggiati due simboli consecutivi che cadono in due parole diverse. Nei grafi seguenti si è scelta come soglia 2; il peso di ciascun arco è il numero di volte in cui il simbolo j segue il simbolo i. L’ordine dei simboli (e quindi delle parole) è considerato sempre dall’interno verso l’esterno. Faccia A: Grafo in cui l’arco (i,j) rappresenta il numero di volte in cui il simbolo j segue il simbolo i in uno stesso segmento 13 1 3 38 0 2 2 10 2 0 2 3 7 2 2 2 26 12 23 6 4 0 28 31 12 3 2 27 2 25 45 2 19 2 2 21 18 2 2 2 2 2 37 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 2 35 86 Analisi Statistica del Disco di Festo Faccia B del disco: Grafo in cui l’arco (i,j) rappresenta il numero di volte in cui il simbolo j segue il simbolo i in uno stesso segmento 2 18 2 23 34 2 25 1 3 8 3 13 36 2 33 7 1 39 4 2 3 2 0 2 35 6 45 0 29 22 20 2 24 2 Guardando il grafo della faccia A, si può dedurre, ad esempio, che l’attività rappresentata dal simbolo 2 segue l’attività rappresentata dal simbolo 12 per ben 12 volte e l’attività rappresentata dal simbolo 18 dovrebbe essere successiva all’attività rappresentata dal simbolo 28, di conseguenza può essere ragionevole ritenere che queste due attività dovessero essere eseguite consecutivamente per raggiungere un particolare obiettivo (per esempio l’inizio di una determinata attività era vincolata al completamento di un’altra in precedenza, nell’ipotesi, comunque non confermata, che il disco sia un calendario). Osservazioni analoghe possono essere fatte relativamente ai grafi della faccia B, ad esempio, evincendo che la sequenza ripetuta con più frequenza è quella fra i caratteri 7 e 45, che si presenta per 4 volte. Un’osservazione conclusiva mette in luce un numero particolarmente esiguo (4 nel grafo della faccia A e 3 in quello della faccia B) di ricorrenze multiple diverse (ovvero superiori alla soglia 2, e qui indicate comunque con il numero 0) tra due parole adiacenti, confermando ulteriormente l’intraducibilità del discorso del Disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 87 Analisi Statistica del Disco di Festo VISUALIZZAZIONE TEMATICHE NELLE CLUSTER ANALYSIS DI DUE FREQUENZE FACCE CON Partendo dall’ipotesi che il disco possa essere considerato un elenco ordinato (forse un calendario) dove ciascuna faccia, rappresentante un determinato periodo, sia divisa in parti di questo e ciascun simbolo rappresenti un’attività, si analizza l’andamento temporale delle attività, divise in opportune classi, testando l’uguaglianza del numero di simboli di ciascuna classe che compaiono sulle due facce. Osservando il Disco di Festo si è deciso di considerare la seguente suddivisione in classi: Classe A (1) Simboli antropomorfi: 1, 2, 3, 4, 5, 6 Classe B (2) Simboli zoomorfi: 28, 29, 30, 31, 32, 33, 34 Classe C (3) Simboli fitomorfi: 35, 36, 37, 38, 39 Classe D (4) Simboli raffiguranti utensili: 10, 11, 12, 13, 15, 16, 17, 18, 19, 20, 23 Classe E (5) Simboli religiosi: 7, 8, 9, 24 Classe F (6) Simboli vari: 14, 21, 22, 25, 26, 27, 40, 41, 42, 43, 44, 45 In primo luogo, si verifica se esistono differenze tra le attività di ciascuna classe nelle due facce. In particolare, si suppone che le due facce siano usate per due periodi distinti e complementari che si indicano con A e B. Si nota che nella parte A, è spesso svolta una qualche attività della classe “A”, mentre nella parte B è più frequente l’assenza di questo tipo di attività. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 88 Analisi Statistica del Disco di Festo frequenze Classe A presenza dei simboli in ogni parola Lato A 2 1 1 2 0 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 4 5 parole frequenze Classe A presenza dei simboli in ogni parola Lato B 2 1 1 2 0 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 4 parole Classe A frequenze cumulate (antropomorfi) 5 Lato A 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe A frequenze cumulate (antropomorfi) Lato B 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 89 Analisi Statistica del Disco di Festo Un’interpretazione diffusa è che i simboli antropomorfi rappresentino attività legate alla guerra. Questo porta a pensare che esistano alcuni periodi dell’anno in cui è preponderante tale attività e altri in cui è praticamente assente. Per quanto riguarda le attività della classe B, si evidenzia un andamento omogeneo tra le due facce. frequenze Classe B presenza dei simboli in ogni parola Lato A 3 28 2 29 1 30 31 0 32 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 33 parole frequenze Classe B presenza dei simboli in ogni parola Lato B 2 28 29 1 30 31 0 32 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 33 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 90 Analisi Statistica del Disco di Festo Classe B frequenze cumulate (zoomorfi) Lato A 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe B frequenze cumulate (zoomorfi) Lato B 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole I simboli zoomorfi possono indicare attività tipo la caccia, la pesca e l’allevamento. Queste attività sono svolte in tutti i periodi, come sembra ragionevole, dal momento che non si hanno periodi in cui le necessità primarie vengono meno. Per quanto riguarda le attività della classe C, nella faccia A sono presenti due periodi distinti; uno dove queste attività sono svolte, mentre nell’altro cessano del tutto. Per quanto riguarda la faccia B, non si riscontra invece la stessa suddivisione. Un’ipotesi ragionevole porta a dedurre che la faccia B si riferisca a periodi in cui si svolgono omogeneamente attività agricole che coinvolgono simboli fitomorfi. Al contrario nel periodo A si hanno solo alcuni momenti in cui tali attività sono svolte. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 91 Analisi Statistica del Disco di Festo frequenze Classe C presenza dei simboli in ogni parola Lato A 2 35 1 36 37 0 38 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 39 parole frequenze Classe C presenza dei simboli in ogni parola Lato B 2 35 1 36 0 37 38 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 39 parole Classe C frequenze cumulate (fitomorfi) Lato A 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe C frequenze cumulate (fitomorfi) Lato B 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 92 Analisi Statistica del Disco di Festo Per quanto riguarda le attività della classe D, nella faccia A, si hanno parecchi momenti distribuiti lungo il periodo in cui si svolgono una o più attività e pochi momenti in cui tali attività non si svolgono. Infatti in complesso, si suppone che un’attività lavorativa di questo tipo sia quasi sempre svolta, trattandosi di utensili. Più contenuto è invece il numero di attività nella faccia B. frequenze Classe D presenza dei simboli in ogni parola Lato A 2 10 11 1 12 13 0 15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 16 parole Classe D frequenze presenza dei simboli in ogni parola Lato B 2 10 11 1 12 13 0 15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 16 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 93 Analisi Statistica del Disco di Festo Classe D frequenze cumulate (simboli utensili) Lato A 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe D frequenze cumulate (simboli utensili) Lato B 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole Un confronto comparativo, tra le classi C e D, può evidenziare una complementarietà, estesa anche ai periodi, tra attività agricole e attività artigianali, tipica delle società contadine. Le attività della classe E, all’interno della faccia A, sono concentrate in un breve momento (posto alla fine del periodo), mentre nel resto del periodo non compaiono. Viceversa all’interno della faccia B si hanno una o più attività di questa classe solo nella prima parte del periodo. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 94 Analisi Statistica del Disco di Festo frequenze Classe E presenza dei simboli in ogni parola Lato A 2 7 1 8 0 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 24 parole frequenze Classe E Lato B presenza dei simboli in ogni parola 3 2 7 1 8 0 9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 24 parole Classe E frequenze cumulate (simboli religiosi) Lato A 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe E frequenze cumulate (simboli religiosi) Lato B 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 95 Analisi Statistica del Disco di Festo Assumendo che questi simboli rappresentino attività religiose, si può dedurre che l’andamento non omogeneo di queste attività sia collegato ai cicli della natura, come spesso accade per religioni di tipo primitivo. Nella classe F invece, data la sua eterogeneità, non si evidenziano particolari distinzioni tra le due facce all’interno dei periodi. Classe F frequenze presenza dei simboli in ogni parola Lato A 3 14 2 21 1 22 0 25 26 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 27 parole frequenze Classe F 2 presenza dei simboli in ogni parola Lato B 14 21 1 22 25 0 26 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 27 parole Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 96 Analisi Statistica del Disco di Festo Classe F frequenze cumulate (simboli vari) Lato A 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 parole Classe F frequenze cumulate (simboli vari) Lato B 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 parole Per ogni classe è possibile valutare, se sia ragionevole ritenere uguali le medie sulle due facce, ossia se in media i simboli di ciascuna classe compaiono lo stesso numero di volte sulla faccia A e sulla faccia B. I dati non hanno ovviamente distribuzione normale; pertanto non possiamo confrontare le medie con l’usuale test t-student. Si ricorre allora al test non parametrico di Kruskall-Wallis che, se i campioni sono solo due come in questo caso, è equivalente al test di Mann-Whitney. Si nota subito che i valori assunti dalle frequenze osservate, nei diversi momenti, sono 0, 1, 2 e 3; pertanto esistono molte osservazioni con lo stesso valore. E’ allora opportuno assegnare alle osservazioni uguali la media dei ranghi. In questo caso più generale, la statistica test assume la seguente forma: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 97 Analisi Statistica del Disco di Festo H 1 S2 Ri2 mi n i 1 N ( N 1) 2 4 con: n numero di campioni mi numerosità dell’ i - esimo campione n mi numerosità totale N i 1 Rij rango associato all’osservazione yij i 1,...,n e j 1,..., mi mi Ri Rij j 1 S2 1 N 1 n mi Rij2 i 1 j 1 N ( N 1) 2 4 varianza dei ranghi. In questo caso, si ha: n = 2, m1 = 31 (faccia A) e m2 = 30 (faccia B). Se i valori di mi sono ragionevolmente grandi ( mi 5 ), H è distribuita 2 approssimativamente come una χ ( n -1), sotto l’ipotesi nulla di uguaglianza delle medie. Scelto il livello di significatività α = 0.05, se H > χ , si rifiuta l’ipotesi nulla. Eseguendo il test per ognuna delle sei classi, si ottengono i seguenti risultati: Classe A: H =4.61, p-value=0.032 si rifiuta l’ipotesi nulla Classe B: H =0.09, p-value=0.766 non si può rifiutare l’ipotesi nulla Classe C: H =2.14, p-value=0.144 non si può rifiutare l’ipotesi nulla Classe D: H =5.48, p-value=0.019 si rifiuta l’ipotesi nulla si rifiuta l’ipotesi nulla Classe E: H =14.09, p-value=0.000 Classe F: H =0.00, p-value=0.969 non si può rifiutare l’ipotesi nulla. Il risultato dei test conferma differenze tra le due facce per i simboli antropomorfi, utensili e religiosi ( classi A, D e E) mentre rileva uguaglianza tra le due facce per i simboli zoomorfi, fitomorfi e vari ( classi B, C e F). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 98 Analisi Statistica del Disco di Festo Successivamente si è operata una suddivisione in classi leggermente differente: Classe 1 Simboli antropomorfi: 1, 2, 3, 4, 5, 6 Classe 2 Simboli zoomorfi: 28, 29, 30, 31, 32, 33, 34 Classe 3 Simboli fitomorfi: 35, 36, 37, 38, 39 Classe 4 Simboli raffiguranti armi: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 Classe 5 Simboli raffiguranti utensili: 20, 21, 22, 23, 24, 25, 26, 27 Classe 6 Simboli indumenti: 7, 8, 9 (classe esigua, conglobata con la successiva) Classe 7 Simboli vari: 40, 41, 42, 43, 44, 45 Questa suddivisione corrisponde ad un tentativo di raffinare la classificazione precedente che, conservando le classi dei simboli: antropomorfi, zoomorfi e fitomorfi, cerca innanzi tutto di ridurre la classe dei simboli vari. Allora alcuni di questi simboli sono inseriti nella classe dei simboli utensili; a sua volta, suddivisa in armi ed utensili propriamente detti. Infine la classe dei simboli religiosi può essere vista come una classe di indumenti, collocando il simbolo del tempio nella classe dei simboli utensili dopo averlo interpretato in modo diverso. Lo scopo secondario di questa suddivisione parte dal riconoscere, come la classe utensili (grazie anche ai nuovi inserimenti) sia, di gran lunga, la maggiore. Pertanto la sua suddivisione (in armi e utensili propriamente detti) è opportuna e facilita lo studio delle forme di dipendenza, tra queste parti suddivise e le altri classi. Dapprima si prende in considerazione la dipendenza in termini di connessione, mediante la cluster analysis. Successivamente lo studio della dipendenza è raffinato in termini di dipendenza funzionale, con i cosiddetti piani 2k (cioè con l’analisi di varianza applicata a voci qualitative, caratterizzate solo da presenza o assenza). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 99 Analisi Statistica del Disco di Festo Un’analisi successiva è calcolare le frequenze assolute e relative per ogni simbolo, sulla faccia A e sulla faccia B. Come per la suddivisione precedente, per prima cosa si può notare che le due facce non presentano simmetria nella distribuzione dei simboli, dato che alcuni simboli sono presenti in una sola delle due facce, mentre altri, presenti in maniera cospicua in una faccia, sono quasi assenti nell’altra. In particolare, i simboli 2 e 12 sono presenti nella faccia A, mentre sono quasi assenti nell’altra e viceversa si può dire per il simbolo 7. Questo lascia supporre che le due facce abbiamo significati diversi, ma probabilmente collegati. Per quanto riguarda invece, le classi si può notare che sono ugualmente rappresentate sulle due facce, con l’eccezione della classe A e della classe C, presenti in misura maggiore nella prima faccia, rispetto alla seconda, e della classe B, presente quasi esclusivamente nella seconda faccia. La situazione è rappresentata nei due istogrammi delle varie classi sulle due facce. Frequenze relative classi faccia A Frequenze relative classi faccia B antropomorfi antropomorfi zoomorfi zoomorfi fitomorfi fitomorfi utensili utensili religiosi religiosi vari vari Figura 1: Frequenze relative faccia A e faccia B (prima suddivisione) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 100 Analisi Statistica del Disco di Festo Frequenze relative classi faccia A Frequenze relative classi faccia B antropomorfi antropomorfi zoomorfi zoomorfi fitomorfi fitomorfi armi armi utensili utensili vari vari Figura 2: Frequenze relative faccia A e faccia B (seconda suddivisione) Il disco risulta diviso in parole, contenenti ognuno un numero variabile tra 2 e 7 simboli; per questo si è deciso di rintracciare eventuali relazioni tra simboli di classi diverse. Nei grafici riportati di seguito per ogni classe, è segnato quante volte un suo elemento appare insieme ad un elemento di una delle altre classi in tutte e due le suddivisioni. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 101 Analisi Statistica del Disco di Festo antropomorfi Lato A antropomorfi Lato B 9 39 21 9 8 religiosi vari zoomorfi fitomorfi utensili antropomorfi Lato A 37 8 religiosi vari antropomorfi Lato B 9 5 18 zoomorfi fitomorfi 7 6 5 1 zoomorfi fitomorfi utensili 9 8 9 8 6 6 armi utensili vari zoomorfi fitomorfi armi utensili vari Per quanto riguarda la classe dei simboli antropomorfi è possibile notare una differenza tra le due facce sia per la prima che per la seconda suddivisione. Nei due istogrammi della faccia A l’accoppiata più frequente risulta essere quella con gli utensili e con la classe delle armi; mentre in quelli della faccia B si nota un rapporto più omogeneo tra le varie classi. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 102 Analisi Statistica del Disco di Festo zoomorfi Lato A zoomorfi Lato B 10 9 10 10 13 9 7 5 2 1 zoomorfi Lato9 A 9 zoomorfi Lato B 9 14 10 2 3 5 11 4 Per la classe dei simboli zoomorfi è possibile notare una differenza tra le due facce sia per la prima che per la seconda suddivisione. Nel primo istogramma della faccia A le accoppiate più frequenti sono quelle con gli antropomorfi, gli utensili e i simboli vari mentre nel secondo istogramma quelle più frequenti sono quelle con gli antropomorfi, le armi e gli utensili; nella faccia B si nota un rapporto più omogeneo tra le varie classi sia per la prima che per la seconda suddivisione. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 103 Analisi Statistica del Disco di Festo fitomorfi Lato A fitomorfi Lato B 14 12 15 8 9 2 10 6 0 fitomorfi Lato A fitomorfi Lato B 15 14 11 8 2 12 9 1 16 10 3 Anche per la classe dei simboli fitomorfi è possibile notare una differenza tra le due facce sia per la prima che per la seconda suddivisione. Nel primo istogramma della faccia A le accoppiate più frequenti sono quelle con gli antropomorfi, gli utensili e i simboli vari mentre nel secondo istogramma quelle più frequenti sono con gli antropomorfi, le armi e gli utensili; nella faccia B si nota un rapporto più omogeneo tra le varie classi sia per la prima che per la seconda suddivisione. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 104 Analisi Statistica del Disco di Festo utensili Lato A utensili Lato B 39 17 33 8 10 9 9 6 12 2 armi Lato A 37 9 11 armi Lato B 32 6 6 4 14 6 3 Si evidenzia anche qui la differenza tra le due facce sia per la prima che per la seconda suddivisione. Nell’istogramma della faccia A relativo alla classe degli utensili le accoppiate più frequenti sono quelle con gli antropomorfi, e i simboli vari mentre nel secondo istogramma, quello relativo alle armi, quelle più frequenti sono con gli antropomorfi e gli utensili; nella faccia B l’istogramma relativo agli utensili evidenzia l’accoppiata con i simboli religiosi invece in quello relativo alle armi spicca l’accoppiata con i simboli vari. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 105 Analisi Statistica del Disco di Festo religiosi Lato A religiosi Lato B 8 1 1 13 15 0 utensili Lato B 32 9 17 6 2 utensili Lato A 18 15 14 9 15 16 14 6 5 Ancora una volta, per quanto riguarda la classe dei simboli zoomorfi, è possibile notare una differenza tra le due facce sia per la prima che per la seconda suddivisione. Nel primo istogramma della faccia A l’accoppiata più frequente è quella con i simboli vari, mentre nel secondo istogramma, quello relativo agli utensili, la più numerosa è quella con le armi; nella faccia B si nota un rapporto più omogeneo tra le varie classi sia per la prima che per la seconda suddivisione. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 106 Analisi Statistica del Disco di Festo vari Lato A vari Lato B 33 12 21 10 14 8 7 7 vari Lato A 6 15 9 vari Lato B 6 16 5 8 3 11 14 16 1 Infine, permangono differenze tra le due facce anche per gli istogrammi dei simboli vari nelle due suddivisioni. Si nota, nel primo istogramma l’accoppiata con gli utensili mentre sono abbastanza omogenei gli altri. Pertanto la faccia A della prima suddivisione è caratterizzata da parole con prevalenza di simboli delle classi A, D e F; mentre la stessa faccia, per la seconda suddivisione evidenzia la presenza di parole con simboli A, D ed E. Nella faccia B, in tutte e due le suddivisioni, si evince una certa omogeneità nelle accoppiate. In generale si può dire che, in ognuna delle due facce esistono delle combinazioni ricorrenti di simboli, essenzialmente a coppie prese dalle sei classi, ma si trovano anche combinazioni più complesse con tre o quattro simboli. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 107 Analisi Statistica del Disco di Festo PIANI 2K I piani 2K sono un strumento statistico, relativamente nuovo e innovativo, capace di misurare la dipendenza funzionale o meno, in presenza di variabili qualitative. Infatti le varie entità che caratterizzano le variabili qualitative si prestano male a essere trasformate in dati quantitativi, con parecchi valori argomentali diversi, ma possono essere rappresentate, tramite numeri, adottando i soli zero e uno, per esprimere la presenza o l’assenza di un certo attributo. Come evidente lo zero e l’uno sono puramente convenzionali; meno uno ed uno sarebbero ugualmente plausibili, mentre uno e due (altrettanto validi) si presenterebbero come ranghi, cioè numeri d’ordine. Tutto ciò significa che, mancando un terzo numero diverso, i due numeri scelti, non esprimono una metrica, ma solo un traduzione di parole in numeri (verrebbe quasi voglia di scrivere di lettere in cifre). Una seconda osservazione mette in luce come variabili qualitative complesse debbano essere opportunamente articolate in più variabili, a loro volta, caratterizzate anche da più attributi, così da ridurre eventuali classificazioni plurime, alla sola presenza o assenza di qualcosa. In caso contrario, una metrica è automaticamente forzata sui dati. Allora i piani 2K sono indicati per studiare la dipendenza funzionale o meno di queste variabili, perché prendono in considerazione la varianza spiegata (o qualche altro indice della dispersione, eventualmente robusto) e la confrontano con la varianza residua (o qualche altro indice identico della dispersione, se del caso, ancora robusto). Il confronto, condotto con la statistica della normalità (ovvero con i test non-parametrici), permette di concludere l’inferenza. Nel caso di verifica della dipendenza funzionale, il risultato dei test si colloca in zona critica, mentre in caso contrario, l’ipotesi fondamentale (o nulla) è accettata. In questo secondo caso, ciò non significa automaticamente indipendenza stocastica, in quanto si è solo provata l’indipendenza in media (o correlativa). Infatti le variabili possono essere connesse e solo un test specifico d’indipendenza può decidere sulla presenza (con un risultato in zona critica) o assenza di connessione (viceversa). Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 108 Analisi Statistica del Disco di Festo PIANI 2K prima prova Osservando il Disco di Festo si è deciso di considerare la seguente suddivisione in classi: Classe A (1) - Simboli antropomorfi: 1, 2, 3, 4, 5, 6 Classe B (2) - Simboli zoomorfi: 28, 29, 30, 31, 32, 33, 34 Classe C (3) - Simboli fitomorfi: 35, 36, 37, 38, 39 Classe D (4) - Simboli raffi. utensili: 10, 11, 12, 13, 15, 16, 17, 18, 19, 20, 23 Classe E (5) - Simboli religiosi: 7, 8, 9, 24 Classe F (6) - Simboli vari: 14, 21, 22, 25, 26, 27, 40, 41, 42, 43, 44, 45 Nelle due facce del disco si è poi proceduto ad individuare le classi d’appartenenza dei diversi simboli che compongono le parole per le due facce del disco. A mo’ d’esempio preliminare è trattata brevemente la costruzione del piano 22, relativamente alle classi A (antropomorfi) e E (religiosi) della sola faccia A del disco. Come evidente lo studio relativo al piano 22 = 4 è rappresentabile tramite un quadrato i cui vertici indicano le condizioni di presenza/assenza di ciascuna delle due classi. Gli elementi delle quattro combinazioni sono illustrati con lettere minuscole, per l’assenza, e con lettere maiuscole, per la presenza: ae, Ae, aE, AE. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 109 Analisi Statistica del Disco di Festo Si noti che tutte le coppie sono ordinabili, ma non richiedono metriche. Pertanto il passaggio da lettere, a segni e a ranghi (1,2) non altera, in alcun modo, il contenuto raccolto e il significato relativo. A31 A30 A29 A28 A27 A26 A25 A24 A23 A22 A21 A20 A19 A18 A17 A16 A15 A14 A13 A12 A11 A10 A9 A8 A7 A6 A5 A4 A3 A2 A1 A antropo morfi 2,1 E religiosi 1 2 1 1 A E E 7 8 2 1 1 2 A E E A 7 1 2 1 A AE A 2 1 2 2 1 1 1 1 A A A A 2 2 1 2 2 6 1 1 1 1 1 1 A A A A A A 2,1 2 A 3 2 1 3 1 1 1 1 A A A A 24 7 2,4 2,6 2 1 2 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 110 Analisi Statistica del Disco di Festo 1 2 3 4 2 1 1 4 6 10 1,4 0,24 2 1 20 21 1,047619 0,045351 ae Ae aE AE 6 20 4 1 5 26 31 1,16129 0,135276 0,108141 1,2 1,769231 1,677419 1,16129 0,135276 0,250916 31 0,16 0,177515 0,218522 0,17469 0,043833 1,677419 0,218522 0,027134 0,250916 0,200586 0,200586 1 2 2 74 -74 5 1 -74 74 26 10 21 31 260 0,569231 0,447868 0,435294 0,200586 420 0,352381 Fischer Pearson Bonferroni Fisher Bartlett Lawley gdl 5% 15;45 1,45 15 25,00 30 43,80 16 26,30 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 1A 0,25 0,00 0,00 0,00 5A 0,25 0,00 111 Analisi Statistica del Disco di Festo Lo svolgimento dell’analisi si compie effettuando il test F di Fisher e preliminarmente quello di Bartlett sull’omogeneità delle varianze. Ad eccezione del caso monodimensionale, la pluralità delle componenti permette altresì il test di Lawley sui coefficienti di correlazione. Inoltre a partire dal piano 22 è possibile conglobare tutte le varianze in un unico test di Bartlett, mentre a partire dal piano 23 è possibile riunire tutti i coefficienti di correlazione in un unico test di Lawley. Nelle due tabelle sottostanti sono riportati i simboli e le classi che compongono le parole nelle due facce del disco. A31 A30 A29 A28 A27 A26 A25 A24 A23 A22 A21 A20 A19 A18 A17 A16 A15 A14 A13 A12 A11 A10 A9 A8 A7 A6 A5 A4 A3 A2 A1 A antropo morfi 2,1 2,4 B zoomorfi C fitomorfi 12,13,18 12 29 29,29,34 33 12 12 2,6 2 1 2 2 2 2 1 2 2 6 32 35 35 38 39 28 31 35,37 33 31 28 31 32 31 2,1 3 2 1 3 E religiosi F vari 24 7 40 45 7 8 40 27,45 27,44 7 26 41 41,40 12,18 31 2 1 2 D utensili 35 38 35,37 38 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 12,19 12,23 11 10,23,18 27,25 12 12 23 12 10,23,18 26 27,27,21 12 12,18 18,17,19 12 12,13 23,19 10 12 13 10 26 27,14,27 26 27,25 26 27,27,21 5 3 3 3 5 4 3 4 3 5 4 5 2 6 2 4 7 2 4 6 2 4 7 4 3 4 3 3 7 2 3 AD DEF BEF B ABDF DEF EF AD BCF ACDF AEF ABCD CD ADF AB ABDF ACDF BD ABDF ADF AB ABDF ABDF AD BDF AD CD ACD ACDF AD ACD 112 Analisi Statistica del Disco di Festo Tabella 1: Simboli e classi che compongono le parole della faccia A. B30 B29 B28 B27 B26 B25 B24 B23 B22 B21 B20 B19 B18 B17 B16 B15 B14 B13 B12 B11 B10 B9 B8 B7 B6 B5 B4 B3 B2 B1 A antropom orfi 2 B zoomorfi C fitomorfi 35 37 2,5 D utensili E religiosi F vari 12 7 7 22,40 27,45 23 22,25,27 33 1 1 33 39 29 37 35 36 38 35 2 1 1 6 2,1 29,33 32,33 29 29 29 29 34 20,12 16,23,18 13 15,13,18 7 7,24 20 16,18 36 13 36 23 18 23,18 2,6 43 22,42,25 40 26,40 27,25 24,24 14 35,39 35 29 30 24 36 39 35 29,34 18 23 23 9 7,8 8 7 7,8 27 45 22 27,25 7 7,7 7,24 7,8 9,7 7 7 45 22 25 45 5 4 4 3 4 4 4 5 4 4 4 4 5 3 3 5 4 4 3 3 5 4 3 3 4 5 5 5 4 2 ADEF CEF ACD F BDE DF ABCD ADE CF CEF ACF ACF BCDE DF AB ABC AEF BCE BDE BEF BCEF BDF CDE EF DE BCEF BCDE ACDE BDF EF Tabella 2: Simboli e classi che compongono le parole della faccia B. Con specifico riferimento allo studio del disco e alla suddivisione in sei classi, l’analisi a seguire può essere condotta dal piano 21 = 2 fino al piano 26 = 64. La tabella 3 mostra l’elenco completo di tutte le combinazioni e le tabelle 4 e 5 dispongono i dati raccolti in accordo con le combinazioni possibili. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 113 Analisi Statistica del Disco di Festo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 abcdef Abcdef aBcdef abCdef abcDef abcdEf abcdeF ABcdef AbCdef AbcDef AbcdEf AbcdeF aBCdef aBcDef aBcdEf aBcdeF abCDef abCdEf abCdeF abcDEf abcDeF abcdEF 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 ABCdef ABcDef ABcdEf ABcdeF AbCDef AbCdEf AbCdeF AbcDEf AbcDeF AbcdEF aBCDef aBCdEf aBCdeF aBcDEf aBcDeF aBcdEF abCDEf abCDeF abCdEF abcDEF ABCDef ABCdEf 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 ABCdeF ABcdEF AbcDEF abCDEF ABcDeF AbCdEF aBcDEF ABcDEf AbCDeF aBCdEF AbCDEf aBCDeF aBCDEf aBCDEF AbCDEF ABcDEF ABCdEF ABCDeF ABCDEf A B C D EF Tabella 3: Elenco di tutte le combinazioni possibili. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 114 Analisi Statistica del Disco di Festo 1 abcdef 23 ABCdef 45 2 Abcdef 24 ABcDef 46 3 aBcdef 25 ABcdEf 47 4 abCdef 26 ABcdeF 48 5 abcDef 27 AbCDef 6 abcdEf 28 AbCdEf 50 7 abcdeF 29 AbCdeF 51 ABCde F ABcdE F AbcDE F abCDE F ABcDe F AbCdE F aBcDEF 8 ABcdef 30 AbcDEf 52 ABcDEf 9 AbCdef 31 AbcDeF 2 53 10 AbcDef 32 AbcdEF 1 54 11 AbcdEf 33 aBCDef 55 12 AbcdeF 34 aBCdEf 56 13 aBCdef 35 aBCdeF AbCDe F aBCdE F AbCDE f aBCDe F aBCDEf 14 aBcDef 36 aBcDEf 15 aBcdEf 37 aBcDeF 1 59 16 aBcdeF 38 aBcdEF 1 60 17 abCDef 39 abCDEf 61 18 abCdEf 40 abCDeF 62 19 abCdeF 41 abCdEF 63 20 abcDEf 42 abcDEF 2 21 abcDeF 43 ABCDef 1 22 abcdEF 44 ABCdEf 1 2 5 1 2 1 2 1 49 57 58 64 5 3 aBCDE F AbCDE F ABcDE F ABCdE F ABCDe F ABCDE f ABCDE F Tabella 4: Dati raccolti in accordo con le combinazioni possibili della faccia A. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 115 Analisi Statistica del Disco di Festo 1 abcdef 23 ABCdef 1 2 Abcdef 24 ABcDef 46 3 aBcdef 25 ABcdEf 47 4 abCdef 26 ABcdeF 48 5 abcDef 27 AbCDef 6 abcdEf 28 AbCdEf 7 abcdeF 1 29 AbCdeF 2 51 ABCde F ABcdE F AbcDE F abCDE F ABcDe F AbCdE F aBcDEF 8 ABcdef 1 30 AbcDEf 1 52 ABcDEf 9 AbCdef 31 AbcDeF 53 10 AbcDef 32 AbcdEF 11 AbcdEf 33 aBCDef 12 AbcdeF 34 aBCdEf 13 aBCdef 35 aBCdeF AbCDe F aBCdE F AbCDE f aBCDe F aBCDEf 14 aBcDef 36 aBcDEf 2 58 15 aBcdEf 37 aBcDeF 2 59 16 aBcdeF 38 aBcdEF 1 60 17 abCDef 39 abCDEf 1 61 18 abCdEf 40 abCDeF 19 abCdeF 1 41 abCdEF 20 abcDEf 1 42 abcDEF 21 abcDeF 2 43 ABCDef 22 abcdEF 2 44 ABCdEf 1 45 49 50 1 54 55 1 56 57 62 2 63 64 1 2 1 2 aBCDE F AbCDE F ABcDE F ABCdE F ABCDe F ABCDE f ABCDE F 1 Tabella 4: Dati raccolti in accordo con le combinazioni possibili della faccia B. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 116 Analisi Statistica del Disco di Festo Di conseguenza la tabella 6 riassume i soli casi non nulli e costituisce i dati d’ingresso per l’analisi dei piani 2K. aBcdef ABcdef AbcDef aBcDef abCDef abcdEF AbCDef AbcDeF AbcdEF aBCdeF aBcDeF aBcdEF abcDEF ABCDef ABcDeF AbCDeF Dati 16 Lato A 121111 221111 211211 121211 112211 111122 212211 211212 211122 122112 121212 121122 111222 222211 221212 212212 1 2 5 1 2 1 2 2 1 1 1 1 2 1 5 3 Connessioni 31 abcdeF ABcdef abCdeF abcDEf abcDeF abcdEF ABCdef AbCDef AbCdeF AbcDEf AbcdEF aBCdEf aBcDEf aBcDeF aBcdEF abCDEf abCdEF ABCDef AbcDEF aBCdEF AbCDEf aBCDEf Dati 22 Lato B 111112 221111 112112 111221 111212 111122 222111 212211 212112 211221 211122 122121 121221 121212 121122 112221 112122 222211 211222 122122 212221 122221 1 1 1 1 2 2 1 1 2 1 1 1 2 2 1 1 2 1 1 2 1 2 Connessioni 30 Tabella 6: Casi non nulli nelle due faccie del Disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 117 Analisi Statistica del Disco di Festo L’analisi monodimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle sei classi relativamente ad entrambe le facce del disco. Tabella analisi monodimensionali lato A gdl 5% 1° Fisher 14;24 1,45 1,26 Bartlett 31 43,80 0,00 2° 1,91 0,00 3° 1,43 0,00 4° 5° 6° 3,65 99,00 1,45 0,00 0,00 0,00 Visualizzazione grafica relativa all’analisi monodimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 118 Analisi Statistica del Disco di Festo Tabella analisi monodimensionali lato B gdl 5% 1A Fisher 14;24 1,45 1,86 Bartlett 31 43,80 0,00 2A 0,64 0,00 3A 0,61 0,00 4A 2,21 0,00 5A 2,93 0,00 6A 5,31 0,00 Visualizzazione grafica relativa all’analisi monodimensionale del lato B Tutte le analisi a seguire si muovono conformemente allo schema prefissato. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 119 Analisi Statistica del Disco di Festo L’analisi bidimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle quindici coppie di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi bidimensionale lato A gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 2A 0,99 0,00 2A 1A 0,60 0,00 0,00 0,00 5A 3,19 0,00 5A 1A 0,69 0,00 0,00 0,00 4A 0,85 0,00 4A 2A 0,77 0,00 0,00 0,00 4A 1,32 0,00 4A 3A 0,68 0,00 0,00 0,00 5A 2,59 0,00 5A 4A 1,32 0,00 0,00 0,00 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3A 0,63 0,00 3A 1A 0,67 0,00 0,00 0,00 6A 0,06 0,00 6A 1A 0,68 0,00 0,00 0,00 5A 5,29 0,00 5A 2A 1,31 0,00 0,00 0,00 5A 7,39 0,00 5A 3A 1,04 0,00 0,00 0,00 6A 0,63 0,00 6A 4A 0,96 0,00 0,00 0,00 4A 2,10 0,00 4A 1A 0,89 0,00 0,00 0,00 3A 0,38 0,00 3A 2A 0,66 0,00 0,00 0,00 6A 0,56 0,00 6A 2A 0,78 0,00 0,00 0,00 6A 0,62 0,00 6A 3A 0,50 0,00 0,00 0,00 6A 1,12 0,00 6A 5A 7,39 0,00 0,00 0,00 120 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa analisi bidimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 121 Analisi Statistica del Disco di Festo Tabella analisi bidimensionale lato B gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 2A 0,40 0,00 2A 1A 1,29 0,00 0,00 0,00 5A 0,62 0,00 5A 1A 0,35 0,00 0,00 0,00 4A 1,76 0,00 4A 2A 0,49 0,00 0,00 0,00 4A 1,53 0,00 4A 3A 0,42 0,00 0,00 0,00 5A 1,37 0,00 5A 4A 1,12 0,00 0,00 0,00 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3A 0,47 0,00 3A 1A 1,38 0,00 0,00 0,00 6A 4,53 0,00 6A 1A 1,67 0,00 0,00 0,00 5A 2,25 0,00 5A 2A 0,49 0,00 0,00 0,00 5A 1,70 0,00 5A 3A 0,36 0,00 0,00 0,00 6A 0,63 0,00 6A 4A 0,32 0,00 0,00 0,00 4A 1,90 0,00 4A 1A 1,50 0,00 0,00 0,00 3A 0,59 0,00 3A 2A 0,62 0,00 0,00 0,00 6A 2,75 0,00 6A 2A 0,37 0,00 0,00 0,00 6A 4,20 0,00 6A 3A 0,53 0,00 0,00 0,00 6A 1,60 0,00 6A 5A 1,06 0,00 0,00 0,00 122 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa analisi bidimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 123 Analisi Statistica del Disco di Festo L’analisi tridimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle venti triplette di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi tridimensionale lato A Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 1A 0,24 0,00 2A 5A 7,20 2,72 1A 0,37 0,00 3A 4A 4,39 3,63 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1,83 0,49 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 3A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,53 0,00 1A 0,44 0,00 3A 6A 2,56 2,51 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 2A 0,50 0,00 0,00 3A 0,30 0,00 2A 4A 2,11 3,52 2A 0,61 0,00 0,00 5A 1,62 0,00 4A 0,77 0,00 3A 0,25 0,00 0,00 6,77 9,40 2,17 0,95 1A 0,24 0,00 1A 3A 6,42 11,47 7,63 5,61 1A 0,49 0,00 2A 6A 1,75 9,28 3A 0,26 0,00 0,00 1A 0,31 1,04 6A 0,41 0,00 7,73 4,67 1A 0,37 0,00 4A 5A 3,50 4,28 2A 0,24 0,46 0,00 4A 0,37 0,00 8,36 17,16 2A 0,50 0,00 0,00 6A 0,45 0,00 1,96 4,03 3A 0,29 0,00 0,00 5A 1,17 0,00 6,07 14,67 4A 0,84 0,00 0,00 5A 0,91 0,00 5,83 10,82 124 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 3A 4A 6,68 5,83 2A 0,37 0,00 3A 6A 4,96 2,28 2A 0,31 0,00 4A 6A 7,00 6,46 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 0,19 0,00 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 6,23 6,66 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 4A 6A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,42 0,00 3A 0,50 0,00 4A 5A 6,77 2,10 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,51 0,00 0,00 6A 0,27 0,00 1A 5A 7,67 16,34 3A 0,12 0,00 0,00 4A 0,41 0,00 6A 0,35 0,00 4A 0,34 0,00 0,00 6A 0,21 0,00 4A 0,63 0,00 0,00 5,83 11,68 5,91 2,86 2A 0,24 0,00 5A 6A 6,61 15,95 8,94 5,83 2A 0,46 0,00 2A 4A 6,25 10,72 6,22 6,57 2A 0,40 0,00 3A 5A 6,72 15,28 3A 0,16 0,00 0,00 1A 0,15 0,00 5A 1,80 0,00 6A 0,38 0,00 6,33 15,20 3A 0,20 0,00 0,00 5A 2,15 0,00 4,67 15,45 4A 0,35 0,00 0,00 5A 1,50 0,00 5,44 11,29 5A 0,80 0,00 0,00 6A 0,18 0,00 10,50 10,70 10,89 25,50 3A 0,41 0,00 4A 6A 5A 0,82 0,00 0,00 1,78 3,13 4A 0,71 0,00 0,00 6A 0,33 0,00 2,59 5,96 125 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 36,40 3A 0,18 0,00 5A 6A 5A 1,52 0,00 0,00 5,83 10,96 5,83 17,98 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 6A 0,30 0,00 4A 0,36 0,00 5A 6A 6,22 5,78 5A 1,58 0,00 0,00 6A 0,39 0,00 2,67 11,65 126 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 127 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 128 Analisi Statistica del Disco di Festo Tabella analisi tridimensionale lato B Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 5A 1A 0,82 0,00 3A 4A 3,50 3,03 36,40 1A 0,54 0,00 3A 6A 2A 0,37 0,00 0,00 3A 0,43 0,00 0,31 3,57 2A 0,24 0,00 0,00 3A 0,18 0,00 0,00 5A 0,40 0,00 11,80 10,11 10,63 25,86 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4,08 2,04 1A 0,69 0,00 2A 6A 4A 1,06 0,00 6A 1,55 0,00 4A 1,45 0,00 3,01 7,26 2A 0,07 0,21 0,00 6A 1,58 0,00 3A 0,26 0,00 0,00 5A 0,40 0,00 2,19 15,24 3,29 16,47 1A 0,18 0,00 4A 5A 2A 0,26 0,00 0,00 9,33 6,94 10,89 21,58 1A 0,25 0,00 3A 5A 4,74 8,96 3A 0,11 0,18 0,00 1A 0,95 0,00 2A 4A 3,89 14,45 2,47 16,53 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1,96 2,22 1A 0,15 0,00 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 3A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,98 0,00 4A 0,77 0,00 0,00 5A 0,18 0,00 4,84 13,97 10,27 23,11 129 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 0,26 0,00 3A 6A 1,87 5,33 2A 0,28 0,00 4A 6A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1,15 3,03 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 0,41 0,00 3A 4A 6A 0,31 0,00 3A 0,36 0,00 0,00 4A 1,03 0,00 6A 1,90 0,00 3,12 8,20 4A 0,24 0,00 0,00 6,51 8,22 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,53 0,00 0,00 7,78 17,88 0,64 2,22 2A 0,23 0,00 4A 5A 6A 0,37 0,00 7,05 7,02 2A 0,14 0,00 5A 6A 5A 0,48 0,00 6A 0,99 0,00 3A 0,33 0,00 0,00 5A 1,23 0,00 6,24 7,23 4A 0,67 0,00 0,00 5A 0,83 0,00 7,99 17,53 5A 0,61 0,00 0,00 6A 0,75 0,00 7,41 10,40 9,52 21,72 3A 0,35 0,00 4A 6A 5A 0,07 0,18 0,00 19,83 6,35 12,96 31,11 2A 0,45 0,00 3A 5A 4,01 6,51 3A 0,42 0,00 0,00 1A 0,16 0,00 5A 6A 1,45 2,90 10,71 11,97 3A 0,06 0,02 4A 5A 4A 0,08 0,13 0,00 7,26 6,74 23,07 29,46 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 4A 6A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,82 0,00 4A 0,17 0,00 0,00 6A 0,51 0,00 3,55 1,58 13,69 14,95 130 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 3A 0,15 0,00 5A 6A 8,94 4,80 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,42 0,00 0,00 9,85 18,75 6A 0,92 0,00 4A 0,17 0,00 5A 6A 5A 0,71 0,00 0,00 6A 0,30 0,00 3,37 14,29 5,08 18,07 131 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 132 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 133 Analisi Statistica del Disco di Festo L’analisi quadridimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle quindici quartine di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi quadridimensionale lato A gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3,76 9,43 1A 0,37 0,00 2A 0,31 0,00 2A 3A 6A 3,50 4,59 5,08 1A 0,29 0,56 2A 4A 6A 36,40 3A 4A 5A 3A 0,09 0,00 0,00 4A 0,21 2,93 4,35 26,58 3A 0,09 0,00 0,00 2A 0,17 0,51 3,24 5,91 0,54 9,85 1,30 1A 0,02 0,27 3A 0,08 1,55 4A 0,19 1,34 0,00 6A 0,23 0,00 13,21 8,08 12,36 2,91 1,87 1,67 35,96 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5,37 3,51 9,36 1A 0,03 0,33 2A 4A 5A 6A 0,19 0,00 5A 0,18 0,00 3A 4A 6A 2A 0,29 0,00 3A 0,10 0,00 0,00 5A 0,72 0,00 7,73 6,39 13,77 41,37 2A 0,08 0,43 4A 0,07 0,00 0,00 5A 0,36 0,00 20,52 14,84 21,88 5,95 3,76 6,27 65,66 1A 0,13 0,00 2A 5A 6A 4,53 22,75 4A 0,27 0,00 0,00 1A 0,15 0,08 2A 3A 5A 1,84 1,87 13,52 27,25 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3,15 0,79 8,15 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 4A 2A 0,09 0,30 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,27 0,49 0,69 7,05 4,35 2A 0,23 0,00 5A 0,29 0,00 0,00 6A 0,08 0,00 7,98 9,98 14,17 39,66 1A 0,32 0,00 3A 0,24 0,00 2,50 5,17 1,40 0,33 0,36 4A 0,48 0,00 0,00 6A 0,25 0,00 2,98 11,43 134 Analisi Statistica del Disco di Festo gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 6A 0,16 0,00 3A 0,04 0,47 4A 0,14 2,67 0,00 3A 0,05 0,00 5A 0,40 0,00 0,00 4A 0,23 3,71 5A 0,43 0,00 0,00 1A 0,02 0,10 4A 5A 6A 5A 0,87 0,00 3A 4A 6A 6A 0,04 0,13 5,53 20,67 7,62 16,55 8,06 23,94 73,86 3A 0,07 1,58 4A 5A 6A 5A 0,64 0,00 0,00 19,78 14,51 8,85 7,62 5,71 13,06 62,34 2A 0,12 0,05 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 4A 5A 3A 0,14 0,00 2,87 7,77 2,27 7,32 10,49 7,29 34,09 2A 0,03 0,10 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,09 0,19 4A 5A 6A 4A 0,16 0,00 5A 0,21 0,00 0,00 6A 0,03 0,02 14,41 10,85 7,36 21,65 20,29 6,96 73,11 2A 0,10 0,00 3A 0,12 0,00 7,80 9,79 3,81 0,62 0,00 2A 0,09 0,70 4A 0,13 0,00 4A 0,31 0,00 0,00 6A 0,21 0,00 2,27 21,78 5A 0,58 0,00 0,00 6A 0,05 0,11 13,94 8,16 4,09 21,09 13,69 7,78 61,66 6A 0,02 0,01 5,65 14,55 17,41 18,97 11,06 16,50 75,46 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 135 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 136 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 137 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 138 Analisi Statistica del Disco di Festo Tabella analisi quadridimensionale lato B gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 4A 6A 4A 0,57 3,19 2A 0,01 0,03 3A 0,05 0,04 6,68 2A 0,04 0,05 4A 0,05 0,04 4,24 3A 0,04 0,00 0,61 2,84 8,97 10,69 5,60 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,41 0,00 0,00 9,27 34,06 1A 0,09 0,33 2A 3A 5A 6A 0,66 2,43 6A 0,09 0,71 5A 0,03 1,52 5A 0,26 0,40 6,19 48,29 4A 0,56 0,00 0,00 5A 0,05 0,34 2A 0,01 0,03 5A 0,01 0,04 0,00 6A 0,60 0,00 5,58 18,49 2,55 5,74 10,02 13,62 50,21 1A 0,25 0,00 3A 4A 6A 2A 0,12 0,07 3A 0,25 0,00 0,00 4,72 4,90 5,41 22,96 6,77 18,05 56,32 1A 0,04 0,28 2A 5A 6A 2A 0,24 0,00 5,80 4,20 0,12 33,18 4,35 1A 0,07 0,51 2A 4A 5A 9,22 8,89 1,27 17,30 10,58 28,46 67,91 1A 0,16 0,00 3A 4A 5A 3A 0,06 0,12 0,00 9,79 16,24 2,55 19,79 16,40 16,48 72,86 1A 0,46 1,52 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 6A 2A 0,14 0,20 7,98 10,28 5,50 10,53 10,83 14,80 53,73 1A 0,20 1,83 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 4A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,45 0,00 3A 0,04 0,00 4A 0,01 0,00 0,00 6A 0,16 1,05 13,96 8,34 3,50 16,32 7,86 25,24 67,46 139 Analisi Statistica del Disco di Festo gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 6A 0,53 0,00 3A 0,05 0,02 4A 0,31 0,75 0,00 3A 0,09 0,06 5A 0,20 0,61 4,30 4A 0,04 0,01 5A 0,26 0,00 0,00 1A 0,06 0,59 4A 5A 6A 5A 0,29 0,00 6A 0,39 2,64 4,12 3,63 7,62 2A 0,05 0,13 4A 5A 6A 4A 0,05 0,02 5A 0,04 0,10 1,22 6A 0,16 0,31 6,53 22,19 1,31 6,04 19,96 6,28 55,87 2A 0,18 0,00 3A 4A 6A 3,46 9,61 14,56 16,41 9,96 17,77 64,36 3A 0,03 0,02 4A 5A 6A 5A 0,01 0,02 0,00 0,12 7,72 10,43 6,65 16,12 14,39 49,70 2A 0,08 0,31 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 4A 5A 3A 0,05 0,02 4,91 18,13 2,84 8,27 8,62 16,33 53,00 2A 0,23 0,00 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,08 1,01 3A 0,28 1,01 4A 0,10 0,11 0,00 6A 0,26 0,00 8,18 5,66 17,41 41,80 4A 0,06 0,03 5A 0,38 2,14 3,36 6A 0,09 0,15 5,94 16,53 9,04 10,10 17,49 11,04 62,90 6A 0,27 0,00 6,62 11,42 4,81 1,02 14,42 5,80 39,54 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 140 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 141 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 142 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 143 Analisi Statistica del Disco di Festo L’analisi penta dimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle sei cinquine di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi penta dimensionale lato A Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 3A 4A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,00 0,02 5A 0,19 0,00 3A 0,09 0,00 0,00 4A 0,18 0,90 6A 0,19 0,00 3,32 0,92 3,58 7,07 11,11 0,22 0,58 1,50 0,02 0,96 27,84 1A 2A 73,76 0,12 0,20 0,02 2A 3A 5A 6A 3A 0,02 0,23 0,00 1,10 1,46 3,52 6,32 14,43 4,46 10,70 3,59 3,76 9,04 55,49 1A 2A 89,21 0,04 0,02 0,37 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 3A 4A 5A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 65,59 0,01 0,05 0,03 3A 5A 0,03 0,18 0,86 4,38 10,35 6A 0,00 0,00 0,24 3,67 4,82 8,81 16,98 5,00 5,16 11,36 5,31 18,76 76,17 144 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 3A 4A 5A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,09 0,00 6A 0,02 0,00 4A 5A 0,12 0,04 2,93 2,77 10,95 6A 0,01 0,01 0,31 4,50 2,63 13,23 5,78 16,74 0,47 0,68 7,26 9,91 58,48 2A 3A 23,08 0,00 0,01 0,00 3A 4A 5A 6A 4A 0,03 1,39 0,00 1,33 9,01 14,06 9,23 3,11 4,66 1,60 0,36 4,96 5,97 51,60 1A 3A 66,34 0,07 0,10 1,31 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 4A 5A 6A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 65,12 0,07 0,00 0,41 3,68 6,58 5,79 0,74 2,19 8,97 3,75 6A 4A 5A 0,09 0,25 0,01 1,63 10,28 0,01 18,63 9,61 2,54 14,37 55,36 145 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi penta dimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 146 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 147 Analisi Statistica del Disco di Festo Tabella analisi penta dimensionale lato B Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 5,17 0,57 0,03 1,57 6,16 15,24 1,24 1A 2A 19,09 0,00 0,50 0,00 2A 3A 4A 6A 7,54 15,13 2,30 5,35 0,84 14,67 8,17 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 3A 4A 5A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 17,70 0,12 0,39 0,06 1A 2A 15,00 0,00 0,00 0,00 2A 3A 5A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3A 0,04 0,00 1,05 4A 0,28 0,09 5A 0,03 0,09 8,65 1,14 10,65 47,95 3A 0,00 0,00 0,98 4A 0,00 0,00 6A 0,03 0,05 3,62 4,03 17,74 75,50 3A 0,04 0,00 1,01 5A 0,00 0,00 6A 0,28 0,40 4,19 2,44 0,45 9,78 0,45 0,72 4,84 11,26 9,91 11,95 53,24 148 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 3A 4A 5A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,00 0,00 6A 0,04 0,05 4A 0,00 0,00 0,71 5A 0,00 0,00 6A 0,12 0,06 1,42 2,33 2,62 14,10 2,25 0,42 7,29 2,24 15,16 2,28 47,65 2A 3A 24,93 0,02 0,10 0,00 3A 4A 5A 6A 4A 0,04 0,00 0,33 2,40 1,26 0,45 16,30 2,21 0,72 2,73 5,82 19,56 2,53 51,32 1A 3A 16,69 0,00 0,35 0,00 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 4A 5A 6A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 15,92 0,00 0,16 0,00 4A 0,00 0,00 0,32 5A 0,09 0,06 6A 0,06 0,01 0,53 2,57 2,67 9,78 14,06 6,29 11,28 1,76 12,95 7,58 66,04 149 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi penta dimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 150 Analisi Statistica del Disco di Festo A conclusione dell’analisi dei piani 2k, alcune considerazioni statistiche possono essere evidenziate. Innanzitutto occorre rilevare che l’analisi, giocoforza qualitativa, non può pretendere spiegazioni troppo forti, anche per l’esiguità dei dati raccolti e sottoposti a test. Una seconda osservazione deve rilevare come per la maggior parte dei test di Fischer, l’essere finito in zona critica del valore atteso (cosa che pone il prevalere delle varianze spiegate sulle varianze residue) sia spesso limitato a poche componenti, tra le tante prese in considerazione. Una terza osservazione mette in luce comunque come il numero di test di Fischer il cui valore atteso è finito in zona critica è pari a 16, per la faccia A, e 19, per la faccia B, come riassunto nella tabella 7 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 151 Analisi Statistica del Disco di Festo Tabella casi significativi Lato A monodimensionale 3 bidimensionale 6 tridimensionale 1 quadri dimensionale 0 penta dimensionale 6 totale 16 Lato B 4 9 0 0 6 19 Tabella 7: Casi significativi nelle due facce del Disco. Pertanto essendo 64 il numero totale di casi analizzati, il rapporto 16/64 è 0,25 e quello 19/64 circa 0,30, cosa che prova come 1/4 dei test, per la faccia A, e circa 1/3 dei test, per la faccia B, abbia evidenziato sperimentalmente un certo legame tra le classi di simboli catalogate. Resta da osservare come il superamento dell’ipotesi nulla, per le quasi totalità dei test di Bartlett, permette l’adozione, senza riserve, del test di Fischer (senza richiedere l’impiego del test di Welch). Infine per quanto riguarda il test di Lawley volto a correlare a due a due le singole classi di simboli catalogate, si considera meglio costruito quello globale sulla totalità dei dati, caso per caso, rispetto a quelli singoli per dati partizionati. La ragione di questa affermazione sta nell’acclamata significatività di questo test per numerosità via, via crescenti e comunque significativamente grandi. Allora il test di Lawley sulla totalità dei dati fornisce valori attesi in zona critica per tutti i casi della faccia A (ad eccezione di uno) e per tutti i casi della faccia B (senza alcuna eccezione) relativamente all’analisi pentadimensionale. Il test di Lawley è forse meno significativo di quello di Fischer, ma una risposta così univoca è certamente una conferma di legami tra le varie classi di simboli catalogate. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 152 Analisi Statistica del Disco di Festo PIANI 2K seconda prova Osservando il Disco di Festo si è deciso di considerare la seguente suddivisione in classi: Classe A (1) - Simboli antropomorfi: 1, 2, 3, 4, 5, 6 Classe B (2) - Simboli zoomorfi: 28, 29, 30, 31, 32, 33, 34 Classe C (3) - Simboli fitomorfi: 35, 36, 37, 38, 39 Classe D (4) - Simboli raffiguranti armi: 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 Classe E (5) - Simboli raffiguranti utensili: 20, 21, 22, 23, 24, 25, 26, 27 Classe F (6) - Simboli vari: 7, 8, 9, 40, 41, 42, 43, 44, 45 Nelle due facce del disco si è poi proceduto ad individuare le classi d’appartenenza dei diversi simboli che compongono le parole per le due facce del disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 153 Analisi Statistica del Disco di Festo Nelle due tabelle 8 e 9, sottostanti, sono riportati i simboli e le classi che compongono le parole nelle due facce del disco. A31 A30 A29 A28 A27 A26 A25 A24 A23 A22 A21 A20 A19 A18 A17 A16 A15 A14 A13 A12 A11 A10 A9 A8 A7 A6 A5 A4 A3 A2 A1 A antropo morfi 2,1 2,4 B zoomorfi C fitomorfi 29 29,29,34 33 2 2 1 2 2 6 32 35 35 38 39 28 31 35,37 33 31 12,13,18 12 24 40 7,45 27 27 40 7,45 8,44 26 12,19 28 31 32 31 35 38 35,37 38 41 7,40,41 12 11 10,18 23 12 12 26 21,27,27 23 26 23,25,29 12 10,18 2,1 3 2 1 3 F vari 12,18 31 2 1 2 2 E utensili 12 12 2,6 2 1 2 D armi 12 12,14,18 17,18,19 12 12,13 19 10 12 13 10 23,25,27 26 27,27 26 23 21,27,27 5 3 3 3 5 4 3 4 3 5 4 5 2 6 2 4 7 2 4 6 2 4 7 4 3 4 3 3 7 2 3 AD DEF BF B ABDF DEF EF AD BCE ACDF AF ABCDE CD ADE AB ABDE ACDE BE ABDE ADE AB ABDE ABDE AD BDE AD CDE ACD ACDE AD ACD Tabella 8: Simboli e classi che compongono le parole della faccia A. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 154 Analisi Statistica del Disco di Festo B30 B29 B28 B27 B26 B25 B24 B23 B22 B21 B20 B19 B18 B17 B16 B15 B14 B13 B12 B11 B10 B9 B8 B7 B6 B5 B4 B3 B2 B1 A antropom orfi 2 B zoomorfi C fitomorfi E utensili F vari 12 22 27 23 22,25,27 20,24 23 7,40 7,45 35 37 2,5 33 1 1 D armi 33 39 29 37 35 36 38 35 2 1 12 16,18 13 13,15,18 22,25 24 26 25,27 20,24,24 43 7 42 7,40 40 14,16,18 1 6 2,1 29,33 32,33 35,39 27 29 29 29 29 34 36 13 36 35 22 23,25,27 18 18 29 30 2,6 36 39 35 23,24 22 18 29,34 23 23,25 9 7,8 8 7,45 7,8 7 7,7,45 7 7,8 7,9 7 7,45 5 4 4 3 4 4 4 5 4 4 4 4 5 3 3 5 4 4 3 3 5 4 3 3 4 5 5 5 4 2 ADEF CEF ACE E BDE DEF ABCD ADF CEF CEF ACEF ACE BCE D AB ABC AEF BCF BDF BF BCEF BE CDF F DEF BCEF BCDF ACEF BE F Tabella 9: Simboli e classi che compongono le parole della faccia B. Con specifico riferimento allo studio del disco e alla suddivisione in sei classi, l’analisi a seguire può essere condotta dal piano 21 = 2 fino al piano 26 = 64. La tabella 10 mostra l’elenco completo di tutte le combinazioni e le tabelle 11 e 12 dispongono i dati raccolti in accordo con le combinazioni possibili. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 155 Analisi Statistica del Disco di Festo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 abcdef Abcdef aBcdef abCdef abcDef abcdEf abcdeF ABcdef AbCdef AbcDef AbcdEf AbcdeF aBCdef aBcDef aBcdEf aBcdeF abCDef abCdEf abCdeF abcDEf abcDeF abcdEF 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 ABCdef ABcDef ABcdEf ABcdeF AbCDef AbCdEf AbCdeF AbcDEf AbcDeF AbcdEF aBCDef aBCdEf aBCdeF aBcDEf aBcDeF aBcdEF abCDEf abCDeF abCdEF abcDEF ABCDef ABCdEf 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 ABCdeF ABcdEF AbcDEF abCDEF ABcDeF AbCdEF aBcDEF ABcDEf AbCDeF aBCdEF AbCDEf aBCDeF aBCDEf aBCDEF AbCDEF ABcDEF ABCdEF ABCDeF ABCDEf ABCDEF Tabella 10: Elenco di tutte le combinazioni possibili. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 156 Analisi Statistica del Disco di Festo 1 abcdef 23 ABCdef 45 2 Abcdef 24 ABcDef 46 3 aBcdef 25 ABcdEf 47 4 abCdef 26 ABcdeF 48 5 abcDef 27 AbCDef 6 abcdEf 28 AbCdEf 50 7 abcdeF 29 AbCdeF 51 ABCde F ABcdE F AbcDE F abCDE F ABcDe F AbCdE F aBcDEF 8 ABcdef 30 AbcDEf 52 ABcDEf 4 9 AbCdef 31 AbcDeF 53 1 10 AbcDef 32 AbcdEF 54 11 AbcdEf 33 aBCDef 55 12 AbcdeF 34 aBCdEf 13 aBCdef 35 aBCdeF AbCDe F aBCdE F AbCDE f aBCDe F aBCDEf 14 aBcDef 36 aBcDEf 15 aBcdEf 1 37 aBcDeF 59 16 aBcdeF 1 38 aBcdEF 60 17 abCDef 1 39 abCDEf 18 abCdEf 40 abCDeF 62 19 abCdeF 41 abCdEF 63 20 abcDEf 42 abcDEF 21 abcDeF 43 22 abcdEF ABCDe f ABCdE f 1 2 5 1 1 44 2 2 1 49 56 57 1 1 2 58 61 64 aBCDE F AbCDE F ABcDE F ABCdE F ABCDe F ABCDE f ABCDE F 1 2 1 Tabella 11: Dati raccolti in accordo con le combinazioni possibili della faccia A. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 157 Analisi Statistica del Disco di Festo 1 abcdef 23 ABCdef 1 2 Abcdef 24 ABcDef 46 3 aBcdef 25 ABcdEf 47 4 abCdef 26 ABcdeF 48 5 abcDef 1 27 AbCDef 49 6 abcdEf 1 28 AbCdEf 7 abcdeF 2 29 AbCdeF 51 ABCde F ABcdE F AbcDE F abCDE F ABcDe F AbCdE F aBcDEF 8 ABcdef 1 30 AbcDEf 52 ABcDEf 9 AbCdef 31 AbcDeF 1 53 10 AbcDef 32 AbcdEF 1 54 11 AbcdEf 33 aBCDef 12 AbcdeF 34 aBCdEf 1 56 13 aBCdef 35 aBCdeF 1 57 AbCDe F aBCdE F AbCDE f aBCDe F aBCDEf 14 aBcDef 36 aBcDEf 1 58 15 aBcdEf 2 37 aBcDeF 1 59 16 aBcdeF 1 38 aBcdEF 60 17 abCDef 39 abCDEf 61 18 abCdEf 40 abCDeF 1 62 19 abCdeF 41 abCdEF 3 63 20 abcDEf 42 abcDEF 2 64 21 abcDeF 43 1 22 abcdEF 44 ABCDe f ABCdE f 2 45 50 55 1 2 2 1 aBCDE F AbCDE F ABcDE F ABCdE F ABCDe F ABCDE f ABCDE F Tabella 12: Dati raccolti in accordo con le combinazioni possibili della faccia B. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 158 Analisi Statistica del Disco di Festo Di conseguenza la tabella 13 riassume i soli casi non nulli e costituisce i dati d’ingresso per l’analisi dei piani 2K. aBcdef ABcdef AbcDef AbcdeF aBcdEf aBcdeF abCDef abcdEF AbCDef AbcDEf aBCdEf aBcDEf abCDEf abcDEF ABcDeF ABcDEf AbCDeF AbCDEf ABCDEf Dati 19 Lato A 121111 221111 211211 211112 121121 121112 112211 111122 212211 211221 122121 121221 112221 111222 221212 221221 212212 212221 222221 1 2 5 1 1 1 1 1 2 2 1 1 1 2 1 4 1 2 1 Connessioni 31 abcDef abcdEf abcdeF ABcdef aBcdEf aBcdeF ABCdef AbCdEf AbcDeF AbcdEF aBCdEf aBCdeF aBcDEf aBcDeF abCDeF abCdEF abcDEF ABCDef AbcDEF AbCdEF aBCdEF aBCDeF Dati 22 Lato B 111211 111121 111112 221111 121121 121112 222111 212121 211212 211122 122121 122112 121221 121212 112212 112122 111222 222211 211222 212122 122122 122212 1 1 2 1 2 1 1 2 1 1 1 1 1 1 1 3 2 1 1 2 2 1 Connessioni 30 Tabella 13: Casi non nulli nelle due faccie del Disco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 159 Analisi Statistica del Disco di Festo L’analisi monodimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle sei classi relativamente ad entrambe le facce del disco. Tabella analisi monodimensionali lato A gdl 5% 1° Fisher 14;24 1,45 1,42 Bartlett 31 43,80 0,00 2° 2,27 0,00 3° 0,71 0,00 4° 4,09 0,00 5° 1,26 0,00 6° 3,65 0,00 Visualizzazione grafica relativa all’analisi monodimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 160 Analisi Statistica del Disco di Festo Tabella analisi monodimensionali lato B gdl 5% 1A Fisher 14;24 1,45 2,57 Bartlett 31 43,80 0,00 2A 1,43 0,00 3A 1,65 0,00 4A 1,50 0,00 5A 5,17 0,00 6A 3,18 0,00 Visualizzazione grafica relativa all’analisi monodimensionale del lato B Tutte le analisi a seguire si muovono conformemente allo schema prefissato. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 161 Analisi Statistica del Disco di Festo L’analisi bidimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle quindici coppie di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi bidimensionale lato A gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 2A 1,82 0,00 2A 1A 0,97 0,00 0,00 0,00 5A 0,85 0,00 5A 1A 0,86 0,00 0,00 0,00 4A 0,65 0,00 4A 2A 0,70 0,00 0,00 0,00 4A 2,24 0,00 4A 3A 0,45 0,00 0,00 0,00 5A 0,57 0,00 5A 4A 1,23 0,00 0,00 0,00 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3A 0,45 0,00 3A 1A 1,13 0,00 0,00 0,00 6A 1,17 0,00 6A 1A 0,61 0,00 0,00 0,00 5A 0,43 0,00 5A 2A 0,96 0,00 0,00 0,00 5A 1,09 0,00 5A 3A 0,59 0,00 0,00 0,00 6A 1,03 0,00 6A 4A 1,23 0,00 0,00 0,00 4A 1,37 0,00 4A 1A 0,56 0,00 0,00 0,00 3A 0,30 0,00 3A 2A 1,34 0,00 0,00 0,00 6A 0,41 0,00 6A 2A 0,62 0,00 0,00 0,00 6A 1,65 0,00 6A 3A 0,32 0,00 0,00 0,00 6A 1,39 0,00 6A 5A 0,68 0,00 0,00 0,00 162 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa analisi bidimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 163 Analisi Statistica del Disco di Festo Tabella analisi bidimensionale lato B gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 gdl Fisher 15;45 Bartlett 15 30 Lawley 16 5% 1,45 25,00 43,80 26,30 2A 0,66 0,00 2A 1A 1,04 0,00 0,00 0,00 5A 1,22 0,00 5A 1A 0,65 0,00 0,00 0,00 4A 1,11 0,00 4A 2A 1,04 0,00 0,00 0,00 4A 0,32 0,00 4A 3A 0,42 0,00 0,00 0,00 5A 0,84 0,00 5A 4A 0,25 0,00 0,00 0,00 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3A 0,80 0,00 3A 1A 1,00 0,00 0,00 0,00 6A 0,52 0,00 6A 1A 0,37 0,00 0,00 0,00 5A 1,27 0,00 5A 2A 0,43 0,00 0,00 0,00 5A 1,14 0,00 5A 3A 0,52 0,00 0,00 0,00 6A 1,32 0,00 6A 4A 0,67 0,00 0,00 0,00 4A 0,86 0,00 4A 1A 1,33 0,00 0,00 0,00 3A 1,25 0,00 3A 2A 1,04 0,00 0,00 0,00 6A 1,32 0,00 6A 2A 0,64 0,00 0,00 0,00 6A 0,91 0,00 6A 3A 0,58 0,00 0,00 0,00 6A 0,64 0,00 6A 5A 0,92 0,00 0,00 0,00 164 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa analisi bidimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 165 Analisi Statistica del Disco di Festo L’analisi tridimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle venti triplette di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi tridimensionale lato A Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 1A 0,45 0,00 2A 5A 6,74 7,73 1A 0,44 0,00 3A 4A 1,99 7,26 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 4,68 1,19 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 3A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,84 0,00 1A 0,53 0,00 3A 6A 1,05 4,12 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 2A 1,03 0,00 0,00 3A 0,18 0,00 2A 4A 5,61 9,12 2A 0,48 0,00 0,00 5A 0,15 0,00 4A 0,87 0,00 3A 0,21 0,00 0,00 2,13 5,79 6A 0,77 0,00 4A 0,22 0,00 7,81 13,32 2A 0,48 0,00 0,00 6A 0,12 0,00 3A 0,15 0,00 0,00 5A 0,42 0,00 6,62 11,46 6,64 19,64 1A 0,33 0,00 4A 5A 2A 0,44 0,00 0,00 1,76 3,31 12,75 14,17 1A 0,38 0,00 1A 3A 5,19 11,47 2,93 6,03 1A 0,44 0,00 2A 6A 8,80 18,49 3A 0,26 0,00 0,00 1A 0,38 0,00 4A 0,41 0,00 0,00 5A 0,36 0,00 11,36 4,67 4,47 16,29 166 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 0,45 0,00 3A 6A 5,96 4,83 3A 0,37 0,00 4A 5A 6A 0,36 0,00 7,19 16,37 3A 0,12 0,00 0,00 3A 0,18 0,00 0,00 5,50 1,04 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,60 0,00 0,00 4A 0,35 0,00 5,19 9,32 7,34 5,94 2A 0,48 0,00 3A 5A 6A 0,23 0,00 9,46 7,48 2A 0,27 0,00 2A 4A 6A 0,38 0,00 5A 0,48 0,00 6A 0,34 0,00 7,21 16,28 3A 0,21 0,00 0,00 5A 0,34 0,00 2,35 15,33 4A 0,31 0,00 0,00 5A 0,19 0,00 5A 0,29 0,00 0,00 6A 0,33 0,00 3,69 11,67 1,36 13,28 3A 0,22 0,00 4A 6A 5A 0,28 0,00 0,00 11,88 7,29 4,62 18,90 2A 0,29 0,00 5A 6A 0,30 8,81 4A 0,77 0,00 0,00 1A 0,23 0,00 1A 5A 2,44 12,93 2,89 14,51 2A 0,32 0,00 4A 6A 4A 0,58 0,00 0,00 8,24 12,06 6,21 21,06 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 3A 4A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 8,09 5,31 2A 0,33 0,00 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 4A 6A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,20 0,00 1,98 4,83 4A 1,00 0,00 0,00 6A 0,56 0,00 7,23 11,15 167 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 3A 0,16 0,00 5A 6A 3,36 5,97 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,47 0,00 0,00 7,99 13,76 6A 0,55 0,00 4A 0,60 0,00 5A 6A 4,27 5,50 5A 0,31 0,00 0,00 6A 0,65 0,00 3,59 10,61 168 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 169 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 170 Analisi Statistica del Disco di Festo Tabella analisi tridimensionale lato B Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 5A 1A 0,83 0,00 3A 4A 5,23 1,67 36,40 1A 0,28 0,00 3A 6A 2A 0,34 0,00 0,00 3A 0,46 0,00 6,96 20,75 2A 0,19 0,00 0,00 3A 0,24 0,00 0,00 5A 0,49 0,00 2,35 10,62 4,57 13,94 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,23 0,00 6A 0,26 0,00 2A 0,19 0,00 0,00 6A 0,13 0,11 3A 0,19 0,00 0,00 5A 0,33 0,00 10,26 10,40 10,69 24,91 1A 0,49 0,00 4A 5A 4A 0,53 0,00 7,30 20,94 10,12 30,48 1A 0,23 0,00 3A 5A 2A 0,41 0,00 0,00 10,86 7,97 6,48 20,11 1A 0,03 0,20 2A 6A 6,16 10,38 3A 0,47 0,00 0,00 1A 0,52 0,00 2A 4A 4,30 10,20 10,12 19,57 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 9,49 9,67 1A 0,35 0,00 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 3A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,30 0,00 4A 0,17 0,00 0,00 5A 0,32 0,00 2,28 9,93 13,38 20,34 171 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley Fisher Bartlett Lawley 3A 6A 2A 0,37 0,00 4A 6A 6,48 8,71 3A 0,26 0,00 4A 5A 6A 0,31 0,00 3A 0,34 0,00 0,00 4A 0,24 0,00 4,36 2,26 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,37 0,00 0,00 6A 0,30 0,00 6A 0,56 0,00 4A 0,05 0,00 0,00 7,60 11,30 1,69 7,89 2A 0,19 0,00 5A 6A 5A 0,60 0,00 6A 0,18 0,00 9,66 19,29 3A 0,40 0,00 0,00 5A 0,33 0,00 4A 0,19 0,00 0,00 5A 0,27 0,00 9,40 15,08 5A 0,34 0,00 0,00 6A 0,33 0,00 10,56 6,68 10,37 21,94 3A 0,11 0,00 4A 6A 5A 0,47 0,00 0,00 2,32 11,45 6,55 16,15 2A 0,33 0,00 4A 5A 8,75 19,03 4,99 9,63 2A 0,30 0,00 3A 5A 8,49 8,60 3A 0,35 0,00 0,00 1A 0,17 0,00 5A 6A 6,34 11,46 9,92 22,02 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1,17 1,17 2A 0,37 0,00 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 2A 0,87 0,00 3A 4A 4A 0,47 0,00 0,00 2,85 12,03 4,47 15,38 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 4A 6A 36,40 gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 1A 0,25 0,00 7,86 4,95 4A 0,18 0,00 0,00 6A 0,64 0,00 2,96 12,53 172 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 7;49 2,10 7 14,10 21 32,70 8 15,50 24 3A 0,26 0,00 5A 6A 5,09 4,21 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,46 0,00 0,00 8,09 13,82 6A 0,35 0,00 4A 0,23 0,00 5A 6A 8,23 0,42 5A 0,35 0,00 0,00 6A 0,61 0,00 5,44 11,20 173 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 174 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 175 Analisi Statistica del Disco di Festo L’analisi quadridimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle quindici quartine di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi quadridimensionale lato A gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 0,13 0,00 4,77 11,86 8,08 10,16 6,76 36,40 1A 0,14 1,28 3A 4A 5A 3A 0,06 0,00 0,00 4A 0,07 0,98 3A 0,09 0,00 0,00 3A 0,13 0,00 4A 0,15 0,00 0,00 6A 0,05 0,89 7,90 16,04 13,21 2,20 6,61 6,24 46,82 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 6A 0,06 0,00 2A 5A 6A 5A 0,20 0,00 3A 4A 6A 2A 0,37 0,00 3A 0,07 0,00 0,00 5A 0,03 0,01 7,62 7,46 22,20 2,50 12,00 9,25 54,74 1A 0,20 0,00 2A 4A 5A 1,64 38,81 4A 0,34 0,00 0,00 1A 0,26 1,31 2A 3A 5A 3,38 2,27 6,07 5,28 25,79 4,45 42,36 1A 0,07 0,80 2A 4A 6A 2A 0,35 2,79 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 6A 2A 0,21 0,00 5,55 2,53 10,45 7,79 14,54 6,32 42,31 1A 0,39 0,00 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 4A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,31 0,00 2A 0,11 0,00 4A 0,10 0,00 0,00 5A 0,05 0,00 3,45 5,90 6,92 8,98 11,00 3,66 35,79 1A 0,21 0,00 2A 0,28 0,00 0,79 6,09 5,01 5,43 7,29 1A 0,13 2,87 3A 0,11 0,00 5A 0,10 0,00 0,00 6A 0,09 0,00 2,03 23,90 4A 0,46 1,44 0,00 6A 0,16 0,00 3,34 11,46 8,56 3,54 4,84 13,81 40,83 176 Analisi Statistica del Disco di Festo gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 6A 0,31 0,00 3A 0,11 0,00 4A 0,20 3,14 0,00 3A 0,06 0,00 5A 0,19 0,00 0,00 4A 0,48 2,80 5A 0,17 0,26 8,26 1A 0,02 0,10 4A 5A 6A 5A 0,18 0,00 6A 0,12 2,91 3A 0,01 0,09 5A 0,08 0,00 0,00 6A 0,08 0,00 7,74 45,07 4A 0,28 0,00 0,00 6A 0,17 0,00 15,92 19,35 10,77 14,62 7,34 3,79 64,38 2A 0,09 0,70 4A 5A 6A 4A 0,22 0,00 16,44 6,05 9,67 5,26 5,10 2A 0,10 0,25 3A 4A 6A 3,81 5,89 20,33 7,07 8,18 4,17 44,35 3A 0,07 1,58 4A 5A 6A 5A 0,17 1,11 0,00 10,55 16,71 15,40 5,34 0,20 5,98 48,59 2A 0,20 0,35 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 4A 5A 3A 0,13 0,00 1,74 18,41 4,46 5,59 1,02 15,00 41,45 2A 0,07 0,09 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,19 0,73 4A 0,24 0,00 15,85 11,19 7,88 9,36 1,49 5A 0,08 0,08 0,00 6A 0,27 0,00 4,06 44,68 6A 0,19 1,14 4,29 8,52 14,27 10,73 9,60 13,96 55,03 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 177 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 178 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 179 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 180 Analisi Statistica del Disco di Festo Tabella analisi quadridimensionale lato B gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 4A 6A 36,40 4A 0,10 1,04 2A 0,08 0,10 3A 0,32 0,00 0,00 2A 0,14 0,29 4A 0,36 0,00 0,00 3A 0,03 0,03 4A 0,01 0,10 0,00 15,45 4,47 17,85 7,52 10,93 16,75 65,44 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 1A 0,05 0,21 2A 3A 5A 6A 0,02 0,11 6A 0,04 0,11 5A 0,10 0,10 5A 0,10 0,14 2A 0,14 0,30 4A 0,12 0,60 2,06 5A 0,05 0,07 2A 0,05 0,09 5A 0,34 0,00 0,00 6A 0,03 0,08 7,15 0,18 18,13 3,76 7,89 3,70 36,61 1A 0,21 0,00 3A 4A 6A 3A 0,11 0,08 0,50 7,52 3,26 10,10 3,17 11,26 14,93 45,07 1A 0,02 0,18 2A 5A 6A 2A 0,11 0,04 8,40 18,41 9,90 5,51 10,61 12,28 58,39 1A 0,27 0,49 2A 4A 5A 8,63 0,47 20,24 3,41 10,15 3,74 41,82 1A 0,15 0,00 3A 4A 5A 3A 0,05 0,01 3,61 8,74 1,08 15,35 5,18 17,19 3,02 45,34 1A 0,02 0,17 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 6A 2A 0,21 0,81 23,54 13,03 7,11 9,15 7,07 11,07 63,65 1A 0,01 0,06 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 2A 3A 4A 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,19 1,27 3A 0,08 0,35 4A 0,11 0,62 0,00 6A 0,14 0,32 1,55 3,02 14,36 11,24 7,83 5,29 38,83 181 Analisi Statistica del Disco di Festo gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 4A 5A 3A 5A 6A 6A 0,12 0,65 8,18 42,61 4A 0,02 0,26 0,00 3A 0,11 0,13 5A 0,09 0,07 0,41 4A 0,01 0,07 11,66 3,72 8,27 7,46 2,33 36,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 5A 0,27 0,00 0,00 1A 0,06 0,59 4A 5A 6A 5A 0,14 0,89 6A 0,06 0,07 5A 0,14 1,69 4,08 6A 0,14 0,29 3A 0,04 0,03 4A 0,10 0,70 0,00 6A 0,19 1,48 5,22 4,84 18,28 10,44 12,09 7,65 52,48 2A 0,05 0,13 4A 5A 6A 4A 0,14 1,45 4,67 8,72 14,49 17,10 1,59 7,56 48,55 2A 0,28 0,00 3A 4A 6A 14,41 16,72 18,13 10,30 17,20 9,87 77,67 3A 0,03 0,02 4A 5A 6A 3A 0,20 0,84 5A 0,18 0,82 2,53 3,84 3,02 19,37 8,79 5,96 12,58 48,04 2A 0,05 0,10 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 6,96 8,53 9,53 12,17 2,14 2A 0,24 0,00 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 3A 5A 6A 3A 0,14 0,66 36,40 gdl 5% Fisher 3;45 2,70 Bartlett 3 7,81 12 21,00 Lawley 4 9,49 24 1A 0,05 0,35 4A 0,09 0,82 5A 0,02 0,05 3,57 6A 0,22 2,07 9,75 17,86 18,55 12,81 6,25 11,28 68,62 6A 0,28 0,00 6,81 36,09 182 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi tridimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 183 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 184 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 185 Analisi Statistica del Disco di Festo L’analisi penta dimensionale fornisce indicazioni sulle presenze/assenze di ciascuna delle sei cinquine di classi distinte relativamente ad entrambe le facce del disco. Tabella analisi penta dimensionale lato A Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 2A 3A 4A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,05 0,45 5A 0,01 0,00 3A 0,00 0,03 2,45 4A 0,03 0,55 6A 0,01 0,24 4,13 0,24 15,13 5,87 5,35 8,10 12,37 8,87 3,09 2,28 62,21 1A 2A 81,47 0,19 0,32 0,04 2A 3A 5A 6A 3A 0,03 0,86 2,64 1,95 7,74 9,37 4,52 4,28 12,24 5,86 17,12 4,08 1,44 65,22 1A 2A 71,72 0,03 0,71 0,05 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 3A 4A 5A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 73,76 0,02 0,20 0,10 3A 0,05 1,39 3,71 5A 0,03 0,01 6A 0,05 0,76 1,07 2,61 5,10 3,77 7,25 16,38 12,39 3,03 2,77 0,24 51,94 186 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 1,33 11,38 6,95 15,35 5,45 3,25 7,99 1A 3A 66,34 0,07 0,10 1,31 3A 4A 5A 6A 0,31 9,35 2,37 5,79 3,35 8,50 6,14 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 4A 5A 6A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 65,12 0,07 0,00 0,41 2A 3A 23,08 0,00 0,01 0,00 3A 4A 5A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 3,68 12,25 0,31 3,35 5,06 4,24 4,94 4A 0,05 1,75 5,11 5A 0,00 0,00 6A 0,03 1,39 2,27 2,13 4,58 57,69 4A 0,19 3,26 7,09 5A 0,03 0,01 6A 0,02 0,68 2,66 9,57 9,64 54,83 4A 0,17 1,84 5,82 5A 0,07 0,08 6A 0,09 1,63 8,44 1,45 3,90 45,28 187 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi penta dimensionale del lato A Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 188 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 189 Analisi Statistica del Disco di Festo Tabella analisi penta dimensionale lato B Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 4,97 12,44 0,12 1,21 4,63 0,70 8,00 1A 2A 15,00 0,07 0,00 0,03 2A 3A 4A 6A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 3A 4A 5A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 16,79 0,11 0,21 0,02 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,01 0,09 5A 0,00 0,01 4,29 2,10 5,95 42,21 3A 0,02 0,00 0,82 4A 0,09 0,50 6A 0,00 0,02 9,01 1,15 1,10 4,23 11,31 6,44 0,26 11,65 1,64 0,68 45,14 1A 2A 15,11 0,00 0,02 0,00 2A 3A 5A 6A 3A 0,00 0,00 0,57 3A 0,09 0,06 0,31 5A 0,09 0,06 6A 0,01 0,06 1,96 0,93 4,22 3,92 12,11 6,14 0,25 2,00 0,88 0,47 31,25 190 Analisi Statistica del Disco di Festo Fisher Bartlett Lawley gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 Fisher Bartlett Lawley Fisher Bartlett Lawley 1A 3A 16,69 0,00 0,35 0,00 3A 4A 5A 6A 1,42 0,43 6,01 9,81 3,74 5,61 7,83 2A 3A 24,93 0,02 0,10 0,00 3A 4A 5A 6A 31,40 Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 4A 0,09 0,73 1,25 5A 0,02 0,05 6A 0,00 0,02 2,40 0,18 6,63 2,58 14,82 6,84 0,05 10,78 1,40 1,69 45,03 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 2A 4A 5A 6A 31,40 gdl 5% 1;31 3,94 1 3,84 5 11,10 2 5,99 20 1A 2A 15,92 0,00 0,16 0,00 4A 0,00 0,02 1,14 5A 0,07 0,12 6A 0,11 0,39 1,69 0,50 1,75 36,89 4A 0,00 0,02 0,35 5A 0,00 0,00 6A 0,04 0,10 0,53 0,39 1,26 5,45 5,66 8,97 18,86 13,97 1,41 7,74 61,07 191 Analisi Statistica del Disco di Festo Visualizzazione grafica relativa all’analisi penta dimensionale del lato B Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 192 Analisi Statistica del Disco di Festo A conclusione dell’analisi dei piani 2k, alcune considerazioni statistiche possono essere evidenziate. Innanzitutto occorre rilevare che l’analisi, giocoforza qualitativa, non può pretendere spiegazioni troppo forti, anche per l’esiguità dei dati raccolti e sottoposti a test. Una seconda osservazione deve rilevare come per la maggior parte dei test di Fischer, l’essere finito in zona critica del valore atteso (cosa che pone il prevalere delle varianze spiegate sulle varianze residue) sia spesso limitato a poche componenti, tra le tante prese in considerazione. Una terza osservazione mette in luce comunque come il numero di test di Fischer il cui valore atteso è finito in zona critica è pari a 12, per la faccia A, e 11, per la faccia B, come riassunto nella tabella 14 Tabella casi significativi Lato A monodimensionale 3 bidimensionale 3 tridimensionale 0 quadri dimensionale 0 penta dimensionale 6 totale 12 Lato B 5 0 0 0 6 11 Tabella 14: Casi significativi nelle due facce del Disco Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 193 Analisi Statistica del Disco di Festo Pertanto essendo 64 il numero totale di casi analizzati, il rapporto 12/64 è 0,20 e quello 11/64 circa 0,17, cosa che prova come 1/5 dei test, per la faccia A, e circa 1/6 dei test, per la faccia B, abbia evidenziato sperimentalmente un certo legame tra le classi di simboli catalogate. Resta da osservare come il superamento dell’ipotesi nulla, per le quasi totalità dei test di Bartlett, permette l’adozione, senza riserve, del test di Fischer (senza richiedere l’impiego del test di Welch). Infine per quanto riguarda il test di Lawley volto a correlare a due a due le singole classi di simboli catalogate, si considera meglio costruito quello globale sulla totalità dei dati, caso per caso, rispetto a quelli singoli per dati partizionati. La ragione di questa affermazione sta nell’acclamata significatività di questo test per numerosità via, via crescenti e comunque significativamente grandi. Allora il test di Lawley sulla totalità dei dati fornisce valori attesi in zona critica per tutti i casi della faccia A (senza alcuna eccezione) e per tutti i casi della faccia B (ad eccezione di uno). Il test di Lawley è forse meno significativo di quello di Fischer, ma una risposta così univoca è certamente una conferma di legami tra le varie classi di simboli catalogate. Ulteriori considerazioni mettono in evidenza come altre ancora potrebbero essere le classi di simboli e, anche all’interno di una data classe di simboli, sia diverso analizzare un singolo dato, una coppia di dati, una loro tripletta, ecc. singolarmente, oppure inserita in una ennupla più grande (come mostrato dal singolo caso 22 isolato, presentato solo a mo’d’esempio, e l’insieme di tutti i casi 22, inseriti invece in una sestina). Infatti un diverso raggruppamento determina diverse statistiche condizionate e, di conseguenza, diversi indici doppi e diversi valori attesi dei test inferenziali. Tutto ciò serve ad evidenziare come l’analisi statistica condotta, per quanto abbastanza estesa, possa essere ripercorsa sotto differenti ipotesi e scelte alternative, perché la ricerca non ha mai fine. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 194 Analisi Statistica del Disco di Festo CONCLUSIONE I COMMENTI DI UN’ARCHEOLOGA, FILOLOGA E LINGUISTA La Dr. Adele Franceschetti dell’Dipartimento di Discipline Storiche “Ettore Lepore” dell’Università degli Studi di Napoli “Federico II”, interpellata sull’argomento, ha molto cortesemente fornito alcuni commenti a riguardo, qui riportati in sintesi. La studiosa, data qualche difficoltà, verso analisi statistiche e matematiche complesse e sofisticate, essendo studiosa di Filologia Micenea, non entra nel merito della qualità del lavoro che comunque sembra bene articolato in una logica di osservazioni e deduzioni, ma si permette di fare qualche osservazione che riguarda il lessico del disco. I 45 segni che compaiono sulle due facce sono unanimemente riconosciuti dagli studiosi di micenologia come sillabogrammi, ossia segni che notano fonemi, costituiti da una vocale o consonante + vocale, che nel loro insieme costituiscono un sillabario. Il termine “simbolo”, usato per analizzarli, cui forse dà un significato generico e di ampio respiro, appartiene nella terminologia della filologia antica esclusivamente alla sfera degli ideogrammi, ossia delle forme concettuali. Pertanto il Disco di Festo rappresenta un testo scritto, in una lingua finora sconosciuta, i cui 45 segni rientrano nello standard di un sistema scrittorio sillabico e non-alfabetico (in quanto troppi), né tanto meno ideografico (in quanto troppo pochi). Di conseguenza, denotando questa scrittura una lingua, la non casualità della disposizione dei segni potrebbe essere ricondotta alle strutture fonetiche di quella lingua. L’ipotesi di vedere descritte delle attività all’interno dei riquadri del disco sembra interessante, ma sempre nell’ottica di una descrizione da parte dell’ignoto scriba di segnalare, in una sorta di calendario, gli eventi dell’anno (forse). Pertanto non bisogna cedere alla suggestione di avvicinare la grafia di un segno alla realtà cui esso sembra automaticamente rimandare, perché nelle scritture antiche questo legame (che costituisce il punto di partenza della creazione dei segni di scrittura) va scomparendo, fino a perdersi in una stilizzazione sempre più corrente nella quale non è più rintracciabile il punto di partenza. In ogni caso, anche se questi segni sono ancora “trasparenti”, essi hanno già assunto la valenza non più di ideogrammi, ma di sillabogrammi per cui ciascuno di essi indica una sequenza fonica, svincolata dalla rappresentazione grafica. Comunque il disco rappresenta un enigma e il fatto che, in più di cento anni, si siano spesi fiumi di inchiostro, senza riuscire a leggerlo, ha dissuaso dall’approfondire ulteriormente questo argomento. Il Prof. Louis Godart si è occupato dell’argomento, anni fa, in un libro famoso. Il suo contenuto è molto chiaro e, dando indicazioni precise Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 195 Analisi Statistica del Disco di Festo sulle prospettive di lettura (non certamente di traduzione), può ben sintetizzare il parere del micenologo, da affiancare così a quello dello statistico. A valle di questo interessante commento, occorre subito precisare che l’interesse specifico di questo lavoro è superare gli ambiti ristretti della matematica applicata, ibridandola con i contributi ed i giudizi delle scienze umane. Di conseguenza, nessun problema a mettere in chiaro che simbolo è un termine generico, spesso usato nelle tecnologie dell'informazione, ma nello specifico riservato agli ideogrammi. In altre parole, nessun problema a definire sillabogrammi i segni finora chiamati simboli, riconoscendo le proprie limitate conoscenze nell'ambito della linguistica e della filologia. Dopodichè si concorda pienamente e, conformemente a quanto scritto anche dal Prof. Louis Godart, si è contrari a tentativi di traduzione, perché fare finta-scienza (diversa dalla fantascienza) è una pura sciocchezza. Rimangono le concordanze statistiche, ma si ribadisce che l'ipotesi calendario, con la lettura tematica della rappresentazione grafica, è solo un modo lessicale per svincolarsi dall'aridità numerica. Quello che conta sono i riscontri matematici che sono lasciati a linguisti e filologi per loro valutazioni, se da tutti questi numeri qualche passo in avanti può essere fatto. La stessa Dr. Adele Franceschetti, lette e valutate le brevi risposte, riscontra una comune intesa ed aggiunge qualche altro commento, perché pienamente convinta, che questo lavoro, rigoroso nella sua logica matematica, possa essere di supporto a chi voglia riprendere in mano questo oggetto, così affascinante, per il mistero che lo avvolge, ripartendo proprio da questi dati concreti. Inoltre un confronto con il passato fa tornare alla memoria il decifratore della scrittura Lineare B. Michael Ventris non è un “addetto ai lavori” (infatti non è né filologo, né linguista), ma un architetto che riusce a mettere a frutto le conoscenze acquisite dalla sua laurea unite a una dote naturale, caratterizzata da una non-comune memoria fotografica che gli permette di realizzare un metodo statistico-combinatorio, innovativo per l’epoca (1934 – 1952), sull’occorrenza di ogni segno all’interno di ciascuna parola, per potere verificare se un sillabogramma sia più frequente in posizione finale, centrale o iniziale. Questo è il punto di partenza cui seguono tanti altri ragionamenti, sempre logici e basati sull’osservazione visiva (che è lungo scrivere qui, per non raccontare tutta la storia della sua decodificazione), ma fondamentali al successo della sua impresa. A lui il merito di avere scoperto che la scrittura Lineare B nasconde un dialetto greco. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 196 Analisi Statistica del Disco di Festo Un doveroso ringraziamento deve far seguito a questa dotta digressione, ancora ben consci della limitatezza del disco e della sua non-traducibilità. Una comunicazione aggiuntiva, sempre Dr. Adele Franceschetti, dà informazioni sulle scritture cretesi la Lineare B, minecea, (composta di 86 sillabe di cui 71 decifrate) e la Lineare A, minoica, (composta da 87 sillabe di cui 78 graficamente uguali alla scrittura Lineare B e 9 diverse, completamente non decifrate). Entrambe le scritture, costituite da circa un'ottantina di segni standard, rientrano nei canoni dei sistemi sillabici. Il numero di dati raccolti è la situazione aggiornata ad oggi e modifiche sono possibili in seguito a scoperte di nuovi testi. Due tavolette cretesi dei periodi minoico (verso la metà del 2° millenio a.C.) e miceneo (verso la fine del 1° millennio a.C.), con iscrizioni in lingua Lineare A e Lineare B. La decifrazione della prima scrittura è ancora problematica, nonostante qualche probabile progresso recente (in quanto la lingua potrebbe anche essere non indo – europea, forse antico – fenicia od altro ancora), mentre la seconda scrittura è stata da tempo decifrata come una forma antica di greco. Sono forse queste tavolette iscritte, così come l’intraducibile Disco di Festo, esempi eloquenti della contiguità fra scritture, mappe e Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 197 Analisi Statistica del Disco di Festo immagini. Pertanto non stupisca questa apparente rincorsa all’infinito; del resto in greco, infinito deriva dall’antico semitico: polveroso (cioè praticamente non calcolabile). Un reperto archeologico, rinvenuto a Terrasini (PA), è una tavoletta di terracotta, trovata a circa cento metri dalla spiaggia tra Cinisi e Terrasini, ad una profondità di circa due metri, in una zona pertinente ad un antico ancoraggio. I segni di una scrittura, tuttora sconosciuta, procedono con andamento circolare dall'esterno verso l'interno, in senso antiorario (contrariamente al Disco di Festo le cui due spirali hanno verso orario), separati a gruppi da linee verticali, per staccare singoli termini del testo. Il reperto di Terrasini, consegnato nel 1974 al Museo di Palermo, risulta fotografato: arch. fotografico, negativo n. 22451. Numerose lineole verticali centrali possono forse essere riferite ad un Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 198 Analisi Statistica del Disco di Festo calcolo. Molti segni caratteristici sono simili a minuscoli oggetti simbolici, ma anche in questo caso non si è trovato alcun riscontro. Una delle ipotesi accreditate sull'origine riconduce le prime utilizzazioni della scrittura nel mondo egeo alle cretule impresse con simboli o nomi di consegnatari, di generi e quantità di prodotti forniti. Probabilmente queste cretule sono realizzate per render conto di derrate palaziali, consegnate o affidate ad esibitori di validi contrassegni od addirittura di modelli miniaturistici. Esse corrispondono, in numero e genere, ai prodotti forniti da chi li custodiva, per conto dell'autorità, in modo da trasmettere i simboli dell’autorità stessa, anche in sua absentia. Recentemente poi è stata rinvenuta in Sicilia, nel fossato neolitico di Stretto Partanna (TP), ovvero in un contesto archeologico assai antico, una cretula sigillo con segni di "cordami che dovevano legare un contenitore di ignote caratteristiche". A mo’ di commento conclusivo, si può rilevare come quasi tutti gli esempi più antichi presentino difficoltà di traduzione, innanzitutto per l’esigità del materiale raccolto. Questa osservazione porta a considerare la nascita della scrittura, non come un unico evento, magico o divino, ma come una prassi, quasi ordinaria, inventata autonomamente da singoli, per esigenze soprattutto commerciali e più raramente funerarie. Le scritture antiche (ma più tarde), oggi tradotte, sono un passo successivo, frutto di unificazioni, certamente più colte, ad opera di sacerdoti, re, poeti, ecc.. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 199 Analisi Statistica del Disco di Festo GIOCANDO CON LE PRIME OTTO TERZINE DELL’INFERNO E CON UNA PRIMA PAGINA DEL NEW YORK TIMES Come arcinoto, Dante Alighieri compone la Divina Commedia, suddivisa in tre cantiche (Inferno, Purgatorio e Paradiso), composta ciascuna di trentatre canti (tranne l'Inferno, che contiene un ulteriore canto proemiale). Proprio da questo canto proemiale sono estratte le prime otto terzine, per un totale di ventiquattro versi, di seguito riportati. Nel mezzo del cammin di nostra vita mi ritrovai per una selva oscura ché la diritta via era smarrita. Ahi quanto a dir qual era è cosa dura esta selva selvaggia e aspra e forte che nel pensier rinova la paura! Tant'è amara che poco è più morte; ma per trattar del ben ch'i' vi trovai, dirò de l'altre cose ch'i' v'ho scorte. Io non so ben ridir com'i' v'intrai, tant'era pien di sonno a quel punto che la verace via abbandonai. Ma poi ch'i' fui al piè d'un colle giunto, là dove terminava quella valle che m'avea di paura il cor compunto, guardai in alto, e vidi le sue spalle vestite già de' raggi del pianeta che mena dritto altrui per ogne calle. Allor fu la paura un poco queta che nel lago del cor m'era durata la notte ch'i' passai con tanta pieta. E come quei che con lena affannata uscito fuor del pelago a la riva si volge a l'acqua perigliosa e guata. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 200 Analisi Statistica del Disco di Festo Il totale di 289 sillabe pareggia il totale di 241 sillabogrammi del Disco di Festo. Tuttavia occorre subito rilevare come le sillabe distinte presenti siano ben 130, contro i soli 45 simboli del disco. Inoltre riordinando l’istogramma (a riguardo, si veda la figura sottostante) per frequenze decrescenti (come mostrato nella figura seguente), le prime diciannove sillabe hanno frequenza assoluta solo maggiore di quattro, mentre i primi diciannove simboli del disco hanno già una frequenza assoluta già maggiore di cinque. Tutto ciò mette in luce come, al crescere delle sillabe dantesche, si riduca la loro frequenza, mentre cresca la frequenza dei simboli del disco, al loro ridursi. Questa osservazione evidenzia una scarsa confrontabilità tra linguaggi evidentemente molto diversi: insiemi più grandi possono forse riprodurre frequenze simili, ma in questo caso è la numerosità a mettere in discussione la correttezza di un simile confronto. Istogramma delle frequenze assolute Istogramma riordinato delle frequenze assolute Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 201 Analisi Statistica del Disco di Festo In aggiunta, si vuole altresì ripetere il confronto con una pagina del New York Times, per rilevare differenze tra un italiano antico e un inglese contemporaneo. Suicide Car Bomber Convoy in Afghanistan Hits U.S. The Taliban on Tuesday took responsibility for the attack in Kabul, which killed at least five U.S. troops and 12 civilians and wounded at least 47. Primaries to Incumbents Test Voters’ Mood Toward Voters in Pennsylvania, Arkansas and Kentucky will vote on Tuesday in Senate primary contests that will offer clues for the rest of the midterm election season. Candidate’s Words on Vietnam Service Differ From History Richard Blumenthal, a Democrat of Connecticut who is running for the Senate, told veterans he “served in Vietnam.” But he did not. In Russia, Journalists Face Blatant Attacks Journalists, human rights activists and opposition leaders are being battered in a wave of unsolved attacks, an unnerving deterrent to those who question authority. Thai Government Rejects Cease-Fire Talks Officials on Tuesday said they would not negotiate until demonstrators leave the protest zone in the capital. Questa ricerca conferma numeri simili (addirittura un po’ più grandi, nello specifico), perché a fronte di un totale di 250 sillabe, si trovano ben 173 sillabe distinte. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 202 Analisi Statistica del Disco di Festo 10 8 6 4 2 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121 126 131 136 141 146 151 156 161 166 171 0 Istogramma delle frequenze assolute NYT 10 8 6 4 2 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121 126 131 136 141 146 151 156 161 166 171 0 Istogramma riordinato delle frequenze assolute NYT E’ altresì noto, dalla teoria dei modelli, che già solo i fattori di scala costituiscono problemi non indifferenti, perché a fronte di variazioni lineari nelle lunghezze, si hanno variazioni quadratiche nelle aree e variazioni cubiche nei volumi. Cosa poi fare per il tempo è certamente un problema aperto e di difficile soluzione. Allora costruire un modello confrontabile con variabili qualsiasi, in questo caso specifico, neppure fisiche, ma linguistiche e riferite ad un’epoca antichissima, è forse un problema mal-posto di cui è conseguentemente dubbia qualsiasi soluzione, tentata o proposta. Allora restano, ancora e solo, le concordanze statistiche ed i riscontri matematici che sono lasciati a linguisti e filologi per loro valutazioni, se da questi numeri qualche passo in avanti può essere fatto. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 203 Analisi Statistica del Disco di Festo Appendice Relazione da: Douglas C. Montgomery Controllo statistico della qualità Ed. McGraw-Hill Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 204 Analisi Statistica del Disco di Festo Controllo statistico della qualità 1 – Il miglioramento della qualità nel moderno ambiente produttivo Questa relazione si riferisce all’impiego di metodi statistici per la soluzione di problemi finalizzati al miglioramento della qualità dei processi, dei prodotti industriali o dei servizi. 1.1 Significato dei termini “qualità” e “miglioramento della qualità” Il termine “qualità” può essere definito in relazione a una o più caratteristiche che il prodotto o servizio deve possedere. Essa costituisce uno dei fattori più rilevanti nel processo di decisione del consumatore; di conseguenza comprendere e migliorare la qualità è un fattore decisivo per raggiungere il successo nell’impresa produttiva, per la crescita e il miglioramento della propria posizione nel mercato. 1.1.1 Le componenti della qualità La qualità di un prodotto può essere valutata secondo diversi aspetti. - Prestazione: - Affidabilità: - Durata: - Manutenibilità: - Aspetti formali: - Funzionalità: - Livello di qualità percepito: - Conformità alle normative: La definizione tradizionale del termine qualità si basa sul presupposto che beni e servizi devono soddisfare le richieste di coloro che li utilizzano. Qualità significa essere appropriato all’uso Ci sono due aspetti generali dell’essere appropriato per l’uso: - la qualità di progetto, tutti i beni e servizi sono prodotti con vari gradi o livelli di qualità - la conformità alle normative, relativa a quanto il prodotto risulta conforme alle specifiche che sono richieste dal progetto. Questa definizione è stata associata più agli aspetti della conformità alle normative che a quelli della qualità di progetto si preferisce, quindi, una più recente definizione del termine qualità: La qualità è inversamente proporzionale rispetto alla variabilità. Ciò implica che se diminuisce la variabilità nelle caratteristiche di un prodotto, aumenta la qualità del prodotto stesso. Minori riparazioni e minori reclami significano una minore Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 205 Analisi Statistica del Disco di Festo rilavorazione e una riduzione di spreco di tempo, di sforzo e di denaro. Pertanto la qualità è davvero inversamente proporzionale alla variabilità e i suoi effetti possono essere comunicati usando un linguaggio che ognuno può comprendere, cioè in termini di denaro. Questo conduce alla seguente definizione di miglioramento della qualità. Il miglioramento della qualità è la riduzione della variabilità nel processo produttivo o nel prodotto. La variabilità eccessiva nella prestazione del processo spesso conduce a una perdita; si consideri per esempio la perdita di denaro, di tempo e lo sforzo che sono associati alle riparazioni. Pertanto, una definizione alternativa è quella che definisce il miglioramento della qualità come la riduzione della perdita. 1.1.2 Terminologia tecnica nell’ingegneria della qualità Ogni prodotto possiede un numero di elementi che congiuntamente descrivono ciò che l’utilizzatore o il consumatore ritengono sia la qualità dell’oggetto. Tali elementi sono spesso definiti caratteristiche di qualità e possono essere di diversi tipi. - Fisiche: lunghezza, peso, viscosità, tensione elettrica. - Sensoriali: sapore, aspetto, colore. - Comportamento nel tempo: affidabilità, durata, manutenzione. Le tecniche della qualità sono un insieme di attività, operative, gestionali e tecnologiche, che un’azienda utilizza per assicurarsi che le caratteristiche di qualità di un prodotto siano quelle di livello nominale o richiesto. Molte organizzazioni trovano difficile fornire agli acquirenti prodotti che abbiano caratteristiche di qualità che siano sempre uguali in ciascun elemento prodotto, o che siano al massimo livello dell’aspettativa dell’acquirente. La causa principale di ciò è la variabilità, dalla cui presenza consegue che non ci sono mai due prodotti identici. Le origini di questa variabilità comprendono differenze nei materiali, diversità nelle prestazioni e nell’operatività degli strumenti di produzione e differenze nelle modalità con cui gli operatori compiono il loro lavoro. Poiché la variabilità può essere descritta solamente in termini statistici, i metodi statistici hanno un ruolo centrale negli sforzi per il miglioramento della qualità. Nell’applicazione dei metodi statistici all’ingegneria della qualità è abituale classificare i dati delle caratteristiche di qualità in: - attributi di solito di tipo discreto , spesso espressi in termini di conteggio variabili che producono in genere misure di tipo continuo, quali la lunghezza, tensione elettrica, viscosità. Le caratteristiche della qualità sono spesso valutate in relazione alle specifiche. Per un prodotto manufatto, le specifiche sono le misure stabilite per alcune caratteristiche tangibili dei componenti o sottocomponenti che costituiscono il prodotto, come pure i valori desiderati per le caratteristiche di qualità del prodotto finale. Nelle società di servizi, le specifiche sono espresse tipicamente in termini di ammontare massimo di tempo necessario per evadere un ordine o per fornire un particolare servizio. Il valore di misura che corrisponde al valore desiderato per una caratteristica di qualità è definito il valore nominale o per quella caratteristica. Questi valori nominali possono anche Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 206 Analisi Statistica del Disco di Festo costituire un intervallo di valori che, tipicamente, si ritiene sufficientemente prossimi al valore teorico di riferimento, da non incidere sulla funzione o sulla prestazione del prodotto se la caratteristica di qualità rientra in tale ambito. Il maggior valore ammissibile (accettabile) per una caratteristica di qualità è definito limite di specifica superiore, Upper Specification Limit (USL) e il valore minore accettabile per una caratteristica di qualità è definito limite di specifica inferiore, Lower Specification Limit (LSL). Alcune caratteristiche di qualità hanno limiti di specifica solo unilaterali. Le specifiche e i limiti di specifica sono solitamente stabiliti dai progettisti durante la progettazione tecnica del prodotto e forniti ai reparti di produzione. Ci si può riferire a tutto ciò come a un approccio alla progettazione di genere non convenzionale (over the wall). I problemi relativi alla qualità di un prodotto sono di solito maggiori quando viene usato tale tipo di approccio, nel quale le specifiche sono spesso stabilite senza considerare la variabilità dei materiali, dei processi e delle altre parti del sistema. Questo si evidenzia in componenti o prodotti che sono non conformi, cioè che non riescono a raggiungere una o più specifiche. Uno specifico tipo di difetto è definito non conformità. Un prodotto non conforme non è necessariamente inadatto allo scopo mentre è considerato difettoso se ha uno o più difetti, costituiti da non conformità abbastanza gravi, tali da impedire in modo significativo l’utilizzazione del prodotto. La progettazione di sistemi di lavorazione e di assemblaggio si è rilevata importante nel superamento dei problemi connessi all’approccio “over the wall” e molti tecnici ricevono oggi una formazione in queste aree come parte integrante della loro preparazione professionale. La recente enfasi sulla tecnica convergente ha indotto a un approccio di team con specialisti in processi produttivi, tecnici della qualità ed esperti in diverse discipline che operano insieme con il progettista fin dalle prime fasi della procedura progettuale al fine del miglioramento della qualità. 1.2 Metodi statistici per il miglioramento della qualità Tre sono gli aspetti fondamentali per il miglioramento della qualità: - il controllo statistico di un processo produttivo, - la programmazione degli esperimenti, - il campionamento in accettazione. La carta di controllo è una delle principali tecniche adottate per il controllo statistico di un processo o più brevemente, SPC (Specific Process Control). La carta di controllo ha una linea centrale (CL) e limiti di controllo superiore (UCL) e inferiore (LCL). La linea centrale indica il punto dove dovrebbe posizionarsi la caratteristica del processo se non fossero presenti fonti di variabilità anomale, mentre i limiti di controllo sono stati individuati sulla base delle semplici considerazioni statistiche sviluppate successivamente. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 207 Analisi Statistica del Disco di Festo tipica carta di controllo UCL 2,0000 CL LCL 1,0000 -1,0000 media campionaria -2,0000 0,5000 -0,5000 1,0000 0,3000 0,0451 -2,0000 La carta di controllo è un’utile tecnica per il monitoraggio del processo e un valido strumento per ridurre la variabilità del processo. Infatti, quando sono presenti fonti di variabilità anomale, può accadere di osservare alcuni punti al di fuori dei limiti di controllo: questa è un’indicazione della necessità di effettuare indagini per rimuovere e correggere gli eventuali errori intervenuti. Un esperimento programmato è invece estremamente utile per scoprire quali sono state le variabili che hanno maggiormente influenzato la realizzazione del livello qualitativo osservato e per sapere in che misura è influenzato dalle variazioni di livello dei fattori studiati. Tale strumento è quindi essenziale per ridurre la variabilità nel livello della qualità del prodotto e nel determinare i livelli che devono assumere le variabili controllabili per avere una resa ottimale. Il tipo più diffuso di esperimento programmato è quello fattoriale in cui i livelli dei fattori vengono fatti variare in modo da esaminare l’effetto di tutte le possibili combinazioni dei livelli testati. Fondamentalmente gli esperimenti programmati sono uno strumento per il controllo della qualità di tipo off-line, perché vengono impiegati nello sviluppo e nella progettazione dell’attività produttiva prima che il processo inizi la sua normale evoluzione, avendo come obiettivo l’individuazione dei trattamenti che garantiscono la minore variabilità possibile. Una volta che sono state individuate le relazioni funzionali tra le variabili che regolano la produzione possono essere utilizzate con grande efficacia le tecniche di monitoraggio e di sorveglianza della produzione. Per esempio, le carte di controllo possono fornire un’indicazione di quando un processo ha subito variazioni e quindi la necessità di riportare la produzione sotto controllo. Se gli interventi correttivi vengono impiegati in modo continuativo si parla di controllo ingegneristico, controllo automatico o controllo feedback. Il campionamento in accettazione è definibile come l’ispezionamento e la classificazione di un campione di unità, selezionate a caso da un lotto, per la valutazione della qualità del lotto stesso. Le diverse tipologie di campionamento in accettazione sono: - l’operazione d’ispezione in uscita che viene realizzata immediatamente dopo la produzione e prima della consegna al cliente, Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 208 Analisi Statistica del Disco di Festo - l’operazione d’ispezione in entrata che viene realizzata quando il controllo dei pezzi è effettuato immediatamente prima della loro acquisizione, l’operazione d’ispezione di rettifica dove i campioni esaminati possono portare all’accettazione o al rifiuto del lotto e in quest’ultimo caso i pezzi esaminati possono essere rilavorati o scartati. 1.3 Aspetti gestionali di miglioramento della qualità Le tecniche statistiche, che includono SPC e programmazione degli esperimenti, sono, con altri strumenti di risoluzione di problemi, le basi tecniche per il controllo e il miglioramento della qualità. La gestione effettiva della qualità comprende la corretta esecuzione delle seguenti attività: - Pianificazione della qualità è un’attività strategica, ed è altrettanto vitale per la positiva evoluzione di un lungo termine di un’organizzazione quanto il piano per lo sviluppo del prodotto, il piano finanziario, il piano di marketing e i piani per l’utilizzazione delle risorse umane. - Assicurazione della qualità costituisce l’insieme delle attività che garantiscono che la qualità dei prodotti e dei servizi siano mantenuti ad un livello adeguato e che le questioni inerenti la qualità dei fornitori e dei clienti siano risolte opportunamente. - Miglioramento della qualità comprende l’insieme delle attività destinate ad assicurare che i prodotti e i servizi soddisfino le richieste degli utilizzatori e siano migliorati in modo continuo. Poiché la variabilità è la causa principale di cattiva qualità, le tecniche statistiche, incluse SPC e programmazione degli esperimenti, sono i migliori strumenti di controllo e di miglioramento. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 209 Analisi Statistica del Disco di Festo Parte I Metodi statistici utili nel miglioramento della qualità Il termine statistica indica un insieme organico di tecniche impiegabili per prendere decisioni riguardanti un processo o una popolazione basandosi sulle informazioni contenute in un campione prodotto da tale processo o rilevato su tale popolazione. Perciò i metodi statistici hanno un ruolo importante nel miglioramento della qualità, sono i principali strumenti con cui un bene o un servizio prodotto viene analizzato, verificato o valutato in modo da impiegare le informazioni così disponibili al fine di controllare e migliorare il processo di produzione. Inoltre il metodo statistico è il linguaggio mediante il quale comunicano tra loro gli addetti allo sviluppo, alla produzione, alla gestione e altri settori dell’impresa. 2 – Modelli della qualità del processo Gli obiettivi di questo capitolo sono: - - Definire quali strumenti di statistica descrittiva si possono impiegare per valutare quantitativamente le variazioni che una caratteristica o indicatore di qualità presenta tra i valori considerati in un campione. Introdurre le distribuzioni di probabilità e spiegare come esse siano in grado di fornire uno strumento per la realizzazione del modello o la descrizione delle caratteristiche di qualità di un processo produttivo. 2.1 La descrizione della variabilità 2.1.1 I grafici “rami e foglie” Due unità di un bene prodotto da un processo produttivo non sono mai identiche, qualche variazione è inevitabile e in questa prospettiva si può considerare la statistica come la scienza che dall’analisi dei dati trae delle conclusioni prendendo in considerazione la presenza della variabilità dei dati stessi. Ci sono diversi metodi grafici utili per sintetizzare e presentare i dati osservati che possono considerarsi un’indagine preliminare. Una di queste tecniche è costituita dai grafici “rami e foglie” (steam-and-leaf plot). Supponiamo che i dati vengono indicati con x1, x2,…,xn e che ciascun numero xi sia composto da almeno due cifre. Per ottenere un grafico “rami e foglie”, si suddividano le cifre del numero xi in due parti: l’una costituita da una o più cifre iniziali, il “ramo”; l’altra costituita dalle rimanenti cifre, le “foglie”. Per esempio possiamo scindere un valore generico 76 nella cifre 7 inteso come “ramo” e 6 come “foglia”. In generale,i valori “rami” saranno relativamente pochi rispetto al numero delle osservazioni. Di solito è meglio scegliere il numero di “rami” tra 5 e 20. Definito l’insieme dei “rami”, essi vengono elencati al margine sinistro ponendo a fianco tutte le “foglie”, corrispondenti ai valori osservati, nell’ordine in cui sono riscontrate nell’insieme dei dati. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 210 Analisi Statistica del Disco di Festo La versione del grafico foglie e rami prodotta da Minitab è talvolta chiamata grafico rami-foglie ordinato, poiché le foglie sono disposte per grandezza. Ciò rende facile trovare i percentili dei dati. Generalmente il 100k-esimo percentile è un valore tale che almeno 100k% dei dati sono minori o uguali di questo valore e almeno 100(1 – k)% dei dati sono maggiori di questo valore. Il 50-esimo percentile della distribuzione dei dati osservati è detto mediana campionaria x (x0.5 o x50%). La mediana può interpretarsi come quel valore che separa il campione in due metà di cui una è costituita dai valori inferiori e l’altra da quelli superiori a esso. Se n è il numero delle osservazioni ed è dispari trovare la mediana è facile: una volta posti i valori delle osservazioni in ordine crescente si ottengono così i “ranghi”dei dati dal valore più piccolo a quello più grande. Quindi la mediana sarà l’osservazione in posizione di rango [(n – 1)/2 + 1]. Il decimo percentile è l’osservazione di rango0.1x40+0.5=4.5 (cioè il valore intermedio tra la quarta e la quinta osservazione ordinata. Il primo quartile, in analogia con quanto detto sulla mediana, è l’osservazione di rango 0.25x40+0.5=10.5 (valore intermedio tra la decima e l’undicesima osservazione) Il terzo quartile, sempre in riferimento al concetto di mediana, è l’osservazione di rango 0.75x40+0.5=30.5(valore intermedio tra la trentesima e la trentunesima osservazione). Avendo indicato con Q1 e Q3 rispettivamente il primo e il terzo quartile, la differenza Q3-Q1è impiegata occasionalmente come misura di variabilità e viene definita differenza interquartile. Infine, benché la rappresentazione mediante il grafico “rami e foglie” sia un’ottima modalità per visualizzare la variabilità dei dati, essa non tiene conto dell’ordine temporale con cui vengono effettuate le osservazioni. Spesso però il tempo è un fattore importante che contribuisce alla variabilità, in particolare nei problemi che riguardano il miglioramento della qualità. E’ possibile rappresentare semplicemente i valori dei dati rispetto al tempo; tale grafico è chiamato grafico della serie temporale o carta a scorrimento temporale. 2.1.2 L’istogramma Un istogramma è una sintesi compatta dei dati simile al grafico rami e foglie che divide il campo di variazione dei dati in intervalli, che sono solitamente chiamati intervalli di classe. Un istogramma che usi un numero eccessivo di classi , come pure troppo limitato, risulterà poco informativo. Solitamente si usano tra 5 e 20 classi e tale numero dovrebbe aumentare all’aumentare di n (numero delle osservazioni). L’istogramma può essere abbastanza sensibile al numero e all’ampiezza delle classi e, nel caso di dati poco numerosi, esso può addirittura cambiare radicalmente aspetto. Perciò l’istogramma è una tecnica adatta soprattutto per insiemi numerosi di dati. Si noti che nel passare dai dati originari o dal grafico rami e foglie a un istogramma si perdono alcune informazioni perché i valori puntuali delle osservazioni originarie non sono presenti nel grafico. Tuttavia questa perdita di informazioni è solitamente piccola se confrontata con la capacità di sintesi e la facilità di interpretazione dell’istogramma. Grafici simili agli istogrammi possono essere usati con alcuni tipi di dati qualitativi oppure dati di conteggio (discreti). Per costruire un grafico per dati discreti, prima si determina la frequenza (o la frequenza relativa) di ogni valore di x. Ognuno dei valori di x corrisponde a Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 211 Analisi Statistica del Disco di Festo una classe. L’istogramma è tracciato rappresentando graficamente le frequenze (o le frequenze relative) sull’asse delle ordinate e i valori della x sull’asse delle ascisse e sopra ogni valore di x, si traccia un rettangolo la cui altezza è la frequenza (o la frequenza relativa) corrispondente a quel valore. 2.1.3 Sintesi numerica dei dati Date le osservazioni di un campione x1, x2,…,xn; la più importante misura della tendenza centrale in un campione è la media campionaria si noti che è semplicemente la media aritmetica delle n osservazioni. La media campionaria rappresenta il punto baricentrico della massa delle osservazioni campionarie. La variabilità presente nel campione è misurata dalla varianza campionaria. La varianza è semplicemente la somma dei quadrati degli scarti di ogni osservazione dalla media campionaria divisa per la numerosità campionaria meno uno. Se non c’è variabilità nel campione, per ogni osservazione si ha = ; allora la varianza campionaria vale . In generale quanto più grande è la varianza campionaria tanto maggiore risulta la variabilità presente nelle osservazioni campionarie. Di solito si preferisce impiegare la radice quadrata di standard campionaria S: , che viene detta deviazione La deviazione standard non è influenzata dall’entità del valore centrale dei dati campionari, ma riflette solo la diversità o dispersione di questi dalla media. 2.1.4 Rappresentazione dei dati mediante “box plot” Il “box plot” è una rappresentazione grafica che presenta diversi importanti indicatori dei dati osservati, quali tendenza centrale o locazione, dispersione o variabilità, allontanamento Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 212 Analisi Statistica del Disco di Festo dalla simmetria distributiva e identificazione di quelle osservazioni anomale che sono distanti dal nucleo centrale dei dati (outliers). Il grafico box plot presenta i tre quartili, il valore minimo e il massimo in una scatola rettangolare che può disporsi sia orizzontalmente che verticalmente; l’ampiezza del rettangolo rappresenta la differenza interquartile con il primo quartile Q1 a sinistra (o in basso) e il terzo quartile Q3 all’estremo a destra (o in alto). La linea intermedia corrisponde al secondo quartile (che indica il valore 50% o mediano) Q2. Due segmenti esterni al rettangolo si estendono fino ai valori estremi, minimo a sinistra (in basso) massimo a destra (in alto) e sono detti whisker (baffi). In alcuni software i “baffi” sono estesi ad a un valore pari a 1.5 (Q3 – Q1) oltre gli estremi del rettangolo e le osservazioni che non cadono entro questi limiti sono assunte come outliers. Questo modo di procedere è chiamato box plot modificato. L’impiego dei grafici box plot è utile per immediati confronti tra i dati disponibili poiché essi sono di facile comprensione. 2.1.5 Distribuzioni di probabilità Un campione è un insieme di elementi scelti da una popolazione più ampia e una distribuzione di probabilità è un modello matematico che collega il valore della variabile alla probabilità che tale valore si trovi all’interno della popolazione. - Distribuzioni continue. Quando la variabile da misurarsi viene espressa mediante una scala continua, la sua distribuzione di probabilità viene definita una distribuzione continua. Si presenta come una curva regolare, avente l’area sottostante la curva uguale alla probabilità, in modo tale che la probabilità che x sia compreso nell’intervallo da a a b è = - Distribuzioni discrete. Quando il parametro da misurarsi può assumere solo determinati valori,quali gli interi 0, 1, 2,…, la distribuzione di probabilità viene definita una distribuzione discreta. Si presenta come una serie di segmenti di altezza proporzionale alla probabilità, in modo tale che la probabilità che una variabile casuale x assuma uno specifico valore xi è ) Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 213 Analisi Statistica del Disco di Festo La media μ di una distribuzione di probabilità è una misura della tendenza centrale della variabile casuale , o la sua posizione. La media è definita come: La media è il punto in cui la distribuzione è esattamente “bilanciata” e rappresenta il baricentro della distribuzione di probabilità. Si noti che la media non è necessariamente il 50-esimo percentile della distribuzione (la mediana) e che essa non è necessariamente il valore più probabile della variabile (che è chiamato moda). La media determina semplicemente la posizione delle distribuzioni. La variabilità di una distribuzione è espressa dalla varianza σ2. La definizione di varianza è: nella popolazione vi sono N elementi, la varianza è Pertanto, la varianza è la media del quadrato della distanza di ciascun elemento della popolazione della media. Si noti la somiglianza con la varianza campionaria S 2 perciò è usuale operare con la radice quadrata della varianza definita variazione standard σ. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 214 Analisi Statistica del Disco di Festo 2.2 Le principali distribuzioni discrete Alcune distribuzioni discrete compaiono frequentemente nel controllo statistico della qualità. In questo paragrafo vengono prese in considerazione le principali e vengono elencate tramite la propria formula e la rispettiva media e varianza. 2.2.1 La distribuzione ipergeometrica La distribuzione ipergeometrica è x = 0, 1, 2, …,min(n ,D) La media e la varianza della distribuzione ipergeometrica sono e 2.2.2 La distribuzione binomiale La distribuzione binomiale con parametri e è x = 0, 1, 2, …,n Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 215 Analisi Statistica del Disco di Festo La media e la varianza della distribuzione binomiale sono e 2.2.3 La distribuzione di Poisson La distribuzione di Poisson è x = 0, 1, … dove il parametro λ vale : Poisson sono La media e la varianza della distribuzione di e 2.2.4 La distribuzione di Pascal La distribuzione di Pascal è x = r, r +1, r +2… dove è un numero intero. La media e la varianza della distribuzione di Pascal sono Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 216 Analisi Statistica del Disco di Festo e 2.3 Le principali distribuzioni continue 2.3.1 La distribuzione normale La distribuzione normale è probabilmente quella di maggiore importanza sia sotto il profilo teorico sia per le applicazioni statistiche. Se x è una variabile casuale normale, allora la distribuzione di x si definisce nel modo seguente. La distribuzione normale è La media della distribuzione normale è e la varianza è . La distribuzione normale è così frequentemente utilizzata che si usa una speciale notazione, per indicare che x è normalmente distribuita con media μ e varianza L’andamento della rappresentazione della distribuzione normale è quello di una curva simmetrica, unimodale a campana. C’è una semplice interpretazione della deviazione standard σ di una distribuzione normale, che è rappresentata nel Si osservi che il 68.26% dei valori della popolazione è contenuto nei limiti definiti dalla media meno o più una deviazione standard ; il 95.46% dei valori della popolazione cade all’interno dei limiti definiti dalla media meno o più 2 deviazioni standard ; il 99.73% dei valori della popolazione è all’interno dei limiti definiti dalla media meno o più 3 deviazioni standard . Pertanto la deviazione standard misura la distanza sulla scala orizzontale associata ai limiti di contenimento del 68.26%, del 95.46% e del 99.73%. E’ pratica comune arrotondare queste percentuali a 68%, 95% e 99%. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 217 Analisi Statistica del Disco di Festo Il Teorema del Limite Centrale. La distribuzione normale è spesso impiegata come modello di probabilità idoneo per una generica variabile casuale. Più avanti verrà analizzato il modo in cui può essere dimostrata la validità di questa assunzione; comunque, una giustificazione di normalità sia pure approssimata è basata sul seguente teorema. Se sono variabili casuali indipendenti con media , allora la distribuzione e varianza , e se tende alla distribuzione N(0,1) per n tendente all’infinito. Il teorema del limite centrale implica che la somma di n variabili casuali indipendentemente distribuite sia approssimativamente normale, senza riferimento alle distribuzioni delle singole variabili. L’approssimazione è migliore al crescere di n. In molti casi l’approssimazione sarà già buona per valori piccoli di n, mentre in taluni casi si necessita di valori molto elevati di n per ottenere un’approssimazione soddisfacente. In generale, se gli xi sono identicamente distribuiti e la distribuzione di ciascun xi non si discosta radicalmente da quella normale, il teorema del limita centrale è soddisfatto per n = 3 o 4. 2.3.2 La distribuzione lognormale Se ω segue una distribuzione normale con media θ e varianza variabile casuale lognormale, la cui distribuzione è , allora è una La media e la varianza di x sono: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 218 Analisi Statistica del Disco di Festo 2.3.3 La distribuzione esponenziale La distribuzione esponenziale è dove λ è una costante. La media e la varianza della distribuzione esponenziale sono: 2.3.4 La distribuzione gamma La distribuzione gamma2 è con parametro di forma distribuzione gamma sono: e parametro di scala Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture . La media e la varianza della 219 Analisi Statistica del Disco di Festo 2.3.5 La distribuzione di Weibull La distribuzione di Weibull è dove è il parametro di scala e della distribuzione di Weibull sono: è il parametro di forma. La media e la varianza 2.4 Grafici di probabilità 2.4.1 Grafici di probabilità normali Come verifichiamo se una particolare distribuzione di probabilità è un modello ragionevole per i dati? La rappresentazione detta grafico di probabilità è un metodo euristico per determinare se i dati campionari sono conformi a una distribuzione ipotizzata a seguito di un esame visivo e soggettivo dei dati. La procedura generale è molto semplice e può essere eseguita velocemente. La rappresentazione usa una speciale rappresentazione grafica, nota come carta di probabilità, che viene realizzata per la specifica distribuzione ipotizzata. Le più comuni applicazioni si riferiscono alle distribuzioni normale, lognormale, Weibull e gamma. In questo paragrafo tratteremo il grafico della distribuzione normale. Per costruire il grafico di probabilità occorre dapprima ordinare le osservazioni disponibili, dalla più piccola alla più grande. Cioè il campione x1, x2,…xn è riordinato nel vettore x(1), x(2),….x(n), dove x(1) rappresenta la più piccola osservazione, x(2) la seconda, e così via, fino a x(n), la più grande. Il grafico di probabilità viene realizzato rappresentando le coppie costituite da ciascuna osservazione ordinata x(j) e dalla corrispondente frequenza cumulata (j-0.5)/n in un opportuno schema nel quale la graduazione della scala delle ordinate è scelta in funzione della distribuzione ipotizzata. Se la distribuzione ipotizzata descrive adeguatamente i dati, i punti disegnati cadranno approssimativamente lungo una linea retta; se i punti disegnati deviano significativamente e sistematicamente da una linea retta, il modello ipotizzato non è appropriato. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 220 Analisi Statistica del Disco di Festo I grafici di probabilità sono estremamente utili e sono spesso la prima tecnica esplorativa usata per la scelta della distribuzione di probabilità più adatta a descrivere i dati. Nell’usare i grafici di probabilità, la decisione è presa solitamente attraverso una valutazione soggettiva del grafico di probabilità. Insieme ai grafici di probabilità, si possono usare anche test statistici più formali, circa la bontà d’adattamento. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 221 Analisi Statistica del Disco di Festo 3 – Inferenze riguardanti la qualità dei processi produttivi Nel capitolo precedente si è considerato l’impiego delle leggi di distribuzione per modellare o descrivere le manifestazioni di un processo. In tutti gli esempi si è assunto che i parametri delle distribuzioni e quindi i parametri del processo siano noti. Tale assunzione è generalmente non realistica. Infatti, se si considera, per esempio, l’impiego della distribuzione binomiale per rappresentare il numero di unità non conformi trovate in un campione ottenuto da un processo produttivo, si assumerà che il parametro p della distribuzione binomiale sia noto. Tale parametro p è da interpretarsi concretamente come la vera frazione di unità non conformi presenti nel processo, che risulta impossibile conoscere con esattezza relativamente a un processo produttivo effettivo. Inoltre se il vero valore p è noto e costante nel tempo, l’attività di monitoraggio e le procedure di controllo sarebbero inutili. Si può considerare quindi che i parametri del processo produttivo sono generalmente ignoti e che possono variare nel tempo, rendendo quindi necessaria l’introduzione di una procedura per stimare i parametri delle distribuzioni di probabilità coinvolte e risolvere ogni altro problema di inferenza o di decisione che li riguarda. Si dimostrano così utili i metodi statistici e le tecniche di stima e di verifica delle ipotesi. Tali tecniche vengono a costituire il substrato necessario per molte metodologie impiegate nel controllo statistico della qualità. In questo capitolo sono presentati i metodi statistici di base dell’inferenza precisandone l’utilità nell’ambito dei problemi che sorgono nell’azione di miglioramento della qualità. Gli strumenti chiave comprendono le stime puntuali e intervallari di medie e di varianze delle distribuzioni di probabilità, dei parametri delle leggi binomiali, le verifiche di ipotesi riguardanti le stesse grandezze e inoltre l’impiego delle carte di probabilità normali. 3.1 Statistiche e distribuzioni campionarie Lo scopo dell’inferenza statistica è quello di trarre delle conclusioni o assumere delle decisioni riguardanti una popolazione sulla basa di un campione estratto dalla popolazione stessa. Spesso si utilizza in queste analisi “campioni casuali”, dove la parola casualità è sovente riferita a un metodo o selezione campionaria che evita criteri sistematici. Definiamo un campione casuale di numerosità n, che indichiamo con (x1,…..xn) quello ottenuto in modo tale che le osservazioni sono selezionate in modo indipendente l’una dalle altre. Una tale definizione è impiegabile per campioni estratti da popolazioni costituite da infinite unità oppure da popolazioni finite dove il campionamento è effettuato “con rimessa o reintroduzione”. Nel campionamento senza “reintroduzione” da una popolazione finita costituita da N unità, diciamo che il campione di n unità è un campione casuale se ciascuno dei possibili campioni ha un’eguale probabilità di estrazione. Molti dei metodi utilizzati assumono che il campionamento sia casuale, benché ci siano altre strategie di campionamento impiegate utilmente nell’ambito del controllo di qualità. Attenzione particolare deve essere rivolta ai metodi di analisi, in modo che siano congrui con il piano di campionamento; infatti, le procedure inferenziali valide Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 222 Analisi Statistica del Disco di Festo per campioni casuali possono comportare errori rilevanti quando siano applicate in presenza di tecniche di campionamento differenti. La statistica inferenziale impiega grandezze calcolate sulle osservazioni del campione. Viene definita come statistica ogni funzione dei dati campionari che non coinvolgano parametri ignoti. Per esempio se x1,…..xn rappresentano le osservazioni di un campione, allora la media campionaria la varianza campionaria e la deviazione standard campionaria sono statistiche. Le statistiche e (o centrale e della variabilità del campione. ) sono rispettivamente misure della tendenza Se conosciamo la legge di distribuzione della popolazione della quale è estratto il campione, possiamo determinare la legge di distribuzione delle diverse statistiche ottenute sui dati campionari. La legge di distribuzione di una statistica è detta distribuzione campionaria. 3.2 Stima puntuale dei parametri del processo Una variabile casuale è caratterizzata dalla legge di distribuzione di probabilità. Tale legge di distribuzione è identificata dai parametri. Per esempio la media e la varianza sono i parametri della distribuzione normale. Nell’ambito del controllo statistico della qualità, la funzione di distribuzione è impiegata per descrivere o rappresentare mediante un modello qualche caratteristica della qualità, come una grandezza o una dimensione critica del prodotto o la frazione di unità difettose nel processo di fabbricazione. Ne consegue che si è interessati a effettuare inferenza relativamente ai parametri delle distribuzioni di probabilità di tali grandezze. Siccome in generale tali parametri non sono noti, si richiedono procedure per stimarli sulla base dei dati campionari. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 223 Analisi Statistica del Disco di Festo 3.3 Inferenza statistica per un singolo campione Le tecniche di inferenza statistica possono essere stimate in due grandi categorie: stima parametrica e test d’ipotesi. Abbiamo già introdotto l’idea di stima puntuale dei parametri di un processo. Un’ipotesi statistica è un’affermazione circa i valori dei parametri di una distribuzione di probabilità. Per esempio, supponiamo di pensare che la media del diametro interno di certi cuscinetti sia 1.5 pollici. Possiamo esprimere questa dichiarazione in modo formale come La proposizione è detta ipotesi nulla e la proposizione è detta ipotesi alternativa; in tale esempio specifica i valori della media dei diametri maggiori o minori del valore 1.5 ed è per questo indicata come ipotesi alternativa bilaterale. In relazione al problema specifico si possono considerare differenti ipotesi alternative unilaterali. Le procedure di verifica dell’ipotesi risulta nodi rilevante utilità in molti problemi di controllo statistico della qualità. Esse costituiscono, inoltre, la base di differenti tecniche e procedure impiegate nell’ambito dello studio statistico del controllo di processo. 3.3.1 L’impiego del P-value nelle verifiche d’ipotesi Il modo consueto per presentare i risultati di una verifica d’ipotesi è quello di indicare che l’ipotesi nulla sia o non sia rifiutata rispetto a un preassegnato valore α che è detto livello di significatività. Queste conclusioni risultano spesso inadeguate poiché non danno nessun idea del valore ottenuto della statistica del test non esprimendo se essa sia di poco entro la regione di rifiuto oppure se si trovi di gran lunga all’interno della regione stessa. Inoltre questa modalità impone un livello di significatività α predefinito anche per altri utilizzatori delle informazioni. Questo approccio può essere insoddisfacente per il responsabile delle decisioni, che può trovare complesso confrontare il risultato con i rischi che implica il valore di α. Per superare tali difficoltà è stato adottato ampiamente nella pratica l’approccio del P-value. Con il termine P-value (o valore P), si intende la probabilità che la statistica test assuma un valore che è almeno come estremo uguale a quello osservato quando l’ipotesi nulla H0 è vera. Quindi il P-value contiene molte informazioni relative all’evidenza di non validità di H0, così il responsabile delle decisioni può trarre una conclusione per ogni specifico livello di significatività. Possiamo ora dare una definizione formale del Pvalue. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 224 Analisi Statistica del Disco di Festo Il P-value è il più piccolo livello di significatività che conduce al rifiuto dell’ipotesi nulla H0. E’ abitudine chiamare una statistica test significativa quando l’ipotesi nulla è rifiutata, quindi il P-value è il più piccolo livello α per il quale i dati osservati sono significativi. Disponendo del P-value il responsabile delle decisioni può stabilire da solo quanto siano significativi i dati osservati senza che chi è predisposto all’analisi dei dati debba imporre un livello di significatività a priori. Per la verifica d’ipotesi sopra considerata è relativamente semplice calcolare il P-value. Se Z0è il valore della statistica test calcolato sui dati osservati, allora il P-value è Essendo la funzione di distribuzione cumulata della variabile casuale normale standardizzata. Non è sempre facile ottenere un esatto P-value per ogni procedura di verifica, comunque molti programmi per computer dedicati all’analisi statistica presentano il Pvalue; questi ultimi possono essere ottenuti anche con alcuni calcolatori tascabili. E’ possibile inoltre impiegare tabelle statistiche che approssimano i P-value per alcuni casi specifici. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 225 Analisi Statistica del Disco di Festo Parte II Il controllo statistico di processo E’ difficile ispezionare o verificare la qualità di un prodotto: meglio è avere un prodotto che sia qualitativamente accettabile già in fase di produzione. Questo richiede che il processo produttivo sia stabile e che le persone impiegate nella produzione siano continuamente impegnate anche nel miglioramento del processo produttivo e nella riduzione della variabilità dei fattori coinvolti nella produzione. L’SPC (Statistical Process Control) è lo strumento primario per conseguire tale risultato e le carte di controllo sono lo strumento più semplice per definire una procedura di controllo statistico di processo. In questa sezione vengono evidenziati i tre fondamentali scopi delle carte di controllo: 4 Riduzione della variabilità del processo Monitoraggio e controllo del processo Stima dei parametri del prodotto e del processo – Teoria e metodi del controllo statistico di un processo produttivo Questo capitolo ha tre obiettivi: - - Presentare gli strumenti statistici di base del controllo statistico di un processo produttivo (SPC, Statistical Process Control),noti anche col nome di “magnifici sette”. Descrivere le basi statistiche delle carte di controllo di Shewhart. Discutere e illustrare alcuni problemi pratici che si incontrano nell’applicazione dell’SPC. 4.1 Introduzione L’SPC può essere applicato a qualsiasi processo. I sette più importanti strumenti statistici di cui si avvale sono: 1234567- Istogrammi e grafici “rami e foglie” Fogli di controllo Grafici di Pareto Diagrammi causa ed effetto Diagrammi sulla concentrazione dei difetti Grafici a dispersione Carte di controllo 4.2 Fonti di variabilità nella qualità Ogni processo produttivo è sempre soggetto ad una certa variabilità intrinseca o naturale. Questa variabilità naturale o rumore di fondo è il risultato dell’effetto cumulato di molti Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 226 Analisi Statistica del Disco di Festo piccoli ma ineliminabili fattori costanti o casuali. Un processo la cui variabilità sia provocata solo da fattori casuali verrà detto sotto controllo mentre le fonti di variabilità che non sono riconducibili a fattori casuali vengono chiamate “fattori specifici” e un processo che stia funzionando in presenza di fattori specifici verrà detto fuori controllo. In genere i processi produttivi operano in situazione di controllo , producendo pezzi di qualità accettabile per lunghi periodi di tempo. Possono tuttavia verificarsi fattori specifici, apparentemente casuali, tali da comportare la produzione di grandi quantità di pezzi non conformi agli standard qualitativi. Quando il processo è sotto controllo, la maggior parte dei valori della grandezza oggetto di controllo cade tra i limiti di specifica superiore e inferiore (indicati con USL Upper Specifc Limit e LSL Lower Specific Limit); invece, quando il processo è fuori controllo un elevato numero di determinazioni campionarie cade al di fuori di queste specifiche. L’obiettivo primario del controllo statistico di un processo è di individuare il più velocemente possibile il verificarsi di fattori specifici: quanto più veloce è l’individuazione delle cause, tanto prima potranno essere avviate azioni di correzione , così da evitare la produzione di molti pezzi di qualità non accettabile. Le carte di controllo sono uno strumento ampiamente usato per questi scopi e per determinare la capacità del processo stesso. Per ultimo si ricordi che lo scopo del controllo statistico di un processo è di eliminare la variabilità all’interno del processo stesso: per quanto non sia possibile eliminarla completamente, le carte di controllo costituiscono un efficace strumento per ridurla il più possibile. 4.3 Fondamenti statistici delle carte di controllo 4.3.1 Introduzione Una tipica carta di controllo è quella riportata in figura, che descrive una certa qualità di un prodotto misurata in diversi istanti temporali. La carta riporta una linea centrale che rappresenta il valore medio della qualità, in genere corrispondente al valore desiderato quando il processo è sotto controllo. Le altre due linee orizzontali vengono chiamate limite di controllo superiore (UCL, Upper Control Limit) e limite di controllo inferiore (LCL, Lowre Control Limit). Questi limiti di controllo vengono scelti in modo tale che, se il processo è sotto controllo, quasi tutti i valori campionari cadranno al loro interno e nessun intervento correttivo sul processo sarà necessario. Se invece un punto cade al di fuori di tali limiti, questo dovrà essere interpretato come un’evidenza del fatto che il processo è fuori controllo e quindi si renderanno necessarie azioni correttive o di indagine sul processo per individuare ed eliminare le cause che hanno portato all’insorgere di quei fattori specifici. Si è soliti unire i punti campionari consecutivi con dei tratti continui, così da rendere più facile la visualizzazione dell’evoluzione del processo nel tempo. C’è uno stretto legame tra carte di controllo e test d’ipotesi; si supponga che l’asse verticale dell’immagine sia la media campionaria . Se il valore osservato di cade tra i limiti di controllo, concluderemo che la media del processo è sotto controllo, cioè pari a un valore μ0. D’altra parte, se supera uno dei limiti di controllo, concluderemo che la media del processo è fuori controllo, ovvero è pari a un valore Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 227 Analisi Statistica del Disco di Festo Possiamo supporre uno schema generico di carta di controllo. Sia ω una statistica campionaria che misura una certa caratteristica di un prodotto e si supponga che la media di ω sia e la deviazione standard sia . Allora l’UCL, la linea centrale CL e LCL saranno: dove L è la “distanza” dei limiti di controllo della linea centrale, espressa in unità di deviazione standard. Le carte di controllo costruite secondo questi criteri vengono chiamate carte di controllo di Shewhard. La carta di controllo è uno strumento per descrivere in maniera sistematica ciò che viene chiamato controllo statistico e di conseguenza può essere usata per il controllo di sorveglianza on-line: i dati campionari vengono raccolti periodicamente e rappresentati nella carta di controllo; se il valore di cade tra i limiti di controllo e se nel tempo non evidenzia andamenti non casuali diremo che il processo è sotto controllo. L’uso più importante è tuttavia quello di contribuire al miglioramento del processo. Le carte di controllo possono essere usate in due modi, a seconda della caratteristica della variabile oggetto di studio. Se la caratteristica di un prodotto è rappresentabile su una scala continua di valori, viene detta variabile ed è possibile descriverla come una misura di centralità e una di variabilità: le carte di controllo per la centralità e la variabilità di un processo vengono chiamate carte di controllo per variabili. E’ pur vero che molte caratteristiche dei prodotti non possono essere misurate né su scala continua né su scale genericamente quantitative. In questi casi ciascuna unità prodotta viene valutata conforme a seconda che possieda o meno certi attributi o a seconda del numero dei difetti presenti nell’unità prodotta. Le carte di controllo costruite sulla base di queste grandezze vengono chiamate carte di controllo per attributi. 4.3.2 Scelta dei limiti di controllo La definizione dei limiti di controllo è uno dei passaggi più critici nella progettazione di una carta di controllo. Più sono collocati lontano dalla linea centrale minore sarà il rischio che un punto si posizioni al di fuori dei limiti indicando una situazione di fuori controllo quando invece nessun fattore si è manifestato (rischio tipo I). D’altro canto ampliare i limiti di controllo comporta il rischio che un punto cada all’interno dei limiti di controllo quando di fatto il processo non è sotto controllo (rischio tipo II). Se i limiti vengono invece avvicinati alla linea di controllo si avrà l’effetto opposto: il rischio di tipo I aumenta mentre quello di tipo II diminuirà. Per la carta in figura, se si ipotizza che il diametro della fascia elastica del pistone abbia distribuzione normale e che i limiti controllo siano a 3-sigma, utilizzando la tavola della variabile casuale normale standardizzata si trova che l’errore di tipo I è 0.0027, ovvero un Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 228 Analisi Statistica del Disco di Festo errato segnale di fuori controllo o falso allarme verrà osservato in probabilità 27 volte ogni 10000 campioni. Inoltre la probabilità che un punto superi uno dei limiti posti a 3sigma quando il processo è sotto controllo è solamente 0.00135. Questi limiti di controllo vengono chiamati limiti con probabilità 0.001. La scelta dei limiti a 3-sigma da in genere buoni risultati nelle applicazioni. Limiti di sorveglianza delle carte di controllo. Alcuni analisti suggeriscono di utilizzare sulla stessa carta di controllo due differenti limiti come quelli evidenziati nell’immagine I limiti esterni, supponiamo posizionati a 3-sigma, sono gli usuali limiti operativi: quando un punto cade al di fuori di questi deve esser intrapresa una ricerca delle cause e devono essere predisposti eventuali interventi correttivi. I limiti interni, solitamente posizionati a 2-sigma, vengono chiamati limiti di sorveglianza superiore (UWL, Upper Warning Limits) e inferiore (LWL, Lower Warning Limits). Se uno o più punti cadono tra i limiti di controllo e limiti di sorveglianza o anche solo in prossimità dei limiti di sorveglianza, si deve ritenere che il processo non stia funzionando correttamente. Per essere più certi di tale congettura e senza dover intraprendere azini correttive sul processo, si è soliti aumentare la frequenza di campionamento e/o la dimensione del campione così che molte più informazioni vengano analizzate nell’intorno temporale dell’istante in cui il problema può essersi manifestato. Questi interventi vengono chiamati schemi adattivi o schemi di campionamento con dimensione campionaria variabile. 4.3.3 Dimensione del campione e frequenza di campionamento Nel progettare una carta di controllo bisogna specificare la dimensione del campione da analizzare e la frequenza di campionamento. In genere, quanto più grande è il campione tanto più facile sarà individuare piccoli spostamenti o regolazioni del processo. Questo lo si nota in figura Dove viene rappresentata la curva operativa caratteristica per diverse dimensioni campionarie della carta rappresentata precedentemente. Per scegliere la dimensione campionaria ottimale bisogna quindi avere presente qual è lo scostamento del processo che si vuole individuare più velocemente. Dobbiamo inoltre determinare la frequenza di campionamento. La situazione ottimale sarebbe quella di poter esaminare grandi campioni di frequente, ma questa è una situazione sicuramente poco accettabile dal punto di vista economico. Si tratta di un problema di allocazione degli sforzi di campionamento: o si esaminano piccoli campioni di frequente o si esaminano grandi campioni a intervalli più distanziati. Due strumenti utili per calcolare la dimensione campionaria e la frequenza di campionamento ottimali sono la lunghezza media delle frequenze (ARL, Average Run Lenght) e il tempo medio al segnale (ATS, Average Time to Signal). L’ARL è il numero medio di punti che devono essere osservati prima che un punto cada al di fuori dei limiti di controllo. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 229 Analisi Statistica del Disco di Festo dove p è la probabilità che un punto superi i limiti di controllo. Il tempo medio al segnale ATS è invece il prodotto dell’ARL per l’intervallo medio di tempo intercorrente tra due campioni, e indica il tempo medio intercorrente tra due segnali di fuori controllo. Se i campioni vengono esaminati a intervalli di tempo costante, allora 4.3.4 Sottogruppi razionali Con sottogruppi razionali si intendono quei campioni scelti in modo che se sono presenti fattori specifici, la probabilità di osservare differenze tra i campioni sia massimizzata mentre la probabilità di osservare differenze tra le unità che compongono il campione a causa di fattori specifici sia minimizzata. Due sono gli approcci per la costruzione di sottogruppi razionali. Il primo suggerisce di costruire i campioni in modo che contengano unità che siano state prodotte nello stesso istante temporale. Questo approccio dovrebbe essere seguito quando lo scopo è di usare la carta di controllo per individuare scostamenti sistematici della produzione, perché minimizza la probabilità di avere una variabilità attribuibile a fattori specifici all’interno del campione mentre massimizza la probabilità di avere un’elevata variabilità tra i campioni se sono presenti scostamenti sistematici del parametro oggetto di controllo. Fornisce inoltre una migliore stima della deviazione standard del processo se la carta di controllo è per variabili. Il secondo approccio consiste nella costruzione di campioni che siano rappresentativi della produzione intercorsa dall’ultimo controllo effettuato. Sostanzialmente ciascun sottogruppo è un campione casuale della produzione ottenuta nell’intervallo di campionamento. Questo approccio viene usato quando si ipotizza che il processo possa uscire di controllo nell’intervallo di tempo intercorso dall’ultimo campione esaminato. 4.3.5 Analisi degli andamenti tipici di una carta di controllo Una carta di controllo può indicare una situazione di fuori controllo sia quando uno o più punti cadono oltre i limiti di controllo sia quando l’andamento descritto dai punti, pur interni ai limiti, non è casuale: la non casualità dei punti è sintomo di un processo che produce pezzi le cui misure di qualità possono essere descritte da un modello e quindi tali da essere prevedibili. Un processo per essere definito sotto controllo deve invece,in genere, avere la proprietà di produrre pezzi con caratteristiche aventi distribuzione casuale secondo un modello probabilistico definito. Una successione di punti avente un andamento crescente o decrescente viene chiamata sequenza così come viene chiamata sequenza di lunghezza 2 una successione di punti che stanno uno al di sopra e uno al di sotto della linea centrale. Sequenze di lunghezza maggiore Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 230 Analisi Statistica del Disco di Festo di 7 hanno la probabilità di verificarsi, in genere, molto bassa e quindi, essendo di tipo non casuale, sono spesso un segnale di fuori controllo. L’abilità nell’individuazione di un comportamento anomalo e la sua attribuzione a fattori specifici richiede esperienza e una profonda conoscenza del processo produttivo. Alcune regole decisionali per l’individuazione di comportamenti anomali, in particolare stabiliscono che un processo è da considerarsi fuori controllo se: - un punto cade al di fuori dei limiti di 3-sigma due punti su tre consecutivi cadono oltre i limiti di sorveglianza posizionati a 2-sigma - quattro punti su cinque consecutivi cadono oltre la distanza di 1-sigma dalla linea centrale; oppure - otto punti consecutivi cadono tutti dalla stessa parte della linea centrale da notare che queste regole si applicano a una sola parte della carta di controllo. Perciò se un punto cade oltre l’UWL e il successivo cade sotto l’LWL questo non indica una situazione di fuori controllo. 4.3.6 Commento alle regole di sensibilità per le carte di controllo Esistono diversi criteri per stabilire se un processo è fuori controllo. Il criterio di base è che uno o più punti cadano al di fuori dei limiti di controllo, ma in genere, vengono usati criteri aggiuntivi per aumentare la sensibilità di una carta nel rilevare regolazioni del processo anche piccole e se solamente uno di questi criteri viene soddisfatto , dovremo considerare il processo fuori controllo. Segnale intervento standard di 1. Uno o più punti cadono al di fuori dei limiti di controllo. 2. Due punti consecutivi su tre cadono oltre i limiti di sorveglianza posizionati a 2-sigma ma rimangono dentro i limiti a 3-sigma. 3. Quattro punti su cinque consecutivi cadono oltre la distanza di 1sigma dalla linea centrale. 4. Otto punti consecutivi cadono dalla stessa parte della linea centrale. 5. Sei punti consecutivi sono in ordine crescente o decrescente. 6. 15 punti consecutivi sono in yna definita zona (sia sotto che sopra la linea centrale). 7. 14 punti consecutivi si alternano a zig-zag. 8. Otto punti consecutivi si alternano intorno alla linea centrale ma nessuno è nella zona definita 9. Si manifesta un comportamento non casuale dei dati. 10. Uno o più punti si posizionano vicino ai limiti di sorveglianza e di controllo. Le regole riassunte nella tabella devono essere usate con una certa cautela se non si vuole andare incontro a un numero eccessivo di falsi allarmi. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 231 Analisi Statistica del Disco di Festo 4.3.7 Fase I e Fase II dell’applicazione delle carte di controllo Nella fase I si esegue un’analisi preliminare del processo: si raccoglie e si analizza un insieme retrospettivo di dati del processo, al fine di determinare se rappresentano una situazione in stato di controllo e costruire quindi i limiti di controllo attendibili per monitorare correttamente la produzione futura. Le carte di controllo sono utilizzate quindi in fase I per isolare sequenze di dati del processo in stato di controllo statistico. Nella fase II usiamo le carte di controllo per monitorare il processo confrontando la statistica campionaria per ogni campione estratto dal processo, con i limiti di controllo stabiliti in fase I. Nella fase I vengono stabiliti dei limiti preliminari basandosi sugli m sottogruppi e su tutti i dati rappresentati sulle carte di controllo. I punti che sono al di fuori dei limiti di controllo sono esclusi e si calcolano i nuovi limiti di controllo, successivamente vengono esaminati altri dati e comparati con questi limiti aggiornati. Talvolta questa fase dell’analisi deve essere ripetuta parecchie volte, fino a ottenere una serie di dati del processo stabilizzato, che può ritenersi cioè rappresentare l’andamento di un processo in controllo. Generalmente la carte di controllo di Sheward sono molto efficienti in fase I e sono facili da costruire e interpretare. Sono efficienti nell’individuare la presenza sia di forti scostamenti di livello dei parametri del processo che di outliers (singole escursioni che possono derivare da cause assegnabili di breve durata, errori di misurazione e/o registrazione dei dati e così via). Nella fase II usualmente si assume che il processo sia in condizioni di stabilità. Spesso le cause assegnabili che si verificano in fase II sono costituite da limitati spostamenti di livello poiché la maggior parte delle fonti di variabilità veramente dannose dovrebbero essere state individuate durante la fase I e le loro cause rimosse anche per il futuro. La nostra enfasi è quindi, in tale fase, posta sul monitoraggio del processo e non sul suo riassetto verso lo stato di controllo. 4.4 Altri strumenti dei “magnifici sette” Sebbene la carta di controllo sia un potente strumento per il controllo e il miglioramento della qualità, risulta di fatto più efficace se viene usata in un contesto dove si ha un’ampia integrazione degli strumenti di SPC: questi dovrebbero essere usati diffusamente e quotidianamente a ogni livello d’impresa. I “magnifici sette” già introdotti nel paragrafo 4.1 sono: 1- Istogrammi e grafici “rami e foglie” 2- Fogli di controllo 3- Grafici di Pareto 4- Diagrammi causa ed effetto 5- Diagrammi sulla concentrazione dei difetti 6- Grafici a dispersione 7- Carte di controllo Abbiamo già introdotto gli istogrammi, i grafici “rami e foglie” e le carte di controllo analizziamo gli altri. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 232 Analisi Statistica del Disco di Festo Fogli di controllo. I primi passi per l’implementazione dell’SPC richiedono che si provveda a una raccolta di dati riguardanti il processo oggetto di controllo: per tale scopo un utile strumento è il foglio di controllo. Quando si progetta un foglio di controllo, è importante definire in modo chiaril tipo di informazione che deve essere raccolta, la data, l’operatore che effettua la raccolta e qualsiasi altra nota che renda più intelligibile la provenienza del dato. Grafico di Pareto. E’ uno degli strumenti più utili nell’SPC: riporta l’istogramma e l’associata distribuzione di frequenza cumulata di dati qualitativi distinti per categoria e ordinati per frequenza di accadimento. Con questo grafico l’utente può facilmente individuare la più frequente tipologia di difetti. Il grafico di Pareto individua le cause che più di frequente si sono manifestate, non quelle più importanti per il funzionamento del prodotto. Diagramma causa ed effetto. Una volta che un errore, un problema o un elemento difettoso è stato identificato e isolato, devono essere cercate le cause potenziali di questo indesiderabile effetto. I passaggi per la costruzione di un diagramma causa ed effetto sono i seguenti: Definire il problema o l’effetto da analizzare Preparare il team che deve eseguire l’analisi Predisporre la casella dell’effetto e una linea centrale Specificare le tipologie delle più importanti cause e unirle con tratti come caselle connesse alla linea centrale 5- Indicare le possibili cause e classificarle nelle tipologie individuate al passo 4. Se necessario creare altre tipologie 6- Ordinare le cause in base alla maggiore o minore probabilità che possano creare il problema oggetto di analisi Quanto più dettagliati sono i diagrammi di causa ed effetto, tanto più efficaci essi saranno nell’aiutare il management nella soluzione del problema. 1234- Diagrammi sulla concentrazione dei difetti. E’ un particolare disegno sulla struttura del prodotto, su cui vengono riportate tutte le visuali rilevanti del prodotto stesso. I diversi tipi di difetti vengono evidenziati su questo disegno, con lo scopo di verificare se la loro collocazione può costituire un’utile informazione sulle cause potenziali del difetto rilevato. Una volta che sono stati raccolti i diagrammi sulla concentrazione dei difetti per un numero sufficientemente elevato di unità prodotte, spesso si riesce a individuare alcune tipologie che aiutano a capire le cause e gli effetti. Grafici a dispersione. Sono utili per individuare potenziali relazioni funzionali tra due variabili. Si considerino due variabili x e y; di queste vengano raccolte n coppie di dati, (xi,yi), per i = 1, 2, …, n, che vengono rappresentate su un piano cartesiano. L’andamento del grafico a dispersione spesso indica quale relazione sussiste tra le due variabili. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 233 Analisi Statistica del Disco di Festo 5 - Carte di controllo per variabili Questo capitolo presenta le carte di controllo per caratteristiche qualitative misurate su scala numerica, come ad esempio la lunghezza, l’ampiezza, la temperatura,il volume, che prendono il nome di carte di controllo per variabili. 5.1 Introduzione Una caratteristica misurabile, come una dimensione, il peso o il volume, viene chiamata variabile; di questa, in un contesto di SPC, è assolutamente necessario per poter controllare sia la media sia la variabilità, monitorare in genere con carte chiamate , S o R (dove S e R stanno rispettivamente per deviazione standard campionaria e range). 5.2 Carte di controllo eR Si supponga che una caratteristica quantitativa, X, sia distribuita secondo la legge di una variabile casuale normale con media μ e deviazione standard σ, dove sia μ sia σ si ipotizzano note. Se indichiamo con x1, x2,…, xn un campione di dimensione n, proveniente da X, allora il valore medio del campione è Si dimostra che ha distribuzione normale con media μ e deviazione standard . Da questo segue che la probabilità che un’altra media da un campione di dimensione pari a n cada tra = e = è pari a 1 – α. Perciò se μ e σ sono note, come visto nel Capitolo precedente, se si sostituisce con il numero 3, così da poter utilizzare i limiti di controllo a 3-sigma. Le soprascritte equazioni potrebbero essere interpretate come limiti di controllo superiore e inferiore di una carta di controllo per la media campionaria: se una media campionaria cade al di fuori di questi limiti, è un segnale che la media del processo non è più pari a μ. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 234 Analisi Statistica del Disco di Festo Di fatto, l’ipotesi introdotta in precedenza di ritenere noti i valori di μ e di σ, non è quasi mai soddisfatta. Di conseguenza questi parametri devono essere stimati sulla base di un certo numero di campioni preliminari (in genere almeno 20 25), opportunamente estratti in un periodo in cui il processo viene ritenuto sotto controllo. A tale scopo si supponga che siano disponibili m campioni, ciascuno contenente n determinazioni casuali della caratteristica qualitativo oggetto di interesse. Tipicamente, n è un numero piccolo, spesso pari a 4, 5 o 6: una così piccola dimensione campionaria è giustificabile se sono stati utilizzati sottogruppi razionali o se i costi di campionamento e di ispezione associati a variabili quantitative sono piuttosto alti. Si indichino, quindi, con le medie di ciascun campione. Se la media del processo non è nota il miglior stimatore è la media delle medie degli m campioni: e verrà usata come linea centrale per la carta . Per costruire i limiti di controllo, abbiamo tuttavia bisogno anche di una stima della deviazione standard, σ. E’ possibile stimare usando le deviazioni standard o i range degli m campioni. Per il momento ci concentreremo solamente sul metodo basato sui range. Si ricorda che se x1, x2,…, xn è un campione di dimensione n, il range del campione è la differenza tra la più grande e la più piccola determinazione campionaria; ovvero Siano i range degli m campioni. Lo stimatore del range del processo, da usare per la costruzione dei limiti di controllo, è il range medio I limiti della carta sono in definitiva i seguenti: Limiti di controllo per la carta la costante A2 è tabulata per diversi valori di n La variabilità del processo può essere monitorata, riportando i valori del range di ogni campione su una carta di controllo R. La linea centrale e i limiti di controllo per la carta R sono i seguenti: Limiti di controllo per la carta R le costanti D4 e D3 sono tabulate per diversi valori di n Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 235 Analisi Statistica del Disco di Festo 5.3 Carte di controllo per eS In presenza di dimensioni campionarie sufficientemente grandi, è opportuno stimare la deviazione standard del processo con la deviazione standard campionaria S e non con il range campionario R. Si ottengono così le carte di controllo e S che sono preferibili alle corrispondenti carte e R quando si verifica una delle seguenti condizioni: 1. la dimensione campionaria n è abbastanza grande, ovvero o 12; 2. la dimensione campionaria è variabile. 5.3.1 Costruzione e uso delle carte di controllo eS La costruzione delle carte di controllo e S richiede gli stessi passi necessari per la costruzione delle carte e R, a eccezione del fatto che per ogni campione dobbiamo calcolare e S che verranno utilizzati per costruire le corrispondenti carte. E’ noto che se σ2 è l’ignota varianza di una distribuzione, uno stimatore non distorto di σ2 è la varianza campionaria La deviazione standard campionaria S non è invece uno stimatore non distorto di σ. Se la distribuzione oggetto di studio è normale, allora S stima una grandezza pari a c4σ, dove c4 è una costante che dipende dalla dimensione campionaria n1. Inoltre la deviazione standard di S è . Questa informazione può essere usata per la costruzione delle carte e S. Si consideri il caso in cui a σ viene assegnoto un valore standard. Dal momento che σ, la linea centrale della carta è σ. I limiti di controllo a 3-sigma per S sono quindi si è soliti definire le costanti Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 236 Analisi Statistica del Disco di Festo I limiti della carta S nell’ipotesi di avere un valore preassegnato per σ saranno quindi Quando è possibile disporre di valori noti per la media e la deviazione standard della popolazione, potremmo usare tali valori per la costruzione della carta . Si supponga che i valori siano μ e σ. I parametri della carta sono: La grandezza , che possiamo porre pari ad A, dipende solamente da n ed è tabulata. Perciò i parametri della carta possono essere riscritti come: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 237 Analisi Statistica del Disco di Festo 6 – Carte di controllo per attributi Molte caratteristiche relative alla qualità di un prodotto non possono essere rappresentate numericamente. In tali casi si è soliti classificare ciascun oggetto esaminato solamente come conforme o non conforme a una certa caratteristica qualitativa prescelta. I termini difettoso o non difettoso vengono spesso usati per identificare tale classificazione. Caratteristiche di questo tipo prendono il nome di attributi. 6.1 Introduzione Le carte di controllo per attributi non sono così informative come le carte per variabili. L’informazione contenuta in una misura è in genere più informativa di quella che si ottiene classificando una unità semplicemente come conforme o non conforme. In ogni caso le carte di controllo per attributi hanno importanti applicazioni, specie nelle società di servizi o per migliorare la qualità nei settori non manifatturieri, essendo le grandezze che le caratterizzano non facilmente misurabili su scala numerica. 6.2 Carte di controllo per frazioni di non conformi La frazione di non conformi viene definita come il rapporto tra numero di unità non conformi presenti in una popolazione e numero di pezzi che compongono quella popolazione. Un’unità prodotta può avere diverse caratteristiche qualitative che possono essere esaminate simultaneamente. Se il pezzo non soddisfa una o più caratteristiche viene classificato come non conforme. La frazione di non conformi campionaria viene definita come il rapporto fra il numero di unità non conformi presenti nel campione e la dimensione del campione n; ovvero Dove p è la probabilità di ottenere un pezzo non conforme, n è la dimensione del campione e D il numero di unità prodotte che non sono conformi. La media e la varianza di sono rispettivamente: e 6.2.1 Costruzione della carta di controllo Nel capitolo 4 sono stati presentati i fondamenti statistici che sottostanno alle carte di Shewhart. Indicata con ω una statistica che misura una certa caratteristica qualitativa e indicate con μω e rispettivamente la sua media e la varianza , l’impostazione generale delle carte di Shewhart è la seguente: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 238 Analisi Statistica del Disco di Festo dove L, di solito posto pari a 3, è la distanza, espressa in unità di deviazione standard di ω, dei limiti di controllo dalla linea centrale. Si supponga che la vera frazione di non conformi p sia nota o che il management abbia definito un valore standard. Dalle equazioni sopra scritte , la linea centrale e i limiti di controllo della carta per la frazione di non conformi vengono definiti come segue: Carte di controllo per frazione di non conformi: valori di riferimento Per l’utilizzo della carta bisognerà estrarre campioni successivi di n unità, calcolare la frazione di non conformi e rappresentare tale statistica sulla carta. Finché rimane all’interno dei limiti di controllo e non si osserva alcun andamento anomalo o non casuale nella successione di punti, si può affermare che il processo è sotto controllo al livello p. Se invece il punto cade al di fuori dei limiti o se si osserva un andamento non casuale dei punti, si dovrà concludere che la frazione di non conformi ha probabilmente subito uno scostamento a un nuovo livello e che il processo è fuori controllo. Se la vera frazione di non conformi p non è nota, dovrà essere stimata dai dati osservati. La procedura consiste nel selezionare m campioni preliminari, ciascun odi dimensione n. Una regola generale è di scegliere m=20 o 25. Se ci sono Di unità non conformi nel campione i-esimo, la corrispondente frazione campionaria di non conformi è , i = 1, 2, …, m e la media di tutte le frazioni di non conformi è = dove la statistica è lo stimatore dell’ignota frazione p. La linea centrale e i corrispondenti limiti della carta di controllo vengono calcolati come segue: Carte per la frazione di non conformi: valori di riferimento non assegnati Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 239 Analisi Statistica del Disco di Festo 6.2.2 Dimensione campionaria variabile Se la dimensione campionaria è variabile , ad esempio perché la produzione non produce sempre lo stesso numero di pezzi, anche i limiti di controllo di una carta per frazione di non conformi dovranno variare. Per gestire tale situazione, tre sono i criteri perseguibili. 1. Limiti di controllo ad ampiezza variabile. L’approccio più semplice consiste nel calcolare i limiti per ogni ampiezza campionaria. 2. Limiti di controllo basati sulla dimensione campionaria media. Tale approccio consiste nel costruire i limiti di controllo sulla base della dimensione campionaria media, ottenendo quindi limiti di controllo approssimati. 3. Carta di controllo con valori standardizzati. In presenza di n variabili, l’approccio consiste nel usare valori standardizzati. 6.3 Carte di controllo per non conformità (numero dei difetti) Un’unità non conforme è un prodotto che non soddisfa una o più caratteristiche qualitative. Ciascuna caratteristica qualitativa non soddisfatta è un difetto o non conformità e in genere, se un bene ha uno o più difetti, è non conforme. Questo attributo dipende tuttavia anche dalla gravità dei difetti. Se questi non influiscono sul funzionamento dell’oggetto possono anche non essere tali da classificarlo necessariamente come non conforme, così come, da un altro punto di vista, pur non influendo sul suo funzionamento i difetti possono essere tali da rendere l’oggetto invendibile: dipende dal livello qualitativo che l’azienda si è prefissata. E’ possibile costruire carte di controllo sia per il numero totale di non conformità per unità prodotta sia per il numero medio di non conformità per unità prodotta. 6.3.1 Procedure con dimensioni campionarie costanti Il campione è in genere costituito da un’unica unità di riferimento che può essere anche una sola parte dell’intero prodotto. Nulla vieta tuttavia che si possa scegliere più di una unità prodotta, che andrà a costituire l’unità di riferimento. I limiti a 3-sigma della carta di controllo per non conformità sono definiti come segue: Carte di controllo per non conformità: valori di riferimento assegnati Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 240 Analisi Statistica del Disco di Festo dove si ipotizza che c sia un valore noto e che, se LCL è negativo, questo verrà posto uguale a 0. Se nessun valore di riferimento viene assegnato è possibile stimare c con il numero medio di difetti rilevati in un campione preliminare; la stima verrà indicata con I limiti in tal caso saranno i seguenti: Carte di controllo per non conformità: valori di riferimento non assegnati che vanno considerati limiti di prova. Le carte di controllo per non conformità vengono talora indicate come carte c. 6.5 Linee guida per l’applicazione delle carte di controllo Quasi tutti i processi possono beneficiare dei metodi di SPC. In questo paragrafo presenteremo alcune linee guida per l’applicazione delle carte di controllo e in particolare affronteremo i seguenti punti: 1. Determinare quale caratteristica controllare. 2. Determinare dove le carte dovrebbero essere applicate nel processo. 3. Scegliere l’appropriata carta di controllo 4. Attivare interventi migliorativi del processo a fronte di risultati di analisi si SPC. 5. Scegliere quali strumenti impiegare per raccogliere i dati per l’analisi di SPC. Determinare quale caratteristica controllare e dove applicare le carte (1-2). Queste scelta non sono facili quindi vengono proposte alcune linee guida: All’inizio di un nuovo processo produttivo o di una nuova applicazione di SPC, le carte dovrebbero essere applicate a tutte le caratteristiche del prodotto che si ritiene siano importanti. Si stabilirà solo nel seguito dove effettivamente sono necessarie. Le carte ritenute in seguito non necessarie devono essere eliminate ed eventualmente ne vanno aggiunte altre, se gli ingegneri o gli operatori lo ritengono necessario. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 241 Analisi Statistica del Disco di Festo Le informazioni sulle carte di controllo dovrebbero inizialmente essere tenute separate e nel tempo il numero dovrebbe diminuire in relazione alla progressiva stabilizzazione del processo produttivo. In genere, con il passare del tempo, se si osserva che le carte sono utili per la produzione, si nota un aumento del numero delle carte per variabili e una riduzione di quelle per attributi. Spesso si osserva l’applicazione delle carte quando ormai il prodotto è finito. E’ tuttavia meglio applicarle il più presto possibile al fine di non incorrere in difettosità che nel seguito potrebbero risultare fatali per l’intero prodotto. Le carte dovrebbero essere disponibili in luoghi il più vicino possibile all’attività produttiva, così da poter garantire un rapido intervento in caso di una segnalazione di guasto. Inoltre la vicinanza alla produzione consente di verificare velocemente gli effetti prodotti da eventuali aggiustamenti sul processo. Scegliere la carta appropriata (3). A. Carte e R (o e S). Tali carte dovrebbero essere usate per misurare variabili nei seguenti casi: - Un nuovo processo produttivo sta per essere avviato su un processo già esistente. - Il processo ha operato per un certo arco di tempo ma ora presenta diversi problemi di funzionamento. - Il processo presenta problemi di funzionamento e la carta serve come strumento di diagnostica. - I controlli sono distruttivi o molto costosi. - Si cerca di ridurre il numero di accettazione quando il processo è sotto controllo. - Sono state usate carte di controllo per attributi ma il processo è o fuori controllo o sotto controllo ma la difettosità inaccettabile. - Le specifiche del prodotto sono molto vincolate o la produzione è particolarmente delicata. - L’operatore deve decidere se modificare il processo o come valutare un certo settaggio. - Si richiede una modifica nelle specifiche del prodotto. - Deve essere continuamente certificata la capacità del processo. B. Carte per attributi (p, c, u). Tali carte dovrebbero essere usate per valutare gli attributi di un prodotto nei seguenti casi: - E’ richiesta una riduzione del numero di pezzi non funzionanti. - Il prodotto è talmente complesso che l’unico strumento di verifica è il suo attributo di funzionamento o di guasto. - Non è possibile effettuare misure delle grandezze osservate. - E’ richiesta la storia passata della produzione. Le carte per attributi sono estremamente sintetiche e quindi particolarmente utili per effettuare comparazioni tra processi a livello manageriale. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 242 Analisi Statistica del Disco di Festo C. Carte per misure singole. Queste carte vengono usate insieme alle carte con range mobile e sono utili nei seguenti casi: - Non è possibile disporre di più di un dato per campione o la replica dell’esperimento non dipende dal laboratorio che la effettua. - Sono disponibili strumenti di controllo automatici che effettuano il controllo di tutte le unità. - I dati sono disponibili solo con grande lentezza, al punto da rendere impraticabile la realizzazione di un campione con più di una unità. Azioni da intraprendere per migliorare il processo (4). L’applicazione delle carte di controllo consente di avere informazioni su due aspetti salienti del processo: (1) il suo stato di controllo, (2) la sua capacità. La figura sottostante da risposta ai due quesiti: “Il processo è sotto controllo?” e “Il processo ha capacità sufficiente?”. Il processo ha sufficiente capacità? Sì No SPC Sì Il processo è sotto controllo? SPC Piani sperimentali Verifica delle specifiche del processo Modifica del processo SPC No SPC Piani sperimentali Verifica delle specifiche del processo Modifica del processo A seconda delle caselle la figura propone diversi tipi di interventi. La situazione ideale è quella della tabella in alto a sinistra, in corrispondenza della quale va praticamente tutto bene e i metodi di SPC sono richiesti solo per garantire il mantenimento di un certo standard qualitativo. La casella in alto a destra invece evidenzia una situazione in cui, a fronte di uno stato di controllo, si assiste alla produzione di molte unità difettose. La ragione è probabilmente dovuta alla eccessiva variabilità del processo o alla scelta dei limiti di specifica troppo stretti, per la cui revisione si potrebbe procedere con un’indagine sperimentale e al limite con la sostituzione del processo con uno più moderno. La casella in basso a destra evidenzia la situazione peggiore, per la quale i metodi do SPC sono quelli che più velocemente dovrebbero fornire indicazioni della direzione in cui agire per migliorare la qualità. Infine la situazione rappresentata dalla casella in basso a sinistra può corrispondere al caso in cui la scelta dei limiti di specifica sono troppo ampi e i metodi di SPC dovrebbero in tal caso aiutare la loro revisione. Questo a beneficio di una migliore immagine dell’efficacia del processo di fronte alla clientela. Strumenti per la raccolta dei dati per l’analisi di SPC (5). Negli ultimi anni si è assistito a un considerevole aumento dell’offerta del software per SPC. Ad esempio la rivista Quality Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 243 Analisi Statistica del Disco di Festo Progress riporta un elenco di software disponibili, suddivisi per categorie, e le corrispondenti società produttrici. L’uso del computer è particolarmente importante in questa attività per diverse ragioni: Inizialmente l’applicazione dei metodi di SPC dovrebbe essere fatta manualmente al fine di apprendere meglio gli strumenti, ma nel seguito potrebbero diventare troppo lunghe le operazioni richieste per effettuare i calcoli. L’abitudine a memorizzare i dati in formato standard consente di scambiare velocemente le informazioni tra i diversi settori dell’azienda. La presenza di un sistema informatico consente altresì di effettuare controlli anche su più variabili in brevissimo tempo, aumentando quindi la produttività dell’operatore. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 244 Analisi Statistica del Disco di Festo 7 – Analisi di capacità del processo Precedentemente è stato formalmente introdotto il concetto di capacità del processo, ovvero come confrontare la variabilità naturale del processo con le specifiche del prodotto. Ora affronteremo una discussione più ampia sull’argomento, compresi i diversi modi di studiare e analizzare tale indicatore. Tra i vari strumenti, la carta di controllo costituisce la tecnica più semplice ed efficace di analisi della capacità del processo; analizzeremo i rapporti di capacità mostrando come interpretarli. 7.1 Introduzione Le tecniche statistiche sono utili durante tutto il ciclo di produzione, a partire dalle attività di sviluppo preliminari alla fabbricazione vera e propria, per continuare con l’analisi e la valutazione della variabilità del processo, in relazione ai livelli nominali di specifica, fino alle operazioni dedicate alla eliminazione o almeno alla riduzione di detta variabilità. Questa attività generale è detta analisi di capacità del processo. La capacità del processo viene in generale riferita alla uniformità di comportamento del processo. Ovviamente la variabilità è una misura della uniformità della caratteristica del prodotto in uscita. Ci sono due modi di interpretare questa variabilità: 1. la variabilità naturale o inerente a uno specifico istante, detta anche variabilità istantanea; 2. la variabilità rispetto al tempo. E’ consuetudine assumere l’intervallo di ampiezza 6-sigma della distribuzione della caratteristica di qualità del prodotto come misura della capacità del processo. La figura Immagine Rappresenta un processo la cui caratteristica di qualità ha distribuzione normale, di media μ e deviazione standard σ. I limiti di tolleranza naturale superiore e inferiore (UNTL e LNTL) sono posti ai valori μ +3 σ e μ -3 σ. Cioè Per la distribuzione normale, l’intervallo tra i limiti di tolleranza naturale corrisponde a una probabilità del 99.73%, ovvero abbiamo una probabilità dello 0.27% di ottenere valori fuori da detto intervallo. Ricordiamo i seguenti due punti: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 245 Analisi Statistica del Disco di Festo 1. anche se una probabilità pari a 0.27% può sembrare piccola, essa corrisponde comunque a 2700 unità non conformi ogni milione; 2. se la distribuzione della variabile in uscita del processo non è gaussiana la percentuale di elementi fuori dai limiti può anche risultare considerevolmente diversa da 0.27%. Definiamo analisi di capacità del processo la procedura di stima della capacità, che viene effettuata con riferimento alla forma della distribuzione di probabilità, alla sua media e alla sua deviazione standard. Ad esempio, nel caso di una distribuzione normale di media e , si potrebbe condurre l’analisi di capacità senza riferimento alle specifiche di qualità del prodotto. In alternativa,è possibile esprimere la capacità del processo come percentuale di elementi fuori specifica. Comunque, le specifiche non sono da usare necessariamente per eseguire l’analisi. Uno studio di capacità di un processo misura solitamente alcuni parametri funzionali del processo, non il processo. Se un analista potesse misurare direttamente il processo e controllare direttamente l’attività di rilevazione dei dati, allora lo studio sarebbe un vero studio di capacità, perché potrebbe effettivamente realizzare una procedura inferenziale indirizzata allo studio della stabilità del processo. Invece, avendo a disposizione solo le unità campionarie, magari fornite dal fornitore, senza poter osservare direttamente il processo, né possedere la conoscenza storica del processo di produzione, allora lo studio dovrebbe più propriamente essere chiamato di caratterizzazione del prodotto. In uno studio di questo tipo, infatti, viene analizzata la distribuzione della caratteristica di qualità (frazione di elementi conformi), e non il comportamento dinamico del processo, eventualmente osservato nel solo stato di controllo statistico. L’analisi di capacità del processo è parte vitale di un programma complessivo di miglioramento della qualità e prevede di utilizzare i dati principalmente allo scopo di: 1. prevedere come il processo rispetterà le tolleranze; 2. assistere i tecnici del servizio di ricerca e sviluppo nelle modifiche di processo; 3. stabilire l’intervallo di campionamento per le procedure di sorveglianza; 4. stabilire i requisiti di prestazione di nuove attrezzature; 5. selezionare i fornitori; 6. pianificare la produzione anche in presenza di interazione del processo sulle tolleranze; 7. ridurre la variabilità del processo. Cosicché, l’analisi della capacità del processo ha applicazione in più parti del ciclo di vita di un prodotto, inclusa la fase di progettazione, quella di scelta dei fornitori, di pianificazione della produzione e quella dell’effettiva realizzazione del prodotto. Per l’analisi della capacità del processo vengono impiegate principalmente tre tecniche: istogrammi o carte di probabilità, carte di controllo e programmazione degli esperimenti. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 246 Analisi Statistica del Disco di Festo Parte III Altre tecniche statistiche di monitoraggio e controllo del processo La seconda parte si è concentrata sui metodi di base dell’analisi statistica di capacità e controllo del processo. Molte di queste tecniche, come le carte di controllo di Shewhart, sono state utilizzate per ben oltre 50 anni. Ad ogni modo la crescente attenzione alla riduzione della variabilità ha portato al miglioramento dei processi, insieme al successo dei metodi di base, e ha portato allo sviluppo di molte nuove tecniche per il monitoraggio ed il controllo statistico del processo. Questa parte contiene argomenti che definiscono alcune di queste tecniche. 8 - Carte di controllo CUSUM ed EWMA Sommario Le carte di controllo presentate precedentemente sono dette carte di Shewhart, dal momento che fanno riferimento alla metodologia sviluppata da Walter A. Shewhart. Caratteristica principale di dette carte è che fanno uso unicamente delle informazioni sul processo contenute nell’ultimo istante di osservazione, ignorando tutte quelle precedenti. Ciò rende la carta di Shewhart relativamente insensibile a piccole modifiche del livello del processo, di ampiezza in genere non superiore a 1.5σ. Per tale motivo, viene allora suggerito di corredare tali carte con ulteriori strumenti, quali il test delle sequenze o l’uso dei limiti di preallarme, allo scopo di considerare, nella procedura decisionale, tutte le informazioni disponibili. Tuttavia queste procedure, miranti a rendere più sensibile la carta, ne riducono la semplicità d’uso e l’immediatezza interpretativa. Due valide alternative alla carta di controllo di Shewhart, in presenza di limitati salti di livello, sono: le carte CUSUM (CUmulative SUM) o “a somme cumulate” e la carta EWMA (Exponentially Weighted Moving Average) ovvero “a medie mobili pesate esponenzialmente”. 8.1 Le carte CUSUM 8.1.1 La procedura maschera a V Una procedura da usare in alternativa alla CUSUM tabulare è lo schema di controllo “maschera a V”. La maschera a V si applica ai valori successivi della statistica cumulata Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 247 Analisi Statistica del Disco di Festo dove è la generica osservazione standardizzata: V è rappresentata in figura . Una tipica maschera a La procedura decisionale consiste nel posizionare la maschera a V nel punto O del grafico dei valori cumulati, in corrispondenza dell’ultimo valore disponibile per , tenendo il segmento OP parallelo all’asse orizzontale. Se i punti corrispondenti alle precedenti somme cumulate giacciono tutti all’interno dei due bracci della maschera a V, il processo è da considerare in stato di controllo. Se invece almeno uno dei punti si presenta fuori dalla maschera , allora il processo è da considerarsi fuori controllo. Nelle utilizzazioni pratiche la maschera dovrebbe essere applicata ad ogni nuovo punto del grafico della CUSUM e i bracci andrebbero tracciati all’indietro, in direzione dell’origine. Le prestazioni della maschera a V dipendono dalla distanza d e dall’angolo θ. …… Si suggerisce al tecnico della qualità di evitare l’uso della maschera a V, principalmente per i seguenti svantaggi e problemi: 1. La maschera a V è uno schema di controllo bilaterale e quindi inutilizzabile nel caso di problemi unilaterali. 2. Lo strumento dell’avvio accelerato, molto utile nelle applicazioni pratiche, non può essere adottato con la maschera a V. 3. Risulta a volte difficoltoso determinare l’estensione da assegnare ai bracci della maschera, aumentando così le difficoltà interpretative per i non esperti. 4. Forse il problema più grosso con la maschera a V è l’ambiguità associata ai valori α e β. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 248 Analisi Statistica del Disco di Festo Parte IV Progetto e miglioramento del processo programmazione statistica degli esperimenti produttivo tramite la I miglioramenti della qualità e della produttività sono più efficaci quando sono parte integrante del ciclo di sviluppo del prodotto e del processo produttivo. In particolare, l’introduzione formale di una metodologia di programmazione degli esperimenti nei primi stadi del ciclo di sviluppo è spesso la chiave del successo complessivo, laddove si tratta di progettazione di nuovi prodotti, di miglioramento del progetto di prodotti esistenti, di ottimizzazione del processo produttivo. Questo principio è stato verificato in molti differenti settori industriali, tra cui quelli di: elettronica e semiconduttori, aerospaziale, apparecchiature mediche, alimentari e farmaceutici, chimica e nelle industrie di processo. L’uso efficace di una solida metodologia di programmazione statistica degli esperimenti può portare a prodotti che siano più facili da realizzare , hanno una migliore affidabilità e hanno migliori prestazioni sul campo. La programmazione degli esperimenti può anche migliorare molto le attività di sviluppo del processo di messa a punto e tutto questo costituisce il nocciolo di questa parte. In tutta la parte IV viene usata l’analisi della varianza come base per analizzare i dati provenienti da esperimenti programmati. Sarebbe possibile introdurre la programmazione degli esprimenti senza fare ricorso a tale metodo, ma si pensa che sia un errore, soprattutto perché gli utenti incontrerebbero comunque l’analisi della varianza in ogni software utilizzato. 9 – I principi di base della programmazione degli esperimenti Sommario Lo scopo di questo capitolo è di introdurre il lettore alla terminologia della programmazione degli esperimenti, di presentare alcune brevi illustrazioni dei tipi di problemi in cui la programmazione degli esperimenti è utile, di discutere i principali metodi statistici usati. Un obiettivo importante è di sviluppare una comprensione dell’analisi della varianza, tecnica che viene usata per l’analisi della maggior parte degli esperimenti programmati. Altri argomenti chiave comprendono: il ruolo del modello sottostante l’esperimento, i residui e il loro uso nella verifica delle ipotesi, il principio del bloccaggio, che è utile negli esperimenti in cui sono coinvolte variabili di disturbo. 9.1 Che cos’è la programmazione degli esperimenti? Un esperimento programmato è una prova, o serie di prove, in cui vengono fatte variare deliberatamente le variabili di ingresso di un processo, in modo da poter osservare e identificare le corrispondenti variazioni della risposta in uscita. I processo come illustrato nella figura, Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 249 Analisi Statistica del Disco di Festo può essere visualizzato come un complesso di macchine, metodi e persone che trasformano il materiale in ingrasso nel prodotto in uscita. Questo prodotto in uscita ha una o più caratteristiche di qualità o risposte osservabili. Alcune delle variabili di processo, siano x1, x2,…, xp, sono controllabili, mentre altre, siano z1, z2,…, zq, sono incontrollabili (anche se queste ultime potrebbero essere controllabili nel corso dell’esperimento). A volte questi fattori incontrollabili sono detti fattori di rumore. Gli obiettivi dell’esperimento possono comprendere: 1. la determinazione di quali variabili hanno più influenza sulla risposta y; 2. la determinazione di come aggiustare le x più influenti in modo che la risposta y sia vicina alla richiesta della specifica; 3. la determinazione di come aggiustare le x influenti in modo che la variabilità di y sia piccola; 4. la determinazione di come aggiustare le x influenti in modo che l’effetto delle variabili non controllabili z sia minimizzato. I metodi della programmazione degli esperimenti possono dunque essere usati sia nello sviluppo sia nella messa a punto del processo per migliorare le prestazioni o per ottenere un processo robusto ovvero insensibile alle sorgenti esterne di variabilità. I metodi di controllo statistico del processo e la programmazione degli esperimenti, due strumenti potenti per il miglioramento e l’ottimizzazione del processo , sono strettamente collegati. Per esempio, se un processo è sotto controllo statistico, ma ha ancora una bassa capacità, sarà necessario ridurre la variabilità per migliorare il processo. Esperimenti programmati possono fornire un modo di ottenere il risultato più efficiente del semplice controllo statistico del processo SPC. In sostanza, l’SPC è un metodo statistico passivo: osserviamo il processo in attesa di certe informazioni che potranno condurre a cambiamenti utili. Tuttavia, se il processo è sotto controllo, l’osservazione passiva non può produrre molta informazione utile. Viceversa, la programmazione degli esperimenti è un metodo statistico attivo: si faranno in effetti una serie di prove sul processo, effettuando cambiamenti negli ingressi e osservando i corrispondenti cambiamenti nelle uscite, cosa che produce informazione che può condurre a un miglioramento del processo. I metodi di programmazione degli esperimenti possono anche essere molto utili nella messa sotto controllo statistico del processo. Ad esempio, si supponga che una carta di controllo indichi che il processo è fuori controllo, e che il processo abbia molte variabili di ingresso controllabili. Può essere difficile ricondurre il processo sotto controllo a meno che non conosciamo quali variabili di ingresso hanno importanza. I metodi di programmazione degli esperimenti possono essere usati per identificare queste variabili di ingresso influenti. La programmazione degli esperimenti è per l’ingegnere uno strumento di importanza critica per il miglioramento di un processo produttivo. Ha anche estese applicazioni nello sviluppo di nuovi processi. L’applicazione tempestiva di queste tecniche nello sviluppo di processi può condurre a: 1. un aumento del volume prodotto; 2. una riduzione della variabilità e un più preciso rispetto delle specifiche; 3. una riduzione dei tempi di sviluppo; 4. una riduzione dei costi complessivi. I metodi di programmazione degli esperimenti possono anche giocare un ruolo importante nelle attività di progetto, quando si sviluppano nuovi prodotti o si migliorano quelli esistenti. Alcune applicazioni della programmazione statistica degli esperimenti comprendono: 1. la valutazione e il confronto di fondamentali configurazioni di progetto; Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 250 Analisi Statistica del Disco di Festo 2. la valutazione di alternative sui materiali; 3. la determinazione dei parametri di progetto chiave in quanto a influenza sulle prestazioni. L’uso della programmazione degli esperimenti in queste aree può condurre a un miglioramento della fabbricabilità del prodotto, migliorate prestazioni operative e affidabilità, minori costi di produzione e tempi di sviluppo del prodotto più corti. 9.2 Esempi di esperimenti programmati nel miglioramento della qualità e del processo Vengono ora presentati vari esempi che illustrano l’applicazione di esperimenti programmati al miglioramento del processo e del prodotto. Esempio 1 - Caratterizzazione di un processo Un ingegnere di produzione ha applicato il controllo statistico di processo al prodotto di saldatura di componenti elettronici a una scheda di circuito stampato. Tramite l’uso delle carte u e dell’analisi di Pareto, ha ha realizzato il controllo statistico del processo di saldatura onda e ha ridotto il numero medio di saldature difettose per piastra a circa l’1%. Malgrado ciò, dato che la scheda tipica contiene più di 2000 giunti di saldatura, anche l’1% di difetti comporta che troppe saldature richiedono una rilavorazione. L’ingegnere vorrebbe ridurre il livello di difettosità ancora di più; d’altra parte, dato che il processo è in stato di controllo statistico, non è ovvio quali regolazioni della macchina sarebbero necessarie. La macchina per la saldatura a onde ha diverse variabili che possono essere controllate. Tra queste vi sono: 1. la temperatura di saldatura; 2. la temperatura di pre-riscaldamento; 3. la velocità di efflusso del fondente; 4. il tipo di fondente; 5. la densità relativa del fondente; 6. la profondità dell’onda di fondente; 7. l’angolo di efflusso. In aggiunta a questi fattori controllabili, molti altri possono essere facilmente controllati durante la fabbricazione ordinaria, benché non possano essere controllati nel corso di una prova. Essi sono: 1. lo spessore della scheda di circuito stampato; 2. il tipo di componenti montati sulla scheda; 3. la disposizione dei componenti sulla scheda; 4. l’operatore; 5. la produttività. In questa situazione l’ingegnere è interessato alla caratterizzazione della saldatrice a onda, cioè vuole determinare quali fattori causano l’insorgere di difetti nelle schede di circuito stampato. Per raggiungere questo scopo, egli potrà programmare un esperimento che lo metta in grado di determinare la grandezza e la direzione dell’effetto dei fattori. Cioè: quanto cambia la variabile di risposta (il numero di difetti per unità) quando uno dei fattori è modificato, e il cambiamento congiunto dei fattori produce effetti diversi da quelli ottenuti con l’aggiustamenti dei fattori singoli? A volte questo tipo di esperimento è detto esperimento di selezione. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 251 Analisi Statistica del Disco di Festo Esempio 2 – Ottimizzazione di un processo In un esperimento di caratterizzazione siamo di solito interessati a determinare quali variabili del processo influenzano la risposta. Il successivo passo logico è l’ottimizzazione, cioè la determinazione della regione di valore dei fattori importanti che conduce alla migliore risposta possibile. Se, ad esempio, la risposta è la resa, cercheremo una regione di massima resa, mentre se la risposta è la variabilità di una dimensione critica del prodotto, allora cercheremo una regione di minima variabilità. Esempio 3 – Un esempio di progetto di prodotto È spesso possibile applicare esperimenti programmati per la progettazione di un prodotto. Per illustrazione, supponiamo che un gruppo di ingegneri stia progettando una cerniera per una portiera d’automobile. La caratteristica di qualità interessante è la forza di tenuta, cioè la capacità di tenuta del dispositivo di arresto della portiera che impedisce alla portiera aperta di richiudersi quando l’auto è parcheggiata in salita. Il meccanismo di tenuta è costituito da una molla e da un rullo. Quando la portiera viene aperta, il rullo si muove lungo un arco causando la compressione della molla a balestra. Quando la portiera viene chiusa, la molla viene forzata lateralmente, creando la forza di tenuta. Il gruppo di ingegneri ritiene che la forza di tenuta sia una funzione dei seguenti fattori: 1) la corsa del rullo; 2) l’altezza della molla tra base e perno; 3) la distanza orizzontale tra perno e molla; 4) l’altezza a riposo della molla di rinforzo; 5) l’altezza a riposo della molla principale. Gli ingegneri costruiscono un prototipo di meccanismo di cerniera in cui tutti questi fattori possono essere modificati in certi intervalli. Una volta che gli appropriati livelli di questi fattori sono stati determinati, può essere programmato un esperimento consistente in varie combinazioni dei livelli dei fattori, e il prototipo di cerniera può essere provato sotto queste combinazioni. Questo produrrà informazioni su quali fattori sono più influenti sulla forza di tenuta, e il progetto potrà essere migliorato tramite tali informazioni. 9.3 Criteri per la programmazione degli esperimenti Gli esperimenti programmati costituiscono un approccio potente al miglioramento del processo. Per poter usare questo approccio è necessario che tutti coloro che sono coinvolti nell’esperimento abbiano preliminarmente una chiara idea del suo obiettivo, un’idea esatta dei fattori che saranno studiati, di come l’esperimento deve essere eseguito, e una comprensione almeno qualitativa di come i dati saranno analizzati. Segue una traccia della procedura: 1. 2. 3. 4. Riconoscimento ed enunciazione del problema. Scelta dei fattori e dei loro livelli. Selezione della variabile di risposta. Scelta del piano sperimentale. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 252 Analisi Statistica del Disco di Festo 5. Esecuzione dell’esperimento. 6. Analisi dei dati. 7. Conclusioni e raccomandazioni. Nel corso dell’intero processo è importante tenere a mente che la sperimentazione è una parte importante del processo di conoscenza, nella quale formuliamo ipotesi di lavoro riguardo al sistema, eseguiamo esperimenti per investigare queste ipotesi, sulla base dei risultati formuliamo nuove ipotesi, e così via. Questo suggerisce che la sperimentazione è iterativa. Normalmente è un grave errore programmare all’inizio dello studio un unico grande ed esaustivo esperimento. Un esperimento di successo richiede la conoscenza di quali sono i fattori importanti, dell’intervallo in cui tali fattori dovrebbero essere fatti variare, dell’appropriato numero di livelli da usare, e delle appropriate unità di misura per queste variabili. In generale non conosciamo la risposta a queste domande, ma impariamo qualche cosa su di esse nel corso del cammino. Man mano che un programma di esperimenti procede, spesso lasciamo cadere alcune variabili, ne aggiungiamo altre, cambiamo la regione di esplorazione di alcuni fattori, aggiungiamo nuove variabili di risposta. In conclusione, di solito sperimentiamo in modo sequenziale e, come regola generale, non più del 25% delle risorse disponibili dovrebbe essere investito nel primo esperimento. Ciò assicurerà che saranno disponibili sufficienti risorse per raggiungere l’obiettivo finale dell’esperimento. 9.4 Esperimenti fattoriali I piani fattoriali dovrebbero essere usati ogni volta che in un esperimento ci sono molti fattori da studiare. In questo tipo di piano, i fattori sono fatti variare insieme. Precisamente, con l’espressione “esperimento fattoriale” intendiamo che in ogni insieme completo di prove o in ogni sua replicazione vengono studiate tutte le possibili combinazioni di livelli dei fattori. Cioè, se ci sono due fattori A e B con a livelli per il fattore A e b livelli per il fattore B, allora ogni replicazione contiene tutte le ab possibili combinazioni. Si definisce effetto del fattore la variazione nella risposta prodotta dal cambiamento di livello del fattore. Questo si chiama effetto principale perché si riferisce ai fattori principali dello studio. Si considerino ad esempio i dati della figura. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 253 Analisi Statistica del Disco di Festo In questo piano fattoriale entrambi i fattori A e B hanno due livelli, indicati rispettivamente “ ” e “+” e chiamati rispettivamente “basso” e “alto”. L’effetto principale del fattore A è la differenza fra la risposta media al livello alto di A e la risposta media al livello basso di A, ovvero In altre parole, il passaggio del fattore A dal livello basso ( al livello alto ( causa in media un aumento della risposta di 20 unità. Analogamente, l’effetto principale di B è: In alcuni esperimenti la differenza di risposta fra i livelli di un fattore non è la stessa a tutti i livelli degli altri fattori. Quando questo avviene c’è un’interazione tra i fattori. Ad esempio, consideriamo i dati della figura. Al livello basso del fattore B l’effetto di A è mentre al livello alto del fattore B l’effetto è Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 254 Analisi Statistica del Disco di Festo Dato che l’effetto di A dipende dal livello scelto per il fattore B, c’è interazione fra A e B. Quando l’interazione è grande, i corrispondenti effetti principali sono poco significativi. Ad esempio, se usiamo i dati della figura sopra, troviamo che l’effetto principale di A vale e potremmo essere tentati di concludere che non c’è effetto di A. D’altra parte, se esaminiamo l’effetto principale di A a livelli diversi del fattore B, vediamo che le cose non stanno così, perché l’effetto del fattore A dipende dai livelli del fattore B. Dunque la conoscenza dell’interazione AB è più utile della conoscenza dell’effetto principale. Una interazione significativa può mascherare la significatività degli effetti principali. Il concetto di interazione può essere illustrato graficamente. La figura contiene una rappresentazione dei dati della figura 12.5 in funzione dei livelli di A per entrambi i livelli di B. Si osservi che le due rette e sono approssimativamente parallele, cosa che indica che i fattori A e B non interagiscono. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 255 Analisi Statistica del Disco di Festo La figura rappresenta i dati della figura 12.6. In questo grafico le linee e non sono parallele, cosa che indica una interazione fra i fattori A e B. Questi tipi di grafico è spesso utile nella rappresentazione dei risultati degli esperimenti. 12.5 Piani fattoriali 2k Certi tipi particolari di piani fattoriali sono molto utili nello sviluppo e miglioramento del processo. Uno di questi è il piano fattoriale con k fattori, ciascuno dei quali ha due livelli. Dato che ogni replicazione completa del piano ha prove, tale disposizione si chiama piano fattoriale . Questi piani hanno un’analisi molto semplificata e costituiscono anche la base per molti altri utili piani. 12.5.1 Il piano 22 Il più semplice piano è il piano , cioè con due fattori A e B, ciascuno con due livelli. Di solito pensiamo a questi due livelli come al livello “basso”, o “ ”, e “alto”, o “+”. Il piano è illustrato in figura e può essere rappresentato geometricamente come un quadrato con le prove a formare i vertici del quadrato. Per rappresentare le prove si usa una notazione speciale. In generale, una prova è rappresentata da una serie di lettere minuscole: se una lettera è presente, allora il corrispondente fattore è fissato al valore alto; se è assente, il fattore è tenuto al livello basso. Ad esempio, la prova a indica che il fattore A è tenuto a livello alto, mentre il fattore B è a livello basso. La prova con entrambi i valori a livello basso è indicata con (1). Questa notazione è usata per tutta la serie di piani . Ad esempio, la prova in un in cui i fattori A e C sono a livello alto e B e D a livello basso si indica con ac. Gli effetti che interessano in un piano sono i due effetti principali A e B e l’interazione fra i due fattori AB. Indichiamo con i simboli (1), a, b, ab i totali di tutte le n osservazioni in questi punti del piano. E’ facile stimare gli effetti di questi fattori. Per stimare l’effeto principale di A, dovremo prendere la media delle osservazioni sul lato destro del quadrato, dove A è a livello alto, e sottrarre da questa la media delle osservazioni sul lato sinistro del quadrato, dove A è a livello basso, cioè: Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 256 Analisi Statistica del Disco di Festo Analogamente , l’effetto principale di B si determina facendo la media delle osservazioni sulla parte superiore del quadrato, dove B è al livello alto, e sottraendo la media delle osservazioni sulla parte inferiore del quadrato, dove B è al livello basso: Infine, l’interazione AB si stima prendendo la differenza delle medie sulle diagonali nella figura 12.17, ovvero: Le quantità in parentesi quadre nelle equazioni sopra scritte sono dette contrasti. Ad esempio, il contrasto A è In queste equazioni i coefficienti dei contrasti sono sempre +1 o Per determinare i segni in ogni prova di un particolare contrasto si può usare una tabella di segni, del tipo di quella nella tabella Effetti fattoriali prova I 1 (1) + 2 a + 3 b + 4 ab + Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture A B AB + + + + + + 257 Analisi Statistica del Disco di Festo Le intestazioni delle colonne sono gli effetti principali di A e di B, l’effetto dell’interazione AB e I, che rappresenta il totale. Le intestazioni delle righe sono le prove. Si osservi che i segni della colonna AB sono i prodotti dei segni delle colonne A e B. Per generare i contrasti a partire da questa tabella, si moltiplicano i segni della colonna appropriata nella tabella per le prove elencate nelle righe e si sommi. Usiamo il seguente risultato per ottenere la somma dei quadrati per A, B, e AB. Ne segue che le somme dei quadrati per A, B, e AB sono: L’analisi della varianza è completata calcolando la somma dei quadrati SSTotale (con 4n-1 gradi di libertà) nel modo solito e ricavando la somma dei quadrati dell’errore SSErrore (con 4(n-1) gradi di libertà) per sottrazione. Esempio: L’esperimento sulla fresatrice Una fresatrice verticale viene utilizzata per tagliare tacche di registrazione su basette di circuito stampato. La media delle dimensioni della tacca è soddisfacente e il processo è sottocontrollo statistico (dalle carte di controllo e R) ma c’è troppa variabilità nel processo. Questo eccesso di variabilità produce dei problemi nell’assemblaggio della basetta. I componenti vi sono inseriti usando l’apparecchiatura automatica, e la variabilità nella dimensione della tacca produce uno scorretto posizionamento della basetta. Come conseguenza, il dispositivo di inserimento automatico non funziona correttamente. Dato che il processo è in stato di controllo statistico, il gruppo di miglioramento della qualità assegnato a questo progetto decide di usare un esperimento programmato per studiare il processo. Il gruppo prende in considerazione due fattori: la dimensione della punta da taglio (A) e la velocità (B). Per ciascuno dei due fattori vengono scelti due livelli, la dimensione della punta A a 1/16" e 1/8", e la velocità B a 40 e 80 giri al minuto (rpm). Viene riproposto un piano . Dato che la variazione nella dimensione della tacca risultava difficile da misurare direttamente, il gruppo decise di misurarla indirettamente. Vennero attrezzate sedici basette con accelerometri che permettessero la misurazione delle vibrazioni negli assi Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 258 Analisi Statistica del Disco di Festo coordinati (X, Y, Z). Il vettore risultante di queste tre misurazioni viene utilizzato come variabile di risposta. Dato che la vibrazione della superficie della basetta durante il taglio è direttamente legata alla variabilità della dimensione della tacca, una riduzione del livello di vibrazione riduce anche la variabilità nelle dimensioni della tacca. Furono testate quattro piastre per ciascuna delle quattro prove dell’esperimento, e i dati risultanti sono illustrati nella tabella Fattori prova A 1 (1) 2 a 3 b 4 ab B Totale 18.2 27.2 15.9 41.0 64.4 18.9 24.0 14.5 43.9 96.1 + 12.9 22.4 15.1 36.3 59.7 + 14.4 22.5 14.2 39.9 161.7 + + Vibrazioni Usando le equazioni possiamo stimare gli effetti dei fattori nel modo seguente: Tutti i valori numerici delle stime degli effetti appaiono grandi. Ad esempio, facciamo passare il fattore A dal valore basso a quello alto, (dimensione della punta da livello medio di vibrazione aumenta di 16.64 cps. e ), il La grandezza di questi effetti può essere confermata dall’analisi della varianza che è riassunta nella tabella. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 259 Analisi Statistica del Disco di Festo Sorgente variazione di Somma quadrati dei Gradi di libertà Media quadrati dei F0 P A 1107.226 1 1107.226 185.25 1.17 x Velocità 227.256 1 227.256 38.03 4.82 x AB 303.631 1 303.631 50.80 1.20 x Errore 71.723 12 5.977 Totale 1709.836 15 L’analisi della varianza conferma le nostre conclusioni, ottenute inizialmente dalla osservazione della grandezza e della direzione degli effetti dei fattori: sia la dimensione della punta da taglio sia la velocità sono importanti ed è presente una interazione fra le due variabili. Modello di regressione e analisi dei residui E’ facile ottenere i residui da un piano adattando un modello di regressione ai dati. Per l’esperimento della fresatrice il modello di regressione è dove i fattori A e B sono rappresentati dalle variabili codificate e e l’interazione AB è rappresentata dal termine di prodotto incrociato del modello. Ai livelli basso e alto di ciascun fattore sono assegnati i valori e rispettivamente. I coefficienti e sono detti coefficienti di regressione ed è un termine di errore casuale, analogo al termine di errore nel modello di analisi della varianza. Il modello di regressione adattato è dove la stima della intercetta è la media generale di tutte le 16 osservazioni e la stima degli altri coefficienti di regressione è la metà della stima dell’effetto del corrispondente fattore. Ogni stima di coefficiente di regressione è metà della stima dell’effetto perché il coefficiente di regressione misura l’effetto di una variazione unitaria di sulla media delle y e la stima dell’effetto è basata su una variazione su due unità (da a +1). Questo modello può essere utilizzato per ottenere i valori stimati del livello di vibrazione in ogni punto della regione di sperimentazione, inclusi i quattro punti del piano. Ad esempio, si consideri il punto con piccola dimensione della punta ( e con bassa velocità ( . Il livello stimato di vibrazione è Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 260 Analisi Statistica del Disco di Festo I quattro residui che corrispondono alle osservazioni in questo punto del piano si trovano prendendo le differenze fra le osservazioni effettive ottenute e il valore previsto, nel modo seguente: I residui negli altri tre punti del piano dovranno essere calcolati in modo analogo. Procedura di analisi per gli esperimenti fattoriali La tabella riassume la successione dei passi che sono usualmente eseguiti nell’analisi degli esperimenti fattoriali. 1. Stimare gli effetti dei fattori 2. Costruire il modello iniziale 3. Testare la significatività degli effetti dei fattori 4. Analizzare i residui 5. Migliorare il modello 6. Interpretare i risultati Il modello preliminare che abbiamo usato nell’analisi è il modello fattoriale a due fattori con interazione. In generale, in ogni esperimento fattoriale con replicazioni, useremo quasi sempre il modello fattoriale completo come modello iniziale. 12.5.2 Il piano 2k con I metodi che abbiamo presentato nel precedente paragrafo per i piani fattoriali con fattori possono essere facilmente estesi al caso di più di due fattori. Ad esempio, consideriamo fattori, ciascuno a due livelli. Questo piano è un piano fattoriale e presenta otto combinazioni di livelli dei fattori. Geometricamente, si tratta di un cubo, con le Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 261 Analisi Statistica del Disco di Festo A B C + + + + + + + + + + + + otto prove a costituire i vertici del cubo. Questo piano permette di stimare tre effetti principali (A, B, e C) unitamente a tre interazioni fra due fattori (AB, AC e BC) e a una interazione fra i tre fattori (ABC). Dunque il modello fattoriale completo potrebbe essere scritto simbolicamente come dove è una media generale, un termine di errore casuale supposto distribuito come indipendenti, e le lettere maiuscole rappresentano gli effetti principali e le interazioni. Gli effetti principali possono essere stimati facilmente. Ricordiamo che le lettere minuscole (1), a, b, ab, c, ac, bc, e abc rappresentano il totale di tutte le n replicazioni per ciascuna delle otto prove del piano. Riferendoci al cubo, dovremo stimare l’effetto principale di A facendo la media delle quattro prove sulla faccia destra del cubo dove A è al livello alto, e sottraendo da questa quantità la media delle quattro prove sulla fascia sinistra del cubo, dove A è al livello basso, ottenendo: In modo analogo, l’effetto di B è la differenza fra la media delle quattro prove sulla faccia posteriore del cubo meno quella delle quattro di fronte, ovvero Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 262 Analisi Statistica del Disco di Festo e l’effetto di C è la differenza fra la media delle quattro prove sulla faccia in alto del cubo meno quella delle quattro in basso, ovvero Consideriamo ora l’interazione fra i due fattori AB. Quando C è al livello basso, ABè proprio la differenza nell’effetto di A ai due livelli di B, ovvero analogamente, quando C è al livello alto, l’interazione AB è L’interazione AB è proprio la media di queste due componenti, ovvero Si noti che l’interazione AB è semplicemente la differenza delle medie su due piani diagonali nel cubo. Usando un approccio analogo troviamo che le stime degli effetti delle interazioni AC e BC sono le seguenti: L’effetto dell’interazione ABC è la differenza delle medie delle interazioni AB ai due livelli di C. Dunque Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 263 Analisi Statistica del Disco di Festo Ovvero Le quantità in parentesi quadra sono i contrasti nelle otto combinazioni di livelli di fattori. Questi contrasti possono essere ricavati dalla tabella di segni più e meno. Combinazioni di trattamenti Effetti fattoriali I A B AB C AC BC ABC (1) a b ab c ac bc abc I segni per gli effetti principali (colonne A, B e C) si ottengono associando un più al livello alto e un meno al livello basso. Una volta che sono stati ottenuti i segni per gli effetti principali, quelli per le altre colonne di determinano moltiplicando le colonne precedenti appropriate, riga per riga. Ad esempio, i segni della colonna AB si ottengono moltiplicando i segni delle colonne A e B. La tabella ha molte proprietà interessanti. 1. Eccetto che per la colonna identità I, ogni colonna ha egual numero di segni più e meno. 2. La somma dei prodotti dei segni di ogni coppia di colonne è zero; cioè le colonne sono ortogonali. 3. Moltiplicando ogni colonna per la colonna I la si lascia invariata; cioè I è l’elemento identità. 4. Il prodotto di ogni coppia di colonne produce una colonna della tabella; ad esempio, A x B = AB e AB x ABC = A2B2C = C, dato che ogni colonna moltiplicata per se stessa è la colonna identità. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 264 Analisi Statistica del Disco di Festo La stima di ogni effetto principale o interazione si determina moltiplicando la combinazione di livelli di fattori della prima colonna della tabella per i segni nella colonna del corrispondente effetto principale o interazione, addizionando il risultato per produrre un contrasto e poi dividendo il contrasto per metà del numero totale di prove nell’esperimento. In termini matematici La somma dei quadrati di ogni effetto è 12.5.3 Il piano 2k senza replicazioni Quando il numero dei fattori in un esperimento fattoriale aumenta, cresce anche il numero degli effetti che possono essere stimati. Ad esempio, un esperimento ha 4 effetti principali, 6 interazioni fra due fattori, 4 interazioni fra tre fattori e 1 interazione fra quattro fattori; invece un esperimento ha 6 effetti semplici, 15 interazioni fra due fattori, 20 interazioni fra tre fattori, 15 interazioni fra quattro fattori, 6 interazioni fra cinque fattori e 1 interazione fra sei fattori. In molte applicazioni si applica il principio di economia sparsity degli effetti: cioè di solito il sistema è controllato dagli effetti principali e dalle interazioni di ordine basso. Le interazioni fra tre o più fattori sono, in generale trascurabili. Dunque, quando il numero dei fattori è abbastanza grande, poniamo , è pratica comune di eseguire il piano solo una volta (senza cioè replicazioni) e poi raggruppare o combinare le stime delle interazioni di ordine alto come stima dell’errore. 12.5.4 Aggiunta di punti centrali al piano 2k Un potenziale problema nell’uso dei piani fattoriali a due livelli è l’ipotesi di non linearità negli effetti dei fattori. Naturalmente, una linearità perfetta non è necessaria, e i piani funzioneranno piuttosto bene quando l’ipotesi di linearità è verificata solo approssimativamente. Infatti, abbiamo già osservato che quando un termine di interazione viene aggiunto a un modello di soli effetti principali, viene introdotta una curvatura nella superficie di risposta. Dato che il piano supporta un modello con effetti principali e interazioni, una certa protezione contro la curvatura è inclusa comunque nel piano. In alcuni sistemi o processi necessario includere effetti del secondo ordine al fine di ottenere un modello adeguato. Consideriamo il caso fattori. Un modello che include effetti del secondo ordine è Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 265 Analisi Statistica del Disco di Festo dove i coefficienti e misurano gli effetti quadratici puri. L’equazione costituisce un modello di superficie di risposta del secondo ordine. Questo modello non può essere adattato usando un piano sperimentale , perché per adattare un modello quadratico è necessario che tutti i fattori compaiano nelle prove con almeno tre livelli. E’ importante, d’altra parte, determinare se i termini quadratici puri dell’equazione sono necessari. Esiste un metodo, basato sull’aggiunta di un piano al piano fattoriale , che può fornire qualche protezione contro gli effetti quadratici puri, nel senso che è possibile eseguire un test per determinare se gli effetti quadratici sono necessari. Inoltre, se questo punto viene replicato, si può ottenere una stima indipendente dell’errore sperimentale. Il metodo consiste dunque nell’aggiungere punti centrali al piano . I punti centrali sono costituiti da nC replicazioni nel punto . Una ragione importante per aggiungere questi punti al centro è che non interferiscono con le usuali stime degli effetti del piano . Supponiamo che i k fattori siano quantitativi, altrimenti il livello “di mezzo” o centrale non può esistere. Per illustrare questo approccio, consideriamo il piano con una osservazione in ciascuno dei punti fattoriali ( ), ( ), ( )e( ), e con nC replicazioni del punto centrale (0, 0). La figura illustra la situazione. Sia la media delle quattro prove nei punti fattoriali e sia la media delle nC osservazioni nel punto centrale. Se la differenza è piccola, allora il punto centrale giace sopra o vicino al piano passante attraverso i piani fattoriali e non c’è curvatura. Se, viceversa, è grande, allora siamo in presenza di curvatura. Una somma di quadrati con un grado di libertà per la curvatura quadratica pura è data da Dove, in generale, è il numero di punti nel piano fattoriale. Questa quantità può essere confrontata con la media dei quadrati dell’errore per eseguire un test sulla curvatura. Più esattamente, quando si aggiungono punti al centro del piano , allora il modello che possiamo trarre è dove le sono gli effetti quadratici puri. Il test per la curvatura in effetti verifica le ipotesi Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 266 Analisi Statistica del Disco di Festo Inoltre, se i punti del piano fattoriale non sono replicati, è possibile utilizzare gli nC punti centrali per costruire una stima dell’errore con nC – gradi di libertà. 12.5.5 Blocchi e confondimento nei piani 2k E’ spesso impossibile eseguire tutte le prove di un piano fattoriale in condizioni costanti e omogenee. Ad esempio, potrebbe non essere fattibile eseguire tutte le prove in un unico turno di lavoro, o usando materiale prodotto nelle stesse condizioni, Quando sorge questo problema, il bloccaggio costituisce una eccellente tecnica per l’eliminazione delle variazioni indesiderate, che potrebbero essere causate dalle condizioni non omogenee. Se il piano contiene replicazioni e se i blocchi sono sufficientemente grandi, allora un metodo consiste nell’eseguire ogni replicazione in un blocco (questo quando un blocco è un insieme di condizioni omogenee). Ad esempio, si consideri un piano che deve essere replicato due volte. Supponiamo che sia necessaria circa un’ora per completare una delle prove. Allora eseguendo le otto prove di ogni replicazione una in un giorno e l’altra in un altro si può eliminare ogni effetto temporale, cioè l’effetto del modo differente in cui il processo funziona nei due giorni. Dunque i due giorni diventano i due blocchi del piano sperimentale. La differenza media fra le risposte nei due giorni è l’effetto del blocco. A volte è impossibile eseguire una replicazione completa del piano fattoriale sotto condizioni sperimentali omogenee. Si chiama confondi mento (confounding) una tecnica di pianificazione sperimentale per eseguire esperimenti fattoriali in blocchi, quando la dimensione del blocco è inferiore alla numerosità di una replicazione completa del piano fattoriale. La tecnica fa si che alcune interazioni siano indistinguibili o confuse con i blocchi. Illustreremo il confondi mento nel caso di piani fattoriali in blocchi, con Si consideri un piano . Supponiamo che ognuna delle = 4 prove richieda 4h di analisi di laboratorio, dunque che siano necessari due giorni per completare l’esperimento. Se i giorni sono considerati blocchi, dobbiamo assegnare due prove a ogni giorno. Consideriamo il piano illustrato in figura. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 267 Analisi Statistica del Disco di Festo Si noti che il blocco1 contiene le prove (1) e ab e che il blocco 2 contiene le prove a e b. I contrasti per stimare gli effetti di A e di B sono Si osservi che questi contrasti non sono influenzati dal bloccaggio, dato che in ciascun contrasto compaiono una prova con segno positivo e una prova con segno negativo da ciascun blocco. In altre parole, ogni differenza fra il blocco 1 e il blocco 2 si annulla algebricamente. Il contrasto per l’interazione AB è Dato che le due prove con il segno positivo, ab e (1), sono nel blocco 1, mentre le due con il segno negativo, a e b, sono nel blocco 2, gli effetti del blocco e dell’interazione AB sono identici, cioè AB è confusa con i blocchi. La ragione per cui questo si verifica è chiara dalla tabella dei segni per il piano vista in precedenza. Da questa tabella vediamo che tutte le prove che hanno segno positivo sono assegnate al blocco 1, mentre tutte quelle che hanno segno negativo sono assegnate al blocco 2. Questo schema può essere utile per confondere ogni piano in due blocchi. Come ulteriore esempio, consideriamo un piano , eseguito in due blocchi. Supponiamo di voler confondere l’interazione fra i tre fattori ABC con i blocchi. Dalla tabella dei segni, illustrata precedentemente, assegniamo le prove con un meno su ABC al blocco 1 e quelle con più su ABC al blocco 2. Il piano che ne risulta è illustrato in figura. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 268 Analisi Statistica del Disco di Festo Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 269 Analisi Statistica del Disco di Festo Parte V Controllo campionario Il controllo o l’ispezione delle materie prime, dei prodotti semilavorati o finiti è uno degli aspetti dell’assicurazione della qualità. Quando l’ispezione o il controllo ha come scopo di accettare o rifiutare il prodotto in base alla corrispondenza agli standard richiesti, il genere di procedura d’ispezione impiegato è comunemente indicato come campionamento in accettazione. Questa parte della relazione è costituita da due capitoli che hanno come argomento la definizione e l’impiego dei piani di campionamento, i vari schemi possibili e i sistemi disponibili. L’attenzione è focalizzata principalmente sui piani di campionamento lotto per lotto. Il concetto che soggiace all’impiego e alla progettazione dei piani di campionamento in accettazione è che essi non si sostituiscono al controllo del processo di produzione. Infatti, riteniamo che un uso adeguato delle tecniche di controllo di processo allo stadio iniziale del processo di produzione, comprendenti l’implementazione di opportuni controlli statistici anche a livello dei fornitori, possa ridurre drasticamente, e talvolta eliminare, l’esigenza di ispezioni campionarie molto costose. 10 – Piani di campionamento per attributi lotto per lotto Sommario Questo capitolo presenta i piani di campionamento d’accettazione per attributi lotto per lotto. Gli argomenti principali comprendono il progetto e la predisposizione di singoli piani di campionamento, l’utilizzazione della curva operativa caratteristica, e i concetti di ispezione e rettifica, di qualità media risultante e di numerosità media totale. Analoghi concetti vengono introdotti brevemente per tipi di piani di campionamento in cui si può considerare più di un campione per determinare l’accettabilità di un lotto (campionamento doppio, multiplo e sequenziale). Vengono inoltre presentati due sistemi di piani di campionamento standard: i piani di campionamento noti come MIL STD 105E e i piani Dodge-Romig. Tali piani sono progettati secondo filosofie differenti: i piani MIL STD 105E sono focalizzati sul livello di qualità accettabile, mentre i piani Dodge-Romig sono orientati sia all’accertamento della percentuale di elementi difettosi del lotto sia alla valutazione della qualità media del lotto in uscita. 10.1 Il problema del campionamento in accettazione Come è stato osservato nel capitolo 1, il campionamento in accettazione si collega all’ispezione e alla presa di decisione in merito ai prodotti, uno degli aspetti più antichi dell’assicurazione della qualità. Negli anni trenta e quaranta , il campionamento in accettazione fu uno degli elementi principali nel campo del controllo statistico della qualità. In anni più recenti, è diventato usuale lavorare con i fornitori per aumentare le prestazioni del prodotto, utilizzando lo SPC e la programmazione degli esperimenti, così da non essere Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 270 Analisi Statistica del Disco di Festo dipendenti dal campionamento in accettazione come strumento primario dell’assicurazione della qualità. Quella che segue è una tipica applicazione del campionamento in accettazione. Una ditta riceve un approvvigionamento di prodotti da un fornitore. Tali prodotti sono spesso dei componenti o dei materiali grezzi utilizzato nel processo di lavorazione dell’azienda. dal lotto viene preso un campione, e vengono valutate alcune caratteristiche di qualità delle unità comprese in esso. Sulla base delle informazioni ottenute da questo campione, si prende una decisione relativamente alla qualità del lotto. Di solito, questa decisione è di accettare o di rifiutare il lotto. I lotti accettati vengono messi in produzione; i lotti rifiutati possono venire rinviati al fornitore oppure essere sottoposti ad alcune altre azioni di accertamento. Mentre si è soliti considerare il campionamento in accettazione come un’attività d’ispezione nel momento di ricevimento, ci sono altri modi d’impiego dei metodi di campionamento. Ad esempio, sovente un produttore intende campionare e ispezionare il proprio prodotto nelle diverse fasi di produzione. I lotti che così accettati sono inviati a ulteriori processi di lavorazione, mentre quelli rifiutati possono essere rilavorati o scartati. Tre aspetti del campionamento sono importanti: 1- Lo scopo del campionamento in accettazione è di saggiare i lotti, non di stimar la qualità del lotto. La maggior parte dei piani di campionamento in accettazione non viene progettata per scopi di stima. 2- I piani di campionamento in accettazione non forniscono alcuna forma diretta di controllo della qualità. Il campionamento in accettazione semplice accetta o rifiuta i lotti. Perfino qualora i lotti siano della medesima qualità, il campionamento ne accetterà alcuni e ne rifiuterà altri, pur non essendo i lotti accettati migliori di quelli rifiutati. Il controllo di processo è utilizzato per controllare e migliorare sistematicamente la qualità, mentre non lo è il campionamento in accettazione. 3- L’uso principale del campionamento in accettazione è di “valutare la qualità nel prodotto”, ma, quasi fosse uno strumento di certificazione, di assicurare che il risultato di un processo sia conforme ai requisiti richiesti. Generalmente ci sono tre modi di intraprendere l’accertamento del lotto: 1) accettazione senza ispezione; 2) ispezione del 100% del lotto, ossia ispezione di ogni unità del lotto, eliminando tutte le unità difettose trovate; campionamento in accettazione. L’assenza di qualsiasi ispezione è utile in quelle situazioni in cui il processo produttivo del fornitore è talmente buono che non sono state quasi mai riscontrate unità difettose oppure quando non vi è una giustificazione economica per ricercare unità difettose. Di solito si usa l’ispezione al 100% nei casi in cui il prodotto è estremamente critico e accettare anche una sola unità difettosa si tradurrebbe in un inaccettabile costo elevato per guasti che si presentano nelle fasi di produzione successive, ovvero quando la capacità di processo produttivo del fornitore è inadeguata a rispettare le specifiche richieste. Il campionamento in accettazione è verosimilmente più utile nelle situazioni seguenti: 1. quando la verifica è distruttiva; 2. quando il costo dell’ispezione 100% è estremamente elevato; 3. quando l’ispezione 100% non è tecnicamente attuabile o richiederebbe così tanto tempo che la programmazione della produzione ne risentirebbe seriamente; 4. quando vi siano molte unità da ispezionare e il tasso di errore ispettivo sia sufficientemente alto per cui l’ispezione 100% potrebbe dare luogo all’accettazione di una percentuale di unità difettose più elevata di quanto accadrebbe utilizzando un piano campionario; Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 271 Analisi Statistica del Disco di Festo 5. quando il fornitore ha un’eccellente immagine di qualità, e si preferisce ridurre alquanto l’ispezione 100%, ma la sua capacità di processo produttivo è sufficientemente bassa da rendere l’assenza d’ispezione un’alternativa non soddisfacente; 6. quando vi sono potenzialmente seri rischi di responsabilità produttiva e pertanto, benché il processo produttivo del fornitore sia soddisfacente, si ritenga necessario un programma di continua osservazione del prodotto. 10.1.1 Vantaggi e svantaggi del campionamento Quando il campionamento in accettazione è posto a confronto con l’ispezione 100%, presenta i seguenti vantaggi; 1. 2. 3. 4. 5. 6. è sovente meno costoso perché ci sono meno ispezioni; c’è meno maneggiamento del prodotto, quindi i danneggiamenti sono ridotti; si può applicare nei casi di verifica distruttiva; un minor numero di persone è coinvolto nelle attività ispettive; speso riduce la numerosità degli errori dell’ispezione; il rifiuto di interi lotti invece del semplice rinvio dei pezzi difettosi spesso induce una motivazione più forte nel fornitore a migliorare la qualità. Il campionamento in accettazione ha anche, tuttavia, taluni svantaggi, tra i quali vi sono i seguenti: 1. vi è il rischi di accettare lotti “cattivi” e di rifiutare lotti “buoni”; 2. si ottengono in generalmente meno informazioni circa il prodotto o il processo di lavorazione del prodotto; 3. il campionamento in accettazione richiede, al contrario dell’ispezione 100%, una pianificazione e una documentazione della procedura di campionamento. Abbiamo indicato il campionamento in accettazione come “un territorio intermedio” tra i due estremi dell’ispezione 100% e della non ispezione. Esso fornisce spesso una metodologia per orientarsi tra questi due estremi, dato che si ottiene un grado sufficiente d’informazione sul controllo del processo produttivo. Mentre non vi è un controllo diretto della qualità nell’applicazione di un piano di campionamento in accettazione a un lotto isolato, quando tale piano viene applicato a una seri di lotti da parte del fornitore diventa un mezzo per ottenere una protezione sia per il produttore del lotto sia per il consumatore. Inoltre, esso fornisce un insieme di informazioni sulla qualità riguardanti il processo che produce il lotto, e può produrre una retroazione utile nel controllo del processo, tale da essere determinante qualora i controlli del processo nell’azienda del fornitore non siano adeguati. Infine, può costituire una pressione economica o psicologica nei confronti del fornitore per migliorare il processo produttivo. 10.1.2 Tipi di piani di campionamento Ci sono numerosi modi per classificare i piani di campionamento in accettazione. Una delle classificazioni più invalse è quella per attributi e per variabili. Le variabili, ovviamente, sono le caratteristiche della qualità che vengono misurate con una scala numerica. Gli attributi Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 272 Analisi Statistica del Disco di Festo sono le caratteristiche della qualità che vengono espresse sulla base della presenza/non presenza di “difettosità”. Questo capitolo riguarda i piani di campionamento in accettazione lotto per lotto per attributi. Un piano di campionamento semplice è una procedura d’indagine di un lotto in cui è selezionato in modo casuale dal lotto un campione di n unità, e la condizione del lotto viene determinata sulla base dell’informazione contenuta in tale campione. Ad esempio, un piano di campionamento semplice per attributi consisterebbe in una “numerosità” di campionamento n e in un numero di accettazione c. La procedura sarebbe la seguente: selezionate n unità a caso dal lotto, se vi è un numero di difettosi nel campione minore o uguale a c, si accetta il lotto; se ve ne è un numero maggiore di c, il lotto viene rifiutato. Un piano di campionamento doppio è più complesso. Dopo aver selezionato un campione iniziale, viene presa una decisione alternativa, basata sulle informazioni ricavate da tale campione, che consiste in: 1) accettare il lotto, 2) rifiutare il lotto, 3) prelevare un secondo campione. Se viene prelevato un secondo campione, le informazioni derivanti sia dal primo che dal secondo campione vengono combinate allo scopo di raggiungere una decisione sull’accettazione o sul rifiuto del lotto. Un piano di campionamento multiplo è una estensione del concetto di piano di campionamento doppio, in cui si possono richiedere più di due campioni per ottenere la decisione relativa alla situazione del lotto. La numerosità nel campione multiplo è solitamente più ridotta rispetto sia a quella del campionamento semplice sia a quella del campionamento doppio. La massima estensione del campionamento multiplo è il campionamento sequenziale, in cui le unità sono prelevate dal lotto una alla volta, e in seguito all’ispezione di ciascuna unità, viene presa una decisione sull’accettazione o il rifiuto del lotto, ovvero sul prelevamento di un’altra unità. 10.1.3 La formazione del lotto Il modo in cui il lotto è costituito può influenzare l’efficacia del piano di campionamento in accettazione. Vi sono numerose importanti considerazioni relative alla formazione del lotto per l’ispezione. Alcune di queste sono le seguenti. 1. I lotti devono essere omogenei. Le unità del lotto dovrebbero essere prodotte dalle stesse macchine, gli stessi operatori e con materiali grezzi uguali, approssimativamente nello stesso periodo di tempo. Quando i lotti non sono omogenei, come quando vengono mischiate le produzioni di due differenti linee produttive, lo schema di campionamento in accettazione può non funzionare come di fatto dovrebbe. Lotti non omogenei rendono anche più difficile effettuare azioni correttive per eliminare la fonte di prodotti difettosi. 2. Loti più grandi sono preferibili rispetto ai lotti più piccoli. E’ in genere economicamente più efficace ispezionare grandi lotti piuttosto che piccoli lotti. 3. I lotti dovrebbero essere conformi al sistema di trattamento dei materiali utilizzato dalle fabbriche sia del fornitore sia dell’acquirente. In aggiunta, le unità dei lotti dovrebbero essere confezionate in modo tale da minimizzare i rischi di trasporto e di trattamento e da rendere relativamente facile la selezione delle unità per il campionamento. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 273 Analisi Statistica del Disco di Festo 10.1.4 Il campionamento casuale Le unità selezionate dal lotto per l’ispezione dovrebbero essere scelta a caso e dovrebbero essere rappresentative di tutti gli elementi del lotto. Il concetto ci campionamento casuale è estremamente importante nel campionamento in accettazione. La tecnica spesso suggerisce, per progettare un campionamento casuale, di assegnare in primo luogo un numero a ciascuna unità del lotto, poi di individuare n numeri casuali, dove n può andare da 1 al numero massimo di unità presenti nel lotto. Questa sequenza di numeri casuali determina quali unità del lotto costituiranno il campione. Non si può prescindere dall’importanza del campionamento casuale. Se vengono utilizzati metodi che non rispettano le condizioni di casualità per la scelta del campione vengono meno le basi statistiche della procedura di campionamento in accettazione. 10.2 Piani di campionamento semplice per attributi 10.2.1 Definizione di un piano di campionamento semplice Si supponga che un lotto di dimensione N sia sottoposto a ispezione. Un piano di campionamento semplice viene definito mediante la numerosità n del campione e il numero di accettazione c. Pertanto, se la dimensione del lotto è N = 10000, il piano di campionamento Indicherà che da un lotto di dimensione 10000 è stato ispezionato un campione casuale di n= 89 unità e il numero di elementi non conformi o difettosi osservati è d. Se il numero di elementi difettosi d è minore o uguale a c = 2, il lotto sarà accettato. Se il numero di elementi difettosi osservati è maggiore di 2, il lotto sarà rifiutato. Dal momento che la caratteristica ispezionata è un attributo, ciascuna unità del campione può essere valutata come conforme o non conforme. Una o più tipi di attributo possono essere ispezionati nel medesimo campione; in generale, si definisce unità difettosa l’unità che non è conforme alle specifiche di uno o più attributi. Questa procedura è chiamata piano di campionamento semplice poiché il lotto è valutato sulla base dell’informazione ricavata da un solo campione di dimensione n. 10.3 Piani di campionamento doppio, multiplo e sequenziale 10.3.1 Piani di campionamento doppio Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 274 Analisi Statistica del Disco di Festo Un piano di campionamento doppio è una procedura in cui, in talune situazioni, è richiesto un secondo campione per valutare il lotto. Un piano di campionamento doppio è definito mediante quattro parametri Come esemplificazione, si supponga , , e . Pertanto, un campione casuale di elementi viene estratto dal lotto e viene osservato un numero di elementi difettosi presenti nel campione. Se il lotto viene accettato dopo il primo campionamento. Se , verrà estratto dal lotto un secondo campione casuale di dimensione e verrà osservato il numero di elementi difettosi in tale secondo campione, . Se il lotto è accettato. Invece, se il lotto è rifiutato. La procedura di questo piano di campionamento è presentata graficamente nella figura. 10.3.2 Piani di campionamento multiplo Un piano di campionamento multiplo è un’estensione del piano di campionamento doppio nel quale possono essere richiesti più di due campioni per decidere sul lotto. Un esempio di piano di campionamento multiplo viene fornito da un piano che richiede cinque stadi, come illustrato di seguito. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 275 Analisi Statistica del Disco di Festo Dim. cumulativa del Campione Numero di accettazione Numero di Rifiuto 20 0 3 40 1 4 60 3 5 80 5 7 100 8 9 Questo piano opera nel modo seguente. Se al completamento di ciascuna fase di campionamento il numero degli elementi difettosi è minore o uguale al numero di accettazione il lotto viene accettato. Se, nel corso di ogni fase, il numero di elementi difettosi è uguale o supera quello di rifiuto il lotto viene rifiutato; altrimenti si prende un altro campione. Questa procedura multipla continua fino a che viene prelevato il quinto campione; in quel momento deve essere presa una decisione in merito al lotto. Il primo campione di solito viene ispezionato al 100%, mentre i successivi campionamenti sono di solito soggetti a procedura abbreviativa. Il vantaggio principale dei piani di campionamento multiplo consiste nel fatto che i campioni richiesti a ogni stadio sono solitamente più piccoli rispetto a quelli richiesti dal campionamento semplice o doppio; pertanto, questa procedura comporta taluni vantaggi economici. Tuttavia il campionamento multiplo è molto più complesso da impiegare. 10.3.3 Piani di campionamento sequenziale Il campionamento sequenziale è un’estensione del concetto di campionamento doppio e multiplo. Nel campionamento sequenziale prendiamo una successione di campioni dal lotto e facciamo sì che il numero di campioni sia interamente determinato dai risultati del processo di campionamento. Il campionamento sequenziale può in via teorica continuare indefinitamente, finché il lotto non venga ispezionato al 100%. Nella pratica, i piani sequenziali di campionamento vengono solitamente interrotti quando il numero delle ispezioni è uguale a tre volte il numero delle ispezioni che si sarebbero dovute effettuare utilizzando un corrispondente piano di campionamento semplice. Se la dimensione del campione ispezionato a ogni fase è uguale a 1, la procedura è solitamente detta campionamento sequenziale unitario. 10.4 La normativa MIL STD 105E (ANSI/ASQC Z1.4, ISO2859) 10.4.1 Descrizione della normativa Le procedure di campionamento mediante piani standard per l’ispezione per attributi vennero sviluppate durante la Seconda Guerra Mondiale. La normativa MIL STD 105E è il sistema di piani di accettazione per attributi più ampiamente usato oggi nel mondo. La versione originale delle tavole di campionamento standard MIL STD 105A fu predisposta Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 276 Analisi Statistica del Disco di Festo nel 1950. Da allora sono state fatte quattro revisioni; l’ultima versione, la MIL STD 105E, è stata predisposta nel 1989. I piani di campionamento esaminati nei paragrafi precedenti sono piani di campionamento a sé stanti. Uno schema di campionamento è una strategia complessiva che specifica il modo in cui i piani di campionamento devono essere utilizzati. La normativa MIL STD 105E è una collezione di schemi di campionamento, pertanto è un sistema di accettazione campionaria. La nostra indagine si concentra in primo luogo sulla MIL STD 105E, tuttavia esistono tavole di campionamento per usi civili derivate da questa, costituenti la normativa ANSI/ASQC Z1.4, che è del tutto simile. Le tavole di campionamento standard sono state adottate anche dalla International Organization for Standardization come ISO 2859. Le tavole di campionamento standard forniscono tre tipi di campionamento: semplice, doppio e multiplo. Per ciascun tipo di piano di campionamento viene fornito materiale sia per l’ispezione normale, sia per quella rinforzata, sia per quella ridota. L’ispezione normale è impiegata all’inizio dell’attività ispettiva. Quella rinforzata viene intrapresa quando la casistica recente della qualità del fornitore presenta elementi negativi. I requisiti ispettivi per i lotti nel caso di tale ispezione sono più ristrettivi rispetto a quelli dell’ispezione normale. L’ispezione ridotta viene adottata quando la casistica recente della qualità del fornitore è stata eccezionalmente buona. La dimensione del campionamento usata generalmente nel caso di ispezione ridotta è inferiore a quella utilizzata per l’ispezione normale. Il primo punto fondamentale della MIL STD 105E è il livello di qualità accettabile (AQL). La tavola di campionamento standard è indicizzata con riferimento a una serie di AQL. Quando tali tavole sono utilizzate per la verifica della percentuale degli elementi difettosi, l’ampiezza del’AQL va dallo 0.10% al 10%. Per la verifica del numero di difetti per unità, vi è un’aggiunta di dieci valori di AQL sino a comprendere fino a 1000 difetti per 100 unità. Si deve notare che livelli minori di AQL lo stesso piano di campionamento può essere usato per controllare sia la frazione di elementi difettosi sia il numero di difetti per unità. I livelli AQL sono collocati in progressione, e ciascun livello è pari a, approssimativamente, 1.585, volte il precedente. La dimensione del campione usata nelle MIL STD 105E è determinata dalla dimensione del lotto e dalla scelta del livello d’ispezione. Vengono forniti tre livelli generali d’ispezione. Il livello II è indicato come normale. Il livello I richiede circa la metà dell’ammontare delle ispezioni del livello II e può essere usato quando si necessita di una minore discriminazione. Il livello III richiede circa il doppio delle ispezioni del livello II e dovrebbe essere utilizzato quando si esige maggiore discriminazione. Le procedure di passaggio tra ispezione normale, rinforzata e ridotta sono descritte nel seguente modo. 1. 2. 3. 4. 5. Da normale a rinforzata. Da rinforzata a normale Da normale a ridotta Da ridotta a normale Discontinuità dell’ispezione. 10.4.2 Procedura Una procedura passo a passo per utilizzare le MIL STD 105E è la seguente: 1. scegliere l’AQL; Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 277 Analisi Statistica del Disco di Festo 2. scegliere il livello d’ispezione; 3. determinate la dimensione del lotto 4. trovare la lettera di codice appropriata per la dimensione del campione nell’apposita tabella; 5. determinare il tipo appropriato di piano di campionamento (semplice, doppio, multiplo), 6. utilizzare la tabella appropriata per individuare il piano da impiegare; 7. determinare il corrispondente piano normale o ridotto per l’ispezione da usare quando sia richiesto. 11 – Altre tecniche di campionamento in accettazione Sommario Questo capitolo presenta in maniera sintetica alcune utili tecniche di campionamento in accettazione, compresi i piani di campionamento per variabili, che possono essere impiegati in alternativa ai piani per attributi quando sono disponibili i dati di misurazione. 11.1 Campionamento in accettazione per variabili 11.1.1 Vantaggi e svantaggi del campionamento per variabili Il principale vantaggio dei piani di campionamento per variabili consiste nel fatto che la stessa curva operativa caratteristica può essere ottenuta con una dimensione del campione più ridotta rispetto a quello che sarebbe richiesto da un piano di campionamento per attributi. Quindi un piano di campionamento per variabili che abbia la stessa protezione di un piano di campionamento per attributi richiede un campionamento minore. Un secondo vantaggio è che i dati di misurazione di solito forniscono una maggiore informazione sul processo di lavorazione o sul lotto rispetto ai dati per attributi. In generale, le misure numeriche delle caratteristiche di qualità sono più utili della semplice classificazione degli elementi difettosi e non difettosi. Va sottolineato poi, un ultimo aspetto: quando i livelli di qualità accettabili sono molto bassi, la dimensione del campione richiesta dal campionamento per attributi è molto grande. In queste situazioni può essere opportuno rivolgersi alla misurazione per variabili. Pertanto, siccome molti produttori iniziano a sottolineare l’importanza di avere numeri consentiti di elementi difettosi in termini di parti per milione, il campionamento per variabili diventa molto vantaggioso. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 278 Analisi Statistica del Disco di Festo 11.1.2 Tipi di piani di campionamento disponibili Ci sono due tipi generali di procedure di campionamento per variabili: piani che controllano la frazione di elementi difettosi (o non conformi) del lotto o del processo, e piani che controllano i parametri (generalmente la media) del lotto o del processo. Si consideri un piano di campionamento per variabili per il controllo della frazione di elementi non conformi del lotto o del processo. Poiché la caratteristica di qualità è una variabile, ci saranno o un limite di specificazione inferiore (LSL), o un limite di specificazione superore (USL), oppure entrambi, limiti che definiscono i valori accettabili di questo parametro. La figura illustra la situazione in cui la caratteristica di qualità x è normalmente distribuita e su tale grandezza vi è un limite di specificazione inferiore. Il simbolo p indica la frazione di elementi difettosi nel lotto. Si osservi che la frazione di elementi difettosi è funzione della media μ del lotto o del processo e della deviazione standard σ del lotto o del processo. Si supponga che la deviazione standard σ sia nota. Sotto questa condizione, si vuole eseguire un campionamento del lotto per determinare quale valore debba assumere la media affinché la frazione di elementi difettosi p sia accettabile. Come indicato di seguito, si può procedere al calcolo mediante un piano di campionamento per variabili in due modi. Procedura 1 (metodo k). Si consideri un campione casuale di n elementi estratto da un lotto e si calcoli la statistica Si osservi che nell’equazione esprime proprio la distanza tra la media del campione e il limite inferiore di specificazione in unità di deviazione standard. Quanto più elevato è il valore di , tanto più la media del campione dista dal limite inferiore di specificazione e tanto minore è la frazione p di elementi difettosi. Se vi è un valore critico di p di interesse che non deve essere superato , con una probabilità stabilita, si può trasformare questo valore di p nella distanza critica, indicata con k, per Pertanto, se , dovremo accettare il lotto poiché i dati del campione implicano che la media del loto è sufficientemente al di sopra del LSL per assicurare che la frazione di elementi non conformi presenti nel lotto è soddisfacente. Se, invece, , la media è troppo vicina al LSL e il lotto dovrebbe essere rifiutato. Procedura 2 (metodo M). Si consideri un campione casuale di n elementi estratto da un lotto e si calcoli mediante equazione sopra . Si utilizzi per stimare la frazione di elementi difettosi presenti nel lotto o nel processo come area sottostante alla curva normale standardizzata al di sotto di ( si osservi che l’impiego di come statistica , con distribuzione normale standardizzata, è migliore, poiché fornisce una migliore stima di p). Sia la stima di p così ottenuta: se la stima di è superiore Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 279 Analisi Statistica del Disco di Festo rispetto al valore massimo specificato M, il lotto viene rifiutato; altrimenti viene accettato. 11.2 La normativa MIL ST 414 (ANSI/ASQC Z1.9) La normativa MIL STD 414 è un piano campionario di accettazione loto per lotto per variabili. Questa normativa è stata introdotta nel 1957. Il suo punto centrale è il livello di qualità accettabile (AQL), che varia tra 0.04% e il 15%. Ci sono cinque livelli d’ispezione e il livello IV è definito come quello “normale”. Il livello d’ispezione V offre una curva OC calcolata per un numero di punti maggiore rispetto a quello al livello IV. Quando è necessario ridurre i costi di campionamento e quando si possono o si devono tollerare maggiori rischi, si possono utilizzare livelli ispettivi inferiori. Come per la MIL STD 105E per attributi, vengono usate lettere di codice per la dimensione campionaria, ma la stessa lettera non implica stessa dimensione nelle due normative. In più, le classi di dimensione del lotto sono diverse nelle due normative. Le dimensioni campionarie sono in funzione della dimensione del lotto e del livello d’ispezione. Sono fornite indicazioni per l’ispezione normale, rinforzata e ridotta. Sia i piani di campionamento sia le procedure nelle tavole di campionamento della normativa si basano sul presupposto che la caratteristica di qualità d’interesse sia distribuita normalmente. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 280 Analisi Statistica del Disco di Festo BIBLIOGRAFIA DI RIFERIMENTO Matematica applicata e statistica 1. 2. 3. 4. Cunietti M. (1964): Corso Teorico Pratico sulle Misure. Libreria Cortina Ed., Milano. Frosini B.V. (1990): Introduzione alla statistica. La Nuova Italia Scientifica, Roma. Montgomery D.C. (2000): Controllo statistico della qualità. McGraw-Hill, Milano. Mood A.M., Graybill F.A., Boes D.C. (1988): Introduzione alla statistica. McGrawHill, Milano. 5. Ricci F. (1975): Statistica ed elaborazione statistica delle informazioni. Zanichelli, Bologna. 6. Togliatti G. (1976): Fondamenti di statistica. Hoepli, Milano. Linguistica e filologia 7. Akmajian A, Demers R.A., Farmer A.K., Harnish R.M. (1982): Linguistica. Il Mulino, Bologna. 8. Canepari L. (1979): Introduzione alla fonetica. Piccola Biblioteca Einaudi, Torino. 9. Chomsky N., Foucault M. (2005): Della natura umana – Invariante biologico e potere politico. Derive Approdi, Roma. 10. Giacalone Ramat A., Ramat P. (1993): Le lingue indoeuropee. Il Mulino, Bologna. 11. Martinet A. (1994): L’indoeuropeo – Lingue, popoli e culture. Biblioteca Universale Laterza, Bari. 12. Moro A. (2006): I confini di Babele. Longanesi&C., Milano 13. Zambponi A. (1976): L’etimologia. Zanichelli, Bologna. Archeologia e storia antica 14. Bara B.G. (2003): Il sogno della permanenza – L’evoluzione della scrittura e del numero. Bollati Boringhieri, Torino. 15. Barberi Squarotti G. (1990): I mondi impossibili: l’utopia. Collana: L’avventura letteraria. Teoria e storia dei generi letterari. Tirrenia Stampatori, Torino. 16. Diamond J. (1998): Armi, acciaio e malattie – Breve storia del mondo negli ultimi tredicimila anni. Einaudi Tascabili, Torino. 17. Giorello G. (2004): Prometeo, Ulisse, Gigamesh. R. Cortina Ed., Milano. 18. Godart L. (1992): L’invenzione della scrittura – Dal Nilo alla Grecia. Einaudi Tascabili, Torino. 19. Vegetti M. (1979 / 1987): Il coltello e lo stilo. Arnoldo Mondatori Editore – Il Saggiatore, Milano. 20. Vegetti M. (1983): Tra Edipo e Euclide – Forme del sapere antico. Arnoldo Mondatori Editore – Il Saggiatore, Milano. Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 281 Analisi Statistica del Disco di Festo Disco di Festo 21. Balistier T. (2000): The Phaistos Disc - an account of its unsolved mystery, Thomas Balistier Verlag 22. Bennett, Emmett L. (1996): Alfabeti egei, (in: I sistemi di scrittura nel mondo, Peter T. Daniels e William Bright (Editori.) Oxford: University Press. 23. Chadwick J. (1958): The Decipherment of Linear B, Cambridge University Press 24. Duhoux Y. (1977): Le disque de Phaestos, Leuven 25. Duhoux Y. (2000): Come non decifrare il disco di Festo, American Journal of Archaeology, Vol. 104, n° 3 p. 597-600 26. Evans A. J. (1909): Scripta Minoa, i documenti scritti della Creta minoica, con spciale riferimento agli archivi di Cnosso, Classic Books 27. Faure P. (2003) "Tourne disque", l'enigma del disco di Festo, Notre Histoire n°213 28. Faucounau J.(1999): Le déchiffrement du Disque de Phaistos, L'Harmattan, Paris 29. Gaur A. (1984): Una storia di scrittura, Charles Scribner's Sons. 30. Glotz G., Dobie M. R., Riley E. M. (1925): La Civiltà Egea, A. A. Knopf 31. Godart L.(1994): Il disco di Festo. L'enigma di una scrittura, Einaudi, Saggi, Torino 32. Kober A. (1948): Gli alfabeti minoici: fatti e teorie. American Journal of Archaeology, Volume 52, pp. 82 – 103. 33. Madau E.G. (2007): "Il disco di Phaistos- un nuovo approccio e una sua traduzione" Zonza Editori 34. Robinson A. (2008): The Phaistos code: Write only . Nature: 990–991. 35. Sornig K. (2006): L'ultima valutazione . Grazer Linguistische Studien: 151–155. 36. Torsten T.(2005): Der Diskos von Phaistos – Fremdeinfluss oder kretisches Erbe, BoD 37. Trauth M.(1990): Il disco di Festo e l'avvocato del diavolo. Sulle teorie di un antico argomento di ricerca., Glottometrika 12, pp. 151 – 173. 38. International Phaistos Disk Conference 2008, sponsorizzata da Minerva Magazine abstracts Politecnico di Milano Dottorato di ricerca in Geomatica e Infrastrutture 282