Introduzione Concetti base Distribuzioni statistiche Concetti base - Classificazione dei caratteri Antonello Maruotti . A. Maruotti . . . . . Outline 1 Introduzione 2 Concetti base 3 Distribuzioni statistiche . . . . . . Introduzione Concetti base Distribuzioni statistiche La Statistica Una citazione: Giuseppe Leti La mente umana non sa sintetizzare numericamente i risultati di un elevato numero di osservazioni di fatti che invece percepisce singolarmente Cosa è la statistica? Strumento conoscitivo atto ad analizzare in termini quantitativi un fenomeno collettivo . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche La Statistica Statistica descrittiva: Insieme di metodologie atte a descrivere, riassumere le caratteristiche della distribuzione di una o più variabili statistiche. L’obiettivo viene perseguito rilevando le variabili (o caratteri) di interesse su di un collettivo (popolazione). Statistica inferenziale: Ha gli stessi obiettivi della statistica descrittiva, ma tenta di perseguirli rilevando solo una parte della popolazione. La parte (campione) viene scelta casualmente. Questo implica (vantaggio) l’uso dello strumento matematico del calcolo delle probabilità . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Terminologia essenziale Unità statistica: l’oggetto elementare al quale riferiamo le singole osservazioni. Collettivo o popolazione: l’insieme delle unità statistiche omogenee rispetto a una o più caratteristiche. Carattere o variabile: la caratteristica oggetto di rilevazione di ciascuna unità statistica (ad es. Titolo di Studio, Reddito, Età) Modalità del carattere: il modo con cui si presenta un carattere. Ciascun carattere è presente in ogni unità con una determinata modalità. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Classificazione dei caratteri Qualitativi: le modalità esprimono un attributo, una qualità dell’unità. Sconnessi: non esiste un ordinamento tra le modalità. Ordinati: esiste un ordine naturale tra le modalità Quantitativi: se le modalità sono numeri che esprimono una misura o una quantità. Discreti: le modalità sono quantità distinte preventivamente individuabili ed elencabili (geralmente numeri interi). Continui: le modalità possono assumere qualsiasi numero reale. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Relazioni ed operazioni tra modalità Relazioni ed operazioni tra modalità Uguaglianza/Disuguaglianza Ordinamento Addizione/Sottrazione Tipologia di caratteri Qualitativi Qualitativi Quantitativi sconnessi ordinati v v v x v v x x v . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Esempi Qualitativi sconnessi ordinati Sesso Titolo di studio Religione Grado di soddisfazione Luogo di nascita Posizione in graduatoria Quantitativi discreti continui # di figli Peso Voto ad un esame Reddito # pezzi prodotti Altezza . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Fissiamo le idee L’insieme dei dati è costituito da tutte le misurazioni effettuate su ognuna delle unità statistiche prese in esame. Ad ogni unità corrispondono le modalità per ciascuno dei caratteri osservati. Ad ogni carattere corrisponde l’insieme delle modalità osservate sul collettivo. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Distribuzioni unitarie Definizione Definiamo distributzione unitaria semplice di un carattere l’elencazione delle modalità osservate, unità per unità, nel collettivo osservato. Si parla di distribuzione unitaria multipla quando tale elencazione si riferisce a più di un carattere. Limite La distribuzione unitaria, pur descrivendo fedelmente i caratteri osservati, riportando per ogni unità le modalità dei caratteri presi in esame, non consente di cogliere in maniera sintetica le caratteristiche del fenomeno oggetto di studio. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Distribuzioni di frequenze Definizione La distributzione di frequenze semplice associa alle modalità assunte dal carattere X , qualitativo o quantitativo, le correspondenti frequenze X x1 x2 .. . Freq. Assolute n1 n2 .. . xK Totale nK n . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Frequenze relative e percentuali Definizione Date n unità statistiche di cui nk presentano la k-esima modalità, si definisce frequenza relativa k-esima il rapporto fk = nnk e frequenza percentuale il prodotto pk = nnk × 100 = fk × 100. Utili per capire l’importanza di una modalità nel collettivo ma anche per eseguire confronti tra distribuzioni relative alla stessa variabile in collettivi diversi. La somma delle frequenze relative è pari a 1. La somma delle frequenze percentuali è uguale a 100. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Rappresentare la distribuzione di frequenze X x1 x2 .. . Freq. Assolute n1 n2 .. . Freq. Relative f1 f2 .. . Freq. Percentuali p1 p2 .. . xK Totale nK n fK 1 pK 100 . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Le frequenze cumulate Definizione Data un carattere X con K modalità ordinate in senso crescente, si indica con Nk = n1 + n2 + · · · + nk la frequenza assoluta cumulata, con Fk = f1 + f2 + · · · + fk la frequenza relativa cumulata e con Pk = p1 + p2 + · · · + pk la frequenza percentuale cumulata. Utili per capirela frequenza con cui si presentano modalità di ordine inferiore o uguale ad una certa modalità. L’ultima delle frequenze assolute cumulate (NK ) è pari a n. L’ultima delle frequenze relative cumulate (FK ) è pari a 1. L’ultima delle frequenze percentuali cumulate (PK ) è pari a 100. . A. Maruotti . . . . . Introduzione Concetti base Distribuzioni statistiche Caratteri con modalità raggruppate in classi Se il carattere che si vuole analizzare presenta moltissime modalità distinte, si possono avere notevoli difficoltà nela comprensione dei dati osservati. In questi casi è conveniente procedere ad un’aggregazione delle modlità. Se il carattere è quantitativo si suddivide l’insieme delle possibili modalità in intervalli tra loro disgiunti, ottenendo una suddivisione in classi del carattere. Come definire le classi: il loro numero deve essere abbastanza piccolo da fornire una sintesi adeguata, ma sufficientemente grande, da mantenere l’informazione con un livello accetabile di dettaglio; le classi devono comprendere tutte le possibili modalità del carattere; se possibile, si costruiscano classi aventi la stessa ampiezza. . A. Maruotti . . . . .