Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012 Bruno Federico [email protected] Cattedra di Igiene - Università degli Studi di Cassino Le lezioni sono parte del corso integrato di Analisi dei dati motori e sportivi (Biostatistica e Metodi Epidemiologici). Per gli studenti LT33 l’insegnamento Biostatistica sostituisce il precedente Principi di Statistica Descrittiva Docenti Daniela Anastasi – Metodi Epidemiologici Bruno Federico – Biostatistica Lezioni Il corso (6 lezioni da 4 ore ciascuna) è articolato in lezioni frontali ed esercitazioni, che saranno svolte sia con carta e penna che al computer in aula informatica. È consigliabile portare con sé una calcolatrice Esami L’esame integrato prevede una prova scritta con domande aperte ed una orale Programma del corso Introduzione alla statistica. Statistica descrittiva. Tabelle di frequenza. Rappresentazioni grafiche dei dati. Indici di tendenza centrale, indici di variabilità. Bibliografia Fowler, Jarvis, Chevannes. STATISTICA PER LE PROFESSIONI SANITARIE. EdiSES – Napoli 2006 Pagano, Gavreau, BIOSTATISTICA, Idelson-Gnocchi, Napoli, 2003 Il materiale del corso è disponibile su www.docente.unicas.it/bruno_federico/didattica 1 Introduzione La Statistica è uno strumento essenziale per la scoperta di leggi e relazioni tra fenomeni Svolge un ruolo fondamentale nella ricerca scientifica La Statistica riguarda la raccolta, l’organizzazione, la presentazione, l’analisi e l’interpretazione dei dati numerici allo scopo di fornire un supporto per la realizzazione di decisioni più efficaci Quando l’interesse è rivolto alle scienze biologiche e mediche, si usa il termine biostatistica Alcuni esempi Trattamento dell’obesità da parte di medici di medicina generale 2 Attività fisica e mortalità 3 La match analysis È il processo di osservazione e valutazione di un insieme di comportamenti adottati dagli atleti durante una partita al fine di: 1. Raccogliere ed elaborare i dati relativi ai diversi aspetti di gioco 2. Presentare i dati a tutti gli interessati (allenatori, atleti, dirigenti, giudici, …) 3. Fornire un’interpretazione dei dati utile a definire meglio le caratteristiche specifiche della prestazione studiata 4 Origini della disciplina Il termine “statistica” deriva dalla parola “Stato” Originariamente con questo termine si indicava la raccolta dei dati demografici ed economici di interesse per gli stati Con la nascita dei grandi Stati europei, l’interesse ad approfondire i fenomeni legati alle popolazioni diventa sempre più forte Gli Stati si dotano di Istituti centrali di statistica deputati per legge alla raccolta, organizzazione e diffusione dei dati sulla popolazione, sulle abitazioni, sulle risorse economiche e su tutti gli aspetti rilevanti della vita di una Nazione In Italia, l’ente centrale è l’ISTAT (Istituto nazionale di statistica) La disciplina si è poi sviluppata in un metodo scientifico di analisi applicato alle scienze sociali, naturali, biomediche La Statistica nello Sport Una delle caratteristiche peculiari dello sport moderno è la misurazione. Punteggi, graduatorie, prestazioni degli atleti La valutazione della performance di un atleta o di una squadra può essere: Descrittiva: utile nell’elaborazione di graduatorie Predittiva: utile per valutare la probabilità di vittoria della squadra o dell’atleta Il baseball ed il basket sono esempi di discipline sportive in cui la statistica gioca un ruolo importante A partire dal 1993, la FIFA ha sviluppato un sistema di ranking delle squadre nazionali che si basa su diversi parametri (Risultato finale, Numero di goal, Se la partita è giocata in casa o fuori, L'importanza del 5 match, La forza della squadra avversaria, Le differenze geografiche tra i continenti) La Statistica nelle scienze bio-mediche Metodi statistici sono largamente utilizzati in campo bio-medico per: Valutare l’efficacia di un trattamento valutare la relazione di causalità di un fenomeno (es. le cause di una malattia) Definizioni di Statistica È una metodologia generale per lo studio dei fenomeni collettivi e della variabilità di tali fenomeni attraverso L’osservazione dei fenomeni La traduzione in simboli L’evidenza di irregolarità La verifica di ipotesi È l’insieme di principi, procedure logiche e metodi utili a comprendere, controllare e prevedere determinati fenomeni Obiettivi della statistica Descrivere i dati condensare anche un gran numero di dati rilevati in pochi valori riassuntivi, capaci di indicare importanti proprietà della popolazione o del campione oggetto di indagine Esplorare le relazioni Valutare l’esistenza e la grandezza delle relazioni tra le variabili rilevate Fare previsioni utilizzare i dati raccolti per prevedere i valori che ci si aspetta di trovare nella popolazione oggetto di indagine in particolari condizioni 6 Obiettivi della statistica - esempi Descrivere i dati Qual è il numero di vittorie della squadra? Qual è la performance dell’atleta? Esplorare le relazioni Che relazione c’è tra adiposità in eccesso, forza e velocità? Fare previsioni Qual è la probabilità di vittoria dell’atleta o della squadra note le seguenti condizioni (stato di forma, morale, forza dell’avversario, …)? Nomenclatura Popolazione: Insieme o collezione di oggetti, numeri, misure o osservazioni. Le popolazioni possono essere finite o infinite Campione: Un sottoinsieme della popolazione su cui vengono raccolti i dati Unità statistica: Minima unità da cui si raccolgono i dati in una indagine (Individuo, Famiglia, Regione, Gara) Variabile: Caratteristica che può assumere valori diversi nelle diverse unità statistiche Altezza dei bambini di una classe Peso degli atleti Tipo di sport praticato Modalità Valore assunto da una variabile in una determinata unità statistica Individuo Giorgio Mario Roberto Peso 80 kg 75 kg 77 kg 7 Natura della Statistica Statistica descrittiva: ha a che fare con la presentazione, organizzazione e sintesi dei dati Tabelle, grafici, indici di sintesi Statistica Inferenziale: ci permette di generalizzare i risultati ottenuti dai dati raccolti in un piccolo campione ad una popolazione più ampia Stima di parametri Test di ipotesi Perché studiare un campione? Risorse limitate Pochi dati disponibili Impossibilità a compiere determinati test 8 Tipo di variabili Variabile ciò che viene osservato o misurato Variabili numeriche discrete I modi di essere possibili sono limitati Variabili numeriche continue I modi di essere possibili sono infiniti Variabile categorica binomiale i valori sono due categorie distinte Variabile categorica nominale i valori sono categorie con nomi distinti, tra le quali non è possibile stabilire un criterio di ordinamento logico Variabile categorica ordinale i valori sono una serie ordinata di categorie, ma la differenza tra una categoria e la successiva non può essere considerata costante Esercitazione Di che tipo di variabili si tratta? Come è in generale la tua salute? Eccellente, molto buona, buona, così così, scadente Che tipo di attività pratichi nel tempo libero? Pratichi sport? Quanti esami hai superato finora? Qual è la tua circonferenza addominale? Qual è la tua età? 9 Dati grezzi e matrice dei dati Quando si raccolgono dati su una popolazione o un campione, i valori ottenuti si presentano all’inizio come un insieme di dati disordinati (dati grezzi) I dati vanno organizzati in righe e colonne in una matrice. La matrice dei dati però è poco informativa, a meno che il campione in esame non sia molto piccolo Ogni riga rappresenta un’unità statistica Ogni colonna rappresenta una variabile id 1 2 3 4 5 6 V1 V2 V3 V4 V5 V6 È importante avere un codice identificativo univoco per ogni osservazione (variabile id) Il codice identificativo è la “chiave” che permette di collegare le informazioni raccolte con i dati personali dell’individuo. È univoco, ovvero ne esiste solo uno per ogni soggetto Il codice identificativo deve essere inserito sia sul modulo di raccolta dati (es. sulla prima pagina del questionario) che nell’archivio dei dati Qualche consiglio utile Evitare l’inserimento di testo Per le variabili categoriche, è spesso conveniente utilizzare dei codici numerici Es. Maschio=1, Femmina=2 Questi codici vanno definiti prima dell’inserimento dei dati, attraverso una legenda 10 Un esempio di archivio di dati: Football Due identici palloni da football, uno riempito di aria ed uno di elio, sono stati utilizzati in un campo da gioco all’esterno dell’Università dell’Ohio in una giornata priva di vento. Ogni pallone è stato calciato 39 volte, alternando i due palloni. È stata misurata la distanza percorsa per ogni calcio. Variabili Trial: Trial Number Air: distance in yards for air-filled football Helium: distance in yards for helium-filled football . use football, clear . list, noobs clean trial 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 air 25 23 18 16 35 15 26 24 24 28 25 19 27 25 34 26 20 22 33 29 31 27 22 29 28 29 22 31 25 20 27 26 28 32 28 25 31 28 28 helium 25 16 25 14 23 29 25 26 22 26 12 28 28 31 22 29 23 26 35 24 31 34 39 32 14 28 30 27 33 11 26 32 30 29 30 29 29 30 26 11 Un esempio di archivio di dati: Step An experiment was conducted by students at The Ohio State University in the fall of 1993 to explore the nature of the relationship between a person's heart rate and the frequency at which that person stepped up and down on steps of various heights. The response variable, heart rate, was measured in beats per minute. There were two different step heights: 5.75 inches (coded as 0), and 11.5 inches (coded as 1). There were three rates of stepping: 14 steps/min. (coded as 0), 21 steps/min. (coded as 1), and 28 steps/min. (coded as 2). This resulted in six possible height/frequency combinations. Each subject performed the activity for three minutes. Subjects were kept on pace by the beat of an electric metronome. One experimenter counted the subject's pulse for 20 seconds before and after each trial. The subject always rested between trials until her or his heart rate returned to close to the beginning rate. Another experimenter kept track of the time spent stepping. Each subject was always measured and timed by the same pair of experimenters to reduce variability in the experiment. Each pair of experimenters was treated as a block. Variabili Order: the overall performance order of the trial Block: the subject and experimenters' block number Height: 0 if step at the low (5.75") height, 1 if at the high (11.5") height Frequency: the rate of stepping. 0 if slow (14 steps/min), 1 if medium (21 steps/min), 2 if high (28 steps/min) RestHR: the resting heart rate of the subject before a trial, in beats per minute HR: the final heart rate of the subject after a trial, in beats per minute 12 La frequenza Il concetto di frequenza è uno dei più importanti nella statistica Frequenza assoluta: conta quanto spesso si presenta un determinato valore o intervallo di valori? Frequenza relativa: proporzione quanto spesso si presenta un determinato valore o intervallo di valori, rispetto al totale delle osservazioni? Frequenza relativa = freq. assoluta/n° totale di unità statistiche Frequenza percentuale quanto spesso si presenta un determinato valore o intervallo di valori rispetto a 100 osservazioni? Frequenza percentuale = Freq relativa * 100 . sort air . list air, clean noobs air 15 16 18 19 20 20 22 22 22 23 24 24 25 25 25 25 25 26 26 26 27 27 27 28 28 28 28 28 28 29 29 29 31 31 31 32 33 34 35 In 2 calci, la distanza percorsa dal pallone riempito di aria è stata uguale a 24 yds f(24)=2 13 p(24)=2/39=0.051 %(24)=0.051*100=5.1% Frequenza cumulativa assoluta Somma delle frequenze corrispondenti alle osservazioni più piccole rispetto all’osservazione data più la frequenza dell’osservazione stessa Frequenza cumulativa relativa Proporzione delle frequenze corrispondenti alle osservazioni più piccole rispetto all’osservazione data più la frequenza dell’osservazione stessa Freq cum rel = Freq. cum ass/n° totale di unità statistiche Frequenza cumulativa percentuale Proporzione delle frequenze corrispondenti alle osservazioni più piccole rispetto all’osservazione data più la frequenza dell’osservazione stessa Freq cum perc = Freq cum rel * 100 In 12 calci, la distanza percorsa dal pallone riempito di aria è inferiore o uguale a 24 yds fc(24)=12 pc(24)=12/39=0.307 %c(24)=0.307*100=30.7% 14 Tabelle di frequenza L’elaborazione di tabelle di frequenza è fondamentale per comprendere come si presentano le variabili prese in esame Le Tabelle di frequenza presentano i dati in forma sintetica, organizzati secondo righe e colonne Sono utili per ogni tipo di variabili, sia per quelle categoriche che per quelle numeriche Tabelle a singola entrata è presentata la distribuzione di frequenza di UN SOLO carattere statistico Tabelle a doppia entrata è presentata la distribuzione di frequenza di DUE caratteri statistici Tabelle a n entrate è presentata la distribuzione di frequenza di n caratteri statistici Nel caso di variabili categoriche (binomiali, nominali ed ordinali) vengono rappresentate tutte le modalità possibili e la frequenza di ciascuna modalità Nel caso di variabili numeriche (discrete e continue) i valori sono aggregati per classi. Per ciascuna classe (intervallo) di valori è rappresentata la frequenza 15 . use infortuni_sport, clear . li soggetto-infortuni, clean noobs soggetto AA BB CC DD EE FF GG HH LL MM NN PP QQ RR SS TT VV ZZ peso 63 75 65 75 75 80 70 65 79 80 73 66 65 70 60 77 74 75 altezza 170 180 170 175 170 185 170 165 180 175 173 163 170 178 172 177 169 181 sport Basket Basket Basket Nuoto Atletica Basket Atletica Pallavolo Nuoto Basket Basket Nuoto Pallavolo Pallavolo Atletica Basket Pallavolo Atletica infort~i 3 2 1 0 0 3 0 2 2 0 0 0 3 2 1 1 1 2 Tabelle a singola entrata . tab sport Sport | Freq. Percent Cum. ------------+----------------------------------Atletica | 4 22.22 22.22 Basket | 7 38.89 61.11 Nuoto | 3 16.67 77.78 Pallavolo | 4 22.22 100.00 ------------+----------------------------------Total | 18 100.00 . tab infortuni N° di | infortuni | Freq. Percent Cum. ------------+----------------------------------0 | 6 33.33 33.33 1 | 4 22.22 55.56 2 | 5 27.78 83.33 3 | 3 16.67 100.00 ------------+----------------------------------Total | 18 100.00 . tab altezzacat altezza | Freq. Percent Cum. ------------+----------------------------------<170 cm | 3 16.67 16.67 170-174 cm | 7 38.89 55.56 175-179 cm | 4 22.22 77.78 >=180 cm | 4 22.22 100.00 ------------+----------------------------------Total | 18 100.00 16 Tabelle a doppia entrata . tab sport dueinfortuni | N° infortuni Sport | meno di 2 2 o più | Total -----------+----------------------+---------Atletica | 3 1 | 4 Basket | 4 3 | 7 Nuoto | 2 1 | 3 Pallavolo | 1 3 | 4 -----------+----------------------+---------Total | 10 8 | 18 . tab sport dueinfortuni, row +----------------+ | Key | |----------------| | frequency | | row percentage | +----------------+ | N° infortuni Sport | meno di 2 2 o più | Total -----------+----------------------+---------Atletica | 3 1 | 4 | 75.00 25.00 | 100.00 -----------+----------------------+---------Basket | 4 3 | 7 | 57.14 42.86 | 100.00 -----------+----------------------+---------Nuoto | 2 1 | 3 | 66.67 33.33 | 100.00 -----------+----------------------+---------Pallavolo | 1 3 | 4 | 25.00 75.00 | 100.00 -----------+----------------------+---------Total | 10 8 | 18 | 55.56 44.44 | 100.00 17 Attività fisica e mortalità – follow-up dell’indagine ISTAT sulla salute del 2000 . tab1 sex eta3 edu4 region smokeint poorhealth bmicat pa dead -> tabulation of sex sex | Freq. Percent Cum. ------------+----------------------------------male | 35,394 48.64 48.64 female | 37,368 51.36 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of eta3 eta3 | Freq. Percent Cum. ------------+----------------------------------30-44 | 27,903 38.35 38.35 45-59 | 24,371 33.49 71.84 60-74 | 20,488 28.16 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of edu4 edu4 | Freq. Percent Cum. ------------+----------------------------------high | 5,503 7.56 7.56 midhigh | 19,313 26.54 34.11 midlow | 20,927 28.76 62.87 low | 27,019 37.13 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of region region | Freq. Percent Cum. ------------+----------------------------------north | 28,053 38.55 38.55 centre | 13,744 18.89 57.44 south | 30,965 42.56 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of smokeint smokeint | Freq. Percent Cum. ----------------+----------------------------------never | 41,371 56.86 56.86 quit>9yrs | 8,263 11.36 68.21 quit2-9yrs | 3,824 5.26 73.47 current<=15 cig | 10,015 13.76 87.23 current>15 cig | 9,289 12.77 100.00 ----------------+----------------------------------Total | 72,762 100.00 18 -> tabulation of poorhealth poorhealth | Freq. Percent Cum. ------------+----------------------------------fair/good | 67,067 92.17 92.17 poor | 5,695 7.83 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of bmicat bmicat | Freq. Percent Cum. ------------+----------------------------------underweight | 2,121 2.91 2.91 normal | 34,914 47.98 50.90 overweight | 27,552 37.87 88.76 obese | 8,175 11.24 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of pa pa | Freq. Percent Cum. ------------+----------------------------------vigorous | 6,485 8.91 8.91 regular | 11,477 15.77 24.69 light | 31,762 43.65 68.34 inactive | 23,038 31.66 100.00 ------------+----------------------------------Total | 72,762 100.00 -> tabulation of dead dead | Freq. Percent Cum. ------------+----------------------------------0 | 68,670 94.38 94.38 1 | 4,092 5.62 100.00 ------------+----------------------------------Total | 72,762 100.00 Quali sono i fattori associati ad una più alta mortalità? . tab sex dead, row nokey | dead sex | 0 1 | Total -----------+----------------------+---------male | 32,863 2,531 | 35,394 | 92.85 7.15 | 100.00 -----------+----------------------+---------female | 35,807 1,561 | 37,368 | 95.82 4.18 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 19 . tab eta3 dead, row nokey | dead eta3 | 0 1 | Total -----------+----------------------+---------30-44 | 27,647 256 | 27,903 | 99.08 0.92 | 100.00 -----------+----------------------+---------45-59 | 23,506 865 | 24,371 | 96.45 3.55 | 100.00 -----------+----------------------+---------60-74 | 17,517 2,971 | 20,488 | 85.50 14.50 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 . tab edu4 dead, row nokey | dead edu4 | 0 1 | Total -----------+----------------------+---------high | 5,365 138 | 5,503 | 97.49 2.51 | 100.00 -----------+----------------------+---------midhigh | 18,809 504 | 19,313 | 97.39 2.61 | 100.00 -----------+----------------------+---------midlow | 20,226 701 | 20,927 | 96.65 3.35 | 100.00 -----------+----------------------+---------low | 24,270 2,749 | 27,019 | 89.83 10.17 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 . tab region dead, row nokey | dead region | 0 1 | Total -----------+----------------------+---------north | 26,459 1,594 | 28,053 | 94.32 5.68 | 100.00 -----------+----------------------+---------centre | 12,997 747 | 13,744 | 94.56 5.44 | 100.00 -----------+----------------------+---------south | 29,214 1,751 | 30,965 | 94.35 5.65 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 20 . tab poorhealth dead, row nokey | dead poorhealth | 0 1 | Total -----------+----------------------+---------fair/good | 64,092 2,975 | 67,067 | 95.56 4.44 | 100.00 -----------+----------------------+---------poor | 4,578 1,117 | 5,695 | 80.39 19.61 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 . tab bmicat dead, row nokey | dead bmicat | 0 1 | Total ------------+----------------------+---------underweight | 1,995 126 | 2,121 | 94.06 5.94 | 100.00 ------------+----------------------+---------normal | 33,304 1,610 | 34,914 | 95.39 4.61 | 100.00 ------------+----------------------+---------overweight | 25,819 1,733 | 27,552 | 93.71 6.29 | 100.00 ------------+----------------------+---------obese | 7,552 623 | 8,175 | 92.38 7.62 | 100.00 ------------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 . tab pa dead, row nokey | dead pa | 0 1 | Total -----------+----------------------+---------vigorous | 6,383 102 | 6,485 | 98.43 1.57 | 100.00 -----------+----------------------+---------regular | 10,905 572 | 11,477 | 95.02 4.98 | 100.00 -----------+----------------------+---------light | 30,137 1,625 | 31,762 | 94.88 5.12 | 100.00 -----------+----------------------+---------inactive | 21,245 1,793 | 23,038 | 92.22 7.78 | 100.00 -----------+----------------------+---------Total | 68,670 4,092 | 72,762 | 94.38 5.62 | 100.00 21 Esercitazione La tabella seguente riporta la distribuzione di frequenza del numero di figli in un campione di famiglie Qual è l’unità statistica? Quante sono le unità statistiche? Qual è la variabile in esame? Che tipo di variabile è? Quante sono le famiglie che hanno 5 figli? Quante sono in percentuale le famiglie che hanno 5 figli? Quante sono le famiglie che hanno al massimo 5 figli? Quante sono in percentuale le famiglie che hanno al massimo 5 figli? N° figli frequenza 0 10 1 3 2 6 3 8 4 31 5 15 6 2 Tot 75 Esercitazione I dati seguenti rappresentano le età di 48 soggetti che frequentano un centro di riabilitazione fisica. Utilizza una tabella di frequenza per rappresentare in modo sintetico i dati 32 63 33 57 35 54 38 53 42 51 42 48 43 46 61 53 12 13 16 31 30 28 28 25 23 23 22 21 17 13 30 14 29 16 28 17 27 21 24 22 23 61 55 34 42 13 26 22 22 Rappresentazioni grafiche Oltre alle rappresentazioni tabellari, per descrivere la frequenza delle variabili in esame sono molto utili le rappresentazioni grafiche Rispetto alle tabelle di frequenza, i grafici hanno il vantaggio dell’immediatezza: riescono cioè a fornire rapidamente ed in maniera efficace l’informazione Le tabelle permettono d’altra parte di poter effettuare confronti molteplici tra diversi sottogruppi del campione Esistono molti tipi di grafici, ognuno dei quali è utilizzato in determinate circostanze. Grafici utili a rappresentare variabili categoriche Grafico a torta Grafico a barre Grafici utili a rappresentare variabili numeriche Istogramma Poligono di frequenza Poligono di frequenza cumulativa Diagramma ramo-foglia Diagramma a scatola Diagramma a dispersione Grafico a torta Può essere rappresentato un solo carattere (qualitativo) Le modalità sono rappresentate da spicchi della torta L’area della torta è proporzionale alla frequenza relativa della modalità 23 . tab sport Sport | Freq. Percent Cum. ------------+----------------------------------Atletica | 4 22.22 22.22 Basket | 7 38.89 61.11 Nuoto | 3 16.67 77.78 Pallavolo | 4 22.22 100.00 ------------+----------------------------------Total | 18 100.00 Atletica Nuoto Basket Pallavolo . tab due N° | infortuni | Freq. Percent Cum. ------------+----------------------------------meno di 2 | 10 55.56 55.56 2 o più | 8 44.44 100.00 ------------+----------------------------------Total | 18 100.00 24 2 o più meno di 2 . tab sport due, row nokey nofreq | N° infortuni Sport | meno di 2 2 o più | Total -----------+----------------------+---------Atletica | 75.00 25.00 | 100.00 Basket | 57.14 42.86 | 100.00 Nuoto | 66.67 33.33 | 100.00 Pallavolo | 25.00 75.00 | 100.00 -----------+----------------------+---------Total | 55.56 44.44 | 100.00 25 Atletica Basket Nuoto Pallavolo 2 o più meno di 2 Graphs by Sport Grafico a barre Le modalità qualitative sono riportate in ascissa. L’asse delle x è qualitativo Sull’asse delle ordinate si può riportare la frequenza assoluta (numero) oppure la frequenza relativa (percentuale) Per ogni gruppo si costruisce un rettangolo la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità l’ area del rettangolo è proporzionale alla frequenza rilevata per il gruppo La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi 26 0 2 4 6 8 . graph bar (count) sportcat, over(sport) Atletica Basket Nuoto Pallavolo . graph bar (count) sportcat, over(sport) horiz Atletica Basket Nuoto Pallavolo 0 2 4 count of sportcat 27 6 8 0 1 2 3 4 . graph bar (count) sportcat, over(due) over(sport) meno di 2 2 o più Atletica meno di 2 2 o più Basket meno di 2 2 o più Nuoto 28 meno di 2 2 o più Pallavolo