Università del Piemonte Orientale Corso di Laurea in Biotecnologie Corso di Statistica Medica Statistica Descrittiva Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 1 I dati costituiscono la ‘materia prima’ su cui lavora lo statistico. I dati vengono forniti dai soggetti che sono coinvolti nella ricerca. I dati vengono raccolti, elaborati e sintetizzati al fine di ottenere: - un messaggio sintetico (statistica descrittiva) - leggi generali ottenute da un numero limitato di osservazioni ma valide per tutti i soggetti con caratteristiche analoghe (statistica inferenziale). Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 2 Tipi di dati - Categorici Binari Nominali Ordinali - Quantitativi o numerici Attenzione: Il tipo di dato condiziona la scelta del metodo statistico! Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 3 Dati categorici Binari presentano due soli valori: presente (codificato di regola come 1) ed assente (codificato di regola come 0). [P&G, Tab.2.1] Nominali Solo classificazione, senza ordinamento Es sesso, specie, area geografica, scuola, tipo istologico, tipo di neoplasia, codice di malattia, immunofenotipo di leucemia….. Ordinali Classificazione con ordinamento, ma distanza tra i valori non misurabile o ignota Es. Punteggio scolastico, valutazione clinica di gravità di un sintomo, codice TNM, punteggio APGAR. Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 4 Esempio di dati ordinali: Graduazione del performance status proposto dall’Eastern Cooperative Oncology Group / ECOG. Grado 0 Descrizione Paziente fisicamente attivo, in grado di svolgere senza restrizioni la normale attività preterapia. 1 Paziente limitato nell’attività fisica massima; può essere seguito in ambulatorio e svolgere un lavoro di entità leggera o di tipo sedentario. 2 Paziente in grado di accudire se stesso, ma incapace di svolgere ogni attività lavorativa. Resta alzato per più del 50% delle ore di veglia. 3 Paziente in grado di accudire se stesso solo parzialmente e costretto a letto o seduto per più del 50% delle ore di veglia 4 Paziente inabile, costretto permanentemente a letto o seduto e non più in grado di accudire a se stesso. 5 Paziente morto Fonte: Oken MM et al. Toxicity and response criteria of the Eastern Cooperative Oncology Group. Am J Clin Oncol 5: 649-655; 1982. Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 5 Esempio di dati ordinali: Graduazione del performance status secondo Karnofsky Capace di esplicare attività 100 Normale. Non ha sintomi o segni di malattia normale e di lavorare. Non è 90 Capace di attività normale. Lievi sintomi o segni di malattia necessaria alcuna particolare 80 Attività normale con sforzo. Alcuni sintomi o segni di malattia assistenza. Incapace di lavorare. In grado di vivere a casa e di occuparsi delle proprie necessità personali. E’ richiesto un certo 70 Può accudire se stesso. Incapace di condurre attività normale o lavoro attivo. 60 Richiede assistenza occasionalmente, ma è in grado di provvedere alla maggior parte delle proprie necessità. grado di assistenza 50 Richiede notevole assistenza e frequenti prestazioni mediche. Incapace di accudire a se 40 Costretto a letto. Richiede assistenza e cure speciali. stesso. E’ richiesto il ricovero 30 In condizioni serie. E’indicata l’ospedalizzazione. ospedaliero. Progressione 20 In condizioni gravi. Sono necessari l’ospedalizzazione ed un rapida della malattia. intenso trattamento generale di supporto. 10 In condizioni gravissime. Progressione rapida della malattia. 0 Paziente morto Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 6 Dati Quantitativi o Numerici Continui: possono assumere tutti i valori in un intervallo, di regola sono prodotti da operazioni di misura (altezza, peso, valori di laboratorio. Discreti: quando solo alcuni valori sono possibili, esempi: - i valori corrispondenti a numeri reali interi come l’età in anni compiuti - il risultato di un conteggio. In pratica, i dati numerici discreti e quelli continui vengono trattati in modo analogo Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 7 Obiettivo della statistica descrittiva: Sintetizzare ed organizzare le informazioni contenute in una serie di dati, al fine di: o presentazione o esame preliminare ad analisi più complesse Requisiti o Mirare agli aspetti essenziali o Sintesi o Facilità di comprensione Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 8 Nel linguaggio statistico alla parola DATO viene spesso sostituita con la parola VARIABILE I dati di interesse vengono raccolti (misurati) per tutti i soggetti inclusi nella popolazione o nel campione. Il termine ‘variabile’ sottolinea che il valore cambia da un soggetto all’altro. I dati che non cambiano di valore sono denominati ‘costanti’. Alcune definizioni di ‘variabile’: - ‘una caratteristica che varia da un’entità biologica ad un’altra’ (J.H.Zar) - ‘qualunque genere di misura di cui si eseguano rilievi individuali è detta variabile’ (P.Armitage) Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 9 In modo analogo a quanto detto per i tipi di dati parliamo di tipo delle variabili. Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 10 Distribuzione di frequenza La distribuzione di frequenza può essere calcolata per - dati / variabili nominali - dati / variabili ordinali - dati / variabili numeriche Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 11 Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: nominale Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98). Immunofenotipo N % Non specificato 35 7.0 T 54 10.8 B 12 2.4 B precursor 397 79.7 498 100 Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 12 Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: numerica continua Esempio Numero di globuli bianchi (G.B.) alla diagnosi G.B. ( / ml) N (%) Non noto 5 (1.0) <=9.999 235 (47.2) 10.000 - <50.000 167 (33.5) >=50.000 91 (18.3) Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 498 (100) 13 Costruzione di una distribuzione di frequenza: procedure Variabili categoriche: 1. definire i possibili valori della variabile 2. predisporre l’elenco dei possibili valori 3. contare quante osservazioni per ciascun valore (frequenza) 4. calcolare le corrispondenti proporzioni / percentuali) (frequenza relativa) numero _ osservazio ni _ nella _ categoria Pr oporzione = Totale Percentuale = proporzione * 100 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 14 1. e 2. Risultato scolastico Frequenza Proporzione % (frequenza relativa) Insufficiente Sufficiente Buono Distinto Ottimo Totale n: numero di soggetti in ciascuna categoria della variabile Proporzione: n / numero totale di soggetti % = proporzione * 100 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 15 3 e 4. Risultato Frequenza scolastico Proporzione % (frequenza relativa) Insufficiente 4 0.14 14 % Sufficiente 8 0.28 28 % Buono 7 0.25 25 % Distinto 4 0.14 14 % Ottimo 5 0.19 19 % Totale 28 1.0 100 % Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 16 www.man.deakin.edu.au/rodneyc/xlstats.htm Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 17 Lettura di una tabella Prestare attenzione a: - Valori mancanti N (%) Immunophenotype Not specified 35 (7.0) T 54 (10.8) B 12 (2.4) B precursor Total Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 397 (79.7) 498 (100) 18 - Intervalli aperti GLOBULI BIANCHI G.B. ( / ml) N (%) missing 5 (1.0) <=9999 235 (47.2) 10 000- 49 999 167 (33.5) >=50 000 91 (18.3) Total Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 498 (100) 19 - Indicazione del totale N (%) Immunophenotype Not specified 35 (7.0) T 54 (10.8) B 12 (2.4) B precursor Total Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 397 (79.7) 498 (100) 20 - Intestazioni (della tabella, delle righe , delle colonne) Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98). GLOBULI BIANCHI G.B. ( / ml) N (%) missing 5 (1.0) <=9999 235 (47.2) 10 000- 49 999 167 (33.5) >=50 000 91 (18.3) Total Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 498 (100) 21 La rappresentazione grafica di una distribuzione di frequenza è un valido aiuto per migliorarne la leggibilità. Rappresentazione grafica della distribuzione di frequenza di una variabile nominale Dato / Variabile: diagnosi di dimissione, tipo nominale. diagnosi di dimissione Colelitiasi Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell’esofago Stenosi esofagea Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva N 12 9 9 4 4 3 2 2 2 1 48 % 25 19 19 8 8 6 4 4 4 2 100 22 Diagramma a barre, corrispondente alla distribuzione di frequenza Attività operatoria 14 12 Numero interventi 10 8 6 4 2 0 Colelitiasi Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell’esofago Stenosi esofagea Diagnosi Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 23 Diagramma a torta, corrispondente alla distribuzione di frequenza Attività operatoria 1 2 2 2 12 3 Colelitiasi Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas 4 Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell’esofago Stenosi esofagea 4 9 9 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 24 Evitate un numero eccessivo di decimali: - nelle proporzioni usate 2 decimali - nelle percentuali usate 1 decimale o l’intero Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 25 Distribuzione di frequenza cumulativa La frequenza cumulativa è somma della frequenza delle osservazioni con valore della variabile inferiore od uguale al valore considerato. Può essere calcolata per - dati / variabili ordinali - dati / variabili numeriche Calcolata la frequenza cumulativa si può calcolare la corrispondente proporzione o percentuale cumulativa. Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 26 Risultato Frequenza Frequenza scolastico cumulativa Ottimo 5 Distinto 4 Buono 7 Sufficiente 8 Insufficiente 4 Totale 28 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva Frequenza relativa cumulativa (in %) 27 Risultato Frequenza Frequenza scolastico cumulativa Ottimo 5 5 Distinto 4 9 Buono 7 16 Sufficiente 8 24 Insufficiente 4 28 Totale 28 28 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva Frequenza relativa cumulativa (in %) 28 Risultato Frequenza Frequenza scolastico Frequenza relativa cumulativa cumulativa (in %) Ottimo 5 5 19% Distinto 4 9 33 % Buono 7 16 58 % Sufficiente 8 24 86 % Insufficiente 4 28 100 % Totale 28 28 100 % Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 29 Risultato scolastico 9 8 7 Frequenza (assoluta) 6 5 4 3 2 1 0 Ottimo Distinto Buono Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva Sufficiente Insufficiente 30 Risultato scolastico 30 25 frequenza (assoluta) 20 15 10 5 0 Ottimo Distinto Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva Buono Sufficiente Insufficiente 31 100% Risultato scolastico 90% Frequenza relativa (percentuale) 80% 70% 60% 50% 40% 30% 20% 10% 0% Ottimo Distinto Buono Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva Sufficiente Insufficiente 32 Distribuzione di frequenza di dati (variabili) numerici Se le variabili sono numeriche (continue o discrete con molti valori) occorre definire gli intervalli dei valori della variabile (classi di valori) 1. gli intervalli debbono essere definiti in modo che tutte le possibili osservazioni cadano in uno ed uno solo di essi. 2. è opportuno che gli intervalli siano di uguale ampiezza Esempio: ETA (variabile indicata con il simbolo x ) ƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 10<= x <20 20<= x <30 30<= x <40 40<= x <50 50<= x <60 60<= x <70 70<= x <80 80<= x <90 90<= x <100 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 33 3. calcolare le corrispondenti distribuzioni di frequenza e proporzioni semplici e cumulative Cumulative Cumulative ETA Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 0 0.0 0 0.0 10<= x <20 0 0.0 0 0.0 20<= x <30 0 0.0 0 0.0 30<= x <40 2 0.5 2 0.5 40<= x <50 38 8.8 40 9.3 50<= x <60 70 16.3 110 25.6 60<= x <70 212 49.3 322 74.9 70<= x <80 104 24.2 426 99.1 80<= x <90 2 0.5 428 99.5 90<= x <100 2 0.5 430 100.0 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 34 I segni per definire un intervallo sono: = es x=1 Æ include solo i soggetti con variabile X di valore 1 >= x>=1 Æ include i soggetti con variabile X di valore 1 (incluso) o superiore ad 1 > x>1 Æ include solo i soggetti con variabile X di valore superiore ad 1 < <= Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 35 Istogrammi : rappresentazione grafica di distribuzioni di frequenza di variabili numeriche. Vengono disegnati su un grafico dei rettangoli contigui, uno per ciascun valore o intervallo (classe) di valori della variabile. L’area dei rettangoli è proporzionale alla frequenza di osservazioni, E’ opportuno che gli intervalli siano della stessa ampiezza e quindi che i rettangoli corrispondenti abbiano tutti base uguale: semplifica sia la preparazione sia la lettura. Come disporre i valori Ascisse: valori della variabile Ordinate: Frequenza (assoluta o percentuale, semplice o cumulativa, a scelta). Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 36 100,0% 90,0% 80,0% Frequenza relativa % 70,0% % 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 80 <= et a< 90 90 <= et a< 10 0 70 <= et a< 80 60 <= et a< 70 50 <= et a< 60 40 <= et a< 50 30 <= et a< 40 20 <= et a< 30 10 <= et a< 20 00 <= et a< 10 0,0% classe di età Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 37 100% 90% 80% Frequenza cumulativa relativa 70% % 60% 50% 40% 30% 20% 10% et a< 10 0 90 a< 80 90 <= 80 <= et a< et <= 70 <= 60 50 <= et a< 70 et a< 60 50 a< et <= 40 30 <= et a< 40 et a< 30 <= 20 <= 10 00 <= et a< 10 et a< 20 0% classe di età Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 38 Poligono di Frequenza Si ottiene unendo con una linea i punti mediani della parte superiore dei rettangoli dell'istogramma 60.0% 50.0% 40.0% 30.0% 20.0% 10.0% Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 90 <= et a< 10 0 80 <= et a< 90 70 <= et a< 80 60 <= et a< 70 50 <= et a< 60 40 <= et a< 50 30 <= et a< 40 20 <= et a< 30 10 <= et a< 20 00 <= et a< 10 0.0% 39 60 50 casi popolazione 40 30 20 10 0 35 40 45 50 55 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 60 65 70 75 40 100 90 80 casi 70 pop. 60 50 40 30 20 10 0 35 40 45 50 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 55 60 65 70 75 41 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 42 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 43 Rappresentazioni alternative di distribuzioni di frequenza: o Diagrammi a torta (pie chart, vedi esempio seguente) o Poligoni di frequenza o Diagrammi di dispersione (a punti) ad una dimensione o Istogrammi a barre orizzontali o Figure con area proporzionale alla frequenza (attenzione, la lettura può essere poco immediata). Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 44 I diagrammi a punti sono adatti solo quando il numero di osservazioni è limitato n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Hb 111 107 124 141 131 105 96 125 135 140 151 139 162 163 168 171 166 169 157 165 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 45 Il risultato non è particolarmente soddisfacente, soprattutto quando le osservazioni sono molte ed i punti si sovrappongono ! Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 46 Diagrammi a torta (pie chart). La frequenza è proporzionale all’angolo al centro, quindi all’area dello spicchio Esempio di diagramma a torta o Pie chart Distribuzione di frequenza del numero di globuli bianchi tra i casi di leucemia linfoblastica acuta (LLA) rilevati dal RTI Piemonte, 1979-98 missing <=9999.103/l 10 000- 49 999.103/l >=50 000.103/l Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 47 Statistica descrittiva - metodi per analisi bivariata (2 variabili contemporaneamente). Analizziamo separatamente i seguenti casi: o Due variabili nominali o Una variabile nominale e l’altra ordinale o Due variabili ordinali o Una variabile quantitativa (discreta o continua) e l’altra nominale / ordinale o Due variabili quantitative (discrete o continue) Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 48 Statistica descrittiva - bivariata Due variabili nominali Una variabile nominale e l’altra ordinale Due variabili ordinali -> Distribuzione di frequenza Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 49 Distribuzione di frequenza di 2 variabili Il procedimento è analogo a quanto descritto per una sola variabile, complicato solo dalla necessità di classificare ciascun soggetto per due variabili contemporaneamente. 1. definire i possibili valori di ciascuna delle due variabili 2. scrivere una tabella con le due variabili a definire le righe e le colonne 3. scrivere i valori delle variabili in ordine crescente 4. contare quante osservazioni per ciascuna combinazione di valori 5. calcolare i totali di riga, colonna e tabella 6. calcolare le corrispondenti proporzioni (eventualmente come percentuali) riferite a: totale generale, totale di riga, tot. di colonna Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 50 Problema: descrivere l’associazione tra arteriopatia ed abitudine al fumo (due variabili categoriche) in uno studio su 200 pazienti: 1. identifico le variabili ed i valori possibili Var. A (arteriopatia), nominale, valori possibili = 2 (malato, sano). Var. B (fumo), nominale, valori possibili = 3 (mai fumatore, ex fumatore, attuale fumatore). 2. preparo una tabella con le due variabili a definire le righe e le colonne Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 51 Totale Arteriopatia Malato Sano Mai Fumo Ex Attuale Totale Queste tabelle sono anche chiamate: tabelle di contingenza tabelle crociate (o crosstabs) tabelle a doppia entrata Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 52 Totale Arteriopatia Malato Sano Mai 8 43 51 Ex 26 45 71 Attuale 30 48 78 64 136 200 Fumo Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 53 Percentuali sul totale delle osservazioni Arteriopatia Malati Sani % totale Totale Malati Sani % % F Mai 8 43 4,0 21,5 U Ex 26 45 13,0 22,5 M attuale 30 48 15,0 24,0 O Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 200 100,0 54 Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni Malati Sani 30,0 25,0 20,0 % 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 Fumo Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 55 Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni 25,0 20,0 15,0 % 10,0 Malati Sani 5,0 Sani 0,0 Malati Mai Ex attuale Fumo Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 56 Percentuali sul totale di riga Arteriopatia Malati Sani %riga Totale Malati Sani % % % F Mai 8 43 51 15,7 84,3 100,0 U Ex 26 45 71 36,6 63,4 100,0 M attuale 30 48 78 38,5 61,5 100,0 O Totale Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 200 57 Istogrammi da tabella con 2 variabili Percentuali di malati per ciascuna categoria di fumo 90,0 80,0 70,0 60,0 50,0 Malati Sani % 40,0 30,0 20,0 10,0 0,0 Mai Ex attuale Totale Malati 15,7 36,6 38,5 32,0 Sani 84,3 63,4 61,5 68,0 Fumo Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 58 Percentuali sul totale di colonna Arteriopatia Malati Sani %colonna Totale Malati Sani F Mai 8 43 12,5 31,6 U Ex 26 45 40,6 33,1 M Attuale 30 48 46,9 35,3 O Totale 64 136 100,0 100,0 Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 200 59 Istogrammi da tabella con 2 variabili Percentuali di fumatori tra malati e sani 50,0 45,0 40,0 35,0 30,0 % Malati Sani 25,0 20,0 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 12,5 40,6 46,9 Sani 31,6 33,1 35,3 Fumo Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 60 Esercizi consigliati, tratti da: M.Pagano & K.Gauvreau. Biostatistica (II edizione italiana). ed. Idelson Gnocchi, Napoli 2003. 1. Partendo dai dati presentati nella tabella 2.10: a) Indicare di quale tipo di variabili si tratta. b) Qual’è la percentuale di nati di peso inferiore a 2 kg? c) Calcolare la frequenza relativa del numero di neonati per classe di peso alla nascita d) Disegnare l’istogramma del numero di neonati per classe di peso alla nascita e) Calcolare la frequenza cumulativa (assoluta e relativa) del numero di neonati per classe di peso alla nascita f) Disegnare l’istogramma della frequenza cumulativa relativa del numero di neonati per classe di peso alla nascita. g) Accorpare i dati della tabella 2.10 in classi di 1000 g e ripetere gli esercizi da c a f. 2. Svolgere i seguenti esercizi tratti dalle pag.26-27: 1, 2, 3, 4, 5, 6, 7. 3. Svolgere i seguenti esercizi tratti dalle pag.26-27: 8, 16 (nel caso sia richiesto un poligono di frequenza, disegnate un istogramma). 4. Svolgere i seguenti esercizi tratti dalle pag.26-27: 12, 13, 14 (id.). Gli esercizi saranno corretti in classe Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva 61