Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica e Biometria Statistica descrittiva CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 1 Statistica Funzioni Descrittiva Induttiva (inferenziale) Statistica descrittiva : • sintesi delle informazioni in pochi valori • descrizione della variabilità dei dati • (presentazione grafica). Statistica induttiva : formulazione di previsioni (leggi generali) sulle caratteristiche della popolazione (universo dei dati) partendo da un campione. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 2 La statistica opera su dati che definiamo ‘variabili’. I dati di interesse vengono raccolti (misurati) per tutti i soggetti inclusi nella popolazione o nel campione. Il termine ‘variabile’ sottolinea che il valore cambia da un soggetto all’altro. I dati che non possono cambiare di valore sono denominati ‘costanti’. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 3 Alcune definizioni di ‘variabile’: •“una caratteristica che varia da un’entità biologica ad un’altra” (J.H.Zar) •“qualunque genere di misura di cui si eseguano rilievi individuali è detta variabile” (P.Armitage) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 4 Il valore delle variabili è conosciuto attraverso un processo di misurazione a livello di ciascun individuo (unità statistica). CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 5 Livello di misurazione (categorie di variabili) Categoriche Nominale Solo classificazione, senza ordinamento Es. sesso, specie, area geografica, scuola Ordinale Classificazione con ordinamento, ma con distanza tra i valori ignota Es. Punteggio scolastico, valutazioni cliniche CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 6 L'indice di Apgar si basa su cinque parametri di base ai quali da un "voto" da zero a 2. Il valore dell'indice va da 0 a 10. Schema di Apgar per la valutazione della vitalità del neonato Parametro 0 Punti 1 Punto 2 Punti Battito cardiaco assente < 100 > 100 Respirazione assente debole o irregolare vigorosa con pianto Tono Muscolare assente (atonia) flessione accennata movimenti attivi Riflessi (risposta al catetere nasofaringeo) assente scarsa starnuto, pianto vivace, tosse Colore della pelle cianotico o pallido estremità cianotiche normale • Il test viene effettuato a 1 minuto e a 5 minuti di vita del neonato e può essere ripetuto se il punteggio rimane basso. • I neonati con punteggio alla nascita inferiore a 4 sono gravemente depressi e necessitano di intervento medico immediato, quelli con punteggio fra 4 e 6 sono moderatamente "a rischio", bisognosi di assistenza, vigilanza e ripetizione del test ogni 5 minuti, i neonati con punteggio fra 7 e 10 sono considerati normali. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 7 Numeriche Variabili numeriche continue: possono assumere tutti i valori in un intervallo, di regola sono prodotte da operazioni di misura Es. altezza, peso, valori di laboratorio. Variabili numeriche discrete: quando solo alcuni valori sono possibili, ad esempio i valori corrispondenti ai numeri reali interi; di regola sono prodotte da operazioni di conteggio. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 8 Numeriche Le Variabili numeriche consentono di effettuare calcoli matematici: Guadagno di peso nella prima settimana= Peso a 7 gg – Peso alla nascita CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 9 Categoriche Le Variabili categoriche (sia nominali sia ordinali) NON consentono di effettuare calcoli matematici. Anche se sono stati usati numeri per indicare i valori della variabile, sono soltanto delle etichette. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 10 Tipo di variabile Categorica Numerica Nominale Ordinale Frequenza SI SI SI Frequenza cumulativa NO SI SI Diagrammi a barre SI SI SI Media NO NO SI Mediana NO NO SI Istogrammi NO NO SI CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 11 Distribuzione di frequenza Frequenza assoluta: il numero di osservazioni con la caratteristica in esame (ad es. con un dato valore della variabile in studio). Frequenza relativa o proporzione: si esprime come relazione quantitativa tra una parte ed il tutto. La si calcola con una frazione in cui il numeratore è compreso nel denominatore: proporzione = parte / totale CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 12 Percentuale o frequenza relativa percentuale: indica una proporzione od una variazione riferiti ad una base di 100. Percentuale ( % ) = Proporzione * 100 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 13 Distribuzione di frequenza: il valore della frequenza (assoluta o relativa) per ciascuno dei possibili valori della variabile CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 14 Distribuzione di frequenza dell’ immunofenotipo dei casi di leucemia linfoblastica acuta infantile in Piemonte (1979-98). Variabile nominale Immunofenotipo Totale Non specificato T B B precursor N % 35 54 12 397 7,0 10,8 2,4 79,7 498 100 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 15 Risultato scolastico Frequenza Insufficiente 4 Sufficiente 8 Buono 7 Distinto 4 Ottimo 5 Totale 28 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 16 Distribuzione di frequenza: procedure Variabili categoriche: 1. elencare i possibili valori della variabile 2. contare quante osservazioni per ciascun valore (frequenza assoluta) 3. calcolare le corrispondenti proporzioni / percentuali (frequenza relativa) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 17 Risultato scolastico Insufficiente Sufficiente Buono Distinto Ottimo Totale CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 18 Risultato scolastico Frequenza Insufficiente 4 Sufficiente 8 Buono 7 Distinto 4 Ottimo 5 Totale 28 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 19 Risultato Frequenza scolastico Proporzione (frequenza relativa) Insufficiente 4 0,14 Sufficiente 8 0,28 Buono 7 0,25 Distinto 4 0,14 Ottimo 5 0,19 Totale 28 1,0 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 20 Riepilogo: Come si calcola una proporzione? p = f / totale Dove: p = proporzione f = frequenza assoluta nella classe o categoria totale = numero totale di soggetti Percentuale = proporzione * 100 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 21 Per rappresentare graficamente la distribuzione di frequenza di una variabile categorica si utilizza il diagramma a barre. In questo tipo di grafico le altezze dei rettangoli (barre) sono proporzionali alla frequenza (assoluta o relativa) osservata. La base è sempre uguale. Le barre sono separate e sono equidistanziate. Se la variabile è ordinale, le barre sono ordinate secondo il valore della variabile. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 22 esempio di diagramma a barre con variabile ordinale (totale= 28 osservazioni) numero di bambini (frequenza) 9 8 7 6 5 4 3 2 1 0 Insufficiente Sufficiente Buono Distinto Ottimo risultato scolastico CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 23 esempio di diagramma a barre con variabile ordinale e distribuzione di frequenza relativa (proporzione) 0.36 0.28 proporzione 0.21 0.14 0.07 0.00 Insufficiente Sufficiente Buono Distinto Ottimo risultato scolastico CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 24 Diagramma a torta, distribuzione di frequenza relativa percentuale. Nei diagrammi a torta la frequenza relativa percentuale è proporzionale all'angolo al centro. A ttività operatoria 2% 4% 4% 26% 4% Colelitiasi 6% Ernia inguinale Tumore del colon Ulcera duodenale Tumore del pancreas 8% Tumore del retto Ulcera gastrica Tumore dello stomaco Tumore dell’esof ago 8% Stenosi esof agea 19% 19% CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 25 Angolo al centro = 360° x proporzione Diagnosi di dimissione N % Colelitiasi 12 25 360*0,25=98 Ernia inguinale 9 19 360*0,19=68 Tumore del colon 9 19 68 Ulcera duodenale 4 8 29 Tumore del pancreas 4 8 29 Tumore del retto 3 6 22 Ulcera gastrica 2 4 14 Tumore dello stomaco 2 4 14 Tumore dell’esofago 2 4 14 Stenosi esofagea 1 2 7 Angolo Totale 48 100 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 26 Distribuzione di frequenza cumulativa La frequenza cumulativa è somma della frequenza delle osservazioni con valore della variabile inferiore od uguale al valore considerato. Si calcola dopo aver ordinato la variabile. Può essere calcolata per variabili ordinali variabili numeriche Calcolata la frequenza cumulativa si può calcolare la corrispondente proporzione o percentuale cumulativa. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 27 Risultato scolastico Insufficiente Frequenza Sufficiente 8 Buono 7 Distinto 4 Ottimo 5 Totale 28 4 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 28 Risultato scolastico Insufficiente Frequenza Frequenza cumulativa 4 =4+0=4 Sufficiente 8 =4+8=12 Buono 7 =4+8+7=19 Distinto 4 23 Ottimo 5 28 Totale 28 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 29 Risultato scolastico Insufficiente Frequenza Frequenza Frequenza relativa cumulativa cumulativa (in%) 4 4 14% Sufficiente 8 12 43% Buono 7 19 68% Distinto 4 23 82% Ottimo 5 28 100% Totale 28 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 30 100% Risultato scolastico 90% Frequenza relativa (percentuale) 80% 70% 60% 50% 40% 30% 20% 10% 0% Insufficiente Sufficiente Buono Distinto Ottimo CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 31 www.man.deakin.edu.au/rodneyc/xlstats.htm Un utile strumento: CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 32 Esempi sull’uso di XLSTATS CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 33 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 34 Distribuzione di frequenza di dati (variabili) numerici Se le variabili sono numeriche (continue o discrete con molti valori) occorre dapprima definire gli intervalli dei valori della variabile (classi di valori) 1. gli intervalli debbono essere definiti in modo che tutte le possibili osservazioni cadano in uno ed uno solo di essi. 2. è conveniente che gli intervalli siano di uguale ampiezza Esempio: ETA (variabile indicata con il simbolo x ) ƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 10<= x <20 20<= x <30 30<= x <40 40<= x <50 50<= x <60 60<= x <70 70<= x <80 80<= x <90 90<= x <100 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 35 1. calcolare le corrispondenti distribuzioni di frequenza e proporzioni semplici e cumulative Cumulative Cumulative ETA Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 0 0.0 0 0.0 10<= x <20 0 0.0 0 0.0 20<= x <30 0 0.0 0 0.0 30<= x <40 2 0.5 2 0.5 40<= x <50 38 8.8 40 9.3 50<= x <60 70 16.3 110 25.6 60<= x <70 212 49.3 322 74.9 70<= x <80 104 24.2 426 99.1 80<= x <90 2 0.5 428 99.5 90<= x <100 2 0.5 430 100.0 TOTALE 430 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 36 I simboli che si utilizzano per definire un intervallo sono: = es x=1 >= x>=1 Æ include i soggetti con variabile X di valore 1 (incluso) o superiore ad 1 > x>1 Æ include solo i soggetti con variabile X di valore superiore ad 1 < x>1 Æ include solo i soggetti con variabile X di valore inferiore ad 1 <= x<=1 Æ include i soggetti con variabile X di valore 1 (incluso) o inferiore ad 1 Æ include solo i soggetti con variabile X di valore 1 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 37 Istogrammi : rappresentazione grafica di distribuzioni di frequenza di variabili numeriche. Vengono disegnati su un grafico dei rettangoli contigui, uno per ciascun valore o intervallo (classe) di valori della variabile. L’area dei rettangoli è proporzionale alla frequenza di osservazioni, è opportuno che gli intervalli siano della stessa ampiezza e quindi che i rettangoli corrispondenti abbiano tutti base uguale: semplifica sia la preparazione sia la lettura. Come disporre i valori Ascisse (asse X): valori della variabile Ordinate (asse Y): Frequenza (assoluta o percentuale, semplice o cumulativa, a scelta). CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 38 Un esempio di istogramma con valori della variabile suddivisi in classi 100,0% 90,0% 80,0% Frequenza relativa % 70,0% 50,0% 40,0% 30,0% 20,0% 10,0% 10 0 90 <= et a< 90 80 <= et a< 80 70 <= et a< 70 60 <= et a< 60 50 <= et a< 50 40 <= et a< 40 30 <= et a< 30 20 <= et a< 20 10 <= et a< 10 0,0% 00 <= et a< % 60,0% classe di età CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 39 Un esempio di istogramma con variabile discreta CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 40 Distribuzione cumulata con variabile discreta CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 41 Un esempio di istogramma con variabile continua CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 42 Distribuzione della percentuale cumulata con variabile continua CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 43 Poligono di frequenza Si ottiene unendo con una linea i punti mediani della parte superiore dei rettangoli dell'istogramma CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 44 100.0% 90.0% 80.0% Frequenza relativa % 70.0% 50.0% 40.0% 30.0% 20.0% 10.0% 90 <= et a< 10 0 80 <= et a< 90 70 <= et a< 80 60 <= et a< 70 50 <= et a< 60 40 <= et a< 50 30 <= et a< 40 20 <= et a< 30 10 <= et a< 20 0.0% 00 <= et a< 10 % 60.0% classe di età CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 45 100.0% 90.0% 80.0% Frequenza relativa % 70.0% 50.0% 40.0% 30.0% 20.0% 10.0% 90 <= et a< 10 0 80 <= et a< 90 70 <= et a< 80 60 <= et a< 70 50 <= et a< 60 40 <= et a< 50 30 <= et a< 40 20 <= et a< 30 10 <= et a< 20 0.0% 00 <= et a< 10 % 60.0% classe di età CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 46 60 50 casi popolazione 40 30 20 10 0 35 40 45 50 55 60 65 70 75 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 47 100 90 80 casi 70 pop. 60 50 40 30 20 10 0 35 40 45 50 55 60 65 70 75 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 48 Distribuzione di frequenza di 2 variabili Il procedimento è analogo a quanto descritto per una sola variabile, complicato solo dalla necessità di classificare ciascun soggetto per due variabili contemporaneamente. 1.definire i possibili valori di ciascuna delle due variabili 2.costruire una tabella con le due variabili a definire le righe e le colonne 3.scrivere i valori delle variabili in ordine crescente 4.contare le osservazioni per ciascuna combinazione di valori 5.calcolare i totali di riga, colonna e tabella 6.calcolare le corrispondenti proporzioni (o percentuali) riferite a: totale generale, tot. di riga, tot. di colonna CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 49 Problema: descrivere l’associazione tra arteriopatia ed abitudine al fumo (due variabili categoriche) in uno studio: 1. identifico le variabili ed i valori possibili Var. A (arteriopatia), nominale, valori possibili = 2 (malato, sano). Var. B (fumo), nominale, valori possibili = 3 (mai fumatore, ex fum., attuale fum.). 2. preparo una tabella con le due variabili che definiscono le righe e le colonne CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 50 Arteriopatia Malato Totale Sano Mai Fumo Ex Attuale Totale Queste tabelle sono anche chiamate: tabelle di contingenza tabelle crociate (o crosstabs) tabelle a doppia entrata CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 51 Arteriopatia Totale Malato Sano Mai 8 43 51 Ex 26 45 71 Attuale 30 48 78 64 136 Fumo Totale CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 200 52 Percentuali sul totale delle osservazioni Arteriopatia Malati Sani % totale Totale Malati Sani % % F Mai 8 43 4,0 21,5 U Ex 26 45 13,0 22,5 M attuale 30 48 15,0 24,0 O Totale 200 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 100,0 53 Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni Malati Sani 30,0 25,0 20,0 % 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 Fumo CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 54 Istogrammi da tabella con 2 variabili Percentuali sul totale delle osservazioni 25,0 20,0 15,0 % 10,0 Mal San 5,0 Sani 0,0 Mai Malati Ex Fumo attuale Mai Ex attuale Malati 4,0 13,0 15,0 Sani 21,5 22,5 24,0 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 55 Percentuali sul totale di riga Arteriopatia Malati Sani %riga Totale Malati Sani % % % F Mai 8 43 51 15,7 84,3 100,0 U Ex 26 45 71 36,6 63,4 100,0 M attuale 30 48 78 38,5 61,5 100,0 O Totale 200 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 56 Istogrammi da tabella con 2 variabili Percentuali di malati per ciascuna categoria di fumo 90,0 80,0 70,0 60,0 50,0 Malati % Sani 40,0 30,0 20,0 10,0 0,0 Mai Ex attuale Totale Malati 15,7 36,6 38,5 32,0 Sani 84,3 63,4 61,5 68,0 Fumo CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 57 Percentuali sul totale di colonna Arteriopatia Malati Sani %colonna Totale Malati Sani F Mai 8 43 12,5 31,6 U Ex 26 45 40,6 33,1 M Attuale 30 48 46,9 35,3 O Totale 64 136 200 100,0 100,0 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 58 Istogrammi da tabella con 2 variabili Percentuali di fumatori tra malati e sani 50,0 45,0 40,0 35,0 30,0 % Malati 25,0 Sani 20,0 15,0 10,0 5,0 0,0 Mai Ex attuale Malati 12,5 40,6 46,9 Sani 31,6 33,1 35,3 Fumo CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 59 Rappresentazione grafica di dati definiti da 2 variabili quantitative SOMMINISTRAZIONE GENERAL HEALTH QUESTIONNAIRE (GHQ) 25 20 2° TEST 15 10 5 0 0 5 10 15 20 25 1° TEST diagramma a punti: è adatto quando il numero di osservazioni in ciascuna categoria non è troppo grande. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 60 Esercizi consigliati da: Fowler et al, ed Edises. • • • • Cap 4 (p 212) es 1 Cap 4 (p 212) es 3 Cap 4 (p 212) es 6 Cap 4 (p 212) es 8 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Statistica descrittiva 61