Biostatistica – Laurea Magistrale in Biologia Risultati dell’esame del 12 settembre 2016 Matricola Voto 700993 739116 739494 739781 751833 752314 752685 752806 752910 753104 753284 753505 754306 805678 808028 811444 insufficiente 28 18 22 22 30 insufficiente 27 insufficiente 30 insufficiente 18 18 27 25 18 Per rifiutare il voto mandare una email all’indirizzo [email protected] Lunedì 19 settembre alle ore 11.30 presso l’ufficio del docente (U7, 2° piano, ufficio 2069) sarà possibile chiedere chiarimenti sugli esiti del compito. La registrazione del voto sul sito della segreteria studenti sarà fatta Lunedì 19 settembre alle ore 14; non è richiesta la presenza dello studente Nelle pagine seguenti sono riportate le soluzioni degli esercizi proposti nella prova di esame. Esercizio 1 La seguente figura rappresenta la distribuzione di probabilità della lunghezza dei geni nel genoma umano. Il diagramma è troncato in corrispondenza di 15000 nucleotidi; 26 geni più grandi sono troppo rari per essere visualizzati in questo diagramma. i) La lunghezza genica mediana è verosimilmente maggiore, minore, o uguale alla media? A maggiore B minore C uguale ii) Spiegate il perché della risposta data al punto i). La distribuzione è molto asimmetrica: più del 95% delle lunghezze geniche considerate è inferiore a 10000 nucleotidi, mentre ci sono alcuni geni che superano i 10000 nucleotidi. In queste situazioni la mediana è molto minore della media, perché quest’ultima, contrariamente alla prima, è influenzata dai pochi valori elevati. 1 Esercizio 2 Nella specie umana il sesso dei figli di una stessa coppia è una variabile indipendente. Per esempio, il fatto di avere già generato un maschio non fa variare la probabilità che anche il figlio successivo sia un maschio. Ci attendiamo quindi che il numero di maschi e il numero di femmine nati in famiglie con due figli siano conformi a una distribuzione binomiale, con n=2 e p uguale alla probabilità di avere un maschio in ogni singola prova. È quanto si osserva? Rodgers e Doughty (2001) hanno verificato questa ipotesi usando i dati provenienti dal National Longitudinal Survey of Youth (NLSY), dove vengono registrati i dati sul sesso dei figli in campioni casuali di famiglie che variano nel numero di componenti. La figura seguente riporta il numero osservato nello studio di famiglie con due figli con un numero dato di maschi confrontato con la frequenza prevista da una distribuzione binomiale. i) commentare la figura Dal diagramma a barre si nota che il numero osservato di figli maschi nelle famiglie che hanno due figli non è simile a quello atteso sotto l’ipotesi di distribuzione binomiale. Il numero di famiglie con un solo figlio maschio è ad esempio maggiore rispetto all’atteso. La differenza potrebbe essere tuttavia dovuta al caso. Per valutare questa ipotesi possiamo effettuare un test statistico. ii) quale test statistico è in grado di verificare l’ipotesi che il numero osservato sia uguale al numero atteso di figli sotto l’ipotesi nulla di indipendenza del sesso dei figli in una stessa coppia? A Test t di Student B Chi-quadrato della bontà di adattamento C Test F iii) Il p-value ottenuto nel test statistico è pari a 1.2 ×10-7. L’ipotesi nulla va rifiutata o accettata? A Accettata B Rifiutata 2 iv) Quale potrebbe essere il motivo dello scarso adattamento della distribuzione binomiale al numeri di maschi nelle famiglie con due figli? Una probabile spiegazione è che molti genitori in famiglie con 2 figli senza maschi, o con 2 maschi, siano insoddisfatti e decidano di avere un terzo figlio, ‘rimuovendo’ così la propria famiglia dall’insieme delle famiglie con 2 figli. 3 Esercizio 3 Alcune persone ritengono di essere capaci di intuire quando qualcuno mente, mentre altre ritengono di non avere questa capacità. Le persone che si dichiarano ‘intuitive’ hanno davvero la capacità di scoprire le bugie? A 100 individui che ritenevano di avere capacità intuitive sono stati mostrati alcuni video in cui una persona dichiarava il proprio film preferito. La persona diceva la verità in alcuni casi, mentre mentiva in altri. Ad altri 100 soggetti che affermavano di non avere capacità intuitive sono stati mostrati gli stessi video. 59 dei 100 soggetti ‘intuitivi’ hanno identificato correttamente se la persona nel video stesse mentendo, mentre dei 100 soggetti ‘non intuitivi’ 69 hanno effettuato l’identificazione corretta. i) Costruire la tabella di contingenza che riassume i risultati dello studio Identificazione/corretta Sì No N % N % Autodefiniti/"Intuitivi" 59 59% 41 41% Autodefiniti/"Non/intuitivi" 69 69% 31 31% Totale N 100 100 ii) Rispetto agli obiettivi dello studio, enunciate un’appropriata ipotesi nulla statistica e un’ipotesi alternativa. Ipotesi nulla statistica: H0: Prob(Identificazione corretta | autodefinirsi intutivi) = Prob(Identificazione corretta | autodefinirsi non intutivi) Ipotesi alternativa statistica: H0: Prob(Identificazione corretta | autodefinirsi intutivi) ≠ Prob(Identificazione corretta | autodefinirsi non intutivi) iii) quale test statistico è in grado di verificare l’ipotesi nulla? A Test t di Student B Test Chi-quadrato C Test F iv) Il rapporto tra l’odds di indovinare nel gruppo degli ‘intuitivi’ e il gruppo dei ‘non intuitivi’ è pari a 0.86. L’intervallo di confidenza al 95% è 0.55-1.33. Per ognuna delle seguenti affermazioni, dire se è vera o falsa. Nel campione in studio, i soggetti che si definiscono intuitivi hanno una avuto in realtà una predisposizione minore nello scoprire le bugie Posso essere sufficientemente confidente nell’affermare che, nella popolazione da cui è stato estratto il campione, i soggetti che si definiscono intuitivi hanno in realtà una minore predisposizione a scoprire le bugie I dati dello studio forniscono un’evidenza piuttosto forte a favore dell’ipotesi che il definirsi intuitivo in realtà non è indice di una maggior predisposizione a scoprire le bugie V F V F V F 4 Esercizio 4 Il Lepomis macrochirus, un pesce d’acqua dolce molto simile al persico sole, in estate preferisce alimentarsi al largo, ma in presenza di predatori tende a nascondersi fra le piante acquatiche in prossimità della riva. Uno studio ha confrontato il tasso di crescita di individui che si alimentano al largo con quello di individui che si alimentano vicino alla riva. I pesci ‘al largo’ e quelli ‘vicino alla riva’ sono stati misurati in 8 laghi, e il loro tasso di crescita medio è stato confrontato mediante un test t per due campioni indipendenti. i) Che tipo di errore è stato commesso nell’analisi statistica di questo studio? I due campioni in ciascun lago non sono indipendenti. Preferibile un test per dati appaiati, eventualmente non parametrico data la bassa numerosità campionaria. 5 Esercizio 5 I carotenoidi sono pigmenti importanti, responsabili di gran parte del colore rosso che vediamo in natura. Per esempio, il rosso brillante del becco del fringuello zebrato è proprio dovuto ai carotenoidi. I carotenoidi sono importanti anche come antiossidanti nell'uomo e in altri animali, e ciò ha indotto un gruppo di ricercatori a ipotizzare che negli uccelli queste sostanze possano influire sul funzionamento del sistema immunitario. Per verificare tale ipotesi, un insieme di 20 fringuelli zebrati è stato suddiviso casualmente in 2 gruppi. Solamente a 10 fringuelli è stata somministrata un'integrazione di carotenoidi. Tutti gli uccelli sono poi stati sottoposti a un saggio che misura l'immunità cellulo-mediata (PHA). Vista la numerosità ridotta dei due gruppi, si è scelto di effettuare un test non parametrico per confrontare la distribuzione del PHA nei due gruppi. Di seguito la tabella dei dati e la figura con i risultati dell'analisi condotta con JMP. (i) Specificare il sistema di ipotesi che si sta testando e la conclusione opportuna. H0: µcarot = µno carot vs. H1: µcarot ≠ µno carot La concentrazione di PHA nel gruppo trattato con carotenoidi è risultata significativamente differente dalla concentrazione di PHA nel gruppo non trattato con carotenoidi. 6 Esercizio 6 Dalterio et al. (1982) hanno condotto un esperimento per esaminare gli effetti dei cannabinoidi sulla fertilità in topi maschi. L’esperimento prevedeva 4 gruppi di trattamento con 18 topi maschi per gruppo. Come trattamento sono stati utilizzati tre forme di cannabinoidi e un controllo con olio di sesamo. I cannabinoidi sono stati somministrati per via orale 3 volte a settimana per 5 settimane, con una dose equivalente nell’uomo a circa 3 sigarette di marijuana. Nelle ultime 3 settimane dello studio ogni maschio è stato messo insieme a una femmina vergine. Al termine dello studio sono stati registrati lo stato di gravidanza della femmina e la massa dei testicoli di ciascun maschio. I risultati sono riportati nella tabella seguente: (i) Quale tipo di analisi statistica condurrebbe per valutare se i cannabinoidi influiscono sulla probabilità di ingravidare una femmina? Test chi quadrato per l’analisi delle tabelle di contingenza (ii) Quale tipo di analisi statistica condurrebbe per valutare se i cannabinoidi influiscono sul peso dei testicoli? Analisi della varianza 7 Esercizio 7 Le persone mancine sono avvantaggiate in molti sport, ed è stato ipotizzato che il mancinismo, in passato, abbia rappresentato un vantaggio nei combattimenti corpo a corpo (i mancini infatti possono fare molta esperienza contro i destrimani, a differenza di quanto possano fare questi ultimi). Per studiare il potenziale vantaggio dei soggetti mancini, Faurie e Raymond (2005) hanno confrontato la frequenza di individui mancini in alcune società tradizionali, con i livelli di violenza tipici di queste società. Di seguito la tabella dei dati e il relativo diagramma a dispersione ottenuto in JMP: Percentuale mancini rispetto a Tasso di omicidio (x 1000 individui/ anno) 25 Percentuale mancini 20 15 10 5 -1 0 1 2 3 Tasso di omicidio (x 1000 individui/anno) 4 5 6 i) quale assunzione dell’analisi della correlazione lineare è violata in questi dati? L’assunzione di normalità bivariata è violata. Per esempio, la distribuzione di frequenza di ognuna delle due variabili è asimmetrica a destra, ed esiste una maggior dispersione per valori elevati rispetto a valori bassi per entrambe le variabili. L’assunto di linearità della relazione pare inoltre violato. ii) prima di ricorrere a un metodo non parametrico, quale strategia possiamo usare per valutare un’eventuale correlazione tra percentuale di mancinismo e tasso di omicidi? Trasformazione di una o di entrambe le variabili. La trasformazione logaritmica è sempre una buona scelta per variabili asimmetriche a destra e con valori maggiori di zero. La trasformazione arcoseno potrebbe essere un’altra buona scelta per la variabile “percentuale di mancini”. 8