700993 739116 739494 739781 751833 752314 752685 752806

Biostatistica – Laurea Magistrale in Biologia
Risultati dell’esame del 12 settembre 2016
Matricola
Voto
700993
739116
739494
739781
751833
752314
752685
752806
752910
753104
753284
753505
754306
805678
808028
811444
insufficiente
28
18
22
22
30
insufficiente
27
insufficiente
30
insufficiente
18
18
27
25
18
Per rifiutare il voto mandare una email all’indirizzo [email protected]
Lunedì 19 settembre alle ore 11.30 presso l’ufficio del docente (U7, 2° piano, ufficio 2069) sarà
possibile chiedere chiarimenti sugli esiti del compito.
La registrazione del voto sul sito della segreteria studenti sarà fatta Lunedì 19 settembre alle ore 14;
non è richiesta la presenza dello studente
Nelle pagine seguenti sono riportate le soluzioni degli esercizi proposti nella prova di esame.
Esercizio 1
La seguente figura rappresenta la distribuzione di probabilità della lunghezza dei geni nel genoma
umano. Il diagramma è troncato in corrispondenza di 15000 nucleotidi; 26 geni più grandi sono
troppo rari per essere visualizzati in questo diagramma.
i) La lunghezza genica mediana è verosimilmente maggiore, minore, o uguale alla media?
A maggiore
B minore
C uguale
ii) Spiegate il perché della risposta data al punto i).
La distribuzione è molto asimmetrica: più del 95% delle lunghezze geniche considerate è
inferiore a 10000 nucleotidi, mentre ci sono alcuni geni che superano i 10000 nucleotidi.
In queste situazioni la mediana è molto minore della media, perché quest’ultima,
contrariamente alla prima, è influenzata dai pochi valori elevati.
1
Esercizio 2
Nella specie umana il sesso dei figli di una stessa coppia è una variabile indipendente. Per esempio,
il fatto di avere già generato un maschio non fa variare la probabilità che anche il figlio successivo
sia un maschio.
Ci attendiamo quindi che il numero di maschi e il numero di femmine nati in famiglie con due figli
siano conformi a una distribuzione binomiale, con n=2 e p uguale alla probabilità di avere un
maschio in ogni singola prova. È quanto si osserva?
Rodgers e Doughty (2001) hanno verificato questa ipotesi usando i dati provenienti dal National
Longitudinal Survey of Youth (NLSY), dove vengono registrati i dati sul sesso dei figli in campioni
casuali di famiglie che variano nel numero di componenti.
La figura seguente riporta il numero osservato nello studio di famiglie con due figli con un numero
dato di maschi confrontato con la frequenza prevista da una distribuzione binomiale.
i) commentare la figura
Dal diagramma a barre si nota che il numero osservato di figli maschi nelle famiglie che
hanno due figli non è simile a quello atteso sotto l’ipotesi di distribuzione binomiale.
Il numero di famiglie con un solo figlio maschio è ad esempio maggiore rispetto all’atteso.
La differenza potrebbe essere tuttavia dovuta al caso. Per valutare questa ipotesi possiamo
effettuare un test statistico.
ii) quale test statistico è in grado di verificare l’ipotesi che il numero osservato sia uguale al numero
atteso di figli sotto l’ipotesi nulla di indipendenza del sesso dei figli in una stessa coppia?
A Test t di Student
B Chi-quadrato della bontà di adattamento
C Test F
iii) Il p-value ottenuto nel test statistico è pari a 1.2 ×10-7. L’ipotesi nulla va rifiutata o accettata?
A Accettata
B Rifiutata
2
iv) Quale potrebbe essere il motivo dello scarso adattamento della distribuzione binomiale al
numeri di maschi nelle famiglie con due figli?
Una probabile spiegazione è che molti genitori in famiglie con 2 figli senza maschi, o con 2
maschi, siano insoddisfatti e decidano di avere un terzo figlio, ‘rimuovendo’ così la propria
famiglia dall’insieme delle famiglie con 2 figli.
3
Esercizio 3
Alcune persone ritengono di essere capaci di intuire quando qualcuno mente, mentre altre ritengono
di non avere questa capacità. Le persone che si dichiarano ‘intuitive’ hanno davvero la capacità di
scoprire le bugie?
A 100 individui che ritenevano di avere capacità intuitive sono stati mostrati alcuni video in cui una
persona dichiarava il proprio film preferito. La persona diceva la verità in alcuni casi, mentre
mentiva in altri. Ad altri 100 soggetti che affermavano di non avere capacità intuitive sono stati
mostrati gli stessi video. 59 dei 100 soggetti ‘intuitivi’ hanno identificato correttamente se la
persona nel video stesse mentendo, mentre dei 100 soggetti ‘non intuitivi’ 69 hanno effettuato
l’identificazione corretta.
i) Costruire la tabella di contingenza che riassume i risultati dello studio
Identificazione/corretta
Sì
No
N
%
N
%
Autodefiniti/"Intuitivi"
59 59%
41
41%
Autodefiniti/"Non/intuitivi" 69 69%
31
31%
Totale
N
100
100
ii) Rispetto agli obiettivi dello studio, enunciate un’appropriata ipotesi nulla statistica e un’ipotesi
alternativa.
Ipotesi nulla statistica:
H0: Prob(Identificazione corretta | autodefinirsi intutivi) = Prob(Identificazione corretta |
autodefinirsi non intutivi)
Ipotesi alternativa statistica:
H0: Prob(Identificazione corretta | autodefinirsi intutivi) ≠ Prob(Identificazione corretta |
autodefinirsi non intutivi)
iii) quale test statistico è in grado di verificare l’ipotesi nulla?
A Test t di Student
B Test Chi-quadrato
C Test F
iv) Il rapporto tra l’odds di indovinare nel gruppo degli ‘intuitivi’ e il gruppo dei ‘non intuitivi’ è
pari a 0.86. L’intervallo di confidenza al 95% è 0.55-1.33. Per ognuna delle seguenti affermazioni,
dire se è vera o falsa.
Nel campione in studio, i soggetti che si definiscono intuitivi hanno una avuto in realtà una
predisposizione minore nello scoprire le bugie
Posso essere sufficientemente confidente nell’affermare che, nella popolazione da cui è
stato estratto il campione, i soggetti che si definiscono intuitivi hanno in realtà una minore
predisposizione a scoprire le bugie
I dati dello studio forniscono un’evidenza piuttosto forte a favore dell’ipotesi che il
definirsi intuitivo in realtà non è indice di una maggior predisposizione a scoprire le bugie
V
F
V
F
V
F
4
Esercizio 4
Il Lepomis macrochirus, un pesce d’acqua dolce molto simile al persico sole, in estate preferisce
alimentarsi al largo, ma in presenza di predatori tende a nascondersi fra le piante acquatiche in
prossimità della riva. Uno studio ha confrontato il tasso di crescita di individui che si alimentano al
largo con quello di individui che si alimentano vicino alla riva. I pesci ‘al largo’ e quelli ‘vicino alla
riva’ sono stati misurati in 8 laghi, e il loro tasso di crescita medio è stato confrontato mediante un
test t per due campioni indipendenti.
i) Che tipo di errore è stato commesso nell’analisi statistica di questo studio?
I due campioni in ciascun lago non sono indipendenti.
Preferibile un test per dati appaiati, eventualmente non parametrico data la bassa
numerosità campionaria.
5
Esercizio 5
I carotenoidi sono pigmenti importanti, responsabili di gran parte del colore rosso che vediamo in
natura. Per esempio, il rosso brillante del becco del fringuello zebrato è proprio dovuto ai
carotenoidi. I carotenoidi sono importanti anche come antiossidanti nell'uomo e in altri animali, e
ciò ha indotto un gruppo di ricercatori a ipotizzare che negli uccelli queste sostanze possano influire
sul funzionamento del sistema immunitario. Per verificare tale ipotesi, un insieme di 20 fringuelli
zebrati è stato suddiviso casualmente in 2 gruppi. Solamente a 10 fringuelli è stata somministrata
un'integrazione di carotenoidi. Tutti gli uccelli sono poi stati sottoposti a un saggio che misura
l'immunità cellulo-mediata (PHA).
Vista la numerosità ridotta dei due gruppi, si è scelto di effettuare un test non parametrico per
confrontare la distribuzione del PHA nei due gruppi.
Di seguito la tabella dei dati e la figura con i risultati dell'analisi condotta con JMP.
(i) Specificare il sistema di ipotesi che si sta testando e la conclusione opportuna.
H0: µcarot = µno carot vs. H1: µcarot ≠ µno carot
La concentrazione di PHA nel gruppo trattato con carotenoidi è risultata significativamente
differente dalla concentrazione di PHA nel gruppo non trattato con carotenoidi.
6
Esercizio 6
Dalterio et al. (1982) hanno condotto un esperimento per esaminare gli effetti dei cannabinoidi sulla
fertilità in topi maschi. L’esperimento prevedeva 4 gruppi di trattamento con 18 topi maschi per
gruppo. Come trattamento sono stati utilizzati tre forme di cannabinoidi e un controllo con olio di
sesamo. I cannabinoidi sono stati somministrati per via orale 3 volte a settimana per 5 settimane,
con una dose equivalente nell’uomo a circa 3 sigarette di marijuana. Nelle ultime 3 settimane dello
studio ogni maschio è stato messo insieme a una femmina vergine. Al termine dello studio sono
stati registrati lo stato di gravidanza della femmina e la massa dei testicoli di ciascun maschio. I
risultati sono riportati nella tabella seguente:
(i) Quale tipo di analisi statistica condurrebbe per valutare se i cannabinoidi influiscono sulla
probabilità di ingravidare una femmina?
Test chi quadrato per l’analisi delle tabelle di contingenza
(ii) Quale tipo di analisi statistica condurrebbe per valutare se i cannabinoidi influiscono sul peso
dei testicoli?
Analisi della varianza
7
Esercizio 7
Le persone mancine sono avvantaggiate in molti sport, ed è stato ipotizzato che il mancinismo, in
passato, abbia rappresentato un vantaggio nei combattimenti corpo a corpo (i mancini infatti
possono fare molta esperienza contro i destrimani, a differenza di quanto possano fare questi
ultimi). Per studiare il potenziale vantaggio dei soggetti mancini, Faurie e Raymond (2005) hanno
confrontato la frequenza di individui mancini in alcune società tradizionali, con i livelli di violenza
tipici di queste società.
Di seguito la tabella dei dati e il relativo diagramma a dispersione ottenuto in JMP:
Percentuale mancini rispetto a Tasso di omicidio (x 1000 individui/
anno)
25
Percentuale mancini
20
15
10
5
-1
0
1
2
3
Tasso di omicidio (x 1000 individui/anno)
4
5
6
i) quale assunzione dell’analisi della correlazione lineare è violata in questi dati?
L’assunzione di normalità bivariata è violata. Per esempio, la distribuzione di frequenza di
ognuna delle due variabili è asimmetrica a destra, ed esiste una maggior dispersione per
valori elevati rispetto a valori bassi per entrambe le variabili.
L’assunto di linearità della relazione pare inoltre violato.
ii) prima di ricorrere a un metodo non parametrico, quale strategia possiamo usare per valutare
un’eventuale correlazione tra percentuale di mancinismo e tasso di omicidi?
Trasformazione di una o di entrambe le variabili. La trasformazione logaritmica è sempre
una buona scelta per variabili asimmetriche a destra e con valori maggiori di zero.
La trasformazione arcoseno potrebbe essere un’altra buona scelta per la variabile
“percentuale di mancini”.
8