Matematica per psicologi Docente: prof. Gabriella Caristi, E-mail: [email protected] http://www.dsm.univ.trieste.it/~caristi Tel.: 040 558 2605 Testo: Statistical methods for the social sciences, A. Agresti-B. Finlay, Prentice Hall 1 Acquisizione di dati attraverso osservazioni, quali inchieste telefoniche, questionari, interviste, esperimenti….. La statistica è un insieme di metodi per raccogliere e analizzare i dati raccolti. I metodi della statistica sono volti: • alla pianificazione della ricerca • alla descrizione dei dati raccolti attraverso la definizione di opportune quantità statistiche • alla predizione e generalizzazione 2 descrizione statistica descrittiva inferenza statistica inferenziale 3 Popolazione: l’insieme dei soggetti ai quali viene applicato lo studio. Campione: il sottoinsieme della popolazione sul quale vengono raccolti i dati. Soggetto o unità statistica: elemento del campione Esempio: si vuole descrivere la famiglia italiana tipo. Ovviamente non si possono intervistare tutte le famiglie italiane (popolazione). Se ne sceglierà un campione. 4 Usiamo la statistica descrittiva per raccogliere i dati relativi alle dimensioni delle famiglie appartenenti al campione e li riassumiamo ad esempio calcolando la dimensione media. Usiamo la statistica inferenziale per prevedere la dimesione media delle famiglie della intera popolazione. Un importante aspetto della inferenza statistica è la stima del grado di accuratezza della previsione. 5 Esempio: se per condurre un esperimento si usa un campione tratto da una classe di studenti di psicologia, le conclusioni che se ne deducono non possono essere generalizzate alla popolazione di tutti gli studenti della università, o a tutti i giovani di età compresa fra i 18 e i 50 anni, ecc. 6 Le caratteristiche dei soggetti del campione che si misurano sono chiamate variabili. Esempio: il sesso, l’età, l’altezza, ecc. I valori che una variabile può assumere formano una scala di misura. Classificazione delle variabili Variabile qualitativa: la scala di misura è un insieme di categorie non ordinato, generalmente la misura non è espressa da un numero. Esempio: il sesso: M o F, 0 o 1. Si parla di scala nominale. 7 Variabile quantitativa: si esprime mediante numeri. Ha senso confrontare i valori di una variabile quantitativa. Spesso si considerano insiemi di valori che possono essere assunti da una variabile quantitativa, intervalli. Si parla di scala a intervalli. Scala ordinale: i valori sono ordinati, ma non è definita la distanza fra due livelli. Esempio: molto buono, buono, sufficiente,... 8 Un’altra classificazione Variabile discreta: può assumere solo un numero finito di valori. Es.:numero di elementi di una famiglia,… Variabile continua: es.: età, peso,… Le variabili qualitative sono discrete, quelle quantitative sono discrete o continue. 9 Campionamento casuale semplice: una volta stabilita la dimensione (numero di elementi) di un campione da estrarre da una data popolazione, si procede a una scelta casuale in modo che ogni campione della medesima dimensione abbia la stessa probabilità di essere estratto. Per estrarre un campione casuale di 10 soggetti da una popolazione di 100 elementi si inseriscono i 100 nominativi in un’urna e si procede ad una estrazione a sorte. 10 Campionamento sistematico Un altro modo di procedere consiste nel creare una lista dei nomi degli elementi della popolazione e quindi di procedere alla estrazione utilizzando un passo n appropriato, scegliendo l’elemento della lista da cui iniziare in modo casuale. Campionamento a più stadi La popolazione è divisa in gruppi e viene estratto un campione casuale da ogni gruppo, in modo proporzionale alla importanza del gruppo stesso. 11 Quando la popolazione è molto grande, si può procedere all’uso - di una tabella di numeri casuali - di un generatore di numeri casuali per scegliere i soggetti. Ad ogni modo pur prendendo un campione casuale, la statistica è influenzata dal campione. 2 ricercatori che basino una statistica sulla stessa popolazione usando 2 campioni casuali, è possibile che ottengano risultati diversi. 12 Ha senso definire l’errore di campionamento come la differenza fra il valore di un parametro di una popolazione predetto da una statistica ed il valore reale di tale parametro. Ciò anche se il valore reale spesso non è noto. Altre fonti di errore: errori sistematici (volontariato), dati mancanti (alcuni soggetti non rispondono, o non rispondono a tutte le domande di un questionario) 13 Percentuali Lilliput ha 1300 abitanti, il 30% dei quali sono donne. Significa che (1300×30):100=390 sono donne. Esercizi: Il prezzo di un bene aumenta del 7% nel corso del primo anno e diminuisce del 5% nel corso del secondo anno. Quale è la variazione di prezzo alla fine dei 2 anni? X+X ×7:100=1.07 ×X= prezzo alla fine del I (1.07 ×X) ×0.95=1.0165 ×X=prezzo alla fine del II Variazione= +1.65% 14 Il I genn. ’03 ho messo in un libretto di risparmio 1000€. L’interesse è del 1% composto annualmente. Quanti euro avrò nel libretto alla fine del 10° anno? 10 10001.011100,...×= In gruppo di 2000 studenti 324 sono residenti fuori sede. Che percentuale rappresentano? 324/2000 = =162/1000=0.162= =16.2% 15