Statistica
vs
Confucio & Steve Jobs
Andrea
Angelini
Andrea
Caruso
Emanuele
Attioli
Simone
Pollutri
Patrik
Muniak
1
Scegli il lavoro che ami e non lavorerai mai,
neanche per un giorno in tutta la tua vita.
Confucio
2
Steve Jobs
3
Applicando la frase di Steve Jobs alla nostra
vita di studenti, considerando quindi lo studio
come nostro lavoro, abbiamo ipotizzato che…
…chi è più soddisfatto del corso di laurea scelto,
avrà allora un rendimento migliore.
4
Vogliamo quindi cercare che CORRELAZIONE c’è
tra GRADIMENTO per il corso di laurea scelto e il
RENDIMENTO ottenuto dallo studente.
In teoria, chi è più soddisfatto dovrebbe
avere un rendimento superiore.
Ma siamo sicuri che sia sempre così…?
5
Prima di tutto, c’è da chiedersi cosa significhi per uno studente avere un
buon rendimento.
Ovviamente, l‘ideale sarebbe avere una media molto alta e al tempo
stesso sostenere il maggior numero dei esami nel minor tempo possibile.
Tuttavia, sappiamo che ciò non avviene spesso e al riguardo ci sono due
punti di vista :
Mantenere una media
voto degli esami alta,
anche a costo di
impiegare un po’ più di
tempo a laurearsi.
E’ importante laurearsi il prima
possibile, indipendentemente
dalla media che si ha.
Pertanto abbiamo deciso di analizzare
questi due casi distintamente, con due
studi statistici separati.
6
ANALISI DEI DATI
Partiamo quindi con l’analisi dei dati da noi utilizzati
per condurre questi studi statistici.
Abbiamo scelto come ambiente di riferimento il nostro
corso di studio, in particolare sono stati utilizzati i dati
raccolti nel questionario compilato da 65 studenti *del
corso di laurea in Economia Aziendale.
* Tuttavia, le risposte di uno studente sono state eliminate perché
alla domanda ‘quanti crediti hai sostenuto’ ha risposto: ‘non so,
dovrei contarli…’.
Pertanto le risposte effettivamente prese in considerazione sono 64.
7
Questi dati sono stati scelti perché presentano
delle caratteristiche adatte:
- CONFRONTABILITA’
Tutti i partecipanti al questionario frequentano lo
stesso corso di laurea
(di conseguenza, stessi professori e stesse materie)
Questa caratteristica dei dati consente quindi di eliminare
gran parte di situazioni che comprometterebbero la
confrontabilità dei dati, ad esempio criteri di giudizio diversi
per via di professori diversi, oppure materie diverse nel caso di
confronto tra studenti di corsi diversi.
8
ASSENZA DI INTERFERENZE ESTERNE
NELLA COMPILAZIONE DEI DATI:
Il questionario è stato svolto SOLO dagli studenti del corso di
statistica, in quanto distribuito attraverso email istituzionale dalla
Professoressa Lupparelli.
Pertanto alla luce di quanto appena detto, possiamo essere sicuri
della ottima ‘qualità’ dei nostri dati presi in esame, punto di
partenza fondamentale per condurre un’ analisi statistica con
accuratezza.
9
Vi ricordate il questionario?
10
11
12
Sei soddisfatto del corso di laurea
che hai scelto?
Media degli esami sostenuti
(approssimare all'intero)
Numero di crediti sostenuti
9
27
79
5
25
88
10
24
75
7
26
91
9
25
58
9
26
100
8
22
70
7
28
76
8
27
95
10
28
97
4
23
79
8
25
99
8
28
98
8
25
70
7
24
61
10
28
87
8
27
59
7
24
81
10
28
88
9
30
100
10
24
72
6
24
99
13
8
26
91
8
25
97
8
26
93
8
24
79
3
22
77
10
25
91
8
26
93
9
26
79
7
24
33
8
24
40
9
26
89
8
23
134
9
25
78
7
24
80
10
27
87
9
26
87
10
26
87
5
26
91
9
25
91
9
23
74
5
21
74
7
20
51
14
8
22
89
8
26
71
9
25
80
8
25
62
8
27
91
9
27
91
9
28
97
1
24
70
9
27
91
8
25
75
8
26
87
8
25
88
8
29
85
8
19
42
9
26
100
10
28
63
0
25
84
6
22
90
15
Partiamo con una breve analisi dei dati che ci servono
per condurre la nostra indagine statistica:
• Soddisfazione per il corso di laurea scelto
• Media voto degli esami sostenuti
• Crediti sostenuti
16
SODDISFAZIONE
Modalità
0
1
2
3
4
5
6
7
8
9
10
nk
1
1
0
1
1
3
2
8
22
15
10
64
(x-µ)
-7,8438
(x-µ)^2
61,5244
-6,8438
46,8369
-5,8438
-4,8438
-3,8438
-2,8438
-1,8438
-0,8438
0,1563
1,1563
2,1563
34,1494
23,4619
14,7744
8,0869
3,3994
0,7119
0,0244
1,3369
4,6494
fk
0,0156
0,0156
0,0000
0,0156
0,0156
0,0469
0,0313
0,1250
0,3438
0,2344
0,1563
1,00
Fk
0,0156
0,0312
0,0312
0,0469
0,0625
0,1094
0,1406
0,2656
0,6094
0,8437
1,0000
(x-µ)^2*nk ∑(x-µ)^2*nk
61,5244
250,4375
Var(x)
3,9131
Moda
8
Modalità*nk
0
1
0
3
4
15
12
56
176
135
100
502
Sqm
1,9782
46,8369
0,0000
23,4619
14,7744
24,2607
6,7988
5,6953
0,5371
20,0537
46,4941
(x-µ)^3
-482,5821
-320,5401
Scarto alla
terza
7,7407
-199,5606
-113,6436
-56,7892
-22,9972
-6,2677
-0,6007
0,0038
1,5458
10,0253
Media
7,84375
Me
8
Quantili
Q1=7
Q2=8
Q3=9
Indice
(x-µ)^3*fk ∑(x-µ)^3*fk asimmetria
-7,5403
-14,6307
-1,8901
asimmetria
-5,0084
negativa
0,0000
-1,7757
-0,8873
-1,0780
-0,1959
-0,0751
0,0013
0,3623
1,5665
17
Grafico ad aste per variabili discrete
Frequenza assoluta
25
20
15
10
5
0
0
1
2
3
4
5
6
7
8
9
10
Soddisfazione
18
MEDIA
Modalità
19
20
21
22
23
24
25
26
27
28
29
30
nk
1
1
1
4
3
10
13
14
7
7
2
1
64
fk
0,0156
0,0156
0,0156
0,0625
0,0469
0,1563
0,2031
0,2188
0,1094
0,1094
0,0313
0,0156
1,0000
(x-µ)
-6,2969
(x-µ)^2
39,6506
-5,2969
28,0569
28,0569
-4,2969
-3,2969
-2,2969
-1,2969
-0,2969
0,7031
1,7031
2,7031
3,7031
4,7031
18,4631
10,8694
5,2756
1,6819
0,0881
0,4944
2,9006
7,3069
13,7131
22,1194
18,4631
43,4775
15,8269
16,8188
1,1458
6,9214
20,3044
51,1482
27,4263
22,1194
Fk
0,0156
0,0312
0,0469
0,1094
0,1562
0,3125
0,5156
0,7344
0,8437
0,9531
0,9844
1,0000
(x-µ)^2*nk ∑(x-µ)^2*nk
39,6506
291,3594
Var(x)
4,5525
Moda
26
Modalità*nk
19
20
21
88
69
240
325
364
189
196
58
30
1619
Sqm
2,1337
(x-µ)^3
-249,6751
-148,6138
Scarto alla
terza
9,7135
-79,3338
-35,8350
-12,1175
-2,1812
-0,0262
0,3476
4,9401
19,7514
50,7815
104,0302
Media
25,2969
Me
25
Quantili
Q1=24
Q2=Me=25
Q3=27
(x-µ)^3*fk ∑(x-µ)^3*fk Indice asimmetria
-3,9012
-4,6276
-0,4764
Asimmetria
-2,3221
negativa
-1,2396
-2,2397
-0,5680
-0,3408
-0,0053
0,0760
0,5403
2,1603
1,5869
1,6255
19
Grafico ad aste per variabili discrete
16
Frequenza assoluta
14
12
10
8
6
4
2
0
19
20
21
22
23
24
25
26
27
28
29
30
Media esami sostenuti
20
CREDITI
Classi
(0-70)
(70-80)
(80-90)
(90-134)
mk
35
wk
70
fk
0,1875
pk
18,7500
Nk
12
Fk
0,1875
0,0027
mk*nk
420
15
75
10
0,2344
23,4375
27
0,4219
0,0234
1125
15
85
10
0,2344
23,4375
42
0,6563
0,0234
1275
22
112
44
0,3438
34,3750
64
1,0000
0,0078
2464
64
Media
approssimata
82,5625
dk
nk
12
100
Media
esatta
Me
82,1875
Nella classe tra 80-90
µk*nk
679
5284
1148
(mk-µ)
Quartili
Q1 nella classe 70-80
-47,1875
Me=80+10*[(0,5-0,4219)/0,2344] Q3 nella classe 90-134
-7,1875
1304
83,3333
2,8125
2129
29,8125
5260
(mk-µ)^2
(mk-µ)^2*nk
Varianza
Sqm
(mk-µ)^3
(mk-µ)^3*fk
I.a.
2226,6602
26719,9219
736,9805
27,1474
-105070,5261
-19700,7236
-0,5335
51,6602
774,902344
-371,3074
-87,0252
7,9102
118,652344
22,2473
5,2142
26496,9075
9108,3119
888,7852
19553,2734
Scarto alla
terza
47166,75
20007,0919
-10674,2227
21
Istogramma per distribuzioni in classi
Densità relativa
0.0250
0.0200
0.0150
0.0100
0.0050
0.0000
(0-70)
(70-80)
(80-90)
(90-134)
Crediti esami sostenuti
22
Confrontiamo i due punti di
vista sul rendimento.
C’è correlazione tra
soddisfazione e media voto?
C’è correlazione tra soddisfazione
e crediti sostenuti?
23
Y: ‘Media voto degli esami sostenuti’
35
30
25
20
15
Media(x)=7,8438
Media(y)=25,2969
VAR(x)=3,9131
VAR(y)=4,5525
COV(x,y)=1,4995
Bontà di adattamento=0,1262
CORR(x,y)=0,3553
a=22,2911
b=0,3882
10
5
0
0
2
4
6
8
X: ‘Soddisfazione per il corso di laurea scelto’
10
12
24
La BONTA’ DI ADATTAMENTO è pari a 0,1262 e questo ci fa capire che
la retta ha un adattamento ai dati molto bassa, quindi quasi la totalità dei
punti non si trova sulla retta stessa.
La CORRELAZIONE ha un valore di 0,3553. La relazione lineare tra le
due variabili(x,y) presenta un’associazione debolmente positiva.
I risultati di questa analisi statistica ci consentono di giungere alla conclusione
che la soddisfazione per il corso di laurea scelto non influenza in maniera
rilevante (al contrario di come ci aspettavamo) la media voto degli esami.
25
Vediamo ora se invece è presente una
correlazione tra la soddisfazione per il corso
di laurea scelto e il numero di crediti
sostenuti: ipotizziamo che maggiore è la
soddisfazione di uno studente, maggiore
dovrebbe essere il numero crediti sostenuti.
26
160
140
Y: ‘Crediti sostenuti’
120
100
80
60
Media(x)=7,8438
Media(y)=82,1875
VAR(x)=3,9131
VAR(y)=736,9805
COV(x,y)=3,3105
Bontà di adattamento=0,0038
CORR(x,y)=0,0616
a=75,5515
b=0,8460
40
20
0
0
2
4
6
8
X: ‘Soddisfazione per il corso di laurea scelto’
10
12
27
La bontà di adattamento in questo caso è pari a 0,0038
e questo vuol dire che la retta ha un adattamento ai dati
quasi nullo e ciò è evidente anche osservando il grafico.
La correlazione inoltre ha un valore di 0,0616 e questo
significa che la relazione lineare tra le due variabili(x,y)
presenta un’associazione leggermente positiva ma
veramente debole tendente allo 0.
Anche la nostra seconda supposizione non è supportata
dall’analisi statistica effettuata.
Pertanto, sembra proprio che non è detto che chi è
soddisfatto del corso di laurea scelto riesca poi ad avere
risultati brillanti corrispondenti alla sua passione.
28
Come si può spiegare questa cosa?
Sicuramente questa analisi non ha potuto prendere in
considerazione numerosi altri fattori decisivi, come ad esempio:
- Tempo dedicato allo studio (scarsa voglia, lavoro)
- Situazioni personali avverse
- Capacità dello studente
29
Data la scarsa correlazione in entrambi i casi precedenti
e visti i dati in nostro possesso, abbiamo pensato di
vedere se almeno c’è una maggiore correlazione tra
crediti sostenuti e media voto degli esami.
30
Crediti/media
35
Y: 'Media voto degli esami'
30
25
20
15
Media(x)=82,1875
Media(y)=25,2969
VAR(x)=736,9805
VAR(y)=4,5525
COV(x,y)=13,7412
Bontà di adattamento=0,0563
CORR(x,y)=0,2373
a=23,7645
b=0,0186
10
5
0
0
20
40
60
80
X: 'Crediti sostenuti'
100
120
140
31
160
La bontà di adattamento è pari a 0,0563 e questo
vuol dire che la retta ha un adattamento ai dati
quasi nullo.
La correlazione ha un valore di 0,2373 e questo
significa che la relazione lineare tra le due
variabili(x,y) presenta un’associazione
leggermente positiva.
Quindi anche in questo caso non possiamo
affermare che chi ha sostenuto un maggior
numero di crediti ha anche una media alta.
32
Ci dispiace quindi confutare le tesi di Confucio
e Steve Jobs, ma abbiamo dimostrato che non è
sufficiente essere soddisfatti di quello che si fa
per fare un buon lavoro.
E’ certamente un buon punto di partenza, ma ci
vogliono anche dedizione, impegno e…
anche un pizzico di fortuna che non guasta
mai!
33
34