Statistica vs Confucio & Steve Jobs Andrea Angelini Andrea Caruso Emanuele Attioli Simone Pollutri Patrik Muniak 1 Scegli il lavoro che ami e non lavorerai mai, neanche per un giorno in tutta la tua vita. Confucio 2 Steve Jobs 3 Applicando la frase di Steve Jobs alla nostra vita di studenti, considerando quindi lo studio come nostro lavoro, abbiamo ipotizzato che… …chi è più soddisfatto del corso di laurea scelto, avrà allora un rendimento migliore. 4 Vogliamo quindi cercare che CORRELAZIONE c’è tra GRADIMENTO per il corso di laurea scelto e il RENDIMENTO ottenuto dallo studente. In teoria, chi è più soddisfatto dovrebbe avere un rendimento superiore. Ma siamo sicuri che sia sempre così…? 5 Prima di tutto, c’è da chiedersi cosa significhi per uno studente avere un buon rendimento. Ovviamente, l‘ideale sarebbe avere una media molto alta e al tempo stesso sostenere il maggior numero dei esami nel minor tempo possibile. Tuttavia, sappiamo che ciò non avviene spesso e al riguardo ci sono due punti di vista : Mantenere una media voto degli esami alta, anche a costo di impiegare un po’ più di tempo a laurearsi. E’ importante laurearsi il prima possibile, indipendentemente dalla media che si ha. Pertanto abbiamo deciso di analizzare questi due casi distintamente, con due studi statistici separati. 6 ANALISI DEI DATI Partiamo quindi con l’analisi dei dati da noi utilizzati per condurre questi studi statistici. Abbiamo scelto come ambiente di riferimento il nostro corso di studio, in particolare sono stati utilizzati i dati raccolti nel questionario compilato da 65 studenti *del corso di laurea in Economia Aziendale. * Tuttavia, le risposte di uno studente sono state eliminate perché alla domanda ‘quanti crediti hai sostenuto’ ha risposto: ‘non so, dovrei contarli…’. Pertanto le risposte effettivamente prese in considerazione sono 64. 7 Questi dati sono stati scelti perché presentano delle caratteristiche adatte: - CONFRONTABILITA’ Tutti i partecipanti al questionario frequentano lo stesso corso di laurea (di conseguenza, stessi professori e stesse materie) Questa caratteristica dei dati consente quindi di eliminare gran parte di situazioni che comprometterebbero la confrontabilità dei dati, ad esempio criteri di giudizio diversi per via di professori diversi, oppure materie diverse nel caso di confronto tra studenti di corsi diversi. 8 ASSENZA DI INTERFERENZE ESTERNE NELLA COMPILAZIONE DEI DATI: Il questionario è stato svolto SOLO dagli studenti del corso di statistica, in quanto distribuito attraverso email istituzionale dalla Professoressa Lupparelli. Pertanto alla luce di quanto appena detto, possiamo essere sicuri della ottima ‘qualità’ dei nostri dati presi in esame, punto di partenza fondamentale per condurre un’ analisi statistica con accuratezza. 9 Vi ricordate il questionario? 10 11 12 Sei soddisfatto del corso di laurea che hai scelto? Media degli esami sostenuti (approssimare all'intero) Numero di crediti sostenuti 9 27 79 5 25 88 10 24 75 7 26 91 9 25 58 9 26 100 8 22 70 7 28 76 8 27 95 10 28 97 4 23 79 8 25 99 8 28 98 8 25 70 7 24 61 10 28 87 8 27 59 7 24 81 10 28 88 9 30 100 10 24 72 6 24 99 13 8 26 91 8 25 97 8 26 93 8 24 79 3 22 77 10 25 91 8 26 93 9 26 79 7 24 33 8 24 40 9 26 89 8 23 134 9 25 78 7 24 80 10 27 87 9 26 87 10 26 87 5 26 91 9 25 91 9 23 74 5 21 74 7 20 51 14 8 22 89 8 26 71 9 25 80 8 25 62 8 27 91 9 27 91 9 28 97 1 24 70 9 27 91 8 25 75 8 26 87 8 25 88 8 29 85 8 19 42 9 26 100 10 28 63 0 25 84 6 22 90 15 Partiamo con una breve analisi dei dati che ci servono per condurre la nostra indagine statistica: • Soddisfazione per il corso di laurea scelto • Media voto degli esami sostenuti • Crediti sostenuti 16 SODDISFAZIONE Modalità 0 1 2 3 4 5 6 7 8 9 10 nk 1 1 0 1 1 3 2 8 22 15 10 64 (x-µ) -7,8438 (x-µ)^2 61,5244 -6,8438 46,8369 -5,8438 -4,8438 -3,8438 -2,8438 -1,8438 -0,8438 0,1563 1,1563 2,1563 34,1494 23,4619 14,7744 8,0869 3,3994 0,7119 0,0244 1,3369 4,6494 fk 0,0156 0,0156 0,0000 0,0156 0,0156 0,0469 0,0313 0,1250 0,3438 0,2344 0,1563 1,00 Fk 0,0156 0,0312 0,0312 0,0469 0,0625 0,1094 0,1406 0,2656 0,6094 0,8437 1,0000 (x-µ)^2*nk ∑(x-µ)^2*nk 61,5244 250,4375 Var(x) 3,9131 Moda 8 Modalità*nk 0 1 0 3 4 15 12 56 176 135 100 502 Sqm 1,9782 46,8369 0,0000 23,4619 14,7744 24,2607 6,7988 5,6953 0,5371 20,0537 46,4941 (x-µ)^3 -482,5821 -320,5401 Scarto alla terza 7,7407 -199,5606 -113,6436 -56,7892 -22,9972 -6,2677 -0,6007 0,0038 1,5458 10,0253 Media 7,84375 Me 8 Quantili Q1=7 Q2=8 Q3=9 Indice (x-µ)^3*fk ∑(x-µ)^3*fk asimmetria -7,5403 -14,6307 -1,8901 asimmetria -5,0084 negativa 0,0000 -1,7757 -0,8873 -1,0780 -0,1959 -0,0751 0,0013 0,3623 1,5665 17 Grafico ad aste per variabili discrete Frequenza assoluta 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 Soddisfazione 18 MEDIA Modalità 19 20 21 22 23 24 25 26 27 28 29 30 nk 1 1 1 4 3 10 13 14 7 7 2 1 64 fk 0,0156 0,0156 0,0156 0,0625 0,0469 0,1563 0,2031 0,2188 0,1094 0,1094 0,0313 0,0156 1,0000 (x-µ) -6,2969 (x-µ)^2 39,6506 -5,2969 28,0569 28,0569 -4,2969 -3,2969 -2,2969 -1,2969 -0,2969 0,7031 1,7031 2,7031 3,7031 4,7031 18,4631 10,8694 5,2756 1,6819 0,0881 0,4944 2,9006 7,3069 13,7131 22,1194 18,4631 43,4775 15,8269 16,8188 1,1458 6,9214 20,3044 51,1482 27,4263 22,1194 Fk 0,0156 0,0312 0,0469 0,1094 0,1562 0,3125 0,5156 0,7344 0,8437 0,9531 0,9844 1,0000 (x-µ)^2*nk ∑(x-µ)^2*nk 39,6506 291,3594 Var(x) 4,5525 Moda 26 Modalità*nk 19 20 21 88 69 240 325 364 189 196 58 30 1619 Sqm 2,1337 (x-µ)^3 -249,6751 -148,6138 Scarto alla terza 9,7135 -79,3338 -35,8350 -12,1175 -2,1812 -0,0262 0,3476 4,9401 19,7514 50,7815 104,0302 Media 25,2969 Me 25 Quantili Q1=24 Q2=Me=25 Q3=27 (x-µ)^3*fk ∑(x-µ)^3*fk Indice asimmetria -3,9012 -4,6276 -0,4764 Asimmetria -2,3221 negativa -1,2396 -2,2397 -0,5680 -0,3408 -0,0053 0,0760 0,5403 2,1603 1,5869 1,6255 19 Grafico ad aste per variabili discrete 16 Frequenza assoluta 14 12 10 8 6 4 2 0 19 20 21 22 23 24 25 26 27 28 29 30 Media esami sostenuti 20 CREDITI Classi (0-70) (70-80) (80-90) (90-134) mk 35 wk 70 fk 0,1875 pk 18,7500 Nk 12 Fk 0,1875 0,0027 mk*nk 420 15 75 10 0,2344 23,4375 27 0,4219 0,0234 1125 15 85 10 0,2344 23,4375 42 0,6563 0,0234 1275 22 112 44 0,3438 34,3750 64 1,0000 0,0078 2464 64 Media approssimata 82,5625 dk nk 12 100 Media esatta Me 82,1875 Nella classe tra 80-90 µk*nk 679 5284 1148 (mk-µ) Quartili Q1 nella classe 70-80 -47,1875 Me=80+10*[(0,5-0,4219)/0,2344] Q3 nella classe 90-134 -7,1875 1304 83,3333 2,8125 2129 29,8125 5260 (mk-µ)^2 (mk-µ)^2*nk Varianza Sqm (mk-µ)^3 (mk-µ)^3*fk I.a. 2226,6602 26719,9219 736,9805 27,1474 -105070,5261 -19700,7236 -0,5335 51,6602 774,902344 -371,3074 -87,0252 7,9102 118,652344 22,2473 5,2142 26496,9075 9108,3119 888,7852 19553,2734 Scarto alla terza 47166,75 20007,0919 -10674,2227 21 Istogramma per distribuzioni in classi Densità relativa 0.0250 0.0200 0.0150 0.0100 0.0050 0.0000 (0-70) (70-80) (80-90) (90-134) Crediti esami sostenuti 22 Confrontiamo i due punti di vista sul rendimento. C’è correlazione tra soddisfazione e media voto? C’è correlazione tra soddisfazione e crediti sostenuti? 23 Y: ‘Media voto degli esami sostenuti’ 35 30 25 20 15 Media(x)=7,8438 Media(y)=25,2969 VAR(x)=3,9131 VAR(y)=4,5525 COV(x,y)=1,4995 Bontà di adattamento=0,1262 CORR(x,y)=0,3553 a=22,2911 b=0,3882 10 5 0 0 2 4 6 8 X: ‘Soddisfazione per il corso di laurea scelto’ 10 12 24 La BONTA’ DI ADATTAMENTO è pari a 0,1262 e questo ci fa capire che la retta ha un adattamento ai dati molto bassa, quindi quasi la totalità dei punti non si trova sulla retta stessa. La CORRELAZIONE ha un valore di 0,3553. La relazione lineare tra le due variabili(x,y) presenta un’associazione debolmente positiva. I risultati di questa analisi statistica ci consentono di giungere alla conclusione che la soddisfazione per il corso di laurea scelto non influenza in maniera rilevante (al contrario di come ci aspettavamo) la media voto degli esami. 25 Vediamo ora se invece è presente una correlazione tra la soddisfazione per il corso di laurea scelto e il numero di crediti sostenuti: ipotizziamo che maggiore è la soddisfazione di uno studente, maggiore dovrebbe essere il numero crediti sostenuti. 26 160 140 Y: ‘Crediti sostenuti’ 120 100 80 60 Media(x)=7,8438 Media(y)=82,1875 VAR(x)=3,9131 VAR(y)=736,9805 COV(x,y)=3,3105 Bontà di adattamento=0,0038 CORR(x,y)=0,0616 a=75,5515 b=0,8460 40 20 0 0 2 4 6 8 X: ‘Soddisfazione per il corso di laurea scelto’ 10 12 27 La bontà di adattamento in questo caso è pari a 0,0038 e questo vuol dire che la retta ha un adattamento ai dati quasi nullo e ciò è evidente anche osservando il grafico. La correlazione inoltre ha un valore di 0,0616 e questo significa che la relazione lineare tra le due variabili(x,y) presenta un’associazione leggermente positiva ma veramente debole tendente allo 0. Anche la nostra seconda supposizione non è supportata dall’analisi statistica effettuata. Pertanto, sembra proprio che non è detto che chi è soddisfatto del corso di laurea scelto riesca poi ad avere risultati brillanti corrispondenti alla sua passione. 28 Come si può spiegare questa cosa? Sicuramente questa analisi non ha potuto prendere in considerazione numerosi altri fattori decisivi, come ad esempio: - Tempo dedicato allo studio (scarsa voglia, lavoro) - Situazioni personali avverse - Capacità dello studente 29 Data la scarsa correlazione in entrambi i casi precedenti e visti i dati in nostro possesso, abbiamo pensato di vedere se almeno c’è una maggiore correlazione tra crediti sostenuti e media voto degli esami. 30 Crediti/media 35 Y: 'Media voto degli esami' 30 25 20 15 Media(x)=82,1875 Media(y)=25,2969 VAR(x)=736,9805 VAR(y)=4,5525 COV(x,y)=13,7412 Bontà di adattamento=0,0563 CORR(x,y)=0,2373 a=23,7645 b=0,0186 10 5 0 0 20 40 60 80 X: 'Crediti sostenuti' 100 120 140 31 160 La bontà di adattamento è pari a 0,0563 e questo vuol dire che la retta ha un adattamento ai dati quasi nullo. La correlazione ha un valore di 0,2373 e questo significa che la relazione lineare tra le due variabili(x,y) presenta un’associazione leggermente positiva. Quindi anche in questo caso non possiamo affermare che chi ha sostenuto un maggior numero di crediti ha anche una media alta. 32 Ci dispiace quindi confutare le tesi di Confucio e Steve Jobs, ma abbiamo dimostrato che non è sufficiente essere soddisfatti di quello che si fa per fare un buon lavoro. E’ certamente un buon punto di partenza, ma ci vogliono anche dedizione, impegno e… anche un pizzico di fortuna che non guasta mai! 33 34