Laboratorio di Statistica A cura di Claudio Baiesi e Mattia Tattini A.A. 2016/2017 Descrizione del lavoro L’obiettivo che ci siamo posti è quello di analizzare dal punto di vista statistico diversi titoli azionari, studiandone i principali indici e indicatori al fine di poter apprezzare le loro caratteristiche e il loro andamento. Infine ci siamo interessati di verificare l’esistenza di una correlazione, o meno, tra questi titoli, volendo dimostrare che il valore di questi può spesso incidere o dipendere dal valore di altri titoli. I titoli azionari che abbiamo preso in considerazione sono: Per il mercato automobilistico: Audi e BMW. Per il settore informatico: Apple e Microsoft. Per il sistema bancario: Unicredit e Deutsche Bank. Per gli indici di borsa: Nasdaq e FTSE MIB. Cosa abbiamo fatto? Dal 24 novembre al 10 marzo abbiamo raccolto quotidianamente i dati relativi alle quotazioni dei diversi titoli azionari ed indici di borsa prima mostrati, rigorosamente alle ore 12:00, in modo da avere un criterio di paragone stabile. Come sappiamo, compiere rilevazioni in condizioni differenti, in questo caso ad orari differenti, fa si che le informazioni che rileviamo perdano, o meglio non mostrino, certe sfumature che dipendono appunto dal parametro che utilizziamo per rilevarle. Le prime peculiarità che abbiamo cercato di individuare sono state quelle relative agli indicatori di tendenza centrale, ovvero la più nota media, la moda, la varianza e lo scarto quadratico medio, fino ad arrivare ad indicatori relativamente più sofisticati come il coefficiente di variazione e i quartili. Perché così tanti dati? Gli scopi di una rilevazione così ampia sono quattro: 1. Mostrare diverse correlazioni, non facilmente riconoscibili a prima vista, tra diversi titoli azionari e tra diversi titoli di borsa, ed inoltre dimostrare il collegamento tra un certo titolo azionario e un determinato indice di borsa. 2. Nel caso in cui la verifica della correlazione tra due variabili non desse i risultati desiderati, abbiamo comunque elementi a sufficienza per approfondire altre possibili correlazioni. Perché così tanti dati? 3. A parità delle altre condizioni, campioni più grandi determinano stime per intervallo più precise, riflettendo così la minore incertezza sull’effettivo valore del parametro considerato. 4. Al fine di fare inferenza, un numero elevato di rilevazioni ci consente di sfruttare il teorema del limite centrale, il quale ci permette di approssimare la nostra distribuzione ad una normale. Che correlazioni stiamo cercando? La nostra analisi è iniziata interrogandoci riguardo la possibile correlazione dei seguenti titoli azionari: Audi – BMW Esiste una relazione tra il valore delle azioni delle due celebri case automobilistiche tedesche? Audi - BMW Per quanto riguarda la media, le azioni di Audi e BMW si pongono su due livelli molto differenti dal punto di vista monetario, infatti la prima viene quotata sul mercato azionario mediamente ad un valore di circa 641€, mentre per acquistare un titolo azionario della seconda casa automobilistica in questione servono poco più di 86€. Questi numeri non devono essere presi come dati, infatti non assicurano di trovare esattamente questo valore nel listino di borsa, ma assieme a questi dati deve essere considerato anche lo scarto quadratico medio, ovvero quanto si discostano mediamente dal valore sopraindicato i valori effettivi che potreste trovare. Nello specifico lo scarto quadratico medio σ per la azioni di Audi è di 23€ mentre per le azioni di BMW è di 2,80€. Audi - BMW Come sappiamo, lo scarto quadratico medio risente dell’unità di misura, quindi sarebbe più opportuno utilizzare un numero puro per sapere quale sia il range entro il quale possa variare, a meno di un errore, il valore che ci attendiamo. A questo proposito viene utilizzato il coefficiente di variazione, che esprime lo scarto quadratico medio come una percentuale della media. Osserviamo quindi che per le azioni di Audi questo valore si aggira intorno 3,5%, mentre per le azioni di BMW è pari al 3,2%. Questo significa che, mediamente, abbiamo uno scostamento dal valore medio relativamente piccolo, per cui possiamo aspettarci valori prossimi alla media. Audi - BMW Questo ci mostra come scarti quadratici medi differenti a prima vista possono ingannare un osservatore inesperto, ma utilizzando gli indicatori adeguati, ovvero pesati in base all’andamento del titolo ed in questo caso prendendo in considerazione non solo lo scarto quadratico medio, ma anche le media, possiamo scoprire che questi due titoli godono di una variabilità relativa tutto sommato abbastanza bassa. Entrando più nello specifico notiamo che il coefficiente di correlazione, lo strumento che ci permette di evidenziare eventuali dipendenze e correlazioni tra le variabili, è paria -0,02, molto prossimo a zero, quindi possiamo concludere che non vi sia alcuna relazione lineare tra il valore delle azioni di Audi e BMW, ma non necessariamente ciò implica la mancanza di un qualsiasi altro tipo di relazione. Modello di regressione Audi - BMW 94 92 90 BMW 88 86 84 82 80 78 590 600 610 620 630 640 Audi 650 660 670 680 690 Andamento azioni Audi Audi 700 680 660 640 620 600 580 560 Andamento azioni BMW Bmw 94 92 90 88 86 84 82 80 78 76 74 72 Che correlazione stiamo cercando? Il secondo interrogativo che ci siamo posti è stato: Apple – Microsoft I due colossi informatici americani vedono correlato il valore delle loro azioni all’andamento del loro concorrente per eccellenza? Apple - Microsoft Il divario economico tra i due titoli azionari in questo caso è decisamente minore rispetto a quello visto in precedenza, nello specifico la media che un titolo azionario Apple ha assunto in questo periodo di osservazioni è di 123€, mentre Bill Gates chiede esattamente 63€ per acquistare un’azione della sua celebre azienda. Per quanto riguarda i titoli azionari marcati Apple si nota un’asimmetria positiva, ovvero quando la media è maggiore della mediana (119€) significa che più del 50% dei valori si troverà in un frangente inferiore al valore medio sopra indicato, con la conseguenza che sarà più probabile che il titolo azionario assuma valori inferiori alla media. Non si può dire lo stesso dei titoli azionari di Microsoft, per i quali media e mediana praticamente coincidono. Apple - Microsoft Per quanto riguarda la variabilità dei titoli azionari in esame, ci troviamo in due fattispecie differenti. I titoli azionari Apple hanno una variabilità maggiore rispetto a quelli concorrenti, infatti il loro coefficiente di variazione è del 7%, con un campo di variazione nell’ultimo trimestre di 30€. Decisamente più stabili sono i titoli azionari di Microsoft, che oscillano poco intorno alla media, più precisamente si sono riscontrate variazioni di appena 2 punti percentuali, ed un campo di variazione che nell’ultimo trimestre ha fatto registrare scostamenti di appena 4€ dal valore medio. Da questo deduciamo che il secondo titolo sia più stabile e apparentemente più sicuro dal punto di vista del rendimento, poiché si è sempre tenuto più o meno sugli stessi valori. Apple - Microsoft Differentemente da quanto osservato in precedenza, notiamo che il coefficiente di correlazione questa volta è molto prossimo a 1, precisamente assume un valore di 0,8, ciò significa che siamo molto vicini a quella che si definisce una relazione lineare positiva, ovvero che i punti aventi come coordinate i titoli azionari delle due aziende tendono ad allinearsi lungo una retta , caratterizzata da un andamento crescente. Ricordiamo che i valori assumono mediamente, una relazione lineare positiva, cioè possono esserci valori che si scostino da questo trend, ma non influenzino in maniera rilevante l’andamento generale. Nello specifico, sappiamo che la retta alla quale tendono questi punti è definita da y = 48,4 + 0,12x. Modello di regressione Apple - Microsoft 67 66 65 Microsoft 64 63 62 61 60 59 58 105 110 115 120 125 Apple 130 135 140 145 Andamento titoli azionari Apple e Microsoft 160 140 120 100 80 60 40 20 0 Altre relazioni Non sono solo queste le conclusioni che volevamo raggiungere. Ci siamo chiesti se ci fosse una correlazione anche tra… Audi – Deutsche Bank Il valore delle azioni dell'Audi e il valore delle azioni della Deutsche Bank, banca di riferimento della casa automobilistica? Audi – Deutsche Bank In questo caso non ci troviamo a paragonare titoli azionari appartenenti a società operanti allo stesso settore, infatti appartengono una al settore automobilistico e l’altra invece è la banca di riferimento per la nazione tedesca, proprio quella dove è situata la sede principale del noto marchio automobilistico. Sicuramente non è utile studiare i due titoli azionari dal punto di vista del valore che hanno assunto in questo trimestre, in quanto un’azione della banca tedesca (la cui media si aggira intorno ai 17,5€) è sicuramente meno costosa rispetto ad un’azione dell’Audi, ma è comunque interessante studiare il loro trend. Infatti osservando il modello di regressione lineare si può notare una sottile correlazione positiva tra le due società. Nello specifico questo coefficiente di correlazione assume il valore di 0,65 che indica mediamente una correlazione positiva, ciò sta a dire che la correlazione non è così forte da supporre che a ogni aumento unitario del valore di un’azione di Audi ne consegua sempre un aumento del valore della azioni della Deutsche Bank, ma in buona approssimazione si può dire che «spesso» all’aumentare del valore di uno consegue l’aumentare dell’altro. Audi – Deutsche Bank 25 20 15 10 5 0 590 600 610 620 630 640 650 660 670 680 690 Che correlazioni stiamo cercando? Potrebbe esistere una correlazione tra… Microsoft – Deutsche Bank Il colosso informatico americano e la principale banca tedesca? Microsoft – Deutsche Bank Inaspettatamente ci siamo accorti che il valore delle azioni di Microsoft è fortemente correlato all’andamento delle azioni della banca tedesca, questo non significa che ci debba essere obbligatoriamente una relazione implicita secondo per la quale i due titoli azionari dipendano l’uno dall’altro, infatti in questo elaborato ci siamo sempre preoccupati di non dire mai la parola «relazione» perché non è vero che l’andamento simile di tue titoli azionari implichi sempre una relazione tra i due, noi ci occupiamo solo di analizzare l’andamento ed esporre considerazioni attingendo solamente dai dati, senza spiegare il vero motivo per cui l’andamento di due titoli azionari, affini o completamente diversi, sia cosi simile. Microsoft – Deutsche Bank Non vogliamo saltare subito alle conclusioni, per cui analizziamo prima i caratteri simili di Microsoft e Deutsche Bank. Questi titoli azionari assumono valori medi diversi, infatti come già detto un’azione Microsoft ha un valore economico di 63€ mentre un’azione di Deutsche Bank si vede attribuire sul listino di borsa solamente 17,7€. Nonostante questa diversità i due titoli hanno in comune una varianza, e contestualmente lo scarto quadratico medio, decisamente esigui, infatti assumono valori molti piccoli, sia per Microsoft che presenta una varianza di 2,2 e scarto quadratico medio di 1,5, sia per Deutsche Bank con varianza 1,4 e scarto quadratico medio 1,2. Microsoft – Deutsche Bank Ma questi sono soltanto numeri, che paragonati ci dicono veramente poco di quanto i valori dei titolo si siano discostati dalla media in questi ultimi mesi. L’unico indicatore che è possibile paragonare, relativamente alla variabilità, è il coefficiente di variazione, che in questo caso per Microsoft è del 2,3% mentre per Deutsche Bank è del 6,6%, insomma per quanto ci aspettassimo valori piccoli, un discostamento del 6,6% non è del tutto trascurabile, questo per mettere in evidenza che valori di varianza e scarto quadratico medio relativamente simili, paragonati mediante un indicatore «puro» hanno incidenza diversa. Microsoft – Deutsche Bank Dai dati però apprendiamo che in questi mesi l’andamento di questi due titoli azionari ha sempre assunto una tendenza molti simile, resa visibile in primis dal coefficiente di correlazione il quale, indicando un valore relativamente molto alto come 0,82, suggerisce che all’aumento di valore di un’azione Microsoft corrisponda quasi sempre un corrispondente aumento del valore del titolo azionario di Deutsche Bank, ricordando sempre le parole «a meno di un errore» che significa che sono ammessi sporadici scostamenti dall’andamento generale, pur non modificando significativamente il trend. Modello di regressione Microsoft – Deutsche Bank 25 20 15 10 5 0 58 59 60 61 62 63 64 65 66 67 Un piccolo imprevisto Purtroppo durante il nostro percorso abbiamo incontrato un imprevisto. Infatti era nostra intenzione verificare una correlazione tra l’indice di borsa italiana (FTSE Mib) e la Deutsche Bank. Questa correlazione a tutti gli effetti e il coefficiente di correlazione in questo caso è molto prossimo a 1, raggiungendo il valore esatto di 0,84, questo significa che esiste una forte correlazione positiva tra i due titoli azionari. Tuttavia questa analisi era volta a dimostrare una sorta di correlazione indiretta tra la banca tedesca e una delle principali banche italiane, l’Unicredit, attraverso appunto la presumibile correlazione tra i valori dei titoli azionari della banca italiana e l’indice di borsa del nostro paese. Deutsche Bank FTSE MIB Unicredit Ed è proprio qui che la nostra analisi non ha potuto dare i frutti sperati perché è avvenuto un fatto che ha fortemente influenzato i valori azionari che stavamo raccogliendo… Unicredit – Aumento di capitale sociale Per questo motivo si sono verificati diversi avvenimenti che hanno reso difficile, se non inutile e poco rappresentativo, raccogliere i valori del titolo azionario: Molteplicità di valori per lo stesso titolo, dipendentemente dal fatto che si trattasse di azioni di cui si fosse esercitato il diritto di recesso, oppure azioni che gli azionisti erano disposti a mantenere nel portafogli. Mancanza del presupposto di condizioni omogenee tra l’inizio e la fine della raccolta dei dati, come abbiamo detto in classe fare la media di gente che prende la bici in una settimana senza tenere conto del fatto che piova o meno porterà sicuramente ad un risultato, ma non quello desiderato in quanto si deve tenere conto anche delle condizioni in cui si raccolgono i dati e per un certo verso la società con cui avevamo iniziato la nostra analisi è diversa da quella con cui saremmo andati a concludere la nostra ricerca. Inferenza Prendiamo in considerazione l’indice FTSE Mib, con la differenza che questa volta prendiamo in considerazione le nostre rilevazioni come un campione di una popolazione molto più ampia. La differenza primaria è che in questa seconda parte della presentazione ci aspetteremo un coefficiente di errore (α), in quanto quelle che andremo a fare saranno supposizioni basate sui dati, ma non dati certi. Da qui consegue che la media e la varianza che prima davamo per note, adesso non lo sono più, infatti parleremo di media campionaria e di varianza campionaria. Cosa vogliamo pronosticare? Come già detto non conosciamo quale sia effettivamente la media di tutti i valori che l’indice di borsa italiana ha assunto dal 2009 ad oggi, definita anche come media della popolazione, ma l’unica media che possiamo definire è quella del nostro campione. Vale lo stesso discorso per la varianza dell’indice di borsa. A questo punto, partendo dal nostro campione otteniamo la media campionaria, che in questo caso è pari a 18.854,61€, che definiremo analiticamente come 𝒙. Varianza campionaria Allo stesso tempo calcoliamo la varianza campionaria, la quale per essere compresa al meglio necessita di qualche spiegazione aggiuntiva. Analiticamente la varianza campionaria𝒏si calcola come: 𝑺𝟐 = 𝟏 𝒏−𝟏 (𝒙𝒊 − 𝒙)𝟐 𝒊=𝟏 Di particolare rilievo è il denominatore n – 1 in quanto è stato confermato che per i campioni, in particolare quelli di piccole dimensioni, sia più calzante la rappresentazione proposta rispetto a quella che si otterrebbe dividendo per il numero delle osservazioni. Una volta svolto il calcolo sopra citato abbiamo ottenuto una varianza campionaria pari a 732.168,2€ Distribuzione normale σ2 𝑋 ~ 𝑁 µ; 𝑛 È importante supporre la distribuzione della popolazione come normale, mentre quella relativa alla media del campione deve essere una distribuzione tale per cui la σ2 media sia pari a µ e la varianza sia pari a . In estrema sintesi questo equivale a dire 𝑛 che i valori della popolazione si possono mostrare grazie alla seguente distribuzione: Distribuzione «t-Student» Ma come ci insegna il nostro manuale, quando la varianza della popolazione a cui ci riferiamo non è nota, come nel nostro caso, per procedere con il processo di inferenza bisogna introdurre un secondo tipo di distribuzione, detta «t-Student». La rappresentazione grafica della suddetta distribuzione è la seguente, ed è importate sottolineare che per gradi di libertà elevati tende ad una normale. Intervallo di confidenza per la media campionaria Dal momento che la nostra media campionaria è solamente uno dei tantissimi valori che potrebbe assumere questo parametro, è opportuno stabilire un intervallo di valori plausibili per quel parametro. Detto in parole più semplici, vogliamo costruire un intervallo per ogni campione entro cui può ricadere la media della popolazione in questione. Sarà dunque a nostra discrezione decidere il valore che assumeremo come coefficiente di errore (α), e noi lo poniamo pari a 5%. Intervallo di confidenza per la media Esiste una vera e propria formula per ottenere l’intervallo desiderato, ed è la seguente: 𝒙 ± 𝒕 𝜶 𝒏−𝟏 , 𝟐 ∗ 𝑺𝟐 𝒏 Svolgendo i calcoli otteniamo un intervallo di confidenza di estremi: [18.628,55 ; 19.080,67] Cosa abbiamo fatto? Abbiamo determinato gli estremi di un intervallo che verosimilmente contiene la media della popolazione. Se si estrae ripetutamente e in modo indipendente un numero molto elevato di campioni dalla stessa popolazione e si determinano i relativi intervalli di confidenza, il 95% di intervalli conterrà il valore della media della popolazione in esame.