Corso di Laurea in “Economia e Finanza” Statistica 1 A.A. 2016/2017 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro Obiettivi del corso Il corso ha come obiettivo fondamentale l’introduzione ai concetti di base della Statistica, vista, in generale, come disciplina fondamentale nel processo di acquisizione della conoscenza scientifica e, in particolare, delle conoscenze economiche. Non si può, infatti, in questo ambito prescindere da una solida base quantitativa per poter effettuare, ad esempio, opportune analisi di tipo economico. In particolare si farà riferimento ai metodi di quella parte della Statistica, nota come “Statistica Descrittiva”, che servono per fornire gli strumenti pratici e tecnici relativi alla misura, al rilevamento ed al trattamento di dati propri dell’analisi economica. 1 / 38 Programma Moduli didattici Lezioni CFU Esercitazioni Laboratorio Totale Modulo 1: Introduzione alla Statistica, caratteri statistici, rappresentazione grafiche e tabellari, numeri indice 12 6 0 18 Modulo 2: Analisi della distribuzione di un carattere: le medie e gli indici di variabilità 12 6 0 18 Modulo 3: Confronto tra distribuzioni empiriche e teoriche 10 4 0 14 Modulo 4: studio della dipendenza e dell’interdipendenza statistica 14 8 0 22 2 / 38 Modalità di svolgimento degli esami L’esame consisterà in una prova scritta ed in una prova orale. La prova scritta prevederà alcune domande di tipo teorico e la risoluzione di alcuni esercizi; non sarà consentito l’uso di libri o appunti, si potranno utilizzare solo una calcolatrice scientifica non programmabile e il prontuario della distribuzione normale. Non sarà, inoltre, consentita per nessun motivo l’uscita dall’aula in cui si svolgerà la prova. Chiunque non dovesse attenersi a queste indicazioni, verrà immediatamente escluso dalla prova. Se la prova scritta verrà valutata insufficiente, l’esame si riterrà non superato e quindi concluso. Nel caso in cui la prova scritta verrà valutata positivamente, si procederà alla prova orale, alla fine della quale verrà formulato dalla Commissione Esaminatrice un giudizio (comprensivo anche della votazione finale) sull’intera prova d’esame (scritto e orale). La data relativa alla prova orale sarà fissata solitamente un paio di giorni dopo lo svolgimento della prova scritta. IMPORTANTE: I primi 15 minuti della prova scritta possono essere utilizzati dal candidato per valutare se si è in grado di affrontare positivamente la prova. Potrà partecipare alla prova scritta solamente chi si è inscritto in tempo utile utilizzando il servizio di prenotazione e verbalizzazione on-line dell’Ateneo. Non verranno ammesse deroghe. 3 / 38 Conoscenze propedeutiche Come previsto dal regolamento didattico del Corso di Laurea in Economia e Finanza, è necessario aver sostenuto l’esame di Matematica Generale per sostenere l’esame di Statistica 1. In ogni caso, per poter seguire proficuamente il corso si ritiene necessario che lo studente disponga di conoscenze matematiche di base (almeno i concetti di limite, derivata e integrale). Testi consigliati Per il modulo 1: appunti forniti dal docente. Per il modulo 2: appunti forniti dal docente. Per il modulo 3: Borra & Ciaccio, Introduzione alla Statistica Descrittiva, McGraw, 1996, Capitoli 7 e 8. Per il modulo 4: Frosini, Metodi Statistici, Caroccio 2001, Capitoli 9 e 10. Per le esercitazioni: Frosini, Montinaro, Nicolini, Complementi ed esercizi di Statistica, Vol. 1, Statistica Descrittiva, Tirrenia Stampatori, 1998. 4 / 38 Ricevimento Studenti Lunedı̀ ore 15.00 - 17.00 Mercoledı̀ ore 15.00 - 17.00 Per il ricevimento gli studenti devono prenotarsi mediante il seguente sito web http://www.unipa.it/persone/docenti/a/luigi.augugliaro Per altro materiale e informazioni sul corso è possibile consultare il sito web http://dssm.unipa.it/augugliaro/teaching.html 5 / 38 Il problema In un reparto dove sono assemblati walkman vengono, in tre giorni diversi, provate tre differenti organizzazioni delle linee di produzione. Le tre diverse organizzazioni sono chiamate nel seguito “vecchia” (quella in uso al momento dell’esperimento) “nuova 1” e “nuova 2”. Nei tre giorni, per ciascuno dei 288 addetti che lavorano nel reparto, viene rilevato “il numero di operazioni completate” che, ovviamente, può essere visto come una misura della produttività. Domanda: qual è l’organizzazione del lavoro migliore? 6 / 38 I dati Vecchia organizzazione 703 693 697 715 698 727 688 709 690 722 695 707 696 694 700 713 708 699 696 700 700 718 715 708 694 708 714 711 728 700 719 714 710 696 718 701 709 694 701 706 708 710 693 708 703 716 701 705 717 713 696 707 690 698 708 704 694 679 696 707 695 711 698 701 699 701 705 705 718 719 694 716 714 705 713 686 719 710 707 704 701 701 688 719 705 710 680 730 703 714 716 698 710 699 720 699 696 701 704 701 715 695 712 711 709 708 703 720 698 727 718 715 709 710 691 704 695 686 703 714 706 703 715 698 710 701 705 715 711 684 695 704 709 705 692 709 708 704 719 710 709 722 713 716 714 692 691 701 711 701 710 717 696 706 702 697 707 707 681 696 703 720 697 711 703 704 701 693 696 699 727 719 695 704 703 681 709 710 727 715 704 715 700 720 710 708 686 722 702 698 718 694 712 690 708 708 702 712 718 725 707 711 699 694 690 712 711 703 704 697 711 702 708 723 716 717 699 679 701 703 719 714 712 696 706 712 713 703 707 708 719 708 724 723 724 714 724 716 718 715 689 713 689 706 716 695 700 701 716 710 704 724 719 700 705 709 693 706 699 710 713 699 722 724 714 692 693 688 689 721 706 713 712 710 708 701 702 687 714 710 707 714 693 713 704 713 715 703 703 693 697 715 698 727 688 709 690 722 695 707 696 694 700 713 708 699 696 700 700 718 715 708 694 708 714 711 728 700 719 714 710 696 718 701 709 694 701 706 708 710 693 708 703 716 701 705 717 713 696 707 690 698 708 704 694 679 696 707 695 711 698 701 699 701 705 705 718 719 694 716 714 705 713 686 719 710 707 704 701 701 688 719 705 710 680 730 703 714 716 698 710 699 720 699 7 / 38 I dati Organizzazione “nuova 1” 708 710 698 695 707 688 685 699 681 691 693 719 712 711 693 736 705 693 695 719 736 730 704 685 750 714 739 715 712 711 695 710 702 688 706 728 695 710 716 703 702 678 698 685 716 671 711 701 699 722 700 711 715 706 692 720 716 703 708 691 692 743 705 686 729 715 670 709 725 705 670 713 701 689 670 716 688 694 695 735 711 702 699 709 671 692 696 679 693 707 687 709 679 711 687 688 688 686 698 706 730 673 713 693 675 690 693 721 704 701 695 685 696 687 695 710 706 703 693 680 715 711 685 725 730 728 738 713 706 683 680 689 691 715 674 702 692 690 689 706 698 717 715 682 693 701 697 713 705 688 696 693 677 706 711 708 731 695 690 672 723 690 689 698 703 682 704 672 688 681 698 685 691 697 694 699 694 697 723 687 699 700 687 678 680 694 674 717 688 693 696 690 715 685 678 715 729 720 673 672 682 713 719 716 713 707 698 708 683 697 684 711 742 740 688 683 740 712 699 673 717 701 727 690 692 678 722 692 705 692 704 715 699 699 695 706 685 702 704 682 758 698 712 692 691 704 700 707 683 683 698 713 725 707 702 720 683 695 703 676 706 678 715 687 679 709 724 706 675 690 682 737 697 715 732 687 720 688 696 696 697 721 703 737 688 703 716 732 708 710 698 695 707 688 685 699 681 691 693 719 712 711 693 736 705 693 695 719 736 730 704 685 750 714 739 715 712 711 695 710 702 688 706 728 695 710 716 703 702 678 698 685 716 671 711 701 699 722 700 711 715 706 692 720 716 703 708 691 692 743 705 686 729 715 670 709 725 705 670 713 701 689 670 716 688 694 695 735 711 702 699 709 671 692 696 679 693 707 687 709 679 711 687 688 8 / 38 I dati Organizzazione “nuova 2” 738 734 707 732 712 714 732 719 726 707 706 718 709 710 727 714 707 705 737 721 704 719 701 726 695 739 702 746 731 714 723 749 703 753 707 717 733 715 725 724 728 712 713 730 725 749 723 735 742 732 712 710 706 691 711 704 724 722 708 737 748 717 686 712 695 713 713 720 722 733 718 711 710 703 709 708 713 733 712 718 704 718 728 713 742 701 738 733 707 747 709 714 715 726 706 741 706 704 717 705 722 710 723 728 707 714 729 728 728 748 704 712 737 705 740 697 727 744 703 712 702 710 716 712 711 713 705 721 700 730 746 712 748 715 731 730 699 735 744 682 725 738 737 716 709 751 721 727 703 699 727 722 717 731 720 735 728 758 720 713 748 723 731 699 701 691 723 725 720 723 733 705 712 700 716 715 725 734 734 690 729 736 742 701 756 735 707 737 711 695 733 743 742 716 742 739 752 715 731 720 724 691 708 733 725 702 693 716 705 739 717 718 731 696 737 714 746 716 735 719 725 705 695 704 724 718 700 718 719 717 742 726 709 716 716 718 698 733 721 698 698 709 694 733 731 744 722 709 718 701 748 709 726 749 725 737 729 698 725 722 726 700 722 722 716 689 707 737 685 751 721 710 699 740 732 710 728 703 701 691 720 710 722 729 742 722 679 752 738 734 707 732 712 714 732 719 726 707 706 718 709 710 727 714 707 705 737 721 704 719 701 726 695 739 702 746 731 714 723 749 703 753 707 717 733 715 725 724 728 712 713 730 725 749 723 735 742 732 712 710 706 691 711 704 724 722 708 737 748 717 686 712 695 713 713 720 722 733 718 711 710 703 709 708 713 733 712 718 704 718 728 713 742 701 738 733 707 747 709 714 715 726 706 741 9 / 38 Frequenze assolute 670 a 675 675 a 680 680 a 685 685 a 690 690 a 695 695 a 700 700 a 705 705 a 710 710 a 715 715 a 720 720 a 725 725 a 730 730 a 735 735 a 740 740 a 745 745 a 750 750 a 755 755 a 760 Totale vecchia 0 2 4 13 23 35 55 52 50 33 15 6 0 0 0 0 0 0 288 nuova 1 13 12 20 33 33 38 27 28 28 19 12 9 4 7 3 1 0 1 288 nuova 2 0 1 2 3 8 13 24 34 32 32 34 27 30 17 12 12 5 2 288 10 / 38 Varie definizioni della Statistica “La Statistica è l’insieme di ciò che è realmente notevole in uno Stato, la costituzione nel più generale, e l’esposizione della costituzione di uno o più Stati” (Orchenwald). “La Statistica è lo studio dell’enumerazione delle cose, delle persone e dei fatti” (Berillon). “La Statistica è la disciplina induttiva, appropriata alla trattazione quantitativa dei fenomeni collettivi, cioè di quei fenomeni che si manifestano in masse di osservazioni” (C. Benedetti). “Intenderemo per Statistica la scienza che ha lo scopo di raccogliere e coordinare fatti numerati in ogni specie, in modo da ottenere rapporti numerici sensibilmente indipendenti dalle anomalie del caso e che denotano l’esistenza di cause regolari la cui azione si è combinata con quella di cause fortuite” (Cournot). La Statistica è un metodo di studio dei caratteri variabili rilevabili su collettività avente per scopo la sintesi delle informazioni disponibili e la loro estensione induttiva a casi più generali” (A. Naddeo). 11 / 38 “La Statistica è una metodologia scientifica ausiliaria; il suo compito è approntare metodi per la raccolta, l’elaborazione, l’analisi e l’interpretazione di dati numerici allo scopo di conoscere la struttura dei fenomeni di massa” (Kellerer). “La Statistica è il ramo del metodo scientifico che tratta i dati ottenuti dall’enumerazione e dalla misurazioni di popolazioni di fenomeni naturali, riguardanti tutti gli accadimenti del mondo esterno, nuovo e non” (M.G. Kendall). “La Statistica è la scienza e l’arte dello sviluppo e delle applicazione dei metodi più efficaci di raccolta, sistemazione e interpretazione di dati quantitativi, in modo che l’affidabilità delle conclusioni e delle stime possa stabilirsi per mezzo di ragionamento induttivo basato sulla matematica della probabilità” (Anderson e Bancroft). 12 / 38 Tentativo di definizione della Statistica: processo di acquisizione della conoscenza (G. Galilei) La Statistica, in quanto disciplina ausiliaria, prende le mosse dall’osservazione del fenomeno della natura - osservazione che fornisce alla studioso informazioni sul carattere o sui caratteri che lo contraddistinguono sotto forma di dati più o meno numerosi - organizza tali dati, li predispone per l’analisi e li elabora per condensare le informazioni in esse contenute in particolari valori tipici a quali attribuire un valido significato che costituirà l’informazione di base per un’attendibile formulazione di ipotesi sui meccanismi che regolano i fenomeni, per passare in fine alla verifica delle teorie costruite sulla base delle ipotesi formulate. Il complesso dei metodi, delle tecniche e delle procedure poste in essere dalla letteratura statistica per assolvere ai compiti indicati in precedenza, costituiscono i contenuti e lo scopo della statistica in quanto disciplina ausiliaria. 13 / 38 Terminologia Nome Età Sesso Titolo di studio Attività Peso (Kg) Punteggio esercizi Rossi M. Bianchi G. Nicoletti C. Marcelli F. Petrone A. 32 39 46 28 51 M F M M F laurea laurea diploma diploma diploma occupato occupato disoccupato studente casalinga 72 55 79 63 64 65 55 53 78 21 In tabella, ogni riga corrisponde a un individuo del quale sono stati rilevati il Nome, ossia una caratteristica che lo identifica in maniera univoca, e le caratteristiche Età, Sesso, Titolo di studio, Attività, Peso, Punteggio riportato in alcuni esercizi. Ciascuno di queste caratteristiche o caratteri, assume in corrispondenza di un determinato individuo una determinata modalità. Per esempio il carattere Peso assume la modalità 72 in corrispondenza dell’individuo Rossi. Le modalità possono essere numeriche, come nel caso dei caratteri Età, Peso, Punteggio esercizi oppure non-numeriche, come per i caratteri Sesso, Titolo di Studio, Attività 14 / 38 Definizione Si definisce unità statistica l’unità elementare su cui vengono osservati i caratteri oggetto di studio. Definizione Un insieme delle unità statistiche omogenee rispetto ad uno o più caratteristiche costituisce un collettivo statistico o una popolazione. Se tutte le unità che costituiscono la popolazione sono effettivamente osservabili, il collettivo viene detto empirico, altrimenti viene definito teorico. Se l’insieme è costituito da un numero finito di unità statistiche viene detto finito, altrimenti viene detto infinito. L’insieme delle autovetture che una fabbrica è in grado di produrre può essere inteso come un collettivo empirico infinito. L’insieme dei potenziali malati di un certa patologia può essere inteso come un collettivo teorico infinito. 15 / 38 A volte la corretta definizione dell’unità statistica richiede una definizione convenzionale molto dettagliata che elimini possibili ambiguità. Famiglia Insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o vincoli affettivi, coabitanti e aventi dimora abituale nello stesso comune (anche se non sono ancora iscritte nell’anagrafe della popolazione residente del comune medesimo). Una famiglia può essere costituita anche da una sola persona. L’assente temporaneo non cessa di appartenere alla propria famiglia sia che si trovi presso altro alloggio (o convivenza) dello stesso comune, sia che si trovi in un altro comune. http://www3.istat.it/servizi/studenti/binariodie/CorsoExcel/Glossario.htm 16 / 38 Classificazione dei caratteri statistici Un carattere può assumere modalità differenti in corrispondenza delle diverse unità statistiche del collettivo. Le modalità del carattere debbono essere esaustive e non sovrapposte. Con il termine esaustive si intende che le modalità elencate devono rappresentare tutti i possibili modi di manifestarsi del carattere. Le modalità si definiscono non sovrapposte se ad ogni unità si può associare una sola modalità. Definizione Quando le modalità sono espresse numericamente, il carattere è detto quantitativo (o variabile) altrimenti è detto qualitativo (o mutabile). 17 / 38 La distinzione dei caratteri in qualitativi e quantitativi non è sufficiente ed è necessario specificare come maggiore dettaglio la natura del carattere. Nell’ambito della teoria della misurazione, nel 1946 lo psicologo Stevens introdusse una classificazione dei caratteri statistici che tuttora trova utilizzo e che si fonda sul concetto di scala di misura. Vengono definite quattro distinte scale di misura: nominale, ordinale, per scala di intervallo, per scale di rapporto 18 / 38 Tipo di dato Carattere qualitativo sconnesso (scala nominale) Carattere qualitativo ordinato (scala ordinale) Variabile quantitativa per scala di intervallo Variabile quantitativa per scala di rapporto Relazione Relazione di equivalenza: date due modalità è possibile affermare soltanto se queste sono uguali o diverse. + Relazione d’ordine: date due modalità è possibile dare un ordine, specificando che una precede l’altra. + Relazione di uguaglianza: non esiste uno zero assoluto, naturale e non arbitrario. + Relazione di rapporto: esiste uno zero assoluto, naturale e non arbitrario. 19 / 38 Saper riconoscere la scala di misurazione del fenomeno osservato è di fondamentale importanza per la determinazione degli strumenti statistici più idonei ad analizzarlo. Infatti, ad ogni scala corrispondono delle specifiche operazioni logico/aritmetiche che permettono di trattare in modo diverso i dati raccolti. Scala di misura Relazione Operazione logico/artimetica Scala nominale Relazione di equivalenza + Relazione d’ordine + Relazione di uguaglianza + Relazione di rapporto operazione di uguaglianza/disuguaglianza + operazione di maggiore/minore + operazione di somma algebrica + operazione di prodotto algebrico Scala ordinale Scala di intervalli Scala di rapporti 20 / 38 Esempi caratteri sconnessi sono: Sesso, Attività, Luogo di nascita, Stato civile, Religione, Colore degli occhi, etc; caratteri ordinati sono quelli che esprimono un grado di soddisfazione (poco, abbastanza, molto), la posizione in una graduatoria, il titolo di studio (con modalità: senza titolo, licenza elementare, licenza media, diploma, laurea, dottorato); un esempio di carattere con scala ad intervalli è la temperatura misurata tramite la scala Celsius. Infatti, lo zero utilizzato è uno zero convenzionale e fissato in corrispondenza del punto di fusione del ghiaccio in una miscela d’acqua satura d’aria; i caratteri quantitativi più comuni sono su scala di rapporti: Peso, Reddito, Lunghezza di un oggetto, etc. 21 / 38 Le variabili quantitative vengono inoltre distinte in continue e discrete Una variabile quantitativa viene definita discreta quando l’insieme delle valori assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri interi. Dalla definizione discende che l’insieme dei valori assumibili da una variabile quantitativa discreta ha cardinalità finita o al più infinito numerabile. Una variabile quantitativa viene definita continua quando l’insieme delle valori assumibili può essere messo in corrispondenza biunivoca con un sottoinsieme dei numeri reali. 22 / 38 Un carattere viene detto trasferibile se ha senso immaginare che un’unità statistica possa cedere tutto o parte del carattere posseduto ad un altra unità statistica. Un esempio di carattere trasferibile è il “Reddito”, cosı̀ come per un collettivo di aziende il “Fatturato” o il “Numero di operaio dipendenti”. Non sono caratteri trasferibili il “Peso”, “l’Età”, il “Titolo di studio”. 23 / 38 Variabili semplici e multiple Si ha una variabile multipla quando sullo stesso oggetto o soggetto si rilevano contemporaneamente le modalità o valori di k, con k > 1, caratteri. Nel caso in cui k = 1 si ha una variabile semplice. Le variabili multiple si dividono in omogenee o miste. Una variabile multipla è definita omogenea quando le k variabili semplici che la compongono sono rilevate con la stessa unità di misura; è definita mista nei restanti casi. 24 / 38 Dati spaziali, temporali e territoriali Un aspetto importante dei dati statistici, legato alla natura del fenomeno in esame e che influisce molto sul tipo di metodologia da adottare per estrarre informazioni sintetiche, è quello che distingue i dai statistici in spaziali, temporali e territoriali. Vengono definiti spaziali tutti i caratteri (qualitativi o quantitativi) per i quali non è importante l’ordine con cui sono state fatte le osservazioni. Se, ad esempio, stiamo indagando sul carattere “Altezza”, ai fini della determinazione delle informazioni sintetiche, non è importante se un individuo è stato osservato prima o dopo ma è importante solamente il contenuto informativo del dato. 25 / 38 Vengono definiti temporali tutti i caratteri (qualitativi o quantitativi) per i quali è fondamentale il riferimento al tempo in cui sono state fatte le rilevazioni. In questi dati l’informazione è vincolata al tempo in cui è stata fatta la rilevazione. Essi descrivono l’evoluzione di fenomeni dinamici per i quali è importante lo studio del modo in cui evolvono nel tempo. Le serie statistiche che descrivono questo tipo di fenomeni sono dette serie temporali o storiche. 26 / 38 Vengono definiti territoriali tutti i caratteri (qualitativi o quantitativi) che, per finalità di descrizione territoriale, sono vincolati al posto in cui sono stati osservati. Si pensi ad esempio a studi sulla evoluzione territoriale di uno stato, di una regione, di una provincia o di un comprensorio, di fenomeni quali l’industrializzazione, la mobilità del lavoro, la natalità, la mortalità, etc, per i quali il dato rilevato in un dato particolare del territorio, in quanto indicativo delle caratteristiche di tale territorio, è vincolato, ad esempio, alle coordinate geografiche che lo individuano. 27 / 38 Esempi Tabella: Risposte date da 50 persone intervistate sul colore preferito nella confezione di un dato prodotto. grigio rosso verde giallo arancione azzurro azzurro grigio grigio violetto verde giallo rosso grigio azzurro verde azzurro verde grigio arancione rosso rosso violetto grigio verde arancione arancione verde grigio giallo verde violetto violetto giallo violetto azzurro giallo violetto arancione verde azzurro azzurro giallo giallo arancione verde giallo azzurro violetto violetto Come è facile verificare si tratta di una serie di osservazioni di una variabile semplice di tipo qualitativo sconnesso poiché le singole modalità del carattere “colore” non possono essere né misurate né poste in un qualche ordine coerente. 28 / 38 Tabella: Voti riportati ad un esame di “italiano” da 30 studenti. 8 9 8 8 5 6 8 8 5 4 7 6 4 7 10 7 9 7 9 5 8 5 7 4 10 7 10 4 6 5 Si tratta ovviamente di una serie di osservazioni di una variabile semplice di tipo qualitativo ordinabile perché le singole modalità del carattere “voto” riflettono i giudizi qualitativi del docente e non una misura della preparazione dello studente. 29 / 38 Nella seguente tabella sono riportati i valori delle resistenze elettriche di isolamento, espresse in unità di 100 megaohm, rilevati nel contesto di un progetto di controllo della qualità di manufatti elettrici. Tabella: Resistenze elettriche di isolamento di 30 manufatti elettrici in unità di 100 megaohm. 47.50 45.98 45.54 44.86 45.83 45.67 46.70 45.79 46.14 46.81 46.22 45.54 45.18 45.58 46.91 45.19 45.96 45.17 46.62 47.87 44.48 45.41 46.28 46.53 44.67 47.37 45.88 46.58 46.43 46.45 Si tratta ovviamente di una serie di osservazioni di una variabile semplice di tipo quantitativo continuo. 30 / 38 Tabella: Diametri in millimetri di 150 teste di chiodi. 11.16 11.48 11.43 11.24 11.26 11.20 11.26 11.45 11.36 11.16 11.19 11.13 11.26 11.40 11.12 11.43 11.16 11.30 11.20 11.24 11.30 11.33 11.37 11.29 11.40 11.22 11.25 11.30 11.23 11.21 11.21 11.39 11.19 11.27 11.38 11.38 11.27 11.12 11.28 11.32 11.39 11.19 11.36 11.22 11.51 11.20 11.39 11.33 11.21 11.38 11.23 11.34 11.37 11.40 11.29 11.30 11.26 11.29 11.19 11.43 11.35 11.37 11.16 11.20 11.19 11.32 11.30 11.30 11.10 11.33 11.31 11.25 11.32 11.18 11.34 11.30 11.33 11.17 11.21 11.17 11.25 11.36 11.06 11.31 11.35 11.26 11.31 11.29 11.22 11.21 11.35 11.29 11.30 11.36 11.22 11.45 11.28 11.37 11.43 11.23 11.40 11.27 11.33 11.30 11.14 11.28 11.44 11.21 11.30 11.18 11.45 11.49 11.50 11.35 11.46 11.34 11.31 11.43 11.33 11.34 11.26 11.36 11.08 11.29 11.33 11.42 11.28 11.39 11.23 11.17 11.23 11.49 11.36 11.34 11.36 11.23 11.44 11.29 11.31 11.26 11.36 11.28 11.19 11.34 11.28 11.42 11.30 11.18 11.50 11.33 31 / 38 Tabella: Dati dell’evaporazione giornaliera e di alcuni valori della temperatura in gradi Fahrenheit. Giorno 6 7 8 9 10 11 12 13 14 15 TGMAS TGMIS TGMS TGMAA TGMIA TGMA EVAP = = = = = = = TGMAS 87 85 72 101 84 80 92 75 83 80 TGMIS 81 67 59 84 63 80 79 71 69 74 TGMS 149 173 188 166 167 119 173 160 173 130 TGMAA 92 90 93 96 94 93 82 87 91 80 TGMIA 62 56 64 60 66 59 56 63 62 57 TGMA 172 172 170 172 175 169 173 171 171 162 EVAP 24 24 24 23 18 15 18 26 24 15 temperatura giornaliera massima del suolo temperatura giornaliera minima del suolo indice della temperatura giornaliera media del suolo temperatura giornaliera massima dell’aria temperatura giornaliera minima dell’aria indice della temperatura giornaliera dell’aria quantità di evaporazione del suolo durante un intero giorno 32 / 38 Ciascuna osservazione relativa a un giorno si compone di sette variabili semplici che descrivono sette caratteri diversi del fenomeno. Questa variabile multipla, se si esclude il dato sull’evaporazione, è omogenea perché con la stessa unità di misura, il grado Fahrenheit. 33 / 38 I diversi tipi di rilevazione Tra le situazioni in cui lo statistico si trova a operare per l’acquisizione dei dati bisogna distinguere quelle di tipo sperimentale da quelle osservazionali. Una situazione di rilevazione sperimentale è caratterizzata da: ipotesi di lavoro, costruite da enunciati formalizzati spesso in termini matematici; possibilità di controllare sia le condizioni in cui l’esperimento si svolge, sia le caratteristiche delle unità statistiche da impiegare. Situazioni sperimentali si possono trovare negli esperimenti fisici, chimici, biologici effettuati in laboratorio, in molti esperimenti chimici, negli esperimenti psicologici, etc. 34 / 38 In una situazione di rilevazione osservazionale non si ha la possibilità di controllare le condizioni sotto le quali si svolge l’osservazione e solo in parte si possono controllare le caratteristiche delle unità statistiche. Le situazioni osservazioni possono essere incontrate nelle indagini di mercato, nei sondaggi, nelle rilevazioni e in altre ancora. Tra le situazioni di rilevazione osservazionale più note troviamo l’indagine statistica che è la principale tecnica con cui si possono acquisire informazioni concernenti la manifestazione di un fenomeno su una data popolazione. L’obiettivo principale di un’indagine statistica è la conoscenza di una popolazione intesa come un insieme di unità elementari su cui si manifesta il fenomeno oggetto di studio. 35 / 38 Per la raccolta delle informazioni sui caratteri della popolazione possono essere utilizzati due diversi tipi di indagine: l’indagine totale o censuaria e l’indagine campionaria. Nell’indagine censuaria si rilevano i caratteri di interesse su tutte le unità costituenti la popolazione, mentre nel caso dell’indagine campionaria ci si limita ad un sottoinsieme di unità statistiche, ossia ad un campione. Il numero di unità statistiche costituenti il campione è definito numerosità campionaria. 36 / 38 Anche se le informazioni ottenute dalle unità di un campione sono state raccolte con cura e attenzione, esse costituiscono comunque un’approssimazione di ciò che si sarebbe potuto ottenere esaminando con la stessa cura l’intera popolazione. Malgrado ciò, alcune valide considerazioni di natura pratica e teorica hanno spinto gli statistici ad impiegare le indagini campionarie. Vantaggi dell’indagine campionaria La riduzione dei tempi e dei costi necessari all’effettuazione dell’indagine. L’attendibilità delle informazioni ottenibili da un campione può essere misurata e controllata. La qualità e la mole delle informazioni può essere maggiore di quella ottenibile da un’indagine totale. 37 / 38 Un’indagine statistica prevede la progettazione di un piano di lavoro in cui vengono definite le diverse fasi necessarie per lo svolgimento dell’indagine: 1. definizione degli obiettivi: definizione delle unità e dei caratteri da rilevare; scelta del periodo di riferimento; 2. individuazione della popolazione e della lista delle unità statistiche; 3. definizione del piano di campionamento; 4. raccolta dei dati: scelta della tecnica di rilevazione; formulazione del questionario; rilevazione sul campo; 5. registrazione dei dati: registrazione su supporto magnetico; controllo e correzione; 6. elaborazione ed analisi dei dati. 38 / 38