“PRINCIPI DI STATISTICA” PROF. GIOVANNI DI TRAPANI Università telematica Pegaso Principi di statistica Indice 1 PREMESSA ---------------------------------------------------------------------------------------------------------------------- 3 2 LA STATISTICA --------------------------------------------------------------------------------------------------------------- 4 2.1. BREVI CENNI NORMATIVI SULLA STATISTICA NELLA COMUNITÀ EUROPEA. ----------------------------------------- 5 3 L’INFORMAZIONE STATISTICA. --------------------------------------------------------------------------------------- 6 4 CONCETTI STATISTICI GENERALI ----------------------------------------------------------------------------------- 7 4.1 4.2 4.3 4.4 4.5 4.6 LE RILEVAZIONI STATISTICHE --------------------------------------------------------------------------------------------------- 8 POPOLAZIONE, CAMPIONE E UNITÀ STATISTICHE. --------------------------------------------------------------------------- 8 LE TIPOLOGIE DELL’INFORMAZIONE STATISTICA. ---------------------------------------------------------------------------- 9 LE MUTABILI ---------------------------------------------------------------------------------------------------------------------10 LE VARIABILI ---------------------------------------------------------------------------------------------------------------------11 LE SERIE STORICHE E LE SERIE CICLICHE. ------------------------------------------------------------------------------------11 Pag. 2 Università telematica Pegaso Principi di statistica 1 Premessa In questa lezione affronteremo alcuni concetti chiave della statistica. Dopo una prima breve definizione della Statistica e dei suoi obiettivi primari, analizzeremo i presupposti normativi della Statistica nella Comunità Europea. Successivamente definiremo l’informazione Statistica e i suoi requisiti. Si passerà poi ad una panoramica circa concetti generali delle statistiche; affrontando allora da un lato le rilevazioni; ed in quest’ambito passeremo ad analizzare i concetti fondamentali di Popolazione, Campione ed Unità Statistica. Infine sarà preso in esame lo studio delle diverse tipologie delle informazioni statistiche riferite alle Mutabili ed alle Variabili. Pag. 3 Università telematica Pegaso Principi di statistica 2 La Statistica Prima di passare ai temi ed ai concetti fondamentali per le applicazioni che saranno affrontate più avanti si ritiene opportuno, in questa seconda lezione, fornire alcune definizioni relativi al termine stesso di Statistica. A tale scopo si riporta la definizione di Zani il quale si esprime in questi termini: “La statistica è il metodo per la raccolta, la classificazione, l’elaborazione, l’analisi, dei dati utilizzati nelle scienze empiriche e per la generalizzazione dei risultati, in termini probabilistici, ai casi non osservati”. Per completezza appare utile citare anche Romanico Piccolo il quale brevemente definisce la Statistica come la “Scienza delle decisioni in condizione di incertezza, … che sull’esperienza e sulle evidenze empiriche”. La caratteristica principale, allora, della Statistica è che non può prescindere dall’osservazione di dati e di fatti, un’osservazione m che però deve seguire delle regole ben precise che sono attinenti sia alla raccolta dei dati sia alla gestione delle informazioni. Con i concetti sopra esposti introduciamo l’indagine statistica (o esperimento statistico) che si basa proprio sull’osservazione dei fenomeni i quali possono manifestarsi evidentemente in modalità diverse. Utile ai fini dello studio delle nozioni di base della statistica è il metodo statistico, assumendo come proprio il criterio induttivo. Tale Criterio induttivo opera attraverso l’analisi dei fenomeni collettivi allo scopo di ricavare, pur nella varietà delle singole manifestazioni le leggi soggiacenti ai fenomeni stessi in modo da evidenziarne eventuali regolarità e trarre anche delle previsioni. La Statistica è quindi la disciplina che studia i fenomeni collettivi di qualsivoglia natura la cui misura richiede la disponibilità di una massa di osservazioni individuali, e mira all’acquisizione, alla classificazione dei dati singoli, alla loro sintesi, per la formulazione di ipotesi e teorie circa i meccanismi di regolazione dei fenomeni stessi. La Statistica si divide i due importanti ambiti di analisi: - la Statistica descrittiva; - la Statistica inferenziale. La prima, la Statistica descrittiva, rappresenta l’insieme delle metodologie di analisi che si prefiggono la descrizione di determinati fenomeni; la seconda, la Statistica inferenziale, invece comporta processi di inferenza in probabilità per l’interpretazione dei risultati dell’analisi. Si tratterrà, allora, dall’osservazione di un certo numero di casi, di ricavarne la cosi detta legge del fenomeno, ovvero di “generalizzare” i risultati. Pag. 4 Università telematica Pegaso Principi di statistica Dopo questa descrizione dei concetti base della Statistica riteniamo necessario sintetizzare brevemente illustrare le proposizioni che la Statistica intende suggerire; a tal proposito possiamo affermare che, circa determinate informazioni la Statistica, si propone di: - Raccogliere; - Sintetizzare; - Interpretare. In conclusione la Statistica, raccogliendo le informazioni di cui si compone il fenomeno oggetto di studio, sintetizza in dati riassuntivi al fine di interpretarne i fattori che li influenzano e gli effetti che ne derivano. 2.1. Brevi cenni normativi sulla Statistica nella Comunità Europea. Il costante processo di integrazione dei Paesi membri alla Comunità Europea ha fatto si che tra gli argomenti di discussione del trattato istitutivo dell’Unione rientrasse anche la statistica che costituisce un importante strumento di programmazione economica e sociale. Lo scopo era quello di dotare la Comunità europea di informazioni statistica UFFICIALI; in quanto rappresenta un requisito “essenziale per lo sviluppo economico, demografico, sociale e ambientale nonché per la reciproca conoscenza e per il commercio tra gli Stati e i popoli della regione”. La nascita della Statistica ufficiale in Europa risale al 2 ottobre 1997 con l’adozione del trattato di Amsterdam, e con l’art. 285 di questo trattato le statistiche comunitarie assumono un valore costituzionale. Le basi normative della statistica ufficiale europea vengono sancite con il Regolamento n. 322/97, con il quale si organizza, in modo sistematico, la produzione di statistiche comunitarie. Il trattato di Amsterdam ha voluto definire alcune regole generali per la Statistica e l’art. 285 così ne sintetizza i principi: “La produzione delle statistiche comunitarie dovrà conformarsi ai principi di imparzialità, affidabilità, obiettività, indipendenza scientifica, efficacia e riservatezza; gli operatori economici non dovranno essere gravati da eccessivo onere statistico” In conclusione, possiamo affidare una Funzione sociale alla Statistica in quanto è oramai pienamente condiviso che ogni società evoluta necessita di informazioni economico-statistiche indipendenti, attendibili, imparziali, trasparenti ed accessibili, in grado di descrivere le condizioni ed i cambiamenti che avvengono in essa. Pag. 5 Università telematica Pegaso Principi di statistica 3 L’Informazione Statistica. La questione preliminare allo sviluppo di una indagine e all’utilizzo delle fonti riguarda la qualità dell'informazione statistica. Volendo semplificare, possiamo identificare le seguenti importanti dimensioni della qualità, che comunque le svilupperemo nelle lezioni successive: - pertinenza o efficacia - accuratezza - tempestività - regolarità - accessibilità - chiarezza - comparabilità - coerenza - completezza - affidabilità Passiamo allora a illustrane il significato di ciascun requisito dell’informazione statistica: Pertinenza o efficacia indica la capacità delle informazioni a soddisfare gli obiettivi conoscitivi dell’indagine. L’accuratezza indica la capacità delle stime di avvicinarsi ai valori incogniti della popolazione. Con la tempestività si indica il tempo che intercorre tra la rilevazione dei dati e la loro disponibilità, in altre parole è connessa alla possibilità per gli utenti finali di disporre di dati aggiornati. Relativamente alla regolarità possiamo affermare che indica la frequenza con cui il dato viene diffuso, mentre con il requisito dell’accessibilità ci si riferisce alla reperibilità e quindi alla possibilità offerta agli utilizzatori di utilizzare le informazioni. Ancora con il termine chiarezza riguarda la modalità espositiva attraverso le quali è stata condotta un indagine statistica. Per quanto riguarda il requisito della comparabilità, questa esiste se è assicurata la possibilità di effettuare confronti omogenei nel tempo e nello spazio, per coerenza si intende la possibilità di ottenere informazioni non contraddittorie dall'insieme delle fonti statistiche. Infine con completezza ed affidabilità, le informazioni devono fornire un quadro sufficientemente accurato e preciso dell'oggetto della ricerca. Pag. 6 Università telematica Pegaso Principi di statistica 4 Concetti statistici generali I concetti chiave che tratteremo riguardano le fondamentali modalità di trattamento dell'informazioni statistiche, in particolare ci riferiamo alle seguenti proprietà: Elencare; Classificare; Contare; Misurare; Stratificare; Sintetizzare; Correlare; Presentare. In qualunque problema di analisi statistica bisogna innanzitutto essere in grado di elencare con chiarezza quali sono le unità elementari, Successivamente sarà indispensabile classificare le unità elementari cioè raggrupparle in classi in funzione di determinati attributi ritenuti rilevanti. L'esito di una classificazione è comunque l'aggregazione delle unità elementari in un numero finito di classi nell'ambito della medesima classificazione. Quando le unità elementari sono state suddivise in classi, normalmente una prima informazione che sarà possibile trarre riguarda il numero di unità appartenenti alle singole classi. Incrociando, allora, due classificazioni, e contando il numero di occorrenze nei singoli incroci, si otterranno le cosiddette tabelle di contingenza, che sono degli strumenti di analisi statistica semplici e molto potenti. La maggior parte dei fenomeni può essere misurata adottando una scala di riferimento. Quando esiste un’unità di misura, l'informazione quantitativa risultante dal procedimento di misurazione prende il nome di variabile. Spesso è necessario misurare l'intensità di queste variabili in rapporto a quella di una altra variabile di riferimento; sarà così che si costruiranno i cosiddetti indicatori, che dal punto di vista matematico sono generalmente rapporti tra variabili. Tuttavia l'analisi di una variabile, o di indicatori, evidenzia l'esigenza di stratificare i dati, analizzando il comportamento all'interno di singole classi e verificando altresì quali differenze vi siano da classe a classe, oppure tra l'andamento dell'indicatore nella singola classe e quello tipico nella generalità dei casi. Pag. 7 Università telematica Pegaso Principi di statistica L'analisi statistica dei dati deve sempre privilegiare la sintesi. Esistono tecniche statistiche avanzate la cui logica di calcolo è complessa, ma i cui risultati sono di agevole interpretazione e che sono state studiate per sintetizzare il contributo informativo di una molteplicità di variabili. Ci riferiamo all’analisi fattoriale o alla cluster analysis. La prima è utile quando si voglia sintetizzare i risultati di indagine sui fenomeni effettuate tramite per esempio ai questionari, mentre la cluster analysis è indispensabile per classificare le unità elementari di rilevazione in relazione a fenomeni che non possono dar luogo ad un unico criterio di misurazione e suddivisione in classi. In questo secondo caso saranno colte determinate fenomenologie solo considerando simultaneamente una molteplicità di variabili. L'analisi statistica dei dati può, infine, servire ad indagare la relazione tra diversi fenomeni, calcolando le misure di correlazione tra le variabili e, con il metodo della regressione lineare o multipla, verificando se esistono leggi di causa-effetto che legano tra di loro le variabili. In un ultimo la presentazione di una tabella densa di numeri, pur rappresentando già una notevole sintesi, non consente spesso il colpo d'occhio sui fenomeni più significativi. Per questo l'informazione finale risulta di più semplice lettura se presentata anche sotto forma di grafici statistici, il cui scopo è, evidentemente, dare il giusto risalto ai dati più importanti. Abbiamo cosi sinteticamente evidenziato le modalità di trattamento delle informazioni statistiche. 4.1 Le rilevazioni statistiche Il complesso delle operazioni indirizzate all’acquisizione di una o più informazioni su un insieme di elementi oggetto di studio è detta rilevazione statistica. In questa fase occorre però fare chiarezza su determinati concetti riguardanti proprio le rilevazioni, ci riferiamo allora a: Popolazione Campione Unità statistiche 4.2 Popolazione, Campione e Unità statistiche. L’insieme (finito e infinito) delle unità statistiche sulle quali si effettua, tramite osservazioni e sperimentazioni, la rilevazione di uno o più caratteri rappresenta la Popolazione o collettivo statistico; un qualsiasi sottoinsieme derivato da una popolazione finalizzato ad uno studio statistico è, invece, detto Campione. In fine gli elementi rientranti nel campo di Pag. 8 Università telematica Pegaso Principi di statistica osservazione e sottoposti a rilevazione risultano essere le Unità statistiche. Da queste però dobbiamo distinguere le unità di rilevazione, che invece rappresentano le unità prescelte per effettuare ad esempio un’intervista. A tal proposito sottolineiamo che non sempre le unità statistiche coincidono con quelle di rilevazione: Ad Esempio nell’indagine dell’Istat sulle forze di lavoro, le unità di rilevazione sono le famiglie-campione mentre le unità statistiche sono costitute dai componenti intervistati della famiglia i cui risultati sono rapportati al totale della popolazione residente. Unitamente a questi concetti affronteremo anche elementi di notevole importanza ci riferiamo allora a : Carattere Modalità Frequenza Serie Seriazione Per Carattere si intende una qualsiasi quantità o qualità che varia, ossia che può assumere più valori o forme verbali. Invece per Modalità si intende l’articolazione del carattere, cioè l’espressione concreta attraverso la quale si manifesta il carattere nelle unità statistiche. Ancora definiamo con Frequenza il numero di volte in cui si presenta una determinata modalità; quest’ultima rappresenta l’elemento più importante in una distribuzione di frequenze. In fine con il termine Serie si intende l’insieme delle modalità rilevate su una popolazione (o anche su un campione) ed organizzate in modo che ad ogni unità statistica corrisponda una ben definita modalità. L’insieme delle modalità di una popolazione (o campione) organizzate in modo che a ciascuna modalità corrisponda la relativa frequenza prende il nome, in ultimo, di Seriazione. 4.3 Le tipologie dell’informazione statistica. Elemento essenziale per l’analisi statistica è, dunque, l’informazione che viene raccolta dalle unità statistica di una popolazione. In termini generali queste informazioni ne definiscono i caratteri, che sono “misure” di caratteristiche, solitamente elementari, riferite alle unità statistiche. Delle unità statistica vengono rilevati diversi aspetti, ciascuno dei quali è appunto chiamato carattere, che rappresenta l’attributo posseduto da una unità statistica. I caratteri possono essere distinti in: Qualitativi; Pag. 9 Università Telematica Pegaso Principi di statistica Quantitativi. I caratteri qualitativi, anche detti mutabili o variabili qualitative, sono espresse in forma verbale mentre i caratteri quantitativi che vengono definite variabili sono espressioni numeriche. Caratteri qualitativi Colore degli occhi Stato civile Gruppo Sanguigno Caratteri quantitativi Peso Statura 4.4 Numero di Componenti di una famiglia Le Mutabili Le Mutabili si distinguono in: Sconnesse o nominali. Ordinali Le prime assumono un insieme finito di categorie mutuamente esclusive tali che, per due differenti unità statistiche, possono essere definite soltanto se queste assumono la stessa o differenti categorie. Le ordinali, invece, assumono un insieme finito di categorie mutuamente Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633) 10 di 11 Università Telematica Pegaso Principi di statistica esclusive tali da poter ordinare due unità statistiche secondo il possesso di determinate caratteristiche possedute. Per questa tipologia è, in fine, possibile stabilire una relazione d’ordine tra le unità statistiche. 4.5 Le Variabili Per quanto riguarda, invece, le Variabili, queste possono essere ancora distinte in: discrete; continue. Nelle variabili discrete la caratteristica può essere descritta mediante un numero finito o infinito numerabile di valori numerici, fra i quali abbia senso calcolare una differenza e/o un rapporto. Mentre nelle variabili continue la caratteristica può essere descritta mediante un’infinità non numerabile di valori, fra i quali abbia senso calcolare una differenza e/o un rapporto. Tornando ai caratteri di una unità statistica questi possono assumere modalità dicotomiche laddove siano solo due le modalità espresse. Ad esempio: l’assenza o la presenza. I Caratteri possono assumere diverse connotazioni se riferite in relazione al tempo oppure relativamente allo spazio. In questo caso ci troveremo di fronte alle cosiddette serie storiche o serie cicliche. 4.6 Le Serie storiche e le Serie cicliche. Le serie storiche che, come abbiamo detto, sono riferite a modalità di tempo, rappresentano la dinamica di un certo fenomeno registrato istantaneamente o conteggiato durante un periodi prefissato. Invece, le serie cicliche sono ordinabili senza che ci sia necessariamente un ordine, quindi ordinabili anche a piacere. Infine le serie geografiche o serie territoriali sono riferite a modalità strettamente legate ad un territorio; ed esprimono la distribuzione di una variabile in rapporto ad unità statistica espressa come territorio; comuni, province, regioni o Stati, ecc. Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n. 633) 11 di 11