UNIVERSITA’ DEGLI STUDI DI BASILICATA FACOLTA’ DI ECONOMIA Corso di laurea in Economia Aziendale Lezioni di Statistica 14 marzo 2013 Docente: Massimo Cristallo ORIGINI ED EVOLUZIONE DELLA STATISTICA Libro di Confucio (550 a.C.) Notizia di una statistica agraria, artigiana e commerciale, effettuata in Cina da un imperatore vissuto oltre 2000 anni prima. La Chiesa, dopo il Concilio di Trento (iniziato nel 1545), impose ai parroci la regolare registrazione dei matrimoni, dei battesimi e delle morti, che ancora oggi costituiscono preziosi fonti statistiche per studi demografici. ORIGINI ED EVOLUZIONE DELLA STATISTICA Nel 1875 la “Statistica” viene inserita come disciplina in tutte le facoltà di Giurisprudenza del nuovo Regno Unificato I maggiori contributi alla scuola statistica italiana sono stati forniti da Rodolfo Benini (1862(1862-1956), Corrado Gini (1884(1884-1965), Giorgio Mortara (1885--1967), Marcello Boldrini (1885 (1890--1969) e Livio Livi (1891 (1890 (1891--1968) Significato della parola “statistica” “statistica” La parola statistica deriva dal termine latino medievale “status”, che sta ad indicare l’ordinamento politico in tal senso la statistica sarebbe, dunque, quella scienza che descrive i fatti notevoli di uno Stato. Tuttavia, il termine statistica statistica,, secondo la concezione del latino classico, significa modo di essere, condizione, stato di fatto si intravede in questo modo una estensione del concetto di statistica, che comprende altri campi di applicazione. ASPETTI DELLA STISTICA MODERNA Fornisce metodi matematici che consentono di fare valide supposizioni, partendo dall’insieme dei dati osservati, e consente di indagare più a fondo sui fattori che determinano il presentarsi di un certo fenomeno. Nuovi Settori di applicazione della statistica Applicazioni della Statistica Ricerche di mercato (acquisizione di informazioni) Pianificazione Territoriale (politiche di intervento) Controllo della Qualità EFFICACIA DELLE APPLICAZIONI STATISTICHE Grado di preparazione della disciplina da parte delle persone che la utilizzano Spirito di obiettività Conoscenza del fenomeno oggetto di studio IMPARZIALITA’ COMPETENZA STATISTICA CONOSCENZA DEL FENOMENO CONCETTI PRELIMINARI Unità statistica caso individuale oggetto di osservazione (ad esempio, una persona singola, una famiglia, il lancio di una moneta, un’azienda); Collettivo statistico insieme di più unità statistiche, omogenee rispetto ad uno o più aspetti (ad esempio, l’insieme delle autovetture presenti in Italia, gli abitanti della provincia di Potenza, gli studenti del Corso di Laurea in Economia Aziendale dell’Università di Basilicata) CONCETTI PRELIMINARI CARATTERE Aspetto delle unità statistiche prese in considerazione (ad esempio, l’età, il reddito, il titolo di studio, il tipo di attività di una azienda); MODALITA’ Diverso modo con cui può presentarsi un carattere. MODALITA’ CARATTERE COLLETTIVO STATISTICO TIPI DI CARATTERI I CARATTERI possono essere di due tipi: QUANTITATIVI (esempi:età, reddito, numero addetti,ecc.) QUALITATIVI (esempi: professione, colore occhi, ecc.) FENOMENI COLLETTIVI La statistica è quindi l’insieme dei metodi per lo studio dei fenomeni collettivi, ovvero delle caratteristiche che in un collettivo statistico (popolazione) si presentano in maniera diversa per l’influenza di varie circostanze. ESEMPIO: reddito carattere popolazione italiana collettivo statistico FASI DELL’INDAGINE STATISTICA 1) RILEVAZIONE = operazioni con le quali si perviene alla conoscenza dei dati 2) ELABORAZIONE = operazioni con cui i dati “grezzi” o “originari” vengono classificati e sintetizzati per ottener dati più espressivi (dati derivati) 3) PRESENTAZIONE = esposizione dei dati in forma chiara e compatta (tabelle, grafici, medie, ecc..) ecc 4) INTERPRETAZIONE = spiegazione dei risultati ottenuti dall’indagine, anche sulla base di conoscenze già possedute sul fenomeno oggetto di studio studio.. LA RILEVAZIONE STATISTICA La rilevazione dei dati consente di conoscere le unità del collettivo statistico unitamente alle informazioni che riguardano tali unità (ad esempio, mediante il questionario di rilevazione) In molte indagini si parte da un materiale già rilevato (ad esempio, dall’ISTAT, Camere di commercio, Ministero del lavoro, ecc.) TIPI DI RILEVAZIONI TOTALI = quando si rilevano tutte le unità che compongono la popolazione PARZIALI O CAMPIONARIE = quando si osserva solo una parte di tutte le unità statistiche che costituiscono il collettivo, con la caratteristica di fornire un’immagine ridotta ma fedele delle caratteristiche del medesimo collettivo (il (il fenomeno si presenta in scala ridotta o proporzionale) proporzionale) LE RILEVAZIONI CAMPIONARIE A) Consentono di ridurre il tempo necessario per la raccolta ed elaborazioni dei dati. B) Permettono, di conseguenza, una notevole riduzione dei costi (si possono quindi effettuare più indagini) C) E’ talvolta una scelta obbligata (esempio: controllo qualità che comporta la distruzione dell’unità osservata) D) A volte, il tempo disponibile per effettuare l’indagine è limitato, per cui non è possibile effettuare una rilevazione totale (esempio:rilevazione trimestrale sulle forze di lavoro effettuata dall’ISTAT). CLASSIFICAZIONE E TABULAZIONE DEI DATI Una volta raccolti i questionari, utilizzati per l’indagine, si passa ad esaminare ed organizzare le informazioni in essi contenute. Si passa, quindi, all’operazione di spoglio o classificazione, consistente nel raggruppare i dati secondo le modalità di uno o più caratteri. SPOGLIO DEI DATI A) Se si dispone di un solo carattere, per effettuare lo spoglio si fa corrispondere ad ogni modalità una casella; B) In ciascuna casella si pone un trattino ogni qualvolta l’unità statistica possiede la modalità corrispondente a quella casella. TABULAZIONE O DISTRIBUZIONE STATISTICA Consiste nel mettere i dati sotto forma di tabella, attraverso un prospetto di due colonne, ove nella prima sono elencate le modalità del carattere, mentre nella seconda si riporta il numero di volte (frequenza assoluta) in cui una certa modalità è stata riscontrata. Carattere = X Frequenza assoluta Modalità X1 n1 Modalità X2 n2 … … Modalità Xs ns TOTALE N DISTRIBUZIONE DI FREQUENZA L’associazione ad ogni modalità (di un certo carattere) della relativa frequenza è anche chiamata distribuzione di frequenza. MODALITA’ CARATTERE FREQUENZA VARIABILE STATISTICA Le distribuzioni statistiche in cui il carattere è quantitativo si chiamano variabili statistiche. MUTABILE STATISTICA Le distribuzioni statistiche in cui il carattere è qualitativo si chiamano mutabili statistiche. DISTINZIONE DELLE VARIABILI STATISTICHE 1) DISCRETE = SE I VALORI ASSUNTI SI RIFERISCONO AD UN INSIEME DISCRETO, CIOE’ NUMERABILE DI VALORI ISOLATI (Esempi:numero figli, numero autovetture, ecc.) 2) CONTINUE = SE I VALORI ASSUNTI SI RIFERISCONO AD UN INSIEME CONTINUO DI VALORI (Esempi: peso corporeo, reddito, ecc.) VARIABILE STATISTICA CONTINUA In questi casi le modalità vengono raggruppate in classi La prima e l’ultima classe, in alcuni casi, possono essere aperte. Carattere = X Frequenza assoluta X1 - X2 n1 X2 - X3 n2 … … Xs – X (s+1) ns TOTALE N DISTINZIONE DELLE MUTABILI STATISTICHE A) RETTILINEA = le modalità ammettono un ordine naturale di successione con una modalità iniziale ed una finale (esempio:grado di istruzione) B) CICLICA = le modalità ammettono un ordine naturale di successione, ma non si può dire, a meno di una convenzione, quale sia la prima e l’ultima modalità (esempio: i giorni della settimana) C) SCONNESSA = le modalità non ammettono un ordine naturale di successione (esempio:nazionalità). SCALE DI MISURA La classificazione con cui è possibile distinguere le variabili secondo la classificazione proposta da Stevens (1946, 1951) è la seguente: variabili nominali, nominali, quando presentano categorie non ordinabili; variabili ordinali, ordinali, quando presentano stati ordinabili ma tuttavia non esiste una unità di misura e quindi una distanza tra due stati presi a caso; variabili ad intervalli, intervalli, quando esiste una unità di misura ma non esiste uno zero assoluto; variabili cardinali, cardinali, quando esiste una unità di misura ed uno zero assoluto. I VALORI MEDI MEDIE ANALITICHE (tengono conto di tutti i valori e vengono calcolate attraverso operazioni algebriche sulle modalità di un carattere quantitativo)) quantitativo MEDIE LASCHE (si basano solo su alcuni valori dell’intera distribuzione) SCELTA DEL VALOR MEDIO I valori medi che si possono utilizzare per sintetizzare una distribuzione sono diversi. La scelta del miglior valore medio dipende dal singolo problema che si esamina: non esiste una ricetta universale. MEDIA ARITMETICA E’ facilmente calcolabile Ha significato immediato Può essere calcolata con valori di qualsiasi tipo Tiene conto di tutti i valori MEDIA ARITMETICA semplice E’ la somma dei valori assunti dal carattere quantitativo in esame, diviso per il numero di unità: N ∑ xi x1 + x2 + ... xN i=1 µ= = N N MEDIA ARITMETICA ponderata E’ la somma dei valori assunti dal carattere quantitativo in esame, ciascuno ponderato con la relativa frequenza assoluta, diviso per il numero di unità: s ∑ xi ni x1 n1 + x2 n2 + ... xn ns i=1 µ= = s N ∑ ni i =1 MEDIA ARITMETICA ponderata Si applica la formula precedente, individuando per ciascuna classe il valore centrale (semisomma degli estremi dell’intervallo) Carattere = X Frequenza assoluta X1 X1--X2 n1 X2 X2--X3 n2 … … Xs – X (s+1) ns TOTALE N MEDIA GEOMETRICA E’ più difficile da calcolare Non può essere utilizzata se vi è qualche dato negativo o nullo Può essere usata nel caso di dati che presentano una progressione geometrica E’ utilizzata quando i dati variano in tempi successivi secondo un certo tasso di incremento (o decremento) per calcolare l’incremento medio per unità di tempo Tiene conto di tutti i valori MEDIA GEOMETRICA semplice Si ottiene estraendo la radice N-esima del prodotto dei valori assunti dal carattere quantitativo: Mg = N x1 . x2 .... xN = N N ∏ xi i =1 MEDIA GEOMETRICA ponderata Si ottiene come nel caso semplice, ma elevando ciascuna modalità del carattere quantitativo alla rispettiva frequenza: s Mg = x1 ⋅ x 2 ⋅...⋅ x = N ∏ x i N n1 n2 ns s i =1 ni MEDIA ARMONICA E’ utile nei problemi in cui vi siano legami inversi del fenomeno considerato con altri fenomeni (ad esempio, dati inversamente proporzionali all’unità di tempo: velocità in Km/h) Può essere utilizzata quando i dati presentano una progressione armonica Tiene conto di tutti i valori Non può essere utilizzata se vi è anche un solo valore uguale a zero MEDIA ARMONICA semplice Si ottiene dal reciproco della media aritmetica dei reciproci delle modalità riferite alle n unità di un carattere quantitativo: N N Ma= = N 1 1 1 1 + + ... + ∑ i=1 x i x1 x 2 xN MEDIA ARMONICA ponderata Si procede con la formula utilizzata nel caso semplice, “pesando” però ciascun addendo del denominatore per la rispettiva frequenza: s ∑ ni n1 + n2 + ... + ns N i =1 Ma = = s = s 1 1 1 ni ni n1 . + n2 . + ... + ns ∑ ∑ x1 x2 xs i=1 xi i=1 xi