STATISTICA Modulo 1 Corso di laurea in Economia aziendale Anno accademico 2008-2009 GUIDA ALLO STUDIO DELLA STATISTICA DESCRITTIVA Capitolo 1: Nozioni introduttive Si tratta di concetti che vanno acquisiti, perché aiutano nello studio delle parti successive. L’attenzione va posta particolarmente sulla movimento di opinione “Political Arithmetic”, sul ruolo del calcolo delle probabilità nella Statistica, sulla terminologia tecnica (collettivo statistico, unità statistica, carattere e modalità). Importanti sono anche la tipologia dei caratteri, la misurazione dei caratteri e la distinzione tra indagini campionarie ed esperimenti. Capitolo 2: Confronti tra grandezze Occorre saper distinguere tra i diversi rapporti statistici (di composizione; di coesistenza; di derivazione), essere in grado di spiegarne il significato e di fare esempi anche diversi da quelli che appaiono nel testo. Molto importanti sono i numeri indici, in relazione al loro frequente uso. Occorre saper calcolare le variazioni percentuali a partire dai numeri indici ed essere in grado di ricavare una delle due grandezze a confronto conoscendo l’altra e il numero indice (al riguardo si rinvia alla parte iniziale del punto 5 di “Informalmente” del cap. 2, p. 40). Capitolo 3: Distribuzioni statistiche Il capitolo contiene concetti che non possono essere trascurati senza compromettere la capacità di comprendere i contenuti dei capitoli successivi. Cruciale è la chiara comprensione delle nozioni di distribuzione statistica disaggregata e di distribuzione statistica di frequenza. Importante è anche comprendere il processo con cui si costruisce una distribuzione di frequenza con o senza classi. Si segnalano, inoltre, le definizioni di: frequenza (assoluta e relativa), frequenza cumulata, densità di frequenza, uniforme distribuzione delle unità nelle classi. Infine, non vanno trascurate le definizioni di distribuzione di quantità (si deve essere in grado di fare un esempio concreto diverso da quelli riportati nel testo). Capitolo 4: Rappresentazioni grafiche Si deve essere in grado di illustrare quale sia la rappresentazione o le rappresentazioni più appropriate per i vari tipi di distribuzione statistica (distribuzione di frequenza secondo un carattere discreto, distribuzione di frequenza secondo un carattere diviso in intervalli; serie sconnessa; serie storica; serie territoriale). La funzione di ripartizione (p. 78 e 83) può essere omessa. Si segnala anche il problema della scala e la questione dell’uso scorretto delle rappresentazioni grafiche (punto 3 di “Informalmente”, p. 94 e segg.). Capitolo 5: Medie Le medie costituiscono la parte più importante della Statistica descrittiva. Per quanto riguarda le medie analitiche, oltre a curare la definizione delle singole medie, è importante sapere indicare le situazioni tipiche in cui ha senso impiegarle. Si deve essere in grado di scrivere le formule delle medie analitiche anche per le distribuzioni di frequenza in assenza e in presenza di classi. Si segnala la particolare rilevanza (concettuale e pratica) della media aritmetica ponderata. Per la media aritmetica, occorre conoscere le proprietà principali (Proposizione 5.1); sono facoltative le “Ulteriori proprietà della media aritmetica”, pp. 537-539). Quanto alla mediana, centrale è la Definizione 5.6 (p. 116). Va curata anche la procedura equivalente (inizio di p. 118) che è utile per la definizione dei quantili (in particolare dei quartili). È pure importante comprendere la Definizione 5.7 (quartili). Ai fini applicativi, ha rilievo il procedimento per la determinazione della mediana e di altri quantili nel caso di dati raggruppati (in assenza o in presenza di classi; p. 120-123). La dimostrazione della formula 5.11 è facoltativa). Va curato in modo speciale (anche in vista delle applicazioni) il paragrafo 5.13.1. Circa il paragrafo 5.13.2, occorre capire il problema concreto, il significato della formula (5.13), anche nella forma di media aritmetica ponderata. Si raccomanda la lettura del punto 7 di “Informalmente” per i riferimenti ad applicazioni concrete. Capitolo 6: Variabilità Sono fondamentali le Definizioni 6.1 e 6.2 (pp. 146-147) e la Proposizione 6.1. Si deve essere in grado di adattare le formule degli scostamenti medi alle distribuzioni di frequenza per caratteri discreti e per caratteri divisi in intervalli. Il paragrafo 6.2.2 può essere tralasciato. Si segnalano anche il campo di variazione e l’intervallo interquartile come ulteriori indici di variabilità. Va curato il concetto di “Indici percentuali di variabilità”, con particolare riferimento al coefficiente di variazione. Al riguardo, si deve essere in grado di indicare almeno una situazione concreta (diversa da quelle riportate nel testo) in cui è rilevante l’uso del coefficiente di variazione. Per quanto concerne la concentrazione, va fatta attenzione alla circostanza che l’analisi è limitata ai caratteri trasferibili e che l’indice G - formule (6.12) e (6.13) - è definito per le sole distribuzioni disaggregate. Bisogna notare, inoltre, che per l’indice R, applicabile sia nelle distribuzioni disaggregate - formula (6.14) - sia nelle distribuzioni di dati raggruppati (con o senza classi) vengono usati, nel secondo caso, i simboli Pi′ e Qi′ per rimarcare la differente definizione di “aliquota di unità” e “aliquota di carattere”. È da escludere il paragrafo 6.4. Si consiglia la lettura dei punti 1 e 5 di “Informalmente”. Capitolo 7: Asimmetria Ci si può limitare alle nozioni di simmetria e asimmetria e agli indici α 1 e α 2 . Capitolo 8: Uno sguardo d’insieme alle costanti caratteristiche L’attenzione va concentrata sulla lettura dei grafici (Figura 8.1, p. 195) e sul paragrafo 8.2.1. Il paragrafo 8.3 va trascurato. Capitolo 9: Analisi delle distribuzioni doppie: dipendenza Si raccomanda di porre attenzione sui concetti di: distribuzione doppia (disaggregata e di frequenza), distribuzione marginale e distribuzione condizionata (Definizioni 9.1 e 9.2). È, poi, cruciale avere chiara la definizione di indipendenza statistica (Definizione 9.3) e le sottese motivazioni logiche. Quanto alla misura della dipendenza, lo studio può essere limitato alla formula (9.2), all’indice χ 2 e all’indice di Cramér (formula (9.5)). Vanno esclusi i paragrafi 9.4 e 9.4.1. Capitolo 10: Analisi delle distribuzioni doppie: regressione Si raccomanda di porre attenzione sul metodo dei minimi quadrati, dalla cui applicazione si ottengono le formule (10.4); al riguardo, è utile studiare la relativa dimostrazione (Appendice A8, pp. 549-550). Di grande rilievo è anche la Proposizione 10.2 (p. 231) e la Figura 10.4 ai fini della comprensione dell’indice di determinazione (la dimostrazione della (10.6) è consigliata): è fondamentale l’ interpretazione dell’indice come quota della variabilità complessiva di Y spiegata dal modello di regressione. Il paragrafo 10.6 e i successivi possono essere esclusi. Si consiglia di studiare anche i punti 1, 3 e 5 di “Informalmente”. Capitolo 11: Analisi delle distribuzioni doppie: correlazione Si possono escludere il paragrafo 11.2.1 e i successivi. È utile studiare i punti 1, 2 e 3 di “Informalmente”.