Capitolo 1 Il linguaggio della statistica Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 1 • La popolazione è l’insieme di individui o oggetti che si vogliono studiare. Questi individui o oggetti vengono denominati unità statistiche. • Una variabile è una caratteristica di ogni appartenente alla popolazione. • Un campione è una parte di popolazione. • Un censimento è lo studio dell’intera popolazione. • L’errore di campionamento è la differenza tra una caratteristica misurata sull’intera popolazione e la stessa riscontrata in un campione di quella popolazione. • Il grado di variabilità è una misura di come gli elementi della popolazione differiscono gli uni dagli altri in riferimento alla variabile sotto studio. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 2 • Un parametro è un valore numerico che descrive una caratteristica della popolazione. • Una statistica è un valore numerico che descrive una caratteristica di un campione. • La dimensione della popolazione è il numero delle unità statistiche della popolazione. Il relativo simbolo è N. • La dimensione del campione si indica con n. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 3 • Un campione distorto è un campione non rappresentativo della popolazione. • Un campione casuale semplice è un campione che è stato scelto in modo tale che tutti i membri della popolazione abbiano la stessa probabilità di essere scelti. Inoltre ogni campione di dimensione n ha la medesima probabilità di diventare il campione selezionato. • La base di campionamento è l’elenco di tutte le unità statistiche della popolazione. • Una tabella di numeri casuali è un elenco di numeri creati a caso e disposti nello stesso ordine in cui sono stati creati. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 4 • I dati qualitativi descrivono una caratteristica particolare di un’osservazione campionaria. Nella maggior parte dei casi non sono numerici. • I dati creati assegnando codifiche numeriche alle diverse categorie, senza che tali numeri abbiano un reale significato, sono chiamati dati nominali. • I dati che sono creati assegnando numeri alle categorie dove l’ordine di assegnazione ha un significato sono chiamati dati ordinali. • Le scale di Likert sono utilizzate per raccogliere informazioni su atteggiamenti e opinioni incluso il grado di consenso di una affermazione, frequenza di uso, importanza di un argomento, qualità e gradimento. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 5 • I dati che sono intrinsecamente numerici sono chiamati dati quantitativi. • I dati discreti possono assumere solo determinati valori. Questi valori sono spesso numeri interi o comunque non decimali. • I dati continui possono assumere un infinito numero di valori possibili entro un intervallo di valori della scala numerica. Tali valori sono molto spesso il risultato di misurazioni. • Gli strumenti della statistica descrittiva permettono di sintetizzare i dati. • Una inferenza è una deduzione o una conclusione. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Definizioni - 6 • Le tecniche della statistica inferenziale ci permettono di trarre inferenze o conclusioni sulla popolazione dal campione. • La teoria della probabilità è usata per calcolare la verosimiglianza di osservare o selezionare un particolare campione dalla popolazione. • Il simbolo sigma è una notazione sintetica, utilizzata per scrivere formule statistiche. Deriva dalla lettera maiuscola dell’alfabeto greco Σ. Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.1 La popolazione e un campione Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Esercizio 1.4 Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Esercizio 1.6 Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.2 Campioni di dimensioni sempre più grandi Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.3 Aerogramma (diagramma a torta) e diagramma a barre Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.4 Relazione tra la probabilità e la statistica inferenziale Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.5 Finestra di dialogo Analisi Dati Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl Figura 1.6 Campione casuale di cinque codici identificativi in Excel Introduzione alla Statistica 2/ed Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici Copyright © 2009 – The McGraw-Hill Companies srl