Esercizi di riepilogo - I prova parziale Esercizio 1 L’Associazione Industriali di una provincia emiliana ha commissionato un’indagine per studiare le esigenze del mercato del lavoro locale. Allo scopo sono stati somministrati 2000 questionari alle industrie della provincia. I dati per 15 di queste aziende sono raccolti nella seguente tabella: • L: Livello di studi prevalente del personale impiegato a tempo indeterminato • A: Ampiezza misurata attraverso il numero di dipendenti • S: Settore prevalente di attività • CA: Numero di contratti di lavoro diversi da quelli a tempo indeterminato • V : Volume di affari per lavoratore a tempo indeterminato (in migliaia di euro). L laurea media superiore media superiore laurea media inferiore media inferiore laurea media inferiore media superiore media inferiore media superiore media inferiore laurea laurea media inferiore A 25 40 15 20 45 34 150 76 60 35 21 62 45 10 30 S alta tecnologia abbigliamento agroalimentare alta tecnologia agroalimentare abbigliamento agroalimentare agroalimentare abbigliamento agroalimentare alta tecnologia agroalimentare agroalimentare alta tecnologia agroalimentare CA 6 4 10 3 5 0 130 9 4 5 5 50 40 0 15 V 228 62 80 600 78 44 62 224 36 85 548 1123 83 600 95 1a) Si calcoli la mediana per il carattere L, per il carattere V e per il carattere CA. 1b) Rappresenti graficamente il carattere L. Rappresentare in un grafico congiunto i caratteri V ed A. 1c) Calcolare il volume medio di affari delle aziende classificate in base al livello di studi prevalente del personale impiegato a tempo indeterminato. 1d) Calcolare la covarianza fra il carattere V e il carattere A. 1e) Considerando il modello di regressione YV = α + βXA + ε, dove YV = V e XA = A, stimare i parametri α e β del modello. 1f) Scomporre la variabilità di YV per valutare la parte di variabilità spiegata dal modello. 1g) Utilizzando il modello di regressione, stimare il volume di affari per un’azienda non 100 dipendenti. 1h) Valutare la bontà di adattamento del modello di regressione. 1 Soluzione 1 1a) M e(L) è media superiore, M e(V ) = 85 e M e(CA) = 5. 1b) Grafico a barre per il carattere S e scatter plot per i caratteri V ed A. Grafico a barre per il carattere L 8 7 6 5 4 3 2 1 0 media inferiore media superiore laurea Scatter plot dei caratteri V ed A 160 140 120 A 100 80 60 40 20 0 1c) µV |laurea = 314.6, 0 200 400 600 V µV |media sup. = 181.5, 800 1000 1200 µV |media inf. = 274.83 1d) La covarianza fra il carattere V e A è σV A = 1 ∑ (Vi − V )(Ai − A) = −1617 N 1e) La stima dei parametri di regressione è β̂ = −1617 = −1.453, 1113 α̂ = 263.2 + 1.453 ∗ 44.53 = 327.901 1f) SST = 92735, SSR = 2349, SSE = 90386 1g) la previsione per XA = 100 è YV = 327.901 − 1.453 ∗ 100 = 182.6. 1h) Il coefficiente di correlazione e l’indice di bontà di adattamento sono ρV A = σV A = −0.15916, σV σA 2 R2 = 0.025 Esercizio 2 Un’azienda produttrice di componenti elettronici per telefonia mobile sottopone ad un controllo ogni pezzo prodotto. Se il pezzo supera il controllo, viene messo in commercio. Sia D l’evento pezzo difettoso e sia S l’evento supera il controllo. Date le seguenti probabilità: • probabilità che il pezzo sia difettoso P (D) = 0.1 • probabilità che il pezzo non superi il controllo dato che è difettoso P (S|D) = 0.9 • probabilità che il pezzo superi il controllo dato che non è difettoso P (S|D) = 0.8 calcolare: 2a) P (D): la probabilità che il pezzo non sia difettoso 2b) P (S|D): la probabilità che il pezzo difettoso superi il controllo 2c) P (S ∩ D): la probabilità che il pezzo sia difettoso e superi il controllo 2d) P (S|D): la probabilità che il pezzo non difettoso non superi il controllo 2e) P (S): la probabilità che il pezzo superi il controllo 2f) P (D|S): la probabilità che il pezzo che ha superato il controllo sia difettoso 2g) P (S ∪ D): la probabilità che il pezzo sia difettoso o che superi il controllo Soluzione 2 2a) P (D) = 1 − P (D) = 1 − 0.1 = 0.9. 2b) P (S|D) = 1 − P (S|D) = 1 − 0.9 = 0.1 2c) P (S ∩ D) = P (S|D) × P (D) = 0.1 × 0.1 = 0.01 2d) P (S|D) = 1 − P (S|D) = 1 − 0.8 = 0.2 2e) P (S) = P (S|D)P (D) + P (S|D)P (D) = 0.1 × 0.1 + 0.8 × 0.9 = 0.73 2f) P (D|S) = P (S|D)P (D) P (S) = 0.1×0.1 0.73 = 0.014. 2g) P (S ∪ D) = P (S) + P (D) − P (S ∩ D) = 0.73 + 0.1 − 0.01 = 0.82 3 Esercizio 3 Un’urna contiene 3 palline nere e 7 bianche. Consideriamo una serie di due estrazioni senza reimmissione. 3a) Calcolare la probabilità di ottenere in due estrazioni consecutive prima 1 pallina bianca e poi 1 pallina nera. 3b) Calcolare la probabilità di ottenere in due estrazioni consecutive 1 pallina bianca e 1 pallina nera, indipendentemente dall’ordine (suggerimento: vanno considerati entrambi gli eventi: prima pallina bianca e poi nera, prima pallina nera e poi bianca). Supponiamo di estrarre a caso una pallina senza reimmissione. Si possono verificare i seguenti casi: - se si estrae pallina nera, nell’urna vengono aggiunte due palline bianche ed una nera; - se si estrare pallina bianca, non viene aggiunta nessuna pallina all’urna. Consideriamo ora un’ulteriore sistema di estrazioni dall’urna. 3c) Calcolare la probabilità che entrambe le palline siano bianche. 3d) Calcolare la probabilità che entrambe le palline siano nere. 3e) Calcolare la probabilità di estrarre prima pallina nera e poi pallina bianca. Soluzione 3 Sia B l’evento estrazione di pallina bianca e sia N l’evento estrazione di pallina nera. 3a) P (B1 ∩ N2 ) = P (B1 ) × P (N2 |B1 ) = 7/10 × 3/9 = 0.7 × 0.33 = 0.233 3b) P (B1 ∩ N2 ) ∪ P (N1 ∩ B2 ) = (7/10 × 3/9) + (3/10 × 7/9) = (0.7 × 0.33) + (0.3 × 0.78) ≈ 0.233 + 0.233 = 0.466 3c) P (B1 ∩ B2 ) = P (B1 ) × P (B2 |B1 ) = 7/10 × 6/9 = 0.7 × 0.66 = 0.46 3d) P (N1 ∩ N2 ) = P (N1 ) × P (N2 |N1 ) = 3/10 × 3/12 = 0.3 × 0.25 = 0.075 3e) P (N1 ∩ B2 ) = P (N1 ) × P (B2 |N1 ) = 3/10 × 9/12 = 0.3 × 0.75 = 0.225 4