lOMoARcPSD|2784667 Equipo 2 - Pruebas de hipótesis PROBABILIDAD Y ESTADISTICA (Universidad Autónoma de Yucatán) StuDocu non è sponsorizzato o supportato da nessuna università o ateneo. Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Universidad Autónoma de Yucatán Campus de Ciencias Exactas e Ingenierías Facultad de Ingeniería Probabilidad y Estadística “Pruebas de Hipótesis” Prof. Carlos Zetina Moguel Equipo # 2 Junio 2017 Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Pruebas de hipótesis Conceptos de la prueba de hipótesis Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para toda la población. Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero. Con base en los datos de la muestra, la prueba determina si se debe rechazar la hipótesis nula. Para tomar la decisión se utiliza un valor p. Si el valor p es menor que o igual al nivel de significancia, que es un punto de corte que usted define, entonces puede rechazar la hipótesis nula. Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas para seleccionar la más probable de dos hipótesis. En realidad, una prueba mantendrá la validez de la hipótesis nula hasta que haya suficiente evidencia (datos) en favor de la hipótesis alternativa. Hipótesis nula y alternativa La hipótesis nula, representada por H0, es la afirmación sobre una o más características de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori"). La hipótesis alternativa, representada por HA, es la afirmación contradictoria a H0, y ésta es generalmente la hipótesis del investigador. La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la evidencia muestral sugiere que H0 es falsa. Si la muestra no contradice decididamente a H0, se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis son rechazar H0 o no rechazar H0. Errores de tipo I y tipo II El error tipo I se define como el rechazo de la hipótesis nula H 0 cuando ésta es verdadera. También es conocido como o nivel de significancia. El error tipo II o error se define como la aceptación de la hipótesis nula cuando ésta es falsa. Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Pruebas de una cola y de dos colas Una prueba de dos colas se asocia a una hipótesis alternativa para la cual se desconoce el signo de la potencial diferencia. Por ejemplo, supongamos que deseamos comparar las medias de dos muestras A y B. Antes de diseñar el experimento y ejecutar la prueba, esperamos que si se resalta una diferencia entre las dos medias, realmente no sabemos si A debería ser superior a B o a la inversa. Esto nos lleva a elegir una prueba de dos colas, asociada a la siguiente hipótesis alternativa: Ha: B ). Las pruebas de dos colas son con diferencia las más media( A)≠ media ¿ utilizadas. Una prueba de una cola normalmente está asociada a una hipótesis alternativa para la cual se conoce el signo de la potencial diferencia antes de ejecutar el experimento y la prueba. En el ejemplo descrito más arriba, la hipótesis alternativa referida a una prueba de una cola podría redactarse así: media( A)<media (B) o B ), dependiendo de la media( A)>media ¿ dirección esperada de la diferencia. Prueba de hipótesis para la µ en muestras grandes Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Prueba de hipótesis para la µ en muestras pequeñas Prueba de hipótesis para proporción Sea π la proporción de éxitos en una población Binomial. Sea p la proporción de éxitos en una muestra de tamaño n extraída de dicha población. A continuación pasamos a recordar los tres modelos de hipótesis aplicados para una proporción poblacional: Modelo de cola a la izquierda: H o :π ≥ π o H 1 : π < πo Estadístico de la prueba: Aplicando el Teorema del Límite Central, el estadístico de prueba es Z C =( p−π o)/ √ ((π o (1−π o ))/ n) El valor crítico es Z α El criterio de decisión: Si Z C <Z α entonces se rechazará la hipótesis nula, en caso contrario no se rechazará. Modelo de cola a la derecha: H o :π ≤ π o Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 H 1 : π > πo En cuanto al estadístico de la prueba es el mismo. El gráfico muestra que Z 1−α será el valor crítico. Criterio de decisión: Si Z C > Zα entonces se rechazará la hipótesis nula, en caso contrario no se rechazará. Modelo de cola bilateral: H o :π =π o H1: π ≠ π o En este caso tenemos dos valores críticos: Zα y Z 1−α /2 , como se muestra en la gráfica. Criterio de decisión: Si Z C < Z α/ 2 o si rechazará. Z C > Z 1−α /2 entonces se rechazará la hipótesis nula, en caso contrario no se Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Prueba de hipótesis para σ2 En una prueba de hipótesis para la varianza poblacional se emplean el valor hipotético de la varianza poblacional σ 2 y la varianza muestral s 2 para calcular el valor estadístico de prueba χ 2 . Si la población tiene una distribución normal, el estadístico de prueba es el siguiente: ( n−1 ) s2 χ= σ 20 2 Donde χ 2 Tiene una distribución chi-cuadrada con n−1 grados de libertad. Una vez calculado el estadístico de prueba χ 2 , para determinar si se acepta o se rechaza la hipótesis nula se encuentra el valor crítico y se realiza la comparación. Prueba de hipótesis para diferencia de medias En la práctica, se presenta una diversidad de problemas en la industria y en las ciencias sociales que nos sugieren confrontar cual de dos procesos es mejor que el otro a la luz de la media que arroja cada uno de ellos. Se nos podría ocurrir por ejemplo: a) verificar si el consumo de gasolina entre dos marcas de vehículos se puede considerar idéntico o por el contrario una marca es más económica que otra, b) Verificar si los salarios de la industria metalúrgica se pueden considerar o no superiores a los salarios de la industria textil en una región, c) Verificar si el contenido de determinada sustancia en una artículo fabricado por una compañía A es inferior o no al contenido de dicha sustancia en el mismo artículo fabricado por una compañía B de la competencia. etc. Con el fin de resolver las pruebas de hipótesis para la diferencia de medias, debemos tener en cuenta el mismo procedimiento y las mismas reglas que seguimos para las pruebas de hipótesis para la media. Las fórmulas para el cálculo de los estadísticos “z” y “t”, son las mismas empleadas en el cálculo de los intervalos de confianza para la diferencia de medias en el capítulo anterior. En cuanto a la distribución en el muestreo de la diferencia de medias, recordemos los siguientes tres casos: 1) Si las dos poblaciones son normales, las diferencias de las medias muestrales también se distribuirán normalmente cualquiera sea el tamaño de las muestras. No obstante, si no se conocen las desviaciones estándar poblacionales (1 y 2), éstas pueden ser reemplazadas por la desviaciones estándar de las muestras (S1 y S2), si los tamaños de las muestras son mayores que 30 (n1>30 y n2>30 o n1+n2>60). 2) Según el teorema central del límite, si las dos poblaciones no son normales o no sabemos si se cumple o no éste comportamiento, las diferencias de las medias muestrales se distribuirán aproximadamente como una distribución normal, si los tamaños de las muestras son mayores que 30 (n1>30 y n2>30 o n1+n2>60) Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 3) Si las dos poblaciones son normales o están muy cerca de éste comportamiento y por otra parte no conocemos la desviaciones estándar poblacionales y además los tamaños de las muestras son menores que 30 (n1<30 y n2<30 o n1+n2<60), entonces, las diferencias de las medias muestrales se distribuirán de acuerdo a la ley t-student. Prueba de hipótesis para diferencia de proporciones Para resolver pruebas de hipótesis para la diferencia de proporciones en muestras grandes, podemos basarnos en la distribución en el muestreo de las diferencias de proporciones utilizando la distribución normal y el proceso que debemos seguir es muy similar al utilizado para el caso de la media. La hipótesis nula puede plantearse como H0: P1 - P2=0 ó H0:P1=P2 y en ambos casos, la hipótesis alternativas podrían ser: HA: P1 - P 0 ó HA: P1 -P2 >0 ó HA: P1 - P2<0, según la hipótesis sea bilateral en el primer caso o unilateral en los dos siguientes. Si la hipótesis nula se plantea como: H0: P1 - P2=A (Siendo A un valor cualquiera), las hipótesis alternativas serían las mismas anteriores pero cambiando el valor 0(cero) por el valor de A. Prueba de hipótesis para diferencia de varianzas La razón entre dos varianzas, se define como la razón de dos variables Ji-cuadrada independientes, provenientes de dos poblaciones normales, dividida cada una de ellas por sus respectivos grados de libertad. En éstas condiciones la razón de varianzas se puede expresar como sigue: 2 F= S1 2 S2 Recordemos que el numerador representa a la varianza muestral mayor, mientras que el denominador representa a la varianza muestral menor. Si el valor de F según la fórmula anterior es igual a 1, entonces, podemos afirmar que las dos varianzas poblacionales son iguales, pero si es diferente de 1, dicha diferencia puede ser no significativa y podría deberse a problemas aleatorios o del azar. También podría suceder que si la razón es diferente de 1 dicha diferencia sea significativa como para pensar que las dos varianzas poblaciones son diferentes. Las pruebas de hipótesis para la razón de dos varianzas sigue el mismo proceso visto en las secciones anteriores y el criterio de decisión F debe buscarse en las tablas correspondientes. Recordemos además que para buscar el valor de F en las tablas, debemos localizar los grados de libertad del numerador en la primera fila de la tabla y localizar los grados de libertad del denominador en la primera columna de la tabla. 2 La hipótesis nula será siempre 2 2 H 0 : σ 1=σ 2 ó σ1 2 σ2 . Por otra parte la hipótesis alternativa podría ser cualquiera de las siguientes: Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 1) 2 2 H a :σ 1 <σ 2 . En éste caso la prueba es unilateral a la izquierda y el estadístico de la prueba es 2 F= S1 y se rechaza la hipótesis nula si el valor de F calculado es menor que el valor de F, según 2 S2 las tablas. 2) 2 2 H a :σ 1 >σ 2 . En éste caso la prueba es unilateral a la derecha y el estadístico de la prueba es 2 F= S1 y se rechaza la hipótesis nula si el valor de F calculado es mayor que el valor de F, según 2 S2 las tablas. 2 3) 2 1 H a :σ ≠ σ 2 2 . En éste caso la prueba es bilateral y el estadístico de la prueba es F= SM 2 Sm y se rechaza la hipótesis nula si el valor de F calculado está fuera del intervalo existente entre los dos valores de F según las tablas. El subíndice M, se refiere a la varianza muestral mayor, mientras que el subíndice m, se refiere a la varianza muestral menor. Scaricato da paola meza maldonado ([email protected]) lOMoARcPSD|2784667 Referencias MiniTab (s.f) ¿Qué es una prueba de hipótesis? Disponible el 20 de junio de 2017. Recuperado de http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-andgraphs/hypothesis-tests/basics/what-is-a-hypothesis-test/ UNID (s.f) Estadística Inferencial. Disponible el 20 de junio de 2017. Recuperado de http://moodle2.unid.edu.mx/dts_cursos_mdl/lic/AE/EI/S08/EI08_Visual.pdf XlStat (2015). ¿Cuál es la diferencia entre una prueba de dos colas (bilateral) y de una cola (unilateral)? Disponible el 20 de junio de 2017. Recuperado de https://help.xlstat.com/customer/es/portal/articles/2062454-%C2%BFcu%C3%A1l-es-la-diferenciaentre-una-prueba-de-dos-colas-bilateral-y-de-una-cola-unilateral- Scaricato da paola meza maldonado ([email protected])