Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apunte7 09
Apunte7 09
INTRODUCCIÓN.
Por intervalo: En este caso para estimar el valor de un parámetro poblacional , usamos un estimador puntual
insesgado, como para determinar un intervalo
[ c , + c ]
donde es la desviación estándar de la distribución muestral de .
En particular, si z/2 es tal que P(z/2 < z ) = /2,
o equivalentemente, P(0 < z < z/2) = (1
entonces
[ z/2 , + z/2 ] es un intervalo de confianza de 1.
es decir,
P([ z/2 , + z/2 ] contenga a ) =1.
Para calcular las probabilidades anteriores, se usa la distribución muestral de . Se supuso que se
trabajaba con muestras grandes para que esta distribución fuera aproximadamente normal.
Hoy vamos a ver como se puede realizar una inferencia acerca de un parámetro poblacional
probando (o comprobando) una hipótesis acerca de su valor. Veamos algunos ejemplos en donde se puede
usar una prueba de hipótesis:
Un investigador en medicina propone la hipótesis de que un medicamento A es más efectivo que otro B
para curar una cierta enfermedad.
Un técnico de control de calidad propone la hipótesis de que un nuevo método de montaje produce sólo
5% de artículos defectuosos.
Un educador afirma que dos métodos para enseñar tiene la misma eficacia.
Un candidato político afirma que la mayoría de los votantes están de su parte.
En todos estos casos la hipótesis o afirmación se somete a una prueba estadística para compararla
con los resultados de los datos muestrales. Vamos a ver:
Qué función de las mediciones muestrales debe utilizarse para realizar la prueba.
Cómo se decide si una muestra no concuerda con la hipótesis
Cuándo debe rechazarse la hipótesis, aceptarse la hipótesis o no decidir nada acerca de la hipótesis.
Cuál es la probabilidad de tomar una decisión equivocada.
______________________________________________________________________
ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS
Probabilidad y Estadística Pruebas de hipótesis 12
El objetivo de toda prueba de hipótesis es probar una hipótesis acerca del valor de un parámetro
poblacional. Entonces el primer elemento de la prueba de hipótesis es la afirmación o hipótesis sobre el valor
de uno o más parámetros poblacionales y recibe el nombre de hipótesis alternativa.
Hipótesis alternativa, Ha: afirmación o hipótesis sobre el valor de uno o más parámetros poblacionales. Se
denota con Ha.
El soporte para la validez de la hipótesis alternativa H a se obtiene mostrando, usando los valores
muestrales como evidencia, que la hipótesis nula H 0 es falsa. Así el soporte de una hipótesis se obtiene
mostrando la falta de soporte para la otra.
Ejemplo. a) Se cree que no más del 50% de los consumidores prefiere un producto de marca A.
Se propone como hipótesis alternativa que la proporción p de consumidores que prefieren la marca A es
mayor que 50% = 0.5
Ha: p > 0.5
Se propone además
H0: p = 0.5
En función de los datos de una muestra se obtiene un número llamando la estadística de prueba (que puede
ser un estimador).
c) Por ejemplo, se obtiene x la cantidad de consumidores que prefieren A de los 100 de la muestra.
El conjunto de todos los valores que puede tomar la estadística de prueba se divide en dos
subconjuntos o regiones:
región de rechazo región de aceptación
Si la estadística cae en la región de rechazo, se rechaza H 0 a favor de Ha.
Si la estadística cae en la región de aceptación, se acepta H 0.
d) Como 0 x 100, es decir, x [0, 100], Ha: p > 0.5 y H0: p = 0.5 se podría tener
región de rechazo: [60, 100] región de aceptación: [0, 60)
(observar que la región de rechazo contiene valores 60 que apoyan Ha).
En general, la región de rechazo incluye valores de x que apoyan H a . En ese ejemplo, Ha: p > 0.5,
por lo tanto la región de rechazo incluye valores de x grandes, que son los que hacen poco probable que p
0.5. La región de aceptación y que por lo tanto apoya H 0 incluye entonces valores de x chicos. Más allá
de estas consideraciones, la determinación de las regiones de rechazo y aceptación depende de la
probabilidad de cometer errores con la que se quiera trabajar. Antes de ver esto, resumamos cuales son los
elementos de una prueba de hipótesis.
Probabilidad y Estadística Pruebas de hipótesis 13
Resumiendo
Elementos de una prueba estadística.
1. Hipótesis alternativa.
2. Hipótesis nula.
3. Estadística de prueba.
4. Región de rechazo.
Analicemos los errores que se pueden cometer al aceptar o rechazar H 0, cuales son las probabilidades
de cometer cada uno de ellos y como se usa esto para determinar las regiones de rechazo y aceptación.
La hipótesis nula H0 puede ser verdadera o falsa, cosa que no conocemos.
Tabla de decisiones.
Hipótesis nula
Decisión Verdadera Falsa
Rechazar H0 Error tipo I Decisión correcta
Aceptar H0 Decisión correcta Error tipo II
La validez o bondad de una prueba de hipótesis se mide mediante las probabilidades de cometer cada
uno de estos errores
Error tipo I:
Supongamos que H0 es verdadera, es decir, se cumple que p = 0.5. Entonces se puede cometer un
error tipo I, cuando se rechaza H0. Veamos como se calcula .
Como H0 es verdadera, x tiene una distribución binomial con parámetro p = 0.5. Como el tamaño n =
100 de la muestra es grande se puede suponer normal con
x = n p = 100 (0.5) = 50
x = npq = 100(0.5)(1 0.5) = 5
Si se define como
región de rechazo: x + 2 = 60,
la probabilidad de cometer un error tipo I, es decir de rechazar H 0 siendo esta verdadera es
Probabilidad y Estadística Pruebas de hipótesis 14
= P( x 60 ) = 0.025.
Es decir x caerá en la región de rechazo 2.5% de las veces, cometiéndose un error al rechazar H 0
siendo verdadera. Vemos además que el valor de queda fijo al fijar la región de rechazo.
Como H0 es falsa, x tiene una distribución binomial con parámetro p desconocido. Como el tamaño n
= 100 de la muestra es grande se puede suponer normal con
= n p = 100 p
= npq = 100 p (1 p )
Aunque sabemos que la distribución de x es normal, como desconocemos p no es imposible calcular la
probabilidad de x que caiga en un determinado intervalo, y por ende .
Sin embargo, podemos ver como se comporta de acuerdo a si p se encuentra cerca o lejos del valor
estipulado en H0, que es 0.5.
Si p = 0.9, en la muestra de 100 consumidores casi la totalidad estará a favor de la marca A, con lo
cual x estaría bastante cerca de 100. De este modo, tendríamos una evidencia muy fuerte para rechazar H 0: p
= 0.5, y por ende de no equivocarnos. Es decir, en este caso es chico.
Probabilidad y Estadística Pruebas de hipótesis 15
Si p = 0.55, en la muestra de 100 consumidores casi la mitad estaría a favor de la marca A. De este
modo, tendríamos evidencia como para aceptar H 0: p = 0.5, y por ende de equivocarnos. Es decir, en este
caso es grande.
En definitiva, mientras mayor sea la diferencia entre p real y el que propone H 0, menor es
probabilidad de cometer un error tipo II, es decir, menor es .
Mientras más grande (chica) es la región de rechazo más chica (grande) es la región de aceptación.
Si crece (disminuye) entonces disminuye (crece).
En general se tiene,
Propiedades de y
1. El valor de se fija al escoger la región de rechazo.
2. El valor de dependerá del valor que se use para definir H0.
Mientras más grande (chica) sea la diferencia entre el valor que se use para definir H 0 y el valor real del
parámetro, menor (mayor) será .
3. Si crece (disminuye) entonces disminuye (crece).
4. Si se aumenta el tamaño de la muestra y disminuyen.
Al idear una prueba de hipótesis se consideran los valores y que se quieren tolerar. Los pasos que
se suelen seguir son:
1. Se especifica .
2. En función de , se determina la región de rechazo.
3. Se selecciona un tamaño n de muestra para lograr un adecuado.
El último paso es el que en general no se puede llevar a cabo porque es necesario conocer los
distintos valores de para diferentes valores del parámetro en prueba. En la práctica, si la estadística de
prueba cae en la región de rechazo, podemos cometer un error tipo I y sabemos cual es la probabilidad de
cometerlo. Si la estadística de prueba cae en la región de aceptación, con lo cual se está en riesgo de cometer
un error de tipo II, no se toma decisión alguna y se recolectan más datos.
___________________________________________________________________________
PRUEBA ESTADÍSTICA PARA MUESTRAS GRANDES
Ahora enunciaremos lo anterior, que se vio para un ejemplo concreto (parámetro p de una población
binomial), de modo general.
Recordemos que una estadística de prueba es un número que se obtiene en función de los datos de
una muestra. Se puede usar como estadística de prueba un estimador puntual insesgado que tenga una
distribución de muestreo aproximadamente normal para tamaños grandes de muestra como los que vimos la
clase pasada:
La media muestral x es un estimador insesgado de la media poblacional .
La proporción muestral p̂ es un estimador insesgado del parámetro p.
x 1 x 2 es un estimador insesgado del parámetro 1 2.
p̂ 1 p̂ 2 es un estimador insesgado del parámetro p1 p2.
En general, sea es un estimador insesgado de un parámetro . Se supone que es un estimador
insesgado que tiene una distribución de muestreo aproximadamente normal.
Supongamos que se quiere probar que el parámetro poblacional es mayor que un cierto valor 0, es
decir
Ha: > 0
Se propone entonces como hipótesis nula
H 0: = 0
Probabilidad y Estadística Pruebas de hipótesis 16
Estadístico de prueba:
La región de rechazo debe contener valores de que apoyen Ha, > 0. Así se elige un C > 0, y se define
región de rechazo: { > 0 + C}.
0 + C valor crítico de la estadística de prueba (separa la región de rechazo de la región de prueba).
Si se quiere probar que el parámetro poblacional es menor que un cierto valor 0,
Ha: < 0
H0: = 0
Estadístico de prueba:
La región de rechazo debe contener valores de que apoyen Ha, < 0.
región de rechazo: { < 0 C}
En ambos casos se dice que es una prueba estadística de una extremidad o cola pues la región de
rechazo se localiza en un sólo extremo de la distribución muestral de la estadística de prueba.
Si se quiere probar que el parámetro poblacional es distinto de cierto valor 0, se tendría
Ha: 0
H0: = 0
Estadístico de prueba:
región de rechazo: { < 0 C} o { > 0 + C}
y se dice que es una prueba estadística de dos extremidades o colas pues la región de rechazo se localiza en
ambos extremos de la distribución muestral de la estadística de prueba.
Si se utiliza como estadístico de prueba la variable
ˆ 0
z=
ˆ
que es la desviación de una variable aleatoria , respecto a 0, expresada en unidades de ˆ .
si
= P(error tipo I),
Probabilidad y Estadística Pruebas de hipótesis 17
En particular se tiene
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
(a) Probar la hipótesis de que el promedio de la producción diaria es = 880 toneladas por día contra la
alternativa de que es mayor o menor a 880 toneladas por día.
Como x = 871, entonces z = 3.03 que cae en la región de rechazo. Así rechazamos que el
promedio de la producción diaria es = 880 toneladas por día y la probabilidad de equivocarnos es de 5%.
Así si fuera en realidad 870 toneladas, la probabilidad de aceptar H0: = 880 es 7.9%.
________________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS POBLACIONALES
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN POBLACIONAL
2. Hipótesis alternativa.
Prueba de una extremidad (o cola) Ha: p > p0 (p < p0)
Prueba de dos extremidades (o cola) Ha: p p0.
pˆ p 0
pˆ p 0
3. Estadística de prueba. z = = p0 q0
pˆ
n
4. Región de rechazo.
Prueba de una extremidad (o cola):z > z (z < z)
z es tal que P(z > z) = P(z < z) = .
Prueba de dos extremidades (o cola): z > z/2 o z < z/.
z/2 es tal que P(z > z/2) = P(z < z/2) = /2.
Suposición: El muestreo aleatorio satisface las características de un experimento binomial y el tamaño de la
muestra n 30.
___________________________________________________________________________
PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES POBLACIONALES
___________________________________________________________________________
VALORES p
La probabilidad de un error tipo I, , suele denominarse nivel de significación asociada a una prueba
estadística.
Probabilidad y Estadística Pruebas de hipótesis 110
El valor p, es el mínimo nivel de significación para el cual los datos observados indican que se tendría que
rechazar la hipótesis.
Ejemplo. La producción diaria de una planta industrial química registrada durante n = 50 días tiene una
media x = 871 toneladas y una desviación estándar s = 21 toneladas.
Hipótesis nula. H0: = 880.
Hipótesis alternativa. Prueba de dos extremidades (o cola) Ha: 880.
x 0 x 880 x 880 x 880
Estadística de prueba. z = = =
/ n / 50 s / 50 21 / 50
Se tiene el valor x = 871, entonces z = 3.03 es un valor observado de z.
Región de rechazo. Prueba de dos extremidades (o cola): z > z/2 o z < z/.
(Antes se usó = 0.05, entonces z/ = 1.96. Luego Región de rechazo. z > 1.96 o z < 1.96)