Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
para lasCiencias Agropecuarias.
Sexta Edición
6
6 Contraste de Hipótesis
Introducción
El hombre reconoce cotidianamente situaciones que le afectan, como la pérdida de
cosechas, las enfermedades, las contingencias climáticas, etc. Tomar acciones para
evitar o prevenir estos problemas requiere comprender cómo funciona el sistema que
los origina. En el proceso de comprensión existe una etapa de idealización que se
llama técnicamente modelación, que tiene por objeto identificar los elementos que son
relevantes y plantear sus relaciones.
Si el modelo es correcto, en el sentido que representa bien el sistema bajo estudio, se
tendrá una herramienta valiosa para planificar acciones en el mundo real.
¿Qué relación existe entre la construcción de estos modelos y la inferencia estadística?
Para que un modelo sea incorporado al patrimonio de la ciencia tiene antes que ser
validado, es decir mostrar que las predicciones que se deducen de él son aceptables.
Lo usual es realizar un experimento u observar el comportamiento del sistema y
comparar los resultados obtenidos en estos estudios con los que se deducen del
modelo. Si no hay diferencias significativas entre lo observado y lo esperado,
entonces se dirá que el modelo es correcto para esa situación (o desde un punto de
vista más estricto: que el modelo es “provisoriamente” aceptable).
El problema es definir qué se entiende por diferencia significativa. No es simple
establecer un criterio para decir si la discrepancia entre lo que se observa y lo que se
espera es grande o pequeña.
Por ejemplo, si un modelo de precipitaciones predice que en los primeros 10 días del
mes de enero lloverá 60 mm en una localidad de la Provincia de Córdoba y en cambio
se registran 40 mm, para un detractor del modelo la diferencia será significativa
mientras que para otros no lo será. ¿Cómo ser imparcial en este juicio?
En primer lugar se deberá discutir si es razonable aceptar que el milimetraje de lluvia
caída en los 10 primeros días de enero se puede tratar como una variable aleatoria. Si
se concluyera afirmativamente, entonces, basándose en el modelo propuesto para las
137
Contraste de Hipótesis
138
Contraste de Hipótesis
6 Con la expresión “bajo hipótesis nula” se indica “suponiendo que lo que especifica la hipótesis nula es
cierto”
139
Contraste de Hipótesis
140
Contraste de Hipótesis
Nota: entre todos los estadísticos posibles para una prueba de hipótesis se
recomienda elegir aquel que maximiza la potencia de la prueba (ver definición de
potencia más adelante).
141
Contraste de Hipótesis
Ejemplos de hipótesis:
Bilateral Unilateral derecha Unilateral izquierda
H0: µ = 20 qq/ha H0: µ ≤ 20 qq/ha H0: µ ≥ 20 qq/ha
H1: µ ≠ 20qq/ha H1: µ > 20 qq/ha H1: µ < 20 qq/ha
Las Figuras 6.1-6.3 ejemplifican los distintos casos de pruebas de hipótesis, donde se
señalan las zonas de no rechazo y rechazo, los puntos críticos y las probabilidades
asociadas al rechazo de H0. Como se observa, el estadístico utilizado en estos casos
tiene esperanza 0 (cero) y una distribución simétrica (como podría ser la distribución
normal o la T de Student).
7 La división de la zona de rechazo en dos zonas de idéntico tamaño en términos de probabilidad puede
parecer arbitraria, pero es la que garantiza la máxima potencia.
142
Contraste de Hipótesis
1 −α
α/2 α/2
−∞ o ∞X
Zona Rechazo 1 Zona Rechazo 2
Zona Aceptación Ho
Punto Crítico 1 Punto Crítico 2
1 −α
α
−∞ ∞ X
o
Zona Rechazo
Zona Aceptación Ho
Punt o Crítico
1 −α
α
−∞ ∞X
Zona Rechazo o
Zona Aceptación Ho
Punto Crítico
143
Contraste de Hipótesis
Ejemplo 6.1
Se desea probar si una nueva variedad de soja lograda por un proceso de mejoramiento
genético supera la base de 20 qq/ha.
De acuerdo a los pasos enunciados anteriormente se tiene:
Paso 2: Para probar la hipótesis se planifica una experiencia que consiste en repetir el
cultivo de la nueva variedad de soja en 30 parcelas de ¼ de hectárea cada una, y
registrar sus rendimientos a cosecha.
(X- µ0 )
Se tomará W(X1,...,Xn) =
2
S
n
Este estadístico, cuando µ = µ0 y bajo el supuesto de normalidad para la variable en
estudio, se distribuye como una T de Student con n-1 grados de libertad.
144
Contraste de Hipótesis
25 - 20
W(x1 ....xn) = ≈ 6.847
4
30
Como W∈ZR se concluye que se rechaza la hipótesis nula, por lo tanto la nueva
variedad supera en promedio el rendimiento de 20 qq/ha.
Es importante observar que si se construye un intervalo de confianza del (1-α).100
unilateral izquierdo para µ, el límite inferior sería mayor que 20 qq/ha, lo cual es
consistente con lo encontrado en la prueba de hipótesis. De hecho, toda prueba tiene
asociada un intervalo de confianza y viceversa.
Errores
En la prueba de una hipótesis estadística pueden ocurrir dos errores: el error de tipo I y
el error de tipo II. La posible ocurrencia de uno u otro error depende de la condición
de verdadera o falsa de la hipótesis nula y de la decisión, basada en la muestra, de
aceptarla o rechazarla.
Si se rechaza H0, el Error de Tipo I se comete cuando H0 es verdadera. Si por el
contrario se acepta H0 siendo ésta falsa, entonces se cometerá el Error de Tipo II. Es
importante advertir que estos errores constituyen eventos de espacios muestrales
diferentes definidos por la condición de verdadera o falsa de H0. En consecuencia, si
se asignan a ellos probabilidades de ocurrencia α y β para el error tipo I y II
respectivamente, será incorrecto decir que la probabilidad de error total en una
prueba de hipótesis es la suma α + β.
145
Contraste de Hipótesis
Ejemplo 6.2
Una muestra de 25 observaciones procede de una distribución normal con media µ=50
–
y desviación estándar σ = 10, por lo tanto la distribución muestral de X es normal con
media µ = 50 y desviación estándar σ / n = 10/5 = 2.
Si el interés se centra en probar la hipótesis nula µ = 50 vs. µ ≠ 50, luego, se toma
(X − µ)
como estadístico de la prueba a W(X1,...,Xn ) = cuya distribución es
σ2
n
N(0,1) cuando H0 es cierta. Para encontrar los valores de W que conducen al rechazo
de H0, se obtienen los puntos críticos de la tabla de distribución normal teniendo en
cuenta que la hipótesis alternativa implica una prueba bilateral y tomando un nivel de
significación del 5%. Luego:
146
Contraste de Hipótesis
donde Z ~ N (0,1)
⎛ ⎞
⎜ µ − µ 0 ⎟⎟
β = P ⎜ Z ≤ Z1−α − si la prueba es unilateral derecha y
⎜ σ 2 ⎟
⎜ ⎟
⎝ n ⎠
⎛ ⎞
⎜ µ − µ 0 ⎟⎟
⎜
β = P Z ≥ Zα − si la prueba es unilateral izquierda.
⎜ σ2 ⎟
⎜ ⎟
⎝ n ⎠
147
Contraste de Hipótesis
⎛ ⎞
⎜ µ − µ0 µ − µ 0 ⎟⎟
⎜
β = P Zα /2 − ≤ Z ≤ Z 1−α / 2 − donde Z ~ N (0,1)
⎜ σ2 σ2 ⎟
⎜ ⎟
⎝ n n ⎠
1 −α
α/2 α/2
−∞ o ∞ T(.)
Zona Rechazo 1 Zona Rechazo 2
Zona Aceptación Ho
Punto Crítico 1 Punto Crítico 2
−∞ µ−µ 0 ∞ T(.)
σ2 /n
148
Contraste de Hipótesis
149
Contraste de Hipótesis
n α = 0.05 α = 0.01
1 0.945 0.988
3 0.936 0.985
5 0.927 0.980
10 0.903 0.973
25 0.830 0.942
50 0.707 0.877
100 0.484 0.717
400 0.021 0.077
1000 0.00001 0.0001
Curva de potencia
Hasta aquí se ha considerado solo la alternativa µ = 52. Otras alternativas tendrán
diferentes valores de β. Suponga de nuevo que se está contrastando la hipótesis µ = 50
vs. µ ≠ 50 con σ = 10 y α = 0.05, con una muestra de tamaño 25. Ahora, si µ bajo la
hipótesis alternativa es 53, se obtiene β = 0.674.
150
Contraste de Hipótesis
π
1
α
µo µ
Figura 6.5: Curva de la función de potencia para una prueba bilateral.
151
Contraste de Hipótesis
Este problema también se podría haber resuelto al obtener una estimación de µ por
Intervalo de Confianza. Si el valor hipotético de µ (20 qq/ha) hubiera quedado
comprendido dentro del intervalo no se habría rechazado la H0 y en caso contrario se
habría rechazado.
Finalmente, en el caso que se rechace H0, se puede aplicar la estimación por intervalo
para saber cúal es el valor del parámetro con una determinada confianza.
152
Contraste de Hipótesis
Ejercicios
Ejercicio 6.5
Se acepta que después de 3 años de almacenamiento el vigor de un arbusto forrajero
medido como peso seco alcanzado a los 20 días de la germinación es de 45 mg
promedio. Un nuevo método de almacenamiento se propone para aumentar el vigor.
Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace
germinar, obteniéndose los siguientes resultados de peso seco promedio a los 20 días:
49 43 56 57 59 65 52 51 50 55
60 65 53 57 67 56 53 37 45 42
a) Plantear las hipótesis nula y alternativa asociadas al problema.
b) Realizar una prueba de hipótesis con un nivel de significación α = 0.01.
c) De acuerdo a la conclusión que se obtuvo en el punto anterior, ¿se justifica
realizar un cálculo de potencia?; ¿por qué?
Ayuda: si tuviera que calcular la potencia con la que se realizó la prueba, acepte la
varianza muestral calculada como si se tratara de la varianza poblacional y tome a
la media muestral como estimador de la verdadera media poblacional.
Ejercicio 6.6
Un tipo de ratón de laboratorio muestra una ganancia media de peso de 65 gr. durante
los primeros tres meses de vida. Doce ratones fueron alimentados con una nueva dieta
desde su nacimiento hasta los primeros tres meses de vida, observándose las siguientes
ganancias de peso en gr.:
153
Contraste de Hipótesis
65 62 64 68 65 64 60 62 69 67 62 71
a) ¿Hay razón para creer que la dieta produce una variación significativa en la
cantidad de peso ganado? Trabajar con α = 0.05.
b) Calcular para la prueba planteada, las potencias para diferentes valores de µ1
variando en el intervalo [62 gr., 70 gr.] y dibujar la curva de potencia.
154