Cap6 Contraste Hipotesis

Di Rienzo., et al. 2005.
Estadística
para lasCiencias Agropecuarias.
Sexta Edición
6
6 Contraste de Hipótesis
Introducción
El hombre reconoce cotidianamente situaciones que le afectan, como la pérdida de
cosechas, las enfermedades, las contingencias climáticas, etc. Tomar acciones para
evitar o prevenir estos problemas requiere comprender cómo funciona el sistema que
los origina. En el proceso de comprensión existe una etapa de idealización que se
llama técnicamente modelación, que tiene por objeto identificar los elementos que son
relevantes y plantear sus relaciones.
Si el modelo es correcto, en el sentido que representa bien el sistema bajo estudio, se
tendrá una herramienta valiosa para planificar acciones en el mundo real.
¿Qué relación existe entre la construcción de estos modelos y la inferencia estadística?
Para que un modelo sea incorporado al patrimonio de la ciencia tiene antes que ser
validado, es decir mostrar que las predicciones que se deducen de él son aceptables.
Lo usual es realizar un experimento u observar el comportamiento del sistema y
comparar los resultados obtenidos en estos estudios con los que se deducen del
modelo. Si no hay diferencias significativas entre lo observado y lo esperado,
entonces se dirá que el modelo es correcto para esa situación (o desde un punto de
vista más estricto: que el modelo es “provisoriamente” aceptable).
El problema es definir qué se entiende por diferencia significativa. No es simple
establecer un criterio para decir si la discrepancia entre lo que se observa y lo que se
espera es grande o pequeña.
Por ejemplo, si un modelo de precipitaciones predice que en los primeros 10 días del
mes de enero lloverá 60 mm en una localidad de la Provincia de Córdoba y en cambio
se registran 40 mm, para un detractor del modelo la diferencia será significativa
mientras que para otros no lo será. ¿Cómo ser imparcial en este juicio?
En primer lugar se deberá discutir si es razonable aceptar que el milimetraje de lluvia
caída en los 10 primeros días de enero se puede tratar como una variable aleatoria. Si
se concluyera afirmativamente, entonces, basándose en el modelo propuesto para las
137
Contraste de Hipótesis
precipitaciones, se podría derivar su distribución y a partir de ella asignar una

probabilidad al evento: “obtener un milimetraje de más de 20 milímetros por debajo o
por encima de la esperanza de la distribución de lluvias” (el milimetraje predicho por
el modelo, en este caso, es de 60 mm). Con esta medida de probabilidad se podrá
tomar una decisión que es reproducible por cualquier investigador. Para el caso,
considérese un ejemplo extremo: suponga que al calcular esta probabilidad se obtiene
que el evento tiene una chance de ocurrir 1 de cada 1.000.000 de veces (uno en un
millón). Esto quiere decir que de cada un millón de períodos que van del 1 al 10 de
enero en la localidad citada, sólo uno tendrá un milimetraje que discrepa en 20 o más
milímetros de lo esperado bajo el modelo. Luego, con la evidencia observada se
pueden sacar dos conclusiones: 1) que se tuvo muy mala suerte (justo se observó el
período que ocurre una vez cada millón de años), o 2) que el modelo es incorrecto. Lo
usual, en estos casos, es aceptar la segunda alternativa.
Otro hubiera sido el caso si la probabilidad del evento mencionado fuera 0.40, esto es
40 de cada 100 años ocurren discrepancias iguales o mayores que la observada. Aquí,
la evidencia muestral no tiene peso suficiente para que se rechace el modelo ya que el
evento observado es un evento frecuente.
La idea es entonces: dado un modelo no validado - que se llama hipótesis científica -
se debe seguir algún procedimiento para deducir alguna consecuencia, cuya
verificación o falta de verificación, sirva para establecer la veracidad de la hipótesis
científica. Si la/s consecuencia/s de la hipótesis científica se pueden visualizar como
propiedades estadísticas de una variable aleatoria, será factible utilizar herramientas
estadísticas para tomar una decisión sobre la veracidad del modelo. Para ello se debe
expresar la hipótesis científica como una hipótesis estadística. Estas hipótesis
consisten en una afirmación sobre uno o más parámetros de la distribución de la
variable aleatoria en cuestión, como sería por ejemplo, para la variable milimetraje de
lluvia indicar que la esperanza de la distribución µ = 60 mm.
Es obvio que la hipótesis estadística debe ser equivalente a la hipótesis científica
postulada, de lo contrario, aceptar o rechazar la hipótesis estadística no implicará
necesariamente lo propio para la hipótesis científica.
Conceptualmente la prueba estadística o prueba de hipótesis es sencilla: se examina
un conjunto de datos muestrales y a partir de ellos se calcula un estadístico cuya
distribución depende de la hipótesis planteada. Sobre la base de la distribución
especificada para el estadístico y de su valor observado en la muestra, se decide el
rechazo o no de la hipótesis estadística y en consecuencia de la hipótesis científica.
Aunque las hipótesis científicas pueden dar lugar a hipótesis estadísticas que
138
involucran a más de un parámetro de la distribución de una o más variables aleatorias,

la discusión que sigue se limitará, por razones de simplicidad, al caso de pruebas de
hipótesis acerca de un parámetro de la distribución de una variable aleatoria normal.
Los objetivos de este capítulo son establecer relaciones entre el Contraste de Hipótesis
y el Método Científico, analizar las etapas fundamentales de la Prueba Estadística de
Hipótesis, conceptualizar los distintos tipos de errores, y establecer relaciones con la
Estimación de Parámetros.
Procedimiento de la Prueba de Hipótesis

A fin de dar una idea general de la metodología de la prueba estadística de hipótesis, y
aunque se incluyen conceptos que se definen posteriormente, a continuación se
enumeran los pasos a seguir en la prueba de una hipótesis estadística:
a) Plantear las hipótesis nula y alternativa.
b) Planificar el experimento o el esquema muestral conducente a obtener datos que
permitan la validación o no de la hipótesis sometida a prueba.
c) Seleccionar (o construir) un estadístico cuya distribución quede completamente
especificada bajo la hipótesis nula6.
d) Establecer el nivel de significación de la prueba.
e) Establecer los eventos que conducen al rechazo y no rechazo de la hipótesis nula
mediante la definición de regiones de rechazo y de no rechazo (aceptación).
f) Realizar el ensayo o muestreo "ad hoc", definido en el punto b para obtener las
observaciones con las que se realizará la prueba.
g) Calcular el valor del estadístico postulado y determinar si está dentro o fuera de la
región de rechazo. En el primer caso se dice que se rechaza la hipótesis nula y en
el segundo que no.
El orden en que se presentan los pasos anteriores es una secuencia formal que no
siempre se respeta en la práctica de la investigación. Usualmente se tiene una hipótesis
científica y se planifica una experiencia para probarla y una vez obtenidos los datos se
trata de formalizar una hipótesis estadística. Debe advertirse que aunque en la práctica
es usual este proceder, decididamente no es recomendable ya que la elección del
estadístico y su distribución dependen de la forma en que se planifica el experimento
6 Con la expresión “bajo hipótesis nula” se indica “suponiendo que lo que especifica la hipótesis nula es
cierto”
139
(o el muestreo) y de la naturaleza de la hipótesis estadística formulada. Si esto no se

ha tenido en cuenta a la hora de planificar la experiencia, puede ocurrir (y de hecho
ocurre con mucha frecuencia) que los datos obtenidos sean de escaso o nulo valor para
realizar una prueba estadística.
A continuación se definen y discuten cada uno los pasos presentados.
Plantear las hipótesis nula y alternativa

Para poder construir una prueba estadística se debe especificar una hipótesis que se
supone, provisoriamente como verdadera, llamada hipótesis nula y es simbolizada
con H0. Esta hipótesis especifica los valores de uno o varios parámetros de la
distribución de la variable aleatoria observada en el experimento. Cuando la hipótesis
nula se somete a prueba, el resultado es su aceptación o rechazo. En este último caso
se aceptará una hipótesis especificada de antemano que se llama hipótesis
alternativa, que se simboliza por H1 y que propone como posibles valores del o los
parámetros en cuestión al conjunto de valores complementarios al postulado bajo H0.
Planificar el experimento o el esquema muestral

La forma en que se recolectan los datos o se diseña el experimento es motivo de
tratamiento particular por las técnicas de muestreo y el diseño de experimentos. A
modo de introducción se puede decir que el objetivo de este paso es definir la forma
en que los datos serán obtenidos, incluyendo el número total de observaciones en la
muestra (o el número de repeticiones del experimento).
Selección de un estadístico para la prueba e identificación de su

distribución bajo H0
El estadístico de la prueba es una función de la muestra. Se necesita una función W de
la muestra cuya distribución sea conocida y quede completamente especificada bajo
H0, es decir que se puede calcular P(W≤w). La función W, a través de su distribución,
servirá para asignar probabilidades a los eventos que conducen a aceptar o rechazar la
hipótesis nula postulada. El evento que induce al rechazo se conoce como región o
zona de rechazo de H0, en tanto que el evento que conduce al no rechazo se llama
región o zona de aceptación de H0.
140
Nota: entre todos los estadísticos posibles para una prueba de hipótesis se
recomienda elegir aquel que maximiza la potencia de la prueba (ver definición de
potencia más adelante).
Establecer el nivel de significación de la prueba
Definición 6.1: Nivel de significación

El nivel de significación se define como la máxima probabilidad de rechazar H0 cuando ésta
es verdadera. Será denotado por la letra griega α.
El nivel de significación representa la máxima probabilidad de equivocarse en el

sentido de concluir que H0 es falsa cuando en realidad no lo es. Este error, llamado
Error de Tipo I, será considerado detenidamente en la próxima sección.
Una vez que se han establecido H0 y H1 debe fijarse el nivel de significación. En
general se fija en 0.05 (5%) o en 0.01 (1%), que son niveles usualmente aceptados,
aunque no hay razón alguna para no seleccionar algún otro.
Es importante indicar que la probabilidad de cometer el error de tipo I se establece
antes de la realización de la prueba estadística. Esta observación tiene el objetivo de
que el investigador evalúe cuál es la tasa de error de tipo I que está dispuesto a tolerar
en base a criterios independientes de los resultados muestrales o experimentales.
Establecer los eventos que conducen al rechazo y no rechazo de la

Hipótesis Nula
Una vez fijados el estadístico de la prueba, su distribución y el nivel de significación,
el próximo paso consiste en establecer las regiones de no rechazo y de rechazo de H0.
Definición 6.2: Región o zona de rechazo

La región de rechazo de H0 es uno o más intervalos de la recta real que describen al evento
que conduce al rechazo de H0 y cuya probabilidad, cuando H0 es verdadera, es α.
Definición 6.3: Región o zona de no rechazo

La región de no rechazo de H0 es un intervalo de la recta real que describe al evento que
conduce al no rechazo de H0 con probabilidad 1-α ,cuando H0 es cierta.
141
La zona de rechazo puede estar a la izquierda o a la derecha de la distribución del

estadístico bajo H0, y en estos casos se dice que la prueba es unilateral izquierda o
derecha respectivamente. Cuando la zona de rechazo está repartida a izquierda y
derecha se dice que la prueba es bilateral.
La condición bilateral o unilateral de la prueba de hipótesis depende de la hipótesis
alternativa. El “tamaño” de la región de rechazo esta determinado por el nivel de
significación de la prueba.
Así, si la hipótesis nula es µ = µ0 y su alternativa es de la forma µ ≠ µ0 se está en
presencia de una prueba bilateral y la zona de rechazo estará ubicada en las dos colas
(izquierda y derecha) de la distribución del estadístico de la prueba. Si el nivel de
significación fuera del 5% (α = 0.05), las “porciones” derecha e izquierda de la zona
de rechazo tendrán asociadas una probabilidad de 0.025 cada una7.
En contraposición, si la hipótesis alternativa es µ > µ0 o µ < µ0 la prueba es unilateral
derecha o izquierda respectivamente, y la zona de rechazo de H0 estará ubicada en la
cola derecha o izquierda de la distribución del estadístico de la prueba y la
probabilidad asociada a la región será “α” en lugar de “α/2” como en las pruebas
bilaterales.
Ejemplos de hipótesis:
Bilateral Unilateral derecha Unilateral izquierda
H0: µ = 20 qq/ha H0: µ ≤ 20 qq/ha H0: µ ≥ 20 qq/ha
H1: µ ≠ 20qq/ha H1: µ > 20 qq/ha H1: µ < 20 qq/ha
Definición 6.4: Puntos críticos

Los valores de la recta real que separan la zona de no rechazo de la de rechazo se denominan
puntos críticos.
Las Figuras 6.1-6.3 ejemplifican los distintos casos de pruebas de hipótesis, donde se
señalan las zonas de no rechazo y rechazo, los puntos críticos y las probabilidades
asociadas al rechazo de H0. Como se observa, el estadístico utilizado en estos casos
tiene esperanza 0 (cero) y una distribución simétrica (como podría ser la distribución
normal o la T de Student).
7 La división de la zona de rechazo en dos zonas de idéntico tamaño en términos de probabilidad puede
parecer arbitraria, pero es la que garantiza la máxima potencia.
142
1 −α
α/2 α/2
−∞ o ∞X
Zona Rechazo 1 Zona Rechazo 2
Zona Aceptación Ho
Punto Crítico 1 Punto Crítico 2
Figura 6.1: Representación de la distribución del estadístico bajo H0 en una prueba

bilateral
1 −α
α
−∞ ∞ X
o
Zona Rechazo
Zona Aceptación Ho
Punt o Crítico

unilateral derecha
1 −α
α
−∞ ∞X
Zona Rechazo o
Zona Aceptación Ho
Punto Crítico

unilateral izquierda
Realizar un ensayo o muestreo “ad Hoc”

Esta etapa tiene por objeto obtener datos experimentales que permitan evaluar el
estadístico propuesto para la prueba, de acuerdo a la planificación realizada
previamente.
143
Calcular el valor del estadístico y determinar si está dentro o fuera de la

región de rechazo
Con los datos obtenidos en el paso anterior se calculará W, cuya distribución bajo la
hipótesis nula es conocida y para la cual se han fijado las regiones de no rechazo y
rechazo.
Si el valor calculado de W pertenece a la región de rechazo se concluye que la
hipótesis nula debe desecharse. En caso contrario se concluye que no hay evidencia
suficiente (o como se verá más adelante, quizás suficiente potencia), para rechazarla.
Ejemplo 6.1
Se desea probar si una nueva variedad de soja lograda por un proceso de mejoramiento
genético supera la base de 20 qq/ha.
De acuerdo a los pasos enunciados anteriormente se tiene:
Paso 1: Planteo de la hipótesis estadística

H0: µ ≤ µ0 (20 qq/ha)
H1: µ > µ0 (20 qq/ha).
Paso 2: Para probar la hipótesis se planifica una experiencia que consiste en repetir el
cultivo de la nueva variedad de soja en 30 parcelas de ¼ de hectárea cada una, y
registrar sus rendimientos a cosecha.
Paso 3: Elección de la función de la muestra W
(X- µ0 )
Se tomará W(X1,...,Xn) =
2
S
n
Este estadístico, cuando µ = µ0 y bajo el supuesto de normalidad para la variable en
estudio, se distribuye como una T de Student con n-1 grados de libertad.
Paso 4: Se fija el nivel de significación α, por ejemplo, en 0.05.

Paso 5: Para el establecimiento de las zonas de aceptación y de rechazo, es necesario
establecer el punto crítico (PC). El PC para W, que en este ejemplo es una variable T
de Student, es el cuantil 0.95 de la distribución T con (n-1) grados de libertad y se
144
denota como T(n-1);0.95.

Si de acuerdo a la planificación del experimento hay 30 repeticiones, en la tabla t de
Student se obtiene PC = 1.699, por lo tanto la zona de aceptación de H0 (ZA) y la de
rechazo de la H0 (ZR) serán:
ZA = (-∞ , 1.699) y ZR = [1.699, ∞)
Paso 6: De acuerdo a la planificación del experimento, referida en el Paso 2, al cabo
_
de la cosecha se obtienen los siguientes resultados: X = 25 qq/ha y S = 4 qq/ha.
Paso 7: Se calcula W y se observa a cuál de los intervalos definidos en el Paso 5

pertenece. En función de ello se acepta o no la hipótesis, así:
25 - 20
W(x1 ....xn) = ≈ 6.847
4
30
Como W∈ZR se concluye que se rechaza la hipótesis nula, por lo tanto la nueva
variedad supera en promedio el rendimiento de 20 qq/ha.
Es importante observar que si se construye un intervalo de confianza del (1-α).100
unilateral izquierdo para µ, el límite inferior sería mayor que 20 qq/ha, lo cual es
consistente con lo encontrado en la prueba de hipótesis. De hecho, toda prueba tiene
asociada un intervalo de confianza y viceversa.
Errores
En la prueba de una hipótesis estadística pueden ocurrir dos errores: el error de tipo I y
el error de tipo II. La posible ocurrencia de uno u otro error depende de la condición
de verdadera o falsa de la hipótesis nula y de la decisión, basada en la muestra, de
aceptarla o rechazarla.
Si se rechaza H0, el Error de Tipo I se comete cuando H0 es verdadera. Si por el
contrario se acepta H0 siendo ésta falsa, entonces se cometerá el Error de Tipo II. Es
importante advertir que estos errores constituyen eventos de espacios muestrales
diferentes definidos por la condición de verdadera o falsa de H0. En consecuencia, si
se asignan a ellos probabilidades de ocurrencia α y β para el error tipo I y II
respectivamente, será incorrecto decir que la probabilidad de error total en una
prueba de hipótesis es la suma α + β.
145
Con la finalidad de dar una interpretación de α, considérese el siguiente ejemplo.
Ejemplo 6.2
Una muestra de 25 observaciones procede de una distribución normal con media µ=50
–
y desviación estándar σ = 10, por lo tanto la distribución muestral de X es normal con
media µ = 50 y desviación estándar σ / n = 10/5 = 2.
Si el interés se centra en probar la hipótesis nula µ = 50 vs. µ ≠ 50, luego, se toma
(X − µ)
como estadístico de la prueba a W(X1,...,Xn ) = cuya distribución es
σ2
n
N(0,1) cuando H0 es cierta. Para encontrar los valores de W que conducen al rechazo
de H0, se obtienen los puntos críticos de la tabla de distribución normal teniendo en
cuenta que la hipótesis alternativa implica una prueba bilateral y tomando un nivel de
significación del 5%. Luego:
PC1 = Z(α/2) = -1.960 y PC2 = Z(1-α/2) =1.960
Así, la regla de decisión es: se rechaza µ = 50 si W es menor que -1.960 o si W es

mayor que 1.960 y no se rechaza µ = 50 si W está entre -1.960 y 1.960.
Nótese que la tabla de los cuantiles de la distribución normal estándar muestra que el
2,5% del área por debajo de la curva se corresponde con valores menores de -1.960 y
otro porcentaje similar con valores mayores que 1.960.
En síntesis:
Cuando H0 es cierta el 5% de las muestras tendrán un valor de W menor que -1.960 o
mayor que 1.960, y para estas muestras la anterior regla de decisión conducirá al error
de rechazar que µ es 50.
Por otra parte, el 95% de las muestras presentarán valores de W entre -1.960 y 1.960 y
en estos casos se decidirá correctamente que µ = 50.
Cálculo de la probabilidad de cometer Error de Tipo II (β)

Prosiguiendo con el ejemplo, supóngase que la hipótesis nula no es verdadera y que
µ = 52. Lo que interesaría saber, en este caso, es cuál es la probabilidad de aceptar H0
cuando es falsa. Para conocer esta probabilidad se debe encontrar la probabilidad de la
región de aceptación cuando µ = 52. En el ejemplo, P(-1.960 ≤ W ≤ 1.960 | µ = 52).
146
Para hallar esta probabilidad se debe conocer la distribución de W cuando µ = 52. De

⎛ ⎞
⎜µ−µ ⎟
manera general W ~ N ⎜ 0
, 1⎟ donde µ0 es la esperanza bajo H0 y µ la verdadera
⎜ σ2 ⎟
⎜ ⎟
⎝ n ⎠
esperanza de la distribución. Luego, utilizando la expresión anterior se tiene que
W ~ N (1,1) cuando µ = 52. En consecuencia β, la probabilidad de Error de Tipo II,
que corresponde a la probabilidad de la región de aceptación bajo la hipótesis
alternativa, está dada en este caso por:
β = P (-1.960 ≤ W ≤ 1.960 | µ = 52) = P ((-1.960 - 1) / 1 ≤ Z ≤ (1.960 - 1) / 1))
donde Z ~ N (0,1)
Por lo tanto, si la hipótesis nula no es verdadera y µ = 52, entonces β = 0.83. Si se

toman sucesivas muestra de tamaño 25 de una población con µ = 52 (en lugar de 50) y
σ =10, la regla de decisión que se ha usado con α = 0.05 conducirá a aceptar
incorrectamente la hipótesis nula 83 de cada 100 veces; esto se ilustra en la Figura 6.4.
Para la prueba de hipótesis acerca de la esperanza de una distribución normal y para
un nivel de significación α dado, β se calcula según las siguientes expresiones:
⎛ ⎞
⎜ µ − µ 0 ⎟⎟
β = P ⎜ Z ≤ Z1−α − si la prueba es unilateral derecha y
⎜ σ 2 ⎟
⎜ ⎟
⎝ n ⎠
⎛ ⎞
⎜ µ − µ 0 ⎟⎟
⎜
β = P Z ≥ Zα − si la prueba es unilateral izquierda.
⎜ σ2 ⎟
⎜ ⎟
⎝ n ⎠
Si la prueba es bilateral entonces:
147
⎛ ⎞
⎜ µ − µ0 µ − µ 0 ⎟⎟
⎜
β = P Zα /2 − ≤ Z ≤ Z 1−α / 2 − donde Z ~ N (0,1)
⎜ σ2 σ2 ⎟
⎜ ⎟
⎝ n n ⎠
1 −α
α/2 α/2
−∞ o ∞ T(.)
Zona Rechazo 1 Zona Rechazo 2
Zona Aceptación Ho
Punto Crítico 1 Punto Crítico 2
−∞ µ−µ 0 ∞ T(.)
σ2 /n
Figura 6.4: Áreas asociadas a los errores
Por lo general el investigador no determina la probabilidad de cometer el error de tipo

II, aunque el ejemplo anterior debe advertir sobre la importancia de tenerla en cuenta.
Usualmente se prueba H0 fijando solamente α pero, como se verá más adelante, el
manejo del tamaño muestral o el número de repeticiones de un experimento, es el
elemento a modificar para controlar β. La importancia relativa de los errores depende
de los costos inherentes a cada tipo de error y estos costos deberían servir como pautas
para fijar las probabilidades de cometerlos.
Las posibles decisiones y sus errores, concernientes a la prueba de hipótesis, se
resumen en la siguiente tabla:
148
Tabla 6.1: Probabilidades asociadas a las distintas decisiones en la prueba de

hipótesis.
Decisión Error Probabilidad

Si H0 Cierta y:
Se rechaza H0 Tipo I α
No se rechaza H0 Nulo 1-α
Si H0 Falsa y:
Se rechaza H0 Nulo 1-β
No se rechaza H0 Tipo II β
Efectos de las variaciones de la región de rechazo sobre β

La afirmación que β aumenta según disminuye α es verdadera para “n” fijo. El
investigador que hace el experimento quizás desee variar el nivel de significación de
la prueba para obtener la correspondiente variación en β. Un valor chico de α es
deseable, pero tomarlo demasiado pequeño puede hacer β tan grande que se tenga muy
poca chance de reconocer si la hipótesis nula es falsa.
Efecto de las variaciones del tamaño de la muestra sobre β

Manteniendo constante el nivel de significación, la región de aceptación es más
pequeña para tamaños de muestras mayores con la consiguiente disminución de β. En
la Tabla 6.2 se dan los valores de β para la alternativa µ = 52, con hipótesis nula µ=50,
mostrando numéricamente el efecto de cambiar α y n sobre la probabilidad del Error
de Tipo II.
149
Tabla 6.2: Valores de β para n y α dados.
n α = 0.05 α = 0.01
1 0.945 0.988
3 0.936 0.985
5 0.927 0.980
10 0.903 0.973
25 0.830 0.942
50 0.707 0.877
100 0.484 0.717
400 0.021 0.077
1000 0.00001 0.0001
Potencia de una prueba de hipótesis
Definición 6.5: Potencia de una prueba

Se define como potencia a la probabilidad de rechazar la Hipótesis Nula cuando ésta es
falsa. La potencia se denota como π.
Esta probabilidad representa la chance de concluir que H0 es falsa cuando

efectivamente lo es. La potencia se calcula como π = 1 - β, donde β es la probabilidad
de cometer el Error de Tipo II. Cuanto mayor es la potencia mejor es la prueba. La
potencia es función de varios factores: a) el nivel de significación elegido, b) la
varianza de la variable aleatoria y c) el tamaño de la muestra. Cuando el nivel de
significación se ha fijado y la varianza de la variable aleatoria es conocida (o se ha
estimado) es posible controlar la potencia de la prueba manejando el tamaño muestral
(o, en el caso de los diseños experimentales, manejando el número de repeticiones).
Curva de potencia
Hasta aquí se ha considerado solo la alternativa µ = 52. Otras alternativas tendrán
diferentes valores de β. Suponga de nuevo que se está contrastando la hipótesis µ = 50
vs. µ ≠ 50 con σ = 10 y α = 0.05, con una muestra de tamaño 25. Ahora, si µ bajo la
hipótesis alternativa es 53, se obtiene β = 0.674.
150
El valor de β es más pequeño cuando las observaciones proceden de una población

con µ = 53 que cuando proceden de una población con µ = 52. Para cualquier n y α
fijos, se puede calcular β para una serie de valores de µ y graficar la llamada curva de
potencia donde la potencia se define, como ya se indicara, π = 1- β.
La Figura 6.5 ilustra la función potencia π(µ) para una prueba bilateral.
π
1
α
µo µ
Figura 6.5: Curva de la función de potencia para una prueba bilateral.
Relación entre estimación por intervalo de confianza y

prueba de hipótesis
En este capítulo y el anterior se han presentado dos procedimientos importantes en el
marco de Inferencia Estadística: la Estimación por Intervalos de Confianza y la
Prueba de Hipótesis.
Los Intervalos de Confianza se plantearon para estimar parámetros, mientras que las
Pruebas de Hipótesis para tomar decisiones en relación a los valores postulados para
ellos.
En muchos casos los Intervalos de Confianza y las Pruebas de Hipótesis se pueden
utilizar alternativamente. Por ejemplo, en el caso de que se desee determinar si el
rendimiento de una nueva variedad de soja es de 20 qq/ha, se plantean las siguientes
hipótesis:
H0: µ = 20 H1: µ ≠ 20
Realizando la prueba correspondiente, se llegará a no rechazar o a rechazar H0.
151
Este problema también se podría haber resuelto al obtener una estimación de µ por
Intervalo de Confianza. Si el valor hipotético de µ (20 qq/ha) hubiera quedado
comprendido dentro del intervalo no se habría rechazado la H0 y en caso contrario se
habría rechazado.
Finalmente, en el caso que se rechace H0, se puede aplicar la estimación por intervalo
para saber cúal es el valor del parámetro con una determinada confianza.
152
Ejercicios
Ejercicio 6.5
Se acepta que después de 3 años de almacenamiento el vigor de un arbusto forrajero
medido como peso seco alcanzado a los 20 días de la germinación es de 45 mg
promedio. Un nuevo método de almacenamiento se propone para aumentar el vigor.
Se evalúan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 años se las hace
germinar, obteniéndose los siguientes resultados de peso seco promedio a los 20 días:
49 43 56 57 59 65 52 51 50 55
60 65 53 57 67 56 53 37 45 42
a) Plantear las hipótesis nula y alternativa asociadas al problema.
b) Realizar una prueba de hipótesis con un nivel de significación α = 0.01.
c) De acuerdo a la conclusión que se obtuvo en el punto anterior, ¿se justifica
realizar un cálculo de potencia?; ¿por qué?
Ayuda: si tuviera que calcular la potencia con la que se realizó la prueba, acepte la
varianza muestral calculada como si se tratara de la varianza poblacional y tome a
la media muestral como estimador de la verdadera media poblacional.
Ejercicio 6.6
Un tipo de ratón de laboratorio muestra una ganancia media de peso de 65 gr. durante
los primeros tres meses de vida. Doce ratones fueron alimentados con una nueva dieta
desde su nacimiento hasta los primeros tres meses de vida, observándose las siguientes
ganancias de peso en gr.:
153
65 62 64 68 65 64 60 62 69 67 62 71
a) ¿Hay razón para creer que la dieta produce una variación significativa en la
cantidad de peso ganado? Trabajar con α = 0.05.
b) Calcular para la prueba planteada, las potencias para diferentes valores de µ1
variando en el intervalo [62 gr., 70 gr.] y dibujar la curva de potencia.
154

Cap6 Contraste Hipotesis

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap6 Contraste Hipotesis

Cargado por

Copyright:

Formatos disponibles

Di Rienzo., et al. 2005.

precipitaciones, se podría derivar su distribución y a partir de ella asignar una

involucran a más de un parámetro de la distribución de una o más variables aleatorias,

Procedimiento de la Prueba de Hipótesis

(o el muestreo) y de la naturaleza de la hipótesis estadística formulada. Si esto no se

Plantear las hipótesis nula y alternativa

Planificar el experimento o el esquema muestral

Selección de un estadístico para la prueba e identificación de su

Establecer el nivel de significación de la prueba

Definición 6.1: Nivel de significación

El nivel de significación representa la máxima probabilidad de equivocarse en el

Establecer los eventos que conducen al rechazo y no rechazo de la

Definición 6.2: Región o zona de rechazo

Definición 6.3: Región o zona de no rechazo

La zona de rechazo puede estar a la izquierda o a la derecha de la distribución del

Definición 6.4: Puntos críticos

Figura 6.1: Representación de la distribución del estadístico bajo H0 en una prueba

Figura 6.2: Representación de la distribución del estadístico bajo H0 en una prueba

Figura 6.3: Representación de la distribución del estadístico bajo H0 en una prueba

Realizar un ensayo o muestreo “ad Hoc”

Calcular el valor del estadístico y determinar si está dentro o fuera de la

Paso 1: Planteo de la hipótesis estadística

Paso 3: Elección de la función de la muestra W

Paso 4: Se fija el nivel de significación α, por ejemplo, en 0.05.

denota como T(n-1);0.95.

Paso 7: Se calcula W y se observa a cuál de los intervalos definidos en el Paso 5

Con la finalidad de dar una interpretación de α, considérese el siguiente ejemplo.

PC1 = Z(α/2) = -1.960 y PC2 = Z(1-α/2) =1.960

Así, la regla de decisión es: se rechaza µ = 50 si W es menor que -1.960 o si W es

Cálculo de la probabilidad de cometer Error de Tipo II (β)

Para hallar esta probabilidad se debe conocer la distribución de W cuando µ = 52. De

β = P (-1.960 ≤ W ≤ 1.960 | µ = 52) = P ((-1.960 - 1) / 1 ≤ Z ≤ (1.960 - 1) / 1))

Por lo tanto, si la hipótesis nula no es verdadera y µ = 52, entonces β = 0.83. Si se

Si la prueba es bilateral entonces:

Figura 6.4: Áreas asociadas a los errores

Por lo general el investigador no determina la probabilidad de cometer el error de tipo

Tabla 6.1: Probabilidades asociadas a las distintas decisiones en la prueba de

Decisión Error Probabilidad

Efectos de las variaciones de la región de rechazo sobre β

Efecto de las variaciones del tamaño de la muestra sobre β

Tabla 6.2: Valores de β para n y α dados.

Potencia de una prueba de hipótesis

Definición 6.5: Potencia de una prueba

Esta probabilidad representa la chance de concluir que H0 es falsa cuando

El valor de β es más pequeño cuando las observaciones proceden de una población

Relación entre estimación por intervalo de confianza y

También podría gustarte