Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONTRASTACIÓN DE HIPÓTESIS
Una hipótesis es una afirmación o teoría que intenta explicar comportamientos alrededor
de los cuales existen algunos factores desconocidos. En términos estadísticos, las hipótesis
de trabajo se plantean como dos opciones:
La hipótesis inicial o sub cero H 0 que se va a evaluar frente a
La hipótesis inicial, o sub cero, H 0 es la hipótesis de igualdad, pues afirma que las
2
Prueba de significancia de cola derecha
3
En las ciencias naturales, se estila que las pruebas de significancia sean de dos colas
básicamente porque permiten el establecimiento de un intervalo de confianza.
Siempre que se prueban hipótesis cabe la posibilidad de cometer uno de dos tipos de
errores. El primero es igual a la probabilidad de rechazar H 0 cuando en realidad es
correcta. Este error es igual al nivel de significancia con que se realiza la prueba, se
representa con la letra griega alfa ( ) y se denomina error de tipo I.
P(Rechazar H 0 H 0 correcta)
Por supuesto que la probabilidad de que H 0 sea aceptada cuando es verdadera debe ser
alta, y también debe ser alta la probabilidad de rechazarla cuando sea incorrecta. Por lo
tanto, para cualquier prueba de significación existen 4 alternativas de decisión:
SITUACIÓN REAL
H 0 es H 0 es
correcta Incorrecta
DECISIÓN
H 0 es rechazada Error de tipo I Decisión
correcta
4
Cuando se toma una decisión, esta puede ser correcta o incorrecta. En el evento de que
H 0 sea aceptada, existe la probabilidad de incurrir en un error de tipo II ( ); mientras
H1 .
2. Establecer el tamaño de muestra, n , adecuado para recoger la información y calcular
las estadísticas.
3. Identificar la distribución de muestreo que se utilizará para evaluar los hallazgos.
Generalmente cuando el tamaño de la muestra es mayor que 30 observaciones se
utiliza la distribución normal, y cuando n 30 se utiliza la distribución t de Student.
4. Definir un nivel de significancia conveniente.
5
5. Buscar en la tabla el o los valores críticos Z vc en términos de desviaciones estándar.
contrario Z p Z vc se rechaza H .
0
Por ejemplo: Expertos en genética animal sostienen que el peso al destete de cierta raza
de bovinos es 240 Kg. con desviación estándar de 24 Kg. Ante esta oferta, usted introduce
esta raza en su finca y, pasado un tiempo decide comprobar los resultados, para ello
seleccionan una muestra de 64 terneros recién destetados y obtienen un peso promedio
de 228 Kg. Se usa un nivel de significación de 0, 05 en ambas colas, determine si se
acepta o si se rechaza la hipótesis de que el peso promedio al destete es de 240 Kg.
1. Planteamiento de las hipótesis:
H 0 : μ = 240
H 0 : μ ≠ 240
6
Si se requiere una confianza de 1 95 % , deberá buscarse en valor de Z en la tabla
por exceso 2 y 2,5 % por defecto 2 ; áreas que, gráficamente, están localizadas en
Como usualmente las tablas están acumuladas en sentido “menos de”, para calcular el
7
Nivel de confianza 1 0,95
Ese valor normal estandarizado indica una probabilidad de 95 % de que los resultados de
la investigación sean los correctos.
6. El cálculo del error estándar es el siguiente:
24 24
x 3
n 64 8
Por lo tanto, se concluye que existe evidencia suficiente para rechazar la hipótesis
inicial: “el peso promedio al destete de esta raza de bovinos es de 240 Kg”; se ha
8
constatado que es más bajo, al distanciarse en 4 desviaciones estándar del promedio
ofrecido.
Esta prueba se hace con dos muestras tomadas de poblaciones diferentes de las que se
conocen su variabilidad poblacional.
Se deben seguir los siguientes pasos para realizar este tipo de contrastación:
1. Obtener los datos de las desviaciones estándar de ambas poblaciones 1 y 2 .
H1 .
6. Calcular el error estándar de ambas poblaciones así:
12 22
x2 x
1 2
n1 n2
12 22
x x
1 2
n1 n2
x1 x 2
Zp
x x
1 2
9
10. Otra forma de enunciar la regla de decisión es si el valor absoluto del estadístico de
prueba es menor que el valor crítico absoluto Z p Zvc , entonces se acepta H 0 , caso
contrario Z p Z vc se rechaza H .
0
Por ejemplo: Un industrial quiere realizar una prueba de significación al nivel del 5% para
constatar si existen diferencias significativas en el tiempo que se tardan dos tipos de
maquinaria en producir una determinada pieza. Para ello utilizó una muestra de 75 piezas
generadas por cada tipo de maquinaria, obteniendo los resultados siguientes:
ZONA Promedio Desviación Tamaño
En minutos estándar De muestra
1. 1 1,62 y 2 1,79 .
2. 0,05 .
3. n1 75 y n2 75 .
4. x1 3,31 y x2 2,27 .
5. H 0 : 1 2 ; H 1 : 1 2 .
12 22 1,622 1,792
6. x x = = 0,035 0,043 =0,279.
1 2
n1 n2 75 75
x1 x 2 3,31 2,27 1,04
7. Zp = 3,73 .
x x
1 2
0,279 0,279
8. Z vc 1,96 .
10
Se rechaza la hipótesis original H 0 : 1 2 .
10. Otra forma de enunciar la regla de decisión es si el valor absoluto del estadístico de
prueba es menor que el valor crítico absoluto Z p Zvc , entonces se acepta H 0 , caso
contrario Z p Z vc se rechaza H .
0
11
3. Se obtienen los promedios 1 y 2 y las desviaciones estándar de ambas poblaciones
1 y 2 .
4. Se plantea en términos estadísticos la hipótesis inicial H 0 : 1 2 y la hipótesis
alternativa H 1 : 1 2 .
5. Calcular la varianza ponderada de las poblaciones, si los tamaños de muestra son
iguales, se procederá así:
12 22
2
2
Si los tamaños de muestra son diferentes la varianza ponderada de la población se
calcula de la siguiente forma:
N1 1 12 N 2 1 22
2
N1 N 2 2
6. Establecer el error estándar de la diferencia poblacional x1 x2 , si las muestras son del
2 2
x x
1 2
N
Si los tamaños de muestra no son iguales se hará una ponderación:
2
x x
1 2
N1 N 2
x1 x 2
Zp
x x
1 2
12
10. Otra forma de enunciar la regla de decisión es si el valor absoluto del estadístico de
prueba es menor que el valor crítico absoluto Z p Zvc , entonces se acepta H 0 , caso
contrario Z p Z vc se rechaza H . 0
Por ejemplo: Un ingeniero forestal quiere medir la eficacia de la poda en ciertos árboles
maderables, para lo cual selecciona 60 especímenes que se someterán a un tratamiento de
poda y 60 que no se les aplicará poda alguna. Al cabo de un tiempo, mide el diámetro de
los troncos y obtiene un incremento promedio de 0,3079 cm. con desviación estándar de
0,019 para los árboles sometidos a tratamiento de poda; mientras que observa incrementos
promedio de 0,2984 con desviación estándar de 0,013 para los que no tuvieron poda. Para
un nivel de significancia de 5%, ¿Qué conclusiones obtiene?
1. 0,05 .
2. N 1 = N 2 = N = 60 > 30 se recomienda prueba Z.
3. 1 0,3079 y 2 0,2984 ; 12 0,019 2 y 22 0,013 2 .
4. H 0 : 1 2 y H 1 : 1 2 .
12 22 0,019 2 0,013 2
5. 2 0,01628 2 0,000265
2 2
2 2 2 0,016282
6. x x 0,00297
1 2
N 60
x1 x2 0,3079 0,2984
7. Zp 3,196
x x
1 2
0,00297
8. Z tab 1,96 .
9. El estadístico de prueba Z p está fuera del valor crítico tabular por lo que se rechaza
H0 .
10. 3,196 > 1,96 razón por la que se acepta la hipótesis alternativa que el tratamiento con
13
2.6. Contrastación de dos promedios muestrales con varianzas
poblacionales desconocidas y n<30 (Prueba t de Student).
14
s12 s 22
s2
2
Si los tamaños de muestra son diferentes la varianza pondera de la muestras se calcula
de la siguiente forma:
n1 1 s12 n2 1 s22
s
2
n1 n2 2
6. Establecer el error estándar de la diferencia muestral s x1 x2 , si las muestras son del
crítico t vc o fuera de él; si el estadístico de prueba t p está dentro de la zona de
10. Otra forma de enunciar la regla de decisión es si el valor absoluto del estadístico de
prueba es menor que el valor crítico absoluto t p < t vc , entonces se acepta H 0 , caso
Por ejemplo: Un productor pecuario ceba novillos bos Taurus y bos indicus, y tiene la
información siguiente sobre los precios obtenidos por kilo en pie:
15
Bos taurus Bos indicus
Tamaño de la muestra 12 12
Usando 0,05 , determine si los precios promedio son significativamente diferentes.
1. 0,05 .
2. Sea n1 =12 y n 2 =12, ambos menores que 30 observaciones.
3. Los precios promedio son x1 =2,100 y x 2 =1,885 y las desviaciones estándar s1 =300 y
s 2 =450.
4. H 0 : x1 x 2 y H 1 : x1 x 2 .
s12 s 22 300 2 450 2
5. s2 146250
2 2
2𝑠 2 2∙146250
6. 𝑠𝑥̄ 1−𝑥̄ 2 = √ =√ = 156,12
𝑛 12
8. 𝑡𝑣𝑐 = 2,074.
16
17
9. |1,38| < | 2,074|.
Que lleva a aceptar la H 0 : x1 x 2 , pues no se encontró evidencia significativa que los
precios promedio pagados por la carne de bos taurus y bos indicus sean estadísticamente
diferentes.
18
s12
F 2
s2
Considerando s12 como la mayor de las dos varianzas, de forma que F≥1.
5. Buscar el valor de F tabular según los grados de libertad del numerador y del
denominador, de acuerdo con el nivel de significancia requerido.
6. Si Fcalc ≤ Ftab se acepta la hipótesis de igualdad de varianzas; caso contrario, si Fcalc ≥
Ftab se rechaza la hipótesis H 0 y se acepta la hipótesis alternativa.
19
6. Puesto que Fcalc ≤ Ftab se acepta la hipótesis de igualdad de varianzas 1,56 ≤ 2,818.
20
Cuando se conoce la varianza poblacional y se puede calcular la varianza muestral, es
posible contrastar la existencia de diferencias significativas entre ellas, utilizando la
distribución chi-cuadrado ( ) a un nivel de significancia .
2
5. Calcular Calc
2
:
Calc
2
n 1s 2
2
6. Buscar en la tabla tabular
2
, el dato se encuentra en la intercepción del nivel de
significancia y los grados de libertad, como en el siguiente ejemplo de 0,05 y
n 1 19 .
21
7. Si tabular
2
> Calc
2
se acepta la hipótesis de igualdad H 0 ; caso contrario se rechaza H 0
y se acepta la hipótesis de diferencia H 1 .
Ejemplo:
A un ganadero se le ha explicado de la varianza máxima en la producción diaria de leche
de vaca es 4. Pone en evaluación un lote de 20 animales y obtiene una varianza muestral
de 4,12. Determine a un nivel de significancia del 5% si estas vacas deben tenerse en
producción o ser llevadas al matadero.
5. Calc
2
n 1s 2
19 4,12 78 ,28
19 ,57
2
4 4
6. tabular
2
30,14
7. tabular
2
> Calc
2
; 30,14 > 19,57, por lo que se acepta la hipótesis de igualdad de varianzas
H0 .
El lote de vacas puede seguir produciendo.
diferencia significativa. Consiste en un alejamiento del dato muestral con respecto del parámetro
de tal forma que se asume que la probabilidad de que ocurra por azar es muy baja.
22
error de tipo II ( ). Es igual a la probabilidad de aceptar H 0 cuando en realidad es incorrecta.
estadístico de prueba Z . Dato que indica cuánto difiere una estadística respecto de su
p
estimación. Proceso que busca calcular los parámetros a partir del análisis que se hace de una
muestra. La estimación consiste en basarse en las estadísticas empíricas para inferir los
valores poblacionales, llamados también parámetros.
hipótesis. Es una afirmación o teoría que intenta explicar comportamientos alrededor de los
cuales existen algunos factores desconocidos.
hipótesis inicial H 0 . Es la hipótesis de igualdad del parámetro con los datos muestrales. La
hipótesis inicial sostiene que las diferencias observadas son aleatorias, es decir, que se deben
al azar en razón del error de muestreo. Su planteamiento sugiere que no hay evidencia
significativa entre lo observado y lo supuesto como valor poblacional.
nivel de confianza. Evaluación probabilística del intervalo en que pueda estar el verdadero valor
poblacional. Se designa como 1 .
23
pruebas de dos colas. Son pruebas bilaterales en los cuales la probabilidad de rechazar una
hipótesis puede ser por exceso o por defecto; esto es por sobrepasar algún límite o por no
llegar a un mínimo requerido.
pruebas de una cola. Son pruebas unilaterales en donde el rechazo se hace o bien por exceso o
bien por defecto.
valor crítico ( Z vc ). Es un valor teórico derivado de una distribución de probabilidades tipo, sea
normal estándar, t de Student, chi cuadrado o binomial. Marca el límite entre la zona de
aceptación y la zona de rechazo para la prueba de hipótesis.
zona de aceptación. Intervalo que indica la variabilidad aceptada para los valores muestrales. La
zona de aceptación tiene una probabilidad conocida y definida por el nivel de confianza que
merece el estadístico de prueba.
24