Está en la página 1de 34

Prueba de Hiptesis

Afirmacin de lo que creemos sobre una poblacin. Por lo


general se refiere a los parmetros de la poblacin acerca
de la cual se quiere hacer la afirmacin.
Prueba, test o contraste de hiptesis es una tcnica
estadstica que se sigue para decidir si rechazamos o no
una hiptesis estadstica en base a la informacin de una
muestra.
Es la afirmacin de que la diferencia entre dos medias muestrales es debida
al azar, a la suerte, al error de muestreoindica que no hay un diferencia
significativa entre los parmetros de las poblaciones
Es generalmente lo contrario de la hiptesis nula que dice que un
mtodo (medicamento, tratamiento,etc.) se espera que sea ms efectivo
que otro
El propsito del experimento
es decidir si la prueba tiende a
apoyar o a refutar la Hiptesis
Nula.
Hiptesis cientfica: Escuchar la msica de Mozart tiene un efecto
sobre el Coeficiente Intelectual diferente al Reggaeton.
Experimento: De la poblacin peruana seleccionamos 20 nios al azar
en dos grupos de 10. Un grupo escuchar Mozart antes de hacer el
test de CIntelectual. El otro escuchar Reggaeton. Despus de realizar
el test, se calculan las medias en cada uno de los dos grupos.
El efecto "Mozart vs. Reggaeton :
Se sospecha que los individuos
rinden ms en un test de
inteligencia tras escuchar msica
de Mozart que cuando han
escuchado Reggaeton
Veamos un ejemplo:
Supongamos que la media del CI del grupo de Mozart fue 110, mientras
que la media del grupo de Reggaeton fue de 102 . Entonces: Podemos
decir que hay diferencias a nivel poblacional entre ambos grupos?. Para
tomar tal decisin necesitaremos plantear DOS hiptesis estadsticas:

Hiptesis estadsticas:
Hiptesis nula. Es la que proporciona la solucin "ms sencilla". En nuestro
ejemplo sera que la media poblacional de ambos grupos es la misma.
(Es decir, que no hay un efecto de la msica sobre el CI.)
H
0
:
1
=
2
Hiptesis alternativa. Es la hiptesis complementaria (y "ms compleja"). En
nuestro caso sera que la media poblacional de ambos grupos es
diferente. (Es decir, que hay un efecto de la msica sobre el CI.)
H
1
:
1

2
TIPOS DE ERROR
Obviamente interesa
minimizar ambos
errores, aunque en
Estadstica se da
prioridad al error de
tipo I (es mejor dejar
libre a un culpable que
condenar a un
inocente).
Reducir ambos errores
a cero es imposible y,
adems, al disminuir
uno se aumenta el otro,
por lo que hay que
elegir bien el test
empleado para llegar al
mejor balance posible
entre el error de tipo I y
el error de tipo II.
La nica manera de
disminuir ambos es
aumentar el tamao de
muestra.
Formaliza las hiptesis:
Hiptesis nula Vs. Hiptesis alternativa
Qu tipo de variables tienes?
Cuntas muestras tienes que comparar?
Se cumplen los supuestos necesarios?
Elige el test adecuado:
Paramtrico Vs. No paramtrico

Determinar si la prueba de significancia tendr
dos direcciones o una sola
Especifica el nivel de significacin
Calcula el valor del test
La probabilidad terica de obtener
las diferencias observadas es menor
o igual que el nivel de significacin?
Aceptar la hiptesis nula: las
diferencias observadas se deben
simplemente a errores de muestreo
Rechaza la hiptesis nula: las
diferencias entre los grupos son
significativas
SI
NO
1. Supuesto de Normalidad: asume que las muestras con las que se trabaja han sido
extradas de una poblacin que sigue una distribucin normal.

2. Homogeneidad de la Varianza: supone que las varianzas dentro de los grupos, son
estadsticamente iguales, es decir, son homogneas.

3. La variable dependiente es medida al menos en una escala de intervalo.

4. Independencia de las observaciones a excepcin de datos pareados. se habla de
muestras apareadas cuando los sujetos de las muestras han sido elegidos de forma
que se parecen bastantes de sus caractersticas (el prototipo seran los gemelos,
pero tambin pueden ser compaeros de un colegio, etc) o se trata de los mismos
individuos evaluados en dos momentos diferentes del tiempo,

5. Se recomienda un tamao de muestra mnimo de 30 sujetos por grupo.
Caractersticas Principales de
las pruebas paramtricas.
Si la hiptesis alternativa se formula simplemente como
la hiptesis nula no es cierta, el contraste es bilateral
o de dos colas.

Por el contrario cuando se indica el sentido de la
diferencia, el contraste es unilateral o de una sola
cola
Determinar si la prueba de significancia
tendr dos direcciones o una sola
Una prueba es de una cola cuando la hiptesis alterna, H1, establece una direccin,
como:

H0 : el ingreso medio de las mujeres es menor al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Distribucin de
muestreo para el valor
estadstico z, prueba
de una cola, nivel de
significancia de .05
= 0.05
rea de rechazo de Ho
Z
t
F
x
2

Significacin
Estadsticos
de prueba
Contraste de una cola
Area de no
rechazo o
aceptacion de
Ho
1-= 0.95



Una prueba es de dos colas cuando no se establece una direccin especfica de la
hiptesis alterna H1, como:

H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Distribucin de muestreo
para el valor estadstico z,
prueba de dos colas, nivel
de significancia de 0.05
/2= 0.025
rea de rechazo de Ho
- /2= 0.025
rea de rechazo de Ho
Area de no
rechazo de Ho
Z
t

Significacin
Estadsticos
de prueba
Contraste de dos colas
1-= 0.95

- Z
- t
Especificar el nivel de
significacin (alpha)
Nivel de significacin de una
prueba: Se llama as a la
probabilidad mxima de
cometer un error de tipo I. A
dicha probabilidad se la suele
denotar con la letra griega .
Normalmente se fija = 0.05, pero a
veces conviene tomar un valor
mayor (0,1) o menor (0,01).

Esto simplemente significa que si la
diferencia observada entre muestras
tiene una probabilidad de ocurrir del
5% (o el 10% o el 1%) o menos no
puede deberse a meros errores de
muestreo sino que indica diferencias
reales entre muestras.
Esta probabilidad (denotada
como ) se suele especificar
antes de tomar la muestra,
de manera que los
resultados obtenidos no
influyan en la decisin
Al realizar un test estadstico lo que
haces es comparar la diferencia que
has obtenido entre muestras con la
distribucin de muestreo terica
generada por el test, utilizando las
tablas disponibles.

Si tu diferencia cae dentro de la regin
de rechazo, concluyes que la hiptesis
nula debe ser rechazada, la hiptesis
alternativa aceptada y las diferencias
son significativas.
La regin de rechazo
Esto es un parntesis, para incrementar tu cultura
general y para que no te mueras sin saberlo.
Inicio del parntesis
La distribucin t de de student fue descubierta por william Gosset en 1908. Gosset era un
estadstico empleado por la compaa de cerveza Guinness con quien tena un contrato
que estipulaba que no poda usar su nombre en sus publicaciones. l recurri al
sobrenombre Student que es como ahora conocemos el tipo de estadstica que desarroll
Lo interesante del caso es que su trabajo estaba enfocado al control de calidad de la
cerveza. En el pasado otros investigadores de la compaa Guinness haban publicado
artculos en los que se divulgaban secretos o informacin confidencial sobre el proceso de
la cerveza y por eso se obligo a Gosser a aceptar la clusula
Tabla de la distribucin t
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

Tabla de la distribucin normal
Como puede verse, la distribucin t, depende de un parmetro llamado grados
de libertad que est en funcin del tamao de la muestra. Porque Gl = n-1
A continuacin veremos 4 ejercicios de prueba de
hiptesis, que clasificaremos de la siguiente manera
Prueba de hiptesis
Para una muestra
cuando se conoce la
desviacin estndar
De una cola
De dos colas
Para dos muestras
Muestras grandes
Muestras pequeas
Para una muestra
cuando no se conoce
la desviacin
estandar
Prueba de hiptesis para una muestra cuando se conoce
la desviacin estndar. Prueba de una cola
Un hospital usa grandes cantidades de dosis envasadas de un medicamento
particular. La dosis individual de esta medicina tiene 100 c.c. La accin de un
medicamento es tal que el cuerpo tolera dosis excesivas sin sufrir dao. Por otra
parte, las dosis insuficientes no producen el efecto mdico deseado e interfieren
con el tratamiento del paciente. El hospital ha adquirido la cantidad de
medicamento que necesita al mismo fabricante durante varios aos y sabe que
la desviacin estndar de la poblacin es 2c.c. el hospital inspecciona
aleatoriamente, 50 dosis, tomadas de un envo muy grande y encuentra que la
media de estas dosis es 99.75 c.c
Datos
H
0 :
=100 valor hipottico de la media de la poblacin
n=50 tamao de la muestra
X= 99.75 media de la muestra
=2 desviacin estndar de la poblacin
Si el hospital establece un nivel de significacin de 0.10 y nos pregunta si la dosis
de entrega son demasiado pequeas, cmo podemos hallar la respuesta?
H
0
: =100 hiptesis nula: la media de la dosis de la remesa es 100 c.c
H
1
: 100 hiptesis alternativa: la media es menor que 100 c.c
= 0.10
88 . 0
2829 . 0
100 75 . 99

x
Ho x
Z

-1.28
Observamos que el valor
calculado para Z cae en la
regin de aceptacin de la
hiptesis nula. Por lo tanto,
el hospital debe aceptar la
hiptesis nula: la media de
la dosis de la remesa es
100 c.c
Este es el z terico
Ahora vamos a calcular el
z para nuestra muestra
Prueba de hiptesis para una muestra cuando se conoce
la desviacin estndar. Prueba de dos colas
Un fabricante surte los ejes traseros para los camiones de una empresa de refrescos. Estos
ejes deben soportar 80.000 libras por pulgada cuadrada en pruebas de carga, pero un eje
excesivamente fuerte eleva los costos de produccin de manera significativa. La larga
experiencia con este fabricante indica que la desviacin estndar de la resistencia de sus
ejes es de 4.000 libras por pulgada cuadrada. El fabricante selecciona una muestra de 100
ejes de la produccin y los prueba y encuentra que la capacidad de carga media de la
muestra es de 79.600 libras por pulgada cuadrada
Datos
H
0
:=80.000 valor hipottico de la media de la poblacin
n=100 tamao de la muestra
X= 79.600 media de la muestra
=4.000 desviacin estndar de la poblacin
Si el fabricante de ejes utiliza un nivel de significacin de 0.05 en la prueba, se cumplirn
los requerimientos de carga para los ejes?
H
0
: =80.000 hiptesis nula: la media real de la poblacin es 80.000 libras por
pulgada cuadrada
H
1
: 80.000 hiptesis alternativa: la media no es 80.000 libras por pulgada cuadrada
= 0.05
Este es el Z terico
-1.96 1.96
Ahora vamos a calcular el Z para
nuestra muestra
1
400
000 . 80 600 . 79

x
o x
Z


Z calculado: -1

-1.96
1.96
El valor calculado cae dentro de la
zona de aceptacin de la hiptesis
nula . El fabricante debe aceptar la
hiptesis nula porque no hay
diferencias significativas entre la
media hipottica de 80.000 y la
media observada de los ejes de la
muestra
Una especialista en recursos humanos de una importante corporacin est
reclutando un gran nmero de empleados para un proyecto en el extranjero.
Durante el proceso de seleccin, la administracin le pregunta cmo van las
cosas, y ella responde: Bien, creo que la puntuacin promedio en la prueba de
aptitudes ser aproximadamente 90. Cuando la administracin revisa 20 de los
resultados de la prueba encuentra que la puntuacin media es 84, y la
desviacin estndar de esta puntuacin es 11.
Prueba de hiptesis con 1 muestra cuando no se
conoce la desviacin estndar de la poblacin
Datos
H
0 :
=90 valor hipottico de la media de la poblacin
n=20 tamao de la muestra
X= 84 media de la muestra
S=11 desviacin estndar de la muestra
Si la administracin desea probar su hiptesis a un nivel de significacin de
0.10, cul es el procedimiento a seguir?
H
0
: =90 hiptesis nula: la media real de la poblacin es 90
H
1
: 90 hiptesis alternativa: la media no es 90
= 0.10
Si el tamao de la muestra n es
30 o menos y de la poblacin
se desconoce. Debemos utilizar
la distribucin t
IMPORTANTE
Recuerda
Puesto que la administracin est interesada en saber s la media verdadera
es mayor o menor que la puntuacin hipottica (no se indica direccin), es
apropiado usar una prueba de dos colas. Como el valor de significacin es
0.10, cada una de las dos reas sombreadas contiene 0.05 del rea bajo la
distribucin t
Como el tamao de la muestra es 20, el nmero apropiado de grados de
libertad es 19 (es decir 20-1). Entonces buscamos en la tabla de distribucin t,
en la columna de 0.10 y el rengln correspondiente a 19 grados de libertad.
Encontramos que el valor crtico de la t es 1.729
Tabla de la distribucin t
Ya tenemos el valor esperado para t. Ahora debemos calcular cul es el
valor de la t de nuestra muestra
x
o x
t

Como no se conoce la desviacin estndar de la poblacin, debemos


estimarla a travs de la siguiente frmula
X

46 . 2
47 . 4
11
20
11

n
x

Sustituyendo los valores, tenemos


44 . 2
46 . 2
90 84

x
o x
t

Al sealar este resultado en una grafica de la distribucin muestral, nos


damos cuenta de que la media de la muestra cae fuera de la regin de
aceptacin. Por lo tanto, la administracin debe rechazar la hiptesis nula
(la aseveracin de la directora del departamento de personal acerca de
que la puntuacin real de los empleados examinados es 90)
Prueba de hiptesis para dos muestras.
Muestras grandes (mayores de 30)
A un especialista en recursos humanos se le pide determinar si los salarios por hora
de los obreros no calificados son los mismos en dos ciudades distintas. A
continuacin se presentan los datos de una encuesta en la que se presentan los
muestreos de salarios por hora
Ciudad Salarios promedio por
hora de la muestra
Desviacin estndar
de la muestra
Tamao de la
muestra
Apex 8.95 0.40 200
Eden 9.10 0.60 175
Como la compaa slo est interesada en saber si las medias son o no iguales,
sta es una prueba de dos colas. El nivel de significacin es de 0.05. entonces

H
o:

1
=
2
Hiptesis nula. No hay diferencia entre las medias
H
1:

2
Hiptesis alternativa: existe diferencia entre las medias

= 0.05
Este es el z terico
-1.96 1.96
Ahora vamos a calcular el z de nuestras muestras
2 1
) ( ) ( 2 1 2 1
x x
X X
Z


2
2
2
1
2
1
2 1
n n
x x


Primero dos aclaratorias
Tamao de la muestra
de la poblacin 1
Tamao de la muestra
de la poblacin 2
Varianza de la
poblacin 1
Varianza de la
poblacin 2
Error estndar de la diferencia entre dos
medias
En este ejemplo, y en la mayora de los que
veremos. Se intentar probar si dos poblaciones
tienen la misma media. Si esto ocurre
0 ) ( 2 1
Si en el ejemplo, quisiramos probar que la
diferencia entre las dos medias es alrededor de
10 centavos. Por ejemplo que en Apex son 10
centavos ms bajos que en Eden. entonces
10 . 0 ) ( 2 1
volvamos a nuestro procedimiento, decamos que:
Ahora vamos a calcular el z de nuestras
muestras
2 1
) ( ) ( 2 1 2 1
x x
X X
Z


503 . 0
175
) 60 . 0 (
200
) 40 . 0 (
2 2
2
2
2
1
2
1
2 1
n n
x x

83 . 2
053 . 0
0 ) 10 . 9 95 . 8 ) ( ) (
2 1
2 1 2 1

x x
X X
Z


Rechazamos la hiptesis nula de
que no hay diferencia y llegamos a
la conclusin de que las medias
de las poblaciones (los salarios de
obreros) son diferentes
Prueba de hiptesis para dos muestras.
pequeas (menores de 30)
Una compaa est investigando dos programas educativos tendientes a aumentar la
sensibilizacin de los administradores con respecto a las necesidades de sus
trabajadores de habla hispana. El programa original consista en varias sesiones
informales y respuestas con los lderes de la comunidad hispana. En aos recientes
se ha desarrollado un programa que implica clases formales con psiclogos y
socilogos profesionales. El nuevo programa es considerablemente ms caro, y el
presidente de la compaa desea saber, a un nivel de significacin del 0.05, si este
gasto ha aumentado la sensibilidad de sus administradores
Programa
muestreado
Sensibilidad despus
del programa
Nmero de
administradores
observados
Desviacin estndar de
la sensibilidad despus
del programa
Formal 92% 12 15%
Informal 84% 15 19%
H
o:

1
=
2
Hiptesis nula. No hay diferencia en los niveles de sensibilidad logrados
H
1:

1
>
2
Hiptesis alternativa: el nuevo programa da resultados de sensibilidad ms altos

= 0.05
Calculamos t para nuestra muestra,
a travs de la ecuacin
2 1
) ( ) ( 2 1 2 1
x x
X X
t


2 1
1 1
2 1
n n
sp x x
Sp = es la estimacin conjunta de
2,
que se obtiene al calcular el
promedio ponderado de s
1
2
y s
2
2
. A travs de la siguiente ecuacin

2
) 1 ( ) 1 (
2 1
2 2 1 1
2
2 2

n n
s n s n
sp 160 . 301
2 15 12
) 19 )( 1 15 ( ) 15 )( 1 12 (
2 2
2



p s
Sacando la raz cuadrada, tenemos 34 . 17 160 . 301 p s
2 1
1 1
2 1
n n
sp x x
721 . 6
15
1
12
1
34 . 17 2 1 x x
19 . 1
721 . 6
0 ) 84 92 ( ) ( ) (
2 1
2 1 2 1

x x
X X
t


Sustituyendo en nuestra ecuacin de t
Aqu podemos apreciar que la diferencia estandarizada entre las dos medias se
encuentra dentro de la regin de aceptacin. As, aceptamos la hiptesis nula de que
no existe una diferencia significativa entre los niveles de sensibilidad logrados por los
dos programas. Los gastos de la empresa en el programa formal no han producido un
incremento significativo en el nivel de sensibilidad de sus administradores

También podría gustarte