Está en la página 1de 50

CLASE0 10: PRUEBA DE HIPOTESIS

Germán Elías Pomachagua Pérez


gpomachagua@hotmail.com
MATERIAL DE CLASES © G.P.P.16-feb-12
OBJETIVOS

Al finalizar el Tema, el participante será capaz de:


1. Utilizar datos provenientes de una muestra aleatoria para
conocer el parámetro poblacional.
2. Comprender los dos tipos de errores posibles que se
producen al probar una hipótesis.
3. Plantear pruebas de una cola y pruebas de dos colas.
4. Realizar el procedimiento para probar hipótesis.
5. Usar con propiedad las distribuciones t ,Z y 2 para probar
hipótesis sobre medias, proporciones y varianzas de
población.

MATERIAL DE CLASES © G.P.P.16-feb-12


CONTENIDO

1. Conceptos básicos
2. Prueba de hipótesis acerca de la media poblacional
3. Prueba de hipótesis acerca de la proporción poblacional
4. Prueba de hipótesis acerca de la varianza poblacional

MATERIAL DE CLASES © G.P.P.16-feb-12


INTRODUCCION
• Muchos problemas de ingeniería, ciencias de
la salud, administración, etc. requieren que se
tome una decisión entre aceptar o rechazar
una proposición sobre algún parámetro.
• Esta proposición recibe el nombre de
hipótesis. Este es uno de los aspectos más
útiles de la inferencia estadística, puesto que
muchos tipos de problemas de toma de
decisiones, pueden formularse como
problemas de prueba de hipótesis.

MATERIAL DE CLASES © G.P.P.16-feb-12


¿Que es una Hipótesis?
Creo que el porcentaje
de enfermos será el 5%
• Es una suposición sobre la
población, principalmente sus
parámetros:
Media
Varianza
Proporción
• Son suposiciones que relacionan
una variable con otra y que serán
probadas a través de la
investigación, con el fin de ser
aceptadas o rechazadas por medio
de los resultados obtenidos.
MATERIAL DE CLASES © G.P.P.16-feb-12
Las siguientes afirmaciones son hipótesis estadísticas

 El porcentaje de niños asmáticos en Lima es del 30%


 El índice de cáncer pulmonar es mayor entre los
fumadores que entre los no fumadores
 Los accidentes de tránsito son más frecuentes en varones
que en mujeres
 La media de vida de los peruanos es de 72 años.
 La eficacia de dos medicamentos para curar el asma es
similar.
Una prueba de hipótesis permite aceptar o rechazar si
determinadas afirmaciones son ciertas o falsas en función
de los datos observados en una muestra
MATERIAL DE CLASES © G.P.P.16-feb-12
¿Qué es una prueba de hipótesis?
• Prueba de hipótesis: Es un procedimiento basado en la
evidencia de la Muestra y en la teoría de probabilidad
para determinar si la hipótesis es un enunciado
razonable ó por el contrario debe ser rechazado
• En toda decisión se plantean dos hipótesis:
Ho: Hipótesis nula (acerca de uno o más parámetros de
la población)
H1: Hipótesis alternativa (contraria a la hipótesis nula,
se dice que es la hipótesis de trabajo)
p  50% , , 
H 0 :
 p  50% , , 
 H1 :
MATERIAL DE CLASES © G.P.P.16-feb-12
¿CÓMO FORMULAR UNA HIPOTESIS?

• Si un investigador esta interesado en apoyar


con fuerza una opinión, debe llegar a la
opinión en forma de rechazo de una hipótesis.
• Por ejemplo si un médico desea mostrar que
hay una fuerte evidencia a favor de la opinión
de que "Existe relación entre fumar y contraer
cáncer al pulmón".
• La hipótesis a probar debe ser " No existe
relación entre fumar y contraer cáncer al
pulmón”

MATERIAL DE CLASES © G.P.P.16-feb-12


PLANTEAMIENTO DE LAS HIPOTESIS

• Ho:“No existe relación entre fumar y contraer


cáncer al pulmón”
(Lo que se busca rechazar)

• H1: " Existe relación entre fumar y contraer


cáncer al pulmón”
(Hipótesis de investigador )

MATERIAL DE CLASES © G.P.P.16-feb-12


MATERIAL DE CLASES © G.P.P.16-feb-12
TIPOS DE HIPÓTESIS
Hay 3 formas en que se puede establecer H0 y H1:

H 0 :   0 H 0 :   0 H 0 :   0
H1 :    0 H1 :    0 H1 :    0

HR1e g:l a em p >


ír i c a0
H1 :   0
R e g l a e m p ír i c a H1 :  < 0
Regla empírica
f(z)

f( z )
f( z )

-4 -3 -2 -1 0 1 2 3 4
-4 -3 -2 -1 0 1 2 3 4 -4 -3 -2 -1 0 1 2 3 4

z
z z

MATERIAL DE CLASES © G.P.P.16-feb-12


(C) Nivel de significación ()

Se rechaza Se rechaza
H0 H0

No se
rechaza H0

Nivel de Significación: Probabilidad de rechazar la hipótesis


nula cuando es verdadera
Error de tipo I: Rechazar la hipótesis nula cuando es verdadera

MATERIAL DE CLASES © G.P.P.16-feb-12


(D) Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de
hipótesis, ya sea de aceptación de la hipótesis planteada o de
la hipótesis alternante, puede incurrirse en error, como
puede verse en el siguiente cuadro:

EN LA La muestra seleccionada conduce a


POBLACION NO RECHAZAR H0 RECHAZAR H0
H0 es verdadera Decisión correcta Error tipo I ó 

H0 es falsa Error tipo II ó  Decisión correcta

MATERIAL DE CLASES © G.P.P.16-feb-12


MATERIAL DE CLASES © G.P.P.16-feb-12
Error tipo I ó 

Error tipo II ó 

MATERIAL DE CLASES © G.P.P.16-feb-12


TIPOS DE ERROR
Error I (Alfa) Rechazar una hipótesis que es verdadera .

Error II: (Beta): No rechazar una hipótesis que es falsa .

Rechazar una hipótesis no significa que ésta sea falsa,


como tampoco el no rechazarla significa que sea
verdadera. La decisión tomada no esta libre de error.

Nunca se sabe con absoluta certeza la verdad o


falsedad de una hipótesis, a no ser que se examine
la población entera.

MATERIAL DE CLASES © G.P.P.16-feb-12


PASOS DE LA PRUEBA DE HIPÓTESIS

1. Plantear las de hipótesis nula y alternativa.


2. Selección de un nivel de significación.
3. Identificación de la Estadística de prueba.
4. Determinar los valores críticos
5. Decisión: Rechazar o no rechazar
6. Interpretar

MATERIAL DE CLASES © G.P.P.16-feb-12


MATERIAL DE CLASES © G.P.P.16-feb-12
MATERIAL DE CLASES © G.P.P.16-feb-12
Prueba de hipótesis acerca de la media poblacional

(A) Con varianzas conocidas (muestras grandes)

Ejemplo1: Se afirma que el salario diario medio de los


técnicos en salud de una cierta zona minera es de S/.65.42,
con una desviación estándar S/. 2.32. Una muestra de 144
técnicos en salud que laboran en esa zona reciben un salario
diario medio de 64.82 soles. ¿Puede considerarse este
resultado como sustento para afirmar que técnicos en salud
de esa zona tienen un salario diario diferente de S/. 65.42 a
un nivel de significación  = 0.05 ?.

MATERIAL DE CLASES © G.P.P.16-feb-12


Procedimiento
H 0 :   65.42
1) Plantear las hipótesis:
H1 :   65.42
2) Seleccionar el nivel de significación:  = 0.05
3) Como se conoce la desviación estándar. Usar Z:
X  64.82  65.42
Z   3.10
/ n 2.32 / 144
4) Determinar los puntos críticos Z / 2  Z 0.025  1.96

-1.96 1.96
MATERIAL DE CLASES © G.P.P.16-feb-12
5) Decisión : Como -3.10<-1.96 entonces se rechaza H0

6) Interpretación:
 Se rechaza la hipótesis planteada y se acepta la
hipótesis alternante a un nivel de significación de 0,05.
La prueba resultó ser significativa.
 La evidencia estadística permite rechazar la hipótesis
planteada
 Por lo tanto los datos muestrales confirman
que el promedio de salarios diarios de los técnicos
en salud de la zona de estudio es diferente de
S/.65,42.

MATERIAL DE CLASES © G.P.P.16-feb-12


Ejemplo2: El periodo de incubación de una determinada
enfermedad se distribuye normalmente con un tiempo medio
de 800 horas y una desviación estándar de 40 horas. Si una
muestra aleatoria de 30 pacientes tiene una duración
promedio de 788 horas, ¿Muestran los datos suficiente
evidencia para decir que la duración media ha cambiado?
Utilice un nivel de significación del 0.04?

Solución: Datos
  800 horas n  30
Población :  muestra : 
  40  x  788 horas

MATERIAL DE CLASES © G.P.P.16-feb-12


Procedimiento
H 0 :   800
1) Plantear las hipótesis:
H1 :   800
2) Seleccionar el nivel de significación:  = 0.04
3) Como se conoce la desviación estándar. Usar Z:
X  788  800
Z   1.643
/ n 40 / 30
Z / 2  Z 0.02  2.052
4) Determinar los puntos críticos

MATERIAL DE CLASES © G.P.P.16-feb-12


5) Decisión :como -2.052< -1.643<2.052, → no se rechaza H0

• No hay evidencia contra H0

•No se rechaza H0

•El experimento no es concluyente

•El contraste no es significativo

-1.643

6) Interpretación: Por lo tanto, no se rechaza Ho y se


concluye con un nivel de significación del 0.04 que los
datos no muestran evidencia suficiente para rechazar Ho

MATERIAL DE CLASES © G.P.P.16-feb-12


RELACION ENTRE PRUEBA DE HIPÓTESIS
E INTERVALOS DE CONFIANZA
 
Si    x  Z / 2 , x  Z / 2   no se rechaza H 0
n n
 
Si    x  Z / 2 , x  Z / 2   se rechaza H 0
n n
Del ejemplo anterior   800,   40, X  788, Z 0.02  2.052, n  30


 X  Z / 2 
n
40
 788  2.052 
30
 773.01, 802.99 
Como 800  773.01, 802.99  no se rechaza H 0
MATERIAL DE CLASES © G.P.P.16-feb-12
EJEMPLO3: El administrador de un centro de salud desea
saber si el tiempo medio invertido por los pacientes en la
sala de espera es mayor que 20 minutos. Una muestra de
100 pacientes permanecieron, en promedio, 23 minutos en
la sala de espera entre el registro y la atención por algún
médico del centro de salud. La desviación estándar de la
muestra fue de 10. Sea =0.05
Solución: Datos
n  100

muestra : s  ˆ  10
Población :   20 minutos  x  23 minutos

MATERIAL DE CLASES © G.P.P.16-feb-12


Procedimiento
H 0 :   20
1) Plantear las hipótesis:
H1 :   20
2) Seleccionar el nivel de significación:  = 0.05
3) Definir la prueba estadística , como n=100. Usar Z
X  23  20 3
Z   3
 / n 10 / 100 1
4) Determinar los puntos críticos Z  Z 0.05  1.645

H1 :  > 20
R e g l a e m p ír i c a
f( z )

-4 -3 -2 -1 0 1 2 3 4
z
1,645

MATERIAL DE CLASES © G.P.P.16-feb-12


5) Decisión :como 3 >1.645, → se rechaza H0
Si prueba Z es mayor que 1,645, se rechaza Ho.
Si prueba Z es menor o igual que 1,645, no se rechaza Ho.

6. Conclusiones
a) Se rechaza la hipótesis planteada, se acepta la hipótesis
alternante a un nivel de significación de 0,05. La prueba
resultó significativa
b) Los datos disponibles como evidencia empírica, han
permitido rechazar la hipótesis planteada.
c) El tiempo medio de espera de los pacientes es mayor a
20 minutos.
MATERIAL DE CLASES © G.P.P.16-feb-12
Ejemplo 4: Los sueldos de los médicos del sistema de salud
tienen una distribución normal con media de $2,320 y una
distribución estándar de $450. Si en el Clínica San Lucas que
trabajan 40 médicos les paga en promedio $2,120 ¿Puede ser
acusado esta Clínica de pagar sueldos inferiores al sistema de
salud con un nivel de significación del 1%?
Solución: Datos

  2,320 n  40
población :  muestra : 
  450  x  2,120

MATERIAL DE CLASES © G.P.P.16-feb-12


Procedimiento
H 0 :   2,320
1) Plantear las hipótesis:
H1 :   2,320
2) Seleccionar el nivel de significación:  = 0.01
3) Definir la prueba estadística , como se conoce σ. Usar Z
X  2,120  2,320  200
Z    2.81
/ n 450 / 40 450 / 6.32
4) Determinar los puntos críticos Z  Z 0.01  2.33

H1 :  < 2,320
Regla empírica
f(z)

-4 -3 -2 -1 0 1 2 Z=
3 -2.33
4

MATERIAL DE CLASES © G.P.P.16-feb-12


5) Decisión :como -2.81<-2.33, → se rechaza H0

6. Conclusiones
a) Se rechaza la hipótesis planteada, se acepta la
hipótesis alternante a un nivel de significación de
0,05. La prueba resultó significativa
b) Es decir la Clínica puede ser acusado de pagar
sueldos inferiores del sistema de salud

MATERIAL DE CLASES © G.P.P.16-feb-12


EJEMPLO5 En cierta universidad se toma un test a los
estudiantes para medir los niveles de depresión. Los
siguientes datos son los puntajes obtenidos de 45
personas de una escala de ansiedad (mayor puntaje
significa mayor depresion). Si α=0.05

¿Proporciona estos datos evidencia suficiente que el


puntaje promedio poblacional sea diferente de 10?

MATERIAL DE CLASES © G.P.P.16-feb-12


H o :   10
1. Plantear la hipótesis
H 1 :   10
2. Seleccione y calcule el estadístico de prueba Z
X  0 14.56  10 4.56
Z  Z   7.07
/ n 4.325 / 45 4.325 / 6.70

3. El valor critico Zα/2=±1.645


4. Regla de decisión Como 7.07 cae en la región de
rechazo, entonces rechazamos H0.

5. Interpretación los puntajes promedios poblacionales


del nivel de ansiedad son diferentes de 10

MATERIAL DE CLASES © G.P.P.16-feb-12


Click en Analyze /Descriptive Statistics/ Explore
Reporte de SPSS

• Si p < α entonces rechazamos H0


• Caso contrario no rechazamos H0

p  Sig

One-Samp le Test

Test Value = 10
95% Conf idence
Interv al of the
Mean Dif f erence
t df Sig. (2-tailed) Dif f erence Lower Upper
ansiedad 7,066 44 ,000 4,556 3,26 5,85

MATERIAL DE CLASES © G.P.P.16-feb-12


VALORES DE p
• La aproximación del valor p como ayuda en la toma
de decisiones es muy importante pues casi todos los
software estadísticos proporcionan el cálculo de
prueba de hipótesis entregan valores de p junto con
valores de la estadística de la prueba apropiada.
• Un valor p representa el nivel de significación más
pequeño que conduciría al rechazo de H0

• Si p < α entonces rechazamos H0


• Caso contrario no rechazamos H0
MATERIAL DE CLASES © G.P.P.16-feb-12
PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL
CON VARIANZA POBLACIONAL DESCONOCIDA

EJEMPLO1 : Una encuesta en 12 laboratorios médicos en


Lima, reveló que el precio medio cobrado por realizar cierta
prueba de diagnostico de embarazo es de S/. 42 con una
desviación estándar de S/. 11.9.
¿Proveen estos datos la suficiente información para indicar que
el precio promedio de todos los laboratorios de Lima es menor
que 46?. Sea  = 0.05

MATERIAL DE CLASES © G.P.P.16-feb-12


poblacion :   46 soles n  12

muestra : s  11.9
Procedimiento  x  42 soles
H 0 :   46 
1) Plantear las hipótesis:
H1 :   46
2) Seleccionar el nivel de significación:  = 0.05
3) Definir la prueba estadística , como se desconoce σ. Usar t
x 42  46
t   1.16
s / n 11.9 / 12
4) Determinar los puntos críticos
t 0.05  1.796

MATERIAL DE CLASES © G.P.P.16-feb-12


5) Decisión : Como -1.16 cae en la región de no rechazo

-1.16

6)Interpretación: Como –1.16 > -1.796, por lo tanto no se


rechaza Ho y se concluye con un nivel de significación del
0.05 que los datos no muestran evidencia suficiente para
rechazar que el precio promedio de todos los laboratorios
de Lima es mayor que 46.

MATERIAL DE CLASES © G.P.P.16-feb-12


Ejemplo2: El Laboratorio Mead Johnson importo una
máquina para en enlatar un complemento nutricional
(Sustagen), esta ha sido regulado para que el contenido de
cada lata sea de 400 gramos, Para comprobar se tomaron una
muestra y los datos fueron: 400, 450, 423, 400, 400, 455, 470,
477, 455 y 415, con un nivel de significación de 0.10 ¿Diría
Ud. que la máquina que se importo ha sido adecuadamente
regulada, interprete?
variable N Media Desviación Estándar
Latas 10 434,5 30,24

MATERIAL DE CLASES © G.P.P.16-feb-12


variable N Media Desviación Estándar
Latas 10 434,5 30,24 HR 1e g:l a µ≠ 400
e m p ír i c a

Procedimiento
H 0 :   400

f( z )
1) Plantear las hipótesis:
H1 :   400
2) Seleccionar el nivel de significación:  = 0.10 -4 -3 -2 -1 0 1 2 3 4
-1.833 z
1.833

3) Definir la prueba estadística , como se desconoce σ. Usar t

x 434.5  400


t   3.6077
s/ n 30.24 / 10
4) Determinar los puntos críticos t0.05  1.833
5) Decisión : Como t=3.6077 > 1.833 entonces se rechaza Ho
6)Interpretación: Por lo tanto se rechaza Ho y se concluye con un nivel
de significación del 0.1 que la maquina ha sido mal calibrada

MATERIAL DE CLASES © G.P.P.16-feb-12


Reporte del Minitab
Test of mu = 400.00 vs mu not = 400.00
Variable N Mean StDev SE Mean T P
conserva 10 434.50 30.24 9.56 3.61 0.0057

Reporte de SPSS
Prueba para una muestra

Valor de prueba = 400


99% Interv alo de
conf ianza para la
Dif erencia dif erencia
t gl Sig. (bilateral) de medias Inf erior Superior
PESO 3.608 9 .006 34.5000 3.4220 65.5780

• Si p=Sig < α entonces rechazamos H0


• Caso contrario no rechazamos H0

Interpretación: Como 0.006 ≤ 0.1 entonces rechazamos H0

MATERIAL DE CLASES © G.P.P.16-feb-12


Ejemplo: Los siguientes datos son los consumos de oxígeno (en ml) durante la
incubación de una muestra aleatoria de 15 suspensiones celulares: 14.0, 14.1, 14.5,
13.2, 11.2, 14.0, 14.1, 12.2, 11.1, 13.7, 13.2, 16.0, 12.8, 14.4, 12.9.
¿Proporcionan estos datos suficiente evidencia, aun nivel de 0.05 de significación, de
que la media de la población no es igual a 12 ml.?.

Ejemplo: Se hizo un estudio de una muestra de 25 registros de pacientes de un


hospital de enfermedades crónicas tomando como base pacientes externos. El
número medio de visitas por paciente fue 4,8 y la desviación estándar muestral fue
de 2. ¿Puede concluirse a partir de estos datos que la media de la población es
mayor que cuatro visitas por paciente?. Suponga que la probabilidad de cometer
error del tipo I es de 0,05.

Ejemplo: Se ha encargado a 14 diferentes laboratorios la medición del grado de


contaminación (en partes por millón, ppm) por el insecticida DDT en las plantas de
col de una cierta región. Los resultados obtenidos fueron: 2.79, 2.93, 3.22, 3.78,
3.22, 3.38, 3.18, 3.33, 3.34, 3.06, 3.07, 3.56, 3.08, 3.34
¿Proporcionan estos datos suficiente evidencia estad´ıstica, al nivel de significación
0.05, para afirmar que el nivel medio de contaminación por DDT excede 3 ppm?

MATERIAL DE CLASES © G.P.P.16-feb-12


Ejemplo: El Director del Banco de Sangre de cierto hospital sostiene que las bolsas
de sangre contienen 250 cc. (1 unidad), con una desviación estándar de 25 cc. Se
selecciona una muestra aleatoria de 100 bolsas, encontrando que el contenido
medio es de 246 cc. ¿Cumplen las bolsas de sangre con las especificaciones?

Ejemplo: El hospital Daniel Alcides Carrión ha asumido, el compromiso de reducir


el tiempo de espera de los pacientes en consulta externa. Existe la sensación que
el tiempo es prolongado, habiéndose estimado que puede ser mayor de 3 horas.
Una encuesta a 30 pacientes dá un tiempo medio de 199,66 minutos con una
desviación estándar de 47,94 minutos. Utilizando un nivel de significación de 0,05
¿qué se concluye respecto al tiempo estimado?

MATERIAL DE CLASES © G.P.P.16-feb-12


Prueba de hipótesis acerca de la proporción
poblacional (= p)
Ejemplo 1 El Director de la Clínica San Pablo de los Olivos afirma que
por lo menos 85% de los pacientes en emergencia piensan que el
servicio es de buena calidad. ¿A qué conclusión puede llegarse si en
una muestra aleatoria de 120 pacientes, 96 expresan esa opinión sobre
la calidad del servicio de emergencia? Utilice un nivel de significación
de 0,01
Datos

p  0.85
x 96
p   0.80
n 120
n  120
  0.01
MATERIAL DE CLASES © G.P.P.16-feb-12
Procedimiento H1 : p < 0.85
Regla empírica

H 0 : p  0.85
1) Plantear las hipótesis:
H1 : p  0.85

f(z)
2) Seleccionar el nivel de significación:  = 0.01
Z= -2.33 1 2 3 4
-4 -3 -2 -1 0
p p
3) Definir la prueba estadística Z 
z

p
Los supuestos son:
• La población se distribuye p(1  p)  (0.85)(0.15)  0.0326
normalmente. p  120
n
• La muestra ha sido
seleccionada al azar 0.80  0.85  0.05
Z   1.53
0.0326 0.0326
4) Determinar los puntos críticos Z= -2.33

5) Decisión :Como -1.53 > -2.33 entonces no rechazamos H0


6)Interpretación: Por lo tanto no, la evidencia empírica disponible
no permite rechazar la afirmación del director de la clínica
MATERIAL DE CLASES © G.P.P.16-feb-12
Ejemplo2: El Jefe de un programa de vigilancia de enfermedades
infecciosa afirma que la proporción de infectados en determinada
población es a lo más 8%. Ante la sospecha de que esta proporción en
verdad pueda ser mayor, se realiza un estudio por muestreo. Se eligen
aleatoriamente 150 individuos encontrándose 18 infectados ¿Es
posible darle la razón al Jefe del programa de emergencia. Analice con
un nivel de significación de 0,05

Datos

p  0.08
x 18
p   0.12
n 150
n  150
  0.05  Z  1.645
MATERIAL DE CLASES © G.P.P.16-feb-12
Procedimiento
H 0 : p  0.08 H1 : p > 0.80
R e g l a e m p ír i c a
1) Plantear las hipótesis:
H1 : p  0.08
2) Seleccionar el nivel de significación:  = 0.05

f( z )
p p
3) Definir la prueba estadística Z 
p
-4 -3 -2 -1 0 1 2 3 4
Z=1.645 z
Los supuestos son:
• La población se distribuye p(1  p)  (0.08)(0.92)  0.02215
normalmente. p  150
n
• La muestra ha sido
seleccionada al azar 0.12  0.08 0.04
Z   1.8058
0.02215 0.02215
4) Determinar los puntos críticos Z= 1.645
5) Decisión :Como 1.8058 > 1.645 entonces rechazamos H0
6)Interpretación: Por lo tanto, la prueba resulto significativa. Luego
es posible concluir que en la población bajo estudio, la
proporción de individuos infectados supera al 8%
MATERIAL DE CLASES © G.P.P.16-feb-12
MATERIAL DE CLASES © G.P.P.16-feb-12
MATERIAL DE CLASES © G.P.P.16-feb-12

También podría gustarte