Está en la página 1de 32
PRUEBA DE HIPOTESIS Validando los supuestos de la población Equipo de Estadística

PRUEBA DE HIPOTESIS

Validando los supuestos de la población

Equipo de Estadística

UNA VISITA A LA EMPRESA CEREALES ÁNGEL

UNA VISITA A LA EMPRESA CEREALES ÁNGEL Imagine que usted es el gerente de operaciones de

Imagine que usted es el gerente de operaciones de la Empresa Cereales Ángel y responsable de vigilar la cantidad empacada en cada caja de cereal. Selecciona y pesa una muestra aleatoria de 25 cajas, con el fin de calcular la media muestral e investigar que tanto se acercan los pesos de llenado a la especificación de 365 gramos establecida por la empresa. Esta vez debe tomar una decisión y concluir si el peso medio de llenado de todo el proceso es igual a 365 gramos (o no), con el objetivo de saber si el proceso de llenado requiere ajustes. ¿Cómo puede tomar esta decisión de una manera razonada?

CONTENIDO

Prueba de Hipótesis

para

proporción, diferencia

la

media,

de

medias

y

diferencia

de

proporciones.

CONTENIDO Prueba de Hipótesis para proporción, diferencia la media, de medias y diferencia de proporciones.

DEFINICIONES

I. HIPOTESIS :

DEFINICIONES I. HIPOTESIS : •. Es una respuesta a priori a un problema. Es una conjetura

•. Es una respuesta a priori a un problema. Es una conjetura sobre el valor concreto que tiene en realidad.

II. HIPOTESIS ESTADÍSTICA

Es una afirmación que se hace a cerca de la distribución de una o más poblaciones.

Es un enunciado acerca del valor de un parámetro poblacional.

III. PRUEBA DE HIPOTESIS:

La prueba de una hipótesis, es una regla que cuando los valores experimentales son observados nos conducen a una decisión; no rechazar (aceptar) o rechazar la hipótesis.

Entonces debemos concentrar la atención en dos hipótesis estadísticas, llamadas: Hipótesis nula e Hipótesis alternativa

IDENTIFICACIÓN DE LA HIPÓTESIS

IDENTIFICACIÓN DE LA HIPÓTESIS a) HIPOTESIS NULA (H0): • Es la probar. hipótesis que se quiere

a) HIPOTESIS NULA (H0):

Es

la

probar.

hipótesis

que

se

quiere

Generalmente es especificada en una forma exacta

b) HIPOTESIS ALTERNATIVA (H1):

Es una suposición contraria a la que se quiere probar.

Se acepta en caso que la primera sea rechazada (es decir cuando se rechaza la Hipótesis Nula).

con

Es

formulada

generalmente

menos precisión.

H 0

H 1

:

:

= , ≤ , ≥

≠ , > , <

la Hipótesis Nula). con • Es formulada generalmente menos precisión. H 0 H 1 : :
ELEMENTOS DE LA PRUEBA HIPÓTESIS ESTADÍSTICO DE PRUEBA: Es un valor, determinado a partir de

ELEMENTOS DE LA PRUEBA HIPÓTESIS

ESTADÍSTICO DE PRUEBA: Es un valor, determinado a partir de la información muestral, que se utiliza para aceptar o rechazar la hipótesis nula.

VALOR CRÍTICO: Es aquel valor que se obtiene en función del grado de confianza seleccionado.

REGLA DE DECISIÓN: Se establece en base a la comparación entre los valores crítico y de prueba.

REGIÓN DE RECHAZO (RR): Contiene los resultados de la estadística de prueba para rechazar Ho.

REGIÓN DE ACEPTACIÓN (RA): Contiene los resultados de la estadística de prueba para aceptar Ho.

ETAPAS BÁSICAS DE UNA PRUEBA DE HIPÓTESIS

ETAPAS BÁSICAS DE UNA PRUEBA DE HIPÓTESIS • Plantear la hipótesis nula y alternativa. • Especificar

Plantear la hipótesis nula y alternativa.

Especificar el nivel de significancia (o confianza)que se va a utilizar.

Elegir

especificado en términos de un estimador del parámetro

el

estadístico

de

prueba

que

debe

ser

a probar.

Establecer el valor o valores críticos para rechazar o aceptar Ho.

Determinar las reglas de decisión de la prueba.

Tomar la decisión de aceptar o rechazar Ho

TIPOS DE PRUEBA, REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN

A) PRUEBA BILATERAL O DE AMBAS COLAS

NIVEL DE SIGNIFICACIÓN A) PRUEBA BILATERAL O DE AMBAS COLAS H o : T = To
NIVEL DE SIGNIFICACIÓN A) PRUEBA BILATERAL O DE AMBAS COLAS H o : T = To

H o : T = To

H 1 : T

To

B) PRUEBA UNILATERAL DE COLA

DERECHA

H o : T ≤ To H 1 : T > To

C) PRUEBA UNILATERAL DE COLA

IZQUIERDA

H o : T ≥ To H 1 : T < To

H o : T ≤ To H 1 : T > To C) PRUEBA UNILATERAL DE

DECISIONES SOBRE LA HIPÓTESIS NULA, CON LAS PROBABILIDADES ASOCIADAS A CADA DECISIÓN.

NULA, CON LAS PROBABILIDADES ASOCIADAS A CADA DECISIÓN. DECISIONES ACEPTAR RECHAZAR HIPÓTESIS NULA

DECISIONES

ACEPTAR

RECHAZAR

HIPÓTESIS NULA VERDADERA

Decisión correcta Probabilidad = 1-

Error Tipo I Probabilidad= (Nivel de significación)

HIPÓTESIS NULA FALSA

Error Tipo II Probabilidad=

Decisión correcta Probabilidad= 1- (Potencia)

PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL PROPORCIÓN Y

PRUEBA DE HIPÓTESIS PARA LA

MEDIA

POBLACIONAL

PROPORCIÓN

Y

P. HIPÓTESIS PARA LA MEDIA O PROMEDIO

P. HIPÓTESIS PARA LA MEDIA O PROMEDIO CASO 1: Estadístico de prueba : muestra grande (n≥30)

CASO 1: Estadístico de prueba :

muestra grande (n≥30)

CASO 2: Estadístico de prueba :

muestra pequeña (n<30)

Z

T

o

o

X   o   / n
X 
o
 
/
n

N (0,1)

X   o  T ( s / n
X 
o
T
(
s / n

n g l

1)

.

EJEMPLO 1

EJEMPLO 1 La producción diaria para una planta química local ha promediado 880 toneladas en los

La producción diaria para una planta química local ha promediado 880 toneladas en los últimos años. A la gerente de control de calidad le gustaría saber si este promedio ha cambiado en meses recientes. Ella selecciona al azar 50 días de entre la base de datos y calcula el promedio y desviación estándar de las n = 50 producciones resultando 871 toneladas en promedio y 21 toneladas de desviación. Pruebe la hipótesis apropiada usando = 0.05. Solución:

H 0 : = 880 contra H 1 : ≠ 880

Estadístico de prueba usamos Caso 1

1 :  ≠ 880 Estadístico de prueba usamos Caso 1 -1.96 1 . 9 6
1 :  ≠ 880 Estadístico de prueba usamos Caso 1 -1.96 1 . 9 6

-1.96

1.96

871  880   Z  3.03 o 21/ 50
871
880  
Z
3.03
o
21/
50

Z 0 = -3.03

Conclusión: como Z 0 cae en la región de rechazo, la gerente puede rechazar la hipótesis nula de que = 880 y concluir que ha cambiado.

EJEMPLO 2

EJEMPLO 2 La • longitud media de una barra de equilibrio es de 43 milímetros. El
La • longitud media de una barra de equilibrio es de 43 milímetros. El supervisor
La • longitud media de una barra de equilibrio es de 43 milímetros. El
supervisor de producciones sospecha que la maquina que produce las
barras se ha desajustado, y le pide al departamento de ingeniería que
investigue esto. El departamento de ingeniería toma una muestra de 12
barras y mide cada una. Los resultados de las mediciones son:
42 39
42
45
43
40
39
41
40
42
43
42
¿Es razonable concluir que la longitud de las barras ha variado? Use 
= 0.02 como nivel de significancia.
Solución:
Datos: ;
t (n-1,1-/2)= t (11,0.99) = 2.718
H 0 : = 43
contra H 1 : ≠ 43
Estadístico de prueba usamos Caso 2
41.5 
T
43   2.92
o
1.78 /
12
-2.718
2.718
T 0 = -2.92
Conclusión: como T 0 cae en la RR, Se acepta H 1 y se concluye que la
media no es 43 milímetros. La maquina deberá ser ajustada.

CASO: UNA VISITA A LA EMPRESA CEREALES ÁNGEL

CASO: UNA VISITA A LA EMPRESA CEREALES ÁNGEL Considerando • que la media y desviación estándar
Considerando • que la media y desviación estándar de las 25 cajas de cereal fueron
Considerando • que la media y desviación estándar de las 25 cajas de
cereal fueron de 368 y 10 gramos respectivamente. Usaremos una
significancia del 0.04 para tomar la decisión mas apropiada.
Solución:
Datos: ;
t (n-1,1-)= t (24,0.98) = 2.172
H 0 : = 365 contra H 1 : ≠ 365
Estadístico de prueba usamos Caso 2
368
365 
T
1.50
o
10 /
25
-2.172
2.172
T 0 = 1.50
Conclusión: como T 0 cae en la RA, No hay evidencia suficiente para
indicar que el peso medio del proceso es diferente a los 365 gramos,
por lo cual se concluye que el proceso esta no necesita ajustes.

P. HIPÓTESIS PARA LA PROPORCIÓN

P. HIPÓTESIS PARA LA PROPORCIÓN CASO 3: Estadístico de prueba : Para muestras grandes y pequeñas

CASO 3: Estadístico de prueba :

Para muestras grandes y pequeñas

Z

o

p  p o p (1  p ) o o n
p
p
o
p
(1
p
)
o
o
n

N (0,1)

EJEMPLO 3

EJEMPLO 3 A cualquier edad, alrededor de 20% de los peruanos adultos participan en actividades de

A cualquier edad, alrededor de 20% de los peruanos adultos participan en actividades de acondicionamiento físico al menos dos veces a la semana. No obstante, estas actividades cambian a medida que las personas envejecen y, ocasionalmente, los participantes se convierten en no participantes. En una encuesta local de n = 100 adultos de más de 40 años, un total de 15 personas indicaron que participaron en estas actividades al menos dos veces a la semana. ¿Estos datos indican que el porcentaje de participación para adultos de más de 40 años de edad es considerablemente menor a la cifra de 20%? Use = 0.05 para sacar las conclusiones apropiadas. Solución:

Datos: p = 15/100 = 0.15 ; = 0.05 ; Z ( Z (0.05 

H 0 : p = 0.20 contra H 1 : p

Estadístico de prueba usamos Caso 3

Z

o

0.15  0.20 0.20(0.80) 100
0.15
 0.20
0.20(0.80)
100

1.25

3 Z o  0.15  0.20 0.20(0.80) 100   1.25 - 1 . 6

-1.645

 0.20 0.20(0.80) 100   1.25 - 1 . 6 4 5 Z 0 =

Z 0 = -1.25

Conclusión: No hay suficiente evidencia para concluir que el porcentaje de adultos de más de 40 años que participan en actividades de acondicionamiento físico dos veces a la semana es menor a 20%.

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS CON MUESTRAS INDEPENDIENTES, DATOS PAREADOS Y

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS MEDIAS CON MUESTRAS INDEPENDIENTES, DATOS PAREADOS Y DIFERENCIA DE DOS PROPORCIONES.

TIPOS DE PRUEBA, REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN DOS POBLACIONES

REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN DOS POBLACIONES A) PRUEBA BILATERAL O DE AMBAS COLAS H

A) PRUEBA BILATERAL O DE AMBAS COLAS

H o : T 1 = T 2

ó

T 1 - T 2

= 0

H 1 : T 1 ≠ T 2

ó

T 1 - T 2

≠ 0

B) PRUEBA UNILATERAL DE COLA

DERECHA

H o : T 1 ≤ T 2

ó

T 1 - T 2 ≤ 0

H 1 : T 1 > T 2

ó

T 1 - T 2 > 0

C) PRUEBA UNILATERAL DE COLA

IZQUIERDA

H o : T 1 ≥ T 2

ó

T 1 - T 2 ≥ 0

H 1 : T 1 < T 2

ó

T 1 - T 2 < 0

: T 1 ≥ T 2 ó T 1 - T 2 ≥ 0 H 1
: T 1 ≥ T 2 ó T 1 - T 2 ≥ 0 H 1

P. HIPÓTESIS PARA LA DIFERENCIAS DE MEDIAS MUESTRAS INDEPENDIENTES

PARA LA DIFERENCIAS DE MEDIAS MUESTRAS INDEPENDIENTES CASO 4: Estadístico de prueba : Muestras grandes (n

CASO 4: Estadístico de prueba :

Muestras grandes (n 1 y n 2 ≥30) y varianzas conocidas Distribución Normal Estándar Z

CASO 5: Estadístico de prueba :

Muestras pequeñas (n 1 y n 2 <30) y varianzas desconocidas Distribución T-Student con (n 1 +n 2 −2) grados de libertad.

Desviación

Mancomunada

Z

o

T

o

S C

(

x

1

x

2

)

(

1

2

)

 
 
 S 
 S

1 2 S

2

2

 

n

1

n

2

(

x

1

x

2

)

(

1

2

)

 

S

 
 1   n  1
1
n
1

1

C

n

2

 

(

 

1)

2

 

2

n

1

S

1

(

n

2

1)

S

2

 

n

n

2

 
2  n 1  S 1  ( n 2  1) S 2  

1

2

EJEMPLO 4

EJEMPLO 4 La empresa A se dedica a la fabricación de monturas de gafas. Su producción

La empresa A se dedica a la fabricación de monturas de gafas. Su producción diaria X, en cientos, sigue una distribución normal. En la empresa B, la competencia, el número de gafas producidas Y, también se distribuye normalmente. Se extraen muestras respectivas de tamaños de 16 y 26 y los resultados obtenidos son los siguientes:

Empresa A

Media=90

Varianza=12

Empresa B

Media=98

Varianza= 17

Varianza=12 Empresa B Media=98 Varianza= 17 ¿Ofrecen estos datos evidencia suficiente para indicar que

¿Ofrecen estos datos evidencia suficiente para indicar que las medias poblacionales son diferentes? Sea α =0.05.

Solución: • Datos: ; con  = 0.05; usamos el Estadístico Caso 5 H 0
Solución:
Datos: ; con  = 0.05; usamos el Estadístico Caso 5
H 0 :   =   contra
H 1 :   ≠  
(
x
x
)
(
)
1
2
1
2
(90
98)
T
  6.47
o
1
1
1
1
S
3.889
C
n
n
16
26
1
2
(16
1)12
(26
1)17 
S
3.889
C
16
26
2
Distribución T=
t (n1-n2-2,1-/2)=
-2.021
2.021
T 0 = -6.47
t (16+26-2; 0.975) = t (40; 0.975) =2.021
Conclusión: como T 0 cae en la RR, Se rechaza H 0 y se concluye que la
si existe suficiente evidencia para probar que la producción diaria de la
empresa de gafas A es diferente que la de B, con una confianza del
95%.

EJEMPLO 5

Un editor está interesado en conocer los efectos sobre unos costosos diseños tricolor para las cubiertas de los libros de texto. El editor planea publicar 500 libros de texto de economía y elige aleatoriamente 40 de ellos para colocarles las cubiertas caras y otros 40 llevan la cubierta sencilla. Para aquellos con cubiertas caras, el promedio de ventas durante el primer año fue de 9.254 con una desviación de 2.107. para los libros con cubiertas sencillas el promedio de ventas fue de 8.167 con una desviación de 1.681. asumiendo que las dos poblaciones tienen distribución normal. Contrastar la hipótesis de que la media de libros con diseños de cubierta cara es mayor.

tienen distribución normal. Contrastar la hipótesis de que la media de libros con diseños de cubierta
tienen distribución normal. Contrastar la hipótesis de que la media de libros con diseños de cubierta
Solución: • Datos: ; con  = 0.05; usamos el Estadístico Caso 4 H 0
Solución:
Datos: ; con  = 0.05; usamos el Estadístico Caso 4
H 0 :   ≤   contra H 1 :   >  
(
x
x
)
(
)
1
2
1
2
(9.254
8.167)
Z
 2.55
o
2
2
2
 S
 2.107
1.681
1 2 S
2
n 1 n
40
40
2
Distribución Z con  = 0.05
Z
(0.95) = 1.645
1.645
Z 0 = 2.55
Conclusión: como T 0 cae en la RR, Se rechaza H 0 y se concluye que la
media de las ventas anuales de libros con diseños de cubierta cara es
mayor que la media de las ventas de los libros con diseño simple, con
una confianza del 95%
P. HIPÓTESIS PARA LA DIFERENCIAS DE MEDIAS DEPENDIENTES O DATOS PAREADOS Supongamos que disponemos de
P. HIPÓTESIS PARA LA DIFERENCIAS DE
MEDIAS DEPENDIENTES O DATOS PAREADOS
Supongamos que disponemos de una muestra aleatoria de n
pares de observaciones de distribuciones. Denotamos por a la
media muestral y a S d la desviación estándar observadas para
las n diferencias (Xi – Yi).
a) Prueba bilateral o de ambas colas
H o : d = 0
H 1 : d ≠ 0
b) Prueba unilateral de cola derecha
H o : d ≤ 0
H 1 : d > 0
c) Prueba unilateral de cola izquierda
H o : d ≥ 0
H 1 : d < 0
P. HIPÓTESIS PARA LA DIFERENCIAS DE MEDIAS DEPENDIENTES O DATOS PAREADOS
P. HIPÓTESIS PARA LA DIFERENCIAS DE
MEDIAS DEPENDIENTES O DATOS PAREADOS

CASO 6: Estadístico de prueba T de Student:

t

_

d s / n d
d
s
/
n
d

t

n 1g.l

EJEMPLO 6

Se asume que se tienen puntajes de la prueba de 10 empleados antes y después de habérseles impartido capacitación laboral adicional, pruébese con un nivel de significancia de

0.10,

¿existe evidencia para decir que la media de la diferencia en los puntaje antes y después de la capacitación es diferente? Los puntajes aparecen en la tabla:

de la diferencia en los puntaje antes y después de la capacitación es diferente? Los puntajes
de la diferencia en los puntaje antes y después de la capacitación es diferente? Los puntajes
Solución: • Hallando el promedio y desviación estándar de las d i
Solución: • Hallando el promedio y desviación estándar
de las d i

Hipótesis H o : d = 0

H 1 : d ≠ 0

Estadístico de Prueba

T

o

 0.5 0.736 / 10
 0.5
0.736 /
10

t

2.14

Distribución T, con α =0.10

t (n-1,1-/2)= t (9,0.95) = 1.833

T, con α =0.10 t (n-1,1-  /2)= t (9,0.95) = 1.833 _ d s /

_

d

s / n d
s
/
n
d
t (n-1,1-  /2)= t (9,0.95) = 1.833 _ d s / n d -1.833 1
t (n-1,1-  /2)= t (9,0.95) = 1.833 _ d s / n d -1.833 1

-1.833

1.833

T 0 = -2.14

Conclusión: como T 0 = -2.14 cae en la RR, Se rechaza H 0 y se concluye que si hay diferencia en los puntajes antes y después del entrenamiento, con una confianza del 90%

P. HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES

P. HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES CASO 7: Estadístico de prueba : Donde: Z

CASO 7: Estadístico de prueba :

Donde:

Z

(

p

1

p

2

)

(

P P

1

2

)

o

o
o

n p

1

P

1

(1

P

P

)

1

1

n p

2

2

n

1

n

2

   

n

1

n

2

N (0,1)

EJEMPLO 7

EJEMPLO 7 En un estudio diseñado para comparar un nuevo tratamiento para la migraña con el

En un estudio diseñado para comparar un nuevo tratamiento para la migraña con el tratamiento estándar, 78 de 100 individuos que recibieron el tratamiento estándar respondieron favorablemente y 90 de 100 del nuevo tratamiento respondieron satisfactoriamente. ¿Ofrecen estos datos evidencia suficiente para indicar que el nuevo tratamiento es más efectivo? Sea α =0.05 y determine el valor de P.

datos evidencia suficiente para indicar que el nuevo tratamiento es más efectivo? Sea α =0.05 y
datos evidencia suficiente para indicar que el nuevo tratamiento es más efectivo? Sea α =0.05 y
Solución: • Datos: ; con  = 0.05; usamos el Estadístico Caso 7 H 0
Solución:
Datos: ; con  = 0.05; usamos el Estadístico Caso 7
H 0 : P  ≥ P 
contra H 1 : P  < P 
P 1 : proporción de respuesta favorable al tratamiento estándar = 78/100 = 0.78
P 2 : proporción de respuesta favorable al tratamiento nuevo = 90/100 = 0.90
Estadístico:
(
p
p
)
(
P P
)
0.78
0.90
 0.12
1
2
1
2
o
Z
  2.32
o
1
1
0.0518
1
1
P
(1
P
) 
0.84(1
0.84) 
n
n
100
100
1
2
78
 90
P 
0.84
100
 100
-1.645
Z 0 = -2.32
Conclusión: como Z 0 cae en la RR, Se rechaza H 0 y se concluye que el
tratamiento nuevo es mas efectivo es el estándar.