Está en la página 1de 63

Estadística Aplicada

ESTIMACIÓN Y CONTRASTE DE
HIPÓTESIS

1
Estimación puntual
◼ consiste en la estimación del valor del
parámetro por medio de un único valor
obtenido mediante el cálculo o evaluación
de un estimador para una muestra
específica.
◼ El estimador se expresa mediante una
fórmula. Por ejemplo, la media de la
n
muestra: X = 1  X i
n i =1
2
Estimación por intervalos
◼ La estimación por intervalo establece un
intervalo dentro del cual es muy probable
que se encuentre el parámetro poblacional.
El nivel de confianza es la representatividad
de la muestra a tomar y se usa para indicar
la probabilidad de que una estimación por
intervalo contenga al parámetro
poblacional. NC=1-α

3
VARIABLES CONTINUAS

4
Intervalo de confianza para la
media (con varianza σ2 conocida)
◼ Si X es la media de tamaño n de una población
con varianza s2, conocida, un intervalo de
confianza de (1-a) % para está dado por:
Poblacion infinita
s s
X − z 1− a / 2    X + z 1− a / 2
n n
Población finita N conocida
s N −n s N −n
X − z1−a / 2    X + z1−a / 2
n N −1 n N −1
5
Intervalo de confianza para la media con
varianza poblacional(σ2) desconocida y
muestra grande n>30

Poblacion infinita

S S
X − z 1− a / 2    X + z 1− a / 2
n n

Poblacion finita N conocida


S N−n S N−n
X − z 1−a / 2    X + z 1−a / 2
n N −1 n N −1
6
Intervalo de confianza para la media con
varianza poblacional desconocida
(muestra pequeña <=30 )
intervalo de confianza de (1-a) % para
la media poblacional está dado por

S S
X − ta / 2    X + ta / 2
n n

S N −n S N −n
X − ta / 2    X + ta / 2
n N −1 n N −1
7
Ejemplo 1
◼ Una muestra aleatoria de los archivos de una
compañía que contienen información detallada,
indican las órdenes de compras para cierta
pieza fueron complementadas en 10, 12, 19,14,
15, 18, 11 y 13 días. Suponiendo que el tiempo
de cumplimiento de la orden de compra
(medido en días) es una v.a. Normal con
desviación estándar 3 días,
a) Obtenga un intervalo con un nivel de confianza
del 99% para el tiempo medio de cumplimiento
de una orden de compra para la pieza
considerada.
8
Ejemplo 2
◼ Una empresa eléctrica fabrica focos que tienen
una duración aproximadamente normal con
desviación estándar de 40 horas. Si una
muestra de 50 focos tiene una duración
promedio de 785 horas, encuentre un intervalo
de confianza de 95% para la media de la
población de todos los focos que produce esta
empresa, si la muestra de focos fue elegida de
lotes que contienen 200 focos.
9
Ejemplo 3
En un estudio de costos del seguro de choques
automovilísticos, una muestra aleatoria de 80
costos de reparación de carrocerías para una
clase particular de daños tiene una media de
$472 y una desviación estándar de $62.
Obtenga un intervalo con un 90% de nivel de
confianza para el costo medio de reparación del
tipo de daño considerado

10
Ejercicio4
◼ Una máquina produce piezas metálicas de
forma cilíndrica. Se toma una muestra de las
piezas y los diámetros son 1.01, 0.97, 1.03,
1.04, 0.99, 0.98, 0.99, 1.01 y 1.03
centímetros. Encuentre un intervalo de
confianza de 99% para el diámetro medio de
las piezas de esta máquina, suponga una
distribución aproximadamente normal.
11
Ejercicio3
◼ Para estimar el gasto promedio de los
clientes en el McDonald’s local, los
estudiantes de una clase de estadística
toman una muestra de 200 clientes y
encuentran un gasto promedio de US$ 5.67,
con una desviación estándar de US$ 1.10.
¿Cuál es el intervalo de confianza del 95%
para los gastos promedio de todos los
clientes? Interprete sus resultados.

12
Ejercicio4
◼ Una muestra aleatoria de 600 propietarios
de automóviles muestra que, en el estado de
Virginia, un automóvil se maneja, en
promedio, 23500 kilómetros por año con
una desviación estándar de 3900 kilómetros.
Construya un intervalo de confianza de 99%
para el número promedio de kilómetros que
se maneja un automóvil anualmente en
Virginia.
13
Tamaño de muestra para 
◼ Si X se usa como estimación de  , podemos
tener (1-a)x100% de confianza de que el error
no exceda una cantidad específiva e cuando el
tamaño de la muestra es:
 z 1− a / 2 s 
2

n = 
 e 
◼ Si el cálculo del tamaño de muestra resulta un
valor con decimales, se debe redondear al
siguiente número entero.
14
◼ Nota: Si el muestreo es sin reemplazo, el
tamaño de muestra se calcula con la
siguiente fórmula:
n0
n=
n0
1+
N
 z 1−a / 2 s 
2
◼ donde: n0 =  
 e 
15
Tamaño de muestra para  cuando la
varianza poblacional es desconocida

2
 z1−a / 2 s 
n= 
 e 
◼ El valor de s puede ser obtenido a partir de
una muestra preliminar de por lo menos 30
elementos.
◼  Nota: Si el valor del tamaño de muestra es
decimal se debe redondear al siguiente número
entero. 16
Ejercicio1
◼ Un estudio que usted está realizando requiere
un intervalo del 95% para la tasa de
rendimiento promedio que su empresa gana
sobre los proyectos para presupuestar capital.
¿Cuántos proyectos debe tener su muestra si su
supervisor especifica un error máximo de sólo
el 5% y s = 2.3%?

17
Ejercicio2
◼ Un experto en eficiencia desea determinar el
tiempo promedio que toma el hacer tres
perforaciones en una cierta pieza metálica.
¿Qué tan grande se requiere que sea la
muestra si se necesita una confianza de 95%
de que su media muestral estará dentro de 15
segundos del promedio real? Asuma, por
estudios anteriores que s = 40 segundos.

18
Ejercicio 3
◼ Una máquina de refrescos está ajustada de
tal manera que la cantidad de líquido
despachada se distribuye aproximadamente
en forma normal. ¿Qué tan grande se
requiere que sea la muestra si se desea tener
una confianza de 98% de que su media
muestral estará dentro de 0.09 decilitros del
promedio real?. Se cuenta con información
de una muestra piloto de tamaño 24.
19
1.99 2.59 2.04 1.86 2.58 2.04

2.73 2.51 2.65 2.72 2.44 2.29

2.52 2.48 2.14 1.98 2.29 2.02

1.94 1.82 2.53 2.38 2.38 2.43


20
Intervalo de confianza para la
proporción poblacional π
◼ Si p̂ es la proporción de éxitos en una muestra
aleatoria de tamaño n y q̂ = 1 − p̂ , un intervalo
de confianza aproximado de (1-a)x100% para el
parámetro binomial p está dado por:
p̂q̂ p̂q̂
p̂ − z 1−a / 2  p  p̂ + z 1−a / 2
n n

21
◼ Problema. Una empresa desea estimar la
proporción de trabajadores de la línea de
producción que están a favor de que se
corrija el programa de aseguramiento de la
calidad. Se toma una muestra de 100
trabajadores y resulta que 80 están a favor.
Estime con 99% de confianza la proporción
de trabajadores de la línea de producción
que están a favor de que se corrija el
programa de aseguramiento de la calidad
22
Tamaño de muestra
◼ Si p̂ se utiliza como una estimación de p,
podemos tener una confianza del (1-a)x100%
de que el error será menor de una cantidad
específica e cuando el tamaño de la muestra es
aproximadamente:
2
z a/2 p̂q̂
n= 2
e
23
◼ Nota: Si el muestreo es sin reemplazo, el
tamaño de muestra se calcula con la
siguiente fórmula:
2
n0 donde z 1− a / 2 p̂q̂
n= n0 = 2
n0 −1 e
1+
N y N es el tamaño de la
población.
24
◼ Problema. Se realiza un estudio para estimar
la proporción de residentes en una ciudad que
están a favor de la construcción de una
fábrica. ¿Qué tan grande deber ser una
muestra si se quiere una confianza de al
menos 98% de que la estimación estará dentro
de 0.04 de la proporción real de residentes de
la ciudad, que estén a favor de la construcción
de la nueva fábrica?
25
Intervalos de confianza para la
diferencia entre dos medias.
◼ Caso1: varianzas poblacionales conocidas

s 2
s 2
IC ( 1 −  2 ) = ( X 1 − X 2 )  z1−a / 2 1
+ 2
n1 n2

26
◼ Ejemplo. Para comparar dos métodos de la enseñanza
de las matemáticas, se aplicaron a 200 alumnos elegidos
al azar el método tradicional y a otra muestra de 250
alumnos el método nuevo resultando las calificaciones
promedio respectivos de 13 y 15. Suponga que las
varianzas poblacionales respectivas son 9 y 16.
Utilizando un intervalo de confianza del 95% para la
diferencia de las medias, ¿podemos afirmar que no hay
diferencias significativas entre los dos métodos?, si hay
diferencias, ¿podemos afirmar que el método nuevo es
mejor que el método tradicional?

27
Intervalos de confianza para la
diferencia entre dos medias.
◼ Caso2: Varianzas poblacionales
desconocidas pero iguales

1 1
IC ( 1 −  2 ) = ( X 1 − X 2 )  ta / 2 S  + 
2
p
 n1 n2 

( n − 1) S 2
+ ( n − 1) S 2
S 2p = 1 1 2 2
n1 + n2 − 2
28
◼ Problema. Se comparan el rendimiento de la
gasolina de dos automóviles, A y B, probando
cada uno de ellos con cinco marcas de gasolina.
Cada uno de los vehículos gasta un tanque de
cada marca, y el resultado, en millas por galón,
es el siguiente
Marca Automóvil Automóvil
A B
1 28.3 29.2
2 27.4 28.4
3 29.1 28.2
4 28.7 28
5 29.4 29.6
29
◼ Calcule un intervalo de confianza de 99%
para la diferencia de promedios.¿Hay
evidencia que sugiera que existe una
diferencia entre las cifras promedio
verdadero para el rendimiento de los dos
automóviles? Asuma poblaciones normales
con varianzas iguales.

30
◼ Caso3.2: Varianzas diferentes

2 2
IC ( 1 −  2 ) = ( X 1 − X 2 ) + t( v ,a / 2)
S S
1
+ 2
n1 n2
2
S S 2 2
 + 1
 2
n 
 1 n 2 
v=
 S12 2  S 22 2
   
n  n 
 1   2 
+
(n 1 − 1) (n 2 − 1) 31
32
Prueba de hipótesis

33
Conceptos generales
◼ La prueba de hipótesis involucra una suposición
elaborada sobre algún parámetro de la población. A
partir de la información proporcionada por la muestra se
verificará la suposición sobre el parámetro estudiado. La
hipótesis que se contrasta se llama hipótesis nula (Ho).
◼ Partiendo de los resultados obtenidos de la muestra,
o bien rechazamos la hipótesis nula a favor de la
alternativa, o bien no rechazamos la hipótesis nula y
suponemos que nuestra estimación inicial del
parámetro poblacional podría ser correcta.
34
35
PROBABILIDAD DE : NO RECHAZAR AL AMOR DE SU
VIDA / ES EL AMOR DE SU VIDA 36
37
Pasos a seguir en una Prueba
de Hipótesis
◼  Paso 1: Planteo de hipótesis.
◼  Paso 2: Nivel de significación.
◼  Paso 3: Prueba estadística.
◼  Paso 4: Suposiciones.
◼  Paso 5: Regiones críticas. Criterios de
decisión.
◼  Paso 6: Realización de la prueba.
◼  Paso 7: Resultados y conclusiones.

38
PRUEBA DE HIPOTESIS
SIMPLES PARA LA MEDIA
CASO 1: σ CONOCIDA
CASO 2: σ DESCONOCIDA Y n>30
CASO 3: σ DESCONOCIDA Y n<=30

39
40
PRUEBA DE HIPOTESIS SIMPLES
PARA PROPORCIONES

REGLA DE
DECISION

41
Prueba de hipótesis para una media
poblacional (varianza conocida)
◼ Una empresa eléctrica fabrica focos
cuya duración se distribuye de forma
aproximadamente normal con media de
800 horas y desviación estándar de 40
horas. Pruebe la hipótesis de que
horas contra la alternativa horas si una
muestra aleatoria de 28 focos tiene una
duración promedio de 784 horas.
Utilice un nivel de significancia de 0.05.
42
◼ 1. Planteo de hipótesis.
H 0 :  = 800

H 1 :   800
◼ 2. Nivel de significación: a = 0.05
◼ 3. Prueba estadística
_
x− 
Zc = ~ N(0.1)
s/ n
◼ 4. Supuestos.
◼ a. Población normal.
◼ b. Muestra tomada al azar.
43
◼ 5. Regiones críticas. Criterios de decisión.
La hipótesis alternante define la(s) zona(s) de
rechazo.

6. Cálculos 784 − 800


Zc = = −2.12
40 / 28

Conclusiones. Con 5% de nivel de significación y a


partir de la información muestral, el tiempo
promedio de duración de los focos es diferente de
800 horas.
44
PRUEBA HIPOTESIS SIMPLE
PROPORCIONES

45
Prueba de hipótesis
compuesta para proporciones

46
Prueba de hipótesis para una media
poblacional (varianza desconocida)
◼ Problema1: Antes de publicar un nuevo libro
de cocina, Bantam Books desea probar la
hipótesis, con un nivel de significancia del 2%
de que el precio promedio de tales libros es de
US$ 35.00. ¿Esta afirmación se sustenta si una
muestra de 50 libros de cocina tiene una
media de US$ 32.97 y una desviación estándar
de US$ 12.87?

47
◼ Problema2: Un químico ha desarrollado un
material plástico que, según él, tiene una
resistencia media a la ruptura de 29 onzas por
pulgada cuadrada. Para comprobar la bondad
del método se tomaron 20 láminas de plástico
en mención hallándose que en cada una de
éstas la resistencia a la ruptura es,
respectivamente,

48
30.1 22.5 28.9 29.8 31.4
32.7 27.5 27.7 28.9 30.4
27.0 24.3 22.8 22.3 33.4
31.2 26.4 29.4 29.1 23.5

◼ Al nivel de significación 0.05 y suponiendo


normalidad, ¿se admite la hipótesis del
químico?

49
50
Prueba de hipótesis para la
varianza

◼ Problema: Se reporta que la desviación


estándar de la resistencia al rompimiento de
ciertos cables producidos por una compañía es
240 lb. Después de que se introdujo un cambio
en el proceso de producción de estos cables, la
resistencia al rompimiento de una muestra de 8
cables mostró una desviación estándar de 300
lb. Investigue la significancia del aumento
aparente en la variación usando un nivel de
significancia de 0.05

51
Pruebas de hipótesis para una
proporción poblacional
◼ Problema. En cierta universidad se estima
que el 25% de los estudiantes van a
bicicleta a la universidad. ¿Esta parece ser
una estimación válida si, en una muestra
aleatoria de 90 estudiantes universitarios, se
encuentra que 28 van en bicicleta a la
universidad? Utilice un nivel de
significancia de 0.05

52
Pruebas de hipótesis para dos
varianzas poblacionales
◼ Ejemplo1: Suponga que el director de
capacitación de una compañía manufacturera
desea comparar dos enfoques de trabajo en
equipo. Cada miembro de un grupo de 16
empleados nuevos se asigna al azar a uno de
los tres métodos. Una vez terminada la
capacitación de los participantes, se evalúa el
tiempo que tardan (en minutos) en ensamblar
el producto. Los resultados se resumen como
sigue:
53
A 8.82 9.26 8.7 8.97 8.64 8.29 9.45 9.42

B 8.21 6.65 7.44 7.95 8.2 7.75 8.84 8.4

◼ a) ¿Existe homogeneidad de varianzas?


Analice los datos considerando un nivel
de significación del 5%.

54
Pruebas de hipótesis para la
diferencia de medias (varianzas
desconocidas e iguales)
◼ Ejemplo2: Clean All es un nuevo limpiador de
uso múltiple cuya demanda se prueba
exhibiéndolo en dos lugares diferentes dentro
de varios supermercados. A continuación se
muestra el número de botellas de 12 onzas que
se vendieron en cada ubicación.
Cerca de las 12 18 10 15
cervezas
Con otros 25 28 30 32
limpiadores
55
◼ a) Analice los datos, formule las
hipótesis adecuadas y contrástelas
considerando un nivel de significación
del 5%.
◼ b)Determine si es posible, ¿Cuál es el
lugar dentro del supermercado más
efectivo para la venta del limpiador
Clean All?

56
Pruebas de hipótesis para la diferencia
de medias (varianzas desconocidas y
diferentes)
◼ Ejemplo: Para investigar la influencia
de la especialización en el salario inicial
de los graduados en Ingeniería, se
entrevistó a dos grupos de estudiantes
recién graduados especializados en
ingeniería y en otras profesiones. Los
resultados fueron como sigue:

57
Ingeniería Otras Si se asume
profesiones poblaciones
normales, ¿se
70000 109000 puede
95000 97000 concluir que
100000 95000 el salario
110000 99000 promedio de
otras
85000 105000
profesiones es
75000 110000 mayor que en
70000 106000 ingeniería?
98000 Use a = 0.05.
58
PRUEBAS DE HIPOTESIS COMPUESTAS
MUESTRA INDEPENDIENTES
VARIANZAS IGUALES

59
PRUEBAS DE HIPOTESIS COMPUESTAS
MUESTRA INDEPENDIENTES
VARIANZAS DIFERENTES

60
PRUEBAS DE HIPOTESIS COMPUESTAS
MUESTRAS DEPENDIENTES

61
62
◼ Ejemplo. Una compañía de taxis trata de decidir
si comprar neumáticos de la marca A o de la B
para su flotilla de taxis. Se lleva a cabo un
experimento utilizando 12 de cada marca. Los
neumáticos se utilizaron hasta que se gastan.
Los resultados son:
Marca A Marca B
x 1 = 36 300 kilómetros x 2 = 38 100 kilómetros
s = 5 000 kilométros
2
1 s 22 = 6 100 kilométros
Calcule un IC de 90% para la diferencia de rendimiento
promedio de ambas marcas de neumáticos. Suponga
poblaciones normales con varianzas distintas.
63

También podría gustarte