Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ea PDF
Ea PDF
Estadística. Nivel B.
UNIDADA III. INFERENCIA ESTADISTICA.
MUESTREO: Su función básica es determinar qué parte de una población debe examinarse con la
finalidad de hacer inferencias (conclusiones o respuestas), sobre dicha población. El error
que se comete debido a que se obtienen conclusiones sobre la población a partir de la
observación de solo una parte de ellas, se denomina error de muestreo.
OBJETIVO DEL MUESTREO: es hacer una inferencia acerca de la población con base en la
información contenida en la muestra.
Parámetro Estimador o
MEDIDA estadístico.
ˆ
Media x
Varianza 2
s2
Desviación Estándar s
Proporción p p̂
En el siguiente ejemplo se demuestra como deducir las distribuciones muestrales de un estadístico para
una población muy pequeña:
Ejemplo: Una población consta de N = 5 números: 3, 6, 9, 12, 15. Si se selecciona una muestra
aleatoria de tamaño n = 3 sin reemplazo, encuentre la distribución muestral para la media de la
muestra.
Solución:
Muestra Valores de x P( x ) C3
5!
10
5
la muestra (3!(5 3)!)
1
2
3
4
5
6
7
8
9
10
x f P( x
)
2) En una dependencia de gobierno se requirió que seis empleados de confianza trabajaran en horas
extras una quincena:
Empleado
Horas extras
Muestra Valores de x P( x )
C2
6!
15
la muestra 6
(2!(6 2)!)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
d) Obtenga la media de las medias x y el error estándar.
x f P( x
)
Horas extras
x
El teorema del límite central (TLC) informa acerca de la distribución de muestreo de medias de
muestras con tamaño n.
pˆ (1 pˆ )
x pˆ
n n
X x X
Z
x
n
Ejemplos:
1) Suponga que se selecciona una muestra aleatoria n = 5 observaciones de una población que está
normalmente distribuida, con media igual a 1 y desviación estándar igual a 0.36.
c) Estime la probabilidad de que la media de la muestra se desvíe de la media de la población μ=1 por más de
0.4.
2) Suponga que un empresario quiere usar la información sobre precios de consumo publicada en un
artículo. Bajo la suposición de que estos precios tiene una distribución normal con media de 75 pesos y
Beatriz Adriana Márquez Elías Departamento de Estadística U. A. A. 6
Fecha: ______________________________________________________
Estadística. Nivel B.
una desviación estándar de 9 pesos, se eligió una muestra aleatoria de 81 precios. Calcule la
probabilidad de que la media de la muestra:
3) Un empresario de botellas y envases de pintura, debe asegurarse de que los frascos de 12 oz. para
una pintura en realidad contengan esa cantidad de pintura. El empresario muestrea al azar 10 frascos
por hora y mide la cantidad de pintura que contiene cada una. Si en los registros se observa que la
¿Cuál es la probabilidad aproximada de que la media muestral x de los diez frascos de prueba sea
menor que 12 oz?
a) ¿Cuál es la probabilidad de que la muestra tenga un peso medio entre 0.75 y 0.90 onzas?
b) Determine la probabilidad de que la muestra tenga media menor que 0.5 onzas.
5) Un auditor toma una muestra de tamaño 63 de una población muy grande de cuentas por cobrar; la
desviación estándar de la población se desconoce. La desviación estándar de la muestra fue de $43. El
valor real de la media de las cuentas por cobrar se cree que es de $266.
b) ¿Cuál es la probabilidad de que en esta muestra se encontrara una media de $260 o más?
n
pˆ (1 pˆ )
= P y una desviación estándar pˆ donde q = 1 - p .
n
2) Cuando el tamaño de la muestra n es grande, la distribución muestral de p se puede aproximar
mediante una distribución normal. La aproximación será adecuada si np > 5 y nq > 5.
p p
Para calcular probabilidades para la proporción muestral p : Z= pq
n
Ejemplos:
1) En una encuesta se preguntó a 500 empresarios acerca de la importancia de los deportes para sus
trabajadores. De los empresarios entrevistados, 55 % (P) estaba de acuerdo en que los géneros son
iguales y deben tener las mismas oportunidades de participar en los deportes.
¿Cuál es la probabilidad de observar una proporción muestral tan grande o mayor que el valor
observado p = 0.60?
2) Cuando se investigó la proporción de personas que compran artículos que llevan premio se encontró
que en una muestra de 89 hogares, la proporción de personas que compraban con premio fue de 0.39.
3) Una de las formas en que la mayoría de los estadounidenses alivia el estrés es premiarse con dulces.
Según un estudio, 46% admite ingerir comidas dulces en exceso cuando está estresado. Suponga que la
cifra 46 % es correcta y que se selecciona una muestra aleatoria de n = 100 personas.
b) ¿cuál es la probabilidad de que p quede dentro de un intervalo entre 0.35 y 0.55?
4) Según una revista el porcentaje promedio de dulces M & M color café en un paquete cualquiera
de M & M es 30 % (sin embargo este porcentaje varía entre los diferentes tipos de dulces M & M
empaquetados). Suponga que se selecciona al azar un paquete de dulces M & M que contiene 55
dulces y determina la proporción de éstos que son cafés.
5) Cerca del 20% de las tiendas de comestibles independientes de cierta ciudad ofrecen cupones-
obsequio. Si se elige una muestra de 50 tiendas, encuentre la probabilidad de que:
a) La proporción de tiendas que ofrecen cupones-obsequio sea mayor que 25%. a) 0.1894
b) La proporción de tiendas que ofrecen cupones-obsequio sea menor que 22%. b) 0.6368
c) La proporción de tiendas que ofrecen cupones-obsequio esté entre el 17% y el 23%. c) 0.4038
Objetivo: Con las muestras obtenidas construirá intervalos de confianza (1 - ) 100% para la media y
la proporción poblacional
La inferencia estadística es el proceso que consiste en utilizar los resultados de una muestra para llegar
a conclusiones acerca de las características de una población.
CONCEPTO DE ESTIMADOR:
Es una regla para calcular un número de la información de la muestra, la cual es usada para estimar un
parámetro particular de la población.
Estimador Insesgado:
Se dice que el estimador ˆ de algún parámetro es imparcial si la distribución de muestreo de ese
estimador ˆ se centra alrededor del parámetro , de tal modo que el promedio de todos los posibles
ˆ sea igual al parámetro , es decir, que:
ˆ
Estimador Eficiente:
Si se nos presentan dos estimadores imparciales para un solo parámetro, el estimador cuya distribución
de muestreo tenga la menor varianza, se dice que es el estimador más eficiente.
TIPOS DE ESTIMACIÓN
Existen dos tipos de estimación, estimaciones puntuales y estimaciones por intervalo, los cuales se
definen a continuación:
Estimador Puntual.
Es un valor único calculado a partir de la información de la muestra, que se emplea para estimar un
parámetro poblacional. La media muestral x , es un estimador puntual de la media poblacional , la
proporción muestral p̂ , es un estimador puntual de la proporción poblacional p . En resumen:
Promedio Poblacional: = x
Varianza Poblacional: 2 = s2
Desviación Estándar Poblacional: = s
Proporción Poblacional: p = p̂
Ejemplos:
1) A 12 personas de 67 que estaban presentes en un banco en una quincena, se les tomó el tiempo
(en min.) que tardaron en ser atendidas. Los resultados fueron los siguientes: 3.01, 3.05, 2.99,
2.99, 3.00, 3.02, 2.98. 2.99, 2.97, 2.97, 3.02, 3.01. Obtener la estimación puntual del tiempo
medio de atención.
3) En Monterrey se desea calcular el promedio de empleados que tienen las empresas cementeras
por lo que se tomó una muestra aleatoria del número de empleados que hay en 21 empresas. La
muestra es: 75; 92; 517; 3200; 428; 117; 92; 50; 714.
a) Estime el número promedio de empleados.
b) Estime la proporción de empresas que tienen más de 100 empleados.
ˆ �Z / 2 ˆ
Donde:
= Es el parámetro poblacional a estimar ( , 2 , , p ).
ˆ = Es el estimador puntual de la muestra ( x , s 2 , s , p̂ ).
ˆ = Es el error estándar del estimador.
El valor de Z / 2 se obtiene de acuerdo al nivel de confianza que se desea en el ejercicio. Los niveles de
confianza más utilizados en la estadística son los de 95% y 99%, pero no por ello no se pueden utilizar
otros. Además, se utilizan otras distribuciones como t de Student, F de Fisher o 2 Chi-cuadrada. A
continuación se mencionan los pasos a seguir para encontrar el valor de Z / 2 .
1. Representar el nivel de confianza (por ejemplo 95%), como fracción y restarlo a la unidad. A este
valor se le llama nivel de significancia o (alfa).
NOTA: La única manera de aumentar la confianza sin incrementar la amplitud del intervalo es
aumentar el tamaño de la muestra n.
: x Z
2 n
1) Encuentre un intervalo de confianza del 90 % para una media poblacional en el caso de los
siguientes valores:
2) Un científico interesado en vigilar los contaminantes químicos en los alimentos y, por tanto, la
acumulación de contaminantes en las dietas humanas, eligió una muestra aleatoria de n = 50 adultos de
sexo masculino. Se encontró que la ingestión diaria promedio de productos lácteos era x = 756 gr. Al
día con = 35 gr. diarios. Construya un intervalo de confianza del 95 % para la ingestión media diaria
de productos lácteos de los hombres.
3) Construya un intervalo de confianza del 99 % para la ingestión media diaria de productos lácteos
para los hombres adultos del ejemplo anterior.
4) En un experimento para determinar el número promedio de latidos del corazón por minuto para
cierta población, bajo las condiciones del experimento, se encontró que el número promedio de latidos
por minuto para 49 sujetos era de 130, con = 10, encontrar un intervalo de confianza del 90 % para
.
1. Una empresa desea información acerca del ingreso medio de los gerentes de la industria del
menudeo. Una muestra aleatoria de 256 gerentes revela una media muestral de $45 420. La
desviación estándar poblacional de esta muestra es de $2 050. A la asociación le gustaría
responder las siguientes preguntas:
2. Una empresa de investigación llevó a cabo una encuesta para determinar la cantidad media
que los fumadores gastan en cigarrillos durante una semana. La empresa encontró que la
distribución de cantidades gastadas por semana tendía a seguir la distribución normal, con
una desviación estándar poblacional de $5. Una muestra de 49 fumadores reveló que X
=$20.
c. Supón que se tomó una muestra de 64 fumadores (en lugar de 49) y que la media muestral
es la misma. ¿Cuál es el estimador del Intervalo de Confianza de 95% para la ?
d. Explica porque este intervalo de confianza es más reducido que el intervalo del inciso c
1) Un artículo publicado, presenta las siguientes 20 mediciones del tiempo en minutos en que se tarda
un gerente en atender a sus clientes.
9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.95 9.93 9.92 9.89
Encuentre un intervalo de confianza del 95 % para el tiempo de atención promedio. Supóngase que el
tiempo de atención sigue una distribución normal.
2) Se eligen 5 clientes que están esperando ser atendidos, considerando su edad media de 35 años con
una desviación muestral s=5. Elabore un intervalo de confianza para la edad.
3) El departamento de personal de una dependencia de gobierno desea estimar los gastos médicos
familiares de sus empleados. Una muestra aleatoria de 10 empleados reveló esos gastos durante el año
anterior 110, 362, 246, 85, 510, 208, 173, 425, 316, 179.
a) Establezca un intervalo de confianza del 90 % para los gastos promedio por familia para todos
los empleados de la dependencia de gobierno.
b) Establezca un intervalo de confianza del 95 % para los gastos promedio por familia para todos
los empleados de la dependencia de gobierno.
2. Al gerente del departamento de servicios al cliente de una compañía gasera local le gustaría
estimar el tiempo promedio que transcurre entre la solicitud de servicio y su conexión. Se
seleccionó una muestra aleatoria de 15 casas de los registros disponibles del año anterior. Los
resultados obtenidos en número de minutos se presentan de la manera siguiente:
a. Establezca una estimación de intervalo de confianza de 95% del tiempo de espera promedio de
población durante el año anterior.
pˆ (1 pˆ )
p : pˆ Z
2 n
Ejemplos:
2) Se diseña una encuesta por muestreo para estimar la proporción de vendedores de droga del estado
de Aguascalientes. Se selecciona una muestra aleatoria de 500 registros de una base de datos, y se
clasifica a 68 como vendedores de droga.
Utilice un intervalo de confianza del 95 % para estimar la proporción de vendedores de droga del
estado de Aguascalientes.
3) Una muestra aleatoria de 985 votantes probables fueron encuestados por teléfono por uno de los
partidos. De los 985 encuestados, 592 indicaron que pensaban votar por el candidato de su partido.
Construya un intervalo de confianza de 90 % para p, la proporción de votantes probables en la
población que piensa votar por el candidato. Con base en esta información, ¿puede concluir que el
candidato ganará la elección?
4) Se condujo una encuesta con el fin de estudiar las prácticas sanitarias dentales y las actitudes de
cierta población urbana de adultos. De 300 adultos entrevistados, 123 dijeron que regularmente se
sometían a una revisión dental dos veces al año. Construya un intervalo de confianza del 95 % para p,
e interprete su resultado.
5) Un encargado del archivo de expedientes de la PROFECO extrajo una muestra aleatoria de 100
expedientes de personas y encontró que en el 8 % de ellos, la carátula tenía, al menos, un detalle de
información que contradecía a la demás información que aparecía en el expediente. Construya un
intervalo de confianza del 99 % para la proporción verdadera de los expedientes que contienen tales
discrepancias.
1. Se llevó a cabo una encuesta de mercado para calcularla proporción de amas de casa que
reconocerían el nombre de la marca de un limpiador a partir de la forma y color del envase. De
las1400 amas de casa de la muestra, 420 identificaron la marca por su nombre.
c. Interpreta.
2. Suponga que en una muestra de 2200 familias con uno o más televisores, 471 ven un programa
particular en un momento dado.
Una preocupación frecuente al diseñar un estudio estadístico consiste en cuántos elementos debe haber
en una muestra. Si una muestra es demasiado grande, se gasta mucho dinero en recabar datos.
Asimismo, si la muestra es muy pequeña, las conclusiones resultarán inciertas.
Definición: Si x se utiliza como estimación de , entonces puede tenerse una confianza del
100(1 - ) por ciento de que el error x no será mayor que una cantidad específica E cuando el
tamaño de la muestra sea
2
z
2
n=
E
dónde:
n es el tamaño de la muestra.
Nos indica la probabilidad de error correspondiente al nivel de confianza deseado.
σ = es la desviación estándar de la población.
E es el error máximo admisible.
2) Para el ejemplo anterior, que tamaño de muestra debe emplearse, si el error en la estimación de la
duración promedio es de 6 horas.
3) Se sabe que el contenido de fructuosa de cierto alimento sigue una distribución normal, cuya
varianza es de 0.25. se desea estimar el valor de la media poblacional mediante el valor de la media de
una muestra, admitiéndose un error máximo de estimación de 0.2 con una confianza del 95 % ¿cuál ha
de ser el tamaño de la muestra?
4) Un estudiante desea determinar la cantidad media que ganan al mes los egresados de su carrera. El
error máximo al calcular la media debe ser $100, con un nivel de confianza de 80%. El estudiante
encontró un informe del Departamento del Trabajo en el que la desviación estándar es de $1 000.
b) ¿Cuál es el tamaño de la muestra que se requiere si se quiere tener un nivel de confianza de 99%?
En el tema anterior se describió el modo en que se puede seleccionar una muestra al azar, y a partir de
ella, calcular el valor de un parámetro poblacional. En otras palabras, se calculó un parámetro
poblacional a partir de un valor estadístico muestral (estimación puntual), además se desarrolló una
gama de valores, llamada intervalo de confianza, dentro del cual se esperaba localizar el valor
poblacional.
Ahora, en lugar de desarrollar una variedad de valores dentro de la cual se espera que ocurra el
parámetro poblacional, se llevará a cabo una PRUEBA DE HIPÓTESIS en cuanto a una declaración
referente a un parámetro de la población.
HIPÓTESIS: Una hipótesis es un enunciado acerca de una población elaborado con el propósito de
ponerla a prueba.
Por lo tanto, en el análisis estadístico se expone un enunciado, es decir, una hipótesis, y después se
realizan pruebas para verificar lo que se dijo, o para determinar si es falso.
Se le denomina hipótesis nula, es designada mediante H0, donde la letra H significa hipótesis y el
subíndice cero indica "no hay diferencia".
Es importante recordar que sin que importe como se planteo el problema, la hipótesis nula siempre
incluirá el signo igual (=), ya sea solo, o acompañado de los signos menor o mayor (Este signo nunca
aparecerá en la hipótesis alternativa porque la hipótesis nula es el enunciado a probar. Se recurrirá a la
hipótesis alternativa sólo si se prueba que la hipótesis nula se puede rechazar.
En general, la estructura para el planteamiento de una hipótesis estadística puede asumir una de las tres
formas siguientes:
Re
gió
n d
e Regió
n d
e
R
echa
zo n
o r
e c
hazo
R
egió
n d
e R
egió
nde Re
gió
n d
e R
egió
nde
Recha
zo Reg
ió
n d
e RecR
he
a
zg
oió
n d
e n
orec
hazo Recha
zo
R
egió
n d
e r
e c
haz
o
n
o R
ech
azo
rech
azo
/2
/2
-zT
AB 0 z -z
TA
B T
AB
TA
B
P
rob
.0.0
25 P
rob
abilid
ad0
.95 P
rob
.0.0
25
Prueba Bilateral Prueba unilateral Prueba unilateral
a la izquierda a la derecha
H0: = 0 H0: 0 H0: 0
H1: 0 H1: < 0 H1: > 0
donde:
ERROR TIPO I. También llamado Error Alfa. Es la probabilidad de rechazar la hipótesis nula H 0,
cuando en realidad es verdadera y se representa con .
ERROR TIPO II. También llamado Error Beta. Es la probabilidad de aceptar la hipótesis nula H 0,
cuando en realidad es falsa y se representa con .
En la siguiente tabla se resumen las decisiones que podría tomar el investigador y las consecuencias
posibles:
Decisión
del Investigador
Hipótesis Nula Se Se
H0 acepta rechaza
Es Decisión Error
Verdadera Correcta Tipo I
Es Error Decisión
falsa Tipo II correcta
Debe tomarse una decisión de usar el nivel 0.05 (nivel de 5%), el nivel 0.01, el 0.10, o cualquier otro
nivel entre 0 y 1. Tradicionalmente se selecciona el nivel de 0.05. De hecho, si no se menciona un nivel
de significancia en el problema, por default se utilizará el valor 0.05.
REGIÓN DE RECHAZO
La región de rechazo en una gráfica, define la ubicación de todos los valores que son demasiado
grandes o demasiado pequeños, por lo que es muy remota la probabilidad de que ocurran según una
hipótesis verdadera.
Valor P o Valor Pro o P Value. Si el citado valor P es menor que dicho nivel de significancia, la
hipótesis nula se rechaza. Si tal valor es mayor que el nivel en cuestión, la hipótesis nula no se rechaza.
Por lo tanto, el valor P es la probabilidad de observar un valor muestral tan extremo, o más, que el
valor observado, dado que la hipótesis nula sea verdadera.
EL ESTADISTICO DE PRUEBA
Es el valor obtenido a partir de la información muestral, que se utiliza para determinar si se rechaza la
hipótesis nula.
x 0
Z calc
n
x 0
Z calc
s n
pˆ p0
Z calc
p0 (1 p0 )
n
x1 - x 2
zCALC =
n1 + n2
pˆ 1 pˆ 2
Z calc
pˆ 1 (1 pˆ 1 ) pˆ 2 (1 pˆ 2 )
n1 n2
1) Una empresa fabrica muebles para hoteles y restaurantes. La producción semanal de “x” mueble se
distribuye normalmente, con una media de 200 ( ) y una desviación estándar de 16. ¿El número
medio de muebles producidos en una de sus plantas es diferente de 200? Utilice un nivel de
significancia de 0.01, donde el número medio de muebles producidos en el último año es de 203.5 (50
semanas).
2) Una cadena de tiendas de descuento, expide su propia tarjeta de crédito. El gerente desea averiguar
si el saldo insoluto medio mensual es mayor que $400. El nivel de significancia se fija en 0.05. Una
revisión aleatoria de 172 saldos insolutos reveló que la media muestral es 407 y que la desviación
estándar de 38. ¿Debería concluir el funcionario de crédito que la media es mayor que 400, o bien es
razonable suponer que la diferencia de 7 se debe al azar?
7) La atención a personas que presentan una queja en la PROFECO está programada para
realizarse en un tiempo promedio de 30 minutos. La población tiene una desviación estándar igual a
4 minutos. Establezca la regla de decisión para una muestra de 64 observaciones probadas a un
nivel de significancia de 0.01. Establezca la conclusión apropiada si la media muestral es de 35
minutos. Calcule el valor p.
Solución: z = 10, valor p = ≈ 0.0000
8) En una encuesta de problemas sociales de cierta comunidad, se entrevistaron 150 personas. Uno de
los detalles de la información obtenida fue el número de quejas que cada persona había tenido que
pedir durante el año pasado. El número promedio para las 150 personas fue de 5.8 con una desviación
estándar de 3.1. El investigador desea saber si estos datos proporcionan evidencia suficiente como para
indicar que la media de la población es mayor que 5.
1) Un artículo publicado, presenta las siguientes 20 mediciones del tiempo en minutos en que se tarda
una agencia de viajes en atender a sus clientes.
9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.95 9.93 9.92 9.89
2) En una oficina, se eligen 5 clientes que están esperando ser atendidos, considerando su edad media
de 35 años con una desviación muestral s=5. El investigador desea saber si estos datos proporcionan
evidencia suficiente como para indicar que la edad media de los clientes es mayor que 35. A un nivel
de significancia de 0.01.
3) El departamento de personal de una dependencia de gobierno desea estimar los gastos médicos
familiares de sus empleados. Una muestra aleatoria de 10 empleados reveló esos gastos durante el año
anterior 110, 362, 246, 85, 510, 208, 173, 425, 316, 179.
El investigador desea saber si estos datos proporcionan evidencia suficiente como para indicar que los
gastos promedio por familia de la población es menor que 295.
Ejemplos:
1) Un artículo declaró que casi 45 % de la población sale de vacaciones en diciembre. Para probar la
afirmación del periódico, se eligió una muestra aleatoria de 80 personas y se encontró que 32
vacacionaban en diciembre. ¿Hay suficiente evidencia para disputar la afirmación del periódico
respecto a la proporción de personas que vacacionan en diciembre? Llegar a una conclusión mediante
el método del valor crítico con = 0.01 y con el método del valor p.
2) En los registros de una procesadora se encuentra la proporción de días que la mantequilla cumple
con las normas de calidad. Se eligen aleatoriamente 50 días y se encuentra que en 32 de los 50 días
estudiados, la mantequilla producida cumplió con las normas de calidad. Los vendedores de la
maquinaria que realiza la función para la elaboración de la mantequilla garantizan que el 66 % de los
días se cumplirán las normas de calidad. ¿Los resultados de la procesadora están significativamente por
debajo de la garantía? = 0.05, ¿cuál es el valor de p?
3) El director de personal de una compañía de seguros grande está interesado en reducir la tasa de
rotación del personal de apoyo en el procesamiento de datos durante el primer ano de contratación. Los
registros históricos indican que 25% de todos los nuevos ingresos ya no están contratados al final del
año. Se implantaron nuevos programas de capacitación para una muestra e 150 nuevos ingresos.
Después de un año, 29 de ellos ya no están en la compañía.
4) Sin tener en cuenta la edad, cerca de 20 % de adultos participan en actividades deportivas por lo
menos dos veces al año. En un estudio local de n = 100 adultos mayores de 40 años, un total de 15
personas indicó que participaban por lo menos dos veces al año en una actividad. ¿Estos datos indican
que la tasa de participación para los adultos mayores de 40 años de edad es significativamente menor
que la cifra de 20 %?
5) Según el Centro Nacional de Estadísticas para el turismo, alrededor de 16% de los trabajadores de
hoteles sin especialización son hombres: un investigador seleccionó al azar de una base de datos de
todo el estado a 1000 trabajadores sin especialización en México y encontró que 142 eran hombres.
¿Esta muestra proporciona evidencia suficiente de que el porcentaje de trabajadores sin especialización
hombres en México es diferente del porcentaje nacional?
Solución: z = -1.55, valor p = 0.1212.
Se desea probar H0 : p1 = p2
H1 : p1 p2
X1 X2
Las proporciones poblacionales P1
y P2 tienen distribuciones aproximadamente
n1 n2
normales. Si la hipótesis nula H0: p1 = p2 es verdadera, el estadístico de prueba para este es,
( p1 p 2 )
z0
p 1 (1 p 1 ) p 2 (1 p 2 )
n1 n2
z z
sea z0 el valor calculado del estadístico de prueba. Entonces, si z 0 > o z0 < - se rechaza
2 2
la hipótesis nula.
Ejemplos:
1) En los archivos de un hospital se observa que 52 hombres de una muestra de 1000 hombres contra
23 mujeres en una muestra de 1000 mujeres fueron admitidos por enfermedad del corazón.
¿Representan estos datos evidencia suficiente para indicar una mayor proporción de enfermedad del
corazón entre los hombres admitidos al hospital, 0.05 .
2) Se evalúan dos tipos diferentes de soluciones para pulir, para su posible uso en una operación de
pulido en la fabricación de lentes intraoculares utilizados en el ojo humano después de una cirugía de
Beatriz Adriana Márquez Elías Departamento de Estadística U. A. A. 43
Fecha: ______________________________________________________
Estadística. Nivel B.
cataratas. Se pulen 300 lentes con la primera solución y, de éstos, 253 no presentaron defectos
inducidos por el pulido. Después se pulen otros 300 lentes con la segunda solución, de los cuales 196
resultan satisfactorios. ¿Existe alguna razón para creer que las dos soluciones para pulir son diferentes?
Utilícese 0.01 .
4) En una muestra aleatoria de 500 adultos residentes en cierto fraccionamiento, se encuentra que 385
están a favor de aumentar el límite de velocidad en la avenida principal del fraccionamiento a 70 Km/h,
mientras que en otra muestra de 400 adultos residentes en el otro fraccionamiento vecino se encuentra
que 267 están a favor del aumento del límite de velocidad. ¿Estos datos indican que existe una
diferencia en el apoyo al aumento del límite de velocidad entre los residentes de ambos
fraccionamientos? Utilice 0.05 para llegar a una conclusión. Encuentre el valor de P.
5) Una compañía de restaurantes tiene dos plantas, una en Monterrey y otra en el D. F. En la primera
se estudia a 150 trabajadores y se encuentra que 102 de ellos no han incurrido en faltas de asistencia
durante un año. En el D. F., se encuestaron a 150 personas y se supo que 95 trabajadores no tuvieron
faltas en el año ¿con estos datos podemos creer que los regios son más asiduos al trabajo que los
capitalinos? = 0.05.