Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3.3 ESTIMACIÓN 80
3.3.1.3 Aplicaciones 82
3.4 PRUEBA DE HIPÓTESIS (PRIMERA PARTE) 85
3.4.1 HIPÓTESIS ESTADÍSTICAS 85
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPÓTESIS 86
3.4.3 CRITERIOS DE DECISIÓN 86
3.4.4 CONTRASTES UNILATERALES Y BILATERALES 86
3.4.5 METODOLOGÍA PARA CONTRASTAR UNA HIPÓTESIS 87
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRARÁ UN RESUMEN 87
CON LOS PRINCIPALES CONTRASTES)
76
3.1 INTRODUCCIÓN
A menudo necesitamos estudiar las propiedades de una determinada población, pero nos encontramos con el
inconveniente de que ésta es demasiado numerosa como para analizar a todos los individuos que la componen. Por
tal motivo, recurrimos a extraer una muestra de la misma y a utilizar la información obtenida para hacer inferencias
sobre toda la población. La Inferencia estadística persigue entonces la obtención de conclusiones sobre toda una
población, basándose en la observación de una muestra obtenida de ella. Estas estimaciones serán válidas sólo si la
muestra tomada es “representativa” de la población. Así, el muestreo es una técnica que utilizamos para asegurarnos
que las muestras seleccionadas de la población sean realmente representativas. El muestreo puede hacerse con o sin
reposición, y la población de partida puede ser infinita o finita. Una población finita en la que se efectúa muestreo con
reposición puede considerarse infinita teóricamente. También, para efectos prácticos, una población muy grande puede
considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo
con reposición.
Caso 2. Si tenemos una población donde la variable bajo estudio X NO tiene una distribución normal, pero el
tamaño de la muestra n es mayor o igual que 30 (n>30), entonces aplicando el llamado Teorema del límite central la
distribución muestral de la media se aproxima también a la distribución normal anterior.
2 (X μ)
X Nμ, σn Z σ N(0,1)
n
Caso 3. El resultado del Caso 2 sigue siendo válido en aquellos casos en que no se conozca la varianza poblacional
σ2 y n> 30. En tales casos es posible utilizar la varianza muestral S 2, en reemplazo de la varianza poblacional σ2. El
resultado quedaría como:
2 (X μ)
X Nμ, Sn Z N(0,1)
S
n
77
Caso 4. Si en el Caso 3, el tamaño de la muestra es menor a 30 (n < 30), entonces la estadística,
(X μ)
t tiene una distribución t con (n-1) grados de libertad.
S
n
Comentario: Los resultados anteriores son aplicables también a la estadística suma, es decir, de acuerdo al teorema
n
del límite central la distribución de X i es aproximadamente normal, con media n y varianza n2, sin importar la
i 1
distribución de la población.
Ejemplo 1. Suponga que las notas obtenidas en la primera prueba parcial de la asignatura siguen una distribución
normal con una media µ igual a 5,8 y una desviación estándar, σ, igual a 2,4. Encuentre la probabilidad de que la media
de una muestra tomada al azar de 16 estudiantes esté comprendida entre 5 y 7.
Solución: Como la variable NOTAS tiene una distribución N(5,8; 2,4), con n=16, la distribución muestral de la media
se distribuye N(5,8; 0,6). Si x es la media de la muestra hemos de calcular la probabilidad
(p̂ p)
p̂ N p, pq
n Z N(0,1)
pq
n
Ejemplo 2. Si tiramos una moneda correcta 100 veces, ¿cuál es la probabilidad de que obtengamos más de 55 caras?.
Solución: En una moneda correcta la proporción de caras es 0,5, con lo que p=0,5; q=0,5 y n=100. Entonces la
proporción muestral tiene una distribución muestral N(0,5; 0,05 2). Si llamamos p̂ a la proporción en la muestra hemos
n
2
X i X tiene una distribución Chi-cuadrado con n-1 grados de libertad.
i 1 (n 1)S2
σ2 σ2
78
Supongamos ahora que estamos estudiando el comportamiento de una variable en dos poblaciones independientes.
Supongamos además que en ambas poblaciones dicha variable tiene una distribución normal con parámetros distintos
σ 12 σ 22 (X X 2 ) ( 1 2 )
(X1 - X 2 ) N( μ 1 - μ 2 , ) Z 1 N (0,1)
n1 n 2 12 22
n1 n2
Caso 2. Si las distribuciones de la variable a nivel poblacional NO son normales y las varianzas son conocidas,
entonces si los tamaños muestrales son ambos mayores o iguales a 30 (n1 ≥ 30 y n2 ≥ 30), la diferencia de las medias
muestrales se aproximan a una distribución normal.
n 1 , n2 σ 12 σ 22 (X X 2 ) ( 1 2 ) n1 , n2
(X1 - X 2 ) N( μ 1 - μ 2 , ) Z 1 N (0,1)
n1 n 2 11 22
n1 n2
Caso 3. Si las varianzas poblacionales son desconocidas y los tamaños muestrales son ambos mayores o iguales a
30 (n1 ≥ 30 y n2 ≥ 30), entonces el resultado anterior sigue siendo válido, es decir, la diferencia de las medias
muestrales se aproximan a una distribución normal, donde las varianzas poblacionales se reemplazan por las
varianzas muestrales.
n1 , n2 S12 S 22 (X X 2 ) ( 1 2 ) n1 , n2
(X 1 - X 2 ) N( μ 1 - μ 2 , ) Z 1 N (0,1)
n1 n 2 S 11 S 22
n1 n 2
Caso 4. Si las varianzas poblacionales son desconocidas, pero aproximadamente iguales, y los tamaños muestrales
son pequeños (n1 < 30 y/o n2 < 30), entonces la estadística,
79
Si
D y SD son la media y la desviación estándar muestrales de la diferencia de n pares aleatorios de mediciones
D - μD
t
SD
normalmente distribuidas, entonces la estadística n tiene una distribución t con n-1 grados de libertad.
1 , n 2
p1 q 1 p 2 q 2 ( pˆ pˆ 2 ) ( p1 p 2 ) n1 ,n2
(p̂1 - p̂ 2 ) n N( p1 - p 2 , ) Z 1 N (0,1)
n1 n2 p1 q1 p 2 q 2
n1 n2
3.3 ESTIMACIÓN
3.3.1 Estimación de parámetros
Una variable aleatoria se caracteriza o describe mediante su distribución de probabilidad, la cual depende de
parámetros, que usualmente son desconocidos, por ello es necesario disponer de procedimientos para estimarlos
a partir de datos muestrales.
80
n
x
n
Media X i i
̂ X i 1
x i 1
n n
n n
1 1
2
2
Varianza ̂ 2 S 2 ( X i X )2 s2 xi x
n 1 i 1 n 1 i 1
X número éxitos x
Proporción p ˆ
p pˆ
n número pruebas n
Los estimadores puntuales adecuados requieren cierto número de propiedades importantes, de las cuales dos de las
más importantes son las siguientes: (VER LIBRO: CANAVOS)
1. El estimador puntual debe carecer de sesgo; es decir, el valor esperado del estimador puntual debe ser igual al
parámetro estimado.
2. El estimador debe tener varianza mínima. Cualquier estimador puntual es una variable aleatoria. por tanto, un
estimador puntual de varianza mínima tendrá una menor varianza que cualquier otro estimador puntual del
parámetro.
Ejemplo: Sea X1, X2, X3 y X4 una m.a (4) de una población cuya distribución es normal con media y
2. Considérense las estadísticas T 1= (X1 + X2 + X3 + X4)/4 y T2= (X1+2X2+X3)/4
a) ¿Cuáles son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), ¿Cuál tiene varianza mínima?
Actividad
Sea X1, X2, X3 y X4 una m.a(4) de una población cuya distribución es exponencial con parámetro . Considérense
las estadísticas T1= (1/6)(X1 + X2) + (1/3)(X3 + X4), T2= (X1+ 2X2 + 3X3+4X4)/4, T3= (X1 + X2 + X3 + X4)/4
a) ¿Cuáles son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), ¿Cuál tiene varianza mínima?
Para determinar estimadores puntuales existen métodos de estimación, dentro de los cuales se destacan: El Método
de los Momentos; El Método de Máxima Verosimilitud y el Método de Mínimos Cuadrado Ordinarios (Unidad
IV).
Un estimador por intervalo es un intervalo aleatorio que incluye el valor real del parámetro, con cierto nivel de
probabilidad. Estos intervalos aleatorios se denominan normalmente intervalos de confianza. Una estimación por
intervalo de un parámetro es el intervalo limitado por dos estadísticas, de manera que incluye el verdadero valor del
parámetro con cierta probabilidad.
Por ejemplo para elaborar un estimador por intervalo para un parámetro , es necesario encontrar dos estadísticas L
y U, tales que: P{L U} = 1- . El intervalo resultante: L U se denomina intervalo bilateral al 100(1- )% de
confianza para el parámetro desconocido , donde: L es el límite inferior de confianza; U es el límite superior de
confianza; 1- es el coeficiente o nivel de confianza y U - (ó - L) se denomina exactitud del intervalo.
Si se determinan un gran número de tales intervalos, cada uno a partir de una muestra aleatoria, entonces el (1- ) de
estos intervalos contendrán el verdadero valor del parámetro .
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parámetro. Se
indica por 1- y habitualmente se da en porcentaje 100(1-)%. Hablamos de nivel de confianza y no de probabilidad
ya que una vez extraída la muestra, el intervalo de confianza contendrá al verdadero valor del parámetro o no, lo que
81
sabemos es que si repitiésemos el proceso con muchas muestras podríamos afirmar que el 100(1-)% de los
intervalos así construidos contendría al verdadero valor del parámetro.
Un intervalo unilateral superior al 100(1- )% de confianza para estaría dado por, U donde U, el límite superior
de confianza, se escoge de manera que P{ U } = 1- .
Para construir un intervalo de confianza para un parámetro determinado se requiere encontrar una estadística que
cumpla dos condiciones:
1. Que involucre en su formulación al parámetro que se desea estimar.
2. Que dicha estadística tenga una distribución de probabilidades conocida.
Una estadística que cumpla con estas condiciones recibe el nombre de estadística pivotal.
3.3.1.3 Aplicaciones (en anexo 1 encontrará un resumen con estadísticas pivotales)
Estudiaremos ahora cómo construir intervalos de confianza para la media, la varianza y la proporción en una población.
Para el caso de dos poblaciones estudiaremos cómo construir intervalos de confianza para la diferencia de medias, el
cociente de varianzas y la diferencia de proporciones. En cada caso se trabaja con las estadísticas y distribuciones
muestrales ya estudiadas anteriormente.
Si x es la media de una muestra aleatoria de tamaño n proveniente de una población cuya variable de interés tiene
una distribución normal con varianza conocida 2, entonces un intervalo al 100(1 - )% de confianza para , la media
poblacional de la variable está dado por:
Z
(1
) n Ver Figura 1
2
x
μ
XZ XZ
) n
(1 ) n (1
2
2
e: error de estimación
Z
(1
) n
Figura 1. Error al estimar por x 2
82
Teorema: Si se utiliza x como una estimación de , se puede tener una confianza de 100(1 - )% de que el error será
menor que una cantidad especificada cuando el tamaño de la muestra es:
z )
2
(1
n
2
e
C a s o 2 . I n t e r va l o d e c o n f i a n z a p a r a ; c o n 2 d e s c o n o c i d a ( m u e s t r a s g r a n d e s )
Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n > 30, tomada de una población
cuya variable de interés tiene una distribución normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable, está dado por:
S S
x z
xz
(1
2
) n (1 )
2
n donde z (1
2)
es el percentil (1-/2) de la distribución normal estándar.
C a so 3. In t er v al o d e c on fi a nz a p a r a ; c o n 2 d es c on oc id a (m u e s t r a s p equ e ñ as)
Si x y s son la media y la desviación estándar de una muestra aleatoria de tamaño n < 30, tomada de una población
cuya variable de interés tiene una distribución normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable está dado por:
S S
x t )
x t donde t(1-/2) es el percentil (1-/2) de la distribución t con v = n – 1
(1 (1 )
2 n 2 n grados de libertad.
Si S2 es la varianza muestral de una muestra aleatoria de tamaño n, tomada de una población cuya variable de interés
tiene una distribución normal con varianza desconocida 2, un intervalo al 100(1 - )% de confianza para 2, la varianza
poblacional, está dado por:
donde
2) 2
y (1 2 ) son los percentiles /2 y (1-/2), respectivamente
2 2 2
(n -1) S (n -1)2 S
2
de la distribución Chi-cuadrado con (n – 1) grados de libertad.
2
)
(1
2 2
σ2 σ2 σ2 σ2
(x - x ) z α 1 2 μ - μ (x - x ) z 1 2 donde z (1
2)
es el percentil (1-/2) de la
1 2 (1
2
) n n 1 2 1 2 (1 α )
2 n n
1 2 1 2 distribución normal estándar.
Comentario:
83
El grado de confianza es exacto cuando las muestra provienen de poblaciones donde la variable de interés tiene una
distribución normal. Para poblaciones donde la variable de interés no tiene una distribución normal se obtiene un
intervalo de confianza aproximado que es muy bueno cuando tanto n 1 como n2 son > 30.
Como antes, si 12 y 22 son desconocidos y los tamaños muestrales son suficientemente grandes, se puede
reemplazar, en la ecuación precedente, 12 por S12 y 22 por S 22 , sin afectar de manera significativa el intervalo de
confianza.
Caso 2. Intervalo de confianza para 1 - 2; con σ 12 = σ 22 pero desconocidas (para muestras pequeñas)
Si x1 y x2 son las medias de muestras aleatorias pequeñas independientes de tamaños n1 y n2, respectivamente,
provenientes de poblaciones, donde la variable de interés tiene una distribución normal, con varianzas 12 y 22
desconocidas pero aproximadamente iguales, entonces un intervalo al 100(1 - )% de confianza para 1 2 , la
diferencia de medias poblacionales, está dado por:
1 1 1 1
(x - x ) t (1 α ; v)Sp μ -μ (x - x ) t (1 α ; v) Sp
1 2 2 n n 1 2 1 2 2 n n
1 2 1 2
donde Sp es la estimación conjunta de la desviación estándar de la población, y donde t(1-/2) es el percentil (1-/2) de
la distribución t con v = n1 + n2 – 2 grados de libertad.
Caso 3. Intervalo de confianza para 1 - 2; con σ 12 σ 22 y desconocidas (para muestras pequeñas)
Si x1 , S12 y x2 , S 22 , son las medias y las varianzas de muestras aleatorias pequeñas independientes de tamaños n1
y n2 respectivamente, provenientes de poblaciones donde la variable de interés tiene una distribución normal, con
12 y 22 desconocidas y desiguales, respectivamente, entonces un intervalo al 100(1 - )% de confianza
varianzas
S2 S2 S2 S2
(x - x ) t (1α ;v) 1 2 μ -μ (x - x ) t 1 2
1 2 2
n n 1 2 1 2 (1 α ; v )
2 n n
1 2 1 2
donde t(1-/2) es el percentil (1-/2) de la distribución t con grados de libertad, y queda dado por la siguiente expresión:
2
S12 S 22
12
n n2
2
S1 2
S 22
n1 n2
n1 1 n2 1
84
Si d y Sd son la media y la desviación estándar de las diferencias de n pares aleatorios de mediciones, entonces
un intervalo al 100(1 - )% de confianza para D 1 2 , la diferencia de medias poblacionales está dado por:
Si p1 y p2 son las proporciones de éxitos en muestras aleatorias de tamaños n1 y n2, respectivamente, y además
qˆ1 1 pˆ 1 y qˆ 2 1 pˆ 2 , entonces un intervalo al 100(1 - )% de confianza para p1 – p2, está dado por:
p̂ q̂ p̂ q̂ p̂ q̂ p̂ q̂
(p̂ - p̂ ) z 1 1 2 2 P - P (p̂ - p̂ ) z 1 1 2 2 donde z (1 es el percentil (1-/2) de
(1 )
1 2 (1 ) 1 2 1 2 2)
2 2
n n n n la distribución normal estándar.
1 2 1 2
3.- Estimación de la razón de dos varianzas
22
Intervalo de confianza para 12
Si S12 y S 22 son las varianzas de muestras aleatorias independientes de tamaños n1 y n2, respectivamente, tomadas
de poblaciones cuya variable de interés tiene una distribución normal, entonces un intervalo al 100(1 - )% de confianza
85
El contraste de hipótesis no establece la verdad de la hipótesis, sino un criterio que nos permite decidir si una hipótesis
se acepta o se rechaza, o el determinar si las muestras observadas difieren significativamente de los resultados
esperados. En este proceso podemos incurrir en dos tipos de errores según sea la situación real y la decisión que
tomemos.
Si rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la aceptamos
debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una cuestión
sencilla, un tipo suele ser más grave que otro y los intentos de disminuir uno suelen producir el aumento del otro. La
única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra.
Ho verdadera Ho falsa
Decisión incorrecta
Decisión correcta
DECISIÓN: Mantener Ho
Error de tipo II
Decisión incorrecta
Decisión correcta
DECISIÓN: Rechazar Ho
Error de tipo I
El conjunto donde toma valores la estadística de prueba se divide en dos subconjuntos, la región de rechazo o región
crítica, R, que contiene los resultados menos favorables de H0, y la región de aceptación, A, que contiene los
resultados más favorables a H0. Luego si el valor calculado de la estadística de prueba pertenece a R, rechazamos H 0,
en cambio si pertenece a A, aceptamos H0. El valor (o los valores) de la estadística de prueba que separa (o separan)
a la región R de la región A se llama valor crítico (o valores críticos).
A una prueba de cualquier hipótesis estadística, en la que la hipótesis alternativa es unilateral, tal como:
La región crítica de la hipótesis alternativa H1: > 0 se ubica por completo en la cola derecha de la distribución,
mientras que la región crítica de la hipótesis alternativa H1: < 0 se ubica por completo en la cola izquierda. En cierto
sentido el símbolo de desigualdad señala la dirección en la cual se ubica la región crítica.
A una prueba de cualquier hipótesis estadística, en la que la hipótesis alternativa es bilateral, tal como:
86
H0: = 0 versus H1: 0
Se le denomina prueba de dos colas o bilateral, ya que la región crítica está dividida en dos partes igualmente
probables ubicadas en cada cola de la distribución de la estadística de prueba.
3.4.5 METODOLOGÍA PARA CONTRASTAR UNA HIPÓTESIS
Se trata pues, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o rechazar
una hipótesis previamente emitida, sobre el valor de un parámetro desconocido de la población. El método que
seguiremos es el siguiente:
1. Formulación de las hipótesis.
2. Elegir un nivel de significación
3. Escoger la estadística de prueba.
4. Establecer el criterio en que se basará la decisión. Construir la zona de aceptación, intervalo fuera del cual
sólo se encuentran el 100% de los casos más raros. A la zona de rechazo la llamaremos región crítica, y su área
es el nivel de significación.
5. Verificar la hipótesis extrayendo una muestra cuyo tamaño se ha decidido en el paso anterior y obteniendo de ella
el correspondiente estadístico (media o proporción en nuestro caso).
6. Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptación se acepta la hipótesis y si no se
rechaza.
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRARÁ UN RESUMEN CON LOS PRINCIPALES CONTRASTES)
Estudiaremos ahora hipótesis sobre la media, la varianza y sobre la proporción en una población. Para el caso de dos
poblaciones estudiaremos la comparación de medias, comparación de varianzas y comparación de proporciones. En
cada caso se trabaja con un contraste bilateral y otro unilateral. Los contrastes unilaterales son de distinta dirección en
cada ejemplo, pero el método a seguir es análogo para ambos.
Queremos contrastar una hipótesis acerca de la proporción en una población a partir de los datos extraídos de una
muestra. Procederemos como en el apartado anterior:
B.1 Contraste bilateral
Ejemplo 4. Se realizan 200 lanzamientos de una moneda y salen 120 caras, ¿podemos aceptar que la moneda no
está trucada con un nivel de significación del 5%?. ¿Aceptaríamos que la moneda no está trucada con =0,01?
Ejemplo 5. Un partido político afirma que obtendrá el 60% de los votos en las próximas elecciones. Encuestados 1000
votantes afirman su intención de votar a dicho partido 540. ¿Se puede aceptar la hipótesis del partido con un nivel de
significación del 5%?
87
Ejemplo 6.Una máquina fabrica piezas de precisión y se garantiza que la proporción de piezas correctas producidas
es al menos del 97%. Un cliente recibe un lote de 200 piezas y aparecen 8 piezas defectuosas; a un nivel de confianza
del 95% ¿rechazará el lote por no cumplir las condiciones de la garantía?
Si la muestra hubiese sido de 300 piezas con 285 correctas, ¿se aceptaría el lote al 10% de significación?
C. Contraste de hipótesis para la varianza de una población
Ejemplo 7. El peso de 12 latas de cerezas, en onzas, es:
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La desviación estándar especificada es de 1/2 onza. ¿Se cumple esta especificación? Use el nivel de significación del
1% y una prueba bilateral. (Nota: 1 onza = 28,35 gramos)
desviación estándar muestral de s1 = $1.800. Para una muestra de n2 = 40 hogares de la segunda comunidad,
x2 =
$34.600 s2 = $2.400. Probar la hipótesis nula en el nivel de significación del 5%.
88
REFORZAMIENTO ESTIMACIÓN
1. Se sabe que la duración, en horas, de una ampolleta utilizada a la luz testigo, tiene una distribución
aproximadamente normal, con una desviación estándar de = 25 horas. Se toma una muestra aleatoria de 20
ampolletas, la cual arroja una duración promedio de 1.014 horas.
a) Construya un intervalo de confianza bilateral del 95% para la duración promedio.
b) Estudie el error de estimación para niveles de confianza del 95% y del 99%. ¿Qué relación existe entre longitud
del intervalo, precisión de la estimación y nivel de confianza?.
c) Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea
menor que 5 horas. ¿Qué tamaño de muestra debe utilizarse?
d) Supóngase que se desea el ancho total del intervalo de confianza bilateral sea de seis horas, con una confianza
del 95%. ¿Qué tamaño de muestra debe emplearse para este fin?
2. Una máquina produce piezas metálicas de forma cilíndrica para ser utilizadas en la fabricación de discos duros
para computadoras. Se toma una muestra de las piezas y los diámetros resultan de: 1,01, 0,97, 1,03, 1,04, 0,99,
1,01, y 1,03 centímetros, respectivamente:
a) Obtenga un intervalo de confianza de 99% para el diámetro medio de las piezas producidas por la máquina,
suponiendo una distribución aproximadamente normal.
b) Estudie el error de estimación para niveles de confianza del 95%. ¿Qué relación existe entre longitud del
intervalo, precisión de la estimación y nivel de confianza?
c) Supóngase que se desea que el error en la estimación del diámetro medio de las piezas sea menor que 0.05
centímetros, con una confianza del 95%. ¿Cuál debería ser en este caso el tamaño de la muestra?.
3. Una muestra aleatoria de tamaño n1 = 16 que se tomó de una población con una desviación estándar 1 = 5 tiene
una media x 1 = 80. Una segunda muestra aleatoria de tamaño n2 = 25 tomada de una población normal diferente
con una desviación estándar 2 = 3, tiene media x 2 = 75. Encuentre un intervalo de confianza del 95% para 1
- 2 . De acuerdo con el intervalo hallado. ¿hay evidencia de que las dos medias son iguales?
4. Una compañía tiene dos departamentos que producen el mismo producto. Se tiene la sensación de que las
producciones por hora son diferentes en los dos departamentos. Al tomar una muestra aleatoria de horas de
producción en cada departamento se obtuvieron los datos siguientes:
Departamento I Departamento II
Tamaño de muestra n1 = 64 n2 = 49
Se sabe que las varianzas de las producciones por hora son 12 = 256, 22 = 196 para los dos departamentos
respectivamente. Obtenga e interprete un intervalo del 95% para la verdadera diferencia de la producción media.
¿Qué puede decirse de la sospecha que exista acerca de la diferencia entre la producción promedio?
5. Se compara la resistencia de dos tipos de rosca de tornillo, utilizados en el armado de computadores, 50 piezas
con cada tipo de rosca se prueban en condiciones similares. Las piezas de la marca A tienen una resistencia
media a la tensión de 78,3 kg., con una desviación estándar de 5,6 kg., en tanto que las de la marca B tienen una
resistencia media a la tensión de 87,2 g., con una desviación estándar de 6,3 kilogramos.
a) Determine un intervalo de confianza de 95% para la diferencia de las medias poblaciones.
b) Con base en los resultados obtenidos en (a), ¿Qué marca recomendaría comprar?. Justifique.
6. Durante un periodo de 15 días se tomaron los tiempos gastados por dos estudiantes para transportarse de sus
casas a la universidad. Las medias y varianzas fueron:
x1 = 40,33 x2 = 42,54
2 2
s 1
= 1,53 s 2
= 2,96
89
mayores antecedentes, para tomar la decisión, sometió a prueba 10 tubos de cada tipo, obteniendo las siguientes
duraciones en horas:
A: 1.614, 1.094, 1.293, 1.643, 1.466, 1.270, 1.340, 1.380, 1.028, 1.997
B: 1.383, 1.138, 1.092, 1.143, 1.017, 1.061, 1.627, 1.021, 1.711, 1.065
a) Suponiendo que las varianzas son iguales, encontrar un intervalo de confianza para la diferencia de medias.
b) Suponiendo que las varianzas son desiguales, encontrar un intervalo de confianza para la diferencia de medias.
c) Con base en los resultados obtenidos en (a) y (b), ¿qué tipo de tubo recomendaría comprar usted, el con
filamento tipo A o el con filamento tipo B?. Justifique.
8. Un científico de la computación está investigando la utilidad de dos lenguajes de diseño para mejorar la tarea de
programación. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen una
función estándar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta tarea. Los
datos obtenidos son los siguientes:
TIEMPO
1 17 18
2 16 14
3 21 19
4 14 11
5 18 23
6 24 21
7 16 10
8 14 13
9 21 19
10 23 24
11 13 15
12 18 20
a) Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificación promedio.
b) ¿Existe algo que indique una preferencia por alguno de los lenguajes?.
9. Un fabricante de calculadoras electrónicas está interesado en estimar la fracción de unidades defectuosas
producidas. Se toma una muestra aleatoria de 800 calculadoras, de las cuales 10 resultan defectuosas. Calcule
un intervalo de confianza superior del 99% para la fracción de calculadoras defectuosas.
10. Se lleva a cabo un estudio para determinar el porcentaje de hogares en Valdivia donde hay al menos un
computador. ¿De qué tamaño debe ser la muestra si se desea tener una confianza del 99% de que el error al
estimar esta cantidad es menor que 0,017?.
11. El jefe de personal de una empresa desea realizar una encuesta para determinar la proporción de trabajadores
que está a favor de un cambio en el horario de trabajo. Como es imposible consultar a los N = 500 trabajadores en
un lapso razonable, procede a escoger aleatoriamente cierto número de trabajadores para entrevistarlos; determine
el número de trabajadores que debe entrevistarse si desea que la proporción estimada presente un error máximo
del 5% y un nivel de confianza del 95%.
12. Se analiza la fracción de productos defectuosos producidos por dos líneas de producción. Una muestra aleatoria
de 100 unidades provenientes de la línea 1 contiene 10 que son defectuosas, mientras que una muestra aleatoria
de 120 unidades de la línea 2 tiene 25 que son defectuosas.
90
a) Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de productos defectuosos
producidos por las dos líneas.
b) ¿Qué conclusiones pueden obtenerse de los resultados obtenidos en (a)?
13. Considere los datos del problema 2. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 95% para 2 ?
b) Un intervalo de confianza inferior del 95% para 2 ?
c) Un intervalo de confianza superior del 95% para 2 ?
14. Considere los datos del problema 4. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 90% para 21 /22
b) Un intervalo de confianza bilateral del 95% para 21 /22 . Compare el ancho de este intervalo con el del obtenido
en la parte (a).
c) Un intervalo de confianza inferior del 90% para 21 /22
d) ¿Qué conclusiones se podrían obtener, en el contexto del problema, de los resultados obtenidos en (a), (b) y
(c)?
Ejercicios de Comprensión
38. Se admite que la velocidad promedio de las mecanógrafas de una compañía es de 55 palabras por minuto. El jefe de personal
afirma que un programa de adiestramiento instituido hace poco ha aumentado la velocidad de las mecanógrafas. Formule la
hipótesis nula y la hipótesis alternativa.
39. La resistencia a la tracción de los alambres de acero es cuando más de 1.000 libras. El fabricante asegura que un nuevo proceso
de producción ha aumentado la resistencia de los alambres. Formule la hipótesis nula y la hipótesis alternativa. Si se sabe que la
resistencia a la tracción es exactamente de 1.000 libras. ¿cuáles son las hipótesis nula y alternativa?
Sección 2:
40. Una fábrica de pilas garantiza que su producto tiene una vida media de 1.000 horas y una desviación estándar de 50. Pruebe la
hipótesis de que = 1.000 en contraposición de la alternativa 1.000 horas, si una muestra aleatoria de 30 baterías tiene
una duración promedio de 950 horas. Utilice = 5%.
41. Una muestra aleatoria de 36 refrescos de una máquina despachadora tiene un contenido promedio de 19.8 decilitros, con una
desviación estándar de 1.3 decilitros. Pruebe la hipótesis de = 20 decilitros en contraposición a la hipótesis alternativa
< 20. Use el nivel de significación = 1%. Calcule el valor p de significación.
42. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4,22, 3,99, 5,41, 4,23, 4,29, 4,62, 4,55,
4,13, 4,23, 4,48. ¿Evidencian estos datos que el contenido promedio de grasa en los hombres es menor de 4,46? Considere
= 5% y tome = 0,4. Calcule el valor p.
43. Se espera que dos operarios produzcan en promedio el mismo número de unidades terminadas en el mismo tiempo. Los
siguientes datos dan los números de las unidades terminadas para ambos trabajadores en una semana de trabajo.
Operador 1 Operador 2
91
10 12
9 16
16 16
14 15
11 14
Si supone que el número de unidades terminadas diariamente por los trabajadores son variables aleatorias independientes
distribuidas normalmente con varianzas iguales, ¿puede concluirse alguna diferencia entre las medias? Tome = 5%.
44. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194, 202, 335, 515, 184, 369, 142, 552, 200,
344, 421, 590, 301, 439. ¿podemos concluir que la distancia promedio en que se aleja es mayor de 338?. Suponga que = 149
y tome = 5%.
45. Pruebe la hipótesis según la cual el contenido promedio de un aceite comestible es de 5 litros. Si los contenidos de una muestra
aleatoria de 10 recipientes son: 5,2, 4,7, 5,3, 5,1, 4,8, 4,9, 5,4, 5,3, 4,8. Utilice un nivel de significación de= 1% y suponga
que la distribución de los contenidos es normal. Calcule el valor p para dicho nivel.
46. Se desea comparar dos métodos para enseñar estadística. Para ello se tomaron 10 pares de estudiantes del mismo nivel de
aprovechamiento en estadística. De cada par a uno se asigna al azar al método A y el otro al método B. Después de un periodo
de cuatro semanas, cada estudiante se sometió a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10
Método A 36 37 41 42 36 35 42 33 40 38
Método B 35 35 42 41 36 34 40 31 39 37
¿Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de aprovechamiento de los métodos
son distintos? Sea = 5%.
47. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para responder a un examen de estadística.
Grupo Tiempo mínimo
1 100 84 96 107 89
2 79 163 95 132 91 85
Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo de duración promedio para responder
el examen del grupo 1 es mayor que el promedio del grupo 2. Tome
= 2%.
48. Los siguientes datos corresponden a los diámetros de dos muestras de arandelas producidas por dos máquinas
distintas.
Muestra 1 0,91 1,82 1,46 1,95 1,57 1,61 1,32
Considere que los diámetros se distribuyen normalmente y que las varianzas respectivas son 12 = 0,12 y 22
= 0,13. ¿Evidencian estos datos que los diámetros promedios de las arandelas producidas por las dos máquinas
son iguales? Tome = 5%.
49. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus pesos al
comienzo y al final de la dieta. Estos se muestran en la tabla que sigue:
Individuo 1 2 3 4 5
92
Peso inicial 295 305 323 299 310
¿Se puede concluir según estos datos que la dieta es efectiva? Tome = 10%.
50. Suponga que se tienen dos poblaciones X, Y independientes, distribuidas normalmente y de igual varianza. De
cada una de estas poblaciones se extrae una muestra. En la tabla que sigue se dan los resultados.
Población Media Desviación estándar Tamaño de muestra
X 4.52 1,4 5
Y 5,31 1,95 23
¿Se puede concluir, a partir de estos datos, que y x es mayor de 1? Tome = 5%.
51. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseñanza secundaria media en una ciudad es de
225. Una muestra aleatoria de 25 estudiantes arroja un cociente intelectual de 106. ¿Se puede concluir a partir de estos datos
que el cociente intelectual medio de los estudiantes es superior a 100? Use
= 5%.
52. Una muestra aleatoria de tamaño n1 = 25, tomada de una población normal con desviación estándar de 1 = 4,8, tiene una
media x1 = 75. Una segunda muestra aleatoria de tamaño n2 = 36, tomada de una población normal diferente con desviación
2
estándar = 3,5, tiene media x2 = 70. Pruebe la hipótesis de 1 2 , en contraposición a la alternativa 1 2 . Use
5% .
53. Se conduce una prueba sobre la potencia de fricción producida por ciertas máquinas lubricadas con dos aceites comerciales. Los
resultados fueron:
Marca 1 Marca 2
n1 = 9 n2 = 11
x1 10,4 x2 = 14,1
Use 5%.
58. En un estudio diseñado para conocer los efectos secundarios de dos medicamentos a 100 animales se les administro el
medicamento A y a otros 100 el medicamento B. De los 100 que recibieron el medicamento A, 20 mostraron efectos secundarios
mientras que 15 de los que recibieron el medicamento B reaccionaron en forma similar. ¿Evidencian estos datos una diferencia
entre las dos proporciones de los que tuvieron efectos secundarios? Use 5%.
59. Con referencia al problema 51 de la Sección 2. ¿proporcionan estos datos una evidencia de que 2 0,16 ?. Use 5%.
60. Se cree que al menos el 60% de los habitantes de una gran ciudad está a favor del adelanto de la hora local en 30 minutos. Se
tomó una muestra de 200 habitantes de esta ciudad y 110 estuvieron de acuerdo en el adelanto. ¿Qué puede decirse, según
estos datos, del porcentaje real de los que están a favor? Use
= 2%.
93
61. Se compara el nivel de colesterol en la sangre de pacientes seleccionados al azar y sometidos a dos dietas distintas; una baja en
grasa y la otra normal. Las varianza y tamaños de muestra se dan a continuación.
Baja en grasas
S12 198 n1 19
Normal
S22 435 n2 24
¿Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad de las dos poblaciones de donde se
obtuvieron las muestras?. Use 10%.
62. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de casa de 200 consultadas prefieren la
marca A; y que 29 de 150 la marca B. ¿Es esto evidencia suficiente para sostener que la marca A es preferida a la B?. Sea
1%.
63. Se realizó una encuesta para determinar la diferencia que puede existir entre las fracciones de casados y solteros entre 20 y 30
años que fuman. Se entrevistaron 200 personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman. ¿Contienen
los datos suficiente evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para las dos
poblaciones?. Sea 10%.
64. Dos máquinas diferentes A y B se utilizan para producir pernos idénticos que se suponen de 2 pulgadas de longitud. Se toman
dos muestras aleatorias de 25 pernos cada una de la producción de ambas máquinas y arrojan dos varianzas S12 0,03
pulgadas para la máquina A, y S12 = 0,04 pulgadas para la máquina B. ¿Evidencian estos datos que las varianzas son iguales?
Tome 5% .
65. La desviación estándar de cierto proceso de producción es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado
grande. Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas.
Pruebe la hipótesis de que el proceso conserva aún la varianza 2 4. sea 1%.
94
ANEXO 1
Tabla 1: Estadísticas pivotales para la construcción de intervalos de confianza relacionados con medias, varianzas y
proporciones.
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADÍSTICA PIVOTAL
µ x-
Z N(0,1)
con 2 conocida n
µ
x-
Z N(0,1)
S
2 desconocida y n > 30
n
µ x-
t t(n - 1)
S
2 desconocida y n < 30 n
µ1 - µ2
(x - x ) - (μ - μ )
Z 1 2 1 2 N (0,1)
con 1 y 22 conocidas
2
2 2
1 2
n n
1 2
µ1 - µ2
(x - x ) - (μ - μ )
Z 1 2 1 2 N (0,1)
con y desconocidos; muestras
2 2 2
1 2 S S2
1 2
aleatorias independientes de tamaños n1 y n2, n n
1 2
ambos mayores o iguales que 30 (n1> 30 y n2 >
30)
µ1 - µ2 (x - x ) - (μ - μ )
t 1 2 1 2 t(n n - 2)
1 1 1 2
con 1 y 2 desconocidas pero
2 2
S
p n n
aproximadamente iguales. Muestras aleatorias 1 2
(n1 1)S12 (n 2 1)S22
pequeñas independientes de tamaños n1 y n2 S2p
n1 n 2 2
(n1< 30 y/o n2 < 30)
µ1 - µ2 (x - x ) - (μ - μ )
S S
2
t 1 2 1 2 t( ) 2 2
n n
1 2
2 2
con 1 y 2 desconocidas y distintas. S S
2 2
1 2 1 2
S S
2 2
2 2
1 2 n n 1
2
µD d-
t D t(n -1)
2
Muestras pareadas S
d
n
95
Tabla 1: Estadísticas pivotales para la construcción de intervalos de confianza relacionados con medias,
varianzas y proporciones (Continuación).
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADÍSTICA PIVOTAL
(n - 1) S2
2 2 (n 1)
2
2
2 2
S
F 2 1 F(n 1, n 1)
12 / 22 2 2
S
1 2
1 2
p̂ - p
Z N(0,1)
p̂ (1 p̂)
p n
(p̂ - p̂ ) (p - p )
Z 1 2 1 2 N(0,1)
p1 p 2 p̂ q̂ p̂ q̂
1 1 2 2
n n
1 2
96
ANEXO 2
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones
H0 VALOR DE LA ESTADÍSTICA DE H1 REGIÓN CRÍTICA
PRUEBA
µ1 - µ2 = d0
µ1 - µ 2 < d0
con 1 y 22
2 z < -z1-
conocidas (x - x ) - (μ - μ )
Z 1 2 1 2 N (0,1)
2 2
1 2 µ1 - µ 2 > d0 z > z1-
n n
1 2
µ1 - µ2 = d0
µ1 - µ 2 < d0
con 1 y 22
2 z < -z1-
desconocidas; muestras
(x - x ) - (μ - μ )
aleatorias independientes de tamaños n1 Z 1 2 1 2 N (0,1)
y n2, ambos mayores o iguales que 30 S 2 S2
(n1> 30 y n2 > 30) 1 2 µ1 - µ 2 > d0 z > z1-
n n
1 2
µ1 - µ2 = d0 t < -t1-
(x - x ) - (μ - μ )
t 1 2 1 2 t(n n - 2) µ1 - µ 2 < d0
con 1 y 22
2
desconocidas pero 1 1 1 2
Sp
aproximadamente iguales. Muestras n n t > t1-
aleatorias pequeñas independientes de
1 2
tamaños n1 y n2 (n1< 30 y/o n2 < 30) µ1 - µ 2 > d0
(n 1)S (n 1)S2 2
S
2 1 1 2 2
t < -t1-/2 ó t > t1-/2
n n 2
p
1 2
µ1 - µ 2 d0
97
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones (Continuación).
t < -t1-
µ1 - µ2 = d0 (x - x ) - (μ - μ ) µ1 - µ 2 < d0
t 1 2 1 2 t( )
S S2
2
con 1 y 22
2 t > t1-
desconocidas y distintas. 1 2
Muestras aleatorias pequeñas n n µ1 - µ 2 > d0
1 2 S S 2 2
2
n n
30 y/o n2 < 30 1 2
S S
2 2
2 2
1 2
µ1 - µ 2 d0 t < -z1-/2 o t > t1-/2
n n
1 2
n 1 n 1
1 2
d-
t D t(n -1)
µD = d0 2 µD> d 0 t > t1-
S
d
Muestras pareadas n µD d0 t < -t1-/2 o t > t1-/2
2 02 2 12
2 02 (n - 1) S2
2
2
2 (n 1) 2 02 2 12
2 02 2 12 o 2 12
2
2
12 22 f 2 f12
2 2
S
F 2 1 F(n 1, n 1) 12 22 f 2 f12
2
1
2
2 2 2 1 2
S
12 22 f 2 f12 2 o f f12 2
2
1 2
p = p0 Z
p̂ - p
N(0,1) p > p0 z < -z1-
p̂ (1 p̂)
n z < -z1-/2 z > z1-/2
p ≠ p0
98