Está en la página 1de 15

www.elsolucionario.

net
7-4 Estimación de la media poblacional: s desconocida 355

36. Determinación del tamaño de la muestra utilizando datos muestrales Refer to


Remítase al conjunto de datos 1 del apéndice B y localice los pulsos máximo y mínimo de los hom-
bres; después, utilice esos valores para estimar s por medio de la regla práctica de las desviaciones.
¿A cuántos hombres adultos se debe seleccionar al azar y someter a prueba si se desea tener una
confianza del 95% de que el pulso medio muestral está dentro de dos latidos (por minuto) de la
media poblacional verdadera m? Si en vez de usar la regla práctica de las desviaciones se emplea
la desviación estándar de los pulsos de varones del conjunto de datos 1 como una estimación de s,
¿es muy diferente el tamaño de la muestra requerido? ¿Qué tamaño de la muestra parece estar más
cerca del tamaño de la muestra correcto?

7-3 Más allá de lo básico


37. Intervalo de confianza con factor de corrección por población finita El error están-
dar de la media es s> 1n, siempre y cuando el tamaño de la población sea infinito o muy grande, o
si el muestreo se hace con reemplazo. Si el tamaño N de la población es finito, entonces el factor de
corrección 1(N - n)>(N - 1) debe usarse siempre y cuando n . 0.05N. Este factor de correc-
ción multiplica el margen de error E, como se muestra a continuación. Repita el inciso a) del ejer-
cicio 25, suponiendo que la muestra se selecciona sin reemplazo de una población de tamaño 200.
¿Cómo afecta la información adicional sobre el tamaño de la población al intervalo de confianza?
s N - n
E = z a>2
2n A N - 1
38. Tamaño de la muestra con factor de corrección por población finita Los métodos
de esta sección suponen que el muestreo se realiza con reemplazo y a partir de una población muy
grande o infinita. Si tenemos una población relativamente pequeña y hacemos el muestreo sin
reemplazo, debemos modificar E para incluir un factor de corrección por población finita, para que el
margen de error sea como el que se indica en el ejercicio 37, donde N es el tamaño de la población.
En esta expresión del margen de error se despeja n para obtener
Ns2(za>2)2
n =
(N - 1)E2 + s2(za>2)2
Repita el ejercicio 32, suponiendo que se selecciona una muestra aleatoria simple sin reemplazo a
partir de una población de 500 personas. ¿La información adicional sobre el tamaño de la
población afecta mucho el tamaño de la muestra?

7-4 Estimación de la media poblacional: s desconocida


Concepto clave En esta sección se presentan métodos para estimar una media pobla-
cional cuando no se conoce la desviación estándar s. Cuando se desconoce s, se utiliza la
distribución t de Student (en vez de la distribución normal), suponiendo que se cumplen
los requisitos relevantes. Como generalmente se desconoce s en circunstancias reales, los
métodos de esta sección son muy realistas y prácticos, y se utilizan con frecuencia.
Al igual que en la sección 7-3, la media muestral x es la mejor estimación puntual (o
estimación de un solo valor) de la media poblacional m.
La media muestral x es la mejor estimación puntual de la media poblacional M.
He aquí el aspecto clave de esta sección: si s no se conoce, pero los requisitos rele-
vantes se satisfacen, en vez de emplear la distribución normal, utilizamos la distribución t
de Student, desarrollada por William Gosset (1876-1937). Gosset era un empleado de la
cervecería Guinness Brewery que necesitaba una distribución que pudiera utilizarse con
muestras pequeñas. La cervecería irlandesa donde trabajaba no permitía la publicación
de resultados de investigaciones, así que Gosset publicó bajo el seudónimo de Student.
(En aras de la investigación y para servir mejor a sus lectores, el autor visitó la cervecería
Guinness Brewery y probó una muestra del producto. ¡Qué comprometido!).
www.elsolucionario.net
356 Capítulo 7 Estimaciones y tamaño de la muestra

El Departamento Distribución t de Student


del Transporte Si una población tiene una distribución normal, entonces la distribución de
usa intervalos de
confianza x - m
t =
s
Los siguientes extractos de
una circular del Departamento 2n
del Transporte de Estados es una distribución t de Student para todas las muestras de tamaño n. La distribución t
Unidos atañen de Student a menudo se conoce simplemente como distribución t.
a algunos de los
Como no conocemos el valor de la desviación estándar poblacional s, la estima-
requisitos de
exactitud para
mos con el valor de la desviación estándar muestral s, pero esta introduce otra fuente de
el equipo de baja confiabilidad, especialmente con muestras pequeñas. Para poder mantener el nivel
navegación de confianza deseado, como 95%, compensamos esta falta de confianza adicional am-
empleado pliando el intervalo de confianza: utilizamos valores críticos ta/2 (de una distribución t de
en aviones. Student) que son más grandes que los valores críticos de za/2 de la distribución normal.
Observe el uso del Podemos calcular un valor crítico de ta/2 utilizando una herramienta tecnológica o la ta-
intervalo de confianza. “El total bla A-3, pero primero debemos identificar el número de grados de libertad.
de las contribuciones de error
del equipo a bordo, combinado
con los errores técnicos de
vuelo correspondientes inclui-
dos en la lista, no debe exceder El número de grados de libertad para un conjunto de datos muestrales recolec-
lo siguiente con un nivel de tados es el número de valores muestrales que pueden variar después de haber im-
confianza del 95% (2-sigma),
puesto ciertas restricciones a todos los valores de los datos. El número de grados
durante un periodo de tiempo
igual al ciclo de actualización”.
de libertad suele abreviarse como gl.
“El sistema de vías y rutas
aéreas de Estados Unidos tiene
anchuras de protección de ruta
que se utilizan en un sistema
Por ejemplo, si 10 estudiantes tienen puntuaciones de examen con una media de 80,
VOR con una exactitud de podemos asignar con libertad valores a las primeras 9 puntuaciones, pero la décima
;4.5 grados con base en una puntuación se calcula. La suma de las 10 puntuaciones debe ser 800, así que la déci-
probabilidad del 95%”. ma puntuación debe ser igual a 800 menos la suma de las primeras 9 puntuaciones.
Puesto que esas primeras 9 puntuaciones pueden seleccionarse con libertad para adoptar
cualquier valor, decimos que existen 9 grados de libertad disponibles. Para las apli-
caciones de esta sección, el número de grados de libertad es simplemente el tamaño de
la muestra menos 1.
grados de libertad 5 n 2 1

1
Cálculo de un valor crítico t Una muestra de tamaño n 5 7
es una muestra aleatoria simple seleccionada de una población distribuida normal-
mente. Calcule el valor crítico ta/2 correspondiente a un nivel de confianza del 95%.

Puesto que n 5 7, el número de grados de libertad está dado por


n 2 1 5 6. Utilizando la tabla A-3, localizamos el sexto renglón con respecto a la
columna del extremo izquierdo. Un nivel de confianza del 95% corresponde a a 5 0.05,
y los intervalos de confianza requieren que el área a se divida de manera equitativa entre
las colas izquierda y derecha de la distribución (como en la figura 7-4), de manera que
encontramos los valores listados en la columna para un área de 0.05 en dos colas. El valor
correspondiente al renglón para 6 grados de libertad y a la columna para un área de 0.05
en dos colas es 2.447, de manera que ta/2 5 2.447. (Véase la figura 7-4). Podríamos
expresar esto como t0.025 5 2.447. Este tipo de valores críticos ta/2 se utiliza para el
margen de error E y el intervalo de confianza, como se observa a continuación.
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 357

0. 025 0. 025

t!0
t!/2 ! 2 . 447
Valor crítico
Figura 7-4 Valor crítico ta/2

Intervalo de confianza para estimar una media poblacional (con S desconocida)

Objetivo
Construir un intervalo de confianza que se utilice para estimar una media poblacional.

Notación

m 5 media poblacional E 5 margen de error


x 5 media muestral ta/2 5 valor crítico t que separa un área de a/2 en la cola
derecha de la distribución t
s 5 desviación estándar muestral
n 5 número de valores muestrales

Requisitos
1. La muestra es aleatoria simple. 2. La muestra proviene de una población con distribución
normal o n . 30.

Intervalo de confianza
s
x - E 6 m 6 x + E donde E = ta>2 (gl = n - 1)
2n
o
x ;E
o
(x - E, x + E )

Requisitos Como en la sección 7-3, el requisito de una población distribuida normal-


mente no es estricto. Por lo regular, podemos considerar que la población está distribuida
normalmente después de usar los datos muestrales para confirmar que no existen valores
atípicos y que el histograma tiene una forma que no es muy alejada de la de una distribu-
ción normal. Además, al igual que en la sección 7-3, el requisito de que el tamaño de la
muestra sea n 7 30 suele usarse como directriz, pero el tamaño de la muestra mínimo
realmente depende de cuánto se aleja la distribución de la población de la distribución
normal. [Si se sabe que una población se distribuye normalmente, la distribución de me-
dias muestrales x es exactamente una distribución normal con media m y desviación están-
dar s> 1n ; si la población no está distribuida normalmente, muestras grandes (n 7 30)
www.elsolucionario.net
358 Capítulo 7 Estimaciones y tamaño de la muestra

producen medias muestrales con una distribución que es aproximadamente normal, con
media m y desviación estándar s> 1n.]
Procedimiento para construir un intervalo de confianza para M
(con S desconocida)
1. Verifique que los requisitos se satisfagan.
2. Utilizando n 2 1 grados de libertad, utilice una herramienta tecnológica o remí-
tase a la tabla A-3 para encontrar el valor crítico ta/2 que corresponde al nivel de
confianza deseado. (Para el nivel de confianza, remítase al “área en dos colas”).
3. Evalúe el margen de error E = ta>2 # s> 1n.
4. Utilizando el valor del margen de error E calculado y el valor de la media
muestral x, calcule los valores de los límites del intervalo de confianza: x - E
y x + E. Sustituya estos valores en el formato general para el intervalo de
confianza.
5. Redondee los límites del intervalo de confianza resultantes. Si utiliza el conjunto
original de datos, redondee a un decimal más del que se usa para el conjunto origi-
nal de datos. Si utiliza un resumen de estadísticos (n, x, s), redondee los límites del
intervalo de confianza al mismo número de lugares decimales utilizados para la
media muestral.

2
Construcción de un intervalo de confianza: Ajo para re-
ducir el colesterol Existe la creencia popular de que el ajo reduce los niveles de co-
lesterol. En una prueba de la eficacia del ajo, 49 sujetos fueron tratados con dosis de
ajo crudo, y sus niveles de colesterol se midieron antes y después del tratamiento.
Los cambios en sus niveles de colesterol de baja densidad (en mg/dL) tienen una
media de 0.4 y una desviación estándar de 21.0 (según datos de “Effect of Raw Garlic
vs Commercial Garlic Supplements on Plasma Lipid Concentrations in Adults With
Moderate Hypercholesterolemia”, de Gardner et al., Archives of Internal Medicine,
vol. 167). Utilice los estadísticos muestrales de n = 49, x = 0.4, y s = 21.0 para cons-
truir un intervalo de confianza del 95% para el cambio medio neto en el colesterol de
baja densidad después del tratamiento con ajo. ¿Qué sugiere el intervalo de confianza
acerca de la eficacia del ajo para reducir el colesterol de baja densidad?

VERIFICACIÓN DE REQUISITOS Primero debemos


verificar que los dos requisitos para esta sección se satisfacen. 1. El diseño detallado de
los ensayos con ajo justifican el supuesto de que se trata de una muestra aleatoria simple.
2. El requisito de que “la población se distribuye normalmente o n . 30” se satisface,
puesto que n 5 49. Por lo tanto, los requisitos se cumplen.
El nivel de confianza del 95% implica que a = 0.05. Con n = 49, el número de
grados de libertad es n 2 1 = 48. Si utilizamos la tabla A-3, buscamos en el renglón con
48 grados de libertad, y en la columna correspondiente a a 5 0.05 en dos colas. La tabla
no incluye 48 grados de libertad, y el número más cercano de grados de libertad es 50,
de manera que podemos utilizar ta/2 5 2.009. (Si utilizamos una herramienta tecnoló-
gica, obtenemos el resultado más exacto de ta/2 5 2.011).
Si utilizamos ta/2 5 2.009, s 5 21.0 y n 5 49, calculamos el margen de error E como
sigue:

E = ta>2
s
= 2.009 # 21.0
= 6.027
2n 249
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 359

Con x = 0.4 y E = 6.027, construimos el intervalo de confianza de la siguiente Estimación de


manera: azúcar en las
naranjas
x - E 6 m 6 x + E
En Florida, los miembros de
0.4 - 6.027 6 m 6 0.4 + 6.027
la industria de los cítricos
- 5.6 6 m 6 6.4 (redondeado a una posición decimal, usan profusa-
como la media muestral dada) mente méto-
dos estadís-
ticos. Una
Este resultado también podría expresarse en la forma de aplicación
0.4 ; 6.0 o (- 5.6, 6.4). Con base en los resultados muestrales dados, tenemos una con- específica
fianza del 95% de que los límites de - 5.6 y 6.4 realmente contienen el valor de m, tiene que
ver con la
la media de los cambios en el colesterol de baja densidad para la población.
forma en que
Como los límites del intervalo de confianza contienen el valor de 0, es muy posible
se paga a los agricul-
que la media de los cambios en el colesterol de baja densidad sea igual a 0, lo que su- tores por las naranjas que
giere que el tratamiento con ajo no modificó los niveles de este tipo de colesterol. se usan para elaborar jugo
No parece que el tratamiento con ajo sea eficaz para reducir el colesterol de baja de naranja. Cuando llega un
densidad. camión cargado con naranjas,
primero se pesa la carga en la
planta receptora, luego se elige
al azar una muestra de una do-
cena de naranjas. La muestra
Ahora listamos las propiedades importantes de la distribución t de Student que se
se pesa, se exprime y se mide
presentó en esta sección.
la cantidad de azúcar que con-
tiene el jugo. Con base en los
Propiedades importantes de la distribución t de Student resultados de la muestra, se
estima la cantidad total de
1. La distribución t de Student es diferente para distintos tamaños de muestra. azúcar contenida en toda la
(Véase la figura 7-5 para los casos n 5 3 y n 5 12). carga del camión. El pago por
2. La distribución t de Student tiene la misma forma de campana simétrica que la la carga de naranjas se basa
en la estimación de la cantidad
distribución normal estándar, pero refleja una mayor variabilidad (con distribu-
de azúcar, ya que las naranjas
ciones más amplias) de lo que se espera con muestras pequeñas.
más dulces son más valiosas
3. La distribución t de Student tiene una media de t 5 0 (así como la distribución que las menos dulces, aunque
normal estándar tiene una media de z 5 0). las cantidades de jugo sean
iguales.

Figura 7-5
Distribuciones t de Student para n 5 3 y n 5 12
La distribución t de Student tiene la misma forma y simetría general
de la distribución normal estándar, pero refleja una mayor variabi-
lidad de lo que se espera con muestras pequeñas.
www.elsolucionario.net
360 Capítulo 7 Estimaciones y tamaño de la muestra

4. La desviación estándar de la distribución t de Student varía con el tamaño de la


muestra, pero es mayor que 1 (a diferencia de la distribución normal estándar,
que tiene s 5 1).
5. Conforme el tamaño de la muestra n se vuelve más grande, la distribución t de
Student se acerca más a la distribución normal estándar.

Elección de la distribución adecuada


En ocasiones es difícil decidir entre utilizar la distribución normal estándar z o la distri-
bución t de Student. El diagrama de flujo de la figura 7-6 y la tabla 7-1 resumen los
aspectos clave a considerarse cuando se construyen intervalos de confianza para estimar
m, la media poblacional. En la figura 7-6 o en la tabla 7-1, note que si tenemos una
muestra pequeña (n # 30), obtenida de una distribución que difiere drásticamente de
una distribución normal, no podemos usar los métodos descritos en este capítulo. Una
alternativa es utilizar métodos no paramétricos (véase el capítulo 13); otra alternativa es
usar el método bootstrap basado en computadora. En ambos enfoques no se hacen
supuestos acerca de la población original. El método bootstrap se describe en el proyecto
tecnológico al final del capítulo.
Importante: En la figura 7-6 y en la tabla 7-1 se supone que la muestra es aleatoria
simple. Si los datos muestrales se reunieron utilizando algún método inadecuado, como
una muestra de conveniencia o una muestra de respuesta voluntaria, es muy posible que
no existan métodos estadísticos para calcular una estimación útil de una media po-
blacional.

Inicio

¿La población Sí ¿Se No ¿La población


está distribuida conoce s? está distribuida
normalmente? normalmente?

No No

Sí Sí
¿Es ¿Es
n " 30? n " 30?

Sí No Sí
S No

z Utilice métodos t Utilice métodos


Utilice la no paramétricos Utilice la no paramétricos
distribución normal o bootstrap. distribución t. o bootstrap.

Figura 7-6 Elección entre z y t


www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 361

Tabla 7-1 Elección entre z y t Estimación


Método Condiciones del tamaño de
Utilice la distribución normal (z). conocida y población distribuida normalmente multitudes
o Existen métodos complejos
para analizar el tamaño de
s conocida y n . 30
una multitud.
Utilice la distribución t. s desconocida y población distribuida normalmente Se pueden
o emplear foto-
grafías aéreas
s desconocida y n . 30 y medidas de
Utilice un método no paramétrico La población no está distribuida normalmente y n # 30. densidad de-
o bootstrap. mográfica
con una exac-
titud bastante
Notas: 1. Criterios para decidir si la población está distribuida normalmente: La población no nece-
razonable. Sin embargo, los
sita ser exactamente normal, pero debe tener una apariencia un tanto simétrica, con una moda
reportes de estimaciones
y sin valores atípicos.
del tamaño de multitudes
2. Tamaño de la muestra n . 30: Este es un lineamiento que se usa regularmente, pero tamaños
a menudo son simples conje-
de muestra de 15 a 30 son adecuados si la población parece tener una distribución normal y
turas. Después de que los
no existen valores atípicos. Para algunas distribuciones poblacionales que estén extremada-
Medias Rojas de Boston gana-
mente alejadas de la normal, puede requerirse que el tamaño de la muestra sea mucho mayor
ron la Serie Mundial por primera
que 30.
vez en 86 años, las autoridades
de la ciudad de Boston estima-
ron que a la celebración calle-
El siguiente ejemplo se enfoca en la elección del método correcto. jera acudieron 3.2 millones de
aficionados. La policía de
Boston hizo una estimación
de alrededor de un millón de
personas, pero aceptó que este
3
Selección de distribuciones Usted planea construir un inter- cálculo se basaba en conjeturas
valo de confianza para la media poblacional m. Utilice los datos para determinar si el de los comandantes de la po-
margen de error E debe calcularse utilizando un valor crítico de za/2 (de la distribución licía. Un análisis fotográfico
produjo una estimación de
normal), un valor crítico de ta/2 (de la distribución t) o ninguno de estos (de manera
alrededor de 150,000. El pro-
que los métodos de la sección 7-3 y de esta sección no son viables). fesor Farouk El-Baz de la Uni-
a) n = 9, x = 75, s = 15 y la población tiene una distribución normal. versidad de Boston utilizó
imágenes del U.S. Geological
b) n = 5, x = 20, s = 2 y la población tiene una distribución muy sesgada. Survey para llegar a una esti-
c) n = 12, x = 98.6, s = 0.6 y la población tiene una distribución normal. mación de casi 400,000.
(En la realidad, pocas veces se conoce s). El físico Bill Donnelly del MIT
dijo que “es un problema serio
d) n = 75, x = 98.6, s = 0.6 y la población tiene una distribución sesgada. que la gente solo indique un
(En la realidad, pocas veces se conoce s). número cualquiera. Esto signi-
fica que otros asuntos no se
e) n = 75, x = 98.6, s = 0.6 y la población tiene una distribución sesgada. investigan de manera
cuidadosa”.

Remítase a la figura 7-6 o a la tabla 7-1.


a) Puesto que la desviación estándar poblacional s no se conoce y la población está dis-
tribuida normalmente, el margen de error se calcula usando ta/2.
b) Puesto que la muestra es pequeña (n # 30) y la población no tiene una distribución
normal, el margen de error E no se debe calcular usando un valor crítico de za/2 o ta/2.
No se pueden aplicar los métodos de la sección 7-3 ni los de esta sección.
continúa
www.elsolucionario.net
362 Capítulo 7 Estimaciones y tamaño de la muestra

c) Puesto que se conoce s y la población tiene una distribución normal, el margen de


error se calcula usando za/2.
d) Como la muestra es grande (n . 30) y se conoce s, el margen de error se calcula
usando za/2.
e) Como la muestra es grande (n . 30) y se desconoce s, el margen de error se calcula
usando ta/2.

4
Intervalo de confianza para alcohol en videojuegos Se ob-
servaron 12 videojuegos diferentes que exhiben el consumo de sustancias tóxicas. Se
registró la duración (en segundos) del consumo de alcohol, los cuales se presentan a
continuación (según datos de “Content and Ratings of Teen-Rated Video Games”, de
Haninger y Thompson, Journal of the American Medical Association, vol. 291, núm. 7).
El diseño del estudio justifica el supuesto de que la muestra puede tratarse como si
fuera una muestra aleatoria simple. Utilice los datos muestrales para construir un in-
tervalo de confianza del 95% para m, la media del tiempo que el video mostró el con-
sumo de alcohol.
84 14 583 50 0 57 207 43 178 0 2 57

VERIFICACIÓN DE REQUISITOS Primero debemos


verificar que los requisitos se cumplan. 1. Podemos considerar que se trata de una mues-
tra aleatoria simple. 2. Al verificar el requisito de que “la población se distribuye normal-
mente o n 7 30”, observamos que el tamaño de la muestra es n = 12, de manera que
debemos determinar si los datos parecen provenir de una población con una distribución
normal. A continuación se presenta un histograma generado por Minitab y una gráfica
cuantilar normal generada por STATDISK. El histograma no parece tener forma de
campana, y los puntos en la gráfica cuantilar normal no se acercan de manera razonable
a una línea recta, por lo que concluimos que los tiempos no provienen de una población
con distribución normal. Los requisitos no se cumplen. Si continuáramos con la cons-
trucción del intervalo de confianza, obtendríamos 1.8 segundos 6 m 6 210.7 segundos,
pero este resultado es cuestionable porque supone de manera incorrecta que los requi-
sitos se cumplieron.

Puesto que no se cumple el requisito de que “la población se


distribuye normalmente o n 7 30”, no tenemos una confianza del 95% de que los límites
de 1.8 y 210.7 segundos realmente contengan el valor de la media poblacional. Debemos
utilizar algún otro método para calcular los límites del intervalo de confianza. Por ejemplo,
el autor utilizó un nuevo muestreo con bootstrap, como se describe en el proyecto tec-
nológico al final de esta sección, y obtuvo el intervalo de confianza de 35.3 segundos 6
m 6 205.6 segundos.
MINITAB
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 363

STATDISK

Cálculo de la estimación puntual y de E


a partir de un intervalo de confianza
Más adelante en esta sección describiremos cómo pueden utilizarse las calculadoras y los
programas de cómputo para calcular un intervalo de confianza. Un uso común requiere
que usted ingrese un nivel de confianza y estadísticos muestrales, y la pantalla indica los
límites del intervalo de confianza. La media muestral x es el valor intermedio de estos lí-
mites; el margen de error E es la mitad de la diferencia entre esos límites (ya que el límite
superior es x + E y el límite inferior es x - E, y la distancia que los separa es 2E ).

(límite de confianza superior) + (límite de confianza inferior)


Estimación puntual de m: x =
2
(límite de confianza superior) - (límite de confianza inferior)
Margen de error: E =
2

5
Peso de basura El conjunto de datos 22 del apéndice B in-
cluye los pesos de la basura desechada proveniente de una muestra de 62 hogares.
La siguiente pantalla de la calculadora TI-83/84 Plus es el resultado desplegado al
considerar 62 cantidades de pesos totales (en libras) para construir un intervalo de
confianza del 95% para el peso medio de la basura desechada por la población de to-
dos los hogares. Utilice el intervalo de confianza de la pantalla para calcular los va-
lores de la mejor estimación puntual x y del margen de error E.

En los siguientes cálculos, los resultados se redondean a tres deci-


males, que es un espacio decimal adicional más de los dos lugares decimales utilizados
para la lista original de pesos.

(límite de confianza superior) + (límite de confianza inferior)


x = TI-83/ 84 PLUS
2
30.607 + 24.28
= = 27.444 lb
2
(límite de confianza superior) - (límite de confianza inferior)
E =
2
30.607 - 24.28
= = 3.164 lb
2
www.elsolucionario.net
364 Capítulo 7 Estimaciones y tamaño de la muestra

Uso de los intervalos de confianza para describir,


explorar o comparar datos
En algunos casos, podríamos utilizar un intervalo de confianza para lograr el objetivo final
de estimar el valor de un parámetro poblacional. En otros casos, un intervalo de confianza
podría ser una de varias herramientas para describir, explorar o comparar conjuntos de
datos. En la figura 7-7 se presentan gráficas de intervalos de confianza para los índices
de masa corporal (IMC) de dos muestras, una de mujeres y otra de hombres. (Ambas
muestras están incluidas en el conjunto de datos 1 del apéndice B). Puesto que los inter-
valos de confianza se traslapan en la figura 7-7, es posible que los hombres y las mujeres
tengan el mismo índice de masa corporal medio, por lo que no parece haber una diferencia
significativa entre la media del índice IMC de mujeres y hombres.

Figura 7-7 Índices de masa corporal (IMC) de hombres y mujeres

ADVERTENCIA
Al igual que sucedió en las secciones 7-2 y 7-3, los intervalos de confianza pueden usarse
de manera informal para comparar diferentes conjuntos de datos, pero el traslape de inter-
valos de confianza no debe usarse para obtener conclusiones formales ni finales acerca de la
igualdad de medias.

Determinación del tamaño de la muestra La sección 7-2 incluye un apartado


donde se describen métodos para determinar el tamaño de muestra que se necesita para
estimar una proporción poblacional, y la sección 7-3 incluye un apartado con métodos
para determinar el tamaño de muestra que se necesita para estimar una media pobla-
cional. En esta sección no se incluye un apartado de tal tipo. Cuando necesite determinar
el tamaño de la muestra necesario para estimar una media poblacional, utilice el procedi-
miento que se describe en la sección 7-3, el cual requiere de un valor estimado o conocido
de la desviación estándar poblacional.

Los siguientes procedimientos se aplican a intervalos de confianza para cione Stat y Basic Statistics. Si no se conoce s, seleccione 1-sample t
U S O D E L A T E C N O LO G Í A

estimar una media m e incluyen los intervalos de confianza descritos en e ingrese el resumen de estadísticos o ingrese C1 en el recuadro ubicado
la sección 7-3, así como los intervalos de confianza presentados en esta en la parte superior derecha. (Si se conoce s, seleccione 1-sample Z e
sección. Antes de utilizar programas de cómputo o una calculadora para ingrese el resumen de estadísticos o ingrese C1 en el recuadro ubicado
generar un intervalo de confianza, asegúrese de revisar que los requisitos en la parte superior derecha. También ingrese el valor de s en el cuadro
se satisfagan. Consulte los requisitos listados casi al principio de esta “Standard Deviation” o “Sigma”). Utilice el botón Options para ingresar
sección y de la sección 7-3. el nivel de confianza, por ejemplo, 95.0.
S TAT D I S K Primero debe calcular el tamaño de la muestra n, E XC E L Si utiliza Excel 2010 o Excel 2007, haga clic en Add-Ins,
la media muestral x, y la desviación estándar muestral s. (Véase el proce- luego en DDXL; si utiliza Excel 2003, haga clic en DDXL. Seleccione
dimiento del STATDISK descrito en la sección 3-3). Seleccione Analysis Confidence Intervals. Dentro de las opciones para tipo de función,
de la barra del menú principal, luego Confidence Intervals y después seleccione Var t Interval isi se desconoce s. (Si se conoce s, seleccione
Population Mean. Proceda a ingresar los elementos en el cuadro de 1 Var z Interval.). Haga clic en el icono con forma de lápiz e ingrese
diálogo; luego, haga clic en el botón Evaluate. El intervalo de confianza el rango de datos, como A1:A12 si usted tiene 12 valores listados en la
aparecerá en la pantalla. STATDISK elige de manera automática entre columna A. Haga clic en OK. En el cuadro de diálogo, seleccione el
las distribuciones normal y t, dependiendo de si se ingresa un valor nivel de confianza. (Si está utilizando 1 Var z Interval, también ingrese
para la desviación estándar poblacional. el valor de s). Haga clic en Compute Interval y el intervalo de confianza
aparecerá en la pantalla. (No se recomienda el uso de la herramienta
M I N I TA B Minitab le permite utilizar ya sea el resumen de es-
CONFIDENCE de Excel, por varias razones).
tadísticos n, x, y s o una lista de los valores muestrales originales. Selec-
continúa
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 365

TI-83/84 PLUS La calculadora TI-83/84 Plus sirve para Valores críticos de t: Para obtener los valores críticos de t en la calcu-
generar intervalos de confianza para valores muestrales originales guarda- ladora TI-84 Plus, presione F O para que aparezca el menú
dos en una lista, o bien, usted puede utilizar el resumen de estadísticos n, DISTR (distribución) y luego seleccione invT. Ingrese el área acumulada
x, y s. Ingrese los datos en la lista L1 o tenga disponible el resumen de de la izquierda, ingrese una coma y luego el número de grados de libertad.
los estadísticos; luego, presione la tecla STAT. Ahora seleccione TESTS El comando invT(0.975, 52) produce 2.006646761; para 52 grados de
y elija TInterval si no se conoce s (elija ZInterval si se conoce s). libertad, el valor t con un área de 0.975 a su izquierda es 2.006646761.
Después de ingresar los datos requeridos, la pantalla de la calculadora La calculadora TI-83/84 Plus no cuenta con el comando invT, por lo que
incluirá el intervalo de confianza en el formato (x - E, x + E ). deberá usar el programa invt del sitio Web del libro.
Por ejemplo, observe la pantalla de la calculadora TI-83/84 Plus del
ejemplo 5 de esta sección.

7-4 Destrezas y conceptos básicos


Conocimientos estadísticos y pensamiento crítico
1. ¿Dónde está el error? Una nota informativa en USA Today señaló que “los consumidores
gastarán un promedio estimado de $483 en mercancía” por el reinicio de las clases. Se informó que
el valor se basaba en una encuesta de 8453 consumidores, y que el margen de error era de “;1
punto porcentual”. ¿Qué está incorrecto en esta información?
2. Robusto ¿Qué significa cuando decimos que los métodos para construir intervalos de confianza
de esta sección son robustos frente a desviaciones respecto de la normalidad? ¿Los métodos para cons-
truir intervalos de confianza de esta sección son robustos con respecto a los métodos de muestreo
inadecuados?
3. Muestreo AUna organización nacional de encuestas fue contratada para estimar la cantidad me-
dia de dinero en efectivo que llevan consigo los adultos en Estados Unidos. El plan de muestreo ori-
ginal incluía llamadas telefónicas a 2500 números de teléfono diferentes en todo el territorio esta-
dounidense, pero un gerente decidió ahorrar gastos en llamadas de larga distancia utilizando una
muestra aleatoria simple de 2500 números telefónicos dentro del estado de California. Si esta mues-
tra se utiliza para construir un intervalo de confianza del 95% para estimar la media poblacional,
¿se obtendrá una buena estimación? ¿Por qué?
4. Grados de libertad Se obtiene una muestra aleatoria simple de tamaño n 5 5 a partir de una
población de conductores que viven en la ciudad de Nueva York, y se mide el tiempo de reacción
de frenado de cada conductor. Los resultados se usarán para construir un intervalo de confianza del
95%. ¿Cuál es el número de grados de libertad que debe usarse para calcular el valor crítico ta/2?
Dé una explicación breve del número de grados de libertad.

Uso de la distribución correcta. En los ejercicios 5 a 12, suponga que deseamos cons-
truir un intervalo de confianza utilizando el nivel de confianza indicado. Realice
una de las siguientes acciones, según sea adecuado: a) calcule el valor crítico za/2,
b) calcule el valor crítico ta/2, c) determine que no se aplican ni la distribución nor-
mal ni la distribución t.
5. 95%; n 5 23; se desconoce s; la población parece estar distribuida normalmente.
6. 99%; n 5 25; se conoce s; la población parece estar distribuida normalmente.
7. 99%; n 5 6; se desconoce s; la población parece estar muy sesgada.
8. 95%; n 5 40; se desconoce s; la población parece estar sesgada.
9. 90%; n 5 200; s 5 15.0; la población parece estar sesgada.
10. 95%; n 5 9; se desconoce s; la población parece estar muy sesgada.
11. 99%; n 5 12; se desconoce s; la población parece estar distribuida normalmente.
12. 95%; n 5 38; se desconoce s; la población parece estar sesgada.
www.elsolucionario.net
366 Capítulo 7 Estimaciones y tamaño de la muestra

Cálculo de intervalos de confianza. En los ejercicios 13 y 14, utilice el nivel de con-


fianza y los datos muestrales indicados para calcular a) el margen de error y b) el
intervalo de confianza para la media poblacional M. Suponga que la muestra es
aleatoria simple y que la población tiene una distribución normal.
13. Costos de hospital 95% de confianza; n = 20, x = $9004, s = $569 (según datos del
costo hospitalario para víctimas de choques automovilísticos que usaban cinturones de seguridad,
del Departamento del Transporte de Estados Unidos).
14. Contaminación de automóviles 99% de confianza n = 7, x = 0.12, s = 0.04 (los va-
lores originales son emisiones de óxido de nitrógeno en gramos/milla, de la Environmental Pro-
tection Agency).

Interpretación de la pantalla de resultados. En los ejercicios 15 y 16, utilice los datos


y la imagen de la pantalla para expresar el intervalo de confianza en el formato de
x " E< M<x ! E. Además, escriba un enunciado que interprete el intervalo
de confianza.
15. Pesos de monedas de un dólar 95% de confianza; n = 20, x = 8.0710 g, s = 0.0411 g
(según mediciones realizadas por el autor). Observe la siguiente pantalla de SPSS.

SPSS

TI-83/ 84 PLUS 16. Pesos de plástico desechado por hogares 99% de confianza n = 62,
x = 1.911 libras, s = 1.065 libras (según datos del Garbage Project, Universidad de Arizona).
Véase la pantalla de la calculadora TI- 83/84 Plus que aparece al margen.

Construcción de intervalos de confianza. En los ejercicios 17 a 30, construya el inter-


valo de confianza.
17. Ajo para reducir el colesterol En una prueba sobre la eficacia del ajo para reducir el coles-
terol, 47 sujetos fueron tratados con Garlicin, que es ajo en tabletas. Se midieron niveles de co-
lesterol antes y después del tratamiento. Los cambios en sus niveles de colesterol de baja densidad
(en mg/dL) tienen una media de 3.2 y una desviación estándar de 18.6 (según datos de “Effect of
Raw Garlic vs Commercial Garlic Supplements on Plasma Lipid Concentrations in Adults With
Moderate Hypercholesterolemia”, de Gardner et al., Archives of Internal Medicine, vol. 167).
a) ¿Cuál es la mejor estimación puntual del cambio neto medio poblacional en el colesterol de
baja densidad después del tratamiento con Garlicin?
b) Construya un intervalo de confianza del 95% para el cambio neto medio en el colesterol de baja
densidad después del tratamiento con Garlicin. ¿Qué sugiere el intervalo de confianza sobre la efi-
cacia del Garlicin en la reducción del colesterol de baja densidad?
18. Pesos al nacer Una muestra aleatoria de los pesos al nacer de 186 bebés tiene una media de
3103 g y una desviación estándar de 696 g (según datos de “Cognitive Outcomes of Preschool
Children with Prenatal Cocaine Exposure”, de Singer et al., Journal of the American Medical Asso-
ciation, vol. 291, núm. 20). Estos bebés son hijos de mujeres que no consumieron cocaína durante
el embarazo.
a) ¿Cuál es la mejor estimación puntual del peso medio de bebés nacidos de madres que no con-
sumieron cocaína durante su embarazo?
b) Construya un intervalo de confianza del 95% para el peso medio al nacer de todos estos bebés.
c) Compare el resultado con el intervalo de confianza del inciso b) con el siguiente intervalo de
confianza obtenido de los pesos al nacer de hijos de mujeres que consumieron cocaína durante el
embarazo: 2608 g , m , 2792 g. Al parecer, ¿el consumo de cocaína por parte de las madres
afecta el peso que registran sus bebés al nacer?
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 367

19. Temperatura media corporal El conjunto de datos 2 del apéndice B incluye 106 tempera-
turas corporales, para las cuales x = 98.20°F y s 5 0.62°F.
a) ¿Cuál es la mejor estimación puntual de la temperatura corporal media de todos los seres hu-
manos saludables?
b) Utilice los estadísticos de la muestra con la finalidad de construir un intervalo de confianza del
99% para la temperatura media corporal de todos los seres humanos saludables. ¿Los límites del in-
tervalo de confianza incluyen los 98.6°F? ¿Qué sugiere la muestra acerca del uso de 98.6°F como
la temperatura corporal media?
20. Programa Atkins de pérdida de peso En una prueba del programa Atkins para la pér-
dida de peso, 40 individuos participaron en un ensayo aleatorizado con adultos que sufren so-
brepeso. Doce meses después, la pérdida media de peso fue de 2.1 libras, con una desviación están-
dar de 4.8 libras.
a) ¿Cuál es la mejor estimación puntual de la pérdida media de peso de todos los adultos con so-
brepeso que siguen el programa Atkins?
b) Construya un intervalo de confianza del 99% para la pérdida media de peso de todos estos in-
dividuos.
c) ¿Parece que el programa Atkins es eficaz? ¿Es práctico?
21. Tratamiento con equinácea En un estudio diseñado para probar la eficacia de la equinácea
para tratar infecciones del tracto respiratorio superior en niños, se trató a 337 niños con equiná-
cea y 370 recibieron un placebo. El número de días de mayor severidad de los síntomas en el grupo
de tratamiento con equinácea tuvo una media de 6.0 días y una desviación estándar de 2.3 días.
El número de días de mayor severidad de los síntomas en el grupo del placebo tuvo una media de
6.1 días y una desviación estándar de 2.4 días (según datos de “Efficacy and Safety of Echinacea
in Treating Upper Respiratory Tract Infections in Children”, de Taylor et al., Journal of the Ameri-
can Medical Association, vol. 290, núm. 21).
a) Construya un intervalo de confianza del 95% para la media del número de días de mayor seve-
ridad de los síntomas en el caso de los niños que recibieron el tratamiento con equinácea.
b) Construya un intervalo de confianza del 95% para la media del número de días de mayor severi-
dad de los síntomas en el caso de los niños que recibieron el placebo.
c) Compare los dos intervalos de confianza. ¿Qué sugieren los resultados acerca de la eficacia de
la equinácea?
22. Acupuntura para migrañas En un estudio diseñado para probar la eficacia de la acupun-
tura para tratar la migraña, 142 sujetos fueron tratados con acupuntura, mientras que 80 recibie-
ron un tratamiento simulado. El número de ataques de migraña en el grupo de tratamiento con
acupuntura tuvo una media de 1.8 y una desviación estándar de 1.4. El número de ataques de
migraña en el grupo del tratamiento simulado tuvo una media de 1.6 y una desviación estándar
de 1.2.
a) Construya un intervalo de confianza del 95% para el número medio de ataques de migraña para
las personas tratadas con acupuntura.
b) Construya un intervalo de confianza del 95% para el número medio de ataques de migraña
para las personas que recibieron un tratamiento simulado.
c) Compare los dos intervalos de confianza. ¿Qué sugieren los resultados acerca de la eficacia de
la acupuntura?
23. Imanes para tratar el dolor de espalda En un estudio diseñado para probar la eficacia
de los imanes para tratar el dolor de espalda, 20 pacientes recibieron un tratamiento con imanes
y también un tratamiento simulado sin imanes. Se midió el dolor con la escala Visual Analog Scale
(VAS). Después del tratamiento con imanes, la media de las puntuaciones VAS de los 20 pacientes
fue de 5.0, con una desviación estándar de 2.4. Después del tratamiento simulado, la media de las
puntuaciones VAS de los 20 pacientes fue de 4.7, con una desviación estándar de 2.9.
a) Construya un intervalo de confianza del 95% para la puntuación VAS media para los pacientes
que recibieron el tratamiento con imanes.
b) Construya un intervalo de confianza del 95% para la puntuación VAS media para los pacien-
tes que recibieron un tratamiento simulado.
c) Compare los resultados. ¿Parece que el tratamiento con imanes es eficaz?
www.elsolucionario.net
368 Capítulo 7 Estimaciones y tamaño de la muestra

24. Edades de actrices y actores ganadores del Óscar Las edades de las 79 actrices en
el momento de ganar el Óscar en la categoría de mejor actriz tienen una media de 35.8 años y una
desviación estándar de 11.3 años. Las edades de los 79 actores en el momento de ganar el Óscar
en la categoría de mejor actor tienen una media de 43.8 años y una desviación estándar de 8.9
años. Suponga que se trata de muestras aleatorias simples.
a) Construya un intervalo de confianza del 99% para la media de la edad de las actrices en el mo-
mento de ganar el Óscar en la categoría de mejor actriz.
b) Construya un intervalo de confianza del 99% para la media de la edad de los actores en el
momento de ganar el Óscar en la categoría de mejor actor.
c) Compare los resultados.
25. Control del plomo en el aire A continuación se listan las cantidades de plomo medidas (en
microgramos por metro cúbico o mg/m3) en el aire. La Environmental Protection Agency (EPA)
estableció un estándar de calidad del aire para el plomo de 1.5 mg/m3. Las medidas que se presen-
tan a continuación se registraron en el edificio 5 del World Trade Center en diferentes días, inme-
diatamente después de la destrucción causada por los ataques terroristas del 11 de septiembre de
2001. Después del colapso de los dos edificios del World Trade Center hubo una gran preocu-
pación por la calidad del aire. Utilice los valores dados para construir un intervalo de confianza del
95% para la cantidad media de plomo en el aire. ¿Hay algo en este conjunto de datos que sugiera
que el intervalo de confianza tal vez no sea muy bueno? Explique.

5.40 1.10 0.42 0.73 0.48 1.10

26. Estimación de contaminación de automóviles En una muestra de siete automóviles, se


probaron las emisiones de óxido de nitrógeno de cada uno (en gramos por milla) y se obtuvieron
los siguientes resultados: 0.06, 0.11, 0.16, 0.15, 0.14, 0.08, 0.15 (según datos de la EPA).
Suponiendo que esta muestra es representativa de los automóviles en uso, construya un intervalo de
confianza del 98% para la cantidad media de emisiones de óxido de nitrógeno para todos los au-
tomóviles. Si la EPA exige que las emisiones de óxido de nitrógeno sean menores que 0.165 g/mi,
¿podemos concluir con seguridad que se cumple este requisito?
27. Salarios de conductores de televisión A continuación se listan los 10 salarios más altos
(en millones de dólares) de personalidades de la televisión en un año reciente (los cuales aparecen
en orden para Letterman, Cowell, Sheindlin, Leno, Couric, Lauer, Sawyer, Viera, Sutherland y
Sheen, según datos de la revista OK!).
a) Utilice los datos muestrales para construir un intervalo de confianza del 95% para la media
poblacional.
b) ¿Los datos muestrales representan una muestra aleatoria simple de los salarios que se pagan en
televisión?
c) ¿Cuál es la población supuesta? ¿La muestra es representativa de la población?
d) ¿El intervalo de confianza tiene sentido?

38 36 35 27 15 13 12 10 9.6 8.4

28. Duración de películas A continuación se incluye la duración (en minutos) de 12 películas


elegidas al azar del conjunto de datos 9 en el apéndice B.
a) Construya un intervalo de confianza del 99% para la duración media de todas las películas.
b) Suponiendo que se necesitan 30 minutos para vaciar una sala de cine después de la exhibición
de una película, limpiarla, dar tiempo a que ingrese el público de la siguiente función y presentar
los cortos, ¿cuál es el tiempo mínimo que el gerente de un cine debería planear entre los tiempos
de inicio de las películas, suponiendo que ese tiempo será suficiente para las películas típicas?

110 96 125 94 132 120 136 154 149 94 119 132

29. Videojuegos Se observaron 12 videojuegos diferentes que exhiben el consumo de sustancias


tóxicas, y a continuación se presentan las duraciones de los juegos (en segundos) (según datos de
“Content and Ratings of Teen-Rated Video Games”, de Haninger y Thompson, Journal of the
American Medical Association, vol. 291, núm. 7). El diseño del estudio justifica el supuesto de que
la muestra puede tratarse como si fuera aleatoria simple. Utilice los datos muestrales para construir
un intervalo de confianza del 95% de m, la duración media de los juegos.

4049 3884 3859 4027 4318 4813 4657 4033 5004 4823 4334 4317
www.elsolucionario.net
7-4 Estimación de la media poblacional: s desconocida 369

30. Edades de presidentes A continuación se presentan las edades de los presidentes de Esta-
dos Unidos en el momento de asumir el cargo. Construya un intervalo de confianza del 99% para
la media de las edades de los presidentes en el momento de asumir el cargo. ¿Cuál es la población?
¿El intervalo de confianza ofrece una buena estimación de la media poblacional? ¿Por qué?

42 43 46 46 47 48 49 49 50 51 51 51 51 51 52 52 54 54 54 54 54 55
55 55 55 56 56 56 57 57 57 57 58 60 61 61 61 62 64 64 65 68 69

Conjuntos de datos del apéndice B. En los ejercicios 31 y 32, utilice los conjuntos de
datos del apéndice B.
31. Nicotina en cigarrillos Remítase al conjunto de datos 4 en el apéndice B y suponga que se
trata de muestras aleatorias simples obtenidas de poblaciones distribuidas de manera normal.
a) Construya un intervalo de confianza del 95% para la cantidad media de nicotina en cigarrillos
tamaño grande, sin filtro, que no son mentolados ni ligeros.
b) Construya un intervalo de confianza del 95% para la cantidad media de nicotina en cigarrillos
de 100 mm, con filtro, que no son mentolados ni ligeros.
c) Compare los resultados. ¿Parece que los filtros de los cigarrillos son eficaces?
32. Pulsos Un médico quiere desarrollar criterios para determinar si el pulso de un paciente es
anormal y desea determinar si hay diferencias significativas entre hombres y mujeres. Utilice los
pulsos muestrales del conjunto de datos 1 del apéndice B.
a) Construya un intervalo de confianza del 95% para el pulso medio de los hombres.
b) Construya un intervalo de confianza del 95% para el pulso medio de las mujeres.
c) Compare los resultados anteriores. ¿Podemos concluir que las medias poblacionales para hom-
bres y para mujeres son diferentes? ¿Por qué?

7-4 Más allá de lo básico


33. Efecto de un valor atípico Utilice los datos muestrales del ejercicio 30 para calcular una es-
timación de un intervalo de confianza del 99% de la media poblacional, después de cambiar la
primera edad de 42 por 422 años. Este valor no es realista, pero es fácil que ocurra un error como
este durante el proceso de captura de datos. ¿El intervalo de confianza se modifica mucho cuando
se cambian 42 años por 422 años? ¿Los límites del intervalo de confianza son sensibles a los valores
atípicos? ¿Cómo se deberían manejar los valores atípicos cuando se presentan en conjuntos de datos
muestrales que se utilizarán para construir intervalos de confianza?
34. Método alternativo La figura 7-6 y la tabla 7-1 resumen la decisión tomada al elegir entre
las distribuciones normal y t. Un método alternativo que se incluye en algunos libros de texto (pero
que casi nunca utilizan los profesionales en estadística y que tampoco se incluye en revistas científi-
cas) se basa en el siguiente criterio: sustituya la desviación estándar muestral s por s siempre que n
. 30, y luego proceda como si se conociera s. Utilice este método alternativo para repetir el ejerci-
cio 30. Compare los resultados con los obtenidos en el ejercicio 30, y comente sobre las implica-
ciones del cambio en la anchura del intervalo de confianza.
35. Factor de corrección por población finita Si se selecciona una muestra aleatoria simple
de tamaño n sin reemplazo de una población finita de tamaño N, y el tamaño de la muestra es
mayor que el 5% del tamaño de la población (n 7 0.05N), se pueden obtener mejores resultados
utilizando el factor de corrección por población finita, el cual implica multiplicar el margen de
error E por 1(N - n)>(N - 1). Para la muestra de 100 pesos de dulces M&M del conjunto
de datos 18 en el apéndice B, obtenemos x = 0.8565 g y s = 0.0518 g. Primero construya un in-
tervalo de confianza del 95% de m, suponiendo que la población es grande, y luego construya un
intervalo de confianza del 95% para el peso medio de dulces M&M que se encuentran en la
bolsa llena de donde se tomó la muestra. La bolsa llena tiene 465 dulces M&M. Compare los
resultados.

También podría gustarte