Está en la página 1de 44

Page 1

Distribuciones derivadas del muestreo

Diseñar de forma práctica una distribución muestral para la media de la población explicando la relación que guardan
estadísticos y parámetros, es decir las relaciones entre las medidas calculadas en la población y las calculadas en las
muestras.

DISTRIBUCION MUESTRAL: Es el conjunto de estadísticos (valores que resultan del análisis de muestreo), que pueden
obtenerse de las diferentes muestras de igual tamaño que conforman una población determinada.

DISTRIBUCION MUESTRAL DE MEDIAS: Es una distribución de probabilidades de todas las medias posibles de las
muestras de igual tamaño que se pueden extraer de poblaciones dadas.

Distribución Muestral de la media


Si una muestra aleatoria de tamaño 𝑛 se elige de una población que tiene 𝜇 y varianza 𝜎 2 , entonces 𝑥̅ es una variable
aleatoria cuya distribución tiene media 𝜇.
𝜎2 𝜎
Para muestras tomadas de poblaciones infinitas la varianza de esta distribución es y el error estándar es 𝜎𝑥̅ =
𝑛 √𝑛
Siempre que:
1. la población sea infinita
𝑛
2. la población sea finita y el tamaño de la muestra sea menor o igual a 5% del tamaño de la población; es decir ≤ 0.05.
𝑁
𝜎 2 𝑁−𝑛 𝜎 𝑁−𝑛
Para muestras extraídas de poblaciones finitas de tamaño 𝑁 la varianza es ( ) y el error estándar es 𝜎𝑥̅ = √
𝑛 𝑁−1 √𝑛 𝑁−1
𝑛
El factor de corrección se utiliza si ≥0.05.
𝑁

Observamos que, efectivamente, cuanto mayor es la muestra, menor resulta la desviación típica y, por tanto, hay menos
dispersión. Este cociente que nos da la desviación típica de la media aritmética se conoce como error estándar.

Ejemplos:
1. Se tienen las estaturas de 3000 estudiantes varones de una universidad, están distribuidas normalmente, con
media de 68 pulgadas y desviación estándar de 3 pulgadas. Si se toma una muestra de 2000 estudiantes, ¿cuál
es el error estándar de la media?

2. A partir de una población de 125 artículos con una media de 105 y desviación estándar de 17, se eligieron 64
artículos. ¿Cuál es el error estándar de la muestra?

3. La desviación estándar de una población es igual a 12, se han elegido muestras de tamaño 4. El error estándar
de la media es?

4. Se encontró que la desviación estándar de los sueldos anuales en la población de 2500 administradores de una
empresa era de 4000. Si se toma una muestra de 30 administradores. ¿Cuál es la desviación estándar de la
distribución muestral de la media?

5. Si de los miles de cajas de cereales empacadas durante un turno usted selecciona de manera aleatoria una
muestra de 25 cajas, si la desviación estándar del proceso de llenado de cereales de 15 gramos, calcule el error
estándar de la media.

Teorema del límite central


Este teorema nos permite asignar probabilidades a intervalos de valores 𝑥̅ . Donde su distribución es aproximadamente
normal, el cual establece:
Cuando se seleccionan muestras aleatorias simples de tamaño 𝑛 de una población, la distribución de la media muestral
puede aproximarse mediante una distribución normal a medida que el tamaño de la muestra se hace grande. (𝑛 > 30)
Si 𝑥̅ es la media de una muestra aleatoria de tamaño 𝑛 extraída de una población que tiene media 𝜇 y varianza 𝜎 2 , entonces
̅−𝝁
𝒙
𝒁= 𝝈 es el valor de una variable aleatoria cuya función de distribución se aproxima a la distribución normal estándar
√𝒏
cuando 𝑛 es muy grande.
Page 2
Ejemplos:

1. Mary Bartel, auditora de una gran compañía de tarjetas de crédito, sabe que el saldo promedio mensual de un
cliente dado es $112 y la desviación estándar es $56. Si Mary audita 50 cuentas seleccionadas al azar, encuentre
la probabilidad de que el saldo promedio mensual de la muestra sea:
a) mínimo $100
b) De entre $100 y $130

2. Sabemos que el tiempo medio de espera en la cola de un banco es de 15 minutos, con una desviación estándar
de 5 minutos. Si tomamos al azar a un grupo de 35 clientes:
a) Calcula el error estándar
b) Cuál es la probabilidad de que el tiempo medio de espera del grupo fuera menor de 17 minutos
c) Cuál es la probabilidad de que estuviera entre 12 y 16 minutos
d) Cuál es la probabilidad de que sea mayor de 18 minutos

3. Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se empaquetaron en cajas
de 100 unidades. Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor
que 495 g.

4. Un auditor extrae una muestra aleatoria de tamaño 𝑛 = 36. De una población de mil cuentas por cobrar. La media
poblacional de las cuentas por cobrar es 𝜇 = 260 y la desviación estándar poblacional es 𝜎 = $45. ¿Cuál es la
probabilidad de que la media muestral sea menor que $250?

5. En unos grandes almacenes la media de los salarios es de $10,500 con una desviación estándar de $2,500. Se
preguntó a 35 empleados aleatoriamente por su sueldo. ¿Cuál es la probabilidad de que la media correspondiente
de los 35 empleados fuera inferior a $10,000?

6. A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligieron 64 artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la 𝑃 (107.5 ≤ 𝑥̅ ≤ 109)?

7. En una muestra de 55 observaciones a partir de una distribución normal con media 98.6 y desviación estándar
17.2
a) ¿cuánto vale 𝑃(92 < 𝑥̅ < 102)?
b) encuentre la probabilidad correspondiente dada una muestra de 36.
Page 3

Problemas Teorema del límite central

1. En una muestra de 16 observaciones de una distribución normal con una media de 150 y una varianza de 256,
¿cuál es
a) P ( < 160)
b) P ( > 142)
c) P ( < 142)
Si, en vez de 16 observaciones, se toman sólo 9, encuentre
d) P ( < 160)
e) P ( > 142)
f) P ( < 142)

2. Para una muestra de 19 observaciones de una distribución normal con media 18 y desviación estándar 4.8,
calcule
a) P (20 < < 23)
b) P (16 < < 20)
c) P (15 < < 16)
d)Suponga un tamaño de muestra de 48. ¿Cuál es la nueva probabilidad en los incisos anteriores?

3. En una distribución normal con media de 56 y desviación estándar de 21, ¿qué tan grande se debe tomar
una muestra para que haya al menos el 90% de posibilidades de que su media sea mayor que 52?

4. En una distribución normal con media de 375 y desviación estándar de 48, ¿de qué tamaño debe tomarse
una muestra para que la probabilidad sea al menos de 0.95 de que la media de la muestra caiga entre 370
y 380?

5. Un astrónomo del Observatorio del Monte Palomar observa que durante la lluvia de meteoritos Geminid,
aparece un promedio de 50 de ellos cada hora, con una varianza de nueve meteoritos al cuadrado. La lluvia
de meteoritos Geminid se presentará la semana siguiente.
a) Si el astrónomo observa la lluvia durante cuatro horas, ¿cuál es la probabilidad de que aparezcan al
menos 48 meteoritos por hora?
b) Si el astrónomo observa otra hora, ¿se elevará o disminuirá esta probabilidad? ¿Por qué?

6. El costo promedio de un estudio en condominio en el desarrollo Cedar Lakes es de $62,000 con una desviación
estándar de $4,200.
a) ¿Cuál es la probabilidad de que un condominio en este desarrollo cueste al menos $65,000?
b) ¿La probabilidad de que el costo promedio de una muestra de dos condominios sea al menos de $65,000
es mayor o menor que la probabilidad de que un condominio cueste eso? ¿En qué cantidad?

7. La agencia de colocaciones Robertson Employment aplica, habitualmente, una prueba estándar de inteligencia
y aptitud a todas las personas que buscan trabajo por medio de la compañía. La agencia ha recolectado datos
durante varios años y ha encontrado que la distribución de resultados no es normal, sino que está sesgada a
la izquierda con una media de 86 y una desviación estándar de 16. ¿Cuál es la probabilidad de que en una
muestra de 75 solicitantes que realizan la prueba, el resultado medio sea menor de 84 o mayor de 90?
Page 4

Tamaño de la muestra
El error estándar es una medición de dispersión de las medias de muestras alrededor de la media de
población. Si la dispersión disminuye (si  , se hace más pequeña), entonces los valores tomados por la media
de la muestra tienden a agruparse más cercanamente alrededor de µ. Por el contrario, si la dispersión se
incrementa (si  , se hace más grande), los valores tomados por la media de la muestra tienden a agruparse
menos cercanamente alrededor de µ. Podemos concebir esta relación así: al disminuir el error estándar, el
valor de cualquier media de muestra probablemente se acercará al valor de la media de población.

Los especialistas en estadística describen este fenómeno de otra manera: al disminuir el error estándar, se
incrementa la precisión con la que se puede usar la media de muestra para estimar la media de población.

Ejemplo:
Para los siguientes datos calcular 
a) n = 10  = 100
b) n = 100  = 100

Estos ejemplos muestran que, debido al hecho de que  , varía inversamente con la raíz cuadrada de n, hay
una utilidad decreciente en el muestreo.
Es cierto que muestrear más elementos disminuye el error estándar, pero este beneficio puede no valer el
costo. Un estadístico diría: “El aumento de precisión no vale el costo del muestreo adicional”. En un sentido
estadístico, rara vez vale la pena tomar muestras excesivamente grandes. Los administradores debieran
evaluar siempre tanto el valor como el costo de la precisión adicional que obtendrían de una muestra mayor
antes de comprometer recursos para tomarla.

Fórmula para calcular n

Medias

E: Error máximo admisible. La diferencia


entre la media poblacional y muestral |μ - |
La distancia entre las dos medias.

Proporciones
Page 5

El multiplicador de población finita


Podemos concebir esta relación así: al disminuir el error estándar, el valor de cualquier media de muestra
probablemente se acercará al valor de la media de población. Los especialistas en estadística describen este
fenómeno de otra manera: al disminuir el error estándar, se incrementa la precisión con la que se puede usar
la media de muestra para estimar la media de población.

Ejemplo 1. Supongamos que estamos interesados en una población de 20 compañías textiles del mismo
tamaño, todas estas fábricas experimentan una producción excesiva de trabajo. Nuestro estudio indica que
la desviación estándar de la distribución de la producción anual es igual a 75 empleados. Si muestreamos
cinco de estas compañías textiles ¿Cuál es el error estándar de la media?

Ejemplo 2. Digamos que tenemos una población de 1,000 elementos y que hemos tomado una muestra de
20. Calcular el error estándar de la media utilizando el multiplicador de población finita.

Cuando el tamaño de la población N es muy grande en relación con el tamaño de la muestra n, el


multiplicador de población finita toma un valor cercano a 1.0. Los especialistas en estadística se refieren a la
fracción n/N como la fracción de muestreo, porque es la fracción de la población N contenida en la muestra.
Cuando la fracción de muestreo es pequeña, el error estándar de la media para poblaciones finitas es tan
cercano a la media para poblaciones infinitas que bien podríamos utilizar la misma fórmula para ambas
desviaciones. La regla generalmente aceptada es: si la fracción de muestreo es menor a 0.05, no es necesario
usar el multiplicador de población finita.

Problemas

1. A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligieron 64
artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la P (107.5 < < 109)?

2. Juanita Martínez, investigadora de la Colombian Cofee Corporation, está interesada en determinar la tasa
de uso de café por hogar en Estados Unidos. Ella cree que el consumo anual por hogar tiene distribución
normal con media µ desconocida y desviación estándar cercana a 1.25 libras.
Page 6

a) Si Juanita toma una muestra de 36 hogares y registra su consumo de café durante un año, ¿cuál es
la probabilidad de que la media de la muestra se aleje de la media de la población no más de media
libra?
b) ¿Qué tan grande debe ser la muestra que tome para tener el 98% de certidumbre de que la media
de la muestra no se aleja más de media libra de la media de la población?

3. Dada una población de tamaño N = 80 con una media de 22 y una desviación estándar de 3.2, ¿cuál es la
probabilidad de que una muestra de 25 tenga una media de entre 21 y 23.5?

4. De una población de 75 elementos con media de 364 y varianza de 18, se seleccionaron 32 elementos al
azar.
a) ¿Cuál es el error estándar de la media?
b) ¿Cuál es la P(363 < < 366)?

5. Para una población de tamaño N = 80 con media de 8.2 y desviación estándar de 2.1, encuentre el error
de la media para los siguientes tamaños de muestra:
a) n = 16.
b) n = 25.
c) n = 49.

6. Tread-On-Us ha diseñado una nueva llanta y no saben cuál será la vida promedio de las cuerdas. Saben que
la vida de las cuerdas tiene una distribución normal con desviación estándar de 216.4 millas.
a) Si la compañía toma una muestra de 800 llantas y registra la vida de sus cuerdas, ¿cuál es la
probabilidad de que la media de la muestra esté entre la media verdadera y 300 millas más que la
media verdadera?
b) ¿Qué tan grande debe ser la muestra para tener el 95% de seguridad de que la media muestral estará
a no más de 100 millas de la media verdadera?

7. Un equipo de salvamento submarino se prepara para explorar un sitio, mar adentro frente la costa de
Florida, donde se hundió una flotilla entera de 45 galeones españoles. A partir de registros históricos, el
equipo espera que estos buques naufragados generen un promedio de $225,000 de ingresos cada uno
cuando se exploren, con una desviación estándar de $39,000. El patrocinador del equipo, sin embargo, se
muestra escéptico, y ha establecido que si no se recuperan los gastos de exploración que suman $2.1
millones con los primeros nueve galeones naufragados, cancelará el resto de la exploración. ¿Cuál es la
probabilidad de que la exploración continúe una vez explorados los nueve primeros barcos?
Page 7

Distribución muestral de

La distribución muestral de es la distribución de probabilidad de todos los posibles valores de la proporción


muestral .
La proporción muestral es el estimador puntual de la proporción poblacional p. La fórmula para calcular la
proporción muestral es

donde
x = número de elementos de la muestra que poseen la característica de interés
n = tamaño de la muestra

Valor esperado de
El valor esperado de , la media de todos los posibles valores de , es igual a la proporción poblacional p.

Error estándar de
Como en el caso de la desviación estándar de la desviación estándar de obedece a si la población es finita o
infinita. Las dos fórmulas para calcular la desviación (error) estándar de se presentan a continuación.

Se seguirá la misma regla recomendada para la media poblacional. Es decir, si la población es finita y n/N <
𝑝(1−𝑝)
0.05 se usará √ . Pero, si la población es finita y n/N > 0.05, entonces deberá usar el factor de corrección
𝑛
para una población finita (multiplicador de población finita).

Ejemplo. El director de personal desea saber cuál es la probabilidad de obtener un valor de que no difiera en
más de 0.05 de la proporción poblacional de los administradores de EAI que han participado en el programa
de capacitación. Es decir, ¿cuál es la probabilidad de tener una muestra en la que esté entre 0.55 y 0.65?
Page 8

Ejercicios:

1. De una muestra aleatoria de tamaño 100 de una población en la que p = 0.40.


a. ¿Cuál es el valor esperado de ?
b. ¿Cuál es el error estándar de ?

2. Una proporción poblacional es 0.40. Se toma una muestra aleatoria de tamaño 200 y la proporción muestral
se usa para estimar la proporción poblacional.
a. ¿Cuál es la probabilidad de que la proporción muestral esté entre ±0.03 de la proporción poblacional?
b. ¿De que la proporción muestral esté entre ±0.05 de la proporción poblacional?

3. Suponga que la proporción poblacional es 0.55. Calcule el error estándar de la proporción,  , para los
tamaños de muestra 100, 200, 500 y 1000. ¿Qué puede decir acerca del tamaño del error estándar a medida
que el tamaño de la muestra aumenta?

4. La proporción poblacional es 0.30. ¿Cuál es la probabilidad de que la proporción muestral esté entre ± 0.04
con los tamaños de muestra siguientes?
a. n = 100
b. n = 200
c. n = 500
d. n = 1000
e. ¿Qué ventaja tiene un tamaño grande de muestra?

5. El director de una empresa piensa que 30% de los pedidos provienen de nuevos compradores. Para ver la
proporción de nuevos compradores se usará una muestra aleatoria simple de 100 pedidos.
a. Suponga que el director está en lo cierto y que p = 0.30. ¿Cuál es la distribución muestral de en
este estudio?
b. ¿Cuál es la probabilidad de que la proporción muestral de esté entre 0.20 y 0.40?
c. ¿Cuál es la probabilidad que la proporción muestral de esté entre 0.25 y 0.35?
Page 9

Problemas de repaso Teorema del límite central


1. La Agencia de Aduanas de Estados Unidos revisa a todos los pasajeros que llegan del extranjero cuando
entran al país. La agencia informa que en promedio se encuentra que 42 personas diarias, con una
desviación estándar de 11, llevan material de contrabando al entrar a Estados Unidos a través del
aeropuerto John F. Kennedy de Nueva York. ¿Cuál es la probabilidad de que, en cinco días en el aeropuerto,
el número promedio de pasajeros que llevan contrabando excedan los 50?

2. La HAL Corporation fabrica grandes sistemas de cómputo y siempre se ha ufanado de la confiabilidad de


sus unidades de procesamiento central del Sistema 666. De hecho, la experiencia pasada ha mostrado que
el tiempo improductivo mensual de las CPU del Sistema 666 promedia 41 minutos, con una desviación
estándar de 8 minutos. El centro de cómputo de una gran universidad estatal mantiene una instalación
formada por seis CPU del Sistema 666. James Kitchen, el director del centro, siente que se proporciona un
nivel satisfactorio de servicio a la comunidad universitaria si el tiempo improductivo promedio de las seis
CPU es menor que 50 minutos al mes. Dado cualquier mes, ¿cuál es la probabilidad de que Kitchen se sienta
satifecho con el nivel de servicio?

3. Los miembros de la Organización para la Acción de los Consumidores mandan más de 250 voluntarios al día
a todo el estado para incrementar el apoyo para un proyecto de protección al consumidor, que está
actualmente en debate en la cámara legislativa estatal. Por lo general, cada voluntario visita una casa y
habla brevemente con el residente con la esperanza de que éste firme una petición dirigida a la legislatura
estatal. En promedio, un voluntario obtendrá 5.8 firmas diarias para la petición, con una desviación
estándar de 0.8. ¿Cuál es la probabilidad de que una muestra de 20 voluntarios obtengan un promedio de
entre 5.5 y 6.2 firmas diarias?

4. Setenta capturistas del departamento de vehículos automotores cometen un promedio de 18 errores por
día, distribuidos según una normal con desviación estándar de 4. Un auditor de campo puede verificar el
trabajo de 15 empleados por día. Encuentre la probabilidad de que el número de errores promedio en un
grupo de 15 empleados verificados en un día sea
a) menor que 15.5.
b) mayor que 20.

5. Se calcula que una población tiene una desviación estándar de 10. Desea estimar la media de la población
a menos de 2 unidades del error máximo admisible, con un nivel de confianza de 95%. ¿De qué tamaño
debe ser la muestra?

6. Quiere estimar la media de la población a menos de 5, con un nivel de confianza de 99%. Se calcula que la
desviación estándar es de 15. ¿De qué tamaño debe ser la muestra?

7. El estimador de la proporción poblacional debe estar a más o menos 0.05, con un nivel de confianza de
95%. El mejor estimador de la proporción poblacional es de 0.15. ¿De qué tamaño debe ser la muestra que
se requiere?

8. El estimador de la proporción poblacional debe estar a más o menos de 0.10, con un nivel de confianza de
99%. El mejor estimador de la proporción poblacional es de 0.45. ¿De qué tamaño debe ser la muestra que
se requiere?
Estimadores y sus propiedades Page 10

Hay dos formas de hacer inferencia acerca de un parámetro de una población: podemos estimar el valor del parámetro
desconocido o podemos tomar una decisión acerca de un valor hipotético del parámetro al cual llamaremos estimador.

Estimador puntual. Es una regla o fórmula que nos dice como calcular una estimación numérica con base a las
determinaciones contenidas en una muestra. El número que resulta del cálculo es una estimación.

Estimador de intervalo. Es una fórmula que nos dice cómo utilizar los datos de muestra para calcular un intervalo que
estime un parámetro de población.

La probabilidad de éxito en la estimación se representa con 1 − α y se denomina nivel de confianza y habitualmente se


da en porcentaje (1 − α)%. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una
medida de las posibilidades de fallar en la estimación mediante tal intervalo.

Estimación puntual y por intervalo de una media para una muestra grande (𝑛 > 30)
Cuando empleamos una media muestral para estimar la media de una población, se sabe que por muy exacto que
pueda ser el método se puede cometer un error al estimar, para calcular el error es la siguiente fórmula:
𝜎
𝐸 = 𝑍∝⁄2
√𝑛
Donde:
𝐸 = 𝐸𝑟𝑟𝑜𝑟 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 (𝑒𝑟𝑟𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜)
𝛼 = 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑜 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛

Para calcular la estimación por intervalo de la media poblacional, se requiere conocer el error de estimación, con lo cual
formaremos el intervalo:
𝑥̅ − 𝐸 ≤ 𝜇 ≤ 𝑥̅ + 𝐸

Ejemplo:

1. Un supervisor intenta utilizar la media de una muestra aleatoria de tamaño 𝑛 =150 para estimar la aptitud
mecánica promedio de los obreros de la línea de ensamblado en una gran industria. Si por su experiencia
puede suponer que 𝜎 = 6.2 para tales datos, ¿qué podemos asegurar con una probabilidad de 0.99 sobre la
medida máxima de este error?

2. Una muestra aleatoria de tamaño 𝑛 = 100 se extrae de una población con 𝜎 = 5.1. Dado que la media muestral
es 𝑥̅ = 21.6 construya un intervalo de confianza del 95% para la media 𝜇 de la población.

3. La operadora de una central telefónica está consciente de que la población de duraciones de llamadas esta
normalmente distribuida, con una desviación estándar de cuatro minutos. Una muestra de 50 llamadas produce
una duración media de 9.1 minutos. Construya un intervalo de confianza de 95% para la duración media de
todas las llamadas.
Page 11
4. Un organismo oficial desea conocer el promedio de los salarios de los trabajadores de una gran zona industrial,
para lo cual han seleccionado una muestra de 100 trabajadores, obteniéndose una media semanal de $263.55.
La experiencia ha mostrado que la desviación estándar para esta población es $490.00. Con esta información,
hay que construir un intervalo de confianza del 90% para la media del salario semanal.

5. Un profesor de sexto año de primaria acostumbra hacer al inicio de cada año escolar un intervalo de confianza
de 92% con los resultados de una prueba estandarizada para medir el coeficiente de inteligencia (IQ) de sus
alumnos. Con una media 𝜇 = 90 y una varianza 𝜎 2 = 100. Si este año las calificaciones de sus 45 alumnos
arrojaron una media de 93.8. ¿Qué expectativas obtendrá el profesor con el intervalo de confianza?

6. Una compañía de tarjetas de crédito ha estado expidiendo estados de cuenta a sus millones de clientes el
último día de cada mes y recibe pagos, en promedio 13 días después con una desviación estándar de 5.3 días.
Decide experimentar con la fecha de expedición con la esperanza de acelerar los pagos. Se cambia una sola
muestra aleatoria de 500 clientes a una fecha de expedición a mitad de mes. El lapso promedio de tiempo entre
la fecha de expedición y de pago en la muestra resulta de 18.9 días. Prepare un intervalo de confianza del 98%
para el periodo medio entre la expedición y el pago para todos los clientes, si a todos se les diera la fecha de
expedición de mitad de mes.

7. Se sabe que la población normalmente distribuida de inversiones en acciones hechas por 75 empleados de
una firma tiene una desviación estándar de 99 dólares. Una muestra aleatoria de 36 empleados demuestra una
inversión media de 736 dólares. Construya un intervalo de confianza de 99% para la inversión media de todos
los empleados.
8. La superintendencia de Contribuciones (IRS) hace auditorías a los operadores de unos 13,000 aeropuertos
privados, para lo cual toma una muestra aleatoria de 100 de ellos. El IRS descubre un error promedio, en los
ingresos gravables reportados, de 14,750 dólares, con una desviación estándar muestral de 3,600 dólares.
Determine un intervalo de confianza del 94% para el error promedio hecho por todos los aeropuertos existentes.

9. En un año dado se desocupan 1000 departamentos en una ciudad; una muestra aleatoria de 169 y muestran
un costo medio por reparaciones de 171.32 dólares, con una desviación estándar de 15.39 dólares. Construya
un intervalo de confianza del 90% para el costo medio por reparaciones de todos los departamentos que se
desocuparon.

Tamaño de muestra

𝑍∝⁄2 (𝜎) 2 𝑍∝⁄2 (𝜎) 2


𝑛=[ ] , 𝑛=[ ]
𝑥̅ −𝜇 𝐸
Ejemplos:

1. Una investigadora quiere determinar el tiempo promedio que un mecánico tarda en intercambiar los neumáticos
de un automóvil, y además desea poder asegurar con una confianza del 95% que el error máximo de estimación
de su muestra sea a lo sumo 0.50 minutos. Si puede presumir por experiencia que 𝜎 = 1.6 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 ¿Qué
tamaño debe tener la muestra?

2. Se calcula que una población tiene una desviación estándar de 10. Desea estimar la media de la población a
menos de 2 unidades del error máximo admisible, con un nivel de confianza de 95 %. ¿de qué tamaño debe
ser la muestra?

3. En una distribución normal con media de 56 y desviación estándar de 21, ¿qué tan grande se debe tomar una
muestra para que haya al menos 90% de posibilidades de que su media sea mayor que 52?

4. Para conocer con un 95 % de confianza, un error máximo de 500 pts y 𝜎 = 750 pts, se quiere hacer una
encuesta a jóvenes, sobre sus gastos durante el fin de semana. ¿Cuál deberá ser el tamaño de la muestra?

5. Se desea establecer, con un nivel de confianza del 95%, el peso medio de las naranjas de un barco que acaba
de atracar, de forma que el error no sobrepase los 15 gramos. Si la desviación estándar es de 60 gramos.
¿Cuántas naranjas deberán ser escogidas al azar para poder establecer dicha media?
Estimación puntual y por intervalo de una proporción Page 12

Estimación puntual de una proporción.

Los especialistas en estadística, a menudo, utilizan una muestra para estimar la proporción de ocurrencias de un evento
en una población. La proporción de muestra 𝑝̂ es el mejor estimador puntual de la proporción de una población P. El
𝑥
estimador de P es: 𝑝̂ = donde 𝑥 es el número de éxitos en el tamaño de la muestra 𝑛.
𝑛

𝑝̂𝑞̂
El margen de error del estimado P está dado por 𝐸 = 𝑍∝ √ donde 𝑞̂ = 1 − 𝑝̂
2 𝑛

Donde:
𝑝̂ − 𝑝 𝑝 = 𝑒𝑠 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑍= 𝑝̂ = 𝑒𝑠 𝑙𝑎 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑝𝑞

𝑛 𝑛 = 𝑒𝑠 𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Estimación por intervalo de una proporción

El intervalo de confianza para la proporción de una población P se calcula con la siguiente fórmula:

𝑝̂ − 𝐸 ≤ 𝑝 ≤ 𝑝̂ + 𝐸
Tamaño de muestra
Si 𝑝̂ se utiliza como estimación de p, podemos tener una confianza de (1−∝)100% de que el error será menor que una
cantidad específica cuando el tamaño de la muestra sea aproximadamente
2
(𝑍∝⁄2 ) 𝑝̂ 𝑞̂
𝑛=
𝐸2
Ejemplo:

1. Dados los siguientes datos 𝑛 = 500 , 𝑝 = 30%


Encuentre:
a) 𝑃(𝑝̂ ≤ 0.301)
b) 𝑃(𝑝̂ ≥ 0.289)
c) 𝑃(0.289 ≤ 𝑝̂ ≤ 0.301)

2. En unas elecciones a alcalde, el 56% de los votantes opto por el candidato A mientras que el 44% lo hizo por el
candidato B. calcula la probabilidad de que en una muestra de 50 votantes haya, al menos, 30 favorables al
candidato A.

3. Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra
aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma
cigarrillos sea menor que 0.55.

4. Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una
reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra
aleatoria de 150 personas con malestar estomacal usa el medicamento, encuentre la probabilidad de que la
proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%.

5. Los sondeadores de opinión enfrentan diversos factores que confunden los resultados, como las contestadoras
telefónicas. En una encuesta a 1,068 mexicanos, 673 dijeron que tenían contestadora telefónica. Utilizando estos
resultados de muestra, determine el estimado puntual de la proporción así como su error máximo con un 95% de
confianza de todos los mexicanos que tenían contestadora telefónica.
6. Se realizó una encuesta a 350 familias, preguntando si poseían computadora en casa o no, encontrándose que
Page 13
75 de ellas poseían. Estima la proporción real de familias que dispone de una computadora, con un intervalo de
confianza del 95%

7. Para una organización muy grande, hacemos la estimación de que proporción de sus empleados prefieren
planificar sus propios beneficios de retiro en lugar de seguir un plan patrocinado por la compañía. Tomamos una
muestra aleatoria de 75 empleados y encontramos que el 0.4 de ellos están interesados en seguir sus propios
planes de retiro. La administración solicita que utilicemos un 99% de confianza para encontrar un intervalo que
contenga la proporción verdadera de la población.

8. Una institución de salud ha encontrado en una muestra de 2000 diabéticos que el 61.9% lo son por factores no
hereditarios. calcula un intervalo de confianza del 98% para la proporción de casos de diabetes por factores
hereditarios en la población.

9. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función
eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de
venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas.
Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la
población que no pasan todas las pruebas.

10. En un estudio el valor planeado para la proporción es 0.35. ¿de qué tamaño se debe tomar la muestra para dar un
intervalo de confianza de 95% con un margen de error de 0.05?

11. Suponga que el presidente de estados unidos desea un cálculo de la proporción de la población que apoya su
actual política relacionada con las revisiones del sistema de seguridad social. El presidente quiere que el cálculo
se encuentre a menos de 0.04 de la proporción real. Suponga un nivel de confianza de 95% los asesores políticos
del presidente calculan que la proporción que apoya la actual política es de 0.60. ¿De qué tamaño debe ser la
muestra que se requiere?

12. Suponga que deseamos encuestar a estudiantes de una universidad. Deseamos determinar qué proporción de
estos está a favor de un nuevo sistema de evaluación. Nos gustaría contar con un tamaño de muestra que nos
permita tener una certeza del 90% de que estamos estimando la proporción verdadera de la población de 40,000
estudiantes a favor del nuevo sistema de evaluación, ±0.02.

13. Para un mercado de prueba, encuentre el tamaño de la muestra requerido para estimar la proporción verdadera
de consumidores satisfechos con cierto producto dentro de ±0.04 en un nivel de confianza del 90%. Suponga que
no se tiene una idea buena acerca de cuál es la proporción.

14. El estimador de la proporción poblacional debe estar a más o menos 0.05, con un nivel de confianza de 95%. El
mejor estimador de la proporción es de 0.15. ¿De qué tamaño debe ser la muestra que se requiere?

15. Un curso de lectura rápida garantiza cierto aumento en la velocidad de lectura en dos días. El profesor sabe que
algunas personas no podrán lograr este incremento, de manera que antes de establecer el porcentaje garantizado
de personas que lograran el incremento en la velocidad de lectura, desea tener una confianza del 98% de que el
porcentaje se ha estimado dentro ±5% del valor verdadero. ¿Cuál es el tamaño de muestra más conservador
necesario en este problema?

Distribución t de Student
Las características de la distribución t son:

1. Es una distribución continua.

2. Tiene forma de campana y es simétrica

3. Es una familia de curvas. Todas tienen la misma media cero, pero sus desviaciones estándar dieren de acuerdo
al tamaño de la muestra.

4. A medida que los grados de libertad aumentan, la dispersión de la curva t correspondiente disminuye.

5. La distribución t es más baja y dispersa que la distribución normal. Cuando el tamaño de la muestra se
incrementa, la distribución t se aproxima a la normal.
Si 𝑥̅ es la media de una muestra aleatoria de tamaño n tomada de una población normal que tiene media 𝜇 y varianza
Page 14
𝑥̅ −𝜇
𝜎 2 , entonces: 𝑡 = 𝑆 es el valor de una variable aleatoria con distribución t y parámetro 𝜐 = 𝑛 − 1. Puesto que se
√𝑛
desconoce 𝜎 en muchas aplicaciones prácticas, podemos efectuar aproximaciones adicionales sustituyendo 𝜎 para
desviación estándar muestral S.

Estimación puntual y por intervalo de una muestra pequeña (𝑛 ≤ 30)

Para una distribución normal de mediciones con media desconocida 𝜇 y varianza desconocida 𝜎 2 , un intervalo de
predicción de (1−∝)100% de una observación futura x

El error máximo se obtiene:


𝑆
𝐸 = 𝑡(∝⁄2 ,𝑛−1)
√𝑛
Para n ≤ 30
𝑥̅ − 𝐸 ≤ 𝜇 ≤ 𝑥̅ + 𝐸

Ejemplo:

1. Un fabricante de fusibles asegura que, con una sobrecarga de 20%, sus fusibles se fundirán al cabo de 12.4 minutos
en promedio. Para probar esta afirmación, una muestra de 20 fusibles fue sometida a una sobrecarga de un 20%, y
los tiempos en fundirse tuvieron una media de 10.63 y una desviación estándar de 2.48 minutos. Si se supone que
los datos constituyen una muestra aleatoria de una población normal, ¿con 95% de confianza construya un intervalo
para apoyar o refutar la afirmación del fabricante?

2. Se obtuvo una muestra aleatoria de siete amas de casa y se determinó que las distancias caminadas al realizar las
tareas domésticas dentro de la casa tenían un promedio de 39.2 millas por semana y una desviación estándar de la
muestra de 3.2 millas por semana. Construya un intervalo de confianza del 95% para la media de la población

3. Una muestra de 12 elementos tiene una media de 62 y una desviación estándar de 10. Construya un intervalo de
confianza del 95% para la media de la población.

4. La siguiente muestra de ocho observaciones fue tomada de una población infinita con distribución normal

75.3 76.4 83.2 91 80.1 77.5 84.8 81

a) Encuentre la media

b) Estime la desviación estándar

c) Construya un intervalo de confianza del 98% para la media de la población.

5. Las ventas diarias de cierta oficina comercial se supone que siguen una distribución normal. Para estimar el volumen
medio de ventas por día se realiza una muestra de 10 días escogidas al azar, resultando que la media de las ventas
de esos 10 días es de 100 con una desviación estándar de 4. Dar un intervalo de estimación para el volumen medio
de ventas por día con una confianza del 95%.

6. Cuando el gerente de una empresa se enteró que la media picante de la salsa fue sólo 12, estaba furioso y pidió
ajustes inmediatos a la receta, amenazando con despedir a toda la división de la salsa picante a menos que el medio
picante aumentara sobre 13. El día de ayer, se probaron 8 botellas al azar de la salsa nueva y encontró un medio
picante de 13.5 con una desviación estándar muestral de 0.75. Calcula el intervalo de confianza del 95% para la
media poblacional. Basado en la respuesta, ¿puedes estar el 95% seguro que el medio picante de la nueva salsa
estará encima de 13?
Page 15
7. Un artículo publicado presenta las siguientes 20 mediciones del tiempo de combustión residual en segundos de
especímenes tratados de ropa de dormir para niños:

9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.95 9.93 9.92 9.89
Construya un intervalo de confianza del 95% para el tiempo de combustión residual promedio.

8. El contenido de siete contenedores similares son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Encuentre un intervalo
de confianza del 95% para la media de todos los contenedores.

9. Un fabricante está consciente de que la duración de las baterías que fabrica su empresa esta normalmente
distribuida. Una muestra aleatoria de diez baterías muestra una duración media de 6 horas con una desviación
estándar de una hora. Construya un intervalo de confianza del 99% para la duración media de todas las baterías
producidas por el mismo proceso.
Page 16
Problemas de repaso Estimación de Intervalos

1. Una muestra aleatoria de 25 líderes de grupo, supervisores y personal similar de General Motors reveló
que, en promedio, pasan 6.5 años en su trabajo antes de ascender. La desviación estándar de la muestra
fue de 1.7 años. Construya un intervalo de confianza de 95%.

2. A un inspector de carne del estado de Iowa se le encargó calcular el peso neto medio de los paquetes de
carne molida con la etiqueta “3 libras”. Por supuesto, se da cuenta de que los paquetes no pesan
precisamente 3 libras. Una muestra de 36 paquetes revela que el peso medio es de 3.01 libras, con una
desviación estándar de 0.03 libras.
a) ¿Cuál es la media poblacional estimada?
b) Determine un intervalo de confianza de 95% para la media poblacional.

3. Un estudio reciente de 50 estaciones de gasolina de autoservicio en el área metropolitana de Greater


Cincinnati-Northern Kentucky reveló que el precio medio de la gasolina sin plomo era de $2.029 el galón.
La desviación estándar de la muestra fue de $0.03 el galón.
a) Determine un intervalo de confianza de 99% para el precio medio de la población.
b) ¿Es razonable concluir que la media poblacional fue de $1.50? ¿Por qué?

4. Una encuesta reciente a 50 ejecutivos despedidos reveló que se tardaron 26 semanas en colocarse en otro
puesto. La desviación estándar de la muestra fue de 6.2 semanas. Construya un intervalo de confianza de
95% para la media de población. ¿Es razonable que la media poblacional sea de 28 semanas? Justifique su
respuesta.

5. Marthy Rowatti recién asumió el puesto de director de la YMCA de South Jersey. Le gustaría contar con
datos recientes sobre el tiempo que han pertenecido a la YMCA sus miembros actuales. Para investigarlo,
suponga que selecciona una muestra aleatoria de 40 miembros actuales. El tiempo medio de membresía
de quienes se encuentran en la muestra es de 8.32 años, y la desviación estándar, de 3.07 años.
a) ¿Cuál es la media de la población?
b) Construya un intervalo de confianza de 90% para la media poblacional.
c) La directora anterior, en el breve informe que preparó al retirarse, indicó que ahora el tiempo medio de
membresía era de “casi 10 años”. ¿Confirma la información esta aseveración?

6. La American Restaurant Association reunió información sobre la cantidad de comidas que los matrimonios
jóvenes hacen fuera de casa a la semana. Una encuesta de 60 parejas indicó que la cantidad media de
comidas fuera de casa es de 2.76 comidas semanales, con una desviación estándar de 0.75 comidas por
semana. Construya un intervalo de confianza de 97% para la media poblacional.

7. Si la desviación estándar de la población es 78, encuentre el tamaño de muestra necesario para estimar la
media verdadera dentro de 50 puntos, para un nivel de confianza del 95%.
Page 17

8. Se tienen fuertes indicios de que la proporción es alrededor de 0.7. Encuentre el tamaño de muestra
necesario para estimar la proporción dentro de ±0.02 con un nivel de confianza del 90%.

9. Dada una población con una desviación estándar de 8.6, ¿qué tamaño de muestra es necesario para estimar
la media de la población dentro de ±0.5 con un nivel de confianza del 99%?

10. Debe votarse una propuesta importante y un político desea encontrar la proporción de personas que están
a favor de la propuesta. Encuentre el tamaño de muestra requerido para estimar la proporción verdadera
dentro de ±0.05 con un nivel de confianza del 95%. Suponga que no se tiene idea de cuál es la proporción.
¿Cuál sería el cambio en el tamaño de la muestra si pensara que cerca del 75% de las personas favorece la
propuesta? ¿Cuál sería el cambio si sólo alrededor del 25% favorece la propuesta?

11. La administración de la empresa Southern Textiles, recientemente ha sido atacada por la prensa debido a los
supuestos efectos de deterioro en la salud que ocasiona su proceso de fabricación. Un sociólogo ha
aventurado la teoría de que los empleados que mueren por causas naturales muestran una marcada
consistencia en la duración de su vida: los límites superior e inferior de la duración de sus vidas no difieren
en más de 550 semanas (alrededor de 10 1/2 años). Para un nivel de confianza del 98%, ¿qué tan grande
debe ser la muestra, dentro de ±30 semanas, que ha de examinarse para encontrar la vida promedio de estos
empleados dentro de ±30 semanas?

12. Food Tiger, una tienda local, vende bolsas de plástico para basura y ha recibido unas cuantas quejas respecto
a su resistencia. Parece que las bolsas que vende son menos resistentes que las de su competidor y, en
consecuencia, se rompen más a menudo. John C. Tiger, gerente de adquisiciones, está interesado en
determinar el peso máximo promedio que puede resistir las bolsas para basura sin que se rompan. Si la
desviación estándar del peso límite que rompe una bolsa es 1.2 kg, determine el número de bolsas que deben
ser probadas con el fin de que el señor Tiger tenga una certeza del 95% de que el peso límite promedio está
dentro de 0.5 kg del promedio verdadero.

13. La universidad está considerando la posibilidad de elevar la colegiatura con el fin de mejorar las instalaciones;
para ello, sus autoridades desean determinar qué porcentaje de estudiantes están a favor del aumento. La
universidad necesita tener una confianza del 90% de que el porcentaje se determinó dentro del 2% del valor
verdadero. ¿Qué tamaño de muestra se requiere para garantizar esta precisión independientemente del
porcentaje verdadero?
Page 18
Prueba de Hipótesis
Procedimiento basado en evidencia de la muestra y la teoría de la probabilidad para determinar si la hipótesis es una afirmación razonable.

Hipótesis estadística
Existen múltiples problemas en los cuales, en vez de estimar el valor de un parámetro, debemos decidir si una afirmación relativa a un
parámetro es verdadera o falsa; esto es, debemos probar una hipótesis relativa a un parámetro.
Una Hipótesis estadística es una aseveración sobre un modelo probabilístico. El procedimiento mediante el cual se juzga la factibilidad de
la hipótesis es una prueba de hipótesis.

Hay dos tipos de hipótesis: La Hipótesis Nula y la Hipótesis Alternativa.

La Hipótesis Nula (H₀) es aquella que el investigador está dispuesto a sostener como plausible, a menos que la evidencia experimental en
su contra sea sustancial. Dicho de otra manera, es una declaración tentativa de que un parámetro de la población es igual a un valor
específico. A menudo en tal declaración está implícita la idea de que "no hay diferencia" y de ahí el nombre de hipótesis nula. Es lo
establecido en registros históricos, lo que indica el contrato con el cliente, la aseveración de quien presta el servicio, etc.

La Hipótesis alternativa (HA) es la negación de la hipótesis nula. En otras palabras, es una declaración tentativa de que el mismo parámetro
de la población tiene un valor diferente del especificado en la hipótesis nula. Es lo que queremos estudiar.

Ejemplo 1 (Formular hipótesis). Puede convenir determinar si C.I. medio de los niños de cuatro años de edad es diferente de 100. Debido a
que se debe suponerse que no es diferente de 100, se tiene:

Ejemplo 2 (Formular hipótesis). Suponga que Toyota asegura que un nuevo modelo de automóvil rendirá un promedio de 30 millas por
galón en carretera. Si estuviera planeando un experimento para probar esta afirmación, ¿cuáles serían las hipótesis nula y alternativa?

Ejemplo 3. En el pasado la edad promedio de quienes tenían una póliza de seguro de vida en la compañía Empire Insurance era 48 años.
Cuando la compañía se expandió y ofreció más pólizas en todo el país, el jefe de finanzas llegó a pensar que la edad promedio podía haber
disminuido. Si planeara realizar un estudio para probar esta afirmación, ¿cuáles serían las hipótesis nula y alternativa?
<

Ejemplo 4 (Formular hipótesis). Se está probando un nuevo diseño de bolsas de aire, usadas en los automóviles, y se tiene el interés en
cuanto a que quizá no se abran de manera adecuada.

Las dos posibilidades opuestas son: "las bolsas se abren correctamente" o "las bolsas no se abren correctamente". La prueba sólo
puede producir hechos que desacrediten la hipótesis: "las bolsas se abren correctamente". En consecuencia:
H₀: las bolsas se abren correctamente HA: las bolsas no se abren correctamente

Ejemplo 5 (Formular hipótesis). Se desea demostrar que una nueva fórmula que se acaba de desarrollar da por resultado una pintura que
seca más rápido.
Las dos posibilidades opuestas son "seca más rápido" y "no se seca más rápido". Debido a que se desea demostrar la afirmación que
dice "seca más rápido" la hipótesis quedan como sigue:
H₀: no seca más rápido HA: seca más rápido

Ejemplo 6. (Formular hipótesis). Usted sospecha que un detergente de marca es mejor que el otro que vende la tienda de la esquina y
desea probar ambos productos porque preferiría comprar el detergente más barato, que es el que expende la tienda.
H₀: no hay diferencia en el desempeño de los detergentes (no es mejor)
HA: el detergente de marca es mejor que el detergente que vende la tienda de la esquina (es mejor)

Ejemplo 7: Un grupo de consumidores desea verificar el reclamo en la etiqueta de una marca de refrescos en botella. La etiqueta indica
que la botella contiene 1 litro del refresco. Los consumidores creen que en promedio, las botellas contienen menos de 1 litro.
=

La hipótesis nula es que la cantidad media de refresco en las botellas es (mayor o) o igual a un litro, pues es el reclamo en la etiqueta y los
consumidores aún no tienen evidencia para descartarla. La alternativa es que en promedio, las botellas contienen menos de 1 litro, pues el
consumidor quiere proteger su dinero y no ser engañado. Ciertamente no protestará si el contenido promedio es mayor de un litro.

Ejemplo 8: Por años, un agricultor ha estado usando abono orgánico para cultivar el café en su finca de 200 cuerdas. Su finca produce un
promedio de 620 libras de café por cuerda. Un comerciante le ofrece un abono químico con la promesa de que producirá más de 650 libras
de café por cuerda. Si es cierto lo que dice el comerciante, el agricultor usará el nuevo abono. Por esto decide probarlo y selecciona 30
lotes de una cuerda cada uno. Las hipótesis de interés son:

La hipótesis nula es que la cantidad media de libras de café por cuerda producido por el nuevo abono es menor o igual a 650 libras. El
agricultor parte de la premisa de que no dejará de usar el abono que ha usado por años, a menos que demuestre que el nuevo producirá un
promedio de más de 650 libras, lo que debe dejarle más ganancia.
Errores tipo I y tipo II
Page 19

En una prueba de hipótesis puede cometerse dos tipos de error.

∙ El Error Tipo I que consiste en rechazar una hipótesis nula que es cierta y
∙ El Error Tipo II que consiste en No rechazar una hipótesis nula que es falsa.
Las probabilidades de los errores respectivos se denotan por y
α = P[Error Tipo I]=P[Rechazar H₀ cuando es cierta]
β = P[Error Tipo II]=P[No rechazar H₀ cuando es falsa]

Una hipótesis estadística es esencialmente diferente de una proposición matemática debido a que la decisión sobre la veracidad de la
hipótesis estadística se funda en el comportamiento de una variable aleatoria y, en consecuencia, pueden tomarse decisiones equivocadas.

Existe una interrelación entre la probabilidad de un error Tipo I ( ), la probabilidad de un error Tipo II ( ) y el tamaño demuestra ( ). Si
cualquiera de estos incrementa o disminuye, uno o dos elementos se ven afectados.

- Si se reduce , entonces debe de aumentar o ( ) debe crecer.


- Si disminuye, entonces crece o es necesario aumentar ( ).
- Si ( ) disminuye, entonces crece o aumenta.

Para completar una prueba de hipótesis, es necesario escribir una conclusión que describa cuidadosamente el significado de la decisión
relativa al propósito de dicha prueba.

Se pueden presentar tres tipos de prueba de hipótesis que son:

- Unilateral Derecha (cola derecha). El investigador desea comprobar la hipótesis de un aumento en el parámetro, en este caso el nivel de
significancia se carga todo hacia el lado derecho, para definir las regiones de aceptación y rechazo.

- Unilateral Izquierda (cola izquierda).El investigador desea comprobar la hipótesis de una disminución en el parámetro, en este caso el
nivel de significancia se carga todo hacia el lado izquierdo, para definir las regiones de aceptación y rechazo.

- Bilateral (dos colas). El investigador desea comprobar la hipótesis de un cambio en el parámetro. El nivel de significancia se divide en dos
y existen dos regiones de rechazo.

- Valor p. Es la probabilidad de obtener un estadístico de prueba igual o más extremo que el resultado obtenido a partir de los datos
muéstrales, dados que la hipótesis nula H₀ es en realidad cierta.

⋅ Si el valor p es mayor o igual que α, la hipótesis nula no se rechaza


⋅ Si el valor p es menor que α, la hipótesis nula se rechaza.

Responder:
Page 20

Prueba de hipótesis sobre la media

En las pruebas de hipótesis para la media poblacional cuando se conoce la varianza o cuando el valor de la muestra es grande,
El valor estadístico de la prueba es:

El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación:

Criterio de decisión.

Valores de la distribución Normal estándar (Z)

Ejemplos:

 Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de forma aproximadamente normal con una media de
800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 40 focos tiene duración promedio de 788 horas,
¿muestran los datos suficiente evidencia para decir que la duración ha cambiado? Utilice un nivel de significancia de 0.05.

 Una muestra aleatoria de 100 muertes registradas en México el año pasado muestra una vida promedio de 71.8 años. Suponga una
desviación estándar poblacional años, esto parece indicar que la vida media hoy en día es mayor de 60 años. Utiliza 97% de
confianza.

 El gerente de un banco asegura que el tiempo medio de espera es de 15 minutos con una desviación estándar de 5 minutos. Se
tomaron al azar un grupo de 35 clientes y el tiempo promedio de espera fue de 16.5 minutos. Pruebe con un 99% de confianza que el
tiempo de espera no sea mayor de 15 minutos.

 Una empresa eléctrica fabrica baterías de celular que tienen una duración que se distribuye de forma aproximadamente normal con una
media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 35 baterías tiene una duración promedio de 788
horas, ¿muestran los datos suficiente evidencia para decir que la duración media no es 800? Utilice un nivel de significancia del 0.04.
Page 21
Prueba de hipótesis sobre una proporción

Estadístico de prueba:
O

Criterio de decisión.

Ejemplos:

 Hace algunos años el porcentaje de familias que tenían computadora en casa era del 18%. Se realizo una encuesta a 350 familias,
encontrándose que 75 de ellas tenían. Con estos datos es de pensar que el porcentaje de familias que tienen computadora ha
aumentado usa

 En el pasado, 15% de la propaganda por correo para donativos dio como resultado contribuciones. Se mando una nueva carta a una
muestra de 200 personas y 45 enviaron un donativo. Para de significancia, ¿se puede concluir que la nueva carta fue más
efectiva?

 Un constructor afirma que se instalan calentadores solares en 70% de todas las casas que se construyen hoy en día en la ciudad de
Richmond. ¿Estaría de acuerdo con esta afirmación si una investigación de casas nuevas en esta ciudad muestra que 8 de 15 tienen
instaladas calentadores? Utilice un nivel de significancia de 0.10

 Históricamente la proporción de clientes que compran con tarjeta de crédito en una determinada tienda es del 25%, sin embargo la
dueña de la tienda piensa que esta cifra ha disminuido significativamente. De los últimos 1122 clientes 242 compraron con tarjeta de
crédito. Con el 90% de confianza, se está cumpliendo lo que piensa la dueña?

 Un fabricante garantiza que el 90% de los equipos que comercializa están de acuerdo con los estándares exigidos. Para comprobar si
en esta fábrica se cumplían con estos requerimientos se tomó una muestra de 200 unidades y se encontró 25 equipos presentaban
algún tipo de defecto. A un nivel de significación del 5% ¿existe alguna evidencia que apoye la afirmación del fabricante?
Page 22
Prueba de hipótesis sobre la media, con varianza desconocida.
Estadístico de prueba:

EJEMPLOS:

 Cuando el gerente de una empresa se entero que la media picante de la salsa fue sólo 12, estaba furioso y pidió ajustes inmediatos a la
receta, amenazando con despedir a toda la división de la salsa picante a menos que el medio picante aumentara sobre 13. El día de
ayer, se probaron 8 botellas al azar de la salsa nueva y encontró un medio picante de 13.5 con una desviación estándar muestral de
0.75. Basado en la respuesta, ¿puedes estar el 95% seguro que el medio picante de la nueva salsa estará encima de 13?

 El tiempo real de atención a clientes en una empresa es de 3.5 minutos. Un licenciado en informática afirma que al instalar un sistema
de computación en tal empresa se reducirá el tiempo de espera, para la cual realizan pruebas con 13 clientes encontrando los siguientes
resultados en minutos
2.95 3.51 3.3 3.8 2.8 3 3.05 3.45 2.75 3.8 3.35 3.2 3.55
Realiza la prueba de hipótesis con un nivel de significancia de 4%

 Un supervisor desea probar que el promedio de calificaciones en las escuelas son menores a 12pts. Se selecciona una muestra
aleatoria de 25 escuelas y se obtiene una media muestral de 11.916 y una desviación estándar de 1.40. Haga una prueba de hipótesis
con
Page 23
Problemas de repaso Prueba de Hipótesis

1. Un documental televisivo acerca de comer en exceso afirmaba que los estadounidenses tienen un
sobrepeso aproximado de 10 libras en promedio. Para probar esta afirmación, examinaron a 18 individuos
elegidos aleatoriamente, y encontraron que su sobrepeso promedio era 12.4 libras, con una desviación
estándar de la muestra de 2.7 libras. A un nivel de significancia de 0.01, ¿hay alguna razón para dudar de la
validez del valor afirmado de 10 libras?

2. El departamento de estadística instaló, el año pasado, luces, calentadores y aire acondicionado eficientes
en el consumo de energía. Ahora desean determinar si el consumo promedio mensual de energía ha
disminuido. ¿Deben realizar una prueba de una o de dos colas? Si el consumo promedio mensual anterior
era 3,124 kilowatts hora, ¿cuáles son la hipótesis nula y alternativa?

3. Ellen Harris, una ingeniera industrial, estuvo acumulando tiempos normales para varias tareas sobre un
proceso de ensamble de trabajo intensivo. Este proceso incluía 300 estaciones de trabajo diferentes, cada
una efectuando las mismas actividades de ensamble. Muestreó siete estaciones y obtuvo los siguientes
tiempos de ensamble, en minutos, para cada estación: 1.9, 2.5, 2.9, 1.3, 2.6, 2.8 y 3.0.
a) Calcule el tiempo medio de ensamble y la desviación estándar correspondiente para la muestra.
b) Estime la desviación estándar de la población.
c) Dé un intervalo de confianza del 98% para el tiempo medio de ensamble.

4. Atlas Sporting Goods ha puesto en marcha una promoción especial para su estufa de propano y siente
que la promoción debe provocar un cambio en el precio para el consumidor. Atlas sabe que antes de que
comenzara la promoción, el precio promedio al menudeo de la estufa era $44.95, con una desviación
estándar de $5.75. Atlas muestrea a 25 de sus minoristas después de iniciada la promoción y encuentra
que el precio medio de las estufas es ahora $42.95. A un nivel de significancia de 0.02, ¿tiene Atlas razones
para creer que el precio promedio al menudeo para el consumidor ha disminuido?

5. Grant, Inc., un fabricante de blusas de vestir para mujer, sabe que su marca se vende en 19% de las tiendas
de ropa para mujer ubicadas al este del río Mississippi. Grant muestreó recientemente 85 tiendas de ropa
para mujer en la ribera oeste del río y encontró que 14.12% de las tiendas vendía la marca. A un nivel de
significancia del 0.04, ¿existe evidencia de que Grant tenga peor distribución en la ribera oeste que en la
este del Mississippi?

6. Larry Culler, inspector federal de granos en un puerto marítimo, encontró que había partes echadas perder
en 40 de 120 lotes de avena, elegidos aleatoriamente, embarcados en el puerto. Construya un intervalo de
confianza del 95% para la proporción real de lotes con partes echadas a perder en embarques hechos desde
ese puerto.

7. Hinton Press tiene la hipótesis de que la vida promedio de su prensa rotativa más grande es de 14,500
horas. Saben que la desviación estándar de la vida de una prensa es 2,100 horas. A partir de una muestra
de 25 prensas, la compañía encuentra una media muestral de 13,000 horas. A un nivel de significancia de
0.01, ¿deben concluir que la vida promedio de las prensas es menor que las 14,500 horas hipotéticas?
Page 24
8. American Theaters sabe que cierta película de éxito se exhibió un promedio de 84 días en cada ciudad y
que la desviación estándar correspondiente fue 10 días. El administrador del distrito sureste se interesó
en comparar la popularidad de la película en su región con la que tuvo en otros cines de Estados Unidos.
Eligió 75 salas al azar en su región y encontró que exhibieron la película un promedio de 81.5 días.
a) Establezca las hipótesis adecuadas para probar si hubo una diferencia significativa en la duración de
la exhibición entre los teatros del sureste y el resto de Estados Unidos.
b) Pruebe estas hipótesis para un nivel de significancia del 1%.

9. MacroSwift estimó el año pasado que el 35% de los compradores potenciales de software planeaba
esperar hasta que se liberara una actualización de Window Panes para comprar el nuevo sistema
operativo. Después de una campaña publicitaria para dar confianza al público, MacroSwift encuestó a
3,000 personas y encontró que 950 todavía se mostraban renuentes. Con el 5% de nivel de significancia,
¿puede la compañía concluir que la proporción de personas renuentes ha disminuido?

10. La corredora de bienes raíces Elaine Snyderman tomó una muestra aleatoria de 12 hogares de un
prestigiado suburbio de Chicago y encontró que el valor de mercado promedio estimado era $780,000,
con una desviación estándar de $49,000. Pruebe la hipótesis de que para todas las casas del área, el valor
estimado medio es $825,000, hipótesis alternativa de que es menor que $825,000. Utilice el nivel de
significancia de 0.05.
Prueba de hipótesis sobre la igualdad de dos medias Page 25
Supóngase que se tienen dos poblaciones de interés. La primera tiene media desconocida 1 y varianza conocida 21 , mientras
que la segunda tiene media desconocida 2 y varianza conocida 22 : El interés recae en probar la hipótesis de que las dos
medias poblacionales 1 y 2 son iguales. Supóngase que las dos poblaciones son normales, y que si lo son se aplican las
condiciones del límite central.

Considerense primero las hipótesis

H0 : 1 = 2 vs HA : 1 > 2
H0 : 1 = 2 vs HA : 1 < 2
H0 : 1 = 2 vs HA : 1 6 = 2

Cuando se conocen 1 y 2 el estadístico de prueba es

X1 X ( 2)
Z= q2 2 1
2

n1 +
1 2
n2

para casos en los que la suma de n1 + n2 30 y el criterio de decisión:

Unilaterales: si jZj jZ j se rechaza H0


Bilaterales: si jZj Z =2 se rechaza H0

Cuando no se conocen la desviaciones estándar de la población, el valor estadístico de prueba es


X1 X ( 2)
t= q2 2 1
Para tamaño de muestras iguales
S1 S22
n1 + n2

el valor de t, se puede aproximar mediante z si n1 + n2 30:


Criterio de desición:

Unilaterales si jtj t ;n 1 se rechaza H0


Bilateral si jtj t =2;n 1 se rechaza H0

Cuando los tamaños de las dos muestras no son iguales, y su suma es menor de 30, la formula para el valor estadístico de
prueba se prueba se convierte en:
X1 X2 ( 1 2)
t = rh i
2 2
(n1 1)S1 +(n2 1)S2 1 1
n1 +n2 2 n1 + n 2

Criterio de desición:

Unilaterales si jtj t ;n1 +n2 2 se rechaza H0

Bilateral si jtj t =2;n1 +n2 2 se rechaza H0


Page 26
Se conoce ; utilice = 0:05; calcule el estadídtico de prueba:

H0 : 1 = 2 HA : 1 > 2
X1 = 20 X2 = 18
1 = 2 =3
n1 = n2 = 36

No se conoce ; utilice = 0:05; calcule el estadídtico de prueba:

H0 : 1 = 2 HA : 1 6= 2
X1 = 5:4 X2 = 5
S1 = 1:1 S2 = 1:2
n1 = n2 = 36

No se conoce ; utilice = 0:05; calcule el estadídtico de prueba: H

H0 : 1 = 2 HA : 1 6= 2
X1 = 5:4 X2 = 5
S1 = 1:1 S2 = 1:2
n1 = 15 n2 = 3

Ejemplo El salario semanal medio en una muestra de 30 empleados de una empresa grande es $280 y la desviación
estándar es $14. En otra empresa grande, una muestra aleatoria de 40 empleados tiene un salario medio de $270 y la
desviación estándar es $10. Pruebe a un nivel de signi…cancia del 5 por ciento.

Ejemplo. En 2009, el Consejo de Estándares para Contabilidad Financiera (CECF) consideró una propuesta para
requerir que las compañias informaran el efecto potencial de la opción de compra de acciones de los empleados sobre los
ingresos por acción (IPA). Una muestra aleatoria de 41 empresas de alta tecnología (AT) reveló que la nueva propuesta
reduciría el IPA en promedio de 13.8% , con una desviación estándar del 18.9%. Una muestra aleatoria de 35 productores de
bienes de consumo (BC) mostró que la propuesta reduciría el IPA en 9.1% en promedio, con desviación estándar del 8.7%.
Con base en estas muestras, ¿es razonable concluir (para = 0:1) que la propuesta de la CECF causaría una mayor reducción
en el IPA para las empresas de alta tecnología que los productores de bienes de consumo?

Ejemplo. En una muestra aleatoria de 10 focos, la vida media de los focos es 4000 h y la desviación estándar es 200.
En otra marca de focos cuya vida media se supone que también sigue una distribución normal, una muestra aleatoria de 8
focos tiene una media de 4300 h y una desviación estándar de 250. Verique si existe diferencia entre las medias muestrales
con = 0:01

Ejemplo. En una organización de investigación de mercados selecciona varios modelos de automóviles cada año y evalúa
su e…ciencia en el consumo de combustible. Este año, en el análisis de dos modelos subcompactos similares de dos fabricantes
distintos, el millaje promedio de 12 autos de la marca A fue 27.2 millas por galón, y la desviación estándar fue 3.8 mpg. Los
9 autos de la marca B que se probaron promediaron 32.1 mpg con desviación estándar de 4.3 mpg. Para = 0:01; ¿se puede
concluir que la marca A da un millaje promedio menor que la marca B?
Page 27
Prueba para diferencia entre proporciones
p1 p2
Z=r
1 1
p^q^ n1 + n2

n 1 p 1 + n 2 p2 x1 + x2
p^ = =
n1 + n2 n1 + n2

Ejemplo. Una cadena de hoteles grande intenta decidir si debe convertir más cuartos en habitaciones de no fumar.
El año pasado, en una muestra aleatoria de 400 huéspedes, 166 pidieron cuartos de no fumar. Este año, 205 huéspedes en
una muestra de 380 pre…rieron que no se fumara en su habitación. ¿Recomendaría que la cadena hotelera convirtiera más
habitaciones en lugares de no fumar? Apoye su recomendación con la hipótesis adecuada a un nivel de signi…cancia de 0.01.

Ejemplo. Dos áreas diferentes de una gran ciudad del este de Estados Unidos se estudian como sitios para abrir
guarderías. De 200 casas encuestadas en una sección, la proporción de ellas en las que la madre trabaja tiempo completo
es 0.52. En otra sección, 40% de las 150 casas del estudio tiene madres que trabajan tiempo completo. Para un nivel se
signi…cancia de 0.04, ¿existe una diferencia signi…cativa en las proporciones de madres que trabajan tiempo completo en las
dos áreas de la ciudad?
Page 28
Problemas de repaso Prueba de Hipótesis de 2 muestras

1. La doctora Susan Benner es psicóloga industrial. En este momento estudia el estrés en los ejecutivos de las
compañías de internet. Elaboró un cuestionario que cree que mide el estrés. Un resultado de 80 indica un
nivel de estrés peligroso. Una muestra aleatoria de 15 ejecutivos reveló los siguientes niveles de estrés.
94 78 83 90 78 99 97 90 97 90 93 94 100 75 84
a) Determine el nivel medio de estrés de esta muestra. ¿Cuál es el estimador puntual de la
media poblacional?
b) Construya un intervalo de confianza de 95% para la media poblacional

2. MacroSwift acaba de liberar al mercado un nuevo procesador de textos y la compañía está interesada en
determinar si las personas en el grupo de edad 30-39 califican al programa de manera distinta a las del
grupo 40-49. MacroSwift muestreó al azar a 175 personas del grupo 30-39 que compraron el producto y
encontró que 87 calificaron al programa como excelente; de ellos, 52 comprarían una actualización.
También muestreó a 220 personas del grupo 40-49 y encontró que 94 calificaron al software como
excelente; de ellos, 37 comprarían una actualización. ¿Hay una diferencia significativa en las proporciones
de personas en los dos grupos de edad que califican al programa como excelente con una confianza del
95%? ¿Es cierto el mismo resultado en cuanto a las proporciones de personas que planean comprar una
actualización?

3. Se recolectaron dos muestras independientes de observaciones. Para la primera muestra de 60 elementos,


la media fue 86 y la desviación estándar 6. La segunda muestra de 75 elementos tenía una media de 82 y
una desviación estándar de 9.
a) Calcule el error estándar estimado de la diferencia entre las dos medias.

4. Connie Rodriguez, la decana de estudiantes en el Midstate College, se pregunta cuál será la distribución
de calificaciones en la escuela. Ha oído quejas de que el promedio general en la escuela de administración
está más abajo que en las universidades de artes y ciencias. Un muestreo aleatorio rápido produjo los
siguientes promedios generales.
Administración:
2.86 2.77 3.18 2.80 3.14 2.87 3.19 3.24 2.91 3.00 2.83
Artes y ciencias:
3.35 3.32 3.36 3.63 3.41 3.37 3.45 3.43 3.44 3.17 3.26 3.18 3.41
¿Indican estos datos que existe una base para las quejas? Establezca y pruebe las hipótesis adecuadas para
Una confianza del 98%

5. En 1995, la tarifa aérea promedio con dos semanas de anticipación en el vuelo entre Raleigh-Durham,
Carolina del Norte y la ciudad de Nueva York era $235. La desviación estándar de la población era $68. En
una encuesta hecha en 1996 a 90 viajeros, elegidos al azar, entre estas dos ciudades se encontró que
habían pagado en promedio, $218.77 por sus boletos. ¿Cambió significativamente la tarifa aérea
promedio en esta ruta entre 1995 y 1996? ¿Cuál es el mayor valor de alfa para el que podría concluir que
la tarifa promedio observada no es significativamente diferente de $235?
Page 29

6. En 1993, el Consejo de Estándares para Contabilidad Financiera (CECF) consideró una propuesta para
requerir que las compañías informaran el efecto potencial de la opción de compra de acciones de los
empleados sobre los ingresos por acción (IPA). Una muestra aleatoria de 41 empresas de alta tecnología
(AT) reveló que la nueva propuesta reduciría el IPA en un promedio del 13.8%, con una desviación
estándar del 18.9%. Una nuestra aleatoria de 35 productores de bienes de consumo (BC) mostró que la
propuesta reduciría el IPA en 9.1% en promedio, con desviación estándar del 8.7%. Con base en estas
muestras, ¿es razonable concluir (para α = 0.10) que la propuesta de la CECF causaría una mayor reducción
en el IPA para las empresas de alta tecnología que para los productores de bienes de consumo?

7. Una organización de crédito y seguros ha desarrollado un nuevo método de alta tecnología para capacitar
al nuevo personal de ventas. La compañía obtuvo una muestra de 16 empleados capacitados de la manera
original y encontró ventas diarias promedio de $688 con desviación estándar de la muestra de $32.63.
También tomaron una muestra de 11 empleados capacitados con el método nuevo y encontraron un
promedio de ventas diarias de $706 con desviación estándar de la muestra de $24.84. Para un nivel de
significancia de 0.05, ¿puede la compañía concluir que el promedio diario de ventas aumenta con el nuevo
plan?

8. Se tomaron dos muestras independientes. Para la primera muestra de 42 elementos, la media fue 32.3 y
la varianza 9. La segunda muestra de 57 elementos tenía media de 34 y varianza de 16.
a) Calcule el error estándar estimado de la diferencia entre las dos medias.
b) Con α = 0.05, pruebe si existe suficiente evidencia para mostrar que la segunda población tiene una
media mayor.

9. El viernes, aumentó el precio (avanzaron) de 11 acciones de una muestra aleatoria de 40 tomada de las
2,500 acciones negociadas en la Bolsa de Valores de Nueva York. En una muestra tomada el jueves, de 60
acciones de la misma Bolsa, 24 acciones avanzaron. A un nivel α = 0.10, ¿puede llegar a la conclusión de
que una proporción menor de las acciones de la Bolsa de Valores avanzaron el viernes con respecto al
jueves?

10. Una corredora de bolsa afirma que puede predecir, con el 85% de certeza, el ascenso o caída, durante el
mes siguiente, de un valor del mercado de valores. Para probarlo, predice el resultado de 60 valores y
acierta en 45 de sus predicciones ¿Presentan estos datos evidencia concluyente (con α = 0.04) de que la
exactitud de sus predicciones es significativamente menor que el 85% declarado?

11. Dada una población con una desviación estándar de 9.6, ¿qué tamaño de muestra es necesario para
estimar la media de la población dentro de ±0.5 con un nivel de confianza del 96%?
Page 30
Tablas de contingencia (prueba de independencia)
Un problema común en el análisis de datos enumerativos (categóricos) se re…ere a la independencia de dos métodos de
clasi…cación de eventos observados. En este caso lo que se quiere investigar es la dependencia ( o contingencia) entre dos
criterios de clasifocación.
Cuando los datos se re…eren a dos variables de escala nominal, y cada variable tiene dos o más categórias, se puede usar la
prueba ji cuadrada para poner a prueba si existe o no una relación entre las variables. El propósito de la prueba ji cuadrada
en tales aplicaciones no es identi…car la naturaleza exacta de una relación entre variables nominales; la meta de esta técnica
es simplemente probar si las varibles son o no dependientes entre sí.
En la tabla de contingencia las …las representan categorías de una variable, las columnas representan categorías de
otra variable, y las entradas son las frecuencias de la ocurrencia de varias combinaciones de …la y columna. Una tabla de
contingencias tiene r …las y c columnas, donde r 2 y c 2: Las hipósteis nula y alternativa son

H0 : las varibles son independientes entre sí


HA : las varibles no son independientes entre sí

de igual forma que la prueba de bondad de ajuste, habrá una tabla de recuencias observadas y una tabla de de frecuencias
esperadas, y la magnitud de la diferencia entre estas tablas se medirá mediante el cálculo del estadístico 2
k X
X k 2
2 (Oij Eij )
=
i=1 j=1
Eij

los grados de libertad son


v = (r 1)(c 1)
la frecuencia esperada para cualquier celda está dada por
(total de la columna) (total del renglón)
frecuencia esperada=
gran total
Ejemplo. En la siguiente tabla se indica que 10 de 50 familias de una comunidad vieron un programa especial de
televisión sobre la economía nacional y que en una segunda comunidad 15 de 50 familias vieron el programa. Para un vivel
de signi…cancia del 1 por ciento si existe dependencia entre las variables.
Comunidad 1 Comunidad 2 Total
Número que ve
10 15 25
el programa
Número que no
40 35 75
lo ve
Total 50 50 100

La tabla representa la frecuencia observadas para calcular las frecuencias esperadas hacemos lo siguiente
Comunidad 1 Comunidad 2 Total
Número que ve (50)(25) (50)(25)
100 = 12: 5 100 = 12:5 25
el programa
Número que no (50)(75) (50)(75)
100 = 37: 5 100 = 37:5 75
lo ve
Total 50 50 100
ahora para probar la hipótesis calculamos
2 2 2 2
2 (10 12:5) (15 12:5) (40 37:5) (35 37:5)
= + + +
12:5 12:5 37:5 37:5
= 1: 333 3
2
el valor 0:01 con v = (2 1) (2 1) = 1
2
0:01 = 6:6349
como
2 2
0:01 >

no se recchaza H0 por lo que se concluye que la proporción de espectadores en las dos comunidades puede no deferir.
Page 31
Ejemplo. El0ejemplo anterior se extiende ahora a cuatro comunidades, pruebe a un nivel de signi…cancia del 1 por ciento
si la proporción de espectadores es igual en todas las comunidades

C1 C2 C3 C4 Total
Número que ve
10 15 5 18 48
el programa
Número que no
40 35 45 32 152
lo ve
Total 50 50 50 50 200

Example 16 En la siguiente tabla se presentan la reacción de los votantes a un nuevo plan de impuestos sobre la propiedad
de acuerdo con la a…liación partidista. A partir de los datos mostrados construya una tabla de frecuencias esperadas basada
en la suposición de que no existe relación entre las a…liación partidista y la reacción al plan de impuestos. Utilice = 0:01
A…lación partidista A favor Indiferente En contra Total
Demócrata 120 20 20 160
Republicano 50 30 60 140
Independiente 50 10 40 100
Total 220 60 120 400
Regresión simple y correlación Page 32

Diagrama de dispersión

Resulta a veces indispensable conocer la forma de cómo se comportan entre si algunas variables, esto es, si el comportamiento de unas influye
en el comportamiento de otras y en qué grado. Los diagramas de dispersión muestran la existencia de esta relación.

La forma usual de construir un diagrama de dispersión es localizar los valores de la variable independiente "𝑥" sobre el eje horizontal y los de la
variable dependiente "𝑦" sobre el eje vertical; así se forma un plano bidimensional con "𝑥" y "𝑦".

Coeficiente de correlación

Sean (𝑥1 , 𝑦1 ), (𝑥 2 , 𝑦 2 ), … , (𝑥𝑛 , 𝑦𝑛 ) 𝑛 observaciones hechas en dos características. Sean 𝑆𝑥𝑦 , 𝑆𝑥 , 𝑆𝑦 la covarianza entre ellas y las desviaciones
estándar correspondientes. El coeficiente de correlación (𝑟𝑥𝑦 ), o simplemente la correlación entre las dos variables (𝑟), tiene como expresión:

La correlación es una medida de asociación entre dos variables, que tiene las siguientes propiedades:

a) Es independiente de las unidades de medida utilizadas en las variables.

b) Valores positivos del coeficiente indican que las variables tienden a crecer (o decrecer) simultáneamente, y valores negativos indican que una
aumenta cuando la otra disminuye.

c) Toma valores exclusivamente entre -1 y 1.

d) A medida que 𝑟𝑥𝑦 se aproxima a -1 ó 1 existirá mayor evidencia de que en el modelo de regresión lineal simple la variable X contribuye
significativamente a explicar a Y.

e) Si 𝑟𝑥𝑦 tiene un valor cercano a cero, no hay razón para creer que existe una relación de tipo lineal entre X y Y.
Page 33

Recta de regresión

Un modelo determinista entre las variables 𝑥 e 𝑦, significa que siempre se puede determinar a 𝑦 con exactitud cuando se conoce el valor 𝑥. No
hay margen de error en esa predicción. Rara vez los experimentos reproducen con exactitud los fenómenos en estudio por lo que en general se
tendrá un error aleatorio introducido por el experimento, lo que hará que el modelo en cuestión sólo exprese una aproximación de la realidad.

En forma general los modelos tienen la siguiente expresión

𝑦 = 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎 + 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜

Donde 𝑦 es la variable aleatoria que se tiene que predecir. Siempre se supondrá que el valor promedio del error aleatorio es igual a cero. Esto
equivale a suponer que el valor promedio de 𝑦, 𝐸(𝑦), es igual al componente del modelo: 𝐸(𝑦) = 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡𝑎.

En especial, si se supone que 𝑦 se distribuye normalmente con promedio 𝜇 y varianza 𝜎², entonces se puede formular el modelo 𝑦 = 𝜇 + 𝜀 en el
que el componente aleatorio 𝜀 (epsilon) se distribuye normalmente con promedio 0 y varianza 1.

El objetivo es generalizar este modelo para permitir que 𝐸(𝑦) sea una función de otras variables. Lo anterior se puede lograr suponiendo que 𝑦
es una función lineal de 𝑥,

𝑦 = 𝛽₀ + 𝛽₁𝑥 + 𝜀 (Modelo probabilístico de línea recta)

Donde

𝑦 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 (𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑞𝑢𝑒 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑞𝑢𝑒 𝑚𝑜𝑑𝑒𝑙𝑎𝑟).

𝑥 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 (𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑞𝑢𝑒 𝑠𝑒 𝑢𝑠𝑎𝑟á 𝑐𝑜𝑚𝑜 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑜𝑟 𝑑𝑒 𝑦)

𝜀 = 𝐶𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑑𝑒𝑙 𝑒𝑟𝑟𝑜𝑟

𝛽₀ = 𝑌 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑎𝑙 𝑜𝑟𝑖𝑔𝑒𝑛 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟, 𝑝𝑢𝑛𝑡𝑜 𝑑𝑜𝑛𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 𝑐𝑜𝑟𝑡𝑎 𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑎 𝑎𝑙 𝑒𝑗𝑒 𝑌

𝛽₁ = 𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟, 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑒𝑛 𝑞𝑢𝑒 𝑎𝑢𝑚𝑒𝑛𝑡𝑎 (𝑜 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒) 𝑒𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑌 𝑝𝑜𝑟 𝑐𝑎𝑑𝑎 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑜 𝑑𝑒 𝑥.

Método de mínimos cuadrados para estimar la recta de regresión

Lo que se pretende con este método es estimar los parámetros 𝛽₀ y 𝛽₁, lo que equivale a estimar la recta de regresión
𝑦 = 𝛽₀ + 𝛽₁𝑥. Si denotamos a los estimadores por 𝛽̂0 y 𝛽
̂1 , entonces nuestra recta estimada será 𝑦̂ = 𝛽
̂0 + 𝛽
̂1 𝑥.

La idea del método es producir estimadores 𝛽̂0 y 𝛽


̂1 que minimicen la suma de cuadrados de las distancias entre los valores observados 𝑦𝑖 y los
estimadores 𝑦̂,
𝑖 esto es que minimicen la suma de cuadrados de las longitudes de los segmentos de las líneas verticales que unen los datos
observados con la recta estimada en gráfica de dispersión. Las ecuaciones para los estimadores 𝛽̂0 y 𝛽
̂1 se representan
Page 34

Diagrama de dispersión y recta estimada

Interpretación de la ecuación de regresión estimada

̂ , lo primero que debemos destacar es que en la recta de regresión estimada 𝑌̂ = 𝛽₀


Interpretación de la estimación de la ordenada al origen𝛽₀ ̂+
̂ ̂ ̂ ̂
𝛽₁𝑥 a un valor de 𝑋 = 0 corresponde un valor estimado 𝑌 = 𝛽₀ lo que indica que 𝛽₀ es el valor de la predicción para 𝑌 cuando la variable
independiente toma el valor de cero. Dado lo anterior es importante señalar que 𝛽₀̂ no tiene interpretación práctica en muchos problemas.

̂ , también llamado coeficiente de regresión estimado, es de mucho mayor importancia que 𝛽₀


El estimador de la pendiente 𝛽₁ ̂ , ya que nos indica
la forma en que están relacionadas X y Y, en el sentido que mide cuánto y en qué dirección se modifican los valores de Y cuando cambia X.
Recuérdese que 𝛽₁̂ estima la pendiente de la recta, osea el número de unidades que cambia Y por cada unidad de cambio en X. Al interpretar 𝛽₁̂
en un problema concreto, es necesario tener en cuenta las características del fenómeno que se estudia, ya que una interpretación exclusivamente
matemática es generalmente insuficiente.

Coeficiente de determinación (𝑟 2 ) mide el porcentaje el variabilidad en y que puede ser explicado por la variable predictora x.

Suma de cuadrados total:

La cantidad de desviación total es la variable dependiente se llama suma de cuadrados (SCT). Este valor mide la variabilidad de y sin tener en
cuenta a la variable predictora 𝑥.

𝑆𝐶𝑇 = ∑(𝑦𝑖 − 𝑦̅)2


𝑖=1

Donde:

SCT= suma de cuadrados total

𝑦𝑖 = i-ésimo valor de la variable dependiente.

𝑦̅= media de la variable dependiente

Suma de cuadrados del error

La recta de regresión de mínimos cuadrados minimiza la suma de cuadrados del error (SCE). La SCE mide la variabilidad de los valores y de la
muestra alrededor de 𝑦̂. Representa la cantidad de desviación en la variable dependiente que no puede explicarse por la ecuación de regresión.

𝑆𝐶𝐸 = ∑(𝑦𝑖 − 𝑦̂)2


𝑖=1

𝑦̂= valor y estimado para cada valor dado de x.


2
La ecuación de r , el porcentaje de variabilidad de la variable dependiente y que puede explicarse por la variable predictora 𝑥, se puede definir
como:

𝑆𝐶𝐸
𝑟2 = 1 −
𝑆𝐶𝑇
El cociente que esta después del signo menos representa el porcentaje de la variabilidad de y que todavía no se puede explicar en laPage 35de
ecuación
regresión.

Ejemplo:

Amy, presidenta de una compañía, quiere ver si el volumen semanal de ventas de su empresa se relaciona con alguna otra variable. Amy selecciona
al azar ocho semanas de los dos últimos años y registra el volumen semanal de ventas en miles de dólares. Después de revisar la situación, decide
que el número de anuncios en televisión de la compañía cada semana se puede correlacionar con las ventas; también registra esta variable para
cada semana de la muestra.

Datos: Diagrama de dispersión


x y
3 125
5 152
4 131
4 133
5 142
3 116
3 127
6 163

𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥2 𝑦2
3 125 375 9 15625
5 152 760 25 23104
4 131 524 16 17161
4 133 532 16 17689
5 142 710 25 20164
3 116 348 9 13456
3 127 381 9 16129
6 163 978 36 26569
totales 33 1089 4608 145 149897

Calculamos la covarianza

(33)(1089)
4608 −
𝑆𝑥𝑦 = 8 = 16.5536
8−1

Calculamos la desviación estándar de 𝑥

(33)2
√145 − 8
𝑆𝑥 = = 1.1260
7

Calculamos la desviación estándar de y

(1089)2
√149897 − 8
𝑆𝑦 = = 15.3849
7

Calculando el coeficiente de correlación

16.5536
𝑟𝑥𝑦 = = 0.9556
(1.1260)(15.3849)
𝑦̅ = 136.125 𝑥̅ = 4.125 𝑟𝑥𝑦 = 0.9556 Page 36

Para 𝛽̂1 tenemos:

(33)(1089)
4608 −
𝛽̂1 = 8 = 13.0563
(33)2
145 −
8

Para 𝛽̂0 tenemos: 𝛽̂0 = 𝑦̅ − 𝛽̂1 𝑥̅

𝛽̂0 = 136.125 − 13.0563(4.125) = 82.2677

Entonces nuestra ecuación de estimación es: 𝑦̂ = 82.2677 + 13.0563𝑥

Calculemos la suma de cuadrados total 𝑆𝐶𝑇 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2

y 𝑦̅ 𝑦 − 𝑦̅ (𝑦 − 𝑦̅)2

125 136.125 -11.125 123.7656


152 136.125 15.875 252.0156
131 136.125 -5.125 26.26563
133 136.125 -3.125 9.765625
142 136.125 5.875 34.51563
116 136.125 -20.125 405.0156
127 136.125 -9.125 83.26563
163 136.125 26.875 722.2656
suma 1656.875
𝑆𝐶𝑇 = 1656.875

Calculemos la suma de cuadrados del error 𝑆𝐶𝐸 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂)2

y x 𝑦̂ 𝑦 − 𝑦̂ (𝑦 − 𝑦̂)2
125 3 121.436 3.564 12.7
152 5 147.548 4.452 19.82
131 4 134.492 -3.492 12.19
133 4 134.492 -1.492 2.226
142 5 147.548 -5.548 30.78
116 3 121.436 -5.436 29.55
127 3 121.436 5.564 30.96
163 6 160.604 2.396 5.741
sumas 144
𝑆𝐶𝐸 = 144

Entonces el coeficiente de determinación es:


144 Page 37
𝑟2 = 1 − = 0.9130
1656.875

 En un laboratorio de investigación se quiere investigar la forma en que se relaciona la cantidad de madera con la resistencia del papel.
Los datos obtenidos se muestran a continuación:

Cantidad de Resistencia
madera (x) (y)

4 134
6 145
8 142
10 149
12 144
14 160
16 156
18 157
20 168
22 166
24 167
26 171
28 174
30 183

a) Hacer la grafica de dispersión


b) Encuentre el valor del coeficiente de correlación
c) Encuentre la recta de regresión lineal

 A menudo quienes hacen la contabilidad de costos estiman los gastos generales con base en el nivel de producción. En una empresa
han reunido información acerca de los gastos generales y las unidades producidas en diferentes plantas, y ahora desean estimar una
ecuación de regresión para predecir los gastos generales futuros,

Gastos generales 191 170 272 155 280 173 234 116 153 178
unidades 40 42 53 35 56 39 48 30 37 40

a) Desarrolle la ecuación de regresión para contabilidad de costos

b) Pronostique los gastos generales cuando se producen 50 unidades.

c) Estime el coeficiente de correlación y el coeficiente de determinación


Page 38

Problemas de repaso

1. MacroSwift acaba de liberar al mercado un nuevo procesador de textos y la compañía está interesada en determinar si
las personas en el grupo de edad 30-39 califican al programa de manera distinta a las del grupo 40-49. MacroSwift
muestreó al azar a 175 personas del grupo 30-39 que compraron el producto y encontró que 87 calificaron al programa
como excelente; de ellos, 52 comprarían una actualización. También muestreó a 220 personas del grupo 40-49 y
encontró que 94 calificaron al software como excelente; de ellos, 37 comprarían una actualización. ¿Hay una diferencia
significativa en las proporciones de personas en los dos grupos de edad que califican al programa como excelente al
nivel de significancia de 0.05?

2. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra una vida promedio de 71.8
años. Suponga una desviación estándar poblacional de 8.9 años. Queremos probar si la vida media hoy en día es mayor
a 70 años con base en esa muestra. La muestra parecería indicar que es así, pero ¿Cuál es la probabilidad de que la
media de la muestra no refleje la verdadera media de la población? Utilizar un nivel de significancia de 0.05.

3. Una empresa eléctrica fabrica baterías de celular que tienen una duración que se distribuye de forma aproximadamente
normal con una media de 800 horas y una desviación estándar de 40 horas. Si una muestra aleatoria de 30 baterías
tiene una duración promedio de 788 horas, ¿muestran los datos suficiente evidencia para decir que la duración media
no es 800? Utilice un nivel de significancia del 0.04.

4. Additives-R-Us desarrolló un aditivo para mejorar la eficiencia del combustible en camiones de carga pesada. Probaron
el aditivo seleccionando al azar 18 camiones y agrupándolos en nueve pares. En cada par, ambos camiones llevaban el
mismo tipo de carga en la misma carretera, pero sólo se puso el nuevo aditivo a uno de ellos. Cada par siguió rutas
distintas y llevó diferentes cargas. ¿Indican los datos, con un nivel de significancia de 0.01, que los camiones que usaron
aditivo lograron una eficiencia en el uso de combustible significativamente mejor que los camiones con combustible
normal?

5. Una lata de 12 onzas de refresco se diseña para que contenga una cantidad ligeramente mayor que 12 onzas, de tal
manera que si excede este volumen no hay problemas. Sin embargo, un volumen menor a 12 onzas ocasiona que los
consumidores demanden al fabricante. En el proceso es igual o mayor a 12 onzas. Suponiendo que se prueba una
muestra de 45 latas y se encuentra normal de producción, el fabricante supone que µ un volumen promedio de 10.5
onzas con una desviación estándar de 2 onzas, establecer si se puede afirmar con un nivel de significancia de 0.01 que
el fabricante está en lo correcto.
Page 39

6. El departamento de procesamiento de datos de una compañía de seguros grande instaló nuevas terminales de video
de color para reemplazar las unidades monocromáticas que tenían. Los 95 operadores capacitados para usar las nuevas
máquinas promediaron 7.2 horas antes de lograr un desempeño satisfactorio. Su varianza muestral fue 16.2 horas al
cuadrado. La larga experiencia de los operadores con las viejas terminales monocromáticas indicaba un promedio de
8.1 horas en las máquinas antes de que su desempeño fuera satisfactorio. Al nivel de significancia de 0.01, ¿debería el
supervisor del departamento concluir que es más fácil aprender a operar las nuevas terminales?

7. La distribución de los ingresos anuales de todos los cajeros de un banco con cinco años de experiencia está distribuida
de manera normal. Esta distribución tiene una media de $19,000 y una desviación estándar de $2,000. Si extraemos
una muestra aleatoria de 30 cajeros, ¿cuál es la probabilidad de que sus ganancias promedien más de $19,750
anualmente?

8. Una agencia de colocaciones aplica, habitualmente, una prueba estándar de inteligencia y aptitud a todas las personas
que buscan trabajo por medio de la compañía. La agencia ha recolectado datos durante varios años y ha encontrado
que la distribución de resultados no es normal, sino que está sesgada a la izquierda con una media de 86 y una desviación
estándar de 16. ¿Cuál es la probabilidad de que en una muestra de 75 solicitantes que realizan la prueba, el resultado
medio sea menor de 84 o mayor de 90?

9. El presidente de Samsung., está molesto por el número de teléfonos producidos por su empresa que tienen auriculares
defectuosos. En promedio, 110 teléfonos al día son devueltos por este problema, con una desviación estándar de 64.
Ha decidido que ordenará la cancelación del proceso a menos que pueda estar 80% seguro de que en promedio, no se
devolverán más de 120 teléfonos al día durante los siguientes 48 días. ¿Terminará ordenando la cancelación del
proceso?

10. Un estudio reciente de un organismo de vigilancia ambiental determinó que la cantidad de contaminantes en los lagos
de Michoacán (en partes por millón) tiene una distribución normal con media de 64 ppm y varianza de 17.6. Suponga
que se seleccionan al azar y se toman muestras de 35 lagos. Encuentre la probabilidad de que el promedio muestral de
la cantidad de contaminantes sea
a) Mayor que 72 ppm.
b) Entre 64 y 72 ppm.
c) Exactamente 64 ppm.
d) Mayor que 94 ppm.
e) Si en la muestra se encuentra que =100 ppm, ¿sentiría confianza en el estudio realizado por el organismo?
Dé una explicación breve.
Page 40

11. La HAL Corporation fabrica grandes sistemas de cómputo y siempre se ha ufanado de la confiabilidad de sus unidades
de procesamiento central del Sistema 666. De hecho, la experiencia pasada ha mostrado que el tiempo improductivo
mensual de las CPU del Sistema 666 promedia 41 minutos, con una desviación estándar de 8 minutos. El centro de
cómputo de una gran universidad estatal mantiene una instalación formada por seis CPU del Sistema 666. James
Kitchen, el director del centro, siente que se proporciona un nivel satisfactorio de servicio a la comunidad universitaria
si el tiempo improductivo promedio de las seis CPU es menor que 50 minutos al mes. Dado cualquier mes, ¿cuál es la
probabilidad de que Kitchen se sienta satisfecho con el nivel de servicio?

12. Jill Johnson, gerente de producción de las alarmas de humo de Southern Electric, está preocupada por las quejas que
ha recibido recientemente de grupos de consumidores acerca de la corta vida del dispositivo. Ha decidido recabar
evidencia para contrarrestar las quejas probando una muestra de las alarmas. En cuanto a la prueba, su costo es de $4
por unidad en la muestra. La precisión es deseable para presentar evidencia estadística persuasiva a los grupos de
consumidores, de tal manera que Johnson considera que los beneficios que recibirá para diversos tamaños de muestras
son determinados por la fórmula: Beneficios = $5,249/x. Si la señorita Johnson desea aumentar su muestra hasta que
el costo sea igual al beneficio, ¿cuántas unidades debe muestrear? La desviación estándar de la población es de 265.

13. La jefa de policía, Kathy Ackert, recientemente estableció medidas enérgicas para combatir a los traficantes de droga
de su ciudad. Desde que se pusieron en funcionamiento dichas medidas, han sido capturados 750 de los 12,368
traficantes de droga de la ciudad. El valor promedio, en dólares, de las drogas decomisadas a estos 750 traficantes es
$250,000. La desviación estándar del valor de la droga de esos 750 traficantes es $41,000. Elabore para la jefa Ackert
un intervalo de confianza del 90% para el valor medio en dólares de las drogas que están en manos de los traficantes
de la ciudad.

14. Bi-Io Appliance Super-Store tiene tiendas en varias áreas metropolitanas de Nueva Inglaterra. El gerente general de
ventas planea transmitir un comercial para una cámara digital en estaciones de televisión locales antes de una venta
que empezará el sábado y terminará el domingo. Planea obtener la información para las ventas de la cámara digital
durante el sábado y el domingo en las diversas tiendas y compararlas con el número de veces que se transmitió el
anuncio en las estaciones de televisión. El propósito es determinar si hay alguna relación entre el número de veces que
se transmitió el anuncio y las ventas de cámaras digitales. Los pares son:

a) ¿Cuál es la variable dependiente?


b) Determine el coeficiente de correlación.
c) Establezca el coeficiente de determinación.
d) Interprete estas medidas estadísticas.
e) Encuentre la ecuación que mejor se adapte a los datos.
Page 41

15. El ayuntamiento de la ciudad de Pine Bluffs considera aumentar el número de policías en un esfuerzo para reducir los
delitos. Antes de tomar una decisión final, el ayuntamiento pide al jefe de policía realizar una encuesta en otras ciudades
de tamaño similar para determinar la relación entre el número de policías y el número de delitos reportados. El jefe de
policía reunió la siguiente información muestral.

a) Si se desea estimar los delitos con base en el número de policías, ¿cuál es la variable
dependiente y cuál la independiente?
b) Determine la ecuación de la recta de regresión.
c) Determine el coeficiente de correlación.
d) Establezca el coeficiente de determinación.
e) Interprete estas medidas estadísticas. ¿Le sorprende que la relación sea inversa?

16. Alber’s produce y distribuye tres tipos de cerveza: ligera, clara y oscura. Al analizar los segmentos de mercado de las
tres cervezas, el grupo de investigación de mercado de la empresa se preguntó si las preferencias de los consumidores
por estos tipos de cerveza diferían entre hombres y mujeres. En caso de que las preferencias fueran independientes del
género del consumidor, iniciarían una campaña publicitaria para todas las cervezas de Alber’s. Pero, si las preferencias
por los distintos tipos de cerveza dependían del género del consumidor, la empresa ajustaría sus promociones a los
mercados. Para determinar si la preferencia por un tipo de cerveza (ligera, clara u oscura) era independiente
del género del consumidor (hombre o mujer) se usó una prueba de independencia con α=.05

17. Visa Card USA estudió la frecuencia con que los consumidores de diversos rangos de edades usan tarjetas plásticas (de
crédito o de débito) al pagar sus compras. A continuación, se presentan los datos muestrales de 300 clientes divididos
en cuatro grupos de edades.

a. Pruebe la independencia entre el método de pago y el grupo de edad. Usando α = 0.05, ¿cuál es su conclusión?
b. Si la forma de pago y el grupo de edad no son independientes, ¿qué observación puede hacer acerca de la
diferencia en el uso de plástico en los diversos grupos de edades?
c. ¿Qué consecuencias tiene este estudio para empresas como Visa, MasterCard y Discover?
Page 42
Valores críticos de la distribución Ji-cuadrada
α
v 0.7 0.6 0.5 0.4 0.3 0.25 0.2 0.1 0.05 0.025 0.02 0.01 0.005 0.001
1 0.1485 0.2750 0.4549 0.7083 1.0742 1.3233 1.6424 2.7055 3.8415 5.0239 5.4119 6.6349 7.8794 10.8276
2 0.7133 1.0217 1.3863 1.8326 2.4079 2.7726 3.2189 4.6052 5.9915 7.3778 7.8240 9.2103 10.5966 13.8155
3 1.4237 1.8692 2.3660 2.9462 3.6649 4.1083 4.6416 6.2514 7.8147 9.3484 9.8374 11.3449 12.8382 16.2662
4 2.1947 2.7528 3.3567 4.0446 4.8784 5.3853 5.9886 7.7794 9.4877 11.1433 11.6678 13.2767 14.8603 18.4668
5 2.9999 3.6555 4.3515 5.1319 6.0644 6.6257 7.2893 9.2364 11.0705 12.8325 13.3882 15.0863 16.7496 20.5150
6 3.8276 4.5702 5.3481 6.2108 7.2311 7.8408 8.5581 10.6446 12.5916 14.4494 15.0332 16.8119 18.5476 22.4577
7 4.6713 5.4932 6.3458 7.2832 8.3834 9.0371 9.8032 12.0170 14.0671 16.0128 16.6224 18.4753 20.2777 24.3219
8 5.5274 6.4226 7.3441 8.3505 9.5245 10.2189 11.0301 13.3616 15.5073 17.5345 18.1682 20.0902 21.9550 26.1245
9 6.3933 7.3570 8.3428 9.4136 10.6564 11.3888 12.2421 14.6837 16.9190 19.0228 19.6790 21.6660 23.5894 27.8772
10 7.2672 8.2955 9.3418 10.4732 11.7807 12.5489 13.4420 15.9872 18.3070 20.4832 21.1608 23.2093 25.1882 29.5883
11 8.1479 9.2373 10.3410 11.5298 12.8987 13.7007 14.6314 17.2750 19.6751 21.9200 22.6179 24.7250 26.7568 31.2641
12 9.0343 10.1820 11.3403 12.5838 14.0111 14.8454 15.8120 18.5493 21.0261 23.3367 24.0540 26.2170 28.2995 32.9095
13 9.9257 11.1291 12.3398 13.6356 15.1187 15.9839 16.9848 19.8119 22.3620 24.7356 25.4715 27.6882 29.8195 34.5282
14 10.8215 12.0785 13.3393 14.6853 16.2221 17.1169 18.1508 21.0641 23.6848 26.1189 26.8728 29.1412 31.3193 36.1233
15 11.7212 13.0297 14.3389 15.7332 17.3217 18.2451 19.3107 22.3071 24.9958 27.4884 28.2595 30.5779 32.8013 37.6973
16 12.6243 13.9827 15.3385 16.7795 18.4179 19.3689 20.4651 23.5418 26.2962 28.8454 29.6332 31.9999 34.2672 39.2524
17 13.5307 14.9373 16.3382 17.8244 19.5110 20.4887 21.6146 24.7690 27.5871 30.1910 30.9950 33.4087 35.7185 40.7902
18 14.4399 15.8932 17.3379 18.8679 20.6014 21.6049 22.7595 25.9894 28.8693 31.5264 32.3462 34.8053 37.1565 42.3124
19 15.3517 16.8504 18.3377 19.9102 21.6891 22.7178 23.9004 27.2036 30.1435 32.8523 33.6874 36.1909 38.5823 43.8202
20 16.2659 17.8088 19.3374 20.9514 22.7745 23.8277 25.0375 28.4120 31.4104 34.1696 35.0196 37.5662 39.9968 45.3147
21 17.1823 18.7683 20.3372 21.9915 23.8578 24.9348 26.1711 29.6151 32.6706 35.4789 36.3434 38.9322 41.4011 46.7970
22 18.1007 19.7288 21.3370 23.0307 24.9390 26.0393 27.3015 30.8133 33.9244 36.7807 37.6595 40.2894 42.7957 48.2679
23 19.0211 20.6902 22.3369 24.0689 26.0184 27.1413 28.4288 32.0069 35.1725 38.0756 38.9683 41.6384 44.1813 49.7282
24 19.9432 21.6525 23.3367 25.1063 27.0960 28.2412 29.5533 33.1962 36.4150 39.3641 40.2704 42.9798 45.5585 51.1786
25 20.8670 22.6156 24.3366 26.1430 28.1719 29.3389 30.6752 34.3816 37.6525 40.6465 41.5661 44.3141 46.9279 52.6197
26 21.7924 23.5794 25.3365 27.1789 29.2463 30.4346 31.7946 35.5632 38.8851 41.9232 42.8558 45.6417 48.2899 54.0520
27 22.7192 24.5440 26.3363 28.2141 30.3193 31.5284 32.9117 36.7412 40.1133 43.1945 44.1400 46.9629 49.6449 55.4760
28 23.6475 25.5093 27.3362 29.2486 31.3909 32.6205 34.0266 37.9159 41.3371 44.4608 45.4188 48.2782 50.9934 56.8923
29 24.5770 26.4751 28.3361 30.2825 32.4612 33.7109 35.1394 39.0875 42.5570 45.7223 46.6927 49.5879 52.3356 58.3012
30 25.5078 27.4416 29.3360 31.3159 33.5302 34.7997 36.2502 40.2560 43.7730 46.9792 47.9618 50.8922 53.6720 59.7031
40 34.8719 37.1340 39.3353 41.6222 44.1649 45.6160 47.2685 51.8051 55.7585 59.3417 60.4361 63.6907 66.7660 73.4020
50 44.3133 46.8638 49.3349 51.8916 54.7228 56.3336 58.1638 63.1671 67.5048 71.4202 72.6133 76.1539 79.4900 86.6608
60 53.8091 56.6200 59.3347 62.1348 65.2265 66.9815 68.9721 74.3970 79.0819 83.2977 84.5799 88.3794 91.9517 99.6072
Page 43
Distribución T

Áreas en los dos extremos combinados para la distribución t de Student.

Distribución t

gl 0.2 0.18 0.16 0.14 0.12 0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01
1 3.0777 3.4420 3.8947 4.4737 5.2422 6.3138 7.0264 7.9158 9.0579 10.5789 12.7062 15.8945 21.2049 31.8205 63.6567
2 1.8856 2.0261 2.1894 2.3834 2.6202 2.9200 3.1040 3.3198 3.5782 3.8964 4.3027 4.8487 5.6428 6.9646 9.9248
3 1.6377 1.7413 1.8589 1.9950 2.1562 2.3534 2.4708 2.6054 2.7626 2.9505 3.1824 3.4819 3.8960 4.5407 5.8409
4 1.5332 1.6226 1.7229 1.8375 1.9712 2.1318 2.2261 2.3329 2.4559 2.6008 2.7764 2.9985 3.2976 3.7469 4.6041
5 1.4759 1.5579 1.6493 1.7529 1.8727 2.0150 2.0978 2.1910 2.2974 2.4216 2.5706 2.7565 3.0029 3.3649 4.0321
6 1.4398 1.5172 1.6033 1.7002 1.8117 1.9432 2.0192 2.1043 2.2011 2.3133 2.4469 2.6122 2.8289 3.1427 3.7074
7 1.4149 1.4894 1.5718 1.6643 1.7702 1.8946 1.9662 2.0460 2.1365 2.2409 2.3646 2.5168 2.7146 2.9980 3.4995
8 1.3968 1.4691 1.5489 1.6383 1.7402 1.8595 1.9280 2.0042 2.0902 2.1892 2.3060 2.4490 2.6338 2.8965 3.3554
9 1.3830 1.4537 1.5315 1.6185 1.7176 1.8331 1.8992 1.9727 2.0554 2.1504 2.2622 2.3984 2.5738 2.8214 3.2498
10 1.3722 1.4416 1.5179 1.6031 1.6998 1.8125 1.8768 1.9481 2.0283 2.1202 2.2281 2.3593 2.5275 2.7638 3.1693
11 1.3634 1.4318 1.5069 1.5906 1.6856 1.7959 1.8588 1.9284 2.0067 2.0961 2.2010 2.3281 2.4907 2.7181 3.1058
12 1.3562 1.4237 1.4979 1.5804 1.6739 1.7823 1.8440 1.9123 1.9889 2.0764 2.1788 2.3027 2.4607 2.6810 3.0545
13 1.3502 1.4170 1.4903 1.5718 1.6641 1.7709 1.8317 1.8989 1.9742 2.0600 2.1604 2.2816 2.4358 2.6503 3.0123
14 1.3450 1.4113 1.4839 1.5646 1.6558 1.7613 1.8213 1.8875 1.9617 2.0462 2.1448 2.2638 2.4149 2.6245 2.9768
15 1.3406 1.4063 1.4784 1.5583 1.6487 1.7531 1.8123 1.8777 1.9509 2.0343 2.1314 2.2485 2.3970 2.6025 2.9467
16 1.3368 1.4021 1.4736 1.5529 1.6425 1.7459 1.8046 1.8693 1.9417 2.0240 2.1199 2.2354 2.3815 2.5835 2.9208
17 1.3334 1.3983 1.4694 1.5482 1.6370 1.7396 1.7978 1.8619 1.9335 2.0150 2.1098 2.2238 2.3681 2.5669 2.8982
18 1.3304 1.3950 1.4656 1.5439 1.6322 1.7341 1.7918 1.8553 1.9264 2.0071 2.1009 2.2137 2.3562 2.5524 2.8784
19 1.3277 1.3920 1.4623 1.5402 1.6280 1.7291 1.7864 1.8495 1.9200 2.0000 2.0930 2.2047 2.3456 2.5395 2.8609
20 1.3253 1.3894 1.4593 1.5369 1.6242 1.7247 1.7816 1.8443 1.9143 1.9937 2.0860 2.1967 2.3362 2.5280 2.8453
21 1.3232 1.3870 1.4567 1.5338 1.6207 1.7207 1.7773 1.8397 1.9092 1.9880 2.0796 2.1894 2.3278 2.5176 2.8314
22 1.3212 1.3848 1.4542 1.5311 1.6176 1.7171 1.7734 1.8354 1.9045 1.9829 2.0739 2.1829 2.3202 2.5083 2.8188
23 1.3195 1.3828 1.4520 1.5286 1.6148 1.7139 1.7699 1.8316 1.9003 1.9782 2.0687 2.1770 2.3132 2.4999 2.8073
24 1.3178 1.3810 1.4500 1.5263 1.6122 1.7109 1.7667 1.8281 1.8965 1.9740 2.0639 2.1715 2.3069 2.4922 2.7969
25 1.3163 1.3794 1.4482 1.5242 1.6098 1.7081 1.7637 1.8248 1.8929 1.9701 2.0595 2.1666 2.3011 2.4851 2.7874
26 1.3150 1.3778 1.4464 1.5223 1.6076 1.7056 1.7610 1.8219 1.8897 1.9665 2.0555 2.1620 2.2958 2.4786 2.7787
27 1.3137 1.3764 1.4449 1.5205 1.6056 1.7033 1.7585 1.8191 1.8867 1.9632 2.0518 2.1578 2.2909 2.4727 2.7707
28 1.3125 1.3751 1.4434 1.5189 1.6037 1.7011 1.7561 1.8166 1.8839 1.9601 2.0484 2.1539 2.2864 2.4671 2.7633
29 1.3114 1.3739 1.4421 1.5174 1.6020 1.6991 1.7540 1.8142 1.8813 1.9573 2.0452 2.1503 2.2822 2.4620 2.7564
30 1.3104 1.3728 1.4408 1.5159 1.6004 1.6973 1.7520 1.8120 1.8789 1.9546 2.0423 2.1470 2.2783 2.4573 2.7500
40 1.3031 1.3646 1.4317 1.5057 1.5887 1.6839 1.7375 1.7963 1.8617 1.9357 2.0211 2.1229 2.2503 2.4233 2.7045
50 1.2987 1.3598 1.4263 1.4996 1.5818 1.6759 1.7289 1.7870 1.8516 1.9244 2.0086 2.1087 2.2338 2.4033 2.6778
60 1.2958 1.3566 1.4227 1.4956 1.5772 1.6706 1.7232 1.7808 1.8448 1.9170 2.0003 2.0994 2.2229 2.3901 2.6603
Page 44

Tabla Z
Áreas Bajo la curva de distribución de probabilidad normal estándar, entre la media y
valores positivos de z

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.10 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.20 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.30 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.40 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.50 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.60 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.70 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.80 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.90 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.00 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.10 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.20 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.30 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.40 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.50 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.60 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.70 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.80 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.90 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.00 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.10 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.20 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.30 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.40 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.50 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.60 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.70 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.80 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.90 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.00 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

También podría gustarte