Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplos y Ejercicios Resueltos PDF
Ejemplos y Ejercicios Resueltos PDF
Aprendizaje Efectivo de la
ESTADÍSTICA y la
PROBABILIDAD
RAEEP
Ejemplos y
Ejercicios resueltos
Lic. Gabriel Leandro, MBA
Tabla de contenidos
INTRODUCCIÓN A LA ESTADÍSTICA 3
DISTRIBUCIONES DE FRECUENCIAS 65
MUESTREO 192
1 .
Introducción a la estadística
OBJETIVOS:
Al concluir el capítulo, será capaz de:
Explicar el concepto de estadística y sus funciones principales
Reconocer la diferencia entre estadística descriptiva e inferencial
Identificar las fases básicas de una investigación estadística
Conocer las escalas de medición de las variables estadísticas
4. Número de hijos.
Cuantitativa discreta
8. Ciudad de residencia.
Cualitativa
4. ¿Cuál es la población?
Conjunto de funcionarios actuales de la empresa
Solución 1. Dado que el cuestionario solo debe ser aplicado a los puestos de
jefatura, entonces la unidad estadística no corresponde a un empleado
del banco, sino a un empleado que ocupe un puesto de jefatura en el
periodo en el cual se va a realizar el estudio.
2. Una característica o variable cuantitativa que pueda interesar en este
estudio puede ser el tiempo que tiene el funcionario de laborar para el
4. ¿Cuál es la población?
Es el conjunto de niños en edad escolar matriculados en una escuela de
la ciudad capital durante el año 2013.
Desventajas:
- En el muestreo no aleatorio es difícil obtener muestras representativas
de toda la población, por lo que luego no se podrían generalizar las
conclusiones al resto de la población.
Desventajas:
- Mayor costo, más tiempo en la realización del estudio y la negativa de
algunas unidades de estudio.
4. Número de hijos.
De razón
8. Ciudad de residencia.
Nominal
2. Una _____________ es una parte representativa de la población que se selecciona para ser
estudiada ya que la población es demasiado grande para ser estudiada en su totalidad. La
opción que mejor completa la frase anterior es:
( a ) Característica ( b ) Muestra
( c ) Observación ( d ) Población
3. Considere el siguiente concepto: "unidad de interés en el campo bajo estudio, sobre la cual
recae la observación y de la cual se derivan los datos para el análisis". Esto corresponde al
concepto de:
( a ) Unidad estadística ( b ) Característica
( c ) Muestra ( d ) Población
4. De las siguientes, no es una razón para trabajar con muestras en vez de la población es:
( a ) La población se destruye al estudiarla
( b ) El costo de estudiar la población es muy alto
( c ) La población es muy grande
( d ) Ninguna de las anteriores
8. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parámetros establecidos por la compañía. Para ello se formula lo
siguiente:
9. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parámetros establecidos por la compañía. La característica “tiempo
de realización de la actividad” es una variable que se mide en una escala:
( a ) De razón ( b ) Ordinal
( c ) De intervalo ( d ) Nominal
10. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parámetros establecidos por la compañía. Si la característica “grado
académico del operario” se evalúa como “Primaria incompleta, primaria completa, secundaria
incompleta, secundaria completa”, entonces la variable se mide en una escala:
( a ) De razón ( b ) Ordinal
( c ) De intervalo ( d ) Nominal
11. El gerente de un centro de llamadas desea evaluar el desempeño del sistema y para ello
decide basarse en los tiempos de espera de los clientes para ser atendidos (medido en
segundos) y el grado de satisfacción que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tomó una muestra de 12 llamadas
por día de lunes a miércoles. Los siguientes son los tiempos de las muestras tomadas de lunes
a miércoles:
12. Con base en la información de la pregunta 11, una variable medida en escala ordinal
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendió
( c ) Grado de satisfacción del cliente ( d ) Número de llamadas hechas por el cliente
13. Con base en la información de la pregunta 11, una variable medida en escala de razón
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendió
( c ) Grado de satisfacción del cliente ( d ) Ninguna de las anteriores
14. Con base en la información de la pregunta 11, una variable cualitativa puede ser:
( a ) Tiempo de espera ( b ) Número de llamadas atendidas por día
( c ) Grado de satisfacción del cliente ( d ) Número de llamadas hechas por el cliente
15. Con base en la información de la pregunta 11, una variable continua puede ser:
( a ) Tiempo de espera ( b ) Número de llamadas atendidas
( c ) Grado de satisfacción del cliente ( d ) Número de llamadas hechas por el cliente
16. Con base en la información de la pregunta 11, una variable discreta puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendió
( c ) Grado de satisfacción del cliente ( d ) Ninguna de las anteriores
17. Con base en la información de la pregunta 11, considere las dos siguientes afirmaciones:
A. Si el centro de llamadas tiene un sistema que registra los tiempos de todas las
llamadas, es mejor hacer un censo.
B. Dado que son muchas las llamadas, es necesario tomar una muestra muy grande.
Con respecto a las dos afirmaciones anteriores, es correcto con toda certeza que:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas
1. b 2. b 3. a 4. d
5. b 6. d 7. a 8. d
9. a 10. b 11. b 12. c
13. a 14. c 15. a 16. d
17. b
2 .
Presentación de la información
estadística
OBJETIVOS:
Al concluir el capítulo, será capaz de:
Identificar las formas principales de presentar la información estadística.
Presentar apropiadamente la información estadística en un formato textual.
Elaborar cuadros estadísticos.
Construir gráficos adecuados según el tipo de datos.
Condición de egreso %
Fallecidos al egresar
Por enterobacter 41.38%
Por pseudomonas aeruginosa 9.95%
Por otras infecciones 10.07%
Dados de alta 31.40%
Abandonan en malas condiciones 7.20%
Total 100.00%
Fuente: Membreño Sequeira, Juana María (2004). Comportamiento Clínico y
Epidemiológico de las Infecciones Nosocomiales en la Unidad de Cuidados Intensivos
Neonatales del Hospital Dr. Oscar Danilo Rosales Argüello, Recuperado de
http://www.minsa.gob.ni/enfermeria/PDF/327.pdf
Ejercicio Indique qué tipo de gráfico emplearía para presentar los siguientes datos.
Explique en cada caso:
de
revisión a. Porcentaje de niños de un año vacunados contra el sarampión para los
países de América Central en el 2009.
Barras horizontales
2. Si se tiene una serie cronológica, el tipo de gráfico adecuado para representarla es:
( a ) Gráfica de barras horizontales
( b ) Gráfica de barras verticales
( c ) Histograma
( d ) Diagrama de dispersión
3. Si se tiene una serie cualitativa, el tipo de gráfico adecuado para representarla es:
( a ) Gráfico circular
( b ) Gráfico lineal
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
4. ¿Qué tipo de gráfico utilizaría para representar el porcentaje de niños de un año vacunados
contra el sarampión para los países de América Central en el 2009?
( a ) Gráfico circular
( b ) Gráfico lineal
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
5. ¿Qué tipo de gráfico utilizaría para representar el porcentaje de niños de un año vacunados
contra el sarampión para Costa Rica y Panamá del año 2000 al 2009?
( a ) Gráfico de barras horizontales comparativas
( b ) Gráfico de barras horizontales compuestas
( c ) Gráfico de barras verticales comparativas
( d ) Gráfico de barras verticales compuestas
6. ¿Qué tipo de gráfico utilizaría para representar la distribución porcentual del número de
personas afectadas por el VIH entre la población de 15 a 49 años de edad por sexo para Costa
Rica en el 2009?
( a ) Gráfico circular
( b ) Gráfico lineal
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
7. ¿Qué tipo de gráfico utilizaría para representar la relación entre el porcentaje de cobertura
de atención prenatal y la razón de mortalidad materna por cada 100.000 nacidos vivos para 10
países de América Latina en el 2006?
( a ) Gráfico circular
( b ) Diagrama de dispersión
( c ) Pictograma
( d ) Gráfico de barras horizontales
10. Si usted va a representar las exportaciones anuales de un país en el periodo 2009 – 2011
por tipo de producto, ¿cuál tipo de gráfico es más apropiado?
( a ) Gráfico de barras horizontales comparativas
( b ) Gráfico de barras horizontales compuestas
( c ) Gráfico de barras verticales comparativas
( d ) Gráfica de dispersión
11. ¿Qué tipo de gráfico utilizaría para representar el monto de las ventas (en dólares) de una
empresa por tipo de producto para el año 2012?
( a ) Gráfico circular
( b ) Gráfico lineal
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
12. ¿Qué tipo de gráfico utilizaría para representar el monto de las ventas (en dólares) de una
empresa por año del 2007 al 2012?
( a ) Gráfico circular
( b ) Barra 100%
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
13. ¿Qué tipo de gráfico utilizaría para representar la distribución porcentual de las ventas de
una empresa por tipo de producto para el año 2012?
( a ) Gráfico circular
( b ) Gráfico lineal
( c ) Gráfico de barras verticales
( d ) Gráfico de barras horizontales
14. ¿Qué tipo de gráfico utilizaría para representar la distribución porcentual de las ventas de
una empresa por tipo de producto y según tipo de cliente para el año 2012?
( a ) Gráfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Gráfico de barras verticales compuestas
( d ) Gráfico de barras horizontales compuestas
15. ¿Qué tipo de gráfico utilizaría para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto y según tipo de cliente para el año 2012?
( a ) Gráfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Gráfico de barras verticales compuestas
( d ) Gráfico de barras horizontales compuestas
16. ¿Qué tipo de gráfico utilizaría para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto para el periodo 2007 al 2012?
( a ) Gráfico de barras horizontales comparativas
( b ) Gráfico de barras verticales comparativas
( c ) Gráfico de barras verticales compuestas
( d ) Gráfico de barras horizontales compuestas
17. El gerente de un centro de llamadas desea evaluar el desempeño de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfacción que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tomó una muestra de 12 llamadas
por día de lunes a miércoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a miércoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el miércoles solo de llamadas no atendidas:
El tipo de gráfico apropiado para representar la distribución porcentual de las llamadas según
el agente que contestó es:
( a ) Gráfico lineal
( b ) Gráfico de barras verticales
( c ) Gráficos de barras horizontales
( d ) Gráfico circular
18. Con base en los datos de la pregunta 17, el tipo de gráfico apropiado para representar el
número de llamadas recibidas por mes durante los últimos 12 meses es:
( a ) Gráfico lineal
( b ) Diagrama de dispersión
( c ) Gráficos de barras horizontales
( d ) Barra 100%
1. c 2. b 3. d 4. d
5. c 6. a 7. b 8. b
9. d 10. c 11. d 12. c
13. a 14. d 15. a 16. b
17. d 18. a
3 .
Análisis descriptivo de la
información estadística
OBJETIVOS:
Al concluir el capítulo, será capaz de:
Reconocer la importancia y utilidad de las medidas de posición central.
Calcular e interpretar las principales medidas de posición en datos no agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos no agrupados.
Ejemplo Suponga que se tienen los siguientes datos correspondientes a las ventas
mensuales que ha realizado un vendedor durante los últimos siete meses
(en millones de dólares):
20 33 42 40 19 23 28
x 29,29
7
Según ese resultado, sus ventas mensuales promedio son de 29,29 millones
de dólares.
40 50 65 85 75 90 60 60 60 75
x 66
10
Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tienen
los siguientes datos correspondientes a las ventas mensuales que ha
realizado un vendedor durante los últimos siete meses (en millones de
dólares):
Solución En Excel, se introducen los datos, bien sea en una fila o una columna. En
este caso los datos se encuentran en el rango de celdas de A1 hasta A7:
Luego se elige una celda para determinar el resultado, por ejemplo la celda
B8, y en ella se ingresa la siguiente función de Excel:
=PROMEDIO(A1:A7)
x i fi
4 50 6 40 3 35 2 20
x i 1
39
n 15
x f i i
15 20 20 25 25 10
x i 1
19,09
n 55
Ejemplo Una empresa obtiene distintos márgenes de utilidad según los diferentes
productos que vende. Suponiendo que vende 3 productos diferentes A, B y
C, de acuerdo con los siguientes datos:
Volumen de ventas
Producto Margen de utilidad (en millones de dólares)
A 20% 200
B 30% 100
C 40% 60
Total: $ 360
x w i i
20% 200 30% 100 40% 60
x i 1
k
26.11%
w
360
i
i 1
x w i i
8 1 9 2 6 6
x i 1
6,88
k
1 2 6
w
i 1
i
Ejemplo Utilice Excel y Minitab para calcular la media geométrica del conjunto de
datos siguiente:
Solución En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:
=MEDIA.GEOM(A1:A5)
función:
GMEAN(C1)
Conjunto 1:
12, 14, 14, 15, 18, 18, 18, 22, 25
Conjunto 2:
12, 14, 14, 14, 15, 18, 18, 18, 22, 25
Conjunto 3:
12, 14, 15, 18, 22, 25
Conjunto 4:
12, 14, 14, 15, 18, 18, 18, 22, 2500
Solución 1. El dato que más veces aparece es el 18, por tanto la moda es 18.
3. No tiene moda.
4. El dato que más veces aparece es el 18, por tanto la moda es 18.
Observe que el valor extremo 2500 no afectó el resultado, pues el conjunto
1 y el 4 son iguales excepto por ese valor.
Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un
grupo de trabajadores. ¿Cuál es la mediana?
5, 6, 7, 8, 9, 10, 12
N 1 7 1
PMed 4
2 2
Ese resultado indica que la mediana será el cuarto dato de la serie, es decir,
la mediana será 8, Med = 8.
Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 11, 10, 6, y 9, los años de servicios
de un grupo de trabajadores. ¿Cuál es la mediana?
5, 6, 7, 8, 9, 10, 11, 12
Dado que se tienen 8 datos, una cantidad par de datos, se aplica la formula:
N 1 8 1
PMed 4.5
2 2
Ese resultado indica que la mediana estará entre el cuarto y el quinto dato
de la serie, y por tanto será necesario calcular el punto medio entre 8 y 9,
es decir, la mediana será (8+9)/2, Med = 8.5.
Conjunto 1: 40, 50, 60, 60, 60, 65, 75, 75, 85, 90
N 1 10 1
PMed 5,5
2 2
60 65
Med 62,5
2
N 1 7 1
PMed 4
2 2
Med = 110
Ejemplo Suponga que se tienen tres conjuntos de datos y para cada uno de ellos se
conoce la media, mediana y moda:
Conjunto 1:
12, 13, 14, 14, 15, 15, 15, 16, 16, 16,
16, 16, 17, 17, 17, 18, 18, 19, 20
Conjunto 2:
12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18,
18, 18, 19, 19, 19, 19, 19, 20, 20, 20
Conjunto 3:
12, 12, 12, 13, 13, 13, 13, 13, 14, 14,
14, 15, 15, 16, 16, 17, 17, 18, 19, 20
Solución Conjunto 1:
Media = 16
Mediana = 16
Moda = 16
La media, la mediana y la moda son iguales, lo que indica una distribución
simétrica, lo cual se observa claramente en la gráfica siguiente.
4
Frecuencia
0
12 14 16 18 20
C1
Conjunto 2:
Media = 17,19
Mediana = 18
Moda = 19
La media es menor que la mediana, y a su vez la mediana es menor que la
moda, lo que indica una distribución asimétrica negativa, lo cual se
observa claramente en la gráfica siguiente.
Frecuencia
3
0
12 14 16 18 20
C2
Conjunto 3:
Media = 14,8
Mediana = 14
Moda = 13
La media es mayor que la mediana, y a su vez la mediana es mayor que la
moda, lo que indica una distribución asimétrica positiva, lo cual se observa
claramente en la gráfica siguiente.
4
Frecuencia
0
12 14 16 18 20
C3
Moda = 60
Mediana = 62.5
Media = 66
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
25
10 1 2,75
Paso 3: La fórmula anterior no da el valor del percentil, sino que da la
posición del percentil 25. Hay que buscar el dato en la posición 2,75.
Como no se tiene un valor en la posición 2,75, quiere decir que el valor del
percentil va a estar entre el segundo valor y el tercero, entonces se realiza
una interpolación. Esto es, se toma el segundo dato en la serie ordenada,
que es 40, y se le suma el producto de la parte decimal del resultado de la
fórmula, que es 0,75 por la diferencia entre el segundo y el tercer dato, que
es 70 – 40 = 30. O sea, el percentil equivale a:
Tercer cuartil:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
75
10 1 8,25
Paso 3: La fórmula anterior no da el valor del percentil, sino que da la
posición del percentil 75. Hay que buscar el dato en la posición 8,25.
Como no se tiene un valor en la posición 8,25, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolación. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
fórmula, que es 0,25 por la diferencia entre el octavo y el noveno dato, que
es 140 – 120 = 20. O sea, el percentil equivale a:
Decil 4:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
40
10 1 4,4
Paso 3: La fórmula anterior no da el valor del percentil, sino que da la
posición del percentil 40. Hay que buscar el dato en la posición 4,4. Como
no se tiene un valor en la posición 4,4, quiere decir que el valor del
percentil va a estar entre el cuarto valor y el quinto, entonces se realiza una
interpolación. Esto es, se toma el cuarto dato en la serie ordenada, que es
100, y se le suma el producto de la parte decimal del resultado de la
fórmula, que es 0,4 por la diferencia entre el cuarto y el quinto dato, que es
100 – 100 = 0. O sea, el percentil equivale a:
Percentil 80:
Paso 1: El primer paso es ordenar la serie de datos:
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Pm 100
m
n 1 100
80
10 1 8,8
Paso 3: La fórmula anterior no da el valor del percentil, sino que da la
posición del percentil 80. Hay que buscar el dato en la posición 8,8. Como
no se tiene un valor en la posición 8,8, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolación. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
fórmula, que es 0,8 por la diferencia entre el octavo y el noveno dato, que
es 140 – 120 = 20. O sea, el percentil equivale a:
Primer cuartil:
Paso 1: El primer paso es ordenar la serie de datos:
Paso 2: Se desea calcular el primer cuartil, que equivale al percentil 25, por
lo que m = 25 y se tienen 10 datos, por lo que n = 10. Entonces se sustituye
en la fórmula:
Pm 100
m
n 1 100
25
10 1 2,75
Paso 3: La fórmula anterior no da el valor del percentil, sino que da la
posición del percentil 25. Hay que buscar el dato en la posición 2,75.
Como no se tiene un valor en la posición 2,75, quiere decir que el valor del
percentil va a estar entre el segundo valor y el tercero, entonces se realiza
una interpolación. Esto es, se toma el segundo dato en la serie ordenada,
que es 50, y se le suma el producto de la parte decimal del resultado de la
fórmula, que es 0,75 por la diferencia entre el segundo y el tercer dato, que
es 60 – 50 = 10. O sea, el percentil equivale a:
Tercer cuartil:
Paso 1: El primer paso es ordenar la serie de datos:
Paso 2: Se desea calcular el tercer cuartil, que equivale al percentil 75, por
lo que m = 75 y se tienen 10 datos, por lo que n = 10. Entonces se sustituye
en la fórmula:
Pm 100
m
n 1 100
75
10 1 8,25
Paso 3: Se toma el octavo dato en la serie ordenada, que es 75, y se le
suma el producto de la parte decimal del resultado de la fórmula, que es
0,25 por la diferencia entre el octavo y el noveno dato, que es 85 – 75 =
10. O sea, el percentil equivale a:
Decil 4:
Paso 1: El primer paso es ordenar la serie de datos:
Paso 2: Se desea calcular el decil 4, que equivale al percentil 40, por lo que
m = 40 y se tienen 10 datos, por lo que n = 10. Entonces se sustituye en la
fórmula:
Pm 100
m
n 1 100
40
10 1 4,4
Paso 3: Se aplica:
P40 = 60 + 0,4 * 0 = 60
Quintil 3:
Paso 1: El primer paso es ordenar la serie de datos:
Pm 100
m
n 1 100
30
10 1 3,3
Paso 3: Se aplica:
P30 = 60 + 0,3 * 0 = 60
Percentil 65:
Paso 1: El primer paso es ordenar la serie de datos:
Pm 100
m
n 1 100
65
10 1 7,15
Paso 3: Se aplica:
P65 = 75 + 0,15 * 0 = 75
20, 40, 70, 100, 100, 100, 120, 120, 140, 150
Solución En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A10:
=CUARTIL(A1:A10;1)
=CUARTIL(A1:A10;3)
=PERCENTIL(A1:A10;0,80)
PERCENTILE(número.probabilidad)
PERCENTILE(C1.0,80)
Primer cuartil: 20
Tercer cuartil: 36
Mediana: 30
Mínimo: 8
Máximo: 42
0 10 20 30 40 50
24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40
Q1 = 27
Q3 = 31,5
20, 24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40, 45
Solución Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al menú Grafica y se elige Gráfica de caja. En el cuadro se
escoge Una Y Simple, y se da clic en Aceptar. En el cuadro de diálogo que
aparece se selecciona la columna que contiene los datos, que en este caso
es la columna C1, y se da clic en Aceptar. Se obtiene la gráfica siguiente:
Gráfica de caja de C1
45
40
35
C1
30
25
20
Gráfica de caja de C1
90
80
70
C1
60
50
40
15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35
Solución Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al menú Grafica y se elige Gráfica de caja. En el cuadro se
escoge Una Y Simple, y se da clic en Aceptar. En el cuadro de diálogo que
aparece se selecciona la columna que contiene los datos, que en este caso
es la columna C1, y se da clic en Aceptar. Se obtiene la gráfica siguiente:
Gráfica de caja de C1
35
30
25
C1
20
15
15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35
Solución Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al menú Estadísticas y se elige Mostrar estadísticas descriptivas.
En el cuadro de diálogo se selecciona la variable, en este caso en la
columna C1, y en el botón estadísticas se marca primer cuartil, tercer
cuartil y rango intercuartil, y se da clic en Aceptar.
Q1 = 57.5
Q3 = 77.5
RIC = Q3 – Q1 = 77.5 – 57.5 = 20
Q = 20/2 = 10
Utilice Minitab para elaborar una gráfica de caja para cada conjunto de
datos.
Solución Primero que todo se introducen los datos en la hoja de trabajo, cada
conjunto en una columna distinta, en este caso C1 para los futbolistas y C2
para los basquetbolistas. Luego se da clic en el menú Gráfica y se elige
Gráfica de caja. En el cuadro de diálogo se selecciona Múltiples Y.
Después se seleccionan las dos variables y se da clic en Aceptar.
2,2
2,1
Datos
2,0
1,9
1,8
1,7
C1 C2
Al comparar las dos gráficas, se observa que las estaturas de los futbolistas
tienden a ser menores que las de los basquetbolistas, y que el tercer cuartil
de los primeros es, apenas, un poco superior que el primer cuartil de los
segundos.
Ejemplo Suponga que se tienen los dos siguientes conjuntos de cinco datos:
Conjunto A: 1, 2, 3, 7, 10
Conjunto B: 1, 9, 9, 10, 10
Rango = 10 – 1 = 9
Rango = 10 – 1 = 9
Solución:
Máximo = 90
Mínimo = 40
Rango = 90 – 40 = 50
x i
1 1 3 10 10 25
x i 1
5
n 5 5
x xx x x 2
1 1 – 5 = –4 (–4)² = 16
1 1 – 5 = –4 (–4)² = 16
3 3 – 5 = –2 (–2)² = 4
10 10 – 5 = 5 (5)² = 25
10 10 – 5 = 5 (5)² = 25
Suma: (x x) 2
= 86
(x i x )2
86
s2 i 1
21.5
n 1 5 1
(x i x )2
s i 1
s2 21.5 4.64
n 1
Solución:
a. Si se emplea la fórmula de la varianza para una muestra, es necesario
calcular la media aritmética primero:
x i
40 50 65 85 75 90 60 60 60 75
x i 1
66
n 10
x xx x x 2
40 40 – 66 (-26)2 = 676
50 50 – 66 (-16) 2 = 256
65 65 – 66 (-1) 2 = 1
85 85 – 66 192 = 361
75 75 – 66 92 = 81
90 90 – 66 242 = 576
60 60 – 66 (-6) 2 = 36
60 60 – 66 (-6) 2 = 36
60 60 – 66 (-6) 2 = 36
75 75 – 66 92 = 81
Suma: (x x) 2
= 2140
(x i x )2
2140
s2 i 1
237.78
n 1 10 1
(x i x )2
s i 1
s2 237.78 15.42
n 1
Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tiene el
siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular la
varianza y la desviación estándar de dicha muestra.
Solución En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:
=VAR(A1:A5)
=DESVEST(A1:A5)
Solución Se tiene una media de $600 con una desviación estándar de $30, y el
intervalo dado está entre $510 y $690. Para aplicar la regla empírica es
necesario saber cuántas veces se ha sumado y restado la desviación
estándar al promedio. Esto puede obtenerse fácilmente porque se sabe que
cada límite se obtuvo a partir de k , así que, tomando el límite
inferior de 510 (y por eso va con signo menos):
600 k * 30 510
k * 30 510 600
k 90 / 30
k 3
Solución Se tiene una media de $600 con una desviación estándar de $30, y el
intervalo dado está entre $525 y $675. Para aplicar el teorema de
Chebyshev es necesario saber cuántas veces se ha sumado y restado la
desviación estándar al promedio. Esto puede obtenerse fácilmente porque
se sabe que cada límite se obtuvo a partir de k , así que, tomando el
límite inferior de 525 (y por eso va con signo menos):
600 k * 30 525
k * 30 525 600
k 75 / 30
k 2,5
1 1 1
1 2
1 2
1 0,84
k 2,5 6,25
Ejercicio Las botellas de agua envasadas en un proceso de llenado tienen una media
de 501 ml con una desviación estándar de 2 ml.
de
revisión a. Si no se conoce si la distribución es simétrica o asimétrica, ¿qué
porcentaje de las botellas podrían tener entre 497 ml y 505 ml de agua?
b. ¿Cómo cambia su respuesta anterior si se sabe que la distribución del
contenido de agua en las botellas se distribuye normalmente?
Solución:
Media = 501 ml
Desviación estándar = 2 ml
k 505
501 k 2 505
2k 505 501
2k 4
k 4/2
k2
1 1 1
1 2
1 2 1 0,75
k 2 4
Ejemplo Se sabe que los recién nacidos varones de una ciudad tienen un peso medio
de 3.450 gramos, con una desviación estándar de 75 gramos, mientras que
los recién nacidos varones de una zona rural tienen un peso medio de
3.350 gramos con una desviación estándar de 100 gramos. Una madre
residente de esa ciudad acaba de tener un niño con un peso de 3.475
gramos y otra madre residente de la zona rural dada acaba de tener un niño
con un peso de 3.450 gramos, ¿cuál de los dos niños tiene, en términos
relativos, un peso mayor?
Si una persona en Argentina gastó este año $850 en salud, mientras que
otra persona en Chile gastó $1050 en salud, ¿cuál de los dos gastó más en
términos relativos?
Solución:
En términos absolutos, la persona en Chile gastó más, pero en términos
relativos se requiere el cálculo de puntajes estandarizados.
Ejemplo En el caso del conjunto de datos anterior, se calculó una media de 5 y una
desviación estándar de 4.64, calcule el coeficiente de variación.
Solución Dado que se calculó una media de 5 y una desviación estándar de 4.64,
entonces el coeficiente de variación es:
s 4.64
CV 100 100 92.74%
x 5
Solución:
Se calcula primero la desviación estándar y la media aritmética:
s 15.42
CV 100 100 23.36%
x 66
Ejemplo Utilice Minitab para resolver el ejercicio: Suponga que se tiene el siguiente
conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular el coeficiente de
variación de dicha muestra.
Solución En Minitab, primero se introducen los datos en una columna, por ejemplo,
en la columna C1:
24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30
24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30
Solución El primer paso es digitar estos datos en una columna de la hoja de trabajo
de Minitab, por ejemplo, en la columna C1. Luego se da clic en el menú
Estadísticas, se selecciona Estadística básica y ahí se elige Resumen
gráfico.
Resumen para C1
P rueba de normalidad de A nderson-Darling
A -cuadrado 0,64
V alor P 0,078
M edia 26,133
Desv .Est. 1,767
V arianza 3,124
A simetría 0,932550
Kurtosis 0,217419
N 15
M ínimo 24,000
1er cuartil 25,000
M ediana 26,000
3er cuartil 27,000
24 25 26 27 28 29 30 M áximo 30,000
Interv alo de confianza de 95% para la media
25,155 27,112
Interv alo de confianza de 95% para la mediana
25,000 27,000
Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95%
1,294 2,787
Media
Mediana
2. La media aritmética del siguiente conjunto de datos 7, 20, 13, 14, 6, 9, 1 es:
( a ) 70 ( b ) 20
( c ) 14 ( d ) 10
3. La moda del siguiente conjunto de datos 7, 7, 20, 20, 13, 14, 13, 6, 9, 13, 6 es:
(a)7 ( b ) 20
( c ) 13 (d)6
4. La media aritmética del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
5. La mediana del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
6. La moda del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 20, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36
7. El primer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13 (d)6
8. El tercer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 14 ( b ) 20
( c ) 13 ( d ) 17
9. El percentil 30 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 7,6 ( b ) 10
(c)7 (d)6
10. El percentil 70 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13,4 (d)6
11. La desviación estándar del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6
es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4
12. La varianza del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4
13. Si en una muestra, la media es igual a la moda y a la mediana, entonces se concluye que:
Con respecto a las dos afirmaciones anteriores, es correcto que con toda certeza:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas
14. Si dos valores en un grupo de datos ocurren más a menudo que otros cualesquiera, la
distribución de los datos será ___________. La opción que mejor completa la frase anterior
es:
( a ) Simétrica ( b ) Bimodal
( c ) Asimétrica positiva ( d ) Asimétrica negativa
17. ¿Cuál de los siguientes enunciados no es una ventaja del uso de la mediana?
( a ) Los valores extremos afectan a la mediana menos intensamente que a la media
( b ) La mediana es fácil de entender
( c ) Una mediana puede calcularse para descripciones cualitativas
( d ) Ninguna de las anteriores
20. Si un grupo de datos tiene tan sólo una moda y el valor de la moda es menor que el de la
media, podremos llegar a la conclusión de que la gráfica de la distribución es:
( a ) Simétrica ( b ) Sesgada a la izquierda
( c ) Sesgada ala derecha ( d ) Platicúrtica
23. ¿Cuál de los siguientes casos es un ejemplo de una medida relativa de dispersión?
( a ) Desviación estándar
( b ) Varianza
( c ) Coeficiente de variación
( d ) Las opciones a y b pero no c
24. Si p es el mayor de tres enteros consecutivos, entonces el promedio de los tres números
es:
(a)p (b)p–1
(c)p–3 ( d ) 3p – 1
26. El gerente de un centro de llamadas desea evaluar el desempeño de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfacción que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tomó una muestra de 12 llamadas
por día de lunes a miércoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a miércoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el miércoles solo de llamadas no atendidas:
27. La distribución de los tiempos de las llamadas del día martes es:
( a ) Simétrica ( b ) Asimétrica positiva
( c ) Asimétrica negativa ( d ) Ninguna de las anteriores
28. El tiempo medio de espera de los clientes de la muestra del día martes es, en segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores
29. La mediana del tiempo de espera de los clientes de la muestra del día martes es, en
segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores
30. La moda del tiempo de espera de los clientes de la muestra del día lunes es, en segundos:
( a ) 15 ( b ) 15,5
( c ) 16 ( d ) Ninguna de las anteriores
31. Con respecto a los datos del día miércoles es verdadero que:
( a ) La distribución es asimétrica a la izquierda
( b ) No se presentan valores extremos
( c ) La distribución es bimodal
( d ) Todas las anteriores son verdaderas
32. El cuartil 1 de los tiempos de espera del día lunes es, en segundos:
( a ) 15,5 ( b ) 15
( c ) 16 ( d ) 3,25
33. El cuartil 3 de los tiempos de espera del día martes es, en segundos:
( a ) 18,75 ( b ) 19,5
( c ) 9,75 ( d ) 37,5
34. El percentil 80 de los tiempos de espera del día miércoles es, en segundos:
( a ) 62 ( b ) 68
( c ) 10,4 ( d ) Ninguna de las anteriores
35. La varianza de los tiempos de espera del día miércoles es, aproximadamente, en
segundos2:
( a ) 19,6 ( b ) 384,09
( c ) 13,75 ( d ) 189,06
36. La desviación estándar de los tiempos de espera del día martes es, en segundos:
( a ) 5,5 (b)8
( c ) 64 ( d ) Ninguna de las anteriores
38. Con relación a la variabilidad relativa de los tiempos de espera es verdadero que el día
cuyos tiempos tienen una dispersión relativa más baja es:
( a ) Lunes ( b ) Martes
( c ) Miércoles ( d ) Falta información para determinarlo
39. El decil 4 de los tiempos de espera del día lunes es, en segundos:
( a ) 5,2 ( b ) 15
( c ) 16 ( d ) Ninguna de las anteriores
40. Si el primer cuartil para los tiempos de espera del día viernes es de 14,6 segundos,
entonces es falso que:
( a ) Un 25% de los clientes de ese día esperaron 14,6 segundos o menos
( b ) Un 75% de los clientes de ese día esperaron 14,6 segundos o más
( c ) Un cliente que esperó 12 segundos esperó poco con respecto a los demás
( d ) Ninguna de las anteriores
41. Si la mediana para los tiempos de espera del día viernes es de 19,8 segundos, entonces es
falso, con toda certeza, que:
( a ) Un 50% de los clientes de ese día esperaron 19,8 segundos o menos
( b ) El tiempo de espera promedio de ese día fue de 19,8 segundos
( c ) La mayoría de los clientes esperaron más de 19,8 segundos
( d ) Ninguna de las anteriores
42. Si la media para los tiempos de espera del día viernes es de 21,3 segundos, entonces es
verdadero que:
( a ) La mitad de los clientes esperaron 21,3 segundos o menos
( b ) Un 50% de los clientes de ese día esperaron 21,3 segundos o más
( c ) El tiempo más frecuente fue 21,3 segundos
( d ) Todas las anteriores son falsas
43. Si la media para los tiempos de espera es de 21,3 segundos y la desviación estándar para
los tiempos de espera del día viernes es de 7,6 segundos, entonces es verdadero que:
( a ) Los tiempos de espera tuvieron una variabilidad de 7,6 segundos con relación a su media
( b ) Aproximadamente un 68,3% de los clientes esperaron entre 13,7 y 28,9 segundos
( c ) Aproximadamente un 95,4% de los clientes esperaron entre 6,1 y 36,5 segundos
( d ) Todas las anteriores son verdaderas
1. d 2. d 3. c 4. d 5. b
6. a 7. a 8. a 9. a 10. c
11. b 12. a 13. d 14. b 15. d
16. a 17. d 18. d 19. a 20. b
21. a 22. b 23. c 24. b 25. a
26. a 27. b 28. b 29. c 30. c
31. c 32. b 33. b 34. b 35. b
36. b 37. a 38. a 39. c 40. d
41. d 42. d 43. d
4 .
Distribuciones de frecuencias
OBJETIVOS:
Al concluir el capítulo, será capaz de:
Construir la tabla de una distribución de frecuencias.
Representar gráficamente los datos provenientes de una distribución de frecuencias.
Calcular e interpretar las principales medidas de posición en datos agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos agrupados.
Distribuciones de frecuencias
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisión 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15
Solución:
– Determinación del rango o amplitud total: Esto consiste en encontrar
la diferencia entre el dato más alto y el más bajo. En este caso:
Dato mayor: 25
Dato menor: 8
Rango = dato mayor menos dato menor = 25 – 8 = 17
17 ÷ 6 = 2.83
– Determinación de los límites de clase: Los límites reales serán los que
se emplearán en el cálculo de los puntos medios y los demás cálculos
posteriores. Ejemplo:
Límites reales
7,5 – 10,5
10,5 – 13,5
13,5 – 16,5
16,5 – 19,5
19,5 – 22,5
22,5 – 25,5
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisión 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15
Si los siguientes son los límites reales, determine las frecuencias absolutas
de cada clase:
Solución:
Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine los puntos
de medios de cada clase:
revisión
Límites reales Puntos medios
7,5 - 10,5
10,5 - 13,5
13,5 - 16,5
16,5 - 19,5
19,5 - 22,5
22,5 - 25,5
Solución:
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativas de cada clase:
revisión
Límites Frecuencia Frecuencia
reales absoluta relativa
7,5 - 10,5
10,5 - 13,5
13,5 - 16,5
16,5 - 19,5
19,5 - 22,5
22,5 - 25,5
Total 30 100.00%
Solución:
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias absolutas acumuladas a menos de y a más de de cada clase:
revisión
Límites Frecuencia Frecuencia acumulada
reales absoluta a menos de a más de
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativa acumuladas a menos de y a más de de cada clase:
revisión
Límites Frecuencia Frecuencia acumulada
reales relativa a menos de a más de
7,5 - 10,5 13,33%
10,5 - 13,5 23,33%
13,5 - 16,5 30,00%
16,5 - 19,5 16,67%
19,5 - 22,5 10,00%
22,5 - 25,5 6,67%
Total 30
Solución:
19 25 32 40 21 28 56 27 31 29
41 36 32 18 50 48 25 33 35 26
28 24 22 27 35 26 43 34 43 39
Solución En Excel, primero se introducen los datos en una columna (o una fila). En
este caso se introducen los datos en el rango de celdas A1 hasta A30.
caso están en las celdas de A1 hasta A30. En rango de clases se indican los
límites, los cuales están en las celdas de B1 hasta B8. Luego hay que
marcar la opción Crear gráfico, y se da clic en Aceptar. Excel genera una
tabla y un gráfico como el siguiente:
Histograma de C1
5
Frecuencia
0
20 25 30 35 40 45 50 55
C1
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), construya un
de histograma para esta variable:
revisión
Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Frecuencia absoluta
10
9
8
7
6
5
4
3
2
1
0
9 12 15 18 21 24
Calcule la moda.
Solución La clase modal es la tercera clase, cuyos límites reales son 27,5 – 32,5, su
límite inferior real es 27,5, su intervalo de clase es 5 (límite superior
menos límite inferior = 32,5 – 27,5 = 5) y su frecuencia absoluta es 8. La
clase pre modal (22,5 – 27,5) tiene frecuencia 5 (por tanto d1 = 8 – 5 = 3) y
la pos modal (32,5 – 37,5) tiene frecuencia también de 5 (por tanto d2 = 8 –
5 = 3). El cálculo es:
d1 (8 5)
M o Li c 27.5 5 30
d1 d 2 (8 5) (8 5)
La moda es 30.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la moda:
de
revisión Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
La clase modal es la tercera clase, cuyos límites reales son 13,5 – 16,5, su
límite inferior real es 13,5, su intervalo de clase es 3 (límite superior
menos límite inferior = 16,5 – 13,5 = 5) y su frecuencia absoluta es 9.
La clase pre modal (10,5 – 13,5) tiene frecuencia 7, por tanto el valor de
d1 es d1 = 9 – 7 = 2 y la postmodal (16,5 – 19,5) tiene frecuencia también
de 5, por tanto d2 = 9 – 5 = 4. El cálculo es:
d1 (9 7)
M o Li c 13.5 3 14.5
d1 d 2 (9 7) (9 5)
La moda es 14.5.
Calcule la mediana.
Solución Se tiene que n = 30, por tanto n/2 = 30/2 = 15, lo que quiere decir que la
clase mediana será la tercer clase, ya que su frecuencia acumulada menos
de es 17, que es la que apenas supera a 15. El límite inferior de la clase es
27,5, el intervalo de la clase es 5, la frecuencia acumulada de la clase pre
mediana es 9 y la frecuencia de la clase mediana es 8. Aplicando la
fórmula:
n Fi 1 30 9
Med Li c 2 27,5 5 2 27,5 5 6 31,25
fi 8 8
La mediana es 31,25.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la mediana:
de
revisión Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Se calcula la frecuencia absoluta acumulada (F):
Se tiene que n = 30, por tanto n/2 = 30/2 = 15, lo que quiere decir que la
clase mediana será la tercer clase, ya que su frecuencia acumulada menos
de es 20, que es la que apenas supera a 15. El límite inferior de la clase es
13,5, el intervalo de la clase es 3, la frecuencia acumulada de la clase pre
mediana es 11 y la frecuencia de la clase mediana es 9. Aplicando la
fórmula:
n Fi 1 30 11
Med Li c 2 13,5 3 2 14,83
fi 9
La mediana es 14.83.
Aplicando la fórmula:
k
x i fi
985
x i 1
32,83
n 30
La media es 32,83.
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la media:
de
revisión Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Para el cálculo es útil el empleo de una tabla auxiliar:
Aplicando la fórmula:
k
x i fi
456
x i 1
15.2
n 30
La media es 15.2.
mn Fi 1 75 x30 22
Q3 P75 Li c 100 37,5 5 100
fi 3
0,5
37,5 5 38,33
3
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule el primer cuartil
de y el percentil 70:
revisión
Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Se completa la tabla:
Frecuencia Frecuencia
Frecuencia Frecuencia
Límites absoluta relativa
absoluta relativa
reales acumulada acumulada
fi fr fi n
fi “menos de”
7,5 - 10,5 4 4 13.33% 13.33%
10,5 - 13,5 7 11 23.33% 36.67%
13,5 - 16,5 9 20 30.00% 66.67%
16,5 - 19,5 5 25 16.67% 83.33%
19,5 - 22,5 3 28 10.00% 93.33%
22,5 - 25,5 2 30 6.67% 100.00%
Total 30 100,00%
mn Fi 1 75 x30 20
Q3 P75 Li c 100 16,5 3 100 18
fi 5
Puntos Frecuencia
medios x i absoluta f i
( xi x ) ( xi x ) 2 ( xi x ) 2 f i
20 4 –12,83 164,69 658,78
25 5 –7,83 61,36 306,81
30 8 –2,83 8,03 64,22
35 5 2,17 4,69 23,47
40 3 7,17 51,36 154,08
45 2 12,17 148,03 296,06
50 2 17,17 294,69 589,39
55 1 22,17 491,36 491,36
30 Total 2584,17
Aplicando la fórmula:
(x i x )2 fi
2584,17
s2 i 1
89,11
n 1 30 1
s s 2 89,11 9,44
Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la varianza y la
de desviación estándar:
revisión
Límites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30
Solución:
Se supondrá que los datos corresponden a una muestra y se usará la
segunda fórmula de las señaladas anteriormente. También es útil construir
una tabla auxiliar siguiente. La media se calculó anteriormente y es de
15.2.
Puntos Frecuencia
medios x i absoluta f i
( xi x ) ( xi x ) 2 ( xi x ) 2 f i
9 4 -6.2 38.44 153.76
12 7 -3.2 10.24 71.68
15 9 -0.2 0.04 0.36
18 5 2.8 7.84 39.2
21 3 5.8 33.64 100.92
24 2 8.8 77.44 154.88
30 Total 520.8
Aplicando la fórmula:
(x i x )2 fi
520.8
s2 i 1
17.96
n 1 30 1
s s 2 17.96 4.24
11. El gerente de un centro de llamadas desea evaluar el desempeño de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfacción que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tomó una muestra de 12 llamadas
por día de lunes a miércoles y 20 llamadas el jueves y el viernes.
16. La gráfica apropiada para representar las frecuencias absolutas relacionadas con sus
puntos medios se llama:
( a ) Gráfico de barras horizontales ( b ) Polígono de frecuencias
( c ) Ojiva a menos de ( d ) Diagrama de frecuencias acumuladas
17. El tiempo medio de espera de los clientes de la muestra del día jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores
18. La mediana del tiempo de espera de la muestra del día jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores
19. La desviación estándar del tiempo de espera de la muestra del día jueves es, en segundos:
( a ) 4,2 ( b ) 17,64
( c ) 1,21 ( d ) Ninguna de las anteriores
20. El primer cuartil del tiempo de espera de la muestra del día jueves es, en segundos:
( a ) 17,5 ( b ) 16,5
( c ) 21,5 ( d ) Ninguna de las anteriores
21. El percentil 78 del tiempo de espera de la muestra del día jueves es, en segundos:
( a ) 23,78 ( b ) 19,78
( c ) 22,88 ( d ) Ninguna de las anteriores
22. Con respecto al tercer cuartil para los tiempos de espera del día jueves es verdadero que:
( a ) Un 25% de los clientes de ese día esperaron 23,3 segundos o menos
( b ) Un 75% de los clientes de ese día esperaron 23,3 segundos o menos
( c ) Un 25% de los clientes de ese día esperaron 22,5 segundos o menos
( d ) Un 75% de los clientes de ese día esperaron 22,5 segundos o menos
5 .
Ejemplo Si usted invita a 8 personas a comer y hay una mesa con 8 sillas, ¿de
cuántas formas distintas pueden sentarse a la mesa?
Solución:
1. Se aplica el principio de multiplicación de conteo:
# órdenes = 3 x 2 x 2 = 12
# contraseñas = 10 x 10 x 10 x 10 = 10.000
5! = 5 4 3 2 1 = 120
Solución:
1. 5! = 5 x 4 x 3 x 2 x 1 = 120
2. 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720
3. 10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3.628.800
4. 0! = 1
5. 1! = 1
6. 70! = 1.197857E+100 (usando Excel)
7. 20! = 2.432902E+18 (usando Excel)
=FACT(número)
Donde "número" indica la celda donde se halla el número del cual se desea
calcular el factorial, o bien, simplemente se escribe dicho número.
Entonces, en este caso se digita en la celda en que se desea obtener el
resultado la función:
=FACT(5)
FACTORIAL(número de elementos)
FACTORIAL(5)
5! 5! 120
P(5,3) 60
(5 3) ! 2! 2
Solución:
1. P(8, 5) = 6720
2. P(6, 0) = 1
3. P(10, 1) = 10
4. P(5, 5) = 120
5. P(300, 1) = 300
6. P(200, 2) = 39800
n! n!
7. P(n, n) = n!
( n n) ! 0 !
n! n (n 1) !
8. P(n, 1) = n
(n 1) ! (n 1) !
n! n!
9. P(n, 0) = 1
(n 0) ! n !
n! n!
10. P(n, n – 1) = n!
(n (n 1)) ! 1!
=PERMUTACIONES(número; tamaño)
=PERMUTACIONES(5; 3)
PERMUTATIONS(5.3)
5! 5! 120
C (5,3) 10
3! (5 3) ! 3! 2! 6 2
Solución:
1. C(8, 5) = 56
2. C(6, 0) = 1
3. C(10, 1) = 10
4. C(5, 5) = 1
5. C(300, 1) = 300
6. C(200, 2) = 19900
n! n!
7. C(n, n) = 1
n !(n n) ! n!0!
n! n(n 1)!
8. C(n, 1) = n
1!(n 1) ! 1 (n 1)!
n! n!
9. C(n, 0) = 1
0!(n 0) ! 1 n !
n! n(n 1) !
10. C(n, n – 1) = n
(n 1) !(n (n 1))! (n 1)!1!
P(8, 3) = 336
C(8, 3) = 56
C(10, 3) = 120
C(5, 2) = 10
=COMBINAT(número; tamaño)
=COMBINAT(5; 3)
COMBINATIONS(5.3)
Ejemplo Suponga que en un grupo de 10 bolas hay 5 de color rojo, 3 azules y dos
blancas, ¿cuántas permutaciones son posibles?
a 2
P( A) 0,3333
N 6
Ejercicio Se lanzan dos dados y se suman los puntos. Si X es la suma de los puntos,
calcule las siguientes probabilidades:
de
revisión 1. P(X = 3) =
2. P(X = 6) =
3. P(X = 7) =
4. P(X = 11) =
5. P(X = 12) =
6. P(X = 15) =
Solución:
Cada dado tiene 6 posibles resultados, por lo que el número total de
posibles resultados es 6 x 6 = 36:
1. P(X = 3) = 2/36
2. P(X = 6) = 5/36
3. P(X = 7) = 6/36
4. P(X = 11) = 2/36
5. P(X = 12) = 1/36
6. P(X = 15) = 0
96
P( d ) 0,0320
3.000
Ejercicio En una ciudad en la que habitan 5.000 personas, se sabe que 2.700 son
mujeres. Si se selecciona una persona al azar, ¿cuál es la probabilidad de
de que sea mujer?
revisión
Solución:
2.700
P( M ) 0,54
5.000
Solución:
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cámaras fotográficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, ¿cuál es la probabilidad de que sea un televisor o una
computadora?
Solución Dado que los eventos televisor (T) y computadora (C) son excluyentes se
calcula cada probabilidad por separado y se suman ambas probabilidades.
Además, en la bodega hay un total de 1000 aparatos:
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo según la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, ¿cuál es la probabilidad de que sea
revisión ingeniero civil o ingeniero industrial?
Solución:
8 15 23
P(C o I ) 0,575
40 40 40
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cámaras fotográficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, ¿cuál es la probabilidad de que sea un televisor o una
computadora o una cámara fotográfica?
Solución Dado que los eventos televisor (T), computadora (C) y cámara fotográfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Además, en la bodega hay un total de 1000
aparatos:
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cámaras fotográficas (F) y 300 computadoras (C). Además, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), según la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
Solución En la bodega hay un total de 1000 aparatos. Dado que los eventos televisor
(T) y que el aparato tenga defectos (D) no son excluyentes se calcula cada
probabilidad por separado y se suman ambas probabilidades, pero también
se resta la probabilidad de que ocurran a la vez:
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo según la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, ¿cuál es la probabilidad de que sea
revisión ingeniero civil o mujer?
Solución:
8 14 2 20
P(C o M ) 0,5
40 40 40 40
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cámaras fotográficas (F) y 300 computadoras (C). Además, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), según la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
Solución Dado que solo hay dos niveles de calidad, perfecto (P) o con defectos (D),
entonces podrían considerarse como eventos complementarios, por lo que
la probabilidad de que tenga defectos es igual a uno menos la probabilidad
de que esté perfecto:
850 150
P( D) 1
1000 1000
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo según la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, ¿cuál es la probabilidad de que no
revisión sea ingeniero civil?
Solución:
8 32
P( D) 1 0.8
40 40
Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cámaras fotográficas (F) y 300 computadoras (C). Además, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), según la tabla:
Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000
P( DT )
P( D / T )
P(T )
P(DT) = 50/1000
P( DT ) 50 / 1000 50
P( D / T )
P(T ) 400 / 1000 400
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo según la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional y se sabe que debe ser mujer, ¿cuál
revisión es la probabilidad de que sea ingeniero civil?
Solución:
P(CM ) 2 / 40 2
P(C / M ) 0.14
P( M ) 14 / 40 14
Ejemplo Se tiene una caja con 10 bolas de colores: 6 bolas rojas y 4 bolas azules. Se
seleccionarán dos bolas al azar:
Solución Dado que los eventos televisor (T), computadora (C) y cámara fotográfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Además, en la bodega hay un total de 1000
aparatos:
Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo según la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, ¿cuál es la probabilidad de que sea
revisión ingeniero civil o ingeniero industrial?
Solución:
8 15 23
P(C o I ) 0,575
40 40 40
P( B2 ) P( A / B2 ) 0.3 0.25
P( B2 / A) 0.2941
P( A) 0.255
2. Se tiene un grupo de n libros, suponga que los n libros se van a conformar en grupos de 3
libros (suponiendo que n > 3). El número de diferentes grupos con distinto orden, equivale a:
( a ) P(n, 3) ( b ) n! / 3!
( c ) C(n, 3) ( d ) P(n, n – 3)
5. Se tiene un grupo de 5 personas, suponga que solo se van a sentar 3 de los 5 individuos. El
número de diferentes disposiciones posibles de los asientos para este conjunto de 3
individuos, considerando que pueden ser elegidos 3 cualesquiera de los 5, equivale a:
( a ) P(5, 2) ( b ) 5! / 2!
( c ) C(5, 3) ( d ) Ninguna de las anteriores
7. Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera y por sexo
según la tabla:
La probabilidad de que un ingeniero aleatoriamente seleccionado sea una mujer o que haya
estudiado ingeniería industrial (o ambos) es:
( a ) 11/20 ( b ) 29/40 ( c ) 7/40 ( d ) 210/1600
8. Con respecto a los datos del ejercicio 7, la probabilidad de seleccionar al azar un ingeniero
que sea hombre o sea ingeniero civil, pero no ambos, es:
( a ) 11/20 ( b ) 34/40
( c ) 28/40 ( d ) Ninguna de las anteriores
9. Con respecto a los datos del ejercicio 7, la probabilidad condicional de seleccionar al azar
un ingeniero en electrónica dado que sea mujer es:
( a ) 2/7 ( b ) 14/40
( c ) 4/40 ( d ) 8/4
10. Con respecto a los datos del ejercicio 7, al calcular la probabilidad de seleccionar al azar
un ingeniero industrial y la probabilidad de seleccionar un ingeniero que sea hombre, se
concluye que los eventos, ser ingeniero industrial y ser de sexo masculino son:
( a ) mutuamente excluyentes y dependientes
( b ) dependientes pero no mutuamente excluyentes
( c ) mutuamente excluyentes e independientes
( d ) ni mutuamente excluyentes ni dependientes
11. Se sabe que la caja A contiene un sobre con un billete de un dólar y otro sobre con un
billete de $10. La caja B contiene 2 sobres, cada uno con un billete de $10. Se elige
aleatoriamente una caja y de ella se selecciona un sobre. Si en el primer paso se selecciona la
caja A, la probabilidad de que en el segundo paso se seleccione un sobre con un billete de $10
es:
( a ) 1/2 ( b ) 1/10
(c)1 ( d ) Ninguna de las anteriores
12. Con base en los datos de la pregunta 8, si en el segundo paso se selecciona un sobre con
un billete de $10, la probabilidad de que ese sobre provenga de la caja A es:
( a ) 1/3 ( b ) 1/4
( c ) 1/2 ( d ) Ninguna de las anteriores
18. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola roja no equivale a:
( a ) 1 – 8/25 – 7/25 ( b ) 8/25 – 7/25 – 1
( c ) 2/5 ( d ) 10/25
19. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja después, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) 8/25 + 10/24
20. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja después, en un muestreo con
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) Ninguna de las anteriores
21. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde o una bola roja, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 + 10/24
( c ) 10/25 x 8/25 ( d ) 10/25 + 8/25
22. En una caja hay 10 bolas rojas, 8 bolas azules y 7 bolas verdes. La probabilidad de
seleccionar al azar una bola que no sea verde equivale a:
( a ) –2/5 – 8/25 + 1 ( b ) –17/25 + 1
( c ) 18/25 ( d ) 10/25 + 7/25
23. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y otra bola verde después, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 8/24 ( b ) 8/25 x 7/24
( c ) 8/25 x 8/25 ( d ) 8/25 + 7/24
24. Si la probabilidad de que una familia tenga un hijo varón es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los tres hijos sean varones es de:
( a ) 0,45 ( b ) 0,0911 ( c ) 1,35 ( d ) 0,1664
25. Si la probabilidad de que una familia tenga un hijo varón es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que tenga dos hijos varones es de:
( a ) 0,45 ( b ) 0,1113 ( c ) 0,3341 ( d ) 1,45
26. Si la probabilidad de que una familia tenga un hijo varón es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los dos primeros hijos sean varones es de:
( a ) 0,2025 ( b ) 0,45 ( c ) 0,1135 ( d ) 0,90
27. Si la probabilidad de que una familia tenga un hijo varón es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que solo tenga un hijo varón es de:
( a ) 0,1361 ( b ) 0,4083 ( c ) 1,55 ( d ) 0,3025
28. Si la probabilidad de que una familia tenga un hijo varón es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que ninguno de los hijos sea varón es de:
( a ) 0,1361 ( b ) 0,1663 ( c ) 1,65 ( d ) 0,55
29. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola verde primero y una bola roja después, en un muestreo sin reemplazo, equivale
a:
( a ) P(V) x P(R) ( b ) P(V) x P(R/V)
( c ) P(V) + P(R) ( d ) P(V) x (1 – P(R))
30. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola que sea verde o bola roja, no equivale a:
( a ) P(V) + P(R) – P(VR) ( b ) 1 – P(A)
( c ) P(V) + P(R) ( d ) P(V) x P(R)
31. Considere la siguiente información: “En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefonía celular, se
obtuvieron los siguientes datos: ante la apertura en el mercado de telecomunicaciones, el 68%
los usuarios actuales de telefonía celular estaría dispuesto a cambiar de operador. Entre la
población que aun no posee celular, solo un 38% optará por el operador actual, mientras que
el resto escogerá un nuevo proveedor de servicio”. Con base en los datos anteriores, la
probabilidad de seleccionar un hogar al azar de los 700 estudiados que sea un usuario actual
de telefonía celular y que desee mantener ese servicio con el proveedor actual es:
( a ) 0,16 ( b ) 0,32 ( c ) 112 ( d ) 0,68
32. Utilizando la misma información del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefonía celular y que desee
contratar para ese servicio al proveedor actual es:
( a ) 0,38 ( b ) 0,19 ( c ) 0,62 ( d ) 0,31
33. Utilizando la misma información del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefonía celular es:
( a ) 0,31 ( b ) 0,38 ( c ) 0,62 ( d ) 0,5
34. Utilizando la misma información del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que estaría no dispuesto a contratar a un nuevo proveedor de
telefonía celular distinto del actual es:
( a ) 0,62 ( b ) 0,68 ( c ) 1,3 ( d ) 0,65
35. El 56% de los habitantes del país se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar a dos personas y que
ambas utilicen internet con regularidad es:
( a ) 0,1936 ( b ) 0,2809 ( c ) 0,3136 ( d ) 1,12
36. El 56% de los habitantes del país se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar dos hogares, tal que el
primero tenga computadora y el segundo no, es:
( a ) 0,2209 ( b ) 0,2809 ( c ) 0,2491 ( d ) 0,3136
37. El 56% de los habitantes del país se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar un hogar, tal que tenga
computadora o que al menos uno de sus miembros utilice internet con regularidad es:
( a ) 1,09 ( b ) 0,2968 ( c ) 0,06 ( d ) Falta información
40. Para dos eventos excluyentes A y B, es falso con toda certeza que:
( a ) 0 ≤ P(A) + P(B) ≤ 1 ( b ) P(A o B) = 1
( c ) P(A) = 1 – P(B) ( d ) P(A y B) = 1
1. c 2. a 3. c 4. c 5. b
6. c 7. a 8. a 9. a 10. d
11. a 12. a 13. a 14. a 15. c
16. a 17. a 18. b 19. b 20. c
21. d 22. c 23. b 24. b 25. c
26. a 27. b 28. b 29. b 30. d
31. a 32. b 33. d 34. d 35. c
36. c 37. d 38. a 39. a 40. d
6 .
Distribuciones de probabilidad de
variable discreta
OBJETIVOS:
Al concluir el capítulo, será capaz de:
1. Calcular la media y la varianza de una distribución de probabilidad
2. Resolver problemas empleando la distribución binomial
3. Resolver problemas empleando la distribución hipergeométrica
4. Resolver problemas empleando la distribución de Poisson
5. Resolver problemas empleando la distribución multinomial
6. Resolver problemas empleando la distribución geométrica
Ejemplo Suponga que se lanza al aire una moneda dos veces para ver si cae “cara”
(evento A) o “cruz” (evento B). Construya la tabla de la distribución de
probabilidad.
Solución En este caso existen 4 resultados posibles, cada uno con las siguientes
probabilidades:
Evento Probabilidad
AA 0,25
AB 0,25
BA 0,25
BB 0,25
Total 1,00
Solución En este caso existen resultados posibles, cada uno con las siguientes
probabilidades:
2. Una rifa consta de 100 números a un precio de $20 cada uno. El premio
es de $1000 (premio único) y el jugador compra dos números.
3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.
4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.
Solución:
3. Los posibles resultados son cero puntos (bola azul), un punto (bola
verde) y dos puntos (bola roja):
Resultado Probabilidad
0 2/10
1 3/10
2 5/10
Total 10/10 = 1
4. Los posibles resultados al sacar una bola son son cero puntos (bola
azul), un punto (bola verde) y dos puntos (bola roja):
Pero hay que considerar que los colores no están distribuidos en igual
cantidad, sino que la probabilidad de una bola azul es 2/10, la de una bola
verde es 3/10 y de una bola roja es 5/10, por tanto los resultados anteriores
no son igualmente probables:
Unidades vendidas xi 30 35 40 45 50
Probabilidad P(xi) 0,20 0,28 0,30 0,15 0,07
E ( X ) xi P ( xi )
30 0.2 35 0.28 40 0.30 45 0.15 50 0.07 38.05
Y la varianza es:
² 33.95 5.83
2. Una rifa consta de 100 números a un precio de $20 cada uno. El premio
es de $1000 (premio único) y el jugador compra dos números.
3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.
4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.
Solución:
E ( X ) xi P ( xi )
980 1 / 100 20 99 / 100 10
Y la varianza es:
² 9900 99.50
E ( X ) xi P ( xi )
960 2 / 100 40 98 / 100 20
Y la varianza es:
² 19600 140
Resultado Probabilidad
0 2/10
1 3/10
2 5/10
Total 10/10 = 1
E ( X ) xi P ( xi )
0 2 / 10 1 3 / 10 2 5 / 10 1.3
Y la varianza es:
2 ( xi ) 2 P ( xi )
2 / 10 (0 1.3)² 3 / 10 (1 1.3)² 5 / 10 (2 1.3)² 0.61
² 0.61 0.78
Resultado Probabilidad
0 4/100
1 12/100
2 29/100
3 30/100
4 25/100
100/100 = 1
E ( X ) x i P ( xi )
0 4 / 100 1 12 / 100 2 29 / 100 3 30 / 100 4 25 / 100 2.6
Y la varianza es:
2 ( xi ) 2 P ( xi )
4 / 100 (0 2.6)² 12 / 100 (1 2.6)² 29 / 100 (2 2.6)²
30 / 100 (3 2.6)² 25 / 100 (4 2.6)² 1.22
² 1.22 1.10
Solución a) Se tiene que se realizan 8 intentos de vender el producto, por lo que se tiene
que n = 8. Además, se desea saber la probabilidad de lograr 3 ventas, o sea
que x = 3.
En este caso se define éxito como lograr la venta, por tanto p = 0,30.
8!
P( X 3) (0,30) 3 (0,70) 83 0.2541
3!(8 3) !
b) En este caso se requiere que x ≥ 3, lo que significa que nos interesa que 3 o
más clientes compren el producto, por lo que buscamos:
P( x 3) P( X 3) P( X 4) P( X 5) P( X 6) P( X 7) P( X 8)
P( x 3) 1 P( X 0) P( X 1) P( X 2)
= 0,4482
P(x = 8) = 0,0576
Ejemplo Se sabe que la probabilidad de que un cierto tipo de calentador falle ante
un sobrecalentamiento es de 15%, calcule la probabilidad de que entre 6 de
tales calentadores:
a) fallen entre 2 y 4
b) no fallen como máximo 3
Solución a) Se tiene que n = 6 y que éxito es fallar, así que p = 0,15 y q = 0,85:
= 0,2235
= 0,0473
Solución:
10!
P( X 4) (0,30) 4 (0,70)104 0.2001
4!(10 4) !
P( X 3) P( x 0) P( x 1) P( x 2)
0.0282 0.1211 0.2335 0.3828
P( X 8) P( x 8) P( x 9) P( x 10)
0.0014 0.0001 0.0000 0.0016
P ( X 7) 1 P ( x 7)
1 ( P( x 8) P( x 9) P( x 10))
1 (0.2335 0.1211 0.0282)
1 0.3828
0.6172
P(3 X 5) P( x 3) P( x 4) P( x 5)
0.0090 0.0368 0.1029
0.1487
Solución Se tiene que n = 12, el éxito es que no llevara el casco, entonces p = 0,42 y
q = 0,58.
P(X = 5) =
=DISTR.BINOM(núm_éxito;ensayos;prob_éxito;acumulado)
=DISTR.BINOM(5;12;0,42;0)
=DISTR.BINOM(núm_éxito;ensayos;prob_éxito;acumulado)
=DISTR.BINOM(4;12;0,42;1)
En Minitab, se tiene los mismos datos, o sea, que n = 12, el éxito es que
no llevara el casco, entonces p = 0,42 y q = 0,58.
P(X = 5) =
Gráfica de distribución
Binomial. n=12. p=0,42
0,25
0,20
Probabilidad
0,15
0,10
0,3825
0,05
0,00
4 10
X
Solución a) En este caso éxito es que un teléfono salga defectuoso, por tanto se
tienen 4 éxitos en la población, o sea, a = 4 defectuosos, N = 50 y n = 10, y
se busca la probabilidad de que en la muestra haya uno defectuoso, es
decir, x = 1, por tanto:
C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)
C 50 4,10 1C 4,1 C 46, 9C 4,1
P( X 1)
C 50,10 C 50,10
1101716330 4
0,4290
10272278170
P( X 2) 1 P( X 0) P( X 1)
C 50 4,10 0C 4, 0 C 50 4,10 1C 4,1
1
C 50,10 C 50,10
1 0,3968 0,4290 0,1742
P( X 7buenos ) P( x 7) P( x 8) P( x 9) P( x 10)
Para que el lote sea aceptado, en la muestra debe haber cero defectuosos, o
sea, x = 0, por lo tanto la probabilidad de aceptación del lote corresponde a
P(x = 0):
C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)
Solución:
C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)
P( X 2) P( x 0) P( x 1) P( x 2)
0.6241 0.3086 0.0607
0.9930
P( X 8) P( x 8) P( x 9)
0.3086 0.6241
0.9330
Solución Se tiene que una población N = 200 frascos, a = 8 éxitos (el éxito sería que no
satisfaga la especificación), una muestra n = 12 frascos, y se pregunta la
probabilidad de que 3 no satisfagan la especificación, o sea, que lo que se
desea calcular es:
P(X = 3) =
=DISTR.BINOM(muestra_éxito;núm_de_muestra;población_éxito;núm_de_p
oblación)
resultado como:
=DISTR.HIPERGEOM(3;12;8;200)
El resultado es 0,0074.
P(X = 3) =
También, se puede hacer uso del menú Gráfica, donde se selecciona Gráfica
de distribución de probabilidad. En el cuadro de diálogo se selecciona la
opción que dice Ver probabilidad.
Gráfica de distribución
Hipergeométrico. N=200. M=8. n=12
0,6
0,5
0,4
Probabilidad
0,3
0,2
0,1
0,007406
0,0
0 3
X
x e
35 e 3
P( X 5) 0,1008
X! 5!
x e 30 e 3
P( X 0) 0,0498
X! 0!
x e
31 e 3
P( X 1) 01494
X! 1!
x e 3 2 e 3
P ( X 2) 0,2240
X! 2!
x e 33 e 3
P( X 3) 02240
X! 3!
x e 3 4 e 3
P ( X 4) 0,1680
X! 4!
P(14 ≤ x ≤ 17) = P(X = 14) + P(X = 15) + P(X = 16) + P(X = 17)
Solución:
P( X 8) P( X 0) P( X 1) P( X 2) P( X 3)
P( X 4) P( X 5) P( X 6) P( X 7)
0.0000 0.0000 0.0000 0.0002
0.0006 0.0019 0.0048 0.0104
0.0180
Ejemplo A una clínica llega un promedio de 5 pacientes cada hora. Calcule, usando
Excel y Minitab, la probabilidad de que en una hora seleccionada en forma
aleatoria lleguen exactamente 3 pacientes.
P(X = 3) =
=POISSON(x;media;acumulado)
=POISSON(3;5;0)
El resultado es 0,1404.
En Minitab, con base en los datos dados, una media de 5 pacientes por
hora y se pregunta la probabilidad de que lleguen 3 por hora, o sea, que lo
que se desea calcular es:
P(X = 3) =
Gráfica de distribución
Poisson. Media=5
0,20
0,15 0,1404
Probabilidad
0,10
0,05
0,00
0 3 13
X
x e 10 8 e 10
P(x = 8) = 0,112599
X! 8!
λ = σ2
X 0 1 2 3 4 5 6
P(x) 0,2465 0,3452 0,2417 0,1128 0,0395 0,0111 0,0032
Solución Con base en los datos de la tabla se obtiene primero el valor esperado:
= 1,39
Ejemplo Los audífonos fabricados por una empresa son sometidos a un control de
calidad en el cual se clasifican como perfectos, con defectos secundarios o
con defectos mayores. Generalmente el 85% de los audífonos se clasifican
como perfectos, el 10% con defectos secundarios y un 5% con defectos
mayores. En una muestra de 8 audífonos se quiere saber la probabilidad de
que haya 5 perfectos, 2 con defectos secundarios y uno con defectos
mayores.
Perfectos: p1 = 0,85
Con defectos secundarios: p2 = 0,10
Con defectos mayores: p3 = 0,05
8!
P( x1 = 5, x2 2, x3 1) (0,85) 5 (0,10) 2 (0,05)1 0,0372
5! 2! 1!
10!
P( x1 = 5, x2 4, x3 1) (0,35) 5 (0,20) 4 (0,45)1 0,0048
5! 4! 1!
Ejercicio Un equipo de futbol gana el 40% de los partidos que juega, empata el 25%
y pierde el resto de los encuentros. Suponiendo que se mantienen estas
de proporciones, calcule la probabilidad de que en los próximos 6 partidos:
revisión
a. Gane 3 veces, empate 2 y pierda 1 juego.
b. Gane o empate 4 partidos y pierda los otros dos.
Solución:
6!
P( x1 = 3, x2 2, x3 1) (0,40) 3 (0,25) 2 (0,35)1 0,084
3! 2! 1!
6!
P( X 4) (0,65) 4 (0,35) 64 0.3280
4!(6 4) !
Ejemplo Una empresa de televisión por cable pone a disposición de sus clientes un
número telefónico para proveer soporte en caso de que haya problemas con
el servicio. Sin embargo la central telefónica pasa ocupada el 90% del
tiempo, por lo que los clientes deben hacer más de intento para que su
llamada sea contestada. ¿Cuál es la probabilidad de que la llamada de un
cliente sea contestada en su tercer intento?
Solución Si la primera oveja que posee algún tipo de lunar que produzca fibras
pigmentadas es la quinta (x = 5), quiere decir que las primeras 7 no poseen
este tipo de lunares (x – 1 = 4). La probabilidad de obtener una oveja con
este tipo de lunares es p = 0,40, por tanto, aplicando la fórmula:
Ejercicio Un basquetbolista encesta el 60% de los tiros libres que lanza. Calcule la
probabilidad de que:
de
revisión a. El primer tiro que enceste sea el tercero.
b. El primer tiro que falle sea el cuarto.
c. Si el jugador lanza 6 veces, ¿cuál es la probabilidad de que enceste en
exactamente tres ocasiones?
Solución:
6!
P( X 3) (0,60) 3 (0,40) 63 0.2765
3!(6 3) !
Ejemplo El 10% de las llamadas que ingresan al centro de servicio telefónico de una
empresa son para reportar averías. Calcule, usando Minitab, la
probabilidad de que la primera llamada que ingresa para reportar averías
sea la tercera.
P(X = 3) =
Gráfica de distribución
Geométrico. p=0,1
0,10
0,081
0,08
Probabilidad
0,06
0,04
0,02
0,00
1 3 51
X
X = número total de pruebas.
X 0 1 2 3 4
P(x) 0,40 0,30 0,10 0,05
6. Con base en la tabla del ejercicio 4, en el largo plazo, el número esperado de accidentes
diarios en esa fábrica es de:
( a ) 0,8 (b)2
( c ) 1,1 ( d ) Ninguna de las anteriores
X 0 1 2 3 4
P(x) 0,30 0,20 0,10 0,02
9. Con base en la tabla del ejercicio 8, en el largo plazo, el número esperado de accidentes
diarios en esa fábrica es de:
(a)0 ( b ) 1,6
(c)2 ( d ) 1,16
11. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. También tienen una probabilidad de 0,3 de tener una pérdida de $600. En el largo
plazo, ¿cuál es la mejor opción de las siguientes que se puede hacer para maximizar su
beneficio, y por qué?
( a ) Invertir en las acciones porque hay una mayor probabilidad de ganar dinero que perder
dinero.
( b ) No invertir en las acciones debido a la cantidad de dinero por cada pérdida es mayor que
el monto en dólares para cada ganancia.
( c ) Invertir en las acciones porque la inversión tiene un valor esperado positivo.
( d ) No invertir en las acciones debido a que el valor esperado es una pérdida.
12. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. También tienen una probabilidad de 0,3 de tener una pérdida de $600. Las acciones de
la empresa B tienen una probabilidad de 0,3 de devolver una ganancia de $600 y una
probabilidad de 0,7 de tener una pérdida de $200. En el largo plazo, usando la desviación
estándar como medida del riesgo, es cierto que:
( a ) Las acciones de la empresa A son más riesgosas que las acciones de la empresa B
( b ) Las acciones de la empresa A son menos riesgosas que las acciones de la empresa B
( c ) Las acciones de la empresa A son igualmente riesgosas que las acciones de la empresa B
( d ) Falta información para determinar la desviación estándar
13. Si usted toma una muestra de 15 artículos con reemplazo, para conocer si se presentan
unidades con algún defecto, entonces se emplea la distribución:
( a ) Binomial ( b ) Hipergeométrica
( c ) Multinomial ( d ) Geométrica
14. En un proceso de producción se genera una unidad defectuosa por cada 10 unidades
producidas. Si usted desea saber la probabilidad de que, en un muestra de 20 unidades sin
reemplazo, se presenten 2 defectuosas, debería emplear la distribución:
( a ) Binomial ( b ) Hipergeométrica
( c ) Multinomial ( d ) Ninguna de las anteriores
15. La tasa media de llegadas de vehículos a un peaje es de 10 por minuto. Si usted desea
saber la probabilidad de que en una hora seleccionada aleatoriamente lleguen menos de 50
vehículos, entonces usaría:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal
16. La tasa media de llegadas de vehículos a un peaje es de 15 por minuto. Si usted desea
saber la probabilidad de que pasen 4 minutos entre la llegada de dos vehículos en una hora
seleccionada aleatoriamente, entonces usaría:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal
22. Si se sabe que x sigue una distribución de Poisson con media igual a 3, la probabilidad de
x sea mayor que 2 es:
( a ) 0,4232 ( b ) 0,8009
( c ) 0,5768 ( d ) Ninguna de las anteriores
23. Si se sabe que x sigue una distribución de Poisson con media igual a 5, la probabilidad de
x sea cuando mucho 1 es:
( a ) 0,9933 ( b ) 0,0337
( c ) 0,0404 ( d ) Ninguna de las anteriores
24. Si los resultados del análisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que una de ellas sea clasificada como regular, 1
como mala y 3 como buenas es:
( a ) 0,0036 ( b ) 0,0324
( c ) 0,1296 ( d ) Ninguna de las anteriores
25. Si los resultados del análisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que 4 de ellas sean clasificadas como buenas
es:
( a ) 0,9222 ( b ) 0,7408
( c ) 0,2592 ( d ) Ninguna de las anteriores
27. Si usted controla la calidad de las piezas compradas a un proveedor y desea calcular la
probabilidad de que en un muestreo sin reemplazo se rechace el lote por contener más de 3
piezas defectuosas, entonces se emplea la distribución:
( a ) Binomial ( b ) Hipergeométrica
( c ) Multinomial ( d ) Geométrica
29. Un fabricante de medicamentos sostiene que cierta medicina cura una enfermedad para la
sangre en el 80% de los casos. Para verificarlo los inspectores del gobierno utilizan una
muestra de 100 individuos y deciden aceptar la afirmación si se curan por lo menos 75 de
ellos. La probabilidad de que lo que dice sea rechazado, si efectivamente la probabilidad de
curación es del 80%, es:
( a ) 0,9162 ( b ) 0.0838
( c ) 0,4567 ( d ) Ninguna de las anteriores
30. En un proceso de manufactura se sabe que la probabilidad de obtener una pieza defectuosa
es de 2%. ¿Cuál es la probabilidad de que la octava pieza inspeccionada sea la primera
defectuosa?
( a ) 0,9826 ( b ) 0,9800
( c ) 0,0174 ( d ) Ninguna de las anteriores
31. Un fabricante sabe que cierto tipo de refrigeradores tienen una probabilidad de 0,8 de
clasificarse como aceptable, una probabilidad de 0,15 de ser clasificados como con defectos
secundarios y de 0,05 de ser clasificados como con defectos mayores. Si se revisan seis
refrigeradores, escogidos al azar, la probabilidad de que tres sean aceptables, 2 tengan
defectos menores y 1 tenga defecto mayor es:
( a ) 0,9654 ( b ) 0,7645
( c ) 0,0346 ( d ) Ninguna de las anteriores
32. Una empresa de mercadeo por internet tiene una promoción por e–mail que produce una
respuesta de 15%. Si se hace un envío de dicha promoción a 10 clientes (independientes), la
probabilidad de que nadie responda es:
( a ) 0,0000 ( b ) 0,8031
( c ) 0,1969 ( d ) Ninguna de las anteriores
33. Una empresa de mercadeo por internet tiene una promoción por e–mail que produce una
respuesta de 15%. Si se hace un envío de dicha promoción a 10 clientes (independientes), la
probabilidad de que exactamente dos personas respondan es:
( a ) 0,0000 ( b ) 0,8241
( c ) 0,2759 ( d ) Ninguna de las anteriores
34. Una empresa de mercadeo por internet tiene una promoción por e–mail que produce una
respuesta de 15%. Si se hace un envío de dicha promoción a 10 clientes (independientes), la
probabilidad de que más de la mitad respondan es:
( a ) 0,0000 ( b ) 0,9986
( c ) 0,0014 ( d ) Ninguna de las anteriores
35. Una empresa de mercadeo por internet tiene una promoción por e–mail que produce una
respuesta de 15%. Si se hace un envío de dicha promoción a 10 clientes (independientes), la
probabilidad de que más de 4 no respondan es:
( a ) 0,0099 ( b ) 0,0014
( c ) 0,9986 ( d ) Ninguna de las anteriores
36. Considere la siguiente información: “En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefonía celular, se
obtuvieron los siguientes datos: ante la apertura en el mercado de telecomunicaciones, el 68%
los usuarios actuales de telefonía celular estaría dispuesto a cambiar de operador. Entre la
población que aun no posee celular, solo un 38% optará por el operador actual, mientras que
el resto escogerá un nuevo proveedor de servicio”. Si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que todos conserven el operador actual es:
( a ) 0,0011 ( b ) 0,0989
( c ) 0,0030 ( d ) 0,0568
37. Utilizando la misma información del ejercicio 36, si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que 2 o menos hogares cambien su proveedor
actual de telefonía celular es:
( a ) 0,0011 ( b ) 0,0875
( c ) 0,7064 ( d ) 0,1527
38. Utilizando la misma información del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o más hogares utilicen el proveedor
actual en el mercado de telefonía celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527
39. Utilizando la misma información del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o más hogares utilicen el proveedor
actual en el mercado de telefonía celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527
40. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfacción de los trabajadores dentro de la empresa, y ha encontrado
que 4 de cada 20 empleados se siente insatisfecho con su salario. Esta proporción se ha
mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas, la
probabilidad de que exactamente 3 de ellas se sientan insatisfechas con su salario es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1468
42. La probabilidad de que cierto componente falle ante una carga axial específica es de 5%.
La probabilidad de que entre 16 de tales componentes fallen entre 2 y 5:
( a ) 0,1891 ( b ) 0,8109
( c ) 0,95 ( d ) Ninguna de las anteriores
43. Con respecto a las láminas de zinc esmaltadas que se emplearán en el techo de un edificio
nuevo, se sabe que el 95% no tienen defecto alguno, que el 4% tienen, en promedio, un
defecto menor en el esmalte por cada dos metros cuadrados de lámina, y el resto poseen
huecos u otros defectos mayores, y por tanto serán devueltas al proveedor. La probabilidad de
que al seleccionar una muestra aleatoria de 8 láminas haya que devolver a lo sumo una lámina
es:
( a ) 0,9926 ( b ) 0,0027
( c ) 0,0074 ( d ) Ninguna de las anteriores
45. En relación a la misma situación de la pregunta 43, si se selecciona una lámina al azar
correspondiente a las que tienen un defecto en el esmalte, entonces la probabilidad de que
posea una superficie continua de 1,5 metros cuadrados sin defecto alguno es:
( a ) 0,5276 ( b ) 0,3679
( c ) 0,4724 ( d ) Ninguna de las anteriores
47. En relación a la misma situación de la pregunta 43, suponga que se han comprado 100
láminas. Si se toma una muestra aleatoria sin reemplazo de 6 láminas, la probabilidad de que
exactamente 5 estén en perfecto estado es:
( a ) 0,2430 ( b ) 0,2709
( c ) 0,2649 ( d ) Ninguna de las anteriores
48. En relación a la misma situación de la pregunta 43, si se toma una muestra aleatoria de 8
láminas, la probabilidad de que 6 estén en perfecto estado, que una tenga un defecto en el
esmalte y otra un defecto mayor es:
( a ) 0,0261 ( b ) 0,0138
( c ) 0,0315 ( d ) Ninguna de las anteriores
1. a 2. d 3. c 4. b 5. c
6. c 7. a 8. b 9. d 10. c
11. d 12. c 13. a 14. b 15. c
16. b 17. c 18. c 19. c 20. c
21. c 22. c 23. c 24. c 25. c
26. c 27. b 28. c 29. b 30. c
31. c 32. c 33. c 34. c 35. c
36. a 37. b 38. d 39. d 40. d
41. d 42. a 43. c 44. c 45. c
46. b 47. a 48. d 49. c 50. a
7 .
Distribuciones de probabilidad de
variable continua
OBJETIVOS:
Al concluir el capítulo, será capaz de:
1. Resolver problemas empleando la distribución normal
2. Resolver problemas empleando la distribución exponencial
a) P(z 1,46) =
b) P(z 1,46) =
c) P(z –1,46) =
d) P(z –1,46) =
e) P(1,03 z 1,46) =
El número que aparece donde se cruza esa fila con esa columna es el valor
de la probabilidad, que en este caso es 0,9279.
De la tabla se obtiene:
Solución:
1010 1000
P( x 1010) P z P( z 0,33)
30
1050 1000
P( x 1050) P z
30
P( z 1,67) 1 0,9525 0,0475
990 1000
P( x 990) P z
30
P( z 0,33) 0,6293
1090 1000
P( x 1090) P z
30
P( z 3) 0,9987
P(980 x 1040)
9.80 1000 1040 1000
P z
30 30
P(0,67 z 1,33)
P( z 1,33) P( z 0,67)
0,9082 (1 0,7486)
0,9082 0,2514 0,6568
f) El valor máximo del 20% de las botellas con menor cantidad de líquido
se encuentra al lado izquierdo de la curva, en el cual los valores de z son
negativos, por estar a la izquierda de z = 0 (µ = 0). Gráficamente el
problema queda representado del modo siguiente:
x
z
x 1000
0,84
30
x 0,84 * 30 1000
x 974,8
Esto indica que 974,8 ml es el valor máximo del 20% de las botellas con
menor cantidad de líquido.
g) El valor mínimo del 40% de las botellas con mayor cantidad de líquido
se encuentra al lado derecho de la curva, en el cual los valores de z son
positivos, por estar a la derecha de z = 0 (µ = 0). Gráficamente el problema
queda representado del modo siguiente:
x
z
x 1000
0,25
30
x 0,25 * 30 1000
x 1007,5
Esto indica que 1007,5 ml es el mínimo del 40% de las botellas con mayor
cantidad de líquido.
b. Si sale a las 8:30 y tiene que estar en la oficina a las 9 cuenta con 30
minutos para llegar.
c. Los viajes más rápidos son los que toman menos tiempo, por lo tanto, el
área es el 62% del lado izquierdo.
De ese modo se tiene que 27,09 minutos es el tiempo máximo que toma el
62% de los viajes más rápidos.
e) ¿Cuál es el valor más alto sobre el que se encuentra el 35% de los peces
con menor peso?
z = -0,39
x
z
x 30
0,39
4,5
x 0,39 * 4,5 30
x 28,24
Solución En Excel: Se tiene que una media de 180 mg/100ml con una desviación
estándar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
= DISTR.NORM(x;media;desv_estándar;acum)
=DISTR.NORM(200;180;30;1)
El resultado es 0,7475.
En Minitab: Se tiene que una media de 180 mg/100ml con una desviación
estándar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
Gráfica de distribución
Normal. Media=180. Desv.Est.=30
0,014
0,012
0,010
Densidad
0,008
0,7475
0,006
0,004
0,002
0,000
180 200
X
Solución En Excel: Se tiene que una media de 74,5 Kg. con una desviación estándar
de 8 Kg., y se pregunta el peso que separa el 15% de los hombres adultos
con menor peso. Entonces, en Excel se emplea la función
DISTR.NORM.INV, cuya sintaxis es:
= DISTR.NORM.INV(probabilidad;media;desv_estándar)
=DISTR.NORM.INV(0,15;74,5;8)
En Minitab: Se tiene que una media de 180 mg/100ml con una desviación
estándar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:
Gráfica de distribución
Normal. Media=74,5. Desv.Est.=8
0,05
0,04
Densidad
0,03
0,02
0,01
0,15
0,00
66,21 74,5
X
Solución Este es un problema de distribución binomial, pero que por tener n > 20 se
resuelve por aproximación. En este caso no se puede aplicar la Poisson
porque p > 5%, por lo tanto se resuelve usando la normal como
aproximación.
µ = np = 80 0,3 = 24
Se requiere calcular:
P(25 x 35) =
P(24,5 x 35,5) =
24,5 24
z1 0,12
4,10
35,5 24
z2 2,80
4,10
Entonces:
P(x 20)
Luego se estandariza:
19,5 24
z1 1,10
4,10
80,5 24
z2 13,78
4,10
µ = np = 80 0,7 = 56
Ahora se estandariza:
0,5 56
z1 13,78
4,10
59,5 56
z2 0,85
4,10
= 0,8023 – 0 = 0,8023
= 3/2 = 1,5
P e e 1,5 0,2231
P 1 e 1 e 1 1 0,3679 0,6321
Ejemplo El tiempo requerido para que ocurra una reacción química está
exponencialmente distribuido con un tiempo esperado de 4 minutos:
P e e 0,5 0,6065
Ejercicio Se sabe que la vida útil de cierto tipo de bujías sigue una distribución
exponencial con media de 160.000 km. ¿Cuál es la probabilidad de que
de una bujía seleccionada aleatoriamente dure:
revisión
a. a lo sumo 180.000 km?
b. entre 150.000 y 200.000 km?
Solución:
Ejemplo Los clientes de una tienda llegan en promedio de 20 por hora. Utilice
Excel y Minitab para determinar la probabilidad de que transcurran a lo
sumo 6 minutos después de la llegada del último cliente y el próximo.
Solución En Excel: Se tiene que una media = 20 clientes por hora y se pregunta la
probabilidad de que transcurran a lo sumo 6 minutos después de la llegada
del último cliente y el próximo, por lo que x = 0,1, pues equivale a 6
minutos de una hora que tiene 60 minutos, o sea, x = 6/60 = 0,1. Entonces,
en Excel se emplea la función DISTR.EXP, cuya sintaxis es:
= DISTR.EXP(x;lambda;acum)
=DISTR.EXP(0,1;20;1)
El resultado es 0,8647.
Gráfica de distribución
Exponencial. Escala=0,05. Valor umbral=0
20
15
Densidad
10
0,8647
0
0 0,1
X
1. Si se sabe que b es una variable normal estándar, ¿Cuál es la probabilidad de que b sea
mayor que 2,5?
( a ) 0,0000 ( b ) 0,9938
( c ) 0,0062 ( d ) Falta información
2. Si se sabe que b es una variable normal estándar, ¿Cuál es el valor de que b que se ubica en
el percentil 19? Usando la tabla de la distribución normal estándar acumulada:
( a ) 0,88 ( b ) 0,7910
( c ) –0,88 ( d ) Ninguna de las anteriores
3. Si se sabe que x es una variable normal con media 12 y varianza 9, ¿Cuál es la probabilidad
de que x sea menor que 10? Usando la tabla de la distribución normal estándar acumulada:
( a ) 0,4121 ( b ) 0,7486
( c ) 0,2514 ( d ) Ninguna de las anteriores
4. Si se sabe que x es una variable normal con media 12 y varianza 9, ¿Cuál es la probabilidad
de que x sea como mínimo igual a 8? Usando la tabla de la distribución normal estándar
acumulada:
( a ) 0,6716 ( b ) 0,0918
( c ) 0,9082 ( d ) Ninguna de las anteriores
5. Si se sabe que x es una variable normal, ¿Cuál es la probabilidad de que x tome valores en
un intervalo de 2 veces la desviación estándar con respecto a la media?
( a ) 0,997 ( b ) 0,683
( c ) 0,954 ( d ) Falta información
6. Si se sabe que x es una variable normal con media 12 y varianza 9, ¿Cuál es el valor de x
que separa el 15% superior de los valores posibles de x?
( a ) 0,85 ( b ) 8,891
( c ) 15,11 ( d ) Ninguna de las anteriores
8. Una empresa ha comprado un equipo para su producción que requiere una pieza especial.
Según el proveedor esa pieza especial posee una vida esperada de 8 meses. Si usted desea
saber la probabilidad de tener que reemplazar esta pieza antes de 6 meses, debería emplear la
distribución:
( a ) Binomial ( b ) Normal ( c ) Multinomial ( d ) Geométrica
11. Una fábrica de cemento empaca su producto en sacos que tienen una media de 51,9
kilogramos, con una desviación estándar de 350 gramos, de acuerdo con una distribución
normal. La especificación es que cada saco pese exactamente 52 kilogramos. La probabilidad
de que un saco seleccionado al azar tenga un exceso en el peso de un kilogramo o más con
respecto al peso especificado es:
( a ) 0,0008 ( b ) 0,9992
( c ) 0,0021 ( d ) Ninguna de las anteriores
12. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso en un rango de 2 veces la desviación estándar con respecto al promedio
es:
( a ) 0,9540 ( b ) 0,6830
( c ) 0,9970 ( d ) Ninguna de las anteriores
13. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso entre 50 y 52 kilogramos es:
( a ) 0,6125 ( b ) 0,3875
( c ) 0,9999 ( d ) Ninguna de las anteriores
14. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso inferior a 51,1 kilogramos es:
( a ) 0,4991 ( b ) 0,5009
( c ) 0,0111 ( d ) Ninguna de las anteriores
15. Tomando los mismos datos del problema 11, en un lote de 200 sacos, el número de sacos
que se esperaría que tengan un peso superior a 52,5 kilogramos es:
( a ) 12,5 ( b ) 8,64
( c ) 0,0432 ( d ) Ninguna de las anteriores
16. Tomando los mismos datos del problema 11, si se considera que si un saco tiene un peso
en el 10% inferior debe reprocesarse, entonces el valor que marca el peso en kilogramos a
partir del cual los sacos deben reprocesarse es:
( a ) 51,95 ( b ) 51,45
( c ) 0,5235 ( d ) Ninguna de las anteriores
17. Tomando los mismos datos del problema 11, el valor que marca el percentil 85 de los
pesos, en gramos, es:
( a ) 52,26 ( b ) 52260
( c ) 0,5154 ( d ) Ninguna de las anteriores
19. ¿Cuál de las siguientes es falsa acerca de los datos que sigue la distribución normal?
( a ) El promedio es el mismo que el modo
( b ) La desviación estándar es la misma que la media
( c ) La mediana es el mismo que el modo
( d ) La mayoría de los datos está dentro de 3 desviaciones estándar de la mediana
21. En los problemas binomiales en que n > 20 y p > 5%, es falso que:
( a ) se puede emplear la normal para aproximar la binomial
( b ) los resultados de la binomial y la normal son iguales
( c ) los resultados de la binomial y la normal convergen con forme n tiende a infinito
( d ) efectuar el cálculo usando la distribución binomial lleva más trabajo
1. c 2. c 3. c 4. c 5. c
6. c 7. a 8. b 9. c 10. b
11. a 12. a 13. a 14. c 15. b
16. b 17. b 18. a 19. b 20. b
21. b
8 .
N n 5000 40
0,9922
N 1 5000 1
29
x 4,59
n 40
N n 29 5000 40
x 4,57
n N 1 40 5000 1
Solución:
Si la desviación estándar σ = 250, n =60, entonces el error estándar de la
media es:
250
x 32.27
n 60
N n 250 6000 60
x 32.12
n N 1 60 6000 1
x Z / n
206 1,96 40 / 50
Solución:
Se tiene que n = 50, x = 40, σ = 8 y una confianza 1 – α = 0,95.
x Z / n
40 1,96 8 / 50
Li 40 1,96 8 / 50 37.78
Ls 40 1,96 8 / 50 42.22
=INTERVALO.CONFIANZA(alfa;desv_estándar;tamaño)
=INTERVALO.CONFIANZA(0,05;40;50)
Ejemplo Se sabe que el tiempo que toma completar una prueba psicométrica tiene
una varianza de 225 minutos. Una muestra de 20 estudiantes es sometida a
la prueba obteniéndose una media de 71 minutos. Obtenga los límites de
confianza del 99% para el tiempo medio en que se completa dicha prueba.
Dado que la confianza es: 1 – α = 0,99, entonces α/2 = 0,005. Como n < 30
y σ conocida, se debe usar z. De la tabla de la distribución normal estándar
z con α/2 equivale a z = 2,58.
x Z / n
71 2,58 15 / 20
Li 71 2,58 15 / 20 62,36
Ls 71 2,58 15 / 20 79,64
Solución:
Se tiene que n = 15, x = 288 ml, σ = 52 ml y una confianza: 1 – α = 0,90.
Dado que la confianza es: 1 – α = 0,90, entonces α/2 = 0,05. Como n < 30
y σ conocida, se debe usar z. De la tabla de la distribución normal estándar
z con α/2 equivale a z = 1,645.
x Z / n
288 1,645 52 / 15
y σ desconocida:
x zs/ n
5,25 1,96 1,75 / 42
Ejercicio Una empresa productora de harina de trigo empaca paquetes que deben
contener un kilogramo de producto. En una muestra de 60 paquetes se
de obtuvo un peso medio de 992 gramos y una desviación estándar muestral
revisión de 44 gramos. Calcule los intervalos de confianza del 98% para el peso
medio de los paquetes de harina.
Solución:
Se tiene que n = 60 paquetes, x = 992 gramos, s = 44 gramos y una
confianza: 1 – α = 0,98.
x zs/ n
992 2,33 44 / 60
x ts/ n
2000 2,262 200 / 10
Solución:
Se tiene que n = 25, x = 4,8, s = 3,5 y una confianza: 1 – α = 0,99.
x ts/ n
4,8 2,797 3,5 / 24
Ejemplo Utilice Minitab para resolver el problema: El ciclo medio de vida de una
muestra aleatoria de 12 focos es de 2000 horas, con una desviación
estándar muestral de 200 horas. Se supone que la vida media de los focos
se distribuye normalmente. Determine los intervalos de confianza del 95%
para la vida media de los focos.
Ejemplo Se sabe que 20 fusibles que fueron sometidos a una sobrecarga del 20% se
fundieron en un tiempo promedio de 10,63 minutos, con desviación
estándar de 2,48 minutos.
Solución Se tiene que n = 20, x = 10,63 minutos, s = 2,48 minutos y una confianza:
1 – α = 0,95.
a) Dado que la confianza es: 1 – α = 0,95, entonces α/2 = 0,025. Como n <
30 y σ desconocida se debe usar t en vez de Z, con gl = 20 – 1 = 19. De la
tabla t con α/2 = 0,025 y gl = 19, se obtiene tα/2 = 2,093.
1 – 1/k2 = 0,95
Despejando k:
1/k2 = 0,05
1/ 0,05 = 20 = k2
k = 4,472
8,15
x k s / n 10,63 4,472 2,48 20 10,63 2,48
13,11
Entonces:
Ejemplo Se toma una muestra de 500 varones adultos y se encuentra que 156 son
fumadores. Encuentre los límites de confianza del 99% para la proporción
de fumadores varones.
La confianza del 99%, es decir, 1 – α = 0,99, α = 0,01, α/2 = 0,005, así que
de la tabla se obtiene z = 2,58, según la distribución normal.
0,2586
pz pq n = 0,312 2,58 0,312 0,688 500 =
0,3653
Ejercicio Una empresa desea lanzar un nuevo servicio por internet al mercado y para
ello requiere conocer la proporción de hogares de la zona que posee acceso
de a internet. En una muestra 120 hogares, 70 indicaron que poseían algún
revisión tipo de conexión a la red. Determine los intervalos de confianza del 99%
para la proporción de hogares de la zona con acceso a internet.
Solución:
Se pide el intervalo para la proporción poblacional p z pq n con una
confianza del 99%, es decir, 1 – α = 0,99, α = 0,01, α/2 = 0,005, así que de
la tabla se obtiene z = 2,58, según la distribución normal.
Calculando el intervalo:
Ejemplo En una muestra de 1000 adultos y se encuentra que 198 estarán de acuerdo
con la despenalización de la marihuana. Encuentre los límites de confianza
del 99% para la proporción de adultos que apoyarían la despenalización de
la marihuana.
Solución Se tiene que x = 198 eventos de una muestra de n = 1000 adultos, así que
en el menú Estadísticas / Estadística básica / 1 Proporción se completa el
cuadro, seleccionando la opción Datos resumidos con 198 eventos y 1000
ensayos:
3. Luis está tratando de estimar el gasto promedio en alimentación de las familias de su país.
Para resolver este problema se puede:
(a) Entrevistar a todas y cada una de las familias del país
(b) Seleccionar algunas familias "modelo" según el criterio de Luis
(c) Seleccionar una muestra aleatoria de familias de todo el país
(d) Seleccionar una muestra de familias cercanas al lugar donde Luis vive
11. Se sabe que una variable x tiene una desviación estándar de 10. Si se toma una muestra de
16 unidades, entonces el error estándar equivale a:
(a) 2,5 (b) 4 (c) 0,625 (d) Ninguna de las anteriores
12. Se sabe que una variable x tiene una desviación estándar de 10. Si se toma una muestra de
16 unidades de una población de 70, entonces el error estándar equivale a:
(a) 2,5 (b) 2,21 (c) 0,5529 (d) Ninguna de las anteriores
13. La diferencia en, valor absoluto, entre el valor de la media muestral y la media
poblacional se conoce como:
(a) Error estándar (b) Error de la estimación
(c) Error absoluto medio (d) Ninguna de las anteriores
15. Se desea estimar la media poblacional de una variable x cuya desviación estándar
poblacional es de 5 unidades. En una muestra de tamaño 45 se obtiene una media de 63
unidades, entonces el valor de z necesario para obtener los intervalos de confianza del 95%
es:
(a) 1,645 (b) 0,95 (c) 1,96 (d) 2,58
16. Se desea estimar la media poblacional de una variable x cuya desviación estándar
poblacional es de 5 unidades. En una muestra de tamaño 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, el límite inferior es:
(a) 61,77 (b) 61,54 (c) 64,46 (d) Ninguna de las anteriores
17. Se desea estimar la media poblacional de una variable x cuya desviación estándar
poblacional es de 5 unidades. En una muestra de tamaño 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, se concluye que:
(a) Con una confianza del 95% la media poblacional es 63 unidades
(b) Con una confianza del 95% la media poblacional está entre 61,77 y 64,23 unidades
(c) Con una confianza del 95% la media poblacional es mayor que 61,77 unidades
(d) Con una confianza del 95% la media poblacional está entre 61,54 y 64,46 unidades
18. Se desea estimar la media poblacional de una variable x cuya desviación estándar
poblacional es de 15 unidades. En una muestra de tamaño 200 se obtiene una media de 87
unidades, entonces al obtener los intervalos de confianza del 90%, el límite superior es:
(a) 87 (b) 85,26 (c) 88,74 (d) Ninguna de las anteriores
19. Se desea estimar la media poblacional de una variable x distribuida normalmente cuya
desviación estándar poblacional es de 20 unidades. En una muestra de tamaño 12 se obtiene
una media de 125 unidades, al obtener los intervalos de confianza del 99%, un investigador
realizó las siguientes dos afirmaciones:
20. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamaño 12 se obtiene una media de 125 unidades y una desviación estándar de 20
unidades, al obtener los intervalos de confianza del 99%, un investigador realizó las siguientes
dos afirmaciones:
21. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamaño 20 se obtiene una media de 3200 unidades y una desviación estándar de
450 unidades, al obtener los intervalos de confianza del 95%, un investigador realizó las
siguientes dos afirmaciones:
22. Se desea estimar la media poblacional de una variable x. En una muestra de tamaño 80 se
obtiene una media de 30 unidades y una desviación estándar de 4,5 unidades, al obtener los
intervalos de confianza del 99%, un investigador realizó las siguientes dos afirmaciones:
23. Al estimar la media poblacional de una variable x, en una muestra de tamaño 50 se obtiene
una media de 1500 unidades y una desviación estándar de 250 unidades. Al obtener los
intervalos de confianza del 95%, es verdadero que:
(a) Con certeza la media está entre 1430,70 y 1569,30
(b) Con una confianza del 95% la media poblacional es mayor que 1430,70 unidades
(c) Con una confianza del 95% la media poblacional está alrededor de 1500 unidades
(d) Con una confianza del 95% la media poblacional está entre 1430,70 y 1569,30 unidades
24. Al estimar la media poblacional de una variable x, en una muestra de tamaño 500 se
obtiene una media de 2150 unidades y una desviación estándar de 600 unidades. Al obtener
los intervalos de confianza del 90% se obtuvo como límite inferior 2105,86 y como límite
superior 2194,14, entonces es verdadero que:
(a) La media está entre 2105,86 y 2194,14
(b) Con una confianza del 90% la media poblacional es menor que 2194,14 unidades
(c) La media poblacional será mayor que 2194,14 con una probabilidad de 5%
(d) La media poblacional estará entre 2105,86 y 2194,14 unidades en 90 de cada 100 muestras
25. Si x es el número de veces que ha ocurrido un evento en una muestra n pruebas, entonces
el cociente x/n representa:
(a) La proporción poblacional (b) La proporción muestral
(c) La probabilidad de fracaso (d) Ninguna de las anteriores
26. Se desea estimar una proporción poblacional de una cierta variable. En una muestra de
tamaño 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realizó las siguientes dos afirmaciones:
27. Se desea estimar una proporción poblacional de una cierta variable. En una muestra de
tamaño 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realizó las siguientes dos afirmaciones:
28. Se desea estimar una proporción poblacional de una cierta variable. En una muestra de
tamaño 12 se obtiene un conteo de 5 eventos. Al obtener los intervalos de confianza del 90%,
un investigador realizó las siguientes dos afirmaciones:
29. Se desea estimar una proporción poblacional de una cierta variable. En una muestra de
tamaño 1200 se obtiene un conteo de 750 eventos. Al obtener los intervalos de confianza del
95%, un investigador realizó las siguientes dos afirmaciones:
30. Se desea estimar el peso promedio de las galletas que se elaboran en una fábrica. En una
muestra de tamaño 1100 paquetes de galletas se obtiene una media de 195 gramos con una
desviación estándar de 45 gramos. La empresa ha especificado que el peso de cada paquete de
galletas debe ser 200 gramos. Al obtener los intervalos de confianza del 95%, el encargado
del control del proceso realizó las siguientes dos afirmaciones:
A. No hay problema con el peso de las galletas, el 95% de las galletas tiene un peso de 195
grs.
B. El peso especificado de 200 gramos está fuera del intervalo de confianza del 95%.
31. Se desea estimar el peso promedio de las galletas que se elaboran en una fábrica. En una
muestra de tamaño 10 paquetes de galletas se obtienen los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realizó las
siguientes dos afirmaciones:
32. Se desea estimar el peso promedio de las galletas que se elaboran en una fábrica. Se sabe
que el peso medio de los paquetes de galletas se distribuye normalmente y que tiene una
desviación estándar de 15 gramos. En una muestra de tamaño 10 paquetes de galletas se
obtienen los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realizó las
siguientes dos afirmaciones:
33. Se desea estimar proporción de las galletas que se elaboran en una fábrica cuyo peso está
por debajo de la especificación. En una muestra de tamaño 10 paquetes de galletas se obtienen
los siguientes pesos (en gramos):
190 210 201 196 197 185 176 208 200 191
La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realizó las
siguientes dos afirmaciones:
34. En un periódico se presentan los resultados de una encuesta aplicada a una muestra
aleatoria de 1200 adultos, de los cuales 610 indicaron que la labor del gobierno es buena o
muy buena. El estudio se hizo con una confianza del 95%. Según el autor del artículo la
mayoría de los ciudadanos consideran que la labor del gobierno es buena o muy buena. Con
respecto a esa afirmación del autor del artículo un crítico realizó la siguiente aseveración: "El
autor se ha equivocado, ya que, 1. Con una confianza del 95% la proporción de ciudadanos de
ciudadanos que aprueban la gestión del gobierno podría estar entre 48% y 53,6%, con lo cual
es muy probable que el porcentaje de ciudadanos que están de acuerdo con la gestión del
gobierno sea inferior al 50%". Con respecto a esta situación es correcto que:
(a) El autor está en lo correcto y el crítico está equivocado
(b) El autor está equivocado y el crítico también
(c) El autor está equivocado y el crítico está en lo correcto
(d) Falta información para indicar quién está equivocado y quién no
1. c 2. a 3. c 4. c 5. a
6. d 7. c 8. b 9. b 10. d
11. a 12. b 13. b 14. d 15. c
16. b 17. d 18. c 19. b 20. a
21. d 22. b 23. d 24. d 25. b
26. b 27. a 28. d 29. b 30. c
31. a 32. b 33. d 34. c
9 .
Muestreo
OBJETIVOS:
Al concluir el capítulo, será capaz de:
1. Explicar la importancia y necesidad de trabajar con muestras para conocer información
sobre la población
2. Describir algunas aplicaciones empresariales del muestreo
3. Calcular el tamaño de muestra necesario para estimar la media poblacional y proporción
poblacional
4. Describir las principales técnicas de muestreo probabilístico
Ejemplo Suponga que se desea estimar el gasto promedio diario que realizan los
turistas estadounidenses cuando visitan el país. Por un estudio anterior se
sabe que esta variable tiene una desviación estándar de $46,6. Además, se
desea que la estimación tenga un error máximo de $10 y con una confianza
del 95%. ¿Qué tamaño de muestra se necesita?
Solución Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. Así que se plantea:
z 46,6 1,96
2 2
n 83,42 84
E 10
Ejercicio Se desea estimar el salario promedio de los operarios industriales del país.
Se conoce que la desviación estándar de estos salarios es de $236. Se
de requiere una estimación con un error máximo de $50 y una confianza del
revisión 99%. ¿De qué tamaño debe ser la muestra?
Solución:
Se plantea:
z 236 2,58
2 2
Ejemplo Una empresa posee un total de 800 camiones que se emplean para repartir
sus productos a nivel nacional. Se desea estimar mediante una muestra
aleatoria de los camiones para determinar la cantidad de kilómetros
recorridos mensualmente. Por otro estudio realizado hace un tiempo, se
conoce que esta variable tiene una desviación estándar de 380 kilómetros.
La estimación debe tener un error máximo de 30 kilómetros y una
confianza del 95%. ¿Qué tamaño de muestra se necesita?
Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. Así que se plantea:
z 380 1,96
2 2
n0 617
n 348,34 349
n0 617
1 1
N 800
Solución:
Los datos del problema son:
2 2
z 1,96
n p(1 p) 0,5(1 0,5) 384,16 385
E 0,05
n 385
n 234,20 235
n 385
1 1
N 600
Solución Con base en los datos anteriores, se tiene que para el nivel de confianza del
99% corresponde un valor de z de 2,58. Además, como no se tiene una
estimación de p, se empleará el valor de 0,5. Entonces se plantea:
2 2
z 2,58
n p(1 p) 0,5(1 0,5) 1.849
E 0,03
Solución:
Se plantea:
2 2
z 1,96
n p(1 p) 0,5(1 0,5) 1225
E 0,028
Ejemplo Una empresa desea conocer la proporción de sus empleados que estarían
de acuerdo en un nuevo programa de beneficios. La compañía tiene un
total de 350 colaboradores y quiere hacer la estimación con un error
máximo de 5% y una confianza del 95%. Se estima, por un estudio piloto,
que esta proporción podría ser del 40%. ¿Qué tamaño de muestra se
necesita?
Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. Los datos del problema son:
2 2
z 1,96
n p(1 p) 0,4(1 0,4) 368,79 369
E 0,05
n0 369
n 179,58 180
n0 369
1 1
N 350
Solución:
Los datos del problema son:
2 2
z 1,96
n p(1 p) 0,5(1 0,5) 784
E 0,035
n 784
n 563,21 564
n 784
1 1
N 2000
Ejemplo Un auditor desea verificar si todos los cheques emitidos en una compañía
satisfacían los requerimientos de control establecidos por la gerencia.
Durante el mes pasado se emitieron 81 cheques y la muestra debe contener
10 cheques. ¿Cuáles cheques se seleccionarían si se aplica un muestreo
simple al azar y usando la tabla de números aleatorios anterior (tome como
punto inicial la primera columna y segundo renglón de la tabla)?
Ejemplo Utilice Excel para generar una muestra simple al azar de 5 unidades de una
población total de 20 unidades.
= ALEATORIO.ENTRE(1;20)
Ejemplo Una empresa tiene 700 empleados y se desea tomar una muestra de 20 de
ellos para aplicar un cuestionario sobre la opinión de los colaboradores
sobre los resultados obtenidos luego de la implementación de un nuevo
sistema informático. ¿Cómo se seleccionarían los miembros de la muestra
si se emplea el muestreo aleatorio sistemático?
N 700
k 35
n 20
Solución Para establecer cuántos empleados deben seleccionarse de cada uno de los
estratos establecidos, si se emplea la afijación proporcional, primero se
debe determinar la frecuencia relativa de cada uno de los estratos en la
población:
Estrato 1: 0,20 x 50 = 10
Estrato 2: 0,50 x 50 = 25
Estrato 3: 0,30 x 50 = 15
La suma de los tamaños de muestra por estrato debe ser igual al tamaño de
la muestra total, que en este caso es 50.
4. Un banco está estudiando el nivel de satisfacción de los clientes con sus servicios y para tal
fin realizará un estudio por muestreo. Al respecto el investigador a cargo expresó que:
5. Una trabajadora social desea investigar algunos aspectos relacionados con la calidad de
vida de los adultos mayores que residen en hogares de ancianos. Para tal fin selecciona una
muestra aleatoria y visita varios hogares de ancianos para valorar si dichas organizaciones
poseen planes e infraestructura adecuados. Al respecto la trabajadora social considera que:
6. Una nutricionista está investigando la calidad de la nutrición que reciben los niños de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los niños y
entrevista a sus padres. Con relación a esta situación la nutricionista considera que:
7. Una nutricionista está investigando la calidad de la nutrición que reciben los niños de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los niños y
entrevista a sus padres. Con relación a esta situación la nutricionista considera que:
8. Una nutricionista está investigando la calidad de la nutrición que reciben los niños de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los niños y
entrevista a sus padres. Con relación a esta situación la nutricionista considera que es
necesario emplear una muestra porque:
A. Visitar todos los hogares de todos los niños de la escuela requiere demasiado tiempo.
B. El estudio de la variable en cuestión implica la destrucción de la unidad de interés.
10. Una fábrica de fusibles prueba la calidad de su producto terminado. El ingeniero a cargo
afirma que es estrictamente necesario emplear un muestreo porque:
(a) Estudiar la población requeriría demasiado tiempo
(b) Estudiar la muestra es más barato
(c) La prueba del producto es destructiva
(d) La población es infinita
11. Una ___________ es una colección de todos los elementos de un grupo. Una colección de
algunos de esos elementos es una ___________. Las opciones que mejor completan la frase
anterior son:
(a) muestra, población
(b) población, muestra por conveniencia
(c) población, muestra aleatoria
(d) población, muestra
13. Con respecto al tamaño de muestra un investigador realizó las siguientes dos
afirmaciones:
14. Con respecto al uso de muestras un investigador realizó las siguientes dos afirmaciones:
15. Se desea estimar la media poblacional de una variable x. Se conoce que la desviación
estándar es de 87 unidades. Se requiere una confianza en la estimación del 90% y que el error
no sea mayor que 20 unidades. Entonces, el tamaño de muestra requerido es:
(a) 520 (b) 73 (c) 52 (d) Ninguna de las anteriores
16. Se desea estimar la media poblacional de una variable x. Se conoce que la desviación
estándar es de 87 unidades y que la población está compuesta por 200 unidades. Se requiere
una confianza en la estimación del 95% y que el error no sea mayor que 15 unidades.
Entonces, el tamaño de muestra requerido es:
(a) 130 (b) 92 (c) 79 (d) Ninguna de las anteriores
17. Se desea estimar una proporción poblacional para una cierta variable. Se cuenta con una
estimación previa del 20%. Se requiere una confianza en la estimación del 95% y que el error
no sea mayor que 5%. Entonces, el tamaño de muestra requerido es:
(a) 174 (b) 246 (c) 385 (d) Ninguna de las anteriores
18. Se desea estimar una proporción poblacional para una cierta variable. Se requiere una
confianza en la estimación del 99% y que el error no sea mayor que 3,5%. Entonces, el
tamaño de muestra requerido es:
(a) 1105 (b) 1355 (d) 867 (d) Ninguna de las anteriores
19. Se desea estimar una proporción poblacional para una cierta variable. La población tiene
un tamaño de 220 individuos. Se requiere una confianza en la estimación del 90% y que el
error no sea mayor que 3%. Entonces, el tamaño de muestra requerido es:
(a) 171 (b) 752 (c) 457 (d) 149
20. En un estudio por muestreo se desea estimar la talla promedio de las 400 mujeres que
laboran en una empresa. Por un estudio previo se sabe que la desviación estándar es de 22 cm
y se ha establecido una precisión de 5 cm con una confianza del 99%. Entonces, el tamaño de
muestra requerido es, en número de mujeres:
(a) 98 (b) 129 (c) 105 (d) 84
21. En un estudio por muestreo se desea estimar la proporción de las 400 mujeres que laboran
en una empresa que poseen hijos menores de 10 años. Se ha establecido una precisión de 5%
con una confianza del 95%. Entonces, el tamaño de muestra requerido es, en número de
mujeres:
(a) 385 (b) 271 (c) 162 (d) 197
22. Un noticiero en la televisión decide realizar una encuesta sobre la calidad de la educación
en el país. Los televidentes que desean participar llaman a un número telefónico y votan por la
opción que consideran más apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educación del país debe mejorarse. El tipo de muestreo empleado por este
noticiero es:
(a) Aleatorio
(b) Por conveniencia
(c) Voluntario
(d) De juicio
23. Un noticiero en la televisión decide realizar una encuesta sobre la calidad de la educación
en el país. Los televidentes que desean participar llaman a un número telefónico y votan por la
opción que consideran más apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educación del país debe mejorarse. Con respecto a este muestreo es falso
que:
(a) Es una muestra representativa por ser muy grande
(b) Se presenta un posible sesgo de selección
(c) Es un muestreo no aleatorio
(d) La muestra no es representativa a pesar de su tamaño
25. La discrepancia, debida al azar, entre la estimación de una característica obtenida a través
de una muestra y su verdadero valor en la población corresponde al concepto de:
(a) Sesgo de selección
(b) Error de muestreo
(c) Sesgo de medición
(d) Aleatoriedad
26. El error sistemático, no debido al azar, y que ocasiona que diferencias entre el valor
estimado a través de la muestra y el valor verdadero corresponde al concepto de:
(a) Sesgo
(b) Error de muestreo
(c) Variabilidad
(d) No aleatoriedad
27. Un gerente está haciendo un estudio de mercado. Ha seleccionado una muestra aleatoria
de 385 consumidores, pero hubo 50 de ellos que no contestaron el cuestionario. Esta
situación:
(a) No es problema porque la mayoría sí lo contestaron
(b) Es un problema porque el tamaño de la muestra efectivamente tomada es menor
(c) Es un problema, pero se resuelve sustituyendo los valores faltantes por sus valores
esperados
(d) No es un problema porque no fue causado intencionalmente por el investigador
28. Con respecto al muestreo un investigador realizó las siguientes dos afirmaciones:
32. Con respecto a una muestra sea representativa de una población es correcto que:
(a) Basta con que sea del tamaño apropiado
(b) Debe ser obtenida al azar sin importar su tamaño
(c) Debe al menos el 20% de la población
(d) Ninguna de las anteriores
1. b 2. d 3. c 4. a 5. c
6. c 7. b 8. d 9. d 10. c
11. d 12. c 13. a 14. d 15. c
16. c 17. b 18. b 19. a 20. a
21. d 22. c 23. a 24. b 25. b
26. a 27. b 28. d 29. b 30. a
31. c 32. d
10 .
Pruebas de hipótesis
OBJETIVOS:
Al concluir el capítulo, será capaz de:
1. Plantear las hipótesis nula y alternativa en problemas de decisión con respecto a la media o
la proporción poblacional
2. Identificar los posibles errores que se pueden cometer al tomar decisiones con base en
muestras
3. Describir los pasos del procedimiento de prueba de hipótesis
4. Calcular los estadísticos de prueba adecuados según el tipo de problema
5. Tomar decisiones con base en el procedimiento de prueba de hipótesis
Ejemplo Se sabe por estudios previos que los recién nacidos de cierta población
tienen una talla promedio de 49,5 cm. Una enfermera estudió un grupo de
40 recién nacidos, y obtuvo una media de 53,4 cm.
Pero los datos recopilados sugieren que este promedio podría ser mayor
que 49,5 cm, por lo que, de descartar la hipótesis nula anterior, se aceptaría
la hipótesis alternativa:
H1: La talla media de los recién nacidos es mayor que 49,5 cm.
H0: = 49,5
H1: > 49,5
Solución 1. En esta situación se indica que el peso promedio de las cajas en que
viene el material es 17 libras, por tanto se querrá verificar que se satisface
esta especificación, de manera que la hipótesis nula será que el peso
promedio es 17 libras. Por otro lado, en la muestra de 86 cajas se obtuvo
un peso promedio inferior, lo cual también sugiere la pregunta, entonces la
hipótesis nula será que la media es inferior a 17 libras. En resumen:
H0: = 17
H1: < 17
H0: = 4,2
H1: < 4,2
H0: = 75
H1: < 75
H0: = 15,6
H1: > 15,6
Solución:
Con base en el estudio previo se puede plantear la hipótesos nula de que el
10% de estos vehículos portaban un peso superior al permitido, o sea, que
la proporción P = 0,10.
En resumen:
H0: P = 0,10
H1: P > 0,10
Solución El empresario desea probar que si es cierto que el 74% de los usuarios de
internet han realizado compras por internet en el último trimestre, por
tanto, su hipótesis nula será:
Pero los datos recopilados indican que ese porcentaje podría ser menor,
por lo que, de descartar la hipótesis nula anterior, se aceptaría la hipótesis
alternativa:
H0: P = 0,74
H1: P < 0,74
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra y
probar la hipótesis nula de que los bombillos tienen una vida media de
1000 horas, contra la hipótesis alterna de que la vida media de los
bombillos es menor que dicha especificación. ¿Cómo podrían darse y qué
significan los errores tipo I y tipo II en esta situación?
Solución En esta situación los errores tipo I y tipo II podrían darse si la muestra no
representa bien a la población. Esto puede darse de los modos siguientes:
Solución:
La hipótesis nula es el valor límite que se desea probar de 30%, o sea, que
la proporción P = 0,30. Dado que se cree que al menos el 30% compraría
el producto, entonces la hipótesis alternativa sería P > 30%.
En resumen:
H0: P = 0,30
H1: P > 0,30
En esta situación los errores tipo I y tipo II podrían darse de los modos
siguientes:
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviación estándar es 60 horas. Determine, a un nivel de
significación del 5%, si la media poblacional de estos bombillos es
efectivamente de 1000 horas.
Solución Paso 1. Plantear las hipótesis. Toda prueba inicia planteando las hipótesis.
La hipótesis nula se plantea como H0: μ = μo, donde μo es el valor a probar
(en este caso 1000 horas), y la hipótesis alternativa podría ser como alguna
de las siguientes:
H1: μ > μo
H1: μ < μo
H1: μ ≠ μo
H0: μ = 1000
H0: μ = 1000
H1: μ < 1000
x
zc con n 30 con σ conocida o con n < 30 y σ conocida
/ n
x
zc con n 30 con σ desconocida
s/ n
x
tc con n < 30 y σ desconocida
s/ n
En términos de t sería:
Como |Zc| = 3,54 > |Zt| = 1,645, entonces Zc cae en zona de rechazo de la
H0.
Ejercicio Una institución del gobierno periódicamente verifica que las empresas y
los comercios no realicen prácticas abusivas contra los consumidores.
de Recientemente ha verificado una muestra de 200 latas de atún cuya
revisión etiqueta indica que contienen 130 grs. como peso escurrido. El promedio
en la muestra fue 112 grs. como peso escurrido Por un estudio anterior se
conoce que la desviación estándar es 20,5 grs.
Solución:
Paso 1. Plantear las hipótesis. Se quiere verificar el dato que aparece en la
etiqueta:
H0: μ = 130
H0: μ = 130
H1: μ < 130
x
zc con n 30 y con σ conocida
/ n
Zα = 1.645
Solución Se tiene que hay un peso especificado para los frascos de mantequilla de
maní de 250 gramos, por lo que μ0 = 250 y además n = 8.
Solución:
Se quiere probar si la media es superior a $500, por lo que μ0 = 500 y
además n = 15.
x 535 500
tc 0,63
s / n 215 / 15
Una vez que se tiene bien definida la naturaleza del problema, entonces se
siguen los mismos 5 pasos expuestos para el caso de las pruebas de
hipótesis sobre la media poblacional.
H0: P = 0,20
Por otro lado, los datos muestrales indican que de los 1200 adultos
encuestados, 215 realizaron ejercicio físico la semana pasada, por lo que se
tendría una proporción muestral equivalente a:
H0: P = 0,20
Solución:
Paso 1. Planteamiento de las hipótesis: El problema señala que se desea
probar si el 20% de los adultos realizaron ejercicio físico al menos una vez
durante la semana pasada, por lo que la hipótesis nula será:
H0: P = 0,20
Por otro lado, los datos muestrales indican que de los 1200 adultos
encuestados, 215 realizaron ejercicio físico la semana pasada, por lo que se
tendría una proporción muestral equivalente a:
H0: P = 0,20
H1: P < 0,20
significancia de un 1%.
Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviación estándar es 60 horas. Utilice Minitab para
determinar, a un nivel de significación del 5%, si la media poblacional de
estos bombillos es efectivamente de 1000 horas.
Solución Como en cualquier prueba de hipótesis, se inicia por plantear las hipótesis.
Tal como se expuso anteriormente, las hipótesis son:
H0: μ = 1000
H1: μ < 1000
Luego debe darse clic en el botón Opciones, pues es ahí donde se indica el
nivel de significancia y se selecciona la hipótesis alternativa:
Puede verse que Minitab indica que el valor del estadístico de prueba Zc es
–3,54, que coincide con el valor calculado anteriormente en este capítulo.
De la tabla de la curva normal, o bien, del mismo Minitab se calcula el
valor Zt, que es –1,645, por lo que Zc cae en zona de rechazo de la H0.
Además, observe que Minitab calculó el valor P, que en este caso es 0,000,
un valor inferior al nivel de significancia del 5%, por lo que se rechazaría
la hipótesis nula.
H0: P = 0,20
H1: P < 0,20
Luego debe darse clic en el botón Opciones, pues es ahí donde se indica el
nivel de significancia y se selecciona la hipótesis alternativa:
Solución Se inicia por plantear las hipótesis. Se desea probar que el tiempo medio
para resolver los requerimientos de los usuarios es de 28 días, por lo que
esa será la hipótesis nula. Por otro lado, la evidencia muestral indica que
dicho tiempo se ha disminuido, pero algunos empleados opinan lo
contrario, por lo que se podría plantear la hipótesis alternativa como que el
tiempo medio es diferente de 28 días. En resumen, las hipótesis son:
H0: μ = 28
H1: μ ≠ 28
22,62
x t s / n 26,9 2,779 8 27
31,18
x 26,9 28
tc 0,714
s/ n 8 / 27
1. Cuando se debe decidir, con base en evidencia experimental, si una afirmación hecha
acerca de un parámetro es falsa o verdadera, es necesario realizar:
(a) Una estimación por intervalos
(b) Una prueba de hipótesis
(c) Un análisis de correlación
(d) Un estudio por muestreo
9. El gerente de una empresa espera que el 60% de sus clientes actuales estén dispuestos a
efectuar compras a través de internet. Para comprobar esta afirmación se efectúa una encuesta
entre una muestra de clientes, en la cual se encuentra que solo el 40% de los clientes
efectuarían compras por internet. Según los estudios financieros de la empresa, se requiere
que al menos el 60% de los clientes actuales realicen compras en línea para que valga la pena
implementar dicha modalidad de negocios. Con respecto a esta situación se han realizado dos
afirmaciones:
10. Un candidato de un partido político considera que al menos el 40% de los electores tienen
una opinión favorable acerca de sus planteamientos y, por tanto, votarían por él en las
próximas elecciones. Para comprobar si su expectativa es acertada, decidió efectuar una
encuesta entre un grupo de 200 electores, de los cuales 70 dijeron tener simpatía por este
candidato. Las elecciones se ganan con al menos el 40% de los votos y el candidato
participará solo si posee posibilidades de contar con al menos el 40% de los votos. Con
respecto a esta situación se han realizado dos afirmaciones:
A. Cometer el error tipo II significaría no participar en una elección que pudo haber
ganado.
B. Cometer el error tipo I significaría gastar muchos recursos en propaganda en una
elección que no ganaría.
11. Las autoridades sanitarias consideran que los recién nacidos procedentes de zonas rurales
deberían pesar al menos 2500 gramos al nacer, en promedio. De presentarse una media
inferior, valdría la pena implementar un programa para la mejora de la atención prenatal en
las zonas rurales. Se decide hacer un estudio por muestreo para valorar esta decisión. Con
respecto a esta situación se han realizado dos afirmaciones:
12. Con respecto al nivel de significancia usado en las pruebas de hipótesis se han realizado
dos afirmaciones:
A. Generalmente es de 1% o de 5%.
B. Representa la posibilidad de aceptar una hipótesis incorrecta.
13. Un contrato laboral exige los operarios realicen una producción diaria no menor de 50
unidades. Una muestra de 150 días de producción revela una media de 47,3 unidades, con una
desviación estándar de 5,7 unidades, ¿se cumple con la disposición del contrato?
14. Un contrato laboral exige los operarios realicen una producción diaria no menor de 50
unidades. Una muestra de 150 días de producción revela una media de 47,3 unidades, con una
desviación estándar de 5,7 unidades, ¿se cumple con la disposición del contrato?
15. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. ¿Parecería esta ser una estimación válida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?
16. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. ¿Parecería esta ser una estimación válida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?
17. Con respecto al procedimiento de prueba de hipótesis se han realizado dos afirmaciones:
18. Con respecto al valor P (que ofrecen la mayoría de los programas de computación como
parte de la prueba de hipótesis) se han realizado dos afirmaciones:
19. Si al realizar una prueba de hipótesis sobre una media de una población, se cuenta con
datos de una muestra de 58 observaciones y se conoce el valor de la desviación estándar
poblacional, entonces se emplea como estadístico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
20. Si al realizar una prueba de hipótesis sobre una media de una población, se cuenta con
datos de una muestra de 17 observaciones y se conoce el valor de la desviación estándar
poblacional, entonces se emplea como estadístico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
21. Si al realizar una prueba de hipótesis sobre una media de una población, se cuenta con
datos de una muestra de 17 observaciones y no se conoce el valor de la desviación estándar
poblacional, entonces se emplea como estadístico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
22. Si al realizar una prueba de hipótesis sobre una media de una población, se cuenta con
datos de una muestra de 90 observaciones y no se conoce el valor de la desviación estándar
poblacional, entonces se emplea como estadístico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ
23. Si al realizar una prueba de hipótesis sobre una media de una población, se dice que la
prueba es de dos colas, entonces es verdadero que la hipótesis alternativa puede ser (donde μ0
es el valor hipotético de la media poblacional):
(a) H1: μ > μ0 (b) H1: μ < μ0
(c) H1: μ ≠ μ0 (d) H1: μ = μ0
24. Si al realizar una prueba de hipótesis sobre una media de una población, se sabe que no se
rechazó la hipótesis nula, entonces puede ser verdadero que:
(a) zc zt (b) tc tt
(c) tc tt (d) Ninguna de las anteriores
25. Si al realizar una prueba de hipótesis sobre una media de una población, se sabe que se
rechazó la hipótesis nula, entonces puede ser verdadero que:
(a) z c z t (b) t c t t
(c) z c z t (d) Ninguna de las anteriores
26. Si al realizar una prueba de hipótesis sobre una media de una población, se sabe que se
rechazó la hipótesis nula, entonces puede ser verdadero que:
(a) z c z t (b) valor P <
(c) tc tt (d) valor P >
27. Si se realiza una prueba de hipótesis de dos colas, con un nivel de significancia del 5%,
entonces el valor z crítico es:
(a) 2,00 (b) 1,645 (c) 1,28 (d) 1,96
28. Si se realiza una prueba de hipótesis de dos colas, con un tamaño de muestra de 10
observaciones y un nivel de significancia del 5%, entonces el valor t crítico es:
(a) 1,96 (b) 2,262 (c) 1,833 (d) 2,228
31. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hipótesis nula es:
(a) H0: μ = 2,86 (b) H0: μ = 3,13
(c) H0: μ < 3,13 (d) H0: μ = 1,2
32. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hipótesis alternativa es:
(a) H1: μ = 2,86 (b) H1: μ = 3,13
(c) H1: μ < 3,13 (d) H1: μ > 2,86
33. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, es cierto que:
(a) Debe calcularse z porque el tamaño de muestra es menor que 30 y se desconoce σ
(b) Debe calcularse z porque el tamaño de muestra es menor que 30 y se conoce σ
(c) Debe calcularse t porque el tamaño de muestra es menor que 30 y se desconoce σ
(d) Debe calcularse t porque el tamaño de muestra es menor que 30 y se conoce σ
34. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
35. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor del estadístico de prueba es:
(a) z = –1,13 (b) t = –1,13
(c) t = 1,711 (d) Ninguna de las anteriores
36. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al calcular el valor tabular crítico para hacer la prueba es cierto que:
(a) Los grados de libertad son 25
(b) Los grados de libertad son 24
(c) Los grados de libertad son 26
(d) No se necesita determinar los grados de libertad
37. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor tabular crítico para hacer la prueba es:
(a) z = –1,645 (b) t = 1,711
(c) t = –1,711 (d) t = 2,064
38. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba es verdadero que:
(a) Se acepta la hipótesis nula porque tc < tt
(b) Se acepta la hipótesis nula porque |tc| < |tt|
(c) Se rechaza la hipótesis nula porque tc > tt
(d) Se acepta la hipótesis nula porque |zc|< |zt|
39. De acuerdo con el Instituto de Estadística y Censos, un hogar típico en nuestro país tiene
3,13 miembros. Una muestra de 25 hogares del área metropolitana presenta un número medio
de 2,86 miembros. La desviación estándar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, ¿es razonable concluir que el número medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba se puede concluir, con respecto al tamaño medio de los
hogares del área metropolitana, que:
(a) El tamaño medio es 2,86 miembros
(b) El tamaño medio es 3,13 miembros
(c) No hay evidencia suficiente para decir que el tamaño medio es menor que 3,13 miembros
(d) Hay evidencia suficiente para decir que el tamaño medio es menor que 3,13 miembros
1. b 2. a 3. b 4. c 5. d
6. b 7. c 8. a 9. a 10. c
11. a 12. a 13. a 14. b 15. b
16. d 17. a 18. d 19. a 20. a
21. c 22. b 23. c 24. c 25. a
26. b 27. d 28. b 29. d 30. d
31. b 32. c 33. d 34. b 35. b
36. b 37. c 38. b 39. c
11 .
Ejemplo Una empresa posee operaciones en dos países distintos y en cada país
posee una planta de producción. En uno de los países se tienen 2000
empleados y en el otro 3000. En ambas plantas se realizan los mismos
procesos, pero se ha observado que, según algunos datos muestrales, la
productividad de los operarios tiende a ser mayor en uno de los países que
en el otro.
Tamaño de Desviación
Planta de muestra Media estándar
producción n x
En el país 1 40 22 3,1
En el país 2 50 31 4,2
H0: μ1 – μ2 = 0
H1: μ1 – μ2 < 0
( x1 x 2 ) (22 31) 0
z 11,69
2
2
3,12 4,2 2
1
2
n1 n2 40 50
Solución En esta situación se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:
1 2
Grupo Ciencias económicas Ingeniería
Tamaño de muestra 80 70
Promedio $1.250 $980
Desviación estándar $400 $620
Se plantean la hipótesis nula como la igual de las dos medias, o sea, que la
diferencia es cero:
H0: μ1 – μ2 = 0
H0: μ1 = μ2
H1: μ1 > μ2
H0: μ1 = μ2
H1: μ1 > μ2
( x1 x 2 ) (1250 980) 0
z 3,12
12 22 400 2 620 2
n1 n2 80 70
Solución:
Se tiene que n1 = 40, n2 = 50, x1 = 2,8, x 2 = 3,5, σ1 = 1,2 y σ2 = 1,8.
Se tomará α = 0,05.
H0: μ1 – μ2 = 0
H1: μ1 – μ2 < 0
( x1 x 2 ) (2,8 3,5) 0
z 2,20
2
2
1,2 2 1,8 2
1
2
n1 n2 40 50
Solución En esta situación se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:
1 2
Grupo Ciencias económicas Ingeniería
Tamaño de muestra 80 70
Promedio $1.250 $980
Desviación estándar $400 $620
H0: μ1 = μ2
H1: μ1 > μ2
/ Estadística básica una prueba "z de 2 muestras", sino que solo aparece "t
de 2 muestras". Sin embargo, la distribución normal y la distribución t
convergen conforme se incrementa el tamaño de la muestra, por lo que
usando el menú "t de 2 muestras" se obtendrán resultados bastante
aproximados. Entonces, se da clic al menú Estadísticas, luego Estadística
básica y se selecciona t de 2 muestras, y se completa el cuadro de diálogo
siguiente:
Presencial 79 88 54 81 73 56 79 64 58
En línea 70 80 72 52 70 61
Además, α = 0,05.
H0: μ1 – μ2 = 0
H1: μ1 – μ2 > 0
H0: μ1 = μ2
H1: μ1 > μ2
2
132,42
n1 n2 2 962
Luego se calcula t:
( x1 x 2 ) (70,2 67,5) 0
t 0,45
2
2
132,42 132,42
9 6
n1 n2
Aplicando la distribución t:
gl = n1 + n2 –2 = 9 + 6 – 2 = 13
El valor de t calculado con la fórmula es menor que el tα, por lo tanto, cae
en la zona de aceptación de la hipótesis nula. Se acepta Ho con α = 0,05. Se
puede decir que la diferencia entre los promedios de ambas modalidades
de estudio no es estadísticamente significativa.
Ejemplo Los datos corresponden a los tiempos, en minutos, requeridos por una
muestra de empleados de dos departamentos distintos de una empresa en
un simulacro de evacuación de las instalaciones, esto como parte de la
preparación que se realiza ante eventuales situaciones de emergencia,
como terremotos o incendios.
Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2
H0: μ1 = μ2
H1: μ1 > μ2
2
4,176
n1 n2 2 872
Luego se calcula t:
( x1 x 2 ) (3,875 3,714) 0
t 0,152
2 2 4,176 4,176
8 7
n1 n2
Aplicando la distribución t:
gl = n1 + n2 –2 = 8 + 7 – 2 = 13
El valor de t calculado con la fórmula es menor que el tα, por lo tanto, cae
en la zona de aceptación de la hipótesis nula. Se acepta Ho con α = 0,05. Se
puede decir que la diferencia entre los promedios de los tiempos de
evacuación de los dos departamentos no es estadísticamente significativa.
Solución:
Se cuenta con la siguiente información:
Entonces se calcula p:
p1 p 2 2 1
p 0,1071
n1 n2 15 13
q = 1 – 0,1071 = 0,8929
Ho: p1 = p2
H1: p1 > p2
Luego se calcula z:
p1 p 2 0,1333 0,0769
zc 0,4814
1 1 1 1
pq 0,1071 0,8929
n1 n2 15 13
Ejemplo Utilice Minitab para resolver el problema: Los datos corresponden a los
tiempos, en minutos, requeridos por una muestra de empleados de dos
departamentos distintos de una empresa en un simulacro de evacuación de
las instalaciones, esto como parte de la preparación que se realiza ante
eventuales situaciones de emergencia, como terremotos o incendios.
Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2
Solución Primero que todo se introducen los datos en columnas de la hoja de trabajo
de Minitab:
Resulta útil calcular cada una de las medias, para saber que x1 = 3,875 y
que x 2 = 3,714, y se plantean las hipótesis como:
H0: μ1 = μ2
H1: μ1 > μ2
Antes 7 4 5 3 4 5 10 4
Después 5 3 5 4 6 4 6 3
Solución Primero se calculan las diferencias, di, entre el "antes" y el "después" para
cada una de las observaciones, o sea, se resta el dato "antes" menos el dato
"después":
Antes 7 4 5 3 4 5 10 4
Después 5 3 5 4 6 4 6 3
Diferencia 2 1 0 -1 -2 1 4 1
x d = 0,75
sd = 1,832
Ho: μd = 0
H1: μd > 0
Se calcula t:
xd 0,75
t 1,158
sd n 1,832 8
Ejemplo La tabla muestra las cantidades producidas por hora elaboradas por 8
operarios antes de recibir un entrenamiento y las cantidades producidas
luego de la misma.
Antes 8 8 9 6 9 7 12 12
Después 6 10 7 11 9 12 14 8
Solución Primero se calculan las diferencias, di: 2, –2, –2, –5, 0, –5, –2, 4.
Ho: μd = 0
H1: μd < 0
Se calcula t:
xd 0,75
t 0,637
sd n 3,33 8
Automóvil 1 2 3 4 5 6 7
Neumático nacional 142 138 144 146 150 137 141
Neumático importado 140 139 142 139 141 137 135
Solución:
Primero se calculan las diferencias, di: 2, –1, 2, 7, 9, 0, 6.
Ho: μd = 0
H1: μd > 0
Se calcula t:
xd 3,57
t 2,5
sd n 3,78 7
Ejemplo Utilice Minitab para resolver el siguiente problema. La tabla muestra las
cantidades producidas por hora elaboradas por 8 operarios antes de recibir
un entrenamiento y las cantidades producidas luego de la misma.
Antes 8 8 9 6 9 7 12 12
Después 6 10 7 11 9 12 14 8
Ho: μd = 0
H1: μd < 0
Ho: p1 = p2
H1: p1 > p2
Primero se calculan p y q:
p1 p 2 28 25
p 0,59
n1 n2 40 50
q = 1 – 0,5889 = 0,41
Luego se calcula z:
p1 p 2 0,70 0,50
z 1,92
1 1 1 1
pq 0,59 0,41
n1 n2 40 50
p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625
Entonces se calcula p:
p1 p 2 18 25
p 0,0478
n1 n2 500 400
q = 1 – 0,0478 = 0,9522
Ho: p1 = p2
H1: p1 ≠ p2
Luego se calcula z:
p1 p 2 0,036 0,0625
zc 1,852
1 1 1 1
pq 0,0478 0,9522
n1 n2 500 400
Ejercicio Un investigador cree que las mujeres emplean la tarjeta de crédito más que
los hombres. Para probar su hipótesis toma una muestra de 90 mujeres y
de encuentra que 64 de ellas emplea regularmente la tarjeta de crédito. Por
revisión otro lado, una muestra de 120 hombres arrojó que 76 empleaban la tarjeta
de crédito con regularidad. ¿Tiene razón el investigador? Utilice un nivel
de significancia del 1%.
Solución:
Se cuenta con la siguiente información:
Entonces se calcula p:
p1 p 2 64 76
p 0,6667
n1 n2 90 120
q = 1 – 0,6667 = 0,3333
Ho: p1 = p2
H1: p1 > p2
Luego se calcula z:
p1 p 2 0,7111 0,6333
zc 1,18
1 1 1 1
pq 0,6667 0,3333
n1 n2 90 120
p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625
Ho: p1 = p2
H1: p1 ≠ p2
1. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de
empleados de la primera empresa, que oyen música, y se midió su productividad. También se
tomó una muestra de empleados de la segunda empresa, que no oyen música, y se midió la
productividad empleando los mismos métodos que en la primera empresa.
En un problema como este, la hipótesis nula se podría expresar como, si μ1 es la
productividad media en la primera empresa y μ2 es la productividad media en la segunda
empresa:
(a) H1: μ1 = μ2 (b) H0: μ1 > μ2
(c) H0: μ1 - μ2 = 0 (d) H0: μ1 μ2
2. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de
empleados de la primera empresa, que oyen música, y se midió su productividad. También se
tomó una muestra de empleados de la segunda empresa, que no oyen música, y se midió la
productividad empleando los mismos métodos que en la primera empresa.
En un problema como este, la hipótesis alternativa se podría expresar como, si μ1 es la
productividad media en la primera empresa y μ2 es la productividad media en la segunda
empresa:
(a) H0: μ1 > μ2 (b) H1: μ1 - μ2 > 0
(c) H1: μ1 = μ2 (d) H1: μ1 μ2
3. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de
empleados de la primera empresa, que oyen música, y se midió su productividad. También se
tomó una muestra de empleados de la segunda empresa, que no oyen música, y se midió la
productividad empleando los mismos métodos que en la primera empresa.
En este problema, si las muestras son grandes y las varianzas poblacionales conocidas, se
emplea el siguiente estadístico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2
2
sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
4. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de
empleados de la primera empresa, que oyen música, y se midió su productividad. También se
tomó una muestra de empleados de la segunda empresa, que no oyen música, y se midió la
productividad empleando los mismos métodos que en la primera empresa.
En este problema, si las muestras son pequeñas y las varianzas poblacionales desconocidas, se
emplea el siguiente estadístico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2 2 sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
5. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tomó una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
Con base en estos datos se puede calcular el estadístico de prueba:
(a) z = 2,09 (b) z = 1,96
(c) t = 2,09 (d) Ninguna de las anteriores
6. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tomó una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
En este problema, el valor crítico o tabular para hacer la prueba es, al 5% de significancia:
(a) z = 2,09 (b) z = 1,645
(c) t = 1,96 (d) Ninguna de las anteriores
7. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tomó una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
8. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tomó una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente. Al realizar la prueba de hipótesis el gerente de la
primera empresa indica que "hay evidencia muestral suficiente para considerar que la música
sí tiene efecto positivo sobre la productividad", y el gerente de la segunda empresa expresa
que "la evidencia muestral señala que la diferencia entre las productividades medias entre las
dos empresas es significativa".
9. Considere la siguiente situación: El gerente de producción de una fábrica considera que los
operarios que realizan tareas repetitivas son más productivos cuando oyen música empleando
algún aparato con audífonos. El gerente de producción de otra empresa no cree que la música
genere ese efecto positivo. Para determinar quién tiene la razón se tomó una muestra de 10
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tomó una muestra de 15 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
10. Considere la siguiente situación: El gerente de producción de una fábrica considera que
los operarios que realizan tareas repetitivas son más productivos cuando oyen música
empleando algún aparato con audífonos. El gerente de producción de otra empresa no cree
que la música genere ese efecto positivo. Para determinar quién tiene la razón se tomó una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tomó una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la
11. Considere la siguiente situación: El gerente de producción de una fábrica considera que
los operarios que realizan tareas repetitivas son más productivos cuando oyen música
empleando algún aparato con audífonos. El gerente de producción de otra empresa no cree
que la música genere ese efecto positivo. Para determinar quién tiene la razón se tomó una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tomó una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estándar poblacionales son de 8 y 12 unidades por hora para la
primera y la segunda empresa, respectivamente.
En este problema, es correcto que, al 5% de significancia:
(a) Se acepta la hipótesis alternativa porque |tc| < |tt|
(b) Se acepta la hipótesis nula porque |tc| < |tt|
(c) Se rechaza la hipótesis nula porque |tc| < |tt|
(d) Ninguna de las anteriores
12. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
12 22
A. Se usa el estadístico z ( x1 x 2 )
n1 n2
B. Se usa el estadístico t si se puede suponer que las poblaciones son normales y que
σ1 = σ2 = σ.
13. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
(n 1) s12 (n2 1) s 22
A. Se calcula la varianza como 2 1
n1 n2 2
B. Los grados de libertad son gl = n1 + n2 – 2.
14. Este mes se ha estrenado una nueva película de dibujos animados en los cines del país. Se
desea saber si los adultos y los niños valoran de igual manera la película. Por lo tanto, se pidió
a una muestra de adultos evaluar la película en una escala de 0 a 10, donde 0 es el mínimo y
10 el máximo. Lo mismo se aplicó a una muestra de niños. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Niños 9 10 7 8 9 6 8 6 8
15. Este mes se ha estrenado una nueva película de dibujos animados en los cines del país. Se
desea saber si los adultos y los niños valoran de igual manera la película. Por lo tanto, se pidió
a una muestra de adultos evaluar la película en una escala de 0 a 10, donde 0 es el mínimo y
10 el máximo. Lo mismo se aplicó a una muestra de niños.
Adultos 8 5 6 4 5 6 7 3
Niños 9 10 7 8 9 6 8 6 8
16. Este mes se ha estrenado una nueva película de dibujos animados en los cines del país. Se
desea saber si los adultos y los niños valoran de igual manera la película. Por lo tanto, se pidió
a una muestra de adultos evaluar la película en una escala de 0 a 10, donde 0 es el mínimo y
10 el máximo. Lo mismo se aplicó a una muestra de niños. Los resultados obtenidos fueron:
Adultos 8 5 6 4 5 6 7 3
Niños 9 10 7 8 9 6 8 6 8
17. Este mes se ha estrenado una nueva película de dibujos animados en los cines del país. Se
desea saber si los adultos y los niños valoran de igual manera la película. Por lo tanto, se pidió
a una muestra de adultos evaluar la película en una escala de 0 a 10, donde 0 es el mínimo y
10 el máximo. Lo mismo se aplicó a una muestra de niños.
Adultos 8 5 6 4 5 6 7 3
Niños 9 10 7 8 9 6 8 6 8
18. Este mes se ha estrenado una nueva película de dibujos animados en los cines del país. Se
desea saber si los adultos y los niños valoran de igual manera la película. Por lo tanto, se pidió
a una muestra de adultos evaluar la película en una escala de 0 a 10, donde 0 es el mínimo y
10 el máximo. Lo mismo se aplicó a una muestra de niños.
Adultos 8 5 6 4 5 6 7 3
Niños 9 10 7 8 9 6 8 6 8
19. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
En este problema se puede plantear la hipótesis nula, donde μd es la media de las diferencias
entre los tiempos con y sin uso del celular:
(a) Ho: μd = 0 (b) Ho: μd 0
(c) H1: μd = 0 (d) Ninguna de las anteriores
20. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo.
Los resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
En este problema no se puede plantear la hipótesis alternativa del modo siguiente, donde μ d es
la media de las diferencias entre los tiempos con y sin uso del celular:
(a) H1: μd < 0 (b) H1: μd 0
(c) H1: μd > 0 (d) Ninguna de las anteriores
21. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo.
Los resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
22. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
23. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
24. Un instituto que trabaja en la investigación de riesgos analizó el tiempo que las personas
duran en cruzar una calle cuando hablan por teléfono celular o envían mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccionó una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo.
Los resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):
Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8
(a) No existe diferencia significativa entre los tiempos promedio de los peatones que cruzan la
calle usando el teléfono celular y los que no lo hacen.
(b) Los tiempos promedio de los peatones que cruzan la calle usando el teléfono celular y los
que no lo hacen son iguales.
(c) Los tiempos promedio de los peatones que cruzan la calle usando el teléfono celular son
menores que los tiempos de los que no lo hacen.
(d) Ninguna de las anteriores
25. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento.
¿Constituyen estos datos evidencia suficiente para considerar que los usuarios actuales tienen
mayor disposición para comprar el nuevo modelo?
En este problema, la hipótesis nula se puede plantear como:
(a) H1: P1 = P2 (b) H0: P1 > P2
(c) H0: P1 - P2 = 0 (d) H0: P1 P2
26. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento. ¿Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposición para comprar el nuevo modelo?
27. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento. ¿Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposición para comprar el nuevo modelo?
En este problema, si las muestras son grandes, se emplea el siguiente estadístico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2
2
sd n
n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2
28. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento. ¿Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposición para comprar el nuevo modelo?
En este problema se emplea el siguiente estadístico de prueba:
(a) z = 1,07 (b) z = 1,96
(c) z = 1,10 (d) Ninguna de las anteriores
29. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento. ¿Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposición para comprar el nuevo modelo?
En este problema el cálculo agrupado de p da por resultado:
(a) 0,25 (b) 0,2429
(c) 0,4857 (d) Ninguna de las anteriores
30. Un fabricante de teléfonos celulares líder en el mercado ha anunciado que pronto lanzará
un nuevo modelo de su principal producto. La empresa realizó un estudio en el que descubrió
que, en una muestra de 70 usuarios actuales de sus productos, que 20 comprarían el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 comprarían el nuevo modelo en la misma semana del
lanzamiento. ¿Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposición para comprar el nuevo modelo?
En este problema, al 1% de significancia, se puede concluir con respecto a la diferencia entre
la proporción de clientes actuales que comprarían el nuevo modelo y la proporción de los que
no son usuarios actuales que también comprarían el nuevo modelo que:
(a) Existe diferencia significativa entre ambas proporciones.
(b) Ambas proporciones son iguales.
(c) La evidencia muestral no indica que haya diferencia significativa.
(d) Ninguna de las anteriores
1. c 2. b 3. d 4. a 5. a
6. b 7. c 8. a 9. c 10. a
11. b 12. d 13. a 14. c 15. a
16. c 17. b 18. c 19. a 20. d
21. a 22. c 23. c 24. d 25. c
26. b 27. c 28. a 29. a 30. c
12 .
Solución En este caso el investigador analiza la relación entre las dos variables
mencionadas, número de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadística (variable x) y la nota que cada uno
de ellos obtiene en dicha prueba (variable y).
90
80
Calificación examen (Y) 70
60
50
40
30
20
10
0
0 5 10 15 20 25
Horas de estudio (X)
Solución:
350
250
200
150
100
50
0
0 500 1000 1500 2000 2500 3000
Ingreso familiar mensual
Ejemplo Construya el diagrama de dispersión, usando Excel y Minitab, para los datos
recopilados en el caso del investigador que analiza la relación entre el
número de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadística y la nota que cada uno de ellos obtiene en dicha
prueba.
100
80
60
40
20
0
0 5 10 15 20 25
X Y XY X2 Y2
1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50
Total
–
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000
X Y XY X 2
Y2
N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )
r = 0,885
–
revisión
Número Ingreso familiar mensual Gasto mensual en esparcimiento
de familia (X, en $) (Y, en $)
1 500 60
2 1200 100
3 1800 150
4 2500 300
5 750 50
6 800 30
7 900 80
8 1000 75
9 400 25
10 650 60
11 825 95
12 750 60
Solución:
Se construye la tabla de las sumatorias o totales de cada una de las
columnas:
X Y XY X2 Y2
1 500 60 30000 250000 3600
2 1200 100 120000 1440000 10000
3 1800 150 270000 3240000 22500
4 2500 300 750000 6250000 90000
5 750 50 37500 562500 2500
6 800 30 24000 640000 900
7 900 80 72000 810000 6400
8 1000 75 75000 1000000 5625
9 400 25 10000 160000 625
10 650 60 39000 422500 3600
11 825 95 78375 680625 9025
12 750 60 45000 562500 3600
Total 12075 1085 1550875 16018125 158375
X Y XY X2 Y2
N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )
r = 0,9509
=COEF.DE.CORREL(matriz1;matriz2)
=COEF.DE.CORREL(A2:A9;B2:B9)
Ejemplo Para el caso del investigador que desea analizar la relación entre el número
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadística y la nota que cada uno de ellos obtiene en dicha prueba.
¿Cuál sería el modelo que se podría plantear?
Solución En este caso el investigador analiza la relación entre las dos variables
mencionadas, número de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadística (variable x) y la nota que cada
uno de ellos obtiene en dicha prueba (variable y).
y = a + bx
Ejemplo Construya el modelo de regresión lineal para los datos recopilados en el caso
del investigador que analiza la relación entre el número de horas que un
grupo de estudiantes dedica a prepararse para un examen de estadística y la
nota que cada uno de ellos obtiene en dicha prueba.
Solución Las fórmulas de los coeficientes de la recta de regresión emplean los mismos
datos utilizados en el cálculo del coeficiente de correlación lineal, por lo que
se empleará la misma tabla que se construyó cuando se calculó r. Entonces
los datos disponibles son los siguientes:
X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000
X Y XY X2 Y2
N XY ( X )( Y )
b
N X 2 ( X ) 2
b = 2,41
a
Y b X
N N
480 108
a 2,41
8 8
a = 27,5
y = 27,5 + 2,41x
Solución:
Se construye la tabla:
X Y XY X2 Y2
1 500 60 30000 250000 3600
2 1200 100 120000 1440000 10000
3 1800 150 270000 3240000 22500
4 2500 300 750000 6250000 90000
5 750 50 37500 562500 2500
6 800 30 24000 640000 900
7 900 80 72000 810000 6400
8 1000 75 75000 1000000 5625
9 400 25 10000 160000 625
10 650 60 39000 422500 3600
11 825 95 78375 680625 9025
12 750 60 45000 562500 3600
Total 12075 1085 1550875 16018125 158375
X Y XY X 2
Y2
N XY ( X )( Y )
b
N X 2 ( X ) 2
b = 0,1187
a
Y b X
N N
1085 12075
a 0,1187
12 12
a = -29,03
y = -29,03 + 0,1187x
Ejemplo Construya, usando Excel y Minitab, el modelo de regresión lineal para los
datos recopilados en el caso del investigador que analiza la relación entre el
número de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadística y la nota que cada uno de ellos obtiene en dicha
prueba.
=INTERSECCION.EJE(conocido_y;conocido_x)
=INTERSECCION.EJE(B2:B9;A2:A9)
=PENDIENTE(conocido_y;conocido_x)
=PENDIENTE(B2:B9;A2:A9)
Ejemplo Para el caso del investigador que desea analizar la relación entre el número
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadística y la nota que cada uno de ellos obtiene en dicha prueba, y
para el cual se conoce que el coeficiente de correlación lineal de Pearson
es r = 0,885. Calcule e interprete el coeficiente de determinación R2.
R2 = r2 = (0,885)2 = 0,7832
Solución:
Dado que ya se conoce que el coeficiente de correlación lineal de Pearson
es r = 0,951, basta con elevar ese número al cuadrado para obtener el
coeficiente de determinación R2:
R2 = r2 = (0,951)2 = 0,9044
Ejemplo Para el caso del investigador que desea analizar la relación entre el número
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadística y la nota que cada uno de ellos obtiene en dicha prueba, en el
cual se había obtenido el modelo y = 27,5 + 2,41x, donde y es la nota en el
examen, y x es el número de horas de preparación para la prueba:
y = 27,5 + 2,41x
y = 27,5 + 2,41 * 13
y = 58,83
y = 27,5 + 2,41x
y = 27,5 + 2,41 * 25
y = 87,75
Solución:
a. Se sustituye el valor de X = 800 en la ecuación:
Y = -29,0 + 0,119X
Y = -29,0 + 0,119 ∙ 800
Y = 66,2
Y = -29,0 + 0,119X
Y = -29,0 + 0,119 ∙ 3000
Y = 328
2. Con relación a la determinación del grado de asociación estadística entre dos variables, un
investigador efectuó las siguientes dos afirmaciones:
3. Con relación a la determinación del grado de asociación estadística entre dos variables, un
investigador efectuó las siguientes dos afirmaciones:
A. Una fuerte relación entre dos variables implica que exista causalidad.
B. Una fuerte relación entre dos variables es condición necesaria de la existencia de
causalidad entre ellas.
4. Con relación a la determinación del grado de asociación estadística entre dos variables, un
investigador efectuó las siguientes dos afirmaciones:
5. Con relación a la determinación de la causalidad entre dos variables, sería falso que la
variable x causa a la variable y, si:
(a) El coeficiente de correlación entre x y y es cercano a –1.
(b) Las variaciones en x en un periodo podrían asociarse con las variaciones de y en el periodo
siguiente.
(c) Cambios de mayor magnitud en x no se asocian con cambios mayores en y.
(d) Existe teoría que respalda la relación causal entre x y y.
X 2
16. Si se correlacionan las tasas de interés de los préstamos con la cantidad de viviendas
vendidas por periodo, entonces se esperaría que el coeficiente de correlación entre estas dos
variables sea:
(a) Cercano a cero.
(b) Positivo y cercano a uno.
(c) Negativo.
(d) Ninguna de las anteriores.
18. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
19. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el número de casos de neumonía que se presentaron en un determinado
periodo:
X 86 88 93 91 90 87 88 90
Y 11 9 15 17 10 13 16 17
20. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el número de casos de neumonía que se presentaron en un determinado
periodo:
Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumonía 11 9 15 17 10 13 16 17
21. Al observar la gráfica, donde la línea corresponde a la recta de regresión obtenida por el
método de mínimos cuadrados, podría afirmarse que es falso que:
100
Y
90
80
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
22. Al observar la gráfica, donde la línea corresponde a la recta de regresión obtenida por el
método de mínimos cuadrados, la variable x es el número semanal de unidades producidas en
una fábrica y la variable y corresponde a los costos totales de producción, entonces es falso
que:
100
Y
90
80
70
60
50
40
30
20
10
0
0 2 4 6 8 10 12 14 16
24. Se ha establecido que la relación entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), está dada por Y = 4,3 + 1,5X, entonces
es verdadero que:
(a) Si la empresa no gasta en publicidad, entonces sus ventas serían de $1,5 millones.
(b) Si la empresa gasta $1 millón más en publicidad, se esperaría que sus ventas aumenten en
$4,3 millones.
(c) El coeficiente de correlación lineal entre el gasto en publicidad y las ventas de la empresa
es positivo.
(d) Ninguna de las anteriores.
25. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el número de casos de neumonía que se presentaron en un determinado
periodo:
Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumonía 11 9 15 17 10 13 16 17
26. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
29. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76
30. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:
X 14 18 11 20 23 14 17 19 15 16
Y 65 72 60 75 80 63 70 74 66 64
1. c 2. c 3. d 4. a 5. c
6. b 7. c 8. c 9. d 10. a
11. b 12. c 13. d 14. d 15. d
16. c 17. b 18. c 19. a 20. d
21. c 22. c 23. c 24. c 25. b
26. c 27. b 28. d 29. c 30. a