Documentos de Académico
Documentos de Profesional
Documentos de Cultura
General
Área de Estadística
Lima – Perú
2020
GUÍA DE LABORATORIO DE ESTADÍSTICA GENERAL
Derechos Reservados 2020
Área de Estadística
Décima Edición 2020
Diseño y Diagramación
Universidad Científica del Sur
Panamericana Sur km 19 - Lima 42
Lima-Perú 610-6400
2
Rector
Dr. Manuel Rossemberg
Presidente Ejecutivo
Luis Javier Cardó Soria
Vicerrectos Académico
José Agustín Ortiz Elías
3
CONTENIDO
UNIDAD 1
Capítulo 1: Conceptos 6
UNIDAD 2
UNIDAD 3
UNIDAD 4
4
Elaboración propia
5
CONCEPTOS ESTADÍSTICOS
Estadística. -
Es una ciencia que nos ofrece un conjunto de métodos y técnicas para: recolectar, clasificar,
procesar, presentar, analizar e interpretar un conjunto de datos, con la finalidad de conocer el
problema, obtener algunas conclusiones y finalmente tomar decisiones.
Es una herramienta fundamental para realizar investigación científica.
Estadística Descriptiva. -
Es un conjunto de métodos que nos permiten describir y resumir los datos observados mediante
gráficos o cuadros y realizando algunos cálculos de indicadores.
Estadística Inferencial. -
Es un conjunto de métodos que nos permiten hacer generalizaciones o inferencias acerca de una
población a partir de lo observado en una muestra.
Población. -
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o
satisfacen la o las características en estudio.
Por el número de elementos que la componen la población se clasifica en finita e infinita. La
población es finita si tiene un número determinado de elementos en caso contrario es infinita. En la
práctica una población finita con un gran número de elementos se considera como una población
infinita; por otro lado el tamaño de una población va a depender de objetivo trazado por el
investigador.
Muestra. -
Está constituida por una parte de los individuos o elementos que componen la población,
seleccionada de acuerdo a cierta técnica con el fin de obtener información acerca de la población, de
la cual proviene. La muestra debe ser seleccionada de manera que sea representativa, es decir tenga
características similares a las de su población.
Parámetro.-
Es una medida descriptiva que resume una característica de la población, es decir constituye el valor
real, verdadero; su cálculo implica utilizar toda la información contenida en la población; entre los
más conocidos tenemos:
La media poblacional ( μ )
La varianza poblacional ( σ2 )
La proporción poblacional ( ) etc.
Estadístico.- Es una medida que describe una característica de la muestra, se calcula a partir de los
datos observados en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos
parámetros; entre estos tenemos:
La media muestral ( X )
La varianza muestral ( S2 )
La proporción muestral ( p )
6
CLASIFICACIÓN DE LAS VARIABLES
VARIABLE CATEGORIAS
Color Azul, rojo, blanco, verde, negro, amarillo etc.
Estado Civil Soltero, casado, conviviente, viudo, divorciado.
Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc
Género Masculino, femenino
Calidad Buena, mala.
Morosidad No Moroso, moroso
Banco donde le depositan Interbank, Pichincha, Scotiabank
su sueldo:
VARIABLES ORDINALES. - Son aquellas en donde existe un orden preestablecido entre las
categorías de la variable.
Ejemplos:
VARIABLE CATEGORÏAS
Grado de Instrucción Primaria, Secundaria, Superior
Orden de Mérito Primero, Segundo, Tercero etc.
Nivel Socioeconómico Bajo, Medio, Alto etc.
También podemos considerar como variables ordinales por ejemplo grado de satisfacción de un
servicio (1 = Muy insatisfecho; 2 = Insatisfecho; 3 = Ni satisfecho ni insatisfecho; 4 =
Satisfecho; 5 = Muy satisfecho) o también el grado de depresión, etc.
b) VARIABLES CUANTITATIVAS
Son aquellas que se obtienen como resultado de mediciones o conteos; estas a su vez se
clasifican en:
VARIABLES DISCRETAS
Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden
asumir valores enteros positivos, incluido el cero. Ejemplos
Número de empresas, número de hospitales, número de trabajadores, número de comprobantes
de pago, número de máquinas, número de conservas etc.
VARIABLES CONTINUAS
7
Son aquellas cuyos valores se obtienen por medición, pueden asumir valores decimales.
Ejemplos:
Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.
a) ESCALA NOMINAL Se tiene una escala nominal si dos o más valores de una variable
sólo permiten percibir tas diferencias o semejanzas de las unidades estadísticas que se midan Tales
valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Ejemplo: Color de ojos, genero, Especialidad de los estudiantes.
b) ESCALA ORDINAL Cuando los datos pueden acomodarse en algún orden, las diferencias entre
los datos carecen de significado: A es más alto que B, pero no se puede restar A menos B.
Ejemplo: Grado de Instrucción, grado de satisfacción de los clientes.
d) ESCALA DE RAZON Se parece al nivel intervalo con la diferencia que si tiene un punto de
partida o cero inherente. Ejemplo: Peso, precio, Número de hijos
a) VARIABLE DEPENDIENTE
b) VARIABLE INDEPENDIENTE
- El costo de producción de un artículo, determina su precio de venta. En este caso las variables
son:
Costo de producción = X Precio de venta = Y
Podemos notar que el rol que asuma una determinada variable como dependiente o independiente en
una investigación, va a depender con qué variable se asocie.
EJERCICIOS PROPUESTOS
8
1. Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:
2. Clasificar cada una de las afirmaciones siguientes ya sea como inferencias o métodos
descriptivos.
a. El año pasado en la UCS el puntaje promedio del examen de admisión fue 85.
b. El Dr. García, un ecólogo, informó que en cierto río del oriente peruano, la carne de los
peces contienen un promedio de 300 unidades de mercurio.
c. La compañía “RM” predijo quién sería el ganador en una elección presidencial después de
conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que
hubo en total.
9
a. Tiempo de servicio de los empleados de una empresa.
b. Número de cheques girados por una empresa diariamente en un mes.
c. Número de acciones vendidas cada día en la Bolsa de Valores de Lima.
d. Lugar de nacimiento de las personas que viven en el distrito de Independencia.
e. Nivel de educación de los Limeños.
f. Temperatura y humedad diaria de los Olivos.
5. Cuatro estudiantes de la Universidad A gastan mensualmente s/. 500, s/. 410, s/. 418, s/. 404.
Cuatro estudiantes de la Universidad B gastan mensualmente s/. 410, s/. 395, s/. 380, s/. 387, Se llega
a las siguientes conclusiones.
a. El gasto promedio mensual de los cuatro estudiantes de la universidad A es de s/. 433 mientras que
el gasto promedio de los cuatro estudiantes de la universidad B es de 393
b. El gasto promedio mensual de todos los estudiantes de la Universidad A es mayor que el de todos
los estudiantes de la Universidad B
c. La diferencia entre los dos promedios es de 40
d. Si se selecciona a otro estudiante de la universidad A, probablemente gaste más que el gasto
promedio de los estudiantes de la Universidad B
¿Cuáles de las conclusiones provienen de la Estadística Descriptiva y cuáles de la Estadística
Inferencial?
6. Utilice los términos que aparecen en la siguiente tabla, para asociarlos a las definiciones que
aparecen a continuación:
10
PRESENTACIÓN DE DATOS
Luego de la recolección de información se debe clasificar u organizar los datos para realizar el
análisis y la interpretación de los resultados. Para facilitar este procedimiento se deberá agrupar la
información en categorías o clases.
Una forma sencilla de agrupar los datos es realizando tablas de distribución de frecuencias.
Presentación de tablas:
Todo gráfico debe presentar la siguiente
estructura:
1. Numeración
2. Título
3. Contenido
4. Fuente
11
TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS
Ejemplo:
El restaurante “Don Tito” busca evaluar el grado de satisfacción de sus clientes: donde B es
Bueno, R es Regular, D es Deficiente. Se tienen los resultados en el siguiente cuadro:
R R R R B B D D B R R
R R R D D R R B R R D
R R R R R R R R D D B
12
TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES
CUANTITATIVAS
a) Tabla de frecuencias para Datos No Agrupados.- Es apropiada para datos cuyos valores
distintos no son muy numerosos.
Ejemplo:
20 22 21 19 18 18 20 22 20 19 20 19
23 19 18 20 21 22 19 20 18 23 20 21
19 22 23 20 21 19 22 18 19 20 21 24
21 20 21 20 24 23 20 21 19 20 22 21
21 22
Solución:
En este caso notamos que la variable edad, apenas está tomando solamente siete
valores distintos que van desde 18 hasta 24
Variable: Xi
Frecuencias Absolutas: fi
Frecuencias Absolutas Acumuladas: Fi
Frecuencias Relativas: hi
Frecuencias Relativas Acumuladas: Hi
18 5 5 10.00 10.00
19 9 14 18.00 28.00
20 13 27 26.00 54.00
21 10 37 20.00 74.00
22 7 44 14.00 88.00
23 4 48 8.00 96.00
24 2 50 4.00 100.00
Total 50 100.00
Interpretación: Se observa que el 26% de los estudiantes tienen 20 años de edad mientras que solo
un 4% tienen 24 años. También podemos observar que el 54% de los estudiantes tiene una edad
máxima de 21 años.
13
f1=5
Interpretación: Hay 5 estudiantes de los 50 que tienen 18 años.
F4=37
Interpretación: Hay 37 estudiantes de los 50 que tienen como máximo 21 años.
h3%=26%
Interpretación: El 26% de los estudiantes tienen una edad de 20 años.
H2%=28%
Interpretación: El 28% de los estudiantes tienen como máximo 19 años
b) Tabla de frecuencias para Datos Agrupados.- Es apropiada cuando los valores distintos
que toma la variable es muy numeroso. Se siguen los siguientes pasos:
1) Calcular el rango de la variable: R = Valor máximo – Valor mínimo
2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive
3) Calcular la amplitud de los intervalos de clases: C
C= R cuyo cociente en lo posible deberá ser exacto, caso contrario deberá
K trabajarse con los llamados “excesos”
Ejemplo 1:
Como control de la ética publicitaria, se requiere que el rendimiento en millas/galón, de gasolina esté
basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una muestra de
50 automóviles se registraron las siguientes observaciones en millas por galón
35.6 27.9 29.3 31.8 22.5 34.2 32.7 26.5 26.4 31.0 31.6 28.0 33.7
32.0 28.5 27.5 29.8 34.2 31.2 28.7 30.0 28.7 33.2 30.5 27.9 31.2
29.5 28.7 23.0 30.1 30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3 32.7
30.3 33.5 30.5 30.6 35.1 28.6 30.1 30.3 29.6 31.4 32.4
Solución:
Rango: R
14
Si k=8 C = 13.1 = 1.6375 1.7
8
Rendimiento Xi fi Fi hi Hi
(millas/galón)
22.5 - 24.7 23.6 2 2 0.04 0.04
24.7 - 26.9 25.8 4 6 0.08 0.12
26.9 - 29.1 28.0 10 16 0.20 0.32
29.1 - 31.3 30.2 20 36 0.40 0.72
31.3 - 33.5 32.4 9 45 0.18 0.90
33.5 - 35.7 34.6 5 50 0.10 1.00
T O T A L 50 1.00
Se observa que el 60% de los automóviles tienen un rendimiento entre aproximadamente 27 y 31.3
millas por galón de gasolina.
Ejemplo 2
Los siguientes son los puntajes logrados en un examen de cierta asignatura por 50 estudiantes:
61 50 65 70 45 60 80 65 60 65 64 54 65
67 48 64 56 60 61 62 62 57 75 53 58 59
56 54 67 68 60 63 56 53 61 62 69 70 44
47 65 56 57 58 55 51 43 79 72 48
Solución
R = 80 – 43 = 37
Si k=6 C = 37 = 6.1666………… 7
6
Exceso E = (6 x 7) – 37 = 42 - 37 = 5
Si k=7 C = 37 = 5.2857……….. 6
7
15
Exceso E = (7 x 6) – 37 = 42 - 37 = 5
Si k=8 C = 37 = 4.625 5
8
Exceso E = (8 x 5) – 37 = 40 - 37 = 3
Puntaje Xi fi Fi hi Hi
42 – 46 44 3 3 0.06 0.06
47 – 51 49 5 8 0.1 0.16
52 – 56 54 9 17 0.18 0.34
57 – 61 59 12 29 0.24 0.58
62 – 66 64 11 40 0.22 0.8
67 – 71 69 6 46 0.12 0.92
72 – 76 74 2 48 0.04 0.96
77 - 81 79 2 50 0.04 1
Total 50 1
Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.
Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.
La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:
16
Gráfico de Barras Simples ( EXCEL )
Fuentes de Empleo
100 100
80 80
Porcentaje
Porcentaje
60 60
40 40
20 20
0 0
Fuentes de Empleo
18
EJERCICIOS PROPUESTOS
1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han
obtenido los siguientes datos:
1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,
0, 5, 4, 2.
2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música
rock. Se ha preguntado a 20 alumnos cual es su opinión acerca de estos acordes, según la escala: No
me gusta nada ( 1 ), Me gusta poco ( 2 ), Me es indiferente ( 3 ), Me gusta bastante ( 4 )
Me gusta muchísimo ( 5 ). Estos han opinado la siguiente manera (codificada):
5, 4, 1, 2, 2, 4, 2, 5, 3, 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3
Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:
a) ¿A qué porcentaje de alumnos les gusta poco estos acordes?
b) ¿A cuántos alumnos les gusta bastante los acordes?
c) ¿Cuál es la proporción de alumnos a los que les es indiferente los acordes?
d) ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?
e) ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?
3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han ido
a comprar en su almacén durante un período de dos semanas. Los datos que se registraron fueron:
5 3 3 1 4 4 5 6 4 2 6 6 1
1 14 1 2 4 4 5 6 3 5 3 6 8
4 7 6 5 9 11 3 12 4 7 14 1 1
10 8 9 2 12 5 7 6 4 5 6 5 6
4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:
7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0
30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0 41.5 13.5 12.0 9.2
42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5
19
18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0
12.0 8.3
a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de
clase.
b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.
c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.
5.- Los siguientes datos son calificaciones en la prueba de Miller de personalidad de 82 estudiantes.
22 22 20 27 30 23 29 21 26 31 21 23 25
29 18 22 31 30 28 16 28 33 25 23 31 23
18 24 26 25 17 22 25 28 19 24 20 23 26
21 31 25 24 33 29 20 27 21 25 28 24 23
25 30 27 23 26 22 24 17 33 26 24 19 18
33 25 28 31 29 27 28 24 26 24 22 26 24
18 21 29 22
6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en niños
en edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma una
muestra de 120 niños en edad escolar, obteniendo los siguientes resultados:
27.88 28.42 45.81 6.55 6.4 6.14 3.73 26.88 31.93 14.85 26.88 38.35
34.26 38.97 7.22 5.24 15.4 3.73 31.93 28.34 10.79 26.88 6.32 33.09
28.24 4.67 6.07 9.77 5.35 28.34 33.43 14.85 28.84 3.27 4.88 47
6.56 49.24 6.82 35.49 33.43 27.38 11.33 5.44 9.28 4.36 35.6 9.17
34.26 28.84 26.53 7.92 27.96 6.28 38.62 6.55 4.4 10.79 33.09 28.42
27.38 34.47 5.91 33.1 12.04 34.26 4.24 7.22 45.16 5.91 34.94 5.04
27.6 28.42 33.09 13.38 37.47 38.41 4.67 36.23 33.09 6.67 36.71 33.83
5.04 34.98 6.56 36.56 8.85 29.33 4.88 34.26 34.99 4.82 17.96 7.92
4.68 25.21 4.68 35 9.17 25.17 4.82 28.84 34.13 6.28 4.88 8.7
51.24 5.84 34.72 33.83 35.09 28.42 30.83 4.79 5.44 7.17 29.29 32.29
20
distribución de frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20 empleados ganan al
menos $150 pero menos de $180, 60 ganan menos de $210, 110 ganan menos de $240, 180 ganan
menos de $270 y el 10% restante de los empleados gana a los más $300, reconstruir la distribución.
8.- Los siguientes datos corresponde a una muestra de 20 clientes del Banco de Crédito de la ciudad
de Chimbote según sus inversiones mensuales en dólares en el programa Credifondo:
5500 4000 3000 3100 2000 3600 1000 3900 2500 3500
6000 4500 4800 3300 3400 3700 1500 3800 2900 3600
La información fue obtenida mediante una encuesta realizada por la empresa Aries S.A. en enero de
2004. Se pide
a) Identificar la unidad de análisis y la variable de estudio.
b) Construir una distribución de frecuencia. Utilice la regla de Sturges para determinar el número de
intervalos.
c)Interpretar f2, F2, h2%, H2%.
d)Determine qué porcentaje de clientes invierten mensualmente $4000 o más pero menos de $6000.
e) Determinar qué porcentaje de clientes invierten $3500 mensualmente.
9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y
caballeros además de una amplia gama de productos domésticos. A continuación, se presentan las
ventas netas observadas durante los años del 2002 al 2006. Represente gráficamente dicha
información.
21
12. Completar la siguiente tabla de frecuencias:
LI - LS fi Fi hi% Hi%
[ - 8.8[ 12.50%
[ - [ 5
[ - [ 25% 50%
[ - 12.4 [ 32
[ - [ 95.50%
[ - [
Total 40
80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8
88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3
Se pide:
a) Elaborar una distribución de frecuencias
b) ¿Cuántos empleados tiene pesos entre 45 y 60 kg?
c) ¿Qué porcentaje de empleados tienen pesos mayores a 75?5Kg?
d)La empresa promotora obsequia uniformes de trabajo a los empleados voluntarios. Suponiendo que
los pesos de los empleados voluntarios es menor igual a 80 kg. ¿Cuántos uniformes deben ser
devueltos?
14. La fábrica de chocolates “Glamour S.A.” produce una gran gama de chocolates. Desea
determinar si realmente el tipo de choconut es el que presenta el mayor porcentaje de defectuosos
con la finalidad de capacitar al personal en la elaboración de este producto. Para ello el gerente de
control de calidad les pregunta a los trabajadores su opinión acerca del tipo de chocolate que
presenta el mayor número de defectuosos. En la siguiente tabla se presentan las respuestas de los
trabajadores:
22
b) Indique e interprete el valor f1
c) Indique e interprete el h2%
16. Los tiempos de vida útil (en días) de un tipo de batería, se tabulo
en una distribución de frecuencias de 5 intervalos de igual amplitud
con frecuencias relativas acumuladas: 0.10, 0.25, 0.55, 0.80, 1.00.
Determine la distribución de frecuencias absolutas si la tercera
frecuencia absoluta es 11, si la segunda marca de clase es 6, y si el
límite inferior del cuarto intervalo es 12.
E B B R E M B E
B R R R M B B E
M E R R B B E R
R B B E R M E E
B E B B R M R E
23
MEDIDAS DE TENDENCIA CENTRAL,
MEDIDAS DE POSICIÓN,
MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y
CURTOSIS.
24
Medidas de Tendencia Central
Media Aritmética( X ): Es el promedio de los datos, y su objetivo principal es encontrar el valor que
debería estar al centro.
Datos No Agrupados: Se utiliza cuando hay datos sueltos y se halla la suma de dichos valores
dividida entre el número de valores, así como se expresa en la fórmula:
Media Aritmética: Datos no agrupados
X x i
(Muestral) µ x i
(Poblacional)
n N
Datos Agrupados: Se utiliza cuando agrupamos datos en una tabla de frecuencias por intervalos o
sin intervalos, se halla multiplicando la marca de clase por la frecuencia absoluta de cada categoría
(cuando se encuentran en intervalos de clase) y sin intervalos se multiplica el valor de la variable por
la frecuencia absoluta, después se debe sumar todos los resultados y dividirlos entre el número total
de datos, así como se expresa en la fórmula:
X
x fi i (Muestral) µ x f i i
(Poblacional)
n N
Mediana (Me): Es el valor central, el que limita al 50% de los datos, es decir, el valor que se
encuentra en la mitad de los datos.
Datos No Agrupados:
Primero ordenamos los datos de menor a mayor
Media Aritmética: Datos no agrupados
La mediana es la semisuma de los dos
La mediana es el término central. términos centrales.
n
Datos agrupados por frecuencias. La mediana es aquel valor que tenga una Fi
2
donde Fi es la frecuencia acumulada absoluta.
Datos agrupados por intervalos. Se utiliza la siguiente fórmula :
Moda (Mo): Es el valor más frecuente, el que se observa mayor número de veces.
Datos No Agrupados o agrupados por frecuencias: Después de ordenar los datos buscamos el valor
que más se repite.
Datos Agrupados con intervalos de clase:
En cuadros con intervalos de clase, se localiza la clase modal buscando la frecuencia más alta y
después se aplica la siguiente formula:
1 fmo famo
2 fmo fpmo
Ejercicios de Medidas de Tendencia Central
25
1.- Los salarios en una Empresa son en promedio S/. 380 semanales,
con posterioridad se incorpora a la Empresa un grupo de trabajadores
igual al 25 % de los que estaban anteriormente. El nuevo grupo
ingresa a la Empresa con un salario medio igual al 60 % de los
antiguos. Dos meses más tarde, la Empresa concede un aumento de
salarios de S/. 50. Hallar el salario promedio del total de
trabajadores.
Solución:
n1 : N º de trabajadores antiguos x1 : Salario promedio de antiguos
0.25n1 n2 : N º de trabajadores nuevos x2 : Salario promedio de los nuevos
X p Salario promedio de todos los trabajadores
2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de ventas
observados durante el año pasado aparecen en la siguiente tabla.
Solución:
Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un promedio
ponderado
Solución:
26
B 4 x 4.8
C 5 0.8x 6.0
n1 x1 n2 x 2
Ingreso percápita : X p $315 Ingreso total 315 n
n
x
x n1 x1 Ingreso total del Sector Público x1 0.18 (315 n) 56.7 n
1
x1 1
n1
.
luego x1
x 1
56.7 n
103.09 dólares ( Ingreso promedio del Sector Público )
n1 0.55n
6.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10 la
docena; $500 en latas que cuestan $12.5 la docena; otros $500 en latas que cuestan $20 la docena y
$500 en otras que cuestan $25 la docena.
a) Determinar el costo promedio por docena de las latas de aceite.
b) En promedio ¿Cuántas docenas de latas de aceite compró?
Solución:
27
500 10 50
500 12.5 40
500 20 25
500 25 20
Total = 2000 135
2000 dólares
X 14.8 dólares / docena
135 docenas
135
b) Pr omedio de docenas compradas : 33.75 docenas
4
28
Medidas de Posición No Central
El cuartil es el número que divide al conjunto de datos en 4 partes iguales, y se representa con la
letra Q. Entonces en un conjunto de datos existen tres cuartiles: Q1, Q2, y Q3, los que dividirán en
cuatro partes iguales a toda la muestra de datos.
La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:
Para un número de “n” observaciones en el que los datos no son representados en clases, una vez
ordenados los datos la posición de los cuartiles se pueden localizar de la siguiente forma.
k ( n 1)
k=1,2,3
4
Qk k=1,2,3
n: número de datos.
kn
El cuartil Qk es aquel valor que tenga una Fi donde Fi es la frecuencia acumulada
4
absoluta.
i=1,2,3
29
El Decil es el número que divide al conjunto de datos en 10 partes iguales, y se representa con la
letra D. Entonces en un conjunto de datos existen nueve deciles: D1, D2,….,D9, los que dividirán en
cuatro partes iguales a toda la muestra de datos.
La forma más sencilla de trabajar con deciles implica ordenar todos los datos (de menor a mayor), y
enseguida proceder a determinar:
Para un número de “n” observaciones en el que los datos no son representados en clases, una vez
ordenados los datos la posición de los deciles se pueden localizar de la siguiente forma.
k ( n 1)
k=1,2,3,….,9
10
Dk k=1,2,3,….,9
n: número de datos.
kn
El decil es aquel valor que tenga una Fi donde Fi es la frecuencia acumulada absoluta.
10
i=1,2,3,…9
El percentil es el número que divide al conjunto de datos en 100 partes iguales, y se representa con la
letra P. Entonces en un conjunto de datos existen noventa y nueve percentiles: P1, P2, P3,….,P99 los
que dividirán en cien partes iguales a toda la muestra de datos.
La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:
30
Segundo percentil (P2) que corresponde al 2% del total de datos.
Para un número de “n” observaciones en el que los datos no son representados en clases, una vez
ordenados los datos la posición de los percentiles se pueden localizar de la siguiente forma.
k (n 1)
k=1,2,3,….,99
100
Pk k=1,2,3,….,99
n: número de datos.
kn
El percentil Pk es aquel valor que tenga una Fi donde Fi es la frecuencia acumulada
100
absoluta.
i=1,2,3,…99
EJERCICIOS PROPUESTOS
31
1. Suponga que Juan obtiene 86 en la calificación de un examen de inglés. Si esta puntuación
corresponde al percentil 90, entonces 90% de los estudiantes obtuvieron una puntuación menor que
la de Juan y 10% de los estudiantes obtuvieron una puntuación mayor.
2. Sobre las equivalencias que se presentan a continuación, indique cuales son VERDADERAS y
cuáles son FALSAS. Marque con un aspa la opción correcta.
AFIRMACIONES V F
Q1=P25
El segundo cuartil es la mediana
El noveno decil es igual al percentil 9
D7 = P70
El tercer cuartil equivale al percentil 75
El segundo cuartil es menor que el percentil 48
El séptimo decil es menor que el tercer cuartil
El 80% central de los datos se encuentra comprendido entre el decil 2 y el
decil 6
El 90% central de los datos se encuentra comprendido entre el percentil 5 y
el percentil 95
Q3 = P3
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial
4. Los datos de la tabla muestran información sobre la variable X que representa el número de años
de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro.
Completar los datos que faltan en la siguiente tabla estadística:
Xi fi hi Fi
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 45
8
Total
A partir de los datos encuentre los valores de los siguientes cuantiles:
32
P20
Q3
5.Se realiza una estadística en la Institución Educativa “Fé y Alegría”, referente a la nota global de
cada uno de los estudiantes que van a acudir a los exámenes de selectividad. Las distribuciones de
frecuencias son las siguientes:
¿Calcule la edad máxima del 30% de las personas más jóvenes que trabajan desde sus hogares?
33
9.Se analizan los salarios en una de las áreas de una compañía y se obtiene información de 7 salarios
en nuevos soles: 850.000, 740.000, 1350.000, 5565.000,750.000, 650,000, 680.000.
Calcular el salario mínimo del 30% de los salarios más altos.
11.Se analizó el impuesto que se aplica, en diversos países de Asia, a la compra de instrumento de
Musical. Los resultados obtenidos fueron los siguientes:
12.La siguiente tabla, incompleta, muestra la distribución de los años de servicios del personal
de una empresa. La tabla tiene intervalos de igual amplitud.
Intervalos Punto medio fi Fi
3 8
20
50
90
24 - 110
120
Total 120
a) Complete la tabla de distribución de frecuencias.
b) Calcule el promedio y la mediana, ¿estaría usted en condiciones de afirmar que la distribución
de la variable es asimétrica positiva? Presente sus resultados.
c) Se ha decidido invitar al 30% de trabajadores (los más antiguos) al retiro voluntario con
incentivos. ¿Cuántos años de servicio como mínimo debe tener un trabajador para estar
comprendido en este grupo?
13.La siguiente distribución muestra las edades de los trabajadores de una empresa.
Edad N° de
trabajadores
18 – 23 8
23 – 28 15
28 – 33 20
33 – 38 25
38 – 43 18 34
43 – 48 8
48 - 53 6
Por política de la empresa, la gerencia decide despedir al 20% de trabajadores más jóvenes y el
30% de los trabajadores de mayor edad; después de esta reducción.
a) Encuentre los límites para ser despedido.
b) ¿Cuál es la edad mediana de los trabajadores de la empresa?
14.La distribución de las puntuaciones en una escala de hostilidad, de 160 sujetos de una muestra, ha
sido la siguiente:
Puntuación fi
0 - 10 10
10 – 20 22
20 – 30 32
30 – 40 44
40 – 50 28
50 – 60 20
60 – 70 4
a) ¿Entre que valores se encuentra el 50% central de los individuos?
b) Calcule el percentil 27.
c) ¿A partir de que puntuación se encuentra el 12% de los sujetos más hostiles?
d)Si descontamos el 25% de los individuos menos hostiles y el 15% de los más hostiles ¿En qué
intervalo de puntuación se encuentran los restantes?
[Ganancia) fi Hi%
0-4 20
Calcular: 4-8 50
b. ¿Cuánto ganan como 8-12 80 máximo el 15 % de las
empresas con 12-16 35 menores ganancias?
c. ¿Cuánto ganan como 16-20 15 mínimo el 20 % de las
empresas con Total mayores ganancias?
16.A continuación, se muestra las calificaciones de 120 estudiantes en un examen de Ingles del
BRITANICO.
Calificación N° de
estudiantes
35
30 - 40 3
40 – 50 3
50 – 60 10
60 – 70 22
70 – 80 43
80 – 90 32
90 – 100 7
Determinar:
a) La calificación más baja lograda por el 25% superior de la clase.
b) La calificación más alta lograda por el 10% inferior de la clase.
36
Medidas de Dispersión
Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de
datos. Si el valor es pequeño (respecto de la unidad de medida) entonces hay una gran uniformidad
entre los datos (homogénea).
Por el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es cero quiere
decir que todos los datos son iguales.
S2
( xi x) 2
n 1 2 (x
i )2
N
DATOS AGRUPADOS
S2
(x
i x) 2 . f i
n 1 2 (x i ) 2 . fi
N
Propiedades de la Varianza:
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
4. Var(𝑥 + 𝑏) = Var(𝑥). Si a todos los valores de la variable se les suma un mismo número, la
varianza no varía.
5. 𝑉𝑎𝑟(𝑎𝑥 + 𝑏) = a 2 𝑉𝑎𝑟(𝑥)
Si todos los valores de la variable se multiplican por un mismo número y luego se le suma otro
número, la varianza queda multiplicada por el cuadrado del número multiplicado.
6. Las unidades de medida de la varianza son las unidades al cuadrado de los datos.
DATOS NO AGRUPADOS
37
S2 S
2
DATOS AGRUPADOS
S
2
S
2
Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la
variable.
La desviación estándar o típica siempre es positiva porque la varianza también lo es.
La desviación estándar o típica es la medida de dispersión óptima, más exacta, más estable y más
utilizada, sirviendo de base para las medidas de asimetría, estadísticos típicas y correlación.
Rango o alcance: Es la medida de variabilidad más sencilla entre todas las mencionadas.
El rango de un conjunto de datos es la diferencia entre dato mayor y el dato menor:
R X max X min
Donde:
Xmax : Valor máximo observado de la variable.
Xmin: Valor mínimo observado de la variable.
Coeficiente de Variación: Es una medida relativa que se usa para comparar la variación en
diferentes conjuntos de datos que no vienen dadas en las mismas unidades o que las medias no son
iguales, el cual mide la magnitud de la desviación estándar en relación a la media aritmética,
expresada como porcentaje:
S
CV=
x
38
Ejercicios de Medidas de Dispersión
S S
C.V 0.6 C.V 0.55
X X 90
luego S 0.6 X
n1 70 n2 30
X 1 120 X 2 125
S1 6 S2 5
S
Hallaremos : C.V .
X
70 ( 120 ) 30 ( 125 )
n1 X 1 n2 X 2 = 121.5
en este caso X 70 30
n1 n2
X
2
Sabemos que : S2
X 2
n
n 1
X X X X
2
2 2 1 2
39
X
2
X X 8400
2
2 1 2
1 n1 70
X
1
S12 36 1
2
1010484
n1 1 69
X
2
X X 3750
2
2 2 2
2 n2 30
X
2
S 22 25 2
2 469475
n 2 29
1479959 12150
2
6.14
Por lo tan to C.V x 100% 5.05%
121.5
40
EJERCICIOS PROPUESTOS
1.La cadena de gimnasios Millenium Fit Spa ha evaluado el pago por concepto de membresía (en
dólares), de sus clientes de tres tipos: Estándar, Ejecutiva y Premium, encontrando la siguiente
información para una muestra de 200 clientes de cada tipo de membresía
41
Nro AFIRMACION VóF SUSTENTO
42
Medida Resultado Interpretación
Rango
Varianza
Desviación
Estándar
Coeficiente de
Variación
c) El Ministro ha señalado que dado que el gobierno plantea el incremento del salario de los
controladores aéreos en 4000 dólares al año, esto permitirá que los salarios sean más
homogéneos. Señale como afectaría este incremento a las medidas de dispersión (tanto
absolutas como relativas) de la variable en estudio.
3. De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los
siguientes datos:
Los varones de 17 años tienen un peso medio de 60.8 kg. con una desviación estándar de 6.69 kg.
Los varones de 10 años tienen un peso medio de 30.5 kg y una desviación estándar de 5.37 kg
A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los
17 años. Rpta. Efectivamente el peso es más variable a los 10 años.
43
Dpto. producción Dpto. ventas
Nº Nº
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
2.5 – 3 24 12 – 14 15
3 – 3.5 12 14 – 16 3
6.Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de 8.000
dólares al año. Pero en el país A la desviación típica es de 1.000 dólares y en el país B es de 4.000
dólares. ¿Qué podemos decir sobre la distribución de la riqueza de ambos países gracias a este dato?
7. Determinar la varianza del conjunto de observaciones x 1, x2, x3, x4, x5, a los cuales se les ha restado
4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.
8.La empresa Atención SAC, se preocupa por brindar un servicio adecuado a sus clientes y brinda
especial interés a los reclamos que presentan sus clientes, así como el tiempo que les toma atender
dichos reclamos. El servicio de atención a los clientes se brinda en dos turnos, mañana y tarde, por
dos grupos distintos de analistas. El jefe de calidad ha considerado importante analizar los resultados
de la atención en cada uno de estos turnos, a fin de determinar si existe variación, por lo que obtuvo
información del tiempo que demoró la atención a los clientes:
Turno Mañana
12 12 13 13 14 14 14 14 14 15
15 16 16 16 18 18 18 19 19 19
20 20 20 20 20 21 22 22 22 23
23 23 24 24 24 24 24 24 24 24
Turno Tarde
8 8 9 9 10 10 10 10 10 12
12 13 13 13 15 15 15 16 16 16
17 17 17 17 17 18 19 19 19 20
20 20 21 21 21 24 24 25 26 26
a) ¿En qué rango de tiempo se encuentra el tiempo de atención a los clientes en cada turno?
b) Calcule la varianza en los turnos mañana y tarde.
c)Calcule los coeficientes de Asimetría y Curtosis para ambos conjuntos de datos e interprete los
resultados.
44
ASIMETRÍA Y CURTOSIS
ASIMETRÍA
El coeficiente varía de -3 y 3
Si:
As<0 Distribución Asimetría negativa
As = 0 Distribución Simétrica
As>0 Distribución Asimetría positiva
45
c) Medida de Fisher
Datos sin agrupar:
Cálculo en el SPSS:
CURTOSIS
K<0 Platicurtica
K = 0 Mesocurtica
K>0 Leptocurtica
Cálculo en SPSS
46
EJERCICIOS PROPUESTOS
Grupo I 1 2 4 1
1=2 = 1.5
Grupo II 2 7 7 8 = 5.5
2=6
Calcule los índices de asimetría y curtosis para cada grupo de niños.
2 5 3 4 1 2 0 3 4 2
3.Se evalúo a una sección estudiantes que llevaron el curso de Estadística en el Ciclo Verano de una
Universidad Peruana. Determine la asimetría y curtosis que presentan los siguientes datos.
Notas fi
0–5 3
5 – 10 5
10 – 15 12
15 - 20 10
Total
2 1 3 3 4 5 7 2
47
Determine el tipo de distribución que presentan los datos.
6.Un grupo de jóvenes de la facultad de Ingeniería han sido encuestados en relación a su estatura.
Los datos se han procesado mediante el IBM SPSS. Los resultados se muestran en la tabla adjunta.
Calcule los coeficientes de asimetría de Pearson e indique si la distribución de estaturas es
simétrica o asimétrica.
ESTATURA DEL ENCUESTADO
Nº Validos 50
Perdidos 0
Media 1.633
Mediana 1.64
Moda 1.64
Desv. Tip. 0.627
Varianza 0.004
8. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de azufre en una
planta industrial: Construya una distribución de frecuencias y luego calcule los coeficientes de
asimetría y curtosis:
48
PROBABILIDADES
DISTRIBUCIONES:
BINOMIAL, POISSON,
NORMAL, MUESTRAL.
49
PROBABILIDADES
Conceptos básicos:
Experimento aleatorio: Es un proceso cuyo resultado no puede ser predicho de anterioridad con
seguridad.
Ejemplo:
a) lanzamiento de una moneda
b) lanzamiento de un dado
Ejemplo:
a) A= {obtener un número impar al lanzar un dado}
A= {1, 3, 5}
Notación de probabilidades:
P: denota una probabilidad.
A, B, y C. denotan eventos específicos.
P(A): denota la probabilidad de que ocurra el evento A.
Probabilidad de un evento
La probabilidad del evento A es el cociente entre el número de resultados favorable a la ocurrencia
del evento A y el número de resultados posibles.
Características
Sea un espacio muestral y sean A y B dos eventos cualesquiera de este:
P(Ω)=1 P(Փ)=0
0≤P(A)≤1
Si A y B son eventos no disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B) -
P(A∩B)
Si A y B son eventos disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B)
50
Ejercicios de probabilidades
6 4 4
11
2 24 6 2
P( B C ) P( B ) P( C ) P( B C )
10 45 3
2
P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )
= 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )
80
5
en donde P ( Aceptar ) 0.32 P ( Re chazar ) 1 0.32 0.68
100
5
51
4.- Suponga que en un sorteo la probabilidad de ganar el primer
premio es 2/5 y la de ganar el segundo premio es 3/8. Si la
probabilidad de ganar al menos uno de los dos premios es 3/4.
Calcular la probabilidad de ganar:
a) Sólo uno de los dos premios
b) Ninguno de los dos premios
Solución Sean los eventos:
2
A Ganar el primer premio P( A )
5
3
B Ganar el segundo premio P( B )
8
A B Ganar al menos uno de los dos premio P( A B ) 3 / 4
P ( A B ) P( A ) P ( B ) P( A B )
3 / 4 2 / 5 3 / 8 P( A B ) P( A B ) 1 / 40
15 1 14
40 40 40
15 14 29
Luego P ( A B ' B A' ) 0.725
40 40
52
4
3 4
P ( X 3) 0.033
10 120
3
6 4 6
2 1 60 3 20
P ( X 2 ) P ( X 3)
10 120 10 120
3 3
60 20
Luego P ( X 2 ) 0.6 67
12 0
PROBABILIDAD CONDICIONAL
Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos
(evento B) ya ocurrió, es decir se conoce su resultado.
P( A B )
P( A / B )
P( B )
53
A P(D’/A) = 0.92
P(A) = 0.40
D’
P(B)=0.35 P(D/B) = 0.09
B D
P(D’/B) = 0.91
P(C) = 0.25
D’
C P(D/C) = 0.10
D
P(D’/C) = 0.9
D’
a) Ahora hallaremos la probabilidad de obtener un artículo defectuoso
P ( D ) P ( A ) P ( D / A ) P ( B ) P ( D / B ) P (C ) P ( D / C )
P ( D ) (0.40 x 0.08 ) (0.35 x 0.09 ) (0.25 x 0.10 ) 0.0885
b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A, sabiendo
que el artículo seleccionado salió defectuoso.
P( A D ) P( A ) P( D / A ) 0.40 x 0.08
P( A / D ) 0.36
P( D) P( D ) 0.0885
Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99%
para descubrir la presencia o no de una enfermedad (resultado
positivo cuando realmente lo tiene o negativo cuando realmente no
lo tiene). Se aplica masivamente la prueba a una población en la cual
hay 1% de individuos con la enfermedad; se desea saber qué
porcentaje de los individuos con resultados positivos tendrán
efectivamente la enfermedad.
Solución: Sean los eventos
54
P { Re sultado sea posiivo }
E
Se pide hallar P
P
P P E P
Se sabe que : P 0.99 P E P 0.99 x 0.01 0.0099
E P E
P
P ( P/E ) = 0.99
E P ( P’/E ) = 0.01
P ( E ) = 0.01
P’
55
P
P ( E’) = 0.99 P ( P/E’ ) = 0.01
E’
P ( P’/E’) = 0.99
P’
Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la
enfermedad.
P (E P ) P (E ) P (P / E ) 0.01 x 0.99
P (E / P ) 0.50
P(P) P (P ) 0.0198
EVENTOS INDEPENDIENTES
Dos eventos A y B son independientes si la ocurrencia de uno no afecta la ocurrencia del otro
P ( A B ) P ( A) P ( B )
56
P ( A' B ' ) P ( A B )' 1 P ( A B )
1 ( 0.10 ) x ( 0.10 ) 1 0.01 0.99
OtroMétodo :
Esto implica que por lo menos uno de los dos artículos no tenga defectos
P ( A' B ) P ( A B ' ) P ( A' B ' )
( 0.09 ) ( 0.10 ) ( 0.10 x 0.90 ) ( 0.90 ) ( 0.90 ) 0.99
EJERCICIOS PROPUESTOS
57
2.- A continuación, se presenta una tabla en el cual se
Hábito de Rendimiento en
han clasificado a 100 alumnos según hábito de fumar y
fumar matemáticas Total
rendimiento en el curso de matemática:
Malo Bueno
De este grupo seleccionamos un estudiante al azar, se
pide contestar las preguntas:
a) Calcular la probabilidad de que tenga un Si 25 5 30
rendimiento malo en matemáticas dado de que fuma
cigarrillos. No 15 55 70
b) Calcular la probabilidad de que no fume cigarrillos Total 40 60 100
si se sabe que tiene un buen rendimiento en matemáticas.
4.- Se estima que el 30% de los habitantes de EEUU son obesos y que el 3% sufre de diabetes.
El 2% son obesos y sufren de diabetes. Calcular la probabilidad de que una persona elegida al azar.
a) Sea obesa o sufra de diabetes? Rpta. 0.31
b) Sea obesa pero no sufra de diabetes? Rpta 0.28
5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive
al menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es válida
solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con cáncer
seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años? Rpta. 0.182
7.- La distribución de los tipos de sangre en EEUU entre los individuos de raza blanca es
aproximadamente la siguiente: A: 40% B = 11% AB = 4% O = 45%
Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de
emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la
probabilidad de que sea del tipo A o del B? Rpta. 0.51
58
El 42% tiene al menos uno de los padres alcohólicos. ¿Cuál es la probabilidad de que elegido uno al
azar:
a) Tenga ambos padres alcohólicos. Rpta. 0.04
b) Tenga un padre alcohólico, pero no una madre alcohólica.
Rpta. 0.36
c) Tenga una madre alcohólica, si el padre no lo es. Rpta. 0.033
9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:
a) Un bachiller empleado
b) Empleado pero no bachiller
c) Desempleado o un bachiller
d) Desempleado o no bachiller
10.- El Sr. Conti, propietario de un restaurante, ha mejorado la infraestructura para una buena
presentación. Observa que el 25% de todos los autos que pasan por allí, se detienen para consumir
algún alimento.
a) ¿Cuál es la probabilidad de que los próximos cuatro carros se detengan?
b) ¿Cuál es la probabilidad de que el primer auto pare, que el segundo y tercero no lo hagan y el
cuarto pare?
14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera
prueba. De quienes pasaron el 80% estudiaron, el 20% de quienes no pasaron si estudiaron.
a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?
b) ¿Cuál es la probabilidad de que un estudiante pase, pero no estudie?
15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de
fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un 30%
de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de
0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la
probabilidad de que el proceso se encuentre bajo control?
59
16.- Una planta armadora recibe microcircuitos provenientes de tres
distintos fabricantes B1, B2 y B3. El 50% del total se compra a B1,
mientras que a B2 y B3 se les compra un 25% a cada uno.
El porcentaje de circuitos defectuosos para B1, B2 y B3 es 5, 10 y
12% respectivamente. Si un circuito está defectuoso, ¿cuál es la
probabilidad de que haya sido vendido por el proveedor B2?
17.- Se estima que la probabilidad de que una Cía. B tenga éxito al comercializar un producto es de
0.95 si su competidora la compañía A no interviene en el mercado; y es de 0.15 si la compañía A
interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0.7
a) ¿Cuál es la probabilidad de que la compañía B tenga éxito?. Rpta. 0.39
b) Si la Cía. B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el
mercado?. Rpta. 0.975
18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de
ganar el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del
segundo contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un
70% de probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0.10.
a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos?. Rpta. 0.36
b) ¿Cuál es la probabilidad que gane el segundo contrato?. Rpta. 0.46
21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son
respectivamente 0.4. 0.5 y 0.3. Cada televidente ve los programas independientemente uno del otro.
Si se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:
a) Dos de los tres programas. Rpta. 0.29
b) Al menos uno de los tres programas. Rpta. 0.79
22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0.1. Suponiendo la
independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después
de 14 días sin lluvia? Rpta. 0.023
60
desarrollo de soluciones de ingeniería aplicada, considera que la probabilidad de que los accidentes
en Transmisiones & Ejes hayan sido ocasionados por las conexiones eléctricas es 0,24, por falla
mecánica es 0,18 y por conexiones eléctricas o falla mecánica es 0,39. Si se selecciona al azar un
accidente producido en Transmisiones & Ejes y definiendo los eventos de interés:
E = {Accidentes por conexiones eléctricas}, M = {Accidentes por falla mecánica}
P ( E ) = 0,24 y P ( M ) = 0,18 P ( E M ) = 0,39
a)Determine la probabilidad que se haya producido por ambos tipos de falla.
b)¿Cuál es la probabilidad de que el accidente se haya producido por solo un tipo de falla?
24.-Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el
área de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborarlo se toma una muestra de 80 productos, encontrándose que 25 presentan defectos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un
producto al azar.
a)Determine la probabilidad de que se hayan producido ambos tipos de defectos.
b)¿Cuál es la probabilidad de que se haya producido solo uno de los tipos de defectos?
c)¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.
25.-Una caja contiene 24 resistencias con etiqueta negra y 24 con
etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el
resto de 8 ohmios; mientras que los de etiqueta roja doce son de 5
ohmios y el resto de 8 ohmios:
a)Si se selecciona una resistencia al azar de la caja, ¿cuál es la
probabilidad que la resistencia sea de 8 ohmios?
b)Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de
igual color.
c)Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5
ohmios y una de 8 ohmios?
26. En un estudio de 420 000 usuarios de teléfono celular de
Movistar, se encontró que 135 desarrollaron cáncer cerebral o del
sistema nervioso. Estime la probabilidad de que un usuario de
teléfono celular que se seleccionó al azar desarrolle un cáncer de
este tipo. ¿Qué sugiere el resultado acerca de los teléfonos celulares
como causantes de cáncer de este tipo?
27. En la fabricación de un cierto tipo de clavos, aparecen un cierto nº de ellos defectuosos. Se han
estudiado 200 lotes de 500 clavos cada uno obteniendo:
Clavos defectuosos 1 2 3 4 5 6 7 8
Nº de lotes 5 15 38 42 49 32 17 2
61
28.-Un profesor de Estadística sabe que el 80% de sus estudiantes
terminan los problemas asignados como tarea. Determinó, además,
que de los estudiantes que cumplen con la tarea, el 90% aprobará el
curso. De aquellos estudiantes que no terminan su tarea, el 60%
aprobará. Si un alumno recibió una calificación aprobatoria, ¿Cuál
es la probabilidad de que sí haya hecho sus tareas?
32. -En un laboratorio hay tres jaulas. En la jaula I hay 4 conejos negros y 2 blancos, la jaula II tiene
4 conejos negros y 4 blancos y la jaula III contiene 5 conejos negros y 6 blancos. Se selecciona al
azar una de las jaulas y se saca un conejo al azar de esa jaula. ¿Cuál es la probabilidad que el conejo
escogido sea blanco?
33.-El 70% del ganado es inyectado con una vacuna para combatir
una enfermedad grave. La probabilidad de recuperarse de la
enfermedad es 1 en 20 si no ha habido tratamiento y de 1 en 5 si
hubo tratamiento. Si un animal infectado se recupera, ¿Cuál es la
probabilidad de que haya recibido la vacuna preventiva?
34.-Una unidad de producción de enlatados de atún marca “Campomar” produce 9000 envases
diarios. La máquina A produce 3000 de estos envases, de los que 2% son defectuosos y la maquina B
produce el resto, se sabe que de la maquina B, el 4% son defectuosos. Calcular:
a) La probabilidad de que un envase elegido al azar este defectuoso.
b) La probabilidad de que proceda de la maquina B, si el envase tiene defectos.
c) La probabilidad de que proceda de la maquina A, si el envase tiene defectos.
62
35.- De 400 estudiantes de Ciencias de la Empresa, 100 cursan
Finanzas y 80 cursan Economía. Estas cifras incluyen 30 estudiantes
que cursan ambas materias.
a) ¿Cuál es la probabilidad de que un estudiante elegido
aleatoriamente curse Finanzas o Economía? b) ¿Qué probabilidad
hay de que al elegir un estudiante al azar curse Economía, dado que
cursa Finanzas?
DISTRIBUCIÓN DISCRETA
DISTRIBUCIÓN BINOMIAL
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los
siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.
2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente
llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos.
n
P X x p q x nx
x 0, 1, 2, 3,..........................., n
x
n n!
Donde :
x
x! ( n x)!
63
n: es el número de pruebas
k: es el número de éxitos
p: es la probabilidad de éxito
q: es la probabilidad de fracaso.
n
P X x p q x nx
x 0, 1, 2, 3,.................................n
x
20
P( X 0) (0.05) (0.95) 0.36
0 20
0
La probabilidad que no contenga artículos defectuosos es 36%
b) Ahora hallaremos el Nº promedio de artículos defectuosos por lote
E( X ) n p
E ( X ) 20 ( 0.05 ) 1
El número de artículos defectuosos por lote es 1.
Solución:
a) Exactamente dos compren una aspiradora
luego hallaremos P(X=2) en donde X: Número de mujeres que compran aspiradoras.
6
P( X 2 ) (0.2) 2 (0.8) 4 0.24576
2
Interpretación: La probabilidad de que entre 6 mujeres que admiten la demostración del vendedor y
que 2 compren la aspiradora es 24.58%.
64
P( X 1) P( X 1) P ( X 2 ) P( X 3 ) P ( X 4 ) P( X 5 ) P ( X 6 )
luego P ( X 1 ) 1 P ( X 0 ) en donde X : N º de mujeres que compran
6
P( X 0 )
0
(0.2) (0.8) 0.26214
0 6
Por lo tan to P ( X 1 ) 1 0.26214 0.738
Interpretación: La probabilidad de que entre 6 mujeres que admiten la demostración del vendedor y
al menos una compre la aspiradora es 73.8%.
Interpretación: La probabilidad de que entre 6 mujeres que admiten la demostración del vendedor y
que a lo más una no compre es 0.16%.
P ( X 2) 1 P ( X 0) P ( X 1)
5
P ( X 0) ( p ) (q )
0 5
en donde p : probabilidad que una persona esté apto para jubilarse
0
luego p 0.15 ( 0.8) 0.1 ( 0.2) 0.14
5
En con sec uencia P ( X 0) ( 0.14 ) ( 0.86) 0.4704
0 5
0
5
P ( X 1) ( 0.14) ( 0.86) 0.3829
1 4
1
Por lo tan to P ( X 2) 1 0.8533 0.1467
Interpretación: La probabilidad de 5 solicitudes para jubilarse al menos dos personas estén aptos
para jubilarse es 14.67%.
65
a) Sea X: Nº de multas impuestas
E( X ) = n p = 0.78 ( 620) = 483.6
La media es aproximadamente 484 multas las cuales serán pagadas
Solución:
a) Hallaremos P( X ≥ 4 )
n
en donde X: Nº de pacientes que se curan
P X x
x
p q
nx
x 0, 1, 2, 3,.................................n
x
P ( X 4 ) P( X 4 ) P ( X 5)
5
P( X 4 )
( 0.3 ) 4 ( 0.7 ) 1 0.02835
4
5
P (X 5)
( 0.3 ) ( 0.7 ) 0.00243
5 0
5
10
P( X 8)
( 0.5) 8
( 0.5) 2
0.043945
8
10
P( X 9)
(0.5) 9
(0.5)1
0.009765
9
10
P( X
10)
( 0.5) 10
(0.5) 0
0.000976
10
Interpretación: La probabilidad de que cinco enfermos se tratan con este medicamento y al menos
cuatro se curen es 3.08%
DISTRIBUCIÓN DE POISSON
66
Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos los
siguientes requisitos:
1. El experimento consiste en contar el número “x” de veces que ocurre un evento en particular
durante una unidad de tiempo dada, o en un área o volumen dado.
2. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la
misma para todas las unidades.
3. El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del
número de los que ocurren en otras unidades.
4. El número medio (o esperado) de eventos en cada unidad se denota por la letra griega(“mu” )
Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un
determinado espacio, volumen o tiempo.
X= 0, 1, 2, 3.4 ……………….
a) Hallaremos P (X = 2)
X: Nº de llamadas en una hora µ=3
e 3 3 2
Luego P(X 2) 0.224
2!
Interpretación: La probabilidad de recibir exactamente 2 llamadas en una hora es 22.4%.
67
P ( X 2 ) 1 {P ( X 0 ) P ( X 1)}
e 4.5 ( 4.5 )0
P (X 0) e 4.5
0!
e 4.5 ( 4.5 )1
P ( X 1) 4.5e 4.5
1!
Luego P ( X 2 ) 1 5.5e 4.5 1 0.0611 0.9389
Solución:
P ( X 3 ) P ( X 0 ) P ( X 1) P ( X 2 )
e 1 10
P (X 0) e 1
0!
e 111
P ( X 1) e 1
1!
1
e 112 e
P (X 2)
2! 2
Luego P ( X 3 ) 2.5 e 1 0.92
b) P ( X 1 ) 1 P ( X 0 ) 1 e 1 1 0.36788 0.63212
Solución:
68
Según la Distribución de Poisson
Donde:
µ= Promedio de bacterias en 1/3 de cc = 1
e 1 10
Luego P (X 0) e 1 0.368
0!
Interpretación: La probabilidad de que no contenga bacteria alguna una muestra de 1/3 de cc es
36.8%.
b) P ( X 1 ) 1 P ( X 0 )
X : N º de bacterias en una muestra de 2 cc
µ = Promedio de bacterias en 2 de cc = 6
e 6 60
P (X 0) e 6
0!
luego 1 e 6 0.9975
Interpretación: La probabilidad de que contenga por lo menos una bacteria una muestra de 2 cc es
99.75%.
Interpretación: El número esperado de niños que no han sido inmunizados en grupo de 10, 000
niños vacunados es 1.
b) P ( X 2 ) P ( X 0 ) P ( X 1 )
e 1 10
P (X 0) e 1
0!
e 111
P ( X 1) e 1
1!
Luego P ( X 2 ) 2 e 1 0.7358
Interpretación: La probabilidad de que menos de 2 niños no sean inmunes en un grupo de 10, 000
niños vacunados es 73.58%.
69
DISTRIBUCIÓN CONTINUA
DISTRIBUCIÓN NORMAL
Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria
continua. Es una de las más importantes ya que la mayoría de los trabajos de investigación están
basados en muestras aleatorias provenientes de poblaciones que se distribuyen normalmente.
•Tiene forma de campana y posee una sola cima en el centro de la distribución. La media aritmética,
la mediana y la moda son iguales, y se localizan en el centro de la distribución.
Estandarización
Si la variable aleatoria X tiene una distribución X∼N(µ, 𝜎) , entonces la variable aleatoria
x
z
Tiene distribución normal estándar.
Distribución Normal Estándar: Una variable aleatoria X tiene una distribución normal estándar,
Sus parámetros son µ=0 y 2 1 .
70
Ejemplo1.- Una máquina expendedora de refrescos se regula de
manera que descargue un promedio de 196 gr. por vaso. La cantidad
descargada tiene aproximadamente distribución normal con una
desviación estándar de 14 gramos.
a)¿Cuál es la probabilidad de obtener un vaso con más de 218.4
gramos?
Solución:
Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se distribuye
normalmente con µ = 196 gr y σ = 14 gr.
Hallaremos:
P ( X 218.4 )
X 218.4 196
Z Z 1.6
14
P ( Z 1.6 ) 0.0548
Interpretación: El 5.48% de los vasos tendrán una cantidad mayor de 218.4 gramos.
b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200
vendidos es probable que el líquido se derrame?
Solución:
224 196
P ( X 224 ) Z 2 luego P ( Z 2) 0.0228
14
E 200 ( 0.0228 ) 4.56
Solución:
X X 72
Z 1.28 X 83.5
9
Interpretación: La puntuación mínima que un estudiante debe tener para recibir una calificación
A es 83.5.
Ejemplo 3.- Una variable aleatoria tiene una distribución normal con σ = 21.5. Hallar su media si la
probabilidad de que la variable aleatoria tome un valor menor que 120.5 es de 0.8849
71
Solución:
Se sabe que P( X 120.5) 0.8849
X 120.5
Z 1.2 94.7
21.5
Interpretación: La media es 94.7 para que la variable aleatoria tome un valor menor que 120.5 y
su probabilidad sea 0.8849.
X 99.6 80
Z 1.96 10
55 80 98 80
Z1 2.5 Z2 1.8
10 10
P (2.5 Z 1.8 ) 0.4938 0.4641 0.9579 95.79 %
Interpretación: El porcentaje de alumnos examinados que obtuvieron un puntaje entre 55 y 98 es
95.79%.
72
a) Si el puntaje mínimo para aprobar es 90. ¿Cuál es el porcentaje de
no aprobados?
b) Si han aprobado el 80% de las personas. ¿Cuál es el puntaje
mínimo aprobatorio?
Solución:
a) Consideremos a X: Puntaje del coeficiente de inteligencia, la cual se distribuye normalmente
con µ = 105 y σ = 12
Hallaremos
P ( X 90 ) es tan darizando el valor de X mediante la fórmula :
X 90 1 05
Z Z 1.25
12
80%
X 105
0.84 X 94.92 o sea aproximadamente 95 puntos
12
Solución
73
47 70
0.08 0.58
0.08 47 0.58 70
57 49.79 86 49.79
Ahora Z1 0.21 Z2 1.04
34.85 34.85
EJERCICIOS PROPUESTOS
2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán
la enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente expuestos al agente
infeccioso. ¿Cuál es la probabilidad de que:
a) Exactamente 2 niños se enfermen. Rpta. 0.211
b) Por lo menos un niño se enferme. Rpta. 0.684
74
3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de 25
niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:
a) Menos de cinco. Rpta. 0.0905
b) Menos de 7 pero más de 4? Rpta. 0.2502
4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.8. Si se
sabe que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:
a) Que sobrevivan de 4 a 7.=4.24x10^-3
b) No sobrevivan exactamente 5.=0.1032
5.-
Se tiene información que en la comisaria de Chorrillos, el 25% de los detenidos se encuentran allí
por delitos menores. Se selecciona una muestra aleatoria de 24. ¿Cuál es la probabilidad de que el
número de detenidos por delitos menores en esa muestra sea 10? 0.0333
8.- La encargada de los préstamos del banco “INTERBANK” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.035. El
mes pasado realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados
oportunamente?
75
10.- “CAJA RURAL APU” informó que el 30% de los préstamos garantizados con joyería
vencieron. Si se toma una muestra aleatoria de 10 préstamos
a)¿Cuál es la probabilidad de que ninguno esté vencido?
b)¿Cuál es la probabilidad de que 2 estén vencidos?
11.- El 28% de los tornillos de la última producción para la empresa “MAESTRO” están
defectuosos. Determinar la probabilidad de que de 8 tornillos seleccionados aleatoriamente por lo
menos 3 estén defectuosos.
12.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores
empedernidos. Si su afirmación es correcta:
Encuentre la probabilidad de que de 10 de tales pacientes admitidos recientemente en un hospital,
menos de 3 sean fumadores empedernidos.
13.- Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de
cierto suero es de 0.001. Determinar la probabilidad de que de 200 personas:
a) Exactamente 3 sufran la reacción. Rpta. 0.0011
b) Dos o más sufran la reacción. Rpta. 0.0175
15.- En Caja Sullana se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo
que la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso de 50
minutos es de 20 clientes.
a)¿Cuál es la probabilidad de que se atiendan a 10 clientes en 25 minutos?
b)¿Cuál es la probabilidad de que se atiendan a 7 clientes en 10 minutos?
16.- En una investigación realizada en la calle Miramar, se ha determinado que el número de muertes
debido a accidentes de tránsito ha sido en promedio 10 por en dos meses. Suponiendo que el número
de muertes sigue una distribución de Poisson.
a)Hallar la probabilidad de que en un determinado mes mueran 3 personas.
b)Hallar la probabilidad de que en un determinado mes no mueran 4 personas.
17. En la oficina de ventas de “PARALELO” se analiza el número
de ventas al día, se tiene la información que tiene un promedio de
9,5 ventas al día. Suponiendo que los pedidos siguen una
distribución de Poisson.
a)¿Cuál es la probabilidad de que se realicen menos de 5 ventas en
un día determinado?
b)¿Cuál es la probabilidad de que se realicen al menos 3 ventas en
un día determinado?
c)¿Cuál es la probabilidad de que se realicen al menos 12 ventas en
un 4 días?
d)¿Cuál es la probabilidad de que se realicen 15 ventas en una
semana?
76
e) P ( - 0.84 < Z < 0.84 )
f) P ( -1.24 < Z < 1.63 )
g) P ( - 1 < Z < 2)
19.-Una población normal tiene una media de 20.0 y una desviación estándar de 4.0.
a)Calcule el valor de z asociado con 25.0.
b)¿Qué proporción de la población se encuentra entre 20.0 y 25.0?
c)¿Qué proporción de la población es menor que 18.0?
20.-Una población normal tiene una media de 12.2 y una desviación estándar de 2.5.
a)Calcule el valor de z asociado con 14.3.
b)¿Qué proporción de la población se encuentra entre 12.2 y 14.3?
c)¿Qué proporción de la población es menor que 10.0?
21- Supóngase que se sabe que los pesos de 300 individuos están distribuidos en forma normal con
media de 68 Kg y una desviación estándar de 11.5 Kg.
a) Cuál es la probabilidad de que una persona seleccionada al azar pese 70 Kg o menos?
b) Cuántas personas se espera encontrar que pesen 70 Kg o menos?
25.-Entre las ciudades de Estados Unidos con una población de más de 250 000 habitantes, la media
del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más largo pertenece a la
77
ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribución de
los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal y la
desviación estándar es de 7.5 minutos.
a)¿Qué porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos?
b)¿Qué porcentaje de viajes consumen entre 30 y 35 minutos?
c)¿Qué porcentaje de viajes consumen entre 30 y 40 minutos?
27.- Las notas de un examen del curso de bioestadística se distribuye normalmente con una media
de 13.5 y una desviación estándar de 4.3.
a) Cuál es el porcentaje de estudiantes cuyas notas están entre 11 y 15?
b) Cuál es la probabilidad de que un alumno elegido al azar no tenga una nota mayor de 10?
c) Determinar el valor de la nota debajo el cual se ubica el 15% inferior de los alumnos.
28.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están
distribuidos normalmente con una media de 66 y una varianza de 42.
a) Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre
mayor o igual a 71?
b) Cuántos niños presentan un nivel de glucosa en sangre menor o igual a 61?
c) Determinar la mediana y la moda de la distribución.
29.- Los puntajes del Coeficientes de Inteligencia tomados a un grupo de personas adultas, en un
proceso de selección de personal están distribuidos normalmente con una media de 105 y una
desviación estándar de 12.
a) Si el puntaje mínimo para aprobar es 90, ¿Cuál es el porcentaje de no aprobados?
b) Si han aprobado el 75% de las personas, ¿Cuál es el puntaje mínimo aprobatorio?
31.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado
se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10%
inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la
media y varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar,
cuál es la probabilidad de que su colesterol sea mayor a 250.
78
33.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0.9772 y P (X ≤ 6.5) = 0.8413.
Calcular:
a) µ y σ.
b) P (5.65 ≤ X ≤ 6.25 )
c) El número k tal que P (X > k ) = 0.3
35.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con
media de 12. Si el 95.44% de los examinados obtuvieron calificaciones entre 8 y 16.
a) Calcule la desviación estándar. Rpta. 2
b) Si la nota aprobatoria es 11. ¿Qué porcentaje de alumnos aprobaron el curso? Rpta. 69.15%
c) ¿Qué nota mínima deberá tener un alumno para estar ubicado en el quinto superior? Rpta. 13.7
36.-. El número promedio de personas que comen en un restaurante es aproximadamente normal, con
una media de 250 y una desviación estándar de 20 por día.
a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta. $1000
b) ¿Cuál es la probabilidad de que el consumo exceda a $1,100? Rpta. 0.1056
37.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una
media de 650 kg y una desviación estándar de 100 kg.
a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0.0668
b) ¿Qué cantidad del bien debe haber mensualmente a fin de satisfacer la demanda máxima en un
89?8 %? Rpta. 813. Kg
39.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE, decide
que la vida media con uso familiar normal es de 5.8 años, con desviación estándar de 2 años. Si la
vida de este modelo presenta distribución normal:
a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras
vendidas?
b) Si da una garantía de dos años ¿Qué porcentaje de las máquinas necesitarán reparación antes que
expire el período de garantía?
40.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación
estándar de 0.40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?
41.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media
de $400 y desviación estándar $50.
79
a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe pagar
el impuesto? Rpta. $464
b) Si el ahorro familiar está dado por la relación Y = X - 50
4
¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0.0228
43.- Si el 40% de los clientes de una estación de servicio utilizan tarjetas de crédito. ¿Cuál es la
probabilidad de que entre 400 clientes; más de 250 paguen en efectivo? Rpta. 0.142
80
DISTRIBUCIÓN MUESTRAL
Se denomina distribución muestral de una estadística a su distribución de probabilidad.
Por ejemplo, a la distribución de probabilidad de la estadística media x , se le denomina
distribución muestral de la media.
Para determinar la distribución muestral de un estadístico es necesario conocer:
a) La población y el parámetro.
b) Todas las muestras posibles y todos los valores posibles.
La distribución de la media muestral es la distribución de todos los valores que toma el estadístico
(media muestral), valores que se obtienen a partir de todas las posibles muestras de tamaño n
tomadas de la población.
A continuación, se presentan dos resultados importantes:
• Si la variable aleatoria X sigue una distribución Normal, la distribución de la variable aleatoria x
es Normal, es decir:
2
• Si X ~ N ( , 2 ) entonces X ~ N ( , ) Si la variable aleatoria X no sigue una distribución
n
Normal, entonces por el teorema del límite central, para n suficientemente grande (n > 30), la
distribución de la variable aleatoria x es aproximadamente Normal, es decir:
2
X N (, )
n
La media de la media muestral y la varianza de la media muestral se representa como X y
respectivamente, además:
X
2
2X
n
TEOREMA: Si la variable aleatoria X sigue una distribución N(μ, 2 ), la variable aleatoria:
x
z
n
sigue una distribución Normal Estándar, es decir: Z~N(0,1).
Donde:
x : media muestral
: media poblacional
: desviación estándar
n: tamaño de la muestra.
81
Sea X 1 , X 2 , X 3 ,…., X n una muestra aleatoria de tamaño n, con distribución Bernoulli con
parámetro π, donde: π : Proporción de éxitos en la población
la proporción de éxitos en la muestra (p), sigue una distribución Binomial. Entonces, la media y la
varianza de p se obtienen de la siguiente manera:
p
(1 )
2p
n
OBSERVACIÓN
Si n es suficientemente grande (n>30), entonces la variable aleatoria
p
z
(1 )
n
sigue una distribución Normal Estándar, es decir: Z~N(0,1).
Donde:
p: proporción muestral
: proporción poblacional
n: tamaño de la muestra.
EJERCICIOS PROPUESTOS
82
1. Un estudio reciente de un organismo de vigilancia ambiental
determinó que la cantidad de contaminantes en el río Rímac (en
partes por millón) tiene una distribución normal con media de 64
ppm y desviación estándar de 17.6. Suponga que se seleccionan al
azar y se toman muestras de 35 ríos. Encuentre la probabilidad de
que el promedio muestral de la cantidad de contaminantes sea:
a) Mayor que 72 ppm.
b) Entre 64 y 72 ppm.
c) Exactamente 64 ppm.
d) Mayor que 94 ppm.
2. La distribución de los ingresos anuales de todos los administrativos de una determinada institución
educativa y con cinco años de experiencia sigue una distribución normal, tiene una media de $19,000
y una desviación estándar de $2,000. Si extraemos una muestra aleatoria de 30 administrativos ¿cuál
es la probabilidad de que sus ganancias promedien más de $19,750 anualmente?
3. En una muestra de 25 observaciones a partir de una distribución normal con media 98.6 y
desviación estándar 17.2,
a) ¿Cuánto vale P(92 < x < 102)?
b) Encuentre la probabilidad correspondiente dada una muestra de 36.
4. Para una muestra de 19 observaciones de una distribución normal con media 18 y desviación
estándar 4.8, calcule
a) P(16 < x < 20).
b) P ( > 21)
c) Suponga un tamaño de muestra de 40. ¿Cuál es la nueva probabilidad en el inciso a)?
5. A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se
eligieron 64 artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la P(107.5 < x < 109)?
83
hogar tiene distribución normal con media desconocida y desviación estándar cercana a 1.25
libras. Si Luisa toma una muestra de 36 hogares y registra su consumo de café durante un año, ¿cuál
es la probabilidad de que la media de la muestra se aleje de la media de la población no más de
media libra?
10. Reportajes en periódicos nos dicen que el estadounidense promedio tiene sobrepeso. Muchos de
nosotros hemos tratado de bajar de peso cuando terminamos la preparatoria o la universidad. Y en
efecto, sólo 19% de adultos dicen que no sufren de problemas de pérdida de peso. Suponga que la
cifra de 19% es correcta y que se selecciona una muestra aleatoria de n= 100 adultos.
a. La distribución de p, es decir, la proporción muestral de adultos que no sufren de excesos de peso,
tiene una distribución normal aproximada ¿cuál es su media y desviación estándar?
b. ¿Cuál es la probabilidad de que la proporción muestral p exceda a 0.25?
13. De la historia sacada de los registros de la Universidad se ha determinado que las calificaciones
del curso de MATE1 y de FILO l se distribuyen normalmente con las medias respectivas 12 y 15 y
con varianzas homogéneas igual a 4. ¿Cuál es la probabilidad de que el promedio las notas de un
alumno en tales cursos esté, entre 14 y 17?.
14. La utilidad (en miles dc soles) por la venta de cierto artículo, es
una variable aleatoria con distribución normal. Se estima que en el
5% de las ventas las utilidades serían menos de 6.71, mientras que
el 1% de las ventas serían mayores que 14.66. Si se realizan 16
operaciones de ventas, ¿cuál es la probabilidad de que el promedio
de la utilidad por cada operación esté entre $10.000 y $11,000?.
84
15.Se estima que el 60% de los votos de los electores de la ciudad favorecen al candidato Sr. Tasilla
Ramírez. Si se selecciona una muestra aleatoria de 600 electores de la ciudad, ¿qué probabilidad hay
de que la proporción muestral de votos a favor del Sr. Tasilla Ramírez esté entre 47% y 55%?
17. Por datos obtenidos con anterioridad, se sabe que el 70% de las familias que tienen teléfono no se
encuentran en las horas de la tarde del día domingo. Se toma una muestra aleatoria de 36 familias del
directorio telefónico y se les llama. ¿Cuál es la probabilidad de que el 50% o más estén ausentes?
18. Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina. Se sabe
que el 10% de las unidades producidas son defectuosas. ¿Cuál es la probabilidad de que en la
muestra tomada, 16 o más artículos resulten defectuosos?
85
TAMAÑO DE LA MUESTRA Y
MUESTREO.REGRESIÓN Y
CORRELACIÓN LINEAL. CHI
CUADRADO
86
MUESTREO Y TAMAÑO DE LA MUESTRA
MUESTREO: Técnica estadística que permite seleccionar los elementos que se analizarán o
evaluarán de la población.
Se pueden realizar diferentes tipos de muestreo, que quedan clasificados en dos grandes grupos:
probabilísticos y no probabilísticos. En el muestreo probabilístico, todos los individuos o elementos
de la población tienen la misma probabilidad de ser incluidos en la muestra extraída, asegurándonos
la representatividad de la misma. En el muestreo no probabilístico, por su parte, los elementos de la
muestra se seleccionan siguiendo criterios determinados.
MUESTREO PROBABILISTICO
Muestreo aleatorio simple, cuando todos los elementos de la población tienen la misma
probabilidad de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de
muestreo es más recomendable, pero resulta mucho más difícil de llevarse a cabo y, por lo tanto, es
más costoso. Para seleccionar una muestra de este tipo se requiere tener en forma de lista todos los
elementos que integran la población investigada y utilizar tablas de números aleatorios.
Muestreo aleatorio sistemático, el cual es susceptible de ser más preciso que el muestreo aleatorio
simple. Se elige un primer elemento luego se van escogiendo los demás elementos a intervalos
constantes a partir del primero hasta completar el tamaño de la muestra.
Muestreo aleatorio estratificado, se usa para estimar parámetros de poblaciones muy heterogéneas,
consistes en la separación de las unidades de la población en grupos o clases, de tal manera que
respecto de la variable en estudio sea lo más heterogéneos posibles, pero que sean homogéneos en su
interior. Estos grupos se llaman estratos. De cada estrato se obtiene una muestra aleatoria simple.
Muestreo aleatorio conglomerado, no se necesita un marco muy específico como en el caso del
muestreo aleatorio simple en el que era necesario disponer de un listado de unidades de la población,
o como en el muestreo estratificado, donde era necesario disponer de listados de unidades por
estratos. Se divide previamente al muestreo la población en conglomerados o áreas convenientes, de
las cuales se selecciona un cierto número para la muestra, con lo que sólo es necesario un marco de
conglomerados que será más fácil de conseguir y más barato. Se pueden utilizar como marco
divisiones territoriales ya establecidas por necesidades administrativas para las cuales existe ya
información. También se pueden utilizar como marco áreas geográficas cuyas características están ya
muy delimitadas.
Tamaño de muestra(n)
Donde:
87
Precisión de estimación (e) corresponde al margen de error que el investigador fija de acuerdo con
el conocimiento que tenga caerá del parámetro que piensa estimar. Se le conoce como error de
muestreo.
El nivel de confianza (1-α) es la probabilidad de que la estimación efectuada se ajuste a la realidad;
es decir, que caiga dentro de un intervalo determinado basado en el estimador y que capte el valor
verdadero del parámetro a medir.
El nivel de significancia (α) es la probabilidad de que la estimación efectuada caiga fuera de un
intervalo determinado basado en el estimador y que capte el valor verdadero del parámetro a medir.
88
Ejercicios de tamaño de muestra
89
EJERCICIOS PROPUESTOS
3. Si una cadena de supermercados quisiera estimar el importe promedio de ventas en una escala de
± $100 con una confianza del 99% y si se supone que la desviación estándar de la población es
$200 ¿qué tamaño de muestra se necesita?
4. Si una compañía de gas quisiera estimar el tiempo de espera promedio en días, dentro de ±5 días
con una confianza del 95% y si se supone que la desviación estándar de la población es de 20 días
¿qué tamaño de muestra se necesita?
6. El gerente de un banco quiere tener una confianza del 90% de estar en lo correcto en una escala
de ± 0.05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de
cheques. ¿Qué tamaño de muestra se necesita?
8. Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual
curará cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la
muestra para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se
curan esté dentro de ± 0.04 de la proporción de todos los casos que el suero curará? Rpta. n = 637
90
10. Una firma constructora desea estimar la resistencia promedio de las barras de acero utilizadas en
la construcción de edificios de apartamentos. ¿Qué tamaño de muestra requiere para garantizar con
nivel de significancia del 2% de no sobrepasar un error de 5kg.? La desviación estándar de la
resistencia de este tipo de barras se estima en 25 kg.
Nº de unidades defectuosas 0 1 2 3 4 5 10 12
Nº de cajas examinadas 27 15 12 12 6 4 2 2
91
Regresión y Correlación Lineal
El coeficiente de correlación de Pearson Es un número que indica el grado de asociación entre dos
variables cuantitativas(numéricas) las variables y se define del siguiente modo:
r
n XY X Y
n X i
2
X n Y Y
2
i
2 2
Los valores que puede tomar el coeficiente de correlación "r" son: -1 ≤ r ≤ 1.
Si "r" > 0 La correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlación es tanto más fuerte cuanto más se aproxime a 1.
Si "r" < 0 La correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra).
La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.
Si "r" = 0 No existe correlación lineal entre las variables, aunque podría existir otro tipo de
correlación (parabólica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera próximo a 1 ó -1, tampoco esto quiere decir
obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este
resultado podría haberse debido al puro azar.
Diagrama de dispersión Se utiliza para graficar la relación entre dos variables X e Y, consiste en
una nube de puntos que indicará si existe o no correlación dependiendo de la tendencia de la
tendencia de los puntos.
Regresión Lineal El modelo de regresión lineal se usa para expresar la relación lineal que puede
existir entre los valores de una variable “Y” los valores de una variable “X”.
X: Variable independiente.
Y: Variable dependiente.
Modelo de regresión lineal simple Los modelos de regresión que relacionan valores x de una
variable independiente X con valores y de una variable dependiente Y, cuya forma es
Y 0 1 X
92
Ecuación de regresión lineal
La estimación de los valores 0 y 1 se realiza usando el método de mínimos cuadrados
y los valores obtenidos de la muestra ( x1 , y1 ),....., ( xn , yn )
ˆ0 y ˆ1 x
n n n
n xi y i xi y i
ˆ1 i 1 i 1 i 1
2
n
2 n
n xi xi
i 1 i 1
R2 r 2
93
Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como se
aprecia en el siguiente conjunto de datos:
Costo ($10): 30 70 140 270 530 1010 2500 5020
Tamaño del lote: 1 5 10 25 50 100 250 500
(100 unidades)
Solución
a) Diagrama de Dispersión
5000
4000
Costo ( 10 dólares ): Y
3000
2000
1000
a
X Y X X
i
2
i i i Yi
n X X 2 2
i i
94
n X i Yi X Y i i
b
X X
2 2
n i i
Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9.975
decenas de dólar o sea aproximadamente en 100 dólares.
4000
Costo ( Y )
3000
2000
1000
0
0 100 200 300 400 500
Tamaño del lote ( X )
95
Sy/x
Y 2
a Y b XY
n 2
Ejemplo 2.- Se llevó a cabo un experimento para estudiar el efecto de cierto medicamento para
disminuir la frecuencia cardíaca en adultos. La variable independiente es la dosis en miligramos
del medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja
después de la administración del medicamento y un control antes de administrarlo. Se reunieron
los siguientes datos:
96
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Calcule e interprete el coeficiente de determinación
Solución:
a) Diagrama de Dispersión
22
20
18
16
14
12
10
X Y X X
2
Yi n X i Yi X Y
i i
a
i i i i
b
n X X X X
2 2 2 2
i i n i i
Interpretación: Al aumentar la dosis del medicamento en 1 mg.la reducción de los latidos del
corazón, se incrementan en 4 lat/min aproximadamente; es decir por cada mg de la dosis, los
latidos del corazón se reducen en 4 aproximadamente.
c) Gráfica de la línea de regresión lineal
97
Gráfica de línea ajustada
Y = 7.055 + 4.088 X
22 S 1.35579
18
16
14
12
10
Es decir para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca
disminuya en 15 lat/min aproximadamente.
e) Cálculo del Error Estándar de Estimación: Sy/x
Sy/x
Y 2
a Y b XY
n 2
r
n XY X Y
f) Cálculo del Coeficiente de Correlación: r n X i
2
X n Y Y
2
i
2 2
13 ( 442.5 ) ( 26 ) ( 198 )
r 0.9507
13 ( 63.375 ) ( 26 ) 2 13 ( 3226 ) (198 ) 2
Interpretación: Existe una correlación lineal positiva entre la dosis del medicamento y la
reducción de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento entonces
la reducción de la frecuencia también aumentará.
g) Cálculo del Coeficiente de Determinación: r 2 = 0.904
98
1. Una muestra aleatoria de cinco familias da la siguiente información en relación al ingreso
familiar mensual y los gastos mensuales en gastos en seguros de salud.
Horas-hombre por mes de instrucción 200 500 450 800 900 150 300 600
Accidentes por millón de Horas- 7.0 6.4 5.2 4.0 3.1 8.0 6.5 4.4
hombre
99
4.- El Gerente de una Clínica dispone de la siguiente información:
6.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)
obteniendo el modelo de regresión:
Yˆ 20.61 2.83 X
a) Interprete la recta de regresión lineal
b) ¿Cómo cree Ud. que será el diagrama de dispersión?
7.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la
influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes
variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las
variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:
100
9.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,
obteniendo los siguientes datos.
Temperatura 10 28 12 31 30 19 24 15
Pedidos 21 65 19 72 75 36 67 24
11.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las
pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días.
La tabla que sigue resume los resultados del experimento.
Dosis diaria total Nº de pulsaciones
de efedrina (granos) por minuto
3 70
2 60
1 50
3 80
5 100
4 90
Nota. 1 grano = 0.06 gramos
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Estímese el número de pulsaciones para una dosis diaria de 4 granos de efedrina.
d) Calcule el error estándar de la estimación del modelo
e) Calcule e interprete el coeficiente de correlación.
f) Calcule e interprete el coeficiente de determinación
101
12.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de
mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces
contaminados.
13.- Se quiere determinar la relación entre la experiencia en ventas y el volumen de ventas para cada
vendedor basado en un grupo de 10 vendedores de una compañía de seguros. Los años de
experiencia en ventas y los volúmenes de ventas son:
102
14.- En una muestra de 8 pacientes se miden las cantidades antropométricas peso y edad
obteniéndose los siguientes resultados
Edad (años) 12 8 10 11 7 7 10 14
Peso (kg) 56 42 51 54 40 39 49 58
15.- Consideremos los siguientes datos respecto al precio de venta ($1,000) de una muestra de
viviendas y sus áreas (100 pies2) correspondientes a cada una de ellas, en cierta ciudad.
Precio de venta: 41 32 24 44 42 36 35 40 29 26
Área de la vivienda: 13 10 08 14 14 12 10 12 10 08
103
PRUEBA DE INDEPENDENCIA
Es una prueba de hipótesis que tiene por objeto probar si dos variables cualitativas nominales son
independientes entre sí.
Hipótesis:
Estadístico de prueba:
r c o eij 2
ni n j
ij
2
c ~ 2r 1 c 1 eij
i 1 j 1 eij n
Criterio de rechazo:
c2 2 , r 1 c 1
Conclusión:
Ejemplo 1.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.
DIAGNÓSTICO
Muerte por cáncer Muerte por otras Total
de pulmón causas
Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes con
α = 0.01
Solución
DIAGNÓSTICO
Muerte por cáncer de Muerte por otras causas Total
pulmón
Fumadores 348 301 3,152 3,500
3199
No 82 129 1,418 1,500
Fumadores 1371
Total 430 4,570 5,000
104
(348 301) 2 (3,152 3,199) 2 ( 82 129 ) 2 (1,418 1,371) 2
2 26.764
301 3,199 129 1,371
PRUEBA DE HOMOGENEIDAD
Es una prueba de hipótesis que tiene por objeto probar si los datos de cierta muestra provienen de la
misma población (igualdad).
Hipótesis:
Estadístico de prueba:
r c o eij 2
ni n j
ij
2
c ~ 2r 1 c 1 eij
i 1 j 1 eij n
Criterio de rechazo:
c2 2 , r 1 c 1
Conclusión:
Ejemplo 1.- El Director de compras de una fábrica grande debe decidir por la compra de una de las
cuatro marcas que hay en el mercado. Para probar si existe diferencia significativa en la calidad de
las máquinas, obtiene una muestra de la producción de 150 artículos para cada una de ellas y observa
el número de defectuosos. Los resultados se dan en la siguiente tabla:
M Á Q U I N A S
A B C D Total
Defectuosos 21 12 15 18 66
Buenos 129 138 135 132 534
Total 150 150 150 150 600
Solución
105
H 0 : p A p B pC p D ( La proporción de defectuosos son las mismas en cada una de las máquinas)
H 1 : Al menos en una de las máquinas la proporción de defectuosos no es la misma.
Nivel de significancia 0.05
M A Q U I N A S
CALIDAD A B C D Total
Defectuosos 21 16.5 12 16.5 15 16.5 18 16.5 66
Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534
Total 150 150 150 150 600
Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común.
En un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la
otra mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas en
la siguiente tabla:
REACCIONES
Mejorados Empeorados Efecto Nulo Total
Droga 52 10 20 82
Azúcar 44 12 26 82
Total 96 22 46 164
Solución
H 0 : La droga y las píldoras tienen igual efecto
H 1 : La droga y las píldoras no tienen igual efecto.
Nivel de significancia 0.05
REACCIONES
Mejorado Empeorados Efecto Nulo Total
s
Droga 52 48 10 11 20 23 82
Azúcar 44 48 12 11 26 23 82
Total 96 22 46 164
106
( 52 48 ) 2 (10 11 ) 2 ( 26 23 ) 2
2 .................................... 1.631
48 11 23
EJERCICIOS PROPUESTOS
¿Proporcionan los datos evidencia suficiente para indicar una dependencia entre el tipo de tumor y el
uso de anticonceptivos orales? Use α = 0.05 Rpta. Sí
2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su estado
de nutrición y el desempeño académico, obteniéndose los siguientes resultados:
Existe relación entre el desempeño académico y el estado de nutrición. Use α = 0.01 Rpta. Sí
3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si
existía alguna predilección entre las tres marcas competitivas (A, B y C) dependiendo de la región
geográfica en la que habita el consumidor. La información obtenida es la siguiente:
107
4.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y
Chiclayo respectivamente con la finalidad de determinar si la proporción verdadera de compradores
que se inclinan por el producto A en lugar del B, es la misma en las tres ciudades. Use α = 0.05
5.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:
Probar la hipótesis que las dos clasificaciones son independientes con α = 0.05
CAUSA EDAD
Menos de 30 30 - 50 Más de 50
Enfermedad 40 28 52
Otras 20 36 24
¿Está la edad relacionada con el ausentismo? Use α = 0.01
Contrastar la hipótesis de que el sexo no tiene relación con la preferencia hacia un determinado
modelo para un α = 0.01
8.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en
operaciones del molar mandibular y el porcentaje de casos satisfactorios (efectividad clínica de la
anestesia). Se tuvo la siguiente información:
108
Solución de procaína Casos satisfactorios Casos no satisfactorios
1.0 % 07 18
Más de 1.0 % 63 12
¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?.
10.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los tres
turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de cada
turno del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y según
su calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:
Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de
producción defectuosa.
109