Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPÍTULO I
CONCEPTOS BÁSICOS
Los estadísticos proporcionan una guía crucial para determinar qué información es fiable
y que predicciones son confiables. Ayudan a la búsqueda de pistas sobre la solución de
un misterio científico y, a veces a evitar que los investigadores sean engañados por
falsas impresiones.
División de la Estadística
Ejemplo 1
Se ha hecho estudio del medio de transporte que usan los estudiantes de la UMALM.
Para lo cual se tomó una muestra aleatoria de 350 estudiantes.
Bicicleta 40 11,4 00
Propia Público Privado Bicicleta
Total 350 100,0
Fuente: Elaboración propia Fuente: Elaboración propia
1
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 2
1. Todos los ganaderos del valle de Cajamarca.
2. Todos los futbolistas que participarán en el campeonato descentralizado de
fútbol 2018.
3. Todas las semanas de venta en una comercializadora de PC entre el 2010-2017.
Ejemplo 3
1. Un ganadero del valle de Cajamarca
2. Un futbolista que participará en el campeonato descentralizado de fútbol 2018.
3. Una semana de venta en una comercializadora de PC entre el 2010-2017.
Ejemplo 4
1. 420 ganaderos del valle de Cajamarca.
2. 380 futbolistas que participarán en el campeonato descentralizado de fútbol
2018.
3. 25 semanas de venta en una comercializadora de PC entre el 2010-2017.
2
UNA La Molina - Dpto. de Estadística e Informática Estadística General
4) Variable. Son las características que toman diferentes valores cuando son
evaluadas en las unidades elementales de una población o muestra. Se representan
por las últimas letras mayúsculas del alfabeto, por ejemplo: X, Y, Z, W, P, T, X1, X2,
Y1, etc.
Tipos de Variables
Pueden ser de dos tipos: Cuantitativas y Cualitativas.
Variable Cuantitativa Continua. Son aquellas que pueden tomar cualquier valor
numérico dentro de un intervalo continuo. Se utiliza un instrumento de medición
para generar sus valores: balanza, termómetros, test, escalas, cronómetros,
winchas, etc.
Ejemplo 5
1. Costo de inventario (soles)
2. Longitud del langostino de río (cm)
3. Tiempo para atender un pedido en una pizzería (minutos)
Ejemplo 6
1. Número de pacientes atendidos cada 15 minutos en el área ambulatoria
2. Número de predios que posee un agricultor de un valle
3. Número de quejas de los clientes de una aseguradora
Variable Cualitativa. Son aquellas que permiten que una unidad elemental pueda ser
clasificada como poseedora o no de cierta cualidad, propiedad o atributo. No tiene
sentido realizar operaciones matemáticas con ellas. Son aquellas cuyos valores posibles
son atributos o categorías. Pueden ser: Nominal o Jerárquica.
3
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 7
1. Sexo de los estudiantes (Masculino o Femenino)
2. Estado civil de una persona (Soltero, Casado, Divorciado, Viudo o Conviviente)
3. Las zonas de las sucursales de un banco (Sur, Centro o Norte)
4. Los estados del agua (Sólido, Líquido o Gaseoso)
Ejemplo 8
1. Calificación del servicio del comedor de la UNALM (Bueno, Regular o Malo)
2. Nivel de instrucción (Sin instrucción, Primaria, Secundaria o Superior)
3. Nivel socioeconómico de un cliente (Alto, Medio o Bajo)
4. Rango de ingreso familiar (500 - 2500, 2501 – 5000, 5001 – 7500, Más de 7500)
5) Observación. Es el valor posible que toma una variable. A las observaciones se les
suele representar con las letras minúsculas subindicadas, como por ejemplo x i , yi
, zi
Ejemplo 9
Encuesta de satisfacción
1. Edad
2. ¿Qué tipo de socio es?
1=Principal 2=Asociado 3=Condicionado
3. ¿Cómo encuentra el estado de los campos deportivos?
1=Muy bueno 2=Bueno 3=Regular 4=Malo
4. ¿Con qué frecuencia encuentra libre los campos deportivos?
1=Siempre 2=Casi siempre 3=Raramente 4=Nunca
5. Número de veces que viene al club mensualmente
6. Pago mensual (S/.)
4
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 4. Con la finalidad de establecer una línea base, para evaluar un programa
productivo a los agricultores de la sierra central, se ha aplicado la siguiente encuesta.
Ejemplo 10
1. Suponga que el número promedio de cocinas vendidas en todos los meses de venta
es 15.4 ( = 15.4).
2. El Censo Nacional 2007: XI de Población y VI de Vivienda indica que en el grupo
edad de 20 a 29 años, el 1.4% de los hombres no sabe leer y escribir mientras que
el 3.1% de las mujeres no sabe leer y escribir (1 = 0.014 y 2 = 0.031).
5
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 11
4. En una muestra de 30 meses de venta se encontró que el número promedio de
cocinas vendidas fue de 14.9 ( x 14.9) .
2. En la encuesta nacional de hogares (ENAHO) indica que el 1.1% de los hombres no
sabe leer y ni escribir ( p 0.011) .
2. Suponga que en distrito de Breña se ha seleccionado una muestra de 500 personas
encontrándose los siguientes resultados:
Ejemplo 12
En el siguiente ejercicio, identificar: la población, la muestra, unidad elemental, la
variable, tipo de variable, observación, parámetro y valor del estadístico.
La Oficina de Servicios Generales de la UNALM desea conocer los medios en los cuales
con mayor frecuencia se transportan los alumnos de la UNALM. Para ello, realiza una
encuesta a 50 alumnos de pregrado en el semestre 2013-II y encuentra los siguientes
resultados:
a) El 70% de los encuestados usa el transporte público y un 20% usa el transporte de
la universidad y el resto propio.
b) El 20% de los encuestados consideran que el estado de las unidades de transporte
de la UNALM es bueno, el 35% que es regular y el 45% que es malo.
c) El número promedio de unidades que toma para llegar a la universidad es de 1.5.
d) El tiempo promedio de traslado de su casa a la universidad es de 39.70 minutos.
Solución
Población:
Todos los alumnos de la UNALM La Molina de pregrado del semestre 2013-II
Unidad elemental:
Cada alumno de la UNALM La Molina de pregrado del semestre 2013-II
Muestra:
50 alumnos de la UNALM La Molina de pregrado del semestre 2013-II
6
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Valor del
Tipo de
Variable Observación Estadístico Parámetro
Variable
(estimación)
a) X= Medio de transporte Cualitativa x22 público p p 0.70 La proporción de
usado para llegar a la nominal alumnos según el
UNALM. pu 0.20 medio de transporte
po 0.10 usado para llegar a
la UNALM.
Ejemplo 13
Se presentaron algunos resultados del informe gerencial de marketing “Perfil del adulto
joven” elaborado por Apoyo Opinión y Mercado. (www.apoyo.com). El informe fue
elaborado a partir de los resultados de una encuesta realizada el 25 Abril del 2010 a
una muestra aleatoria conformada por 2000 jóvenes de Lima Metropolitana de todos los
niveles socioeconómicos y cuyas edades fluctúan entre los 21 y 35 años de edad.
El ingreso medio mensual es de 1320 nuevos soles.
El 5% tiene estudios de postgrado, el 17% universitaria completa, el 33%
universitaria incompleta, el 35% secundaria completa y el resto secundaria
incompleta.
El 42% de jóvenes trabaja en empresas estatales.
Solución
Población.
Todos los jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas
edades fluctúan entre los 21 y 35 años.
Muestra.
2000 jóvenes de Lima Metropolitana de todos los niveles socioeconómicos y cuyas
edades fluctúan entre los 21 y 35 años.
Unidad Elemental.
Un joven de Lima Metropolitana de cualquier nivel socioeconómicos y cuya edad fluctúa
entre los 21 y 35 años.
Valores estadísticos
El ingreso medio mensual es de 1320 nuevos soles.
El 17% universitaria completa
El 42% de jóvenes trabaja en empresas estatales.
Parámetros
El ingreso promedio mensual
Porcentaje de jóvenes que tienen cierto grado de instrucción.
Porcentaje de jóvenes que trabajan en cierto tipo de empresa.
Ejemplo 14
Con la finalidad de efectuar mejoras con los servicios al turista, se seleccionaron 200
turistas franceses al azar que arribaron a nuestro país el 2013 y se les aplicó una
encuesta en la que se preguntó por:
Solución:
Población:
Todos los turistas franceses que arribaron a nuestro país el 2013
Muestra:
200 turistas franceses que arribaron a nuestro país el 2013
Unidad elemental:
Un turista francés que arribó a nuestro país el 2013
Valor estadístico:
Número promedio de días de permanencia en el país ( x 8 días )
Porcentaje del medio de transporte para trasladarse en avión ( p 20.0%)
Monto gastado promedio durante el tiempo de estadía ( x S / .4560.6)
Porcentaje que opinaron sobre el servicio de alimentación excelente ( p 30.0%)
Parámetros:
Número promedio de días de permanencia en el país
Porcentaje del medio de transporte para trasladarse
Monto gastado promedio durante el tiempo de estadía
Porcentaje que opinaron sobre el servicio de alimentación
Ejercicio 5. La Dirección de Salud (DISA) de una zona rural desea realizar un estudio
para evaluar la calidad de servicio de las postas de salud. Con esta finalidad se extrae
aleatoriamente 45 postas de la DISA con lo cual se obtiene la siguiente información:
El 45% de las postas de salud registraron como enfermedad principal las
respiratorias, 35% estomacales y el resto de la piel.
El número promedio de niños menores de 6 años atendidos fue de 120.5
Sólo el 25% de las postas tienen como turno de atención mañana y tarde.
8
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 6. Una empresa distribuidora desea evaluar su eficiencia para atender los
pedidos de sus clientes. Selecciona aleatoriamente 30 pedidos realizados en el 2013 y
registra los siguientes datos: Tiempo que se tarda para atender el pedido, nivel de
satisfacción del cliente (Completamente satisfecho, satisfecho, poco satisfecho, nada
satisfecho) y el distrito en el que se encuentra el cliente. Algunos resultados fueron: El
tiempo promedio de atención es de 52 minutos, el 40% está completamente satisfecho
y el 30% de los pedidos son del distrito de Ate.
Identificar la población, unidad elemental, muestra, variables, tipos de variables,
observación, parámetros y valor estadístico.
9
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
1. Indique el tipo de variable que sea la más apropiada para cada una de las siguientes
variables:
Edad
Tamaño de bebida (pequeño, mediano, grande)
Ventas anuales
Número de camiseta de un jugador
Placa del automóvil.
Número de DNI
Forma de pago ( efectivo, cheque, tarjeta de crédito)
Tipo de medalla( Oro, Plata, Bronce)
Puesto de llegada en una competencia.
Número de celular.
Número de personas a favor del aborto.
Número de hermanos.
10
UNA La Molina - Dpto. de Estadística e Informática Estadística General
11
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
1. Las medidas estadísticas calculadas con los datos de una población se llaman
___________________ y las calculadas con los datos de una muestra
___________________________.
2. La parte de la estadística que permite la estimación y prueba de hipótesis de los
parámetros se llama ____________________ y el cálculo de medidas estadística se
denomina ___________________.
3. El valor posible que toma una variable de denomina _____________________.
4. Una ONG que brinda asistencia técnica a productores de truchas en el valle de
Huancayo ha aplicado una encuesta para establecer una línea de base en tres zonas
(A, B y C). Los resultados obtenidos indicaron que la edad promedio de los
productores es de 35.8 años; el peso promedio de las truchas en la zona A, B y C
son 1.2, 1.8 y 1.6 kgrs. respectivamente. Entonces las variables son
_______________________________________________________________.
5. Si el ganadero Juan Pérez, desea registrar el número diario de litros de leche
producidas, entonces la unidad elemental es ____________________.
6. Si se han definido cuatro rangos de las edades de una muestra de 100 agricultores:
de 18 a 25, de 26 a 40, de 41 a 60 y de 61 a más años, entonces la variable rango
de edades es del tipo ______________________________________.
7. Para un estudio sobre la contaminación de un reservorio de agua, se extraen 400
muestras de dos litros de agua y se halló que el número promedio de bacterias fue
de 10.5. Entonces:
Población: __________________________________________.
Unidad elemental: ____________________________________.
Variable: ___________________________________________.
8. En la ENAHO (Encuesta Nacional de Hogares) del 2011, respecto al material
predominante en las viviendas, el 65% es de material noble, el 20% de calamina, el
10% de esteras y 5% otros. La variable en estudio es de tipo _________________.
9. Si un establecimiento de salud del MINSA registra trimestralmente el número de
niños atendidos menores a 5 años, entonces la unidad elemental es __________ y
la variable es del tipo _______________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
12
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO II
ORGANIZACIÓN DE DATOS
Tabla de frecuencias
Donde:
k= Número de clases
n= Número de observaciones o unidades elementales
p
i 1
i 100%
Tipo de gráficos
Se pueden usar las frecuencias absolutas (fi), relativas (fri) o porcentuales (pi) para
elaborar dos tipos de gráficos:
13
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 1
Se hizo una encuesta a una muestra de 45 clientes del Banco Comercial y se obtuvo los
siguientes resultados:
Tarjeta
Ingreso Nº de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crédito tarjeta de crédito
(miles de S/.) (mensual) (miles de S/.)
usada
1 29 3.00 3 Ta1 centros comerciales 1.80 F
2 34 1.99 3 Ta2 discotecas 1.10 F
3 61 2.90 2 Ta3 restaurantes 0.60 M
4 28 4.70 0 Ta2 grifos 2.70 M
5 41 3.00 1 Ta4 centros comerciales 1.30 F
6 57 5.80 2 Ta1 otros 0.80 F
7 30 4.50 4 Ta4 grifos 0.64 M
8 43 7.09 0 Ta3 centro de estudios 0.90 F
9 45 4.40 1 Ta5 centros comerciales 1.40 M
10 35 6.82 0 Ta2 grifos 2.46 F
11 42 5.30 3 Ta1 restaurantes 1.10 F
12 28 5.80 2 Ta4 discotecas 0.20 M
13 28 5.70 1 Ta2 grifos 0.80 F
14 24 4.70 4 Ta4 restaurantes 0.50 M
15 35 6.60 1 Ta5 discotecas 0.40 F
16 42 6.60 2 Ta4 restaurantes 3.46 F
17 48 5.74 1 Ta1 discotecas 1.20 M
18 34 4.23 0 Ta5 centros comerciales 1.90 F
19 66 5.50 3 Ta1 restaurantes 2.35 M
20 36 6.60 1 Ta4 centros comerciales 1.90 F
21 59 3.85 1 Ta4 restaurantes 0.30 M
22 37 6.70 3 Ta6 centros comerciales 0.70 F
23 53 3.50 0 Ta5 restaurantes 0.67 F
24 35 8.80 1 Ta1 discotecas 0.50 F
25 63 10.00 4 Ta5 restaurantes 1.50 M
26 28 10.10 2 Ta1 centro de estudios 0.70 F
27 43 13.40 2 Ta2 discotecas 1.50 F
28 60 3.90 0 Ta5 otros 1.99 M
29 59 5.84 1 Ta5 restaurantes 0.60 M
30 63 3.50 1 Ta4 grifos 1.50 M
31 55 4.40 2 Ta2 centro de estudios 0.40 M
32 42 3.70 0 Ta5 centros comerciales 1.80 F
33 51 4.50 1 Ta1 otros 0.70 M
34 39 5.63 1 Ta1 otros 0.80 M
35 55 4.60 4 Ta1 discotecas 1.25 M
36 35 5.79 0 Ta5 discotecas 1.60 M
37 42 2.93 3 Ta5 grifos 0.20 M
14
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Tarjeta
Ingreso Nº de Monto de
de Lugar de uso de
Caso Edad Mensual viajes deuda Sexo
crédito tarjeta de crédito
(miles de S/.) (mensual) (miles de S/.)
usada
38 36 6.60 1 Ta3 grifos 4.37 F
39 49 4.60 0 Ta3 centros comerciales 2.00 M
40 27 6.60 0 Ta4 grifos 0.90 F
41 36 2.90 4 Ta1 discotecas 0.47 M
42 42 4.69 2 Ta2 centros comerciales 0.80 F
43 25 3.99 1 Ta4 restaurantes 4.32 F
44 32 6.70 2 Ta1 centros comerciales 0.60 M
45 28 2.58 1 Ta4 otros 1.70 M
25
20
%
15
10
0
Ta1 Ta2 Ta3 Ta4 Ta5 Ta6
Tarjeta de crédito
Gráfico Circular
Ta2
Ta4 7, 15.6%
11, 24.4%
Ta3
4, 8.9%
16
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Tabulaciones cruzadas
Edad
Sexo De 15 a De 21 a De 26 a De 31 a De 36 a Más de Total
20 años 25 años 30 años 35 años 40 años 40 años
Masculino 126214 169306 60006 21465 10651 12503 400145
Femenino 150859 159091 42243 15313 7333 7986 382825
Total 277073 328397 102249 36778 17984 20489 782970
Fuente: PERÚ, II Censo Nacional Universitario 2010
17
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Tabla de frecuencias
N° de clase Valor de la Frecuencia Frecuencia Frecuencia
variable Absoluta Relativa Porcentual
(fi) (fri) (pi)
1 x1 f1 fr1 p1
2 x2 f2 fr2 p2
.
.
.
k xk fk frk pk
Total n 1 100
Interprete:
f2 = 15 Existen 15 clientes del Banco Comercial que hacen un viaje al mes.
p1 = 22.22 El 22.22% de los clientes no han realizado viajes.
Viajes al mes
35
30
25
20
%
15
10
0
0 1 2 3 4
Viajes
18
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 3 3 5 6 6 9 9 10 10
1 3 5 5 6 3 9 10 3 1
10 3 5 5 6 5 9 10 1 1
3 3 5 6 6 5 9 5 3 1
b. Interprete f3 y p3
El conjunto de datos es agrupado por intervalos de clase que conforman las clases o
categorías de la tabla de frecuencias.
Tabla de frecuencias
N° de Intervalos Marca Frec. Frec. Frec. Frec. Frec. Frec.
clases de clase de Absoluta Relativa Porc. Acumulada Acumulada Acum.
clase Absoluta Relativa Porc.
[LI-LS> fi fri pi Fi Fri Pi
xi'
1 [LI1-LS1> x’1 f1 fr1 p1 F1 Fr1 P1
2 [LI2-LS2> x’2 f2 fr2 p2 F2 Fr2 P2
.
.
.
k [LIk-LSk] x’k fK frK pk FK FrK Pk
Total N 1 100 1 100
19
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Donde:
'
Marcas de Clase ( X i ). Es el punto medio del intervalo de clase. Se considerada como
el valor representativo de los valores que pertenecen al intervalo de clase.
LI i LSi
Se calcula: X i' o X i' X i'1 TIC , donde TIC es el tamaño del intervalo
2
de clase
Fi
fj i
Fri
n
j 1
n
j 1
fr j
20
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Paso 5. Realizar el conteo del conjunto de datos, como el resultado de asignar cada
observación a alguno de los intervalos de clase. Luego completar la tabla hallando x’i , fi ,
fri , Fi , Fri .
Tipos de gráficos
Histograma. Se usan las frecuencias absolutas o relativas en el eje vertical y los
intervalos de clase en el eje horizontal.
Polígono. Se usan las frecuencias absolutas o relativas en el eje vertical y las
marcas de clase en el eje horizontal.
Organicemos las observaciones de la variable ingreso mensual de los clientes (en miles
de nuevos soles).
TIC 1.90167
21
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Interprete:
f2 = 20; 20 de los clientes tienen un ingreso mensual de por lo menos S/.
3900 pero menos de S/. 5810.
p5 = 4.44; 4.44% de los clientes ganan por lo menos S/. 9630 pero menos de
S/. 11540.
3
F3 fi f1 f 2 f3 11 20 10 41 41 de los clientes ganan mensualmente por
i 1
F5 – F2 = 44 – 31 =13
5
F5 – F2 = f
i 3
i f3 f 4 f5 10 1 2 13 13 de los clientes ganan por lo menos
proporción de los clientes que ganan por lo menos S/.7720 pero menos de
S/.11540.
3
P3 pi p1 p2 p3 24.44 44.44 22.22 91.10 , indica que el 91.10% de los
i 1
clientes tienen ingresos mensuales de por lo menos S/.1990 pero menos de
S/.7720
22
UNA La Molina - Dpto. de Estadística e Informática Estadística General
los clientes de ese banco tienen ingresos mensuales por lo menos S/. 5810 pero
menos de S/. 11540.
x3' 6.765 es el valor representativo de los clientes que ganan por lo menos
S/.5810 pero menos de S/.7720. Las diez observaciones (f3 = 10) que hay en la
clase 3 son representadas por el valor S/. 6765.
Ingreso Mensual
50
40
30
%
20
10
0
1.99 3.90 5.81 7.72 9.63 11.54 13.45
Ingreso
Ingreso Mensual
Series1, 4.855, 20
Series1,
Series1, 8.675, 10.585, 2
1 Series1,
Series1, 1.035, 0 Series1, 12.495,
14.405, 1
0
Fuente: Elaboración propia
En el polígono de frecuencias se observa que son pocos los clientes con ingresos
mensuales altos.
23
UNA La Molina - Dpto. de Estadística e Informática Estadística General
24
UNA La Molina - Dpto. de Estadística e Informática Estadística General
25
UNA La Molina - Dpto. de Estadística e Informática Estadística General
26
UNA La Molina - Dpto. de Estadística e Informática Estadística General
8 12
8 12 10
8 12 8
9 16 6
9 16 4
9 16 2
12 16 0
12 17 amarilla negra blanca tomasa serrana
12 17 Serie1 3 5 9 2 1
12 18
Variedad de papa
Fuente: Estudio Experimental.
27
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 1
1. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de
tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia
de producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes
potenciales, registrándose los siguientes resultados:
28
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Número de Número de
Tipo de Tipo de
Producción días de Producción días de
paquete paquete
pesca pesca
22.0 T1 4 39.8 T1 3
23.7 T1 2 40.0 T2 2
24.6 T2 2 40.3 T3 2
24.8 T2 4 40.6 T3 4
25.0 T3 2 42.8 T3 5
26.4 T3 4 43.0 T4 6
26.6 T4 6 44.1 T4 5
27.5 T3 6 44.5 T4 4
29.9 T2 2 44.8 T2 3
31.1 T1 4 45.6 T2 4
32.5 T2 3 46.0 T3 3
34.8 T3 5 46.4 T1 2
35.0 T2 6 48.0 T2 6
38.4 T4 3 52.0 T1 3
38.5 T4 3 54.0 T1 5
39.1 T3 4 56.0 T2 6
29
UNA La Molina - Dpto. de Estadística e Informática Estadística General
30
UNA La Molina - Dpto. de Estadística e Informática Estadística General
31
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
32
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
1 25 conv 2 2.90 F
2 22 conv 2 2.90 F
3 32 conv 4 4.04 M
4 22 conv 1 4.35 F
5 18 casada 1 3.60 M
6 21 casada 3 3.50 M
7 20 soltera 2 3.20 M
8 19 casada 1 3.00 F
9 23 casada 3 3.60 M
10 26 casada 2 2.80 M
11 36 casada 5 3.00 M
12 30 conv 5 3.30 F
13 23 soltera 3 3.10 F
14 29 conv 4 3.30 F
15 22 conv 2 3.30 F
16 23 casada 1 3.50 F
17 27 conv 2 3.62 M
18 28 conv 3 3.30 F
19 19 conv 1 2.65 F
20 32 casada 2 2.86 F
21 17 conv 1 2.62 M
22 21 conv 2 3.56 F
23 18 casada 2 3.10 M
24 27 conv 3 3.62 F
25 21 casada 1 3.18 M
26 19 casada 1 2.95 M
27 19 conv 2 3.90 M
28 31 casada 3 3.00 F
29 32 casada 4 4.00 F
30 21 conv 2 3.85 M
31 23 casada 2 2.75 F
32 19 casada 1 3.18 F
33 19 conv 1 3.14 F
34 26 conv 3 3.08 F
35 18 casada 1 2.80 F
36 24 casada 2 3.40 M
37 30 casada 3 3.00 F
38 26 casada 3 3.05 F
39 19 casada 1 2.90 F
40 34 casada 3 3.10 F
33
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Madre Hijo
Caso Edad Estado Civil No de partos Peso Sexo
41 28 casada 3 3.40 M
42 24 casada 2 2.97 F
43 26 casada 2 2.94 F
44 22 casada 2 3.80 M
45 34 casada 5 4.65 F
34
UNA La Molina - Dpto. de Estadística e Informática Estadística General
5. Los siguientes datos corresponden a la longitud de la cabeza del feto a los 45 días
de gestación de un total de 60 ovejas que produjeron un solo feto y de las cuales el
día de apareamiento es conocido. Las medidas están en mm y fueron obtenidas
con imágenes de ultrasonido:
19.4 20.4 21.0 21.6 21.9 21.9 22.0 22.1 22.1 22.2 22.3 22.3
22.6 22.7 22.7 22.7 22.8 22.9 23.0 23.1 23.2 23.2 23.4 23.6
23.6 23.6 23.7 24.0 24.0 24.0 24.0 24.0 24.1 24.1 24.3 24.4
24.5 24.6 24.7 24.7 24.8 24.8 25.0 25.0 25.0 25.2 25.3 25.3
25.5 25.5 25.5 25.6 25.6 25.6 25.8 25.9 26.0 26.4 26.9 27.5
105 105 107 108 108 108 109 109 110 111 111 111
113 114 114 117 118 119 121 121 123 125 126 126
126 126 128 129 130 131 134 134 137 145 145 150
150 152 153 154 157 157 158 164 170 171 179 183
1.5 2.1 2.5 3.2 3.7 4.4 4.5 4.6 4.6 4.6 4.7 5.2 5.3 5.4 5.7 5.7 5.8 6.1
6.4 6.7 6.7 7.2 7.4 7.4 7.7 7.8 8.4 8.4 8.5 8.7 9.1 9.8 10.1 11.7 12.1 15.4
1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4
4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 7 7
10. Un Ing. Pesquero está realizando un estudio sobre el salmón plateado con la
finalidad de introducirlo al país. Una de las variables de interés es la longitud (en
centímetros). El resultado luego de la evaluación a 45 peces elegidos al azar de
esta especie se presenta a continuación:
12. Una fábrica textil para su próxima campaña de verano debe decidir la fabricación de
tres tipos de diseños de polos (D1, D2 y D3). Para apoyar su decisión la gerencia de
producción realizó un estudio extrayendo una muestra aleatoria de 60 clientes
potenciales, registrándose los siguientes resultados:
36
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Número de Número de
Tipo de Tipo de
Producción días de Producción días de
paquete paquete
pesca pesca
22.0 T1 4 39.8 T1 3
23.7 T1 2 40.0 T2 2
24.6 T2 2 40.3 T3 2
24.8 T2 4 40.6 T3 4
25.0 T3 2 42.8 T3 5
26.4 T3 4 43.0 T4 6
26.6 T4 6 44.1 T4 5
27.5 T3 6 44.5 T4 4
29.9 T2 2 44.8 T2 3
31.1 T1 4 45.6 T2 4
32.5 T2 3 46.0 T3 3
34.8 T3 5 46.4 T1 2
35.0 T2 6 48.0 T2 6
38.4 T4 3 52.0 T1 3
38.5 T4 3 54.0 T1 5
39.1 T3 4 56.0 T2 6
a) Con respecto a la información proporcionada, identifique la población, unidad
elemental y muestra.
b) Elabore una tabla de frecuencias sobre el tipo de embarcación y un gráfico de
barras de frecuencias porcentuales.
c) Elabore la tabla de frecuencias para la producción de pesca. Use la regla de
Sturges.
d) Interprete f4, p4, F5, y 100-P5.
e) Elabore el respectivo histograma de frecuencias porcentuales.
f) Elabore la tabla de frecuencias para la variable número de días de pesca y su
gráfico respectivo.
37
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
4.051
12.106
35.09
9. El número de decimales del Tamaño de Intervalo de Clase (TIC), debe ser siempre
igual a _________________________________
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
38
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO III
MEDIDAS ESTADÍSTICAS
Las medidas estadísticas pueden ser calculadas con los datos provenientes de una
población (N: Tamaño de la población) o muestra (n: Tamaño de la muestra) para
evaluar diferentes variables (cuantitativas y cualitativas), cuya finalidad es resumir y
representar el conjunto de datos.
Observaciones
Las medidas estadísticas asumen las mismas unidades de medida de la variable en
estudio, con la excepción de ciertas medidas estadísticas relativas.
Para las variables cuantitativas, se pueden calcular medidas estadísticas como:
media, mediana, moda, rango, rango intercuartílico, varianza, desviación estándar,
coeficiente de variabilidad, y otras. En el caso de las variables cualitativas, sólo es
posible calcular las medidas como la moda y la proporción.
La media aritmética
La media ponderada
La mediana
La moda
1 N 1 n
Media poblacional: Xj
N j 1
Media muestral: X Xj
n j 1
Ejemplo 1
Suponga que se tiene los datos de las ventas semanales (en dólares) de una muestra
de 8 vendedores. Calcule la venta promedio semanal.
Solución
1 8 150 120 300 280 350 250 160 280 1,890
X
8 i 1
xi
8
8
236.3
39
UNA La Molina - Dpto. de Estadística e Informática Estadística General
250.5 320.0 345.5 260.4 358.2 268.5 380.1 410.2 430.4 480.3 410.3 420.1
Propiedades:
1. La media está afectada por valores extremos (altos o pequeños). Es una desventaja
de la media.
2. La media aritmética localiza la parte central de un conjunto de observaciones.
3. Para un conjunto de observaciones la media es única.
4. Si la media sustituye a cada observación, la suma total no cambia.
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual
X
n n
a cero. j X X j n X n X n X 0
j 1 j 1
6. La suma de los cuadrados de las desviaciones de las observaciones con respecto a
X X c , donde c R
n 2 n
2
la media es mínima: j X j
j 1 j 1
Ejemplo 2
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de
empleados:
Grupo Ingreso x
A 520 525 518 523 545 580 510 500 527.625
B 530 545 520 8000 580 590 560 600 1490.625
1 8 4221
Propiedad 1. Para A : X
8 i 1
Xi
8
527.625
1 8 11925
Para B : X
8 i 1
Xi
8
1490.625
x
j 1
j wj
x1 w1 x2 w2 xk wk
xp
k
w1 w2 wk
w
j 1
j
La media ponderada se usa en aquellos casos donde las observaciones tienen diferente
importancia dentro de una población o muestra.
Casos particulares:
k k
k
Si x1 , x2 ,..., xk son las medias de k grupos y n
j 1
j xj
cada grupo tiene tamaño n1 , n2 ,..., nk xp k
respectivamente, entonces la media de todos n j
los datos n n1 n2 ... nk se calcula por:
j 1
Ejemplo 3
Un empresario que vende ropa para Caballeros, posee dos tiendas, administradas por
Gerentes contratados, los ternos vendidos por estas tiendas son comprados a un
proveedor a un costo de 150 nuevos soles
La tienda A vendió 95 ternos al precio original de 400 nuevos soles, luego de esto
en una oferta vendió 126 ternos a 280 nuevos soles y por cierre de temporada
vendió los 79 ternos restantes a 200 nuevos soles.
La Tienda B, ha vendido el 30% de sus ternos a 400 nuevos soles, el 40% a 300
nuevos soles y el resto al precio de costo.
41
UNA La Molina - Dpto. de Estadística e Informática Estadística General
42
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La mediana
n impar , me X n 1
( )
2
Si X n X n
( ) ( 1)
n par , m 2 2
2
e
n 1
100 50 Entero E me x E
Otra forma: Si
n 1 50 Decimal E.d me x 0.d x
100
E E 1 x E
Ejemplo 4
Los siguientes datos corresponden a los pesos (en Kg.) de 10 personas: 50, 77, 53, 76,
63, 64, 75, 54, 52, 80. Calcule la mediana
Datos ordenados: 50, 52, 53, 54, 63, 64, 75, 76, 77, 80
X 10 X 10
( ) ( 1) 63 64
n 10 par , me 2 2
63.5
2 2
10 1
Otra forma : 50 5.5 me x5 0.5 x6 x5 63 0.5 64 63 63.5
100
Interpretación. Un 50% de personas pesan menos de 63.5 Kg. y el otro 50% pesa más
de 63.5 Kg.
Zona A 38 32 45 30 24 45 42 18 28
Zona B 25 28 25 32 26 35 54 38
43
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Propiedades:
1. La mediana divide las n observaciones en dos partes iguales. El 50% con valores
menores a la mediana y el otro 50% con valores mayores a la mediana.
2. La suma de las desviaciones absolutas de las observaciones con respecto a la
n n
mediana es un valor mínimo. X
j 1
j me X j c , donde c R
j 1
3. La mediana no está influenciada por valores extremos.
Ejemplo 5
Los siguientes datos corresponden a los ingresos mensuales de dos grupos de
empleados:
Grupo Ingreso me
A 520 525 518 523 545 580 510 523
B 530 545 520 8000 580 590 560 560
Solución
Se observa que la mediana no está afectada por el valor extremo 8000, como es la
media.
La moda
Propiedades:
1. La moda puede no existir o puede haber más de una moda en un conjunto de
datos.
2. La moda no está afectada por valores extremos.
3. Se aplica tanto para información cualitativa como cuantitativa.
Ejemplo 6
1. Se tiene las longitudes de peces de río (cm) de la zona A: 4.0, 4.1, 4.2, 4.3, 4.5,
4.7, 4.8. No hay moda.
2. Las siguientes longitudes sonde la zona B: 4.0, 4.1, 4.1, 4.1, 4.2, 4.2, 4.5, 4.2.
Se distinguen dos modas mo1 = 4.1 y mo2 = 4.2 (distribución bimodal).
Ejercicio 5. Se tiene una muestra de los niveles de ozono alrededor de una ciudad
(220 partes por billón). Halle e interprete la moda.
160 124 156 164 178 163 163 178 164 185 196 164 170 145 164
44
UNA La Molina - Dpto. de Estadística e Informática Estadística General
X i fi
Use la expresión: X i , donde k es el número de clases y n el tamaño de
n
la muestra.
45
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Propiedades de transformación
Para una nueva variable transformada: Yi a bX,i donde a y b son constantes reales.
Entonces, sus medidas estadísticas son calculadas:
Medida estadística Yi a bX i
Media Y a bX
Mediana meY a bmeX
Moda moY a bmoX
Ejemplo 7
En un parque de atracciones la media de los gastos por visitante un día especial es de
S/.40, sabiendo que los adultos gastaron una media de S/.43 y los niños S/.35.
a. Calcule el número de adultos y niños que visitaron el parque, si en total fueron 400
personas.
n Adultos * x Adultos nNiños * x Niños n Adultos * 43 nNiños * 35
xp 40
Se tiene: n Adultos nNiños 400
n Adultos nNiños 400
Entonces: nAdultos 150 y nNiños 250
b. Si los gastos por asistir al parque de atracciones se incrementaron en un 10% en el
caso de los adultos y en un 5% en el caso de los niños. ¿Cuál será ahora el
promedio de los gastos por visitante?
y Adultos 1.1* x Adultos 1.1* 43 47.3 150 * 47.3 250 * 36.75
yp 40.76
y Niños 1.05 * x Niños 1.05 * 35 36.75 400
46
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 8
Se cuenta con los datos de los tiempos (en minutos) de tardanza de los trabajadores de
una compañía de seguro. Halle e interprete el percentil 45.
15 12 18 22 24 10 9 13 25 18 6 14
Datos ordenados: 6, 9, 10, 12, 13, 14, 15, 18, 18, 22, 24, 25
12 1
Posición 45 5.85 P45 x5 0.85 x6 x5 13 0.85 14 13 13.85 min utos
100
47
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 2 3 5 6 7 9 9 12 18
1 3 5 5 6 7 9 11 12 18
1 3 5 5 6 8 9 11 15 19
2 3 5 6 6 8 9 11 18 23
b. ¿Cuál debe ser el valor mínimo de insectos para que una parcela sea considerada
dentro del 18% de las parcelas con mayores números de insectos?
c. ¿Cuál debe ser el valor máximo de insectos para que una parcela sea considerada
dentro del 22% de las parcelas con menores números de insectos?
d. ¿Para qué valores del número de insectos se tendrá el 80% central de parcelas?
Ejercicio 10. Se tiene las notas de los promedio ponderados de los estudiantes
graduados en el último ciclo. Halle el promedio ponderado mínimo para que un alumno
sea considerado dentro del quinto superior.
10.5 10.9 11.2 11.3 11.5 11.5 11.7 12.8 12.9 13.6 13.7 13.9 14.0 15.6
48
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Cuartiles
Son percentiles que dividen el conjunto de datos en 4 partes iguales (25% cada una).
Son conocidos también como Q1=P25, Q2=P50 y Q3=P75.
Ejemplo 9
Los siguientes datos corresponden a los pesos, en Kg. de 10 personas: 50, 52, 53, 54,
63, 64, 75, 76, 77, 80.
b. Halle el percentil 75
P75 x 101 x8.25 x8 0.25 x9 x8 76 0.25 77 76 76.25 Kg
75
100
Interpretación: Un 75% de personas pesa menos de 76.25 Kg. y el otro 25% pesa
más de 76.25 Kg.
Ejemplo 10
Se ha desarrollado un experimento para evaluar el efecto de alimentos balanceados en
la ganancia de pesos de pollos. Una muestra aleatoria de 30 pollos que recibieron el
alimento balanceado fue seleccionada. Al cabo de 10 días se registraron las ganancias
de pesos (en gr)
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 141
a. Halle e interprete las medidas de tendencia central para la ganancia de peso.
b. ¿Cuál es el peso mínimo de un pollo que fue alimentado con el alimento balanceado
para estar en el 10% superior de los que pesan más?
c. ¿Cuál es peso máximo del 60% de pollos que pesan menos con el alimento
balanceado?
Solución:
a)
N Media StDev CoefVar Minimo Q1 Mediana Q3 Maximo
30 117,40 11,57 9,85 93,00 110,00 118,00 125,75 141,00
49
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Paso 1. Cada dato se divide en dos: la primera se llama tallo y la segunda hoja.
Paso 2. Cada tallo se forma con uno o más dígitos iniciales de cada dato y las hojas se
forman con los dígitos restantes (generalmente de un solo dígito).
Paso 3. Los tallos se presentan en una columna ordenada de menor a mayor
Paso 4. Las hojas se muestran en filas ordenadas y listadas a la derecha de su
respectivo tallo.
Nota.-
En caso de datos decimales, al construir el diagrama de tallos y hojas el punto
decimal se pierde, por tal razón se acostumbra indicar unidades que los datos del
tallo representan. Por ejemplo para un dato: 4.12 Unidad de Hoja=0.01
Es necesario pone todos los tallos consecutivos. Si no existe el dato, se pone el valor
del tallo y en la fila de hoja se deja en blanco.
Si es necesario se divide en dos hojas cada tallo, según los rango: (0 – 4) y (5 – 9).
Ejemplo 11
Los siguientes datos corresponden a la estatura de una muestra de 30 alumnos
universitarios.
158, 159, 161, 161, 163, 163, 164, 166, 166, 167, 168, 168, 168, 169, 170, 170, 170,
171, 171, 171, 172, 173, 174, 174, 174, 174, 174, 177, 182, 191
2 15 89
7 16 11334 Hojas
14 16 6678889
(13) 17 0001112344444
3 17 7
2 18 2
1 18
1 19 1
El diagrama de tallos y hojas representa la estatura de 30 alumnos. Existen tres partes
en el gráfico.
La primera columna representa la profundidad
La segunda columna representa los tallos
La última columna representa las hojas.
El diagrama de tallos y hojas muestra 8 tallos con sus respectivas hojas. El primer tallo
es 15 y la primera hoja es 8. La observación correspondiente es 158 que se obtuvo
juntando los dígitos del tallo y de la hoja y se multiplica por la unidad de hoja
(158*1.0=158).
50
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La primera columna (la profundidad) indica cuantas observaciones hay en esa línea o
antes. El número 14 en la tercera línea indica que hay 14 observaciones en esa línea y
en las líneas anteriores (14 observaciones menores o iguales a 169). Hay una línea
especial, la línea que contiene la mediana. El valor que muestra es encerrado entre
paréntesis e indica cuantas observaciones hay en esa línea. A partir de la siguiente línea
que contiene la mediana, la columna de profundidad indica cuantas observaciones hay
en esa línea y en las líneas posteriores. El número 3 en la quinta línea indica que hay 3
observaciones en esa línea y en las líneas posteriores (3 observaciones mayores o
iguales a 177).
2 10 58
3 11 2
4 11 9
7 12 033
7 12 6
6 13 03
4 13 6
3 14 2
2 14 5
1 15
1 15 6
51
UNA La Molina - Dpto. de Estadística e Informática Estadística General
2.1, 2.5, 2.8, 3.5, 3.6, 3.8, 3.8, 4.6, 5.2, 5.4, 5.6, 5.9, 6.2, 6.5, 6.5
1 2 1
3 2 58
3 3
7 3 5688
7 4
(1) 4 6
7 5 24
5 5 69
3 6 2
2 6 55
52
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 2
Fertilizante A Fertilizante B
Tallos y Hojas de A N = 29
Tabla 2: Alturas de planta de frijol al usar el
Leaf Unit = 1.0
fertilizante B
1 3 9
12 4 00011111111 45 42 39 45 41
(5) 4 22223
12 4 45555 46 42 41 45 45
7 4 667 48 48 41 45 47
4 4 889
1 5 49 49 42 46 48
1 5 51 51 42 46 49
1 5 5
52 53 47 47 53
29
y 1261 30
y
i
i 1 i 1385
i 1
a. Calcule e interprete las medidas de tendencia central para la altura de las plantas de
frijol cuando se utiliza el fertilizante A.
b. Calcule la altura más frecuente de las plantas de frijol que reciben el fertilizante B.
53
UNA La Molina - Dpto. de Estadística e Informática Estadística General
c. Si en una zona agrícola con mayor pH se espera que la altura de las plantas con el
fertilizante A tengan un incremento del 12.5% y con el fertilizante B una disminución
del 2.5%, calcule la altura promedio considerando los dos fertilizante para esta zona
agrícola.
d. Calcule la altura promedio del 20% de las plantas de frijol más altas y que reciben el
fertilizante B.
e. El 10% de las plantas con menores alturas es catalogado como grupo de “plantas
enanas”, mientras que el 12% de las mayores alturas como “plantas gigantes” y el
porcentaje restante como “plantas de altura normal”. Determine los intervalos de altura
que debe tener una planta que recibe el fertilizante A para ser considerada enana y
una planta receptora del fertilizante B para ser considerada gigante.
54
UNA La Molina - Dpto. de Estadística e Informática Estadística General
2. El Instituto Nacional de Innovación Agraria (INIA) reporta que una plaga está afectando
considerablemente a las plantas de yuca en el distrito de Tocache (selva del Perú), esta
plaga daña la yuca afectando principalmente a su peso. En el siguiente cuadro se
muestra la distribución de frecuencia del número de hojas amarillas (afectadas) para
una muestra de 35 plantas de yuca:
Halle e interprete la media, mediana, moda y el el 40% central del número de hojas
amarillas.
55
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45
56
UNA La Molina - Dpto. de Estadística e Informática Estadística General
4. Una fábrica tiene una máquina que trabaja las 24 horas del día en tres turnos de 8
horas (mañana, tarde y noche). Los costos de producción por hora (en soles) y los
tiempos de producción por artículo que dependen del turno. Los datos se presentan
a continuación:
5. Del ejercicio anterior. Suponga que un trabajador que labora con la máquina en la
mañana cobra 36 soles, un trabajador que labora en la tarde cobra 40 soles, y un
trabajador que labora en la noche cobra 50 soles diarios. ¿Cuál es el costo promedio
por hora que tiene la fábrica considerando la labor del trabajador y el costo de
producción de energía eléctrica?
X 0 1 2 3 4
fi 50 12 8 7 3
6 7 7 7 7 8 8 8 8 8
9 9 9 9 9 9 10 10 10 11
2 19 3 3 19 3 9 3 9 9 3 5 2 5 5 1 5 1 1 5
5 6 6 18 18 6 6 18 6 11 11 11 11 7 7 7 8 12 8 12
3 5 3 4 1 2 3 2 4 5 7 1 3 4 2
2 1 5 2 2 4 6 7 4 7 6 4 6 4 3
10. Parra evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
teléfonos celulares ha recopilado la siguiente información sobre el número de
teléfonos vendidos en la última semana por sus 64 empleados:
Número de empleados 13 15 16 8 5 4 3
Número de ventas 5 6 7 8 9 10 11
Calcule las medidas de tendencia central para estos datos. Interpretar: Media,
Mediana y Moda.
Variedades
Variedad Kent Variedad Haden
N° de N° de
Rend. Rend. Tallo y Hoja de Haden N = 22
Ha Ha
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2 8 10 22388999
(6) 11 266888
3 12.6 14 13.5
8 12 2233
4 12.6 15 13.5 4 13 344
5 12.6 16 13.7 1 14
6 12.8 17 13.8 1 15
7 12.8 18 13.8 1 16 5
8 12.8 19 14.1
9 12.9 20 14.1
10 12.9 21 14.3
58
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 4 2
1 4
7 5 223344
10 5 5566
(12) 6 112233444444
8 6 8999
4 7 344
1 7 9
59
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
1. Las medidas de tendencia central que no están influenciadas por valores atípicos
son _______________________________________.
2. ___________________ es una medida de tendencia central que está afectada por
los valores extremos.
3. __________________ es una medida de tendencia central utilizada para resumir
datos provenientes de un variable tipo cualitativa.
4. En una muestra de 80 estudiantes, el 60% ha perdido un celular, el 20% dos
celulares, el 15% tres celulares y el resto ningún celular en los últimos dos años.
Entonces el percentil 56 es igual a ____________________________.
5. La suma de las desviaciones de las observaciones respecto a la media aritmética, es
igual a _____________________.
6. La suma de las desviaciones absolutas de las observaciones con respecto a la
________________________ es un valor mínimo.
7. Los resultados de una encuesta sobre el porcentaje de satisfacción de sus clientes
para dos empresas de seguro (A y B) se muestran en el siguiente cuadro:
Para comparar donde hay mayor satisfacción de los clientes en las empresas A y B,
la medida de tendencia central usada es ____________________ y cuyos valores
usados son __________________________ respectivamente.
8. Una empresa aseguradora de autos ofrece a sus clientes cuatro planes de seguros
(A, B, C y D), siendo el costo anual de 650, 520, 450 y 380 (nuevos soles)
respectivamente. Si el 45% de sus clientes tienen el plan de seguro A, el 35% el B,
el 15% el C y el resto el plan D. El costo promedio de los cuatro planes de seguro
para la empresa aseguradora es igual a _____________________________
n
i 1
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
60
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO IV
1. La amplitud o rango
2. El rango intercuartil
3. La variancia y la desviación estándar
4. El coeficiente de variabilidad
Ejemplo 1
Suponga que las notas de la primera práctica de tres grupos del curso de Estadística
General fueron:
Grupo Notas x
A 14 14 14 14 14 14 14 14 14 14 14
B 14 13 15 14 12 15 16 13 12 16 14
C 19 8 19 11 16 18 6 13 10 20 14
Solución
Del cuadro se observa que:
a. Los grupos A, B y C tienen la misma media pero diferente dispersión en torno a la
media.
b. Respecto a la variabilidad o dispersión: A < B < C
c. Respecto a la homogeneidad : A > B > C
d. Respecto a la confiabilidad de la media: A > B > C
El rango
R = Xmax - Xmin
Desventajas:
a. Queda afectada por valores extremos
b. No mide la variabilidad de los datos intermedios
Ejemplo 2
El rango de la nota para el grupo B es: RB = 16 – 12 = 4 puntos.
Indica que la amplitud de la nota de la primera práctica del grupo B fue de 4 puntos.
61
UNA La Molina - Dpto. de Estadística e Informática Estadística General
El rango intercuartil
Ejemplo 3
Para el grupo C: P75 = 19 y P25 = 9.5, entonces: RI = 19 – 9.5 = 9.5 puntos.
Esto indica que la amplitud del 50% central de las notas de la primera práctica para el
grupo C fue 9.5.
Desviación estándar muestral: S S2
1 k 1 k 2
Para una tabla de frecuencias: S2
n 1 i 1
f i ( X i X ) 2
( fi X i2 nX )
n 1 i 1
Se observa que la variancia está dada en las mismas unidades que la variable en
estudio al cuadrado. Por ejemplo si las unidades de las observaciones son Kg. entonces
la variancia se expresa en Kg2.
Ejemplo 4
Halle la variancia y desviación estándar muestral de las notas para cada uno de los
grupos.
10
Grupo Notas x x
i 1
2
i
A 14 14 14 14 14 14 14 14 14 14 14 1960
B 14 13 15 14 12 15 16 13 12 16 14 1980
C 19 8 19 11 16 18 6 13 10 20 14 2192
1 10 2 2 1
Grupo A: S A2 xi n x
n 1 i1
1960 10 x142 0 y SA 0
10 1
1 10 2 2 1
Grupo B: S B2 xi n x
n 1 i1
1980 10 x142 2.22 y S B 2.22 1.49
10 1
1 10 2 2 1
Grupo C: SC2 xi n x
n 1 i1
2192 10 x142 25.78 y SC 25.78 5.08
10 1
62
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Coeficiente de variabilidad
Ejemplo 5
Halle el coeficiente de variabilidad de las notas de la primera práctica para cada grupo.
SA 0
Grupo A: cv A x100 x100 0
xA 14
S 1.49
Grupo B: cv B B x100 x100 10.6%
xB 14
S 5.08
Grupo C: cvC C x100 x100 36.3%
xC 14
Esto indica, que la variabilidad de la nota de la primera práctica del grupo C es 36.3% y
por lo tanto es el más heterogéneo por tener mayor cv en comparación con el grupo A y
B.
Ejemplo 6
Los siguientes datos corresponden al tiempo (en minutos), al cabo del cual se duermen
las ratas después de haber recibido un tipo de tranquilizante (A o B).
Tipo A Tipo B
n 18 ratas 20 ratas
x 9.94 min 15.2 min
s 2.81 min 2.84 min
2.81 2.84
cv A 100 28.27 % cv B 18.68 %
9.94 15.2
63
UNA La Molina - Dpto. de Estadística e Informática Estadística General
15.8 26.4 17.3 11.2 23.9 24.5 13.9 9.4 22.7 18.5
15.2 11.0 7.7 20.0 16.2
Comparación de la variabilidad
Para comparar la variabilidad entre dos o más conjuntos de datos, se debe considerar:
El cuadro indica que cuando se compara la variabilidad de dos conjuntos de datos, si las
variables tienen unidades de medidas diferentes; se debe usar los coeficientes de
variación; mientras si las variables tienen unidades de medida iguales, se debe
observar si las medias son similares para usar la desviación estándar y en caso que las
medias sean diferentes usar el coeficiente de variación.
64
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Desviación Coeficiente de
Promedio estándar variabilidad
a. Las ventas de la zona A son menos variables que las de la zona B. Justifique.
c. Para la zona A, las ventas son más variables que el tiempo extra. Justifique.
Transformación de datos
SY2 b 2 S X2
Sea la variable Y, entonces para Y a bX , se cumple: SY bS X
Ejemplo 7
En una empresa industrial desea mejorar la productividad de los obreros, para tal
efecto se escogió uno de los productos de la empresa para hacer el análisis, y se tomó
el tiempo que demoran 20 trabajadores del primer turno en ensamblar el producto,
obteniéndose los tiempos siguientes (en minutos):
b. Inspeccionando el cronómetro con que se registró los tiempos se encontró que éste
estaba excediendo la medición en 0.1 minutos. ¿Cuáles serían entonces las reales
medidas halladas en a)?
Media = 3.525-0.1=3.425
Mediana = 3.25-0.1=3.15
S= 1.723
CV = 1.723/3.425*100 = 50.3%
Ejercicio 3. Considere los datos del ejercicio 2. Suponga que la empresa decide hacer
un pago adicional por las horas extras. A los vendedores de la zona A, se les pagará S/
10.0 por cada hora extra más S/. 50 por movilidad. A los de la zona B, se les pagará S/
15.0 por cada hora extra.
Calcule la desviación estándar y coeficiente de variabilidad para estos pagos adicionales
Ejercicio 4. Los sueldos de 100 empleados de una empresa tienen una media de $300
y una desviación estándar de $50. Se proponen dos alternativas de aumento A: $75 a
cada uno B: 15% del sueldo más $20 a cada uno. ¿Cuál alternativa es la más
conveniente?. Justifique su respuesta.
66
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
1. En el mes de Julio el sueldo promedio de los trabajadores del Sector Educación fue
de $200 dólares. Para el mes de Agosto se considera un aumento del 37% con
respecto al sueldo del mes anterior más un adicional de $35 dólares. Si se obtuvo
una desviación estándar igual a $ 3.15 en el mes de Julio. ¿Se puede afirmar que la
distribución de sueldos en Julio fue más homogénea?
2. En una industria el jornal diario de sus obreros tiene una media de $10 y una
desviación estándar de $2. Si se hace un incremento del 20% en cada jornal y una
bonificación adicional de $3. ¿En qué porcentaje cambio el coeficiente de variación
de los jornales?
3. Los sueldos de 100 empleados de una empresa tienen una media de $300 y una
desviación estándar de $50. Se proponen dos alternativas de aumento i) $75 a cada
uno ii) 15% del sueldo más $20 a cada uno ¿Cuál alternativa es la más
conveniente?
a) Si la empresa dispone solo de $37000 para pagar sueldos.
b) S la empresa quiere homogeneizar los sueldos
7. El sueldo promedio de los empleados de una empresa para el mes de Julio fue de
S/. 1500 y un coeficiente de variabilidad de 30%. Si la gerencia decide dar un
aumento del 8% más un monto por viáticos de S/. 200 cada mes. Calcular el
coeficiente de variabilidad para el nuevo sueldo.
8. Para evaluar la efectividad de sus empleados, una empresa dedicada a la venta de
teléfonos celulares ha recopilado la siguiente información sobre el número de
teléfonos vendidos en la última semana por sus 64 empleados:
Número de empleados 13 15 16 8 5 4 3
Número de ventas 5 6 7 8 9 10 11
a. Calcule e intérprete las medidas de variabilidad.
b. La empresa le paga a sus empleados 100 soles semanales más una comisión de
40 soles por celular vendido y sobre estos ingresos los empleados deben aportar
el 15% a su AFP. Calcule el promedio y la desviación estándar para el ingreso
neto promedio semanal por empleado.
1 4 3 1 2 6
4 4 678 3 3 01
(4) 5 2244 3 4
5 5 5 5 5 08
4 6 4 5 6
3 6 99 7 7 14
1 7 4 7 8 5
6 9 069
3 10 1
2 11 45
a) Calcule e interprete las medidas de variabilidad para la sucursal de La Molina.
b) ¿Qué conjunto de datos presenta mayor variabilidad?
c) Para la sucursal de los Olivos el interés que cobra el banco corresponde al 5%
del monto otorgado como préstamos más 20 nuevos soles por gastos
administrativos. Mientras que para la sucursal de la Molina, se cobra 4.5% del
monto otorgado. Se puede decir que el interés que cobra la sucursal La Molina es
menos variables que el que cobra los Olivos.
11. En el mes de Marzo el sueldo promedio de los trabajadores del Sector Educación
fue de $180 dólares. Para el mes de Abril se considera un aumento del 25% con
respecto al sueldo del mes anterior más un adicional de $40 dólares. Si el
coeficiente de variación del mes de Marzo fue de 0.15. ¿Se puede afirmar que la
distribución de sueldos en Marzo fue más homogénea?
12. Los sueldos de 150 trabajadores de una empresa tienen un coeficiente de variación
del 5% en el mes de agosto. Para el mes de septiembre hay un aumento a cada
trabajador del 20% de su sueldo más una bonificación de $60 y el coeficiente de
variación baja a 4%.
a) Calcule la media y la desviación estándar de los sueldos del mes de agosto.
b) ¿Cuánto dinero adicional necesita la empresa para pagar todos los sueldos del
mes de septiembre?
68
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
1. La medida de variabilidad que mide la amplitud del 50% central de los datos, se
denomina ___________________________________________.
69
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO V
MEDIDAS DE ASIMETRÍA
Objetivo. Al finalizar este capítulo el lector debe ser capaz de cuantificar e interpretar
la simetría o asimetría de una distribución.
Ejemplo 1
Los siguientes gráficos corresponden a la distribución de los ingresos mensuales (miles
S/.) de muestras al azar de los clientes de tres sucursales (A,B y C) de una caja rural.
X me X me X me
Poblacional: As
3 Me
Muestral: as
3 X me
s
Propiedades
70
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 2
Recordemos los datos de los ingresos mensuales del Banco Comercial que se trabajaron
en la parte de organización de datos. Con esa información se tienen los siguientes
valores: x 5.350 , me 4.700 , s 2.181 .
3 5.350 4.700
Por lo tanto as 0.8941 0 , entonces la distribución de los ingresos
2.181
mensuales tiene una asimétrica positiva.
Ejercicio 1. Se desea realizar un estudio sobre la utilización del agua en tres zonas
rurales (A, B y C). Con esta finalidad se ha seleccionado al azar 8 casas de la zona A, 6
de la zona B y 10 de la zona C. Luego se registró el número de litros de agua
consumidos por un día, los cuales se presenta en el siguiente cuadro:
Estadísticas Descriptivas
71
UNA La Molina - Dpto. de Estadística e Informática Estadística General
El diagrama de cajas (Box plot) es una técnica gráfica que nos permite determinar:
1. Los valores extremos (outliers), valores atípicos o datos discordantes.
2. La asimetría de la distribución que corresponde al 50% central de los datos.
3. La variabilidad del 50% central de dos o más conjuntos de datos.
Valor Outlier
El bigote superior
se extiende al valor
más alto que
* pertenece al
intervalo de
seguridad superior
Tercer
Cuartil (Q3)
Mediana
El bigote inferior se
extiende al valor ás
Primer bajo que pertenece
Cuartil (Q1) al intervalo de
seguridad inferior
La caja contiene información del 50% de los datos ya que la línea inferior de la caja
es el primer cuartil (Q1 = P25), y la línea superior de la caja es el tercer cuartil (Q 3 =
P75).
La línea que divide a la caja es la mediana y su posición dentro de ella nos brindará
información sobre la asimetría de la distribución del 50% central de datos.
Los bigotes son las líneas que se extienden de la parte inferior y superior de la caja
hasta la observación más alta o más baja dentro de los intervalos de seguridad.
3. Respecto a datos outliers. Son observaciones fuera de los límites inferior y/o
superior y que se representan con asteriscos (*).
Ejemplo 3
Se tienen los pesos de 10 personas del aula A: 50, 52, 53, 54, 63, 64, 75, 76, 85, 120.
Con estos datos se obtiene P25 = 52.75, P50 = me = 63.5, P75 = 78.25, RI = Q3-Q1 =
25.5
Luego se calculan los intervalos de seguridad inferior y superior.
ISI = P25 – 1.5 RI = 52.75 – 1.5 (25.5) = 14.5
ISS= P75 + 1.5 RI = 78.25 + 1.5 (25.5) = 116.5
120
110
100
90
Peso A
80
70
60
50
Se aprecia que hay un outlier o valor extremo superior (120 Kg. 116.5) que se
representa con un asterisco (*). En el caso inferior no existe ningún valor menor al
límite inferior (14.5).
El límite superior es 116.5. El bigote superior llega hasta el valor adyacente más alto
dentro del límite superior (78.25 a 116.5). En nuestro ejemplo el bigote superior llega
hasta 85.
El límite inferior es 14.5. El bigote inferior llega hasta el valor adyacente más bajo
dentro del límite inferior (14.5 a 52.75). En nuestro ejemplo el bigote inferior llega
hasta 50.
Ejemplo 4
Si se tienen los pesos de 10 personas del aula B: 54, 54, 54, 55, 55, 55, 55, 56, 56, 56.
Entonces P25 = 54, P50 = 55, P75 = 56, RI = 2, ISI = 51, ISS = 59.
120
110
100
90
80
70
60
50
Peso A Peso B
Peso A representa la caja del ejemplo anterior y Peso B la caja del ejemplo que se
está presentando. Se observa que en Peso B no hay valores extremos y que una caja
más grande representa a datos más variables (Peso A es más variable que Peso B).
Peso B es simétrica (se verifica que me x 55 Kg )
73
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Cálculos:
74
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Alimento A
93 98 100 102 107 109 110 110 111 111 113 114 115 116 118
118 119 119 120 120 120 124 125 128 129 129 130 135 138 181
Alimento B
Tallo y Hojas de Alimento B N = 60
Unidad de Hoja = 1,0
2 12 34
11 12 566788999
24 13 0000000011133
(12) 13 566678889999
24 14 001123
18 14 5669
14 15 0122
10 15 788899
4 16 0123
75
UNA La Molina - Dpto. de Estadística e Informática Estadística General
76
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 3
2.12 4.13 2 21 37
2.2 4.19 3 22 0
2.26 4.23 3 23
5 24 99
2.29 4.31 6 25 0
2.92 4.5 7 26 6
14 27 0024559
3.06 4.51
24 28 0133457779
3.38 4.7 (5) 29 04677
3.76 4.74 21 30 0134699
14 31 1238
3.83 5
10 32 38
3.95 5.01 8 33 4
7 34 27
5 35 6
4 36 118
1 37 5
Tabla N°2. Medidas resumen para el peso (en Kg.) de los patos según raza
Raza x i x 2
i Q2
Muscovy 75.09 299.7393 4.04
Pekín 147.8 443.3536 2.92
a. ¿Cuál debe ser el peso mínimo para que un pato de la raza Pekín sea
considerado dentro del 30% de los patos con mayor peso?
77
UNA La Molina - Dpto. de Estadística e Informática Estadística General
d. ¿Cuál es la forma de la distribución de los pesos para cada una de las razas?
Justifique su respuesta.
78
UNA La Molina - Dpto. de Estadística e Informática Estadística General
e. Complete el siguiente diagrama de cajas para el peso (en Kg.) según tipo de
raza. Indique sus valores.
5.5
5.0
4.5
4.0
Datos
3.5
3.0
2.5
2.0
1.5
Muscovy Pekín
Cálculos:
79
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
7000
6000
5000
4000
3000
2000
1000
Medio-Alto Medio-Bajo
2. Una empresa que posee tres fábricas, ha observado el número de piezas diarias
producidas por cada una de ellas durante diez días elegidos al azar, obteniéndose
los siguientes resultados:
10
x
i 1
2
i
Fabrica A 103 106 105 102 108 109 101 110 105 107 111590
Fabrica B 115 112 99 98 107 113 108 114 96 94 112100
Fabrica C 92 97 103 89 106 108 116 87 128 130 113610
80
UNA La Molina - Dpto. de Estadística e Informática Estadística General
ANDINA INTI
Tallo y Hojas de Andina 0.68 0.94
Unidad de Hoja = 0.010
0.89 0.95
1 8 3 0.89 0.99
3 8 58
7 9 1234 0.89 0.99
(5) 9 56679
3 10 1 0.89 1.04
2 10 5 0.89 1.09
1 11
1 11 5 0.89 1.11
0.90 1.11
1.1
Peso (en kg.)
1.0
0.9
0.8
0.7
Andina Inti
2 0 68
(6) 1 022223
4 1 569
1 2
1 2 6
81
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Variedades
Variedad Kent Variedad Haden
N° de N° de
Rend. Rend.
Ha Ha Tallo y Hojas de Haden N = 22
1 9.0 12 13.1 Unidad de Hoja = 0.10
2 11.9 13 13.2
8 10 22388999
3 12.6 14 13.5
(6) 11 266888
4 12.6 15 13.5 8 12 2233
5 12.6 16 13.7 4 13 344
6 12.8 17 13.8 1 14
7 12.8 18 13.8 1 15
8 12.8 19 14.1 1 16 5
9 12.9 20 14.1
10 12.9 21 14.3
11 13.1 22 15.1
74 89 82 83 67 81 68 85 81 72
71 74 50 64 72 44 66 84 69 81
69 66 93 53 98 70 95 82 81 80
88 80 85 85 72 81 90 89 80 97
82
UNA La Molina - Dpto. de Estadística e Informática Estadística General
2.12 4.13 2 21 37
2.2 4.19 3 22 0
2.26 4.23 3 23
5 24 99
2.29 4.31 6 25 0
2.92 4.5 7 26 6
14 27 0024559
3.06 4.51
24 28 0133457779
3.38 4.7 (5) 29 04677
3.76 4.74 21 30 0134699
14 31 1238
3.83 5
10 32 38
3.95 5.01 8 33 4
7 34 27
5 35 6
4 36 118
1 37 5
Tabla N°2. Medidas resumen para el peso (en Kg.) de los patos según raza
Raza x i x 2
i Q2
Muscovy 75.09 299.7393 4.04
Pekín 147.8 443.3536 2.92
g. ¿Cuál debe ser el peso mínimo para que un pato de la raza Pekín sea
considerado dentro del 30% de los patos con mayor peso?
j. ¿Cuál es la forma de la distribución de los pesos para cada una de las razas?
Justifique su respuesta.
83
UNA La Molina - Dpto. de Estadística e Informática Estadística General
k. Complete el siguiente diagrama de cajas para el peso (en Kg.) según tipo de
raza. Indique sus valores.
5.5
5.0
4.5
4.0
Datos
3.5
3.0
2.5
2.0
1.5
Muscovy Pekín
84
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
85
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO VI
PROBABILIDAD
Objetivo. Conocer los conceptos básicos de las probabilidades; las reglas o axiomas
que la sustentan, así como, sus aplicaciones como medida de cuantificación de la
incertidumbre.
Supóngase que un conjunto está formado por grupos ordenados de n elementos (n-
upla) y que hay n1 posibles opciones para el primer elemento; por cada opción del
primer elemento hay n2 posibles opciones del segundo elemento;...; por cada posible
opción de los primeros n – 1 elementos hay nk opciones del elemento n.
Ejemplo 1
El propietario de una casa desea efectuar algunas remodelaciones y requiere los
servicios de un distribuidor de utensilios de cocina, de un contratista plomero y de un
contratista electricista. Si, en la zona, hay 8 distribuidores de utensilios de cocina, 10
contratistas plomeros y 5 contratistas electricistas. ¿De cuántas formas se pueden
seleccionar estos tres servicios?
86
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La regla de la adición
Si un experimento 1 ocurre de n1 formas, 2 de n2, ….., k de nk formas; entonces el
experimento que consiste en realizar 1 ó 2 ó ….. k (los experimentos no pueden
realizarse juntos) ocurre de n1 + n2 + … + nk formas.
Permutaciones
Sea el evento A = {Número de maneras que puede ocupar los 3 primeros puestos}
Total de equipos : N = 12
Seleccionar 3 equipos: n= 3
Ejercicio 3. Un club social está formado por 10 personas. ¿De cuántas maneras se
puede formar una comisión integrada por un presidente, un secretario y un vocal?
Casos especiales:
Ejemplo 3
Se tiene un grupo de 5 caballos para alquiler. Si llegan 5 personas para alquilar un
caballo cada una de ellas ¿De cuántas maneras se puede hacer el alquiler?
87
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 4
En la casa comercial “El Palco” hay 4 sinfonías N° 9 de Beethoven, 5 Sinfonías N° 100
de Haydn y 6 Sinfonías N° 36 de Mozart. Suponga que se seleccionan con restitución y
considerando el orden de extracción 8 de estas obras maestras.
8!
n A 45 53 P5,3
8
45 53 7168000
5! 3!
b. ¿De cuántas maneras serán seleccionadas 2 sinfonías de Beethoven, 2 de Haydn y 4
de Mozart?
8!
n A 42 52 64 P2,2,4
8
42 52 64 217728000
2! 2! 4!
Combinaciones
N N!
n n ! N n !
N N PnN N!
PnN n!
n n n! n ! N n !
Ejemplo 5
Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta
compañía presentan grietas en la parte inferior del bastidor principal. Suponga que una
ciudad tiene 18 de estos autobuses, y que han aparecido grietas en 5 de ellos.
a. ¿De cuántas formas se puede seleccionar sin restitución y sin considerar el orden
una muestra de 7 autobuses de los 18 para una inspección completa?
18 18 !
Sea el espacio muestral entonces n 31824
7 7 ! 11 !
5 13
n A 7150
3 4
88
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a. ¿De cuántas maneras puede escoger sin restitución y sin considerar el orden de
extracción a cinco karatecas para participar en un torneo?
b. ¿De cuántas maneras puede escoger sin restitución y sin considerar el orden de
extracción a cinco karatecas de tal manera que hayan 2 cinturones negros?
Ejemplo 6
Suponga los siguientes experimentos aleatorios:
E1 : Observar el número de la cara superior cuando se lanza un dado
E2 : Registrar el sexo del recién nacido
E3 : Observar el número de artículos defectuosos de un lote de 8.
E4 : Anotar el número de clientes que llegan a un supermercado en una semana
E5 : Observar el tiempo de duración de un foco de luz (horas)
Ejemplo 7
Los espacios muestrales asociados a los anteriores experimentos aleatorios son:
89
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 8
Si se observan los sexos de tres niños recién nacidos, el espacio muestral asociado
será:
= {MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF}, siendo: n(Ω)=8
Ejemplo 9
Considere dos fábricas tales que en cada una hay 6 máquinas que fabrican un producto.
Sea el experimento aleatorio que consiste en determinar el número de máquinas que
están en uso en un día particular. Un resultado experimental indica cuántas máquinas
están en uso en la primera fábrica y cuantas están en uso en la segunda (asuma que
los resultados son igualmente posibles). El espacio muestral será igual a:
Segunda fábrica
0 1 2 3 4 5 6
0 (0, 0) (0, 1) (0, 2) (0, 3) (0, 4) (0, 5) (0, 6)
1 (1, 0) (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)
Primera 2 (2, 0) (2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)
fábrica 3 (3, 0) (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
4 (4, 0) (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)
5 (5, 0) (5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)
6 (6, 0) (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
Eventos
Un evento es cualquier subconjunto de un espacio muestral. Se dice que un evento es
simple si está formado exactamente por un resultado y compuesto si consta de más de
un resultado. La cardinalidad de un evento se denota por: n(A)
Ejemplo 10
Si se observan los sexos de tres niños recién nacidos, el espacio muestral asociado
será:
Ejemplo 11
Con relación al ejemplo 9, hay 49 eventos simples. Ejemplos de eventos compuestos
son:
E = {(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)} = {el número de máquinas en
uso es el mismo para ambas fábricas}
F = {(0, 3), (3, 0), (1, 2), (2, 1)} = {el número total de máquinas en uso es tres}
G = {(0, 0), (0, 1), (1, 0), (1, 1)} = {a lo sumo una máquina está en uso en cada
fábrica}
90
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 12
En el Ejemplo 11 los eventos E y F son mutuamente excluyentes en cambio los eventos
E y G no son mutuamente excluyentes.
Ejemplo 13
En el Ejemplo 10 los eventos C y D no son colectivamente exhaustivos.
Evento complementario
91
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Se dice que es a priori por que antes de realizarse el experimento se puede determinar
cuál es la probabilidad de que ocurra A.
Ejemplo 15
Se tienen 4 cuyes de tipo I, 6 de tipo II y 7 de tipo III. Cinco cuyes son seleccionados al
azar.
Tipo I: 4 cuyes
Tipo II: 6 cuyes
Tipo III: 7 cuyes
92
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 6. Una urna contiene 8 bolas blancas y 6 bolas negras. Si se extraen al azar y
sin reemplazo 5 bolas de la urna. ¿Cuál es la probabilidad de que dos bolas sea de color
blanco?
93
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 16
La siguiente tabla de frecuencias corresponde a las temperaturas promedio de 24 horas
(C) registrados en cierto observatorio, en el mes de enero de cierto año:
La probabilidad estimada que en un día del mes de enero, la temperatura promedio sea
f 2 f3 f 4 3 12 13 28
por lo menos 20.9 C pero menor que 23.0 C es P A .
n 31 31
Note que esta probabilidad se obtiene después de realizarse el experimento.
Definición axiomática
Propiedades de probabilidad
94
UNA La Molina - Dpto. de Estadística e Informática Estadística General
A B
A Bc A B Ac B
Ac B c
Propiedades:
P A B P A PB P A B
P A Bc P A P A B
PA B PB P A B
c
PA B 1 P A B
c c
PA B 1 P A B
c c
Ejemplo 17
Los registros de una planta industrial indican que el 12% de todos los obreros
lesionados ingresan a un hospital para recibir tratamiento, el 16% regresa al trabajo al
día siguiente y el 2% ingresan a un hospital pero vuelven al trabajo al día siguiente. Si
un obrero se lesiona:
Ejemplo 18
Se ha realizado una encuesta para determinar la adicción de alguna droga en diferentes
profesionales. La encuesta se aplicó a 900 profesionales a los que se les preguntó si
consumen alguna droga, los resultados se muestran en la siguiente tabla:
Ejemplo 19
Se encuestó a 500 alumnos universitarios sobre cultura musical. 474 no identifican el
Concierto para piano y Orquesta de Grieg, 471 no identifican la Sinfonía N° 7 de
Beethoven y 450 no identifican ninguna de estas obras.
96
UNA La Molina - Dpto. de Estadística e Informática Estadística General
474 450 24
P A B c P A P A B 0.048
500 500 500
b. ¿Cuál es la probabilidad que haya leído “Ficciones” pero no “El Libro de Arena”
97
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 11. La unidad de rentas de un distrito de Lima, afirma que el 60% de los
contribuyentes han pagado el predial, el 20% arbitrios y el 8% ambos impuestos. Si se
selecciona un contribuyente al azar:
98
UNA La Molina - Dpto. de Estadística e Informática Estadística General
P A B
P A B
P B
Ejemplo 20
¿Qué es más probable? Que una persona cualquiera tenga cáncer pulmonar o que una
persona que fuma tenga cáncer pulmonar. Según los especialistas la probabilidad de
que tenga cáncer pulmonar una persona que fuma es mayor.
Ejemplo 21
La probabilidad que la construcción de un edificio termine a tiempo es 17/20, la
probabilidad que no haya huelga es 3/4 y la probabilidad que la construcción se
termine a tiempo dado que no hubo huelga es 14/15; la probabilidad que haya huelga y
no se termine la construcción a tiempo es 1/10. ¿Cuál es la probabilidad que
Solución:
Definimos los eventos:
A = La construcción se termina a tiempo.
B = No haya huelga.
Tenemos:
17 3 14 1
P( A) P( B) P( A / B) P( Ac B c )
20 4 15 10
14 3
a) P( A B) P( A / B) * P( B) * 0.7
15 4
7
P( A B)
b) P( B / A) 10 0.8235
P( A) 17
20
1
c P( A B )
c c
10 4 0.4
c) P( A c )
B P( B )
c
3 10
1
4
d)
c P( Ac B) P( B) P( A B) P( A B) 14
P( A ) 1 1 P( A / B) 1 0.0667
B P( B) P( B) P( B) 15
99
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 22
En una universidad el 70% de los estudiantes, son de Ciencias y el 30% de Letras; de
los estudiantes de Ciencias, el 60% son varones y los de Letras son varones el 40%. Si
se elige aleatoriamente un estudiante.
P( A B) 0.42
P( A / B) 0.778
P( B) 0.54
6.
P Ac B/ C PB / C P A B/ C
7. P A B / C P A / C PB / C P A B / C
Ejercicio 12. Una empresa de turismo vende tres planes de viajes para la ciudad del
Cusco y para la ciudad de Arequipa. En una encuesta realizada por internet, resultó la
siguiente tabla de los porcentajes de clientes con las preferencias de los planes y las
ciudades.
100
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a. ¿Cuál es la probabilidad de que desee viajar al Cusco y que no tenga preferencia por
el Plan 1?
Ejercicio 13. Durante el mes de diciembre del año pasado, el 50% de los clientes del
centro comercial PLAZUELA compraron el producto “W”, el 40% compraron el producto
“V”, y de los que compraron el producto “V”, el 20 % compraron el producto “W”.
101
UNA La Molina - Dpto. de Estadística e Informática Estadística General
P A B P A B
Se sabe que: P A B y PB A , de estas expresiones se
P B P A
P A B PB P A B
establece que:
P APB A
102
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 23
Si se eligen al azar 2 artículos de un cargamento de 250, de los cuales, 20 están
defectuosos. Halle la probabilidad de que ambos estén defectuosos si:
Ejemplo 24
Si se eligen al azar 3 artículos de un cargamento de 250, de los cuales, 20 están
defectuosos.
Sean los eventos A1,A2,...,Ak mutuamente excluyentes del espacio muestral Ω, esto es;
k
Ai Aj i j 1, 2, , k , y colectivamente exhaustivos A j A1 A2 Ak ,
j 1
k k
entonces: P Aj PAj . Luego, para cualquier otro evento B definido:
j 1 j 1
j 1
j 1
103
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 25
Suponga que una caja C1 contiene 4 esferas blancas y 2 azules y que otra caja C 2
contiene 4 esferas blancas y 6 azules. La probabilidad de elegir la caja C 1 es el doble de
probabilidad de elegir la caja C2. Si se elige al azar una caja y de ella se elige al azar
una esfera, halle la probabilidad que:
Solución
ul 2/6 = P(A/C1)
Az
1 2/3=P(C1)
ja
a Ca Blan 4/6 = P(B/C1)
l ca
ir
l eg
E
P(A/C2) =6/10
P(C2 A) 6 / 30
P(C2 / A) 3/8
P( A) 8 / 15 104
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 26
Los ingenieros de ventas 1, 2 y 3 estiman los costos de 30%, 20% y 50%,
respectivamente, de todos los trabajos licitados por una compañía. Las probabilidades
de cometer error grave, al estimar el costo, de los ingenieros son 0.01, 0.03 y 0.02
respectivamente.
Sean los eventos: Ai = {el ing. “i” estima los costos de una licitación}, i = 1, 2, 3
E = {Se comete error grave al estimar el costo}
Ejercicio 15. Una empresa manufacturera tiene dos máquinas (M1 y M2) para producir
un producto. El área de control de calidad a determinado que la máquina M1 produce el
60% de la producción total y la máquina M2 el restante. El 2% de las unidades
producidas por la máquina M1 son defectuosos, mientras que la máquina M2 tiene una
tasa de defectuosos del 4%. Si se selecciona un producto al azar:
105
UNA La Molina - Dpto. de Estadística e Informática Estadística General
b. ¿Cuál es la probabilidad de que haya sido producido por la máquina M1, si se sabe
que es defectuoso?
106
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Si el agricultor Juan Pérez acaba de realizar una compra por un monto de $180, ¿cuál
es lo más probable: qué haya pagado la compra, en efectivo, al crédito o con cheque?
Los eventos A y B son independientes si cuando ocurre uno de ellos esto no afecta la
probabilidad de ocurrencia del otro, o sea:
P A B P A
P B A P B
Entonces se cumple:
P A B c P A P ( B c )
P A c
B PA P( B)
c
P A c
B PA P( B )
c c c
P A B P A P ( B ) P A P ( B )
Ejercicio 18. En cierta ciudad la probabilidad de que llueva en un día cualquiera es 0.3
y de que ocurra un temblor en un día cualquiera es 0.4. Si estos eventos son
independientes. Calcule la probabilidad de que en un día cualquiera:
108
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 27
La probabilidad de que se presente determinada enfermedad es 1/500 y un test para
detectarla es 99% confiable (esto quiere decir que si una persona tiene la enfermedad
la probabilidad de que el test de positivo es 0.99 y si una persona no tiene la
enfermedad la probabilidad de que el test de negativo es 0.99).
P( A / B) 0.99
Confiable en este contexto significa:
P( A / B ) 0.99
c c
1
P B P A B 0.99
P B A 500 0.1655
P B P A B P Bc P A Bc 1
0.99
499
0.01
500 500
Solución
Independencia de k eventos
P A1 A2 Ak P A1 P A2 P Ak
Ejemplo 28
En cierta población la probabilidad de que una chica mida más de 1.75 m es 0.08; de
que tenga el cabello lacio es 0.22 y de que tenga un buen conocimiento de Estadística
es 0.18. Si estas cualidades son independientes.
a. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga las
tres cualidades.
Solución
Sean los eventos: M = {la chica mide más de 1.75}
L = {la chica tiene cabello lacio}
E = {la chica tiene un buen conocimiento de estadística}
T = {la chica tiene las tres cualidades}
b. Halle la probabilidad de que una chica, que va a ser seleccionada al azar, tenga
sólo 2 de estas cualidades. (queda como ejercicio)
110
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 4
Red Social
Frecuencia Menos de 3 Mayor o igual a 3 horas, pero Más de 6 Total
horas menor o igual a 6 horas horas
(T1) (T2) (T3)
Twitter (T) 25 20 40 85
Facebook (F) 30 30 60 120
WhatsApp(W) 50 35 50 135
Total 105 85 150 340
a) Calcule la probabilidad de que utilice Facebook o el tiempo que pasa en las redes
sociales sea más de 6 horas.
b) Calcule la probabilidad de que no utilice Twitter y el tiempo que pase en las redes
sociales de 3 a 6 horas.
d) Calcule la probabilidad de que no utilice Facebook y el tiempo que pase en las redes
sociales no sea menor a 3 horas
111
UNA La Molina - Dpto. de Estadística e Informática Estadística General
f) Si se sabe que el tiempo que pase en las redes sociales es más de 6 horas, calcule
la probabilidad que utilice Facebook.
g) Calcule la probabilidad de que el tiempo que pase en las redes sociales sea menos
de 3 horas o más de 6 horas, si se sabe que utiliza WhatsApp.
2. Suponga que una pollería tiene solamente dos locales: A y B. En el local A laboran
20 personas, de las cuales: 10 son meseros, 5 son cocineros, y 5 de limpieza. En el
local B laboran 16 personas, de las cuales: 9 son meseros, 4 son cocineros, y 3 de
limpieza.
112
UNA La Molina - Dpto. de Estadística e Informática Estadística General
113
UNA La Molina - Dpto. de Estadística e Informática Estadística General
114
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
7. La probabilidad de que un turista haga una reservación con más de una semana de
anticipación es del 10% y la probabilidad de que un turista se inscriba en el tour
completo ofrecido por el hotel es de 35%. Si la probabilidad de que se inscriba en el
tour completo ofrecido por el hotel o haga la reservación con más de una semana de
anticipación es del 40%, ¿Cuál es la probabilidad de que se inscriba en el tour
completo ofrecido por el hotel si se sabe que hizo la reservación con más de una
semana de anticipación?
115
UNA La Molina - Dpto. de Estadística e Informática Estadística General
b) Si P(Ac Bc) = 0.3, P(Ac Bc) = 0.9 y P(sólo el primer libro esté prestado)=0.4.
Calcular P(A) y P(B)
10. Una planta armadora recibe microcircuitos provenientes de tres distintos fabricantes
(A, B y C). El 52% del total de microcircuitos se compra de A, el 28% de B y el 20%
de C. El porcentaje de microcircuitos defectuosos para A, B y C son 4%, 8% y 10%
respectivamente. Si los microcircuitos se almacenan en la planta sin importar quién
fue el proveedor:
a) Diga, ¿cuál es la probabilidad que la planta no reciba microcircuitos del
fabricante B?
b) Si un circuito no está defectuoso, ¿cuál es la probabilidad de que no haya sido
vendido por el proveedor C?
11. Suponga que una empresa dedicada a realizar revisiones técnicas tiene dos talleres
A y B. Cada propietario o conductor elige al azar un taller para pasar por dos
exámenes 1 y 2. Un vehículo aprueba la revisión técnicas si aprueba los dos
exámenes. Para un vehículo que pasa por el taller A, la probabilidad que apruebe los
dos exámenes es 0.85 mientras que para un vehículo que pasa por el taller B la
probabilidad correspondiente es 0.9. Considerando que la elección del taller A es
igual de probable que la elección del taller B.
a) Halle la probabilidad que un vehículo apruebe la revisión técnica
b) Si se sabe que el vehículo desaprobó la revisión técnica, ¿cuál es la probabilidad
que haya escogido el taller B?
12. Un investigador afirma que, en cierta población, el 60% son hombres; el 70% de los
hombres y el 45% de las mujeres tienen un coeficiente intelectual menor que el
promedio. Si una persona de esa población tiene un coeficiente intelectual de por lo
menos el promedio ¿Cuál es la probabilidad de que sea hombre?
13. Una fábrica confecciona en un día determinado 400 prendas para varones y 600
para mujeres. La probabilidad de que una prenda de mujer tenga falla es de 0.01 y
la probabilidad de que una prenda de varón tenga falla es 0.02. Se elige de la
producción del día una prenda al azar
a) ¿Cuál es la probabilidad de que la prenda tenga falla?
b) Si la prenda elegida no tiene falla, ¿cuál es la probabilidad de que no sea de
mujer?
c) Se eligen cuatro prendas, ¿cuál es la probabilidad de que por lo menos una
prenda tenga fallas?
116
UNA La Molina - Dpto. de Estadística e Informática Estadística General
16. Un cazador dispara 7 balas a un león enfurecido. Si la probabilidad de que una bala
mate es 0.6. ¿Cuál es la probabilidad de que el cazador esté todavía vivo?
17. En cierta población de perros: el 40% son de raza Bóxer, 57% son machos y 32%
tienen más de dos años. Asuma que estas tres cualidades son independientes. Si
un perro va a ser seleccionado al azar calcule la probabilidad de que tenga sólo una
de estas cualidades.
20. Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos
graves. Se elige un artículo al azar. Encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga un defecto grave.
c) Que sea bueno o que tenga un defecto grave.
Si se escogen 2 artículos en vez de uno, calcule la probabilidad de que:
d) Ambos sean buenos.
e) A lo menos uno sea bueno.
f) A lo más uno sea bueno.
g) Ninguno tenga defectos graves.
23. Dos máquinas, A y B, producen el 35% y el 65% de las tuercas de una fábrica. Se
sabe que el 10% y el 15% de las tuercas de cada máquina son defectuosas.
a) Si en el mercado se encontró una tuerca defectuosa ¿Cuál es la probabilidad de
que haya sido producida por la máquina A?
b) Si en el mercado se seleccionaron independientemente dos tuercas y resultaron
defectuosas ¿Cuál es la probabilidad de que hayan sido producidas por la
máquina A?
117
UNA La Molina - Dpto. de Estadística e Informática Estadística General
26. En la Gerencia de CRM del Supermercado Desco trabajan diez Analistas. Seis de
ellos son informáticos y los otros cuatro son Industriales. Para implementar una
campaña comercial, se debe formar un equipo de cuatro miembros. ¿Cuál es la
probabilidad que hayan dos informáticos en este equipo de cuatro?
Tamaño de la tienda
Importancia en la Pequeña Mediana Grande Muy grande Total
publicidad (T1) (T2) (T3) (T4)
Nada importante (I1) 100 25 10 15 150
Importante (I2) 30 35 50 55 170
Muy Importante (I3) 20 40 60 80 200
Total 150 100 120 150 520
118
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a) Que no considere que es importante la publicidad pero tiene una tienda grande
b) Tenga una tienda mediana o considere nada importante la publicidad.
c) Que no considere muy importante la publicidad y no tenga una tienda muy grande
d) Considere muy importante la publicidad, si se sabe que no tiene una tienda muy
grande.
30. Los resultados de una encuesta sobre inseguridad ciudadana, indican que el 65%
de las personas han sufrido un robo, el 45% un asalto y el 35% un robo y asalto.
Si se selecciona a una persona al azar.
a) ¿Cuál es la probabilidad que haya sufrido un robo y no un asalto?
b) ¿Cuál es la probabilidad que no haya sufrido un robo o ni un asalto?.
31. Un comerciante adquiere sacos de azúcar de dos azucareras nacionales (A1 y A2).
Se sabe que el 68% de los sacos proviene de A1 y el resto de A2. Además, el 85%
de los sacos que recibe de A1 y el 92% que recibe de A2 son de calidad extra. Si un
saco de arroz se escoge al azar: (defina los respectivos eventos).
a. ¿Cuál es la probabilidad que sea de calidad extra?.
b. Sabiendo que es de calidad extra, ¿cuál es la probabilidad de que provenga de la
azucarera A1?.
c. Sabiendo que no es de calidad extra, ¿cuál es la probabilidad de que provenga de
la azucarera A2?.
32. Las personas sospechosas de incurrir en lavado de activos pueden ser investigadas
por Organismos Gubernamentales responsables. La probabilidad de ser investigada
por el organismo gubernamental A es 0.009 y la probabilidad de ser investigada por
el organismo gubernamental B es 0.018. Si estos eventos son independientes:
a) Calcule la probabilidad de que la persona sospechosa sea investigada por el
organismo gubernamental A pero no por el B.
b) Calcule la probabilidad de que un persona sospechosa sea investigada por el
organismo gubernamental A o por el B.
119
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
_________________ siendo P( Ac ) 0 .
6. Si los eventos A y B definidos en el espacio muestral Ω son independientes,
entonces P(Ac/B) es igual a _____________________
7. En una encuesta por teléfono aplicada a los egresados de una entidad educativa
superior, se encontró que el 66% de los encuestados prefieren ahorrar para comprar
su carro, el 46% para estudiar una maestría y el 16% para ambas cosas. Si se
seleccionada al azar a un egresado encuestado, la probabilidad de que no ahorre
para comprar su carro ni para estudiar una maestría es igual a
______________________________________ .
8. Si P(T)=0.25 y P(S)=0.75, sabiendo que los eventos T y S son independientes,
entonces P(T ᴜ Sc) es igual a: ______________________.
9. En un programa de asistencia técnica han participado 120 agricultores en la
capacitación de dos técnicas de manejo de cultivo de frijol (A y B). Se sabe que 80
agricultores han usado la técnica A y el resto la B. De los que usaron la técnica A, el
65% han conseguido aumentar el rendimiento del cultivo de frijol y de los que
usaron la técnica B sólo el 35% consiguieron aumentar su rendimiento. Si se
selecciona al azar a un agricultor que participó el programa, la probabilidad que
haya aumentado su rendimiento de frijol es igual a : _______________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
Item Enunciado V/F
a. Para N objetos tomados de n en n, se pude decir que el número de
combinaciones es mayor al número de permutaciones.
b. Se dice que la probabilidad clásica que es a priori, porque se pude
calcular la probabilidad de un evento antes de realizar el experimento.
c. Para dos eventos A y B Ω, los axiomas de la definición clásica
corresponden a: P(A)≥0, P(B)≥0;P(AᴜB)=1 y A∩B=Φ.
d. Sean los eventos A1, A2, y A3 definidos sobre Ω, entonces si se cumple
que A1 ᴜ A2 ᴜ Ak = Ω se puede afirmar que los eventos forman una
partición de Ω.
e. Si los eventos A y B son mutuamente excluyentes, entonces también se
pude decir que son independientes.
120
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO VII
VARIABLES ALEATORIAS
Una variable aleatoria es cualquier función que tiene como dominio a los elementos que
constituyen el espacio muestral de un experimento aleatorio y como rango a un
subconjunto de los reales.
Ejemplo 1
Sea el experimento aleatorio registrar los sexos de los próximos tres niños que van a
nacer. Si se define la v.a.d. Y como el número de niños de sexo femenino que nacerán.
Halle el dominio y el rango de Y.
Solución:
={ MMM, MMF, MFM, FMM, MFF, FMF, FFM, FFF }
Y(MMM) =0
Y(MMF) = Y(MFM) = Y(FMM) =1
Y(MFF) = Y(FMF) = Y(FFM) =2
Y(FFF) =3
Entonces RY = {0, 1, 2, 3}
MMM 0 RY
MMF
MFM 1
FMM
Y
MFF
FMF 2
FFM
FFF 3
121
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 2
Se va a registrar la variable aleatoria X definida como el número de autos que llegan
por cada hora a una playa de estacionamiento entonces el dominio de X será el
conjunto de todas las horas en estudio y el rango RX = {0, 1, 2, }
Ejemplo 3
Se desea determinar el pH de un compuesto químico seleccionado al azar, entonces la
variable aleatoria X definida como el pH del compuesto es una variable aleatoria
continua con rango 0,14
Sea X una variable aleatoria discreta. Se denomina función (ley, modelo o distribución)
de probabilidad de X a la función f x definida por f x P X x para todo número
real x, que satisface las siguientes condiciones:
i) f x 0 para x Rx
ii ) f x 0 para x Rx
iii ) f x 1
xi RX
i
Ejemplo 4
Con relación al Ejemplo 1, halle la función de probabilidad de la v.a.d Y definida como el
número de niños de sexo femenino que nacerán, asumiendo que los eventos simples
son igualmente probables (o que P(M)=P(F)=1/2 y que M y F son eventos
independientes).
Y 0 1 2 3
f y PY y 1/8 3/8 3/8 1/8
1
8 x 0,3
3
Otra forma de representar: f x P X x , x 1,2
8
0, otros valores de x
1 3 3 1
Se cumple que: f x f 0 f 1 f 2 f 3 8 8 8 8 1
xRX
122
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 5
El número de unidades vendidas por día del artículo Z es una variable aleatoria tiene la
siguiente función de probabilidad:
c, x 1, 2
1
, x 3, 4
f x P X x 8
2c, x 5, 6
0, otros valores de x
Determine el valor de c.
Solución
Por propiedad:
1 1
f x 1 f 1 f 2 f 3 f 4 f 5 f 6 c c 8 8 2c 2c 1
xR X
1
resolviendo la ecuación resulta c .
8
Ejemplo 6
Se tienen 6 impresoras, de las cuales 2 están defectuosas. Si se seleccionan 3 de ellas,
sin reemplazo, determine la función de probabilidad de la variable aleatoria definida
como el número de impresoras defectuosas seleccionadas.
Solución
Sean los eventos: D0 = {obtener 0 impresoras defectuosas y 3 no defectuosas}
D1 = {obtener 1 impresora defectuosa y 2 no defectuosas}
D2 = {obtener 2 impresoras defectuosas y 1 no defectuosa}
123
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 1. Una muestra aleatoria con reposición de tamaño n=2 se selecciona del
conjunto {1,2,3} obteniéndose un espacio muestral:
Ejercicio 2. Un dispositivo está compuesto por tres elementos (A, B y C) que trabajan
independientemente. La probabilidad de falla de cada elemento en una prueba es 0.1.
124
UNA La Molina - Dpto. de Estadística e Informática Estadística General
0.5k x 0;1
k x 2;3
P X x
2.0k x4
0 otra manera
b. Si se escoge al azar una familia, ¿cuál es la probabilidad de que tenga por lo menos
dos hijos?
X n 1 bn 1 a n 1
b b
a X dx n 1
n
Usando el operador integral:
a n 1
125
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 7
Suponga que el tiempo, en horas, que necesita un técnico para reparar cierta avería de
un artefacto eléctrico es una variable aleatoria que tiene la siguiente función de
densidad:
k 6 x , 1 x 3
f x
0 , para otros valores de x
1
6 x , 1 x 3
Entonces la función de densidad: f x 8
0 , para otros valores de x
b. Calcule la probabilidad de que un técnico demore por lo menos 1.8 horas pero
menos de 2 horas en reparar esa avería.
2 2
1
A x 1.8 x 2 P A P 1.8 X 2 f x dx 8 6 x dx 0.1025
1.8 1.8
c. ¿Cuál es el tiempo máximo que necesita un técnico para reparar cierta avería de
un artefacto eléctrico para estar dentro del 18% de los que usan menor tiempo?
1
6 x dx 0.18
k
P( X k )
1 8
k 1.26 horas
Ejercicio 4. Sea la V.A. X: Peso de un artículo (Kg), cuya función de densidad está
dada por:
2
x, 1 x 2
f ( x) 3
0 Otro caso
126
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La media de una v.a X, que tiene como función de probabilidad f x , está dada por:
X2 Var X E X X 2 E( X 2 ) ( E( X ))2 E( X 2 ) 2
127
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Propiedades de la variancia
La variancia es un número real positivo que cumple con las siguientes propiedades:
c. Var c X c2 Var X
3. Si X e Y son v.a. independientes y c, d son constantes reales, entonces:
Var c X d Y c 2 Var X d 2 Var Y .
Ejemplo 8
Suponga que una librería compra 6 ejemplares de un libro y el número de ejemplares
vendidos en tres meses, tiene la siguiente función de probabilidad:
X 1 2 3 4 5 6
f x 1/8 1/8 1/8 1/8 2/8 2/8
1 1 1 1 2 2
X E X x f x 1 8 2 8 3 8 4 8 5 8 6 8 4 unidades
xR X
X 3
CVX 100 100 43.3 %
X 4
d. Suponga que la librería compra 6 ejemplares de un libro a $10.00 cada uno, para
venderlos a $20.00 teniendo en cuenta que al terminar el periodo de 3 meses,
cualquier ejemplar no vendido se venderá a $7.00. Calcule la media, la variancia y
el coeficiente de variación de la utilidad neta.
128
UNA La Molina - Dpto. de Estadística e Informática Estadística General
507
CVU = 100 66.2 %
34
e. Calcule la probabilidad de que la utilidad neta sea mayor que 34.
2 2
PU 34 P13 X 18 34 P X 4 P X 5 P X 6 0.5
8 8
0.1, x 0
kx, x 1,2
f ( x) P( X x)
k (5 x), x 3,4
0 otro caso
129
UNA La Molina - Dpto. de Estadística e Informática Estadística General
d. Si la empresa estima que la perdida por cada artículo defectuoso por día es de
$25.0 y un gasto de reenvió de $4.5. Halle la pérdida media y el coeficiente de
variabilidad.
Ejemplo 9
La v.a. continua X definida como la proporción de accidentes fatales por mes que
ocurren en determinada ciudad tiene como función de densidad:
2 x , para 0 x 1
f x
0 , para otros valores de x
a. Calcule la probabilidad de que la proporción de accidentes por mes sea menor que
0.4
0.4 0.4 0.4
x2 0.4
P X 0.4 P 0 X 0.4 f x dx 2 x dx 2 x 2 0.16
2 0
0
0 0
0.4
P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 P 0 X 0.4 f x dx 0.16
0
b. Encuentre la proporción media de accidentes fatales por mes en esa ciudad.
1 1
2 3 1 2
X E X x f x dx x 2 x dx 2 x 2 dx x
0 0
3 0 3
c. Halle la variancia de X.
1 1
2 4 1 1
EX2 x 2 f x dx x 2 2 x dx 2 x3 dx x
0 0
4 0 2
2
1 2 1
X2 E X 2 E X
2
2 3 18
E(Y)=E(0.8X-0.02)=0.8E(X)-0.02= 0.5133
1
Var(Y)=Var(0.8X-0.02)= 0.8
2
Var X 0.82 0.0356
18
e. Halle la P Y 0.3
P Y 0.3 = P 0.8 X 0.02 0.3 P X 0.4 0.16
130
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 6. Se sabe que el tiempo (en minutos) que demora un automóvil en pasar la
revisión técnica, es una variable aleatoria que tiene la siguiente función de densidad.
x
20 x 40
f ( x) 600
0 otro caso
a. ¿Cuál es la probabilidad de que un automóvil tarde en pasar la revisión técnica
menos de 32 minutos?.
131
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media, la variancia y coeficiente de variación de X.
b) Si en una semana se sabe que ocurrió al menos un accidente, ¿cuál es la
probabilidad de que en dicha semana haya ocurrido exactamente uno?
c) Si la empresa incurre en una pérdida semanal Y (soles) según el número de
accidentes dada por: Y = 10 + 8X. Hallar la pérdida esperada semanal.
k x 1 , para 1 x 3
f x
0 , para otros valores de x
a) Halle el valor de k.
b) Calcule la probabilidad de que una parcela tenga una producción de por lo
menos 1500 Kilos pero menos de 2000 Kilos.
132
UNA La Molina - Dpto. de Estadística e Informática Estadística General
x 8
, para 8 x 10
f ( x) 2
0 , de otro modo
a) Calcule E(X) y Var(X).
b) Si el precio de venta es de 2 u.m. y el costo es de 1 u.m, garantizando un
reintegro cuando el peso es menor de 8.25 Kg. Halle la utilidad esperada por
artículo.
6. Suponga que el número de accidentes por semana que ocurren en una empresa es
una variable aleatoria X con función de distribución de probabilidades dada por:
X 0 1 2 3 Otros valores
f(x) 0.28 0.35 0.22 0.15 0
a) Hallar la media y la variancia de X.
b) La empresa incurre en una pérdida semanal Y según el número de accidentes
dada por Y = 10 + 8X. Hallar la pérdida esperada semanal.
c) Determinar la función de distribución acumulada.
d) Si en una semana se sabe que ocurrió al menos un accidente, ¿cuál es la
probabilidad de que haya ocurrido exactamente uno?
7. Juan Quispe planea gastar su gratificación en comprar un Blue Ray en Jim´s Video
Service a un precio de US$300. Ahora tiene la opción de comprar una póliza de
servicio extendido que ofrece cinco años de cobertura por US$100. Después de
conversar con sus amigos y leer los informes, Juan cree que puede incurrir en los
siguientes gastos de mantenimiento durante los próximos cinco años:
xi p(xi)
0 a/9
1 2a/9
2 5a/9
3 a/9
a) Hallar a.
b) Hallar E(x) y V(X).
c) Hallar: E(Y) y V(Y), donde Y= 3X+4.
d) Calcular P(Y>1)
133
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
a) b)
X 2 4 6 8 10 X -1 0 1 2
f(x) 0.2 0.2 0.2 0.2 0.2 f(x) 0.25 0.25 0.25 0.25
c) d)
X 10 20 30 40 X 0 1
f(x) 0.2 0.2 0.2 0.2 f(x) -0.5 0.5
________________________________________________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
134
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO VIII
Objetivo. Identificar y aplicar una variable aleatoria discreta, asociada alguna de las
principales distribuciones discretas estudiadas.
Experimento Binomial
Ejemplo 1
En una tienda la llegada de un cliente y determinar si compra o no es un experimento
de Bernoulli donde éxito: E = {un cliente compra} y fracaso: F = {un cliente no
compra}. Se sabe que el 75% de los clientes que llegan hacen una compra, entonces
PE = 0.75.
Si a la tienda llegan 20 clientes, este sería un experimento binomial donde n=20 y =
0.75
n x
1
n x
x 0, 1, 2, , n
f x P X x x
0 de otro mod o
Notación: X ~ Binomial n ,
La Media y la Variancia de X
Ejemplo 2
Un examen consta de n = 25 preguntas, cada una de las cuales tiene 5 alternativas de
las cuales sólo una es correcta, si una persona está adivinando al responder y se desea
saber el número de respuestas correctamente respondidas.
P(3 X 5) P(3 X 4) P( X 3) P( X 4)
C325 0.23 0.822 C425 0.24 0.821 0.1358 0.3225
Ejemplo 3
Siguiendo con el Ejemplo 1.
Éxito: E={un cliente compra} y fracaso: F ={un cliente no compra}. Se sabe que el
75% de los clientes que llegan hacen una compra, entonces PE = 0.75.
Si a la tienda llegan 20 clientes, este sería un experimento Binomial con n=20 y =
0.75.
Solución.
Sea v.a. X=El número de clientes que hacen una compra. La distribución de
20
probabilidades se define: f x 0.75x 0.2520 x x 0,1, 2, ...,2 0
x
La probabilidad de que el número de clientes que hacen una compra sea mayor que 18
sería:
20 20
P( X 18) 0.75190.251 0.75200.250 0.0211 0.0032 0.0243
19 20
Ejemplo 4
Una compañía vendedora de equipos electrónicos verifica que de todas las máquinas
por ella instaladas, el 40 % exigen nuevos ajustes después de su instalación. Si 5
máquinas fueron seleccionadas al azar:
136
UNA La Molina - Dpto. de Estadística e Informática Estadística General
5
f x 0.4 x 0.65 x x 0,1, 2, 3, 4, 5
x
5
5
P X 3 f 3 f 4 f 5 0.4 x 0.65 x 0.2304 0.0768 0.0102 0.3174
x 3 x
b. La compañía estima que el costo del ajuste después de la instalación es de 100 um
por máquina y que este costo lo debe pagar la compañía ¿Cuál es el costo esperado
para la firma?
Solución.-
Sea la v.a. Y definida como el costo de las máquinas que necesitan ajuste en un
grupo de 5.
Y = 100 X y como:
X ~ Bin n , , entonces E X n 5 0.4 2 por lo tanto:
Ejemplo 5
El gimnasio “El Rápido” ha comprobado que el 20% de sus alumnos se dan de baja
durante el primer mes y el 80% restante permanecen todo el año. Suponga que este
año se inscribieron 20 alumnos.
P(Y=12) = 0.02216088
c. Al hacer la inscripción se realiza un único pago anual de $ 600. Si cada alumno que
permanece todo el año genera un gasto anual para el gimnasio de $ 150, ¿cuál es el
beneficio anual esperado para el gimnasio?
137
UNA La Molina - Dpto. de Estadística e Informática Estadística General
138
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 2. Una institución educativa conmemora sus 100 años de fundación, con tal
motivo la junta directiva ha invitado a sus 25 profesores fundadores a la ceremonia
principal. Se cree que la probabilidad de que un profesor fundador asista a la ceremonia
es de 0.75.
c. La empresa que da servicios de buffet cobra por persona $35, halle el costo
esperado para la ceremonia.
Ejercicio 3. Un inspector de la SUNAT realiza 12 visitas cada día a las bodegas de Lima
Metropolitana, aplicando una multa a las bodegas que no entregaron el comprobante de
venta. Sabiendo que la probabilidad de que una bodega sea multada es igual a 0.15.
b. Halle la probabilidad de que se multen más de tres pero menos de seis bodegas
139
UNA La Molina - Dpto. de Estadística e Informática Estadística General
A N A
f x P X x
x n x
para x entero t.q máx0, n A N x min n, A
N
n
La Media y la Variancia de X
A A N n
EX n , 2 Var X n 1
A
Si X ~ Hiper N , n, A entonces:
N N N N 1
140
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 6
Un embarque de sustancias químicas llega en 15 contenedores, 2 de los cuales no
cumplen con los requerimientos de pureza. Se eligen 3 contenedores al azar, sin
reemplazo, para hacer una inspección de la pureza del producto. Calcule la probabilidad
de que al menos uno de los contenedores que no cumplen los requerimientos esté en la
muestra.
Ejemplo 7
Una estación experimental se compone de 4 ingenieros agrónomos y 9 técnicos
agrícolas. Si se elige al azar y sin reemplazo a 3 individuos para asignarlos a un trabajo
de campo, ¿cuál es la probabilidad que el grupo asignado al trabajo de campo incluya al
menos 2 ingenieros agrónomos?
x ~ H 13,3, 4 N 13 , n 3 , A 4 , x=0,1,2,3
13 4 4 13 4 4
3 2 2 3 3 3
px 2 px 2 px 3 0.189 0.014 0.203
13 13
3 3
Ejemplo 8
Un determinado antibiótico es empacado en cajas de 20 botellas. Suponga que una
caja, la cual es enviada a una farmacia hay 5 botellas mal envasadas. El dueño de la
farmacia sospecha que la cantidad de antibiótico en algunos de frascos es insuficiente
por lo selecciona al azar y sin reemplazo una muestra de tres frascos y decide que si
encuentra la mitad o más de frascos mal envasados en esa muestra cambiará de
distribuidor. ¿Cuál es la probabilidad de que el dueño de la farmacia no cambie de
distribuidor?
Solución.-
N 20 n 3 A=5 N-A = 15 x 0,1,2,3
5 15 5 15
0 3 1 2 =0.859
P( x 2) P( x 0) P( x 1)
20
3
141
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a.
142
UNA La Molina - Dpto. de Estadística e Informática Estadística General
b. El usuario regresa las defectuosas para su reparación. Se sabe que cuesta 50 u.m.
reparar cada impresora. Calcule el promedio y la variancia del costo total de
reparación.
Ejercicio 7. Un ingeniero zootecnista sabe que en cierta región hay 8 individuos de una
especie de mamífero, de los cuales cinco son machos y el resto son hembras. Si
selecciona al azar a cuatro individuos y observa el número de machos seleccionados.
143
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La Media y la Variancia de X
144
UNA La Molina - Dpto. de Estadística e Informática Estadística General
e 20 20 y
f y P Y y y 0, 1, 2,
y !
e 20 207
P Y 7 0.00052
7 !
e 10 k 10k
z
f z PZ z z 0, 1, 2,
z !
10k
0
e 10 k
P Z 0 e10 k 0.9 k 0.0105 horas
0 !
Nota: La ecuación anterior se resolvió tomando logaritmos.
Ejemplo 10
Se cree que el número promedio de individuos por cada 2 km 2 de cierta especie de
mamífero que habita en las alturas de cierta región es de 1.2.
145
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 8.
Se sabe que el número de encuestas digitadas es una variable aleatoria que sigue un
proceso de Poisson con una media de 6 encuestas digitadas por hora.
146
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 9. El número de barcos que llegan a un puerto cada semana es una variable
aleatoria que tiene distribución de Poisson con media igual a 9 barcos.
c. Un aduanero sabe que el costo de mantenimiento del puerto por semana está en
función del número de barcos que arriban, si no llegan barcos el costo es de 2 mil
soles si llega un barco el costo es de 3 mil soles y si llegan dos o más barcos el
costo es de 5 mil soles. Halle la distribución del costo y el costo esperado por
mantenimiento del puerto por semana.
147
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 5
f(x) 0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 2 4 6 8 10
Número de reclamos
148
UNA La Molina - Dpto. de Estadística e Informática Estadística General
2. En el día de estreno de la película Star War, se formaron grandes colas para sacar
una entrada. Se sabe que el tiempo (en minutos) que demoró un espectador en
comprar una entrada de la película es una variable aleatoria que tiene la siguiente
función de probabilidad.
1
x, 8 x 12
f ( x) 40
0 otro caso
149
UNA La Molina - Dpto. de Estadística e Informática Estadística General
b. Halle la probabilidad que al menos dos locales no cumplan con las normas de
seguridad.
c. Halle la probabilidad de que más de tres pero menos de siete locales no cumplan
con las normas de seguridad.
d. Halle la probabilidad que a lo más 8 de los locales cumplan con las normas de
seguridad.
150
UNA La Molina - Dpto. de Estadística e Informática Estadística General
e. Si el costo por persona para asistir al curso es $350 más $50 por movilidad.
¿Cuál es el costo esperado que pagará la entidad estatal para que asistan al
curso los ingenieros agrícolas?.
151
UNA La Molina - Dpto. de Estadística e Informática Estadística General
b. Calcule la probabilidad de que llegue como máximo tres mensaje en una hora.
152
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
2. El número de rayos gamma emitidos por segundo, por cierto sustancia radioactiva
es una variable aleatoria que tiene una distribución de Poisson con parámetro igual
a 5.6. Si un instrumento de medida se daña cuando recibe por lo menos 3
radiaciones por segundo. ¿Cuál es la probabilidad que este instrumento se dañe?
4. Juan es un dentista que atiende todos los días a sus clientes de 9:00 am a 4:00pm y
se ha registrado el número de clientes atendidos cada tres días, en una muestra de
tamaño 5 obteniéndose: 18, 21, 19, 20 y 17. Se sabe que el número de clientes que
van a consultar sigue una distribución de Poisson.
5. En una población de drosóphila, que ataca a cierta variedad de fruta, se sabe que el
25% ha desarrollado mutación en las alas. Si se escogen aleatoriamente 6 moscas
de esta población:
a. ¿Cuál es la probabilidad de que 2 de estas moscas presenten mutación de alas?
b. ¿Cuál es la probabilidad que más de tres presenten mutación de alas?
c. ¿Cuál es la probabilidad que a lo más una mosca presente mutación de alas?
d. Si se sabe que más de una presenta mutación de alas, ¿Cuál es la probabilidad
que como máximo 4 presenten mutación de alas?
9. Dos cápsulas se seleccionan sin reemplazo de un frasco que contiene tres aspirinas,
dos sedantes y cuatro cápsulas laxantes. ¿Cuál es la probabilidad de no seleccionar
aspirinas?
153
UNA La Molina - Dpto. de Estadística e Informática Estadística General
10. Se sabe que en el centro de Lima ocurre en promedio un asalto cada dos minutos
entre las 6:00 p.m. y las 8:00 p.m. María sale de su trabajo a las 6:30 p.m. y debe
caminar desde la Plaza San Martín hasta la Av. Tacna con dirección hacia el
paradero. Si el trayecto le toma 4 minutos. ¿Cuál es la probabilidad que María llegue
a su paradero sin que haya ocurrido algún asalto?
13. Según una encuesta hecha a un grupo de 10 personas, seis de ellas prefieren la
gaseosa Inca Kola y 4 de ellas Coca Cola. Si se seleccionan a 3 personas de ese
grupo. ¿Cuál es la probabilidad de que hayan 2 que les guste Inca Kola?
14. Se sabe, por experiencia, que el 42% de todas las personas que reciben un ejemplar
gratuito de una revista se suscriben a ella, calcule la probabilidad de que, a lo más 3
de las 6 personas seleccionadas al azar que reciben un ejemplar gratuito de una
revista se suscriben a la revista.
15. Si el número de solicitudes de información sobre cruceros que recibe una agencia de
viajes por día es una variable que tiene una distribución de Poisson con variancia
2.4. Halle la probabilidad de que:
16. Se cree que el número promedio de individuos por cada 2 km2 de cierta especie de
mamífero que habita en las alturas de cierta región es de 1.2. Además se conoce
que el número de individuos por área de esa región tiene una distribución de
Poisson.
a. En una zona de 2.8 km2, cuántos individuos esperaríamos en promedio
encontrar.
b. Si se observa un área de 3 km2 en dicha región, ¿cuál es la probabilidad que se
encuentren más de 3 individuos de esta especie?
c. Si se selecciona dos áreas independientemente de 3km 2 cada una. ¿Cuál es la
probabilidad que en cada una de estas áreas no haya más de 2 individuos?
154
UNA La Molina - Dpto. de Estadística e Informática Estadística General
19. Los agricultores de una región están preocupados por la calidad de sus cosechas,
ya que se ha detectado en ciertas áreas la existencia de sustancias contaminantes
en el suelo. Para analizarla, se segmenta la tierra en parcelas de 100 m 2, y se
concluye que hay una probabilidad de 0.6 de encontrar estos contaminantes en una
determinada parcela. Se pide:
a) Si un agricultor posee 15 de estas parcelas. ¿Qué probabilidad hay de que tenga
alguna parcela contaminada?
b) Una comunidad posee 100 parcelas del tipo anterior. ¿Qué probabilidad hay de
que tenga entre 10 y 15 parcelas contaminadas?
c) Si por cada parcela contaminada la cooperativa sufre una pérdida de 1000
nuevos soles, ¿cuál es la pérdida que la comunidad espera tener?.
20. El gerente de una empresa dedicada realizar copias de CD sabe por información
histórica el 93% de los CD que provee la compañía Lotus international son no
defectuosos. Si selecciona al azar 5 CD, ¿cuál es la probabilidad que 3 sean no
defectuosos, si se sabe que al menos uno es no defectuoso?
21. Por factores internacionales el precio del petróleo ha sufrido ciertas variaciones en
los últimos meses. REPLUSA ha determinado que la probabilidad de que varíe el
precio del petróleo es de 0.60. Si se va a realizar 10 compras de petróleo:
¿Cuál es la probabilidad que el número compras de petróleo donde el precio tiene
variación sea menor que su esperado?
22. Los camiones que reparten el combustible a los diferentes grifos de la capital llegan
a las instalaciones de la refinería a un promedio de tres cada 20 minutos. Si las
instalaciones sólo tienen capacidad para recibir 10 camiones por hora, ¿cuál es la
probabilidad de que una hora los camiones tengan que regresar en otro momento?
f(x) 0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
0 2 4 6 8 10
Número de reclamos
155
UNA La Molina - Dpto. de Estadística e Informática Estadística General
24. En el día de estreno de la película Star War, se formaron grandes colas para sacar
una entrada. Se sabe que el tiempo (en minutos) que demoró un espectador en
comprar una entrada de la película es una variable aleatoria que tiene la siguiente
función de probabilidad.
1
x, 8 x 12
f ( x) 40
0 otro caso
a) ¿Cuál es la probabilidad de que un espectador demore un tiempo menor a
10 minutos en comprar una entrada a la película de estreno?
b) Halle el tiempo esperado y su coeficiente de variación
c) Si se extrae una muestra de 6 espectadores, halle la probabilidad que dos
hayan demorado más de 10 minutos en comprar una entrada para la
película de estreno.
27. Una empresa que ofrece los servicios de la tecnología de Computación en la Nube
(Cloud Computing), desea analizar la capacidad de sus servidores con la finalidad
de ampliar los servicios a pequeñas empresas del interior del país. Si se sabe que el
número de mensajes que llegan a su servidor central, lo hacen de acuerdo con una
distribución de Poisson con una tasa promedio de 1.5 mensajes por minuto.
a. Calcule la probabilidad de que llegue al menos dos mensaje en media hora.
b. Calcule la probabilidad de que llegue como máximo tres mensaje en una hora.
c. Si se sabe que ya llegaron al menos tres mensajes, calcule la probabilidad que
lleguen a lo más seis mensajes en 10 minutos
156
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
5. Si en una poza de crianza hay 200 truchas, de las cuales el 45% son hembras. Si se
toma una muestra aleatoria con reemplazo de 20 truchas, la variable aleatoria
número de truchas hembras tiene una distribución _________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
157
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO IX
DISTRIBUCIONES CONTINUAS
Objetivo. Al finalizar este capítulo el lector conocerá los conceptos y aplicaciones de las
principales distribuciones continuas.
1 x /
e para x 0; 0
f ( x)
0
para cualquier otro caso
Su notación: X ~ E(β)
Gráficamente se representa:
1 e x / para x 0; 0
F ( x) P( X x) <
0 para x < 0
158
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 1
El tiempo de demora en entregar una pizza tiene distribución exponencial con media
igual a 25 minutos. Si la pizzería ofrece su producto con la promoción “si recibe su pizza
después de 30 minutos usted no paga nada”. Calcule:
Solución:
a) Sea X: tiempo de demora en entregar una pizza
X~ E(25)
30 30
P(pizza gratis) = P(X>30) = 1- P(X≤30) = 1 (1 e 25
)e 25
0.3012
159
UNA La Molina - Dpto. de Estadística e Informática Estadística General
c. ¿Cuál debe ser el tiempo como mínimo para ser considerado un proceso de
congelamiento, dentro del 20% de mayores tiempos?
La Distribución Normal fue hallada por primera vez en 1733, por A. De Moivre. Pero el
descubrimiento de De Moivre al parecer pasó inadvertido y fue “redescubierta” por C.F
Gauss en 1809 y P.S Laplace en 1780 hizo trabajos preliminares que profundizó en
1812.
2
1 x
1
f x e 2
, x > 0
2
Notación: X N( , 2)
160
UNA La Molina - Dpto. de Estadística e Informática Estadística General
En el gráfico anterior se aprecia dos distribuciones normales con igual promedio pero
diferente desviación estándar (a menor desviación estándar los datos están más cerca
de la media)
1 12 z2
f z e , z
2
Prueba
X X EX
E Z E E 0
X X Var X
2
Var Z Var Var 1
2 2
Esta prueba es incompleta porque sólo demuestra que la media y la variancia de Z son
0 y 1 respectivamente pero no demuestra que Z tiene distribución normal (esto es tema
de un libro de Estadística Matemática).
161
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 2
La estatura de los estudiantes universitarios de cierto país está normalmente distribuida
con una media de 167.85 cm y desviación estándar 10.37 cm.
X 152 167.85
P X 152 P P Z 1.53 1 P Z 1.53 1 0.0630 0.9370
10.37
c. Si se está buscando estudiantes universitarios que midan entre 165 y 195 cm para
un casting de TV ¿Qué porcentaje de estudiantes cumplen con esa condición?
162
UNA La Molina - Dpto. de Estadística e Informática Estadística General
7
e. ¿Cuál es la altura mínima que debe tener un bus de transporte para que el 97.06%
de los estudiantes viaje de pie sin dificultad?
Ejercicio 2. El tiempo que se demora en entregar una pizza tiene una distribución
normal con media 25 minutos y una desviación estándar 4.5 minutos. Si la pizzería
ofrece su producto con la promoción “si recibe su pizza después de 30 minutos usted no
paga nada”.
b. ¿Cuál será el tiempo como mínimo, para considerar un pedido de pizza dentro del
25% de mayor tiempo?
163
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 3. El peso de los huevos de gallina producidos por cierta granja sigue una
distribución normal de media 65 g y desviación estándar 6 g. Si se selecciona al azar un
huevo:
b. Halle la probabilidad que el peso de los huevos sea mayor a 60 pero menos a 74 g.
164
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Definición de Estadístico
Ejemplo 3
La media muestral X , es un estadístico (variable aleatoria) y x , es el valor calculado
del estadístico. La variancia muestral S2, es un estadístico (variable aleatoria) , y s 2 es
el valor calculado del estadístico. La proporción muestral p, es un estadístico (variable
aleatoria).
Si el muestreo es con reemplazo de una población finita o con o sin reemplazo de una
población infinita:
2
b.
Var X X2
n
y X
n
165
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 4
El tiempo que demora una rata de cierta subespecie seleccionada al azar, para que se
duerma después de aplicársele un somnífero experimental, es una variable aleatoria
distribuida con 1.5 min y 0.35 min. Suponga que se seleccionan n ratas y
Solución:
E X X 1.5
0.35
2
2
Var X X2
n
5
0.0245 y X
n
0.1565
X X 2 1.5
P X 2 P
0.1565
P Z 3.19 0.9993
X
b. Si el tiempo que demora una rata tiene distribución desconocida y X1 , , X 40 es una
muestra aleatoria de tamaño 40 de esa población. Calcule la probabilidad
aproximada de que el tiempo de demora promedio esté entre 1.35 y 1.60 min.
Solución:
Por el teorema del límite central el tiempo promedio de la muestra tiene,
aproximadamente, distribución normal con
0.35
2
2
E X X 1.5
Var X 2
X
n
40
0.0030625 .
166
UNA La Molina - Dpto. de Estadística e Informática Estadística General
X 1 2 3 5 6
P(X=x) 0.31 0.19 0.25 0.125 0.125
b. Si se sabe que el promedio muestral del número de servicio no atendidos fue menor
a 3.5, ¿cuál es la probabilidad que el promedio muestral sea mayor o igual a 1.5?
167
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Para n grande y utilizando el teorema del límite central, se puede asegurar que la
proporción muestral p, tiene una distribución aproximadamente normal con media:
2 (1 ) p
= y variancia: . Se estandarizar como: Z .
n n (1 )
n
A continuación se presentan los casos de la distribución p con muestras aleatorias y con
muestras aleatorias simples.
Solución
La proporción muestral tiene una distribución aproximadamente normal. Esto se puede
afirmar por el Teorema del Límite Central (n grande).
1
p Normal , 2
Aprox. n
p 0.05 0.03
P p 0.05 P P Z 1.65 0.9505
1 0.0121
n
Ejemplo 6
El contenido de sólidos solubles (en grados Brix °B) en muestras de chirimoya tiene
distribución normal siendo su esperanza matemática es 7.78 °B y su desviación
estándar 2.54 °B. Un especialista selecciona una muestra aleatoria de 80 muestras de
chirimoya. Calcule la probabilidad de que la proporción muestral de esas muestras de
chirimoya con un contenido de sólidos solubles menor de 9.88 °B sea menor de 0.72.
Solución
Sea X el contenido de sustancias solubles en °B.
X Normal 7.78, 2 2.542
La probabilidad de que una muestra de chirimoya tenga un contenido menor de 9.88 °B
es:
X 9.88 7.78
P X 9.88 P P Z 0.83 0.7967
2.54
168
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 6. De una empresa se escoge una muestra aleatoria de 300 empleados para
una encuesta sobre condiciones laborales. Halle la probabilidad aproximada de que la
proporción muestral a favor de las condiciones laborales esté comprendido en el
intervalo 0.76 y 0.84, si se estima en 80% del total de empleados el porcentaje a favor
de las condiciones laborales.
Ejercicio 7. El diez por ciento de las personas de cierta comunidad tiene sangre tipo B.
Si se selecciona una muestra aleatoria de 900 personas de esa comunidad. ¿Cuál es la
probabilidad de que la proporción muestral de personas con sangre tipo B?
169
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 7
El tiempo que lleva efectuar un procedimiento de montaje para el método 1 tiene
distribución con media 35 seg. y variancia 20 seg2 mientras que con un método 2 tiene
distribución con media 31 seg. y variancia 17 seg 2. Si se selecciona una muestra de 40
empleados entrenados con el método 1 y 50 entrenados con el método 2.
2 2 20 17
X1 X 2 N 1 2 , 1 2 N 35 31, N 4, 0.84
n1 n2 40 50
X 1 X 2 X X 54
P X1 X 2 5 P
1 2
0.84
P Z 1.09 0.1379
X1X 2
170
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 1 1 2 1 2
2p p
1 2
n1 n2
Ejemplo 8
Si para elaborar un artículo se usan, independientemente, las máquinas I y II, y se
sabe que la probabilidad de producir un artículo defectuoso con la máquina I es 0.15 y
0.08 con la máquina II. Si se eligen al azar 80 artículos producidos por I y 100
producidos por II, halle la probabilidad de que la proporción de defectuosos de la
muestra de I supere a la de II en más de 0.06, si las muestras son aleatorias.
171
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Solución
0.15 0.85 0.08 0.92
p1 p2 aprox N 1 2 , 2p1 p2 aprox N 0.15 0.08,
80
100
aprox N 0.07,0.00233
0.06 0.07
P p1 p2 0.06 P Z P Z 0.21 0.5832
0.04827
Ejercicio 10. Se sabe que van a la universidad en movilidad propia el 40% de los
estudiantes de la Universidad L y el 30% de la Universidad S. Si se toman al azar
muestras de 80 y 90 estudiantes respectivamente, halle la probabilidad de que la
proporción de la muestra de la Universidad L supere a la de S en más de 9%.
172
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 6
a. Calcule la probabilidad de que un pasajero que toma la línea A tenga que esperar
menos de 15 minutos.
b. Calcule la probabilidad de que un pasajero que toma la línea B tenga que esperar
más de 20 minutos.
c. Calcule la probabilidad de que un pasajero que toma la línea C tenga que esperar
entre 15 a 20 minutos.
d. ¿Cuánto tiempo de espera como mínimo debe tener un pasajero de la ruta A para
ser considerado dentro del 30% de los pasajeros que más esperan?.
173
UNA La Molina - Dpto. de Estadística e Informática Estadística General
174
UNA La Molina - Dpto. de Estadística e Informática Estadística General
175
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
2. Suponga que la duración en minutos de las llamadas telefónicas que llegan en forma
independiente a una central telefónica es una variable aleatoria con distribución
exponencial, con media de 2 minutos por llamada. ¿Cuál es la probabilidad que una
llamada dure entre 1 y 4 minutos?
4. Suponga que se estima que el 70% de los jóvenes de Lima y el 63% de los jóvenes
de Arequipa considera que escuchar música clásica es un buen hábito. Si se toman
muestras de tamaño 50 de jóvenes de Lima y 60 de jóvenes de Arequipa, halle la
probabilidad de que la proporción de la muestra de Lima supere a la de Arequipa en
menos de 0.05, si Las muestras son aleatorias simples (sin reemplazo), habiéndose
elegido la primera muestra de 900 jóvenes limeños y la segunda de 1400 jóvenes
arequipeños.
6. En una población, el 20% de las familias están suscritas al diario “El Comercio”,
¿cuál es la probabilidad de que al seleccionar una muestra de 225 familias, la
proporción de familias suscritas a dicho diario sea menor al 16%?
8. El tiempo que necesita un alumno para terminar el examen final de Química General
se distribuye normalmente con una media de 110 minutos y una desviación
estándar de 8 minutos; mientras que el tiempo que necesita un alumno para
terminar el examen final de Física General se distribuye normalmente con una
media de 115 minutos y una variancia de 49 minutos2.
a. Si un alumno termina el examen de Física General en menos de una hora y
media se puede suponer que domina el curso. Si se selecciona un alumno al
azar, ¿cuál es la probabilidad de que domine el curso?
b. Si se seleccionan al azar 5 alumnos de Física General, ¿cuál es la probabilidad de
que al menos dos alumnos dominen el curso?
176
UNA La Molina - Dpto. de Estadística e Informática Estadística General
9. El número de clientes que llegan a una agencia bancaria cada 5 minutos tiene una
distribución Poisson con media 3.2. Se selecciona una muestra aleatoria de tamaño
40 de esta distribución. Calcule la probabilidad de que la media muestral sea mayor
que 2.8.
10. Se sabe que el 52% de adolescentes de cierto distrito fuman. Si se selecciona una
muestra aleatoria de 50 adolescentes de ese distrito, halle la probabilidad de que la
proporción muestral de fumadores sea mayor que 0.40 pero menor que 0.62
11. Una Empresa Arrocera se tienen dos máquinas agrícolas A y B; las cuales presentan
tiempos de duración que cumplen la función de cosechar arroz en forma
independiente tienen una distribución normal con un tiempo de vida medio de 12 y
15 años y con desviaciones estándar de 1.5 años y 3 años respectivamente.
12. La vida útil de una batería se distribuye como una exponencial con una media de 10
años. El fabricante ofrece una garantía de un año. Si la batería falla en ese período
se reemplaza por otra, a lo más una vez. ¿Cuál debe ser el tiempo de garantía que
el fabricante debe ofrecer para que solo se devuelva el 2% de las baterías
producidas?
13. Una máquina fabrica un determinado producto cuya longitud, en centímetros, tiene
un promedio de 6 cm. y una desviación estándar de 1.2 cm.
14. Un fabricante de electrodomésticos sabe que la vida útil de éstos sigue una
distribución normal con media de 100 meses y desviación estándar de 20 meses.
Determine el tamaño mínimo muestral que garantiza, con una probabilidad de 0.98
que la vida útil media de los electrodomésticos en dicha muestra se encuentra
entre 90 y 110 meses.
15. Se sabe que la vida de bombillas eléctricas es una variable aleatoria distribuida
normalmente con media desconocida y = 200 horas. El precio de un lote de
1
bombillas es dólares. Un posible comprador propone tomar una muestra
5
1
aleatoria de n bombillas y pagar al productor X dólares por el lote de bombillas.
5
¿Cuál debe ser el valor de n, para que la probabilidad de que comprador no sobre
pague ni subpague al productor con más de 20 dólares, sea 0.95?
177
UNA La Molina - Dpto. de Estadística e Informática Estadística General
16. El tiempo que tarda un proceso de ensamblaje de un artículo puede modelarse como
una variable aleatoria exponencial con una media de 5.5 minutos.
a. ¿Cuál es la probabilidad que el proceso de ensamblaje de un artículo dure entre
3.8 y 6.8 minutos?
b. ¿Cuánto tiempo como mínimo debe tener un artículo para ser considerado
dentro del 28.5% de los mayor tiempo de ensamblaje?.
c. Halle el RI.
d. Halle el medio del tiempo de ensamblaje y su coeficiente de variación.
17. La escuale de manejo “El Rápido”, estima que el número de horas de práctica
necesarias para la obtención del permiso de conducir para una persona sigue una
distribución normal con media 24 horas y desviación estándar 4 horas.
a. ¿Cuál es la probabilidad de obtener el permiso de conducir con al menos 20
horas de prácticas de manejo?
b. ¿Cuál debe ser el número de horas como máximo, para que una persona sea
considerada dentro del 22% con menos horas de prácticasde manejo?
c. Si una escuela de manejo cobra S/ 35 por hora de práctica más S/ 45 por
gastos de administrativos. Calcule el ingreso esperado por alumno que tendrá
la escuela.
d. Si se extrae una muestra aleatoria de 35 personas, ¿cuál es la probabilidad que
el número promedio de horas de manejo para obtener la licencia de conducir
sea entre 18 y 26 horas?.
e. Si se sabe que el 18.5% de las personas desaprueban en la primera vez el
examen de manejo, entonces para una muestra de 120 personas halle la
probabilidad que la proporción muestral que desaprueban el examen por
primera vez sea a lo más el 15.5%.
f. La escuela desea hacer una evaluación respecto al género. Se tiene que el
número de horas para obtener la licencia de conducir tiene una distribución
normal, con media de 22 horas y desviación estándar de 5 horas para los
hombres, mientras que para las mujeres su media es de 28 horas y desviación
estándar de 8 horas. Halle la probabilidad que el número de horas promedio
para tener una licencia de las mujeres sea mayor que el de los hombres en
más de 3 horas.
178
UNA La Molina - Dpto. de Estadística e Informática Estadística General
La distribución Ji-cuadrado fue encontrada por primera vez por F.R Helmert en 1876.
Esta distribución toma el nombre de la letra griega elevada al cuadrado. Esta letra en
castellano se llama Ji y en inglés Chi.
1
m
1 x
m x2 e 2 si x 0
f x 2 2 m 2
0 si x0
Notación: X 2m
Ejemplo 9
2
X X
Si X N , 2
, entonces Z N 0,1 Z
2
21
179
UNA La Molina - Dpto. de Estadística e Informática Estadística General
n 1 S 2 (X i X )2
desviación estándar , entonces la V.A.: i 1
2n1 .
2
2
Ejemplo 10
Si J 219 , determine el valor de:
a. P J 11.651
Solución
P J 11.651 = 0.1 Notación: 11.651 20.1,19
b. P J 15.352
Solución
P J 15.352 1 P J 15.352 1 0.3 0.7
c. P 15.352 J 30.144
Solución
P 15.352 J 30.144 P J 30.144 P J 15.352 0.95 0.3 0.65
Ejemplo 11
Si L 225 , halle p1 y p2 tales que: P p1 L p2 0.7 y P L p2 0.1 .
Solución
P L p1 0.2 p1 20.2,25 18.940
P L p2 0.9 p2 20.9,25 34.382
Una v.a X tiene distribución t con m grados de libertad si su función de probabilidad es:
m 1
f x 2 , x
m 1
2
m x 2
m 1
2 2
Notación: X t m
180
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Características de la distribución t
3. Si X t m , entonces X 0 y X2 m
m2
4. Conforme aumenta m, la dispersión de la curva t m disminuye.
Teorema
Z
Si las v.as Z N 0,1 y V 2m son independientes, entonces la v.a X t m .
V
m
2 S2
S
X , si el muestreo es con reemplazo (muestra aleatoria)
n
Teorema
Si de dos poblaciones normales independientes distribuidas con medias 1 , 2 y
variancias 12 22 2 , se extraen muestras aleatorias de tamaños n1 y n2 ,
siendo: S 2
n1 1 S12 n2 1 S22
n1 n2 2
p
181
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 12
Si R t8 , calcule:
a. P R 2.306
b. P R 2.896
P R 2.896 1 P R 2.896 1 0.99 0.01
c. P 3.355 R 0.889
P 3.355 R 0.889 P R 0.889 P R 3.355 0.200 0.005 0.195
d. El valor de c si P R c 0.3
P R c 0.3 c t 0.3,8 0.546
9.7 Distribución F
182
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Características de la distribución F
Teorema
Si U 2n y V 2m , son v.a. independientes, entonces la V.A.:
U
U m
X n F n, m
V V n
m
1
F ,n,m
Propiedad recíproca F1 ,m,n
Distribución muestral asociada a la distribución F
Sea X1 , , X n1 una m.a. de una distribución normal con variancia 12 y Y1 , , Yn2 otra
denotemos por S12 y S22 las dos variancias muestrales. Entonces la v.a:
S12 12
F n1 1, n2 1
S22 22
Ejemplo 13
a. P W 2.42
P W 2.42 0.95 2.42 F 0.95,8,21
b. P W 3.51
P W 3.51 1 P W 3.51 1 0.99 0.01
c. P 2.42 W 3.51
P 2.42 W 3.51 P W 3.51 P W 2.42 0.99 0.95 0.04
d. El valor de k en P k W 2.42 =0.94
P k W 2.42 0.94 P W 2.42 P W k 0.94 P W k 0.01
0.95
1 1
k F 0.01,8,21 0.1873
F 0.99,21,8 5.34
Nótese que se utilizó la propiedad recíproca.
183
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
a) P(W 3)
b) P(W 11.07)
c) P( Z 0.860)
d) P( Z 1.325)
e) P(1.325 Z 1.725)
f) P(Y 3.07)
g) P(Y 5.06)
h) P(3.07 Y 5.06)
184
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
185
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO X
INFERENCIA ESTADÍSTICA
X i
Para la media poblacional (): ̂ X i 1
n
n
(X i X )2
Para la variancia poblacional (2): ˆ 2 S 2 i 1
n 1
Número de éxitos
Para la proporción poblacional (): ˆ p
n
Ejemplo 1
De una población de tallas (mt) en madres adolescentes con media y varianza 2,
se extrae una muestra aleatoria 8 madres adolescentes, cuyos valores observados son:
1.50, 1.60, 1.58, 1.45, 1.52, 1.68, 1.62, 1.55. Halle un estimador puntual para la
media, la varianza y la desviación estándar poblacionales.
8
X i
12.5
Entonces se tiene: X i 1
1.56 mt. , será una estimación puntual de .
8 8
8
Cálculo de la suma de cuadrados: X
i 1
i
2
19.569
Para la varianza, el estimador puntual será:
n n
X
2
n
2
X i2 i 1 i
n
X i
2
nX
19.569 (12.5) 2 19.569 8 x1.562
S i
i
0.0053
n 1 n 1 7 7
s S
X t 1 ;n 1 X t 1 ;n 1
2 n
2 n
a b
s
Límite inferior: LI ( ) X t 1
2 n ; n 1
s
Límite superior: LS ( ) X t 1 ;n 1
2 n
p
Se usa la v.a. ~ N(0,1) y n>30, entonces para determinar el intervalo de
(1 )
n
confianza del 1 100 % para la proporción se cumple:
p
P Z Z Z P Z
Z 1
1 1 1 (1 ) 1
2 2
2 2
n
p 1 p p 1 p
p Z p Z
1 n 1 n
2 2
a b
(n 1) S 2 (X i X )2
desconocida. Se usa ~ 2n -1 , entonces para determinar el
2 2
intervalo de confianza del 1 100 % para la varianza se cumple:
P 2 2,n1 2n1 21 2,n1 1
2
P 2,n1
n 1 S 2
21 2,n1 1
2
Entonces despejando la expresión anterior, el intervalo con un nivel de confianza del
1 100 % para la varianza ( 2
) será hallado por:
188
UNA La Molina - Dpto. de Estadística e Informática Estadística General
n 1 s 2 2 n 1 s 2
2
2
1 , n 1 , n 1
2 2
a b
n 1 s 2
n 1 s 2
2
2
1 , n 1 , n 1
2 2
a b
Ejemplo 2
En 2011, se tomó una muestra de 35 casas en la Ciudad 1, y se hizo el estudio de las
siguientes variables: X= Peso total de basura producida en una casa durante un día
(Kg), Y= Peso de residuos orgánicos producidos (Kg) en una casa durante un día y Z=
Hábito de reciclaje, obteniéndose los siguientes resultados:
28 3.7 2.5 No
29 3.2 2.3 No
30 2.9 1.9 No
31 3.5 2.1 Si
32 3.0 1.3 No
33 5.0 3.4 No
34 3.5 2.7 No
35 4.0 3.2 Si
Cálculos:
x 3.160 1.997
s 0.884 0.818
n 35 35
a. Halle e interprete un intervalo de confianza del 95% para el peso total promedio de
basura producida en una casa durante un día.
Solución:
1 0.95 0.05 1 0.975 → t 0.975,34 2.032
2
0.884 0.884
3.160 2.032 3.160 2.032 2.856 3.464
35 35
Solución:
6
1 0.95 0.05 1 0.975 . Z 0.975 1.96 y p
0.1714
2 35
0.1714 x(1 0.1714) 0.1714 x(1 0.1714)
0.1714 1.96 0.1714 1.96
35 35
0.0465 0.2963
Solución:
190
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 0.95 0.05 1 0.975 20.975,34 51.966 y 20.025,34 19.806
2
(n 1) S 2 (n 1) S 2 (35 1)0.8182 (35 1)0.8182
2 2 0.438 2 1.149
21 ;n1 2 ;n1 51.966 19.806
2 2
Interpretación: Se tiene una confianza de 95% que la verdadera varianza del peso
de los residuos orgánico se encuentra en el intervalo 0.438, 1.149 Kgs .2
X1 210 174 310 127 174 172 296 362 306 352
X2 140 142 140 90 92 84 156 200 185 180
248.3 140.9
x
s 85.7 41.4
n 10 10
t0.95;9 1.833
1 0.90 0.10 1 0.95 .
2
s 85.7
x t1 2,n1 248.3 1.833 , de donde se obtiene: 198.624, 297.976
n 10
b. Halle un intervalo de confianza de 98% para la verdadera variancia del peso al nacer
de los cuyes.
Solución:
191
UNA La Molina - Dpto. de Estadística e Informática Estadística General
1 0.95 0.02 1 0.99 20.99,9 21.666 y 20.01,9 2.088
2
(n 1) S 2 2 (n 1)S 2 (10 1) x41.42 2 (10 1) x41.42
2
2 711.975 2 7387.759
1 ; n 1 ; n 1 21.666 2.088
2 2
Interpretación: Se tiene una confianza de 98% que la verdadera variancia del peso
al nacer está en el intervalo 711.975,7387.759 gr . 2
192
UNA La Molina - Dpto. de Estadística e Informática Estadística General
19.3 20.2 21.4 18.3 18.6 19.4 22.5 20.8 19.6 21.3 18.5 22.4
a. Con una confianza del 98%, halle el intervalo de confianza para la tensión de
ruptura media de las fibras sintéticas. Interprete.
193
UNA La Molina - Dpto. de Estadística e Informática Estadística General
.
La variancia s 2 se obtiene de una muestra piloto.
Donde:
e es el margen error permisible.
Ejemplo 4
Una famosa cadena de hoteles desea desarrollar un intervalo de confianza del 99% para
estimar el número promedio de habitaciones ocupadas cada noche en sus sucursales de
toda la nación. ¿Cuántas noches deben incluirse en la muestra si se puede tolerar un
error de 10 habitaciones y una muestra piloto revela una desviación estándar de 60
habitaciones?
Solución:
t 2 s 2 2.582 x602
0.01 t 1 , t 0.995, 2.58 n 2 239.63 240 noches
2 e 102
194
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 5
¿Cuántos estudiantes debe tener una muestra, con el fin de estimar la proporción de
estudiantes que tienen correo electrónico? En un estudio previo, se halló que de 150
estudiantes, 120 tenían correo electrónico. Se desea tener un nivel de confianza del
95% y un error del 3% en las estimaciones.
Solución:
Margen de error n
0,01 6146,560
0,02 1536,640
0,03 682,951
0,04 384,160
0,05 245,862
Se observa un incremento exponencial de tamaño de muestra al disminuir el margen de
error.
Ejercicio 3. ¿Cuál debe ser el tamaño de muestra para estimar el nivel medio del
consumo de proteínas de los adultos de una zona minera, si se desea tener un margen
de error de 0.45 g/dl y un nivel de confianza del 95%?. De una muestra piloto se
obtuvo que el consumo de proteínas tiene una desviación estándar de 2.5 g/dl.
Ejercicio 4. El director comercial de cierta compañía que realiza ventas por correo
electrónico, desea precisar con mucho cuidado su política de crédito. Si el director
desea tener un intervalo de confianza del 99% para la proporción de clientes que están
al día en sus pagos. ¿Qué tamaño de muestra debe usar si se desea tener un margen
de error del 4.5%?. Suponga que en una muestra piloto de 35 clientes se halló que 8
clientes están al día en sus pagos.
195
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 7
196
UNA La Molina - Dpto. de Estadística e Informática Estadística General
d. Suponga que se desea realizar un estudio en la región sur del país, con la finalidad
de estimar la proporción de agricultores que prefieren el maíz Paro. Si en un estudio
previo, se halló que el 40% de pobladores prefiere el maíz Paro. Determine el
tamaño de muestra, si se desea tener un nivel de confianza del 90% y un error del
5% en las estimaciones.
197
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Una hipótesis estadística, es cualquier afirmación o suposición que se hace acerca del
tipo de distribución de probabilidad de la población o al valor o valores de uno o más
parámetros de la población: Media ( ), Variancia ( y Proporción ( .
2
Tipos de hipótesis
Hipótesis alterna (H1 o Ha). Es la hipótesis que se acepta en caso de que la hipótesis
nula sea rechazada. H1 es la suposición contraria a H0.
Ejercicio 1. Para los siguientes enunciados formule la hipótesis nula y alterna e indique
el tipo de prueba.
198
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Al tomarse una decisión respecto a una hipótesis nula (H0), se puede presentar cuatro
posibles casos que determinan si la decisión tomada es correcta o incorrecta, esto se
presenta en la siguiente tabla:
Error tipo I, es el error que se comete cuando se rechaza una hipótesis nula que es
verdadera en la población.
Error tipo II, es el error que se comete cuando se acepta una hipótesis nula que es
falsa en la población.
199
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 6. Para una prueba de hipótesis de una media (μ), las regiones críticas según
el tipo de prueba serán:
t1 , n 1 t
, n 1
t t , n 1
2 1 , n 1
2
La zona de rechazo está La zona de rechazo está La zona de rechazo
al lado derecho. a ambos lados. está al lado izquierdo.
a. La muestra es aleatoria.
b. La muestra proviene de una distribución normal.
6. Conclusión
200
UNA La Molina - Dpto. de Estadística e Informática Estadística General
tc=
X 0
~ t n 1
t1= - t(1-,n-1)
t2= t(1-,n-1)
s
n
c2
n 1 S 2
2n 1 12 2 , n 1
2
02
22 2 1 , n 1
p 0
Zc= ~ N(0,1)
0 (1 0 ) Z1= Z()
Z2 = Z(1-)
n
S12 22
2 2 Fc F n1 1, n2 1 F1= F(, n1-1, n2-1)
/
2 1 S22 12 F1= F(1-, n1-1, n2-1)
a. 12 y 22 desconocidas pero
homogéneas y poblaciones normales. S 2
n1 1 S12 n2 1 S22
n1 n2 2
X
p
1 X 2 1 2 0
tc t n1 n2 2 t1 t 1 , n1 n2 2
1 1
S p2 t2 t 1 , n1 n2 2
n1 n2
12 y 22
2
1 2 b. desconocidas pero s12 s22
heterogéneas y poblaciones
H 12 2 2
n n
normales.
s12 s22
X 1 X 2 1 2 0
tc t H n1 n2
s12 s22 n1 1 n2 1
n1 n2 t1 t 1 , H
t2 t 1 , H
a. Cuando 1 2 =0 n1 p1 n2 p2
p1 p2 1 2 0 p
Zc N 0,1 n1 n2
1 1
p 1 p
n1 n2
Z1= Z()
Z2 = Z(1-)
1 2
b. Cuando 1 2 0
p1 p2 1 2 0
Zc N 0,1 Z1= Z()
p1 1 p1 p2 1 p2 Z2 = Z(1-)
n1 n2
201
UNA La Molina - Dpto. de Estadística e Informática Estadística General
X1 X1
X2 X2 X2
. 2 s .
. p .
XN Xn
a. El gerente financiero sospecha que las ventas promedios por agente en el último
trimestre son menores a las ventas programadas que fueron de $ 465 (miles $).
Usando un nivel de significación del 5%, pruebe la afirmación del gerente financiero
1) Planteamie nto de hipótesis
H 0 : 465
H 1 : 465
2) 0.05
3) Pr ueba estadístic a
10 (399.0 465)
n 10 X 399.0 S 88.84 t c 2.35
88.84
4) t 0.05;9 1.833
5) Decisión estadístic a
Se rechaza H 0 .
6)Conclusión.
b. El gerente también cree que es importante analizar la variabilidad de las ventas
efectuadas por sus agentes. El gerente afirma que la variabilidad de las ventas en
este último trimestre no han variado con respecto al trimestre anterior que fue de $
130 (miles $). Usando un nivel de significación del 5%, será cierta la afirmación del
gerente financiero.
1) Planteamie nto de hipótesis
H 0 : 2 130 2
H 1 : 2 130 2
2) 0.05
3) Pr ueba estadístic a
9 x88.84 2
n 10 S 88.84 2
4.2
130 2
c
SOLUCIÓN :
1) Planteamie nto de hipótesis
H 0 : 0.42
H1 : 0.42
2) 0.05
3) Pr ueba estadístic a
7 0.25 0.42
n 28 p 0.25 Z c 1.82
28 0.42 0.58
28
4) Z 0.05 1.64
5) Decisión estadístic a. Se rechaza H 0 .
6) Conclusión .
203
UNA La Molina - Dpto. de Estadística e Informática Estadística General
H o : 0.1
H1 : 0.1
0.13 0.1
Z 1.41
0.1 * 0.9
200
Como 1.41< 1.64, no se rechaza la hipótesis nula; es decir, los datos no son
suficientes para indicar un aumento de preferencia en la marca A
H o : 4.5
H1 : 4.5
X 4.285 , n 16 y S 0.208
4.285 4.5
tc 4.13
0.208 / 16
t( ,n1) t(0.05,15) 1.753
Región de Rechazo = RR = {t<-1.753}
Región de Aceptación = RA = {t ≥-1.753}
Se rechaza Ho, el nuevo sistema resulta más rápido en promedio
H 0 : 2 0.42
H1 : 2 0.42
(n 1) S 2 (15).0.2082
2
4.056
c
2 0.42
(2 ,n1) (0.05,15)
2
7.261
Región de Rechazo = RR = {x2<7.261}
Región de Aceptación = RA = { x2 ≥7.261}
Se rechaza Ho, el nuevo sistema resulta más estable en variabilidad. Decisión:
Cambiar el antiguo sistema por el nuevo
204
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejercicio 6. Una compañía de seguros vehicular desea analizar los gastos por
cobertura de accidentes de sus clientes del último trimestre. Para una muestra aleatoria
de 18 clientes que tuvieron accidentes, el gasto promedio fue de $ 750 y un desviación
estándar de $35. Asuma que el gasto tiene una distribución normal.
205
UNA La Molina - Dpto. de Estadística e Informática Estadística General
c. El gerente de marketing afirma que a los más el 26.5% de los clientes asegurados
han tenido un accidente en el último trimestre. Con esta finalidad se tomó una
muestra de 45 clientes, resultando que 15 tuvieron un accidente en el último
trimestre. Compruebe la afirmación del gerente, usando un nivel de significación del
5%.
206
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 7
(En este ejemplo se usan los resultados del estudio durante 2011 de la ciudad 1 del
ejemplo 2 y datos ya calculados de la cuidad 2 para ese mismo año). Se estudió el
peso total de basura producida por casa durante un día en dos ciudades, para lo cual se
tomaron dos muestras de tamaños 35 y 40 respectivamente obteniéndose:
Ciudad 1 Ciudad 2
x 3.1600 3.7575
s 0.884 0.3809
n 35 40
¿Hay evidencias estadísticas para afirmar que el peso total promedio en la ciudad 1 es
3.22 Kg? Use =0.05
tc=
X 1 0 n1 ~t(n-1) Cálculo: tc
3.16 3.22 35 0.402
s1 0.884
207
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 8
Después de la ejecución en el 2011 del estudio del peso de residuos orgánicos
producidos por casa durante un día en las ciudades 1 y 2; en el 2012 se volvió a
recoger datos en las mismas dos ciudades, para lo cual se tomaron dos muestras de
tamaños 17 y 22 casas respectivamente obteniéndose:
Ciudad 1 Ciudad 2
1.777 2.115
x
s 0.718 0.6549
n 17 22
X 1 0 1.777 2.5 *
tc= n1 ~ t(n-1) Cálculo: tc 17 4.1518
s1 0.718
208
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Región de
Aceptación
t
¿Hay evidencias muestrales para establecer que el promedio de los residuos orgánicos
de la ciudad 2 excede al de la ciudad 1 en más de 1 Kg? Use =0.10
Solución
22
H 0 : 12 22 1
12
22
H1 : 2 1
2
1
2
2
1
2. Elegir el nivel de significación. =0.10
S12 22
Fc ~ F (n1 1, n2 1) ~ F (16,21).
S 22 12
Cálculo:
0.7182
Fc 1.2019
0.6549 2
Segundo Paso
H o : 2 1 1
H1 : 2 1 1
2. Elegir el nivel de significación. =0.10
(2.115 1.777) 1
tc 3.002
1 1
0.46636( )
22 17
Ejemplo 9
Se hicieron 9 y 8 observaciones de pH en suelo superficial de cada una de dos
diferentes localidades, obteniéndose:
Localidad 1 8.53 8.52 8.01 7.99 7.93 7.89 7.85 7.82 7.80
210
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a. ¿Se puede afirmar que la verdadera media de valores de pH del suelo en la localidad
1 es por lo menos 8.08? Use =0.05.
Solución
Localidad 1 Localidad 2
8.04 7.47
x
s 0.285 0.224
n 9 8
tc=
X 1 0 n1 ~ t n 1 t8 Cálculo: tc
8.04 8.08 9 0.42
s1 0.285
One-Sample T: Local 1
Test of mu = 8.08 vs mu < 8.08
Se rechazará H0 si
X 1 0 n1 1.86
X 1 8.08
9 1.86 X1 7.903
s1 0.285
Se rechazará H0 si X1 7.903 .
Solución
Caso Prueba de hipótesis para 22 .
No se rechazará H0 si:
2n 1 S22 8 1 S22
12.017 S22 0.038
c 2
2 0.022
212
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Solución
22
Caso Prueba de hipótesis para 12 22 1
12
1. Formular la hipótesis nula y la hipótesis alternativa.
22
H 0 : 12 22 1
12
22
H1 : 12 22 1
12
2. Elegir el nivel de significación. =0.10
S2 2 0.2852
Fc 12 22 F n1 1, n2 1 F 8, 7 . Cálculo: Fc 1.62
S2 1 0.2242
Solución
Caso Prueba de hipótesis para 2 1 con 12 y 22 desconocidas y homogéneas
213
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Cálculos: s 2p
n1 1 s12 n2 1 s22
8 0.2852 7 0.2242
0.067
n1 n2 2 15
tc
7.47 8.04 0 4.53
1 1
0.067
9 8
Ejemplo 10
La siguiente información es el resultado de un experimento para medir el porcentaje de
aumento de peso para ratones jóvenes de laboratorio a los que se administró una dieta
estándar y ratones a los que se les dio 2000 partes por millón (ppm) de nitrato (fuerte
dosis) en el agua que bebieron.
Nitrato (1) 12.7 19.3 20.5 10.5 14.0 10.8 16.6 14.0 17.2
Control (2) 18.2 32.9 10.0 14.3 16.2 27.6 15.7
Suponiendo que el porcentaje de aumento de peso con nitrato y del control tienen
distribución normal.
a. ¿Son homogéneas las variancias? Use =0.10.
214
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Solución
15.07 % 19.27 %
x
s 3.558 % 8.053 %
n 9 7
22
Caso Prueba de hipótesis para 2 1
2
1
2
2
1
1. Formular la hipótesis nula y la hipótesis alterna.
22
H 0 : 12 22 1
12
22
H1 : 2 1
2
1
2
2
1
2. Elegir el nivel de significación. =0.10
b. Determine con =0.01, si una fuerte dosis de nitrato retarda el verdadero promedio
de porcentaje de aumento de peso en ratones.
Solución
tc
15.07 19.27 0 1.29
3.5582 8.0532
9 7
Ejemplo 11
(En este ejemplo se usan los datos de la ciudad 1, del ejemplo 2). ¿Hay evidencias
estadísticas para afirmar que la verdadera proporción de casas que tienen hábito de
reciclaje es a lo más 0.15? Use 0.025 .
Solución
6
p 0.1714
35
Procedimiento
1. Formular la hipótesis nula y la hipótesis alternativa.
H 0 : 0.15
H1 : 0.15
2. Elegir el nivel de significación. =0.025
216
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Success = Si
Ejemplo 12
En una biblioteca universitaria se hace un inventario completo de libros en estantes,
una vez al año. El bibliotecario propone seleccionar 800 libros al azar de entre la
colección de la biblioteca e investigarlos de un modo semejante. Si la evidencia
muestral indica que la verdadera proporción de libros mal colocados o extraviados es
menor 0.02, entonces el inventario se pospondrá. Entre 800 libros buscados, 12
estaban mal colocados o no se pudieron encontrar.
a. Pruebe las hipótesis pertinentes y asesore al bibliotecario sobre qué hacer. Use α =
0.05.
Solución
12
p 0.015
800
Solución
12 19
p1 0.015 p2 0.022
800 850
Zc
0.015 0.022 0 1.04
1 1
0.019 0.981
800 850
c. ¿La información nos permite afirmar que la verdadera proporción de libros mal
colocados o extraviados en la universidad 2 es menor que en la universidad 1 en -
0.005. Use =0.05.
Solución
12 19
p1 0.015 p2 0.022
800 850
p1 p2 1 2
Zc N 0,1
p1 1 p1 p2 1 p2
n1 n2
0.015 0.022 0.005
Cálculos: Z c 0.30
0.015 0.985 0.022 0.978
800 850
219
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Nivel 1 Nivel 2
n 21 23
14.4 18.6
x
s 2.277 2.450
Asuma que los tiempos observados en cada nivel tienen distribución normal.
a. ¿Hay evidencias estadísticas para afirmar que el verdadero tiempo medio en el nivel
1 es menor que 15.5 minutos? Use = 0.05.
b. Si el investigador afirma que la verdadera desviación estándar del tiempo con el nivel
2 era 2.3, pero un especialista considera que ha aumentado ¿Tiene razón el
especialista? Use =0.10.
220
UNA La Molina - Dpto. de Estadística e Informática Estadística General
c. Si 10 personas a los que se les aplicó el primer nivel de ruido excedieron el tiempo
límite para llevar a cabo la tarea específica. Pruebe a un =0.05 si más del 30% de
personas a los que se les aplica el primer nivel de ruido exceden el tiempo límite
para llevar a cabo la tarea específica.
d. ¿Son similares los tiempos medios con ambos niveles de ruido?. Use =0.10.
221
UNA La Molina - Dpto. de Estadística e Informática Estadística General
e. Si 12 personas a los que se les aplicó el primer nivel de ruido y 15 personas a lo que
se les aplicó el segundo nivel de ruido excedieron el tiempo límite para llevar a cabo
la tarea específica. Pruebe a un =0.05 si la proporción de personas que supera el
tiempo límite en llevar a cabo la tarea específica es mayor al aplicar el primer nivel
de ruido que el segundo nivel de ruido.
Plaguicida A B
Tamaño de muestra 17 19
Rendimiento promedio en Kg/parcela 210 180
Variancia muestral 18.50 58.20
a. ¿Se puede afirmar que el rendimiento promedio de frijol canario es mayor a 185
Kg/parcela utilizando el plaguicida A? Use = 0.05
Práctica Dirigida N° 8
En una región del país, un agricultor ha cultivado dos variedades de maíz, el Mochero y
el Paro. El desea realiza un estudio sobre el rendimiento de estas variedades. Para ello
223
UNA La Molina - Dpto. de Estadística e Informática Estadística General
a. ¿Existe evidencia para afirmar que el rendimiento medio del maíz de la variedad
Mochero es superior a 1855 Kg? Use α=0.05.
224
UNA La Molina - Dpto. de Estadística e Informática Estadística General
c. ¿Existe evidencia para afirmar que la variabilidad del rendimiento del maíz de la
variedad Paro es inferior a 16.5Kg.? Use α=0.05
225
UNA La Molina - Dpto. de Estadística e Informática Estadística General
e. Se quiere agregar al análisis otro indicador y se aplica una encuesta a los pobladores
de la comunidad A y la comunidad B, sobre la preferencia del consumo de maíz entre
las variedades en estudio. Para ello se tomó una muestra de 150 pobladores de cada
comunidad y se obtuvo el siguiente resultado:
50%
40% 33%
30%
20%
10%
0%
A B
Comunidad
226
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
Tipo de
n s
roca x
I 14 3.06 0.14
II 18 2.85 0.12
III 22 3.02 0.29
a. Para el tipo de roca III, estime la densidad media con un intervalo de confianza
de 95%.
b. ¿Es la densidad media de la roca tipo II igual a 3 gr/cm3? Use =0.0456.
c. ¿Es la densidad media de la roca tipo III menor que la de tipo I? Use
=0.0548.
3. Durante una semana, una tienda de grandes almacenes local registró que 8540 de
las 12810 personas que entraron en la tienda hicieron por lo menos una compra.
Tratando esto como una muestra ala azar de todos los clientes potenciales. Hallar
un intervalo de confianza del 90% para la proporción real de personas que entran
en la tienda y que harán por lo menos una compra.
5. Una planta industrial desea determinar qué tipo de combustible (gas o eléctrico)
producirá más energía usada al menor costo. Una medida de la producción de
energía económica es la razón cuadrangular calculada tomando la cantidad de
dinero (en dólares) invertido en un uso particular de la planta y dividirla entre la
cantidad liberada de energía (en unidades térmicas). Cuanto más pequeño es esta
razón, menos es lo que la planta industrial paga por la energía liberada. Se
tomaron muestras aleatorias de 12 plantas que usan combustible eléctrico y 15
plantas que usan combustible a gas, se midió la razón cuadrangular descrita
anteriormente obteniéndose:
a. ¿Hay evidencias estadísticas para establecer que las variancias difieren? Use
0.02 .
b. ¿El contenido promedio de D.D.T en pelícanos jóvenes supera al de pelícanos
polluelos en más de 0.01 ppm? Use 0.02
7. Se sabe que el peso de ciertas bolsas de arroz, embolsadas por una máquina, tiene
distribución normal. Se tomó una muestra aleatoria de 22 bolsas obteniéndose una
media de 1.990 Kg y una variancia de 0.0004 Kg 2 .
a. Determine e interprete un intervalo de confianza de 95% para la verdadera
desviación estándar del peso.
b. La empresa afirma que el verdadero peso promedio de las bolsas es 2 Kg, pero
determinados consumidores dicen que le están dando menos peso en las bolsas.
¿Quién tiene la razón? Use 0.05 .
c. Suponga que en realidad el verdadero peso medio es 2 Kg. ¿Se cometió algún
error en la pregunta b? Justifique su respuesta.
Autoritarismo n x s
10. Un partido político afirma que el 60% de los electores están de acuerdo con él en
cierto problema. En una muestra aleatoria de 800 electores se encontró que 455
están a favor.
a. ¿Puede el partido sostener su afirmación?. Use =0.05.
b. Determine e interprete un intervalo de confianza del 95% para la verdadera
proporción de electores que están de acuerdo con ese partido político.
228
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Greeck 20 86 9.8
Nico 25 81 10.4
13. ¿Cuál debe ser el tamaño de muestra para estimar la proporción de escolares de
quinto de secundaria, en cierto distrito, que saben nadar (asuma que en ese distrito
hay aproximadamente 5000 estudiantes de quinto de secundaria)?. Considere un
error de 3% en las estimaciones y que en un estudio previo con 100 estudiantes se
encontró que 75 sabían nadar. Además se desea tener un nivel de confianza de
95%.
14. El gerente de producción desea estimar el tiempo promedio que demora cierto
proceso, como el tiempo se mide en minutos, este gerente desea tener un error
máximo de estimación, del tiempo promedio real, de a lo más 4 minutos, sabe, por
experiencias anteriores, que la desviación estándar en los tiempos de
procesamiento es de 10 minutos, qué tamaño de muestra debe tomar, si desea un
nivel de confianza del 95% para sus resultados?
15. El tiempo que tarda un proceso de ensamblaje tiene una distribución normal con
una media de 20 minutos. Para hacer más eficiente el sistema, se le pide a un
ingeniero que haga un análisis y proponga algunas mejoras. Tras implementar los
cambios sugeridos, se toma una muestra de 9 artículos y se registran sus tiempos
de ensamblaje obteniéndose un tiempo medio de 24.3 minutos con una desviación
estándar de 6 minutos.
a) ¿Se puede afirmar que los cambios implementados has disminuido el tiempo
promedio del sistema de ensamblaje? (Utilice un nivel de confianza del 95%)
b) Construya un intervalo del 90% de confianza para el tiempo medio de
ensamblaje
229
UNA La Molina - Dpto. de Estadística e Informática Estadística General
16. Se sabe que en una compañía de taxis el gasto diario promedio en combustible,
por unidad, es una variable con distribución normal, cuyo promedio es de 187.6
galones, y una desviación estándar de 32.5 galones. El gerente de operaciones
decide incluir un aditivo especial al combustible que le permitirá un ahorro en ese
rubro. Después de incluir el aditivo toma una muestra de 6 unidades y encontró los
siguientes gastos en combustible expresado en galones por día:
180.3 179.6 185.7 170.5 158.3 180.6
17. Una compañía telefónica está tratando de determinar si algunas líneas en una
determinada comunidad deben instalarse subterráneas. Debido a que se hará un
pequeño cargo adicional en las cuentas telefónicas para pagar los costos extras de la
instalación, la compañía ha determinado hacer un estudio entre los clientes y
proceder con la instalación subterránea solo si el estudio indica que más del 60% de
todos los clientes están a favor de la instalación.
a) Defina en forma clara el parámetro que utilizará en la prueba de hipótesis
respectiva.
b) Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del
cargo adicional, ¿qué debe hacer la compañía? Use un =0.01
c) ¿Cuáles son las conclusiones al respecto?
d) Defina el error tipo I y error tipo II en términos del problema
18. El Dpto. de Marketing de una compañía que produce el detergente ABC encontró en
una muestra de 200 amas de casa que el 20% utiliza esta marca de detergente.
Después de una intensa campaña publicitaria, se tomó otra muestra de 300 amas
de casa la que indicó que el 27% favorece esta marca. Al 5% de significación,
¿puede el jefe del Dpto. concluir, en base a los resultados de esta muestra, que la
campaña fue exitosa?
19. Al señor Juan Pérez le han propuesto participar en una lista para el congreso, en
representación de su provincia. Para aceptar la propuesta este señor quiere estar
seguro de que al menos el 25% de los votantes en la provincia que reside están a
favor de su candidatura. Para determinar esto toma una muestra aleatoria de
tamaño n = 450 personas encontrando que 90 están a favor de su candidatura.
¿Aceptará el señor Juan Pérez participar en la lista? Considere = 5%
20. La siguiente tabla muestra datos sobre aumento de peso corporal (grs) para una
muestra de animales de control y una muestra de animales a los que se dio una
dosis de 1 mg/pastilla de cierto esteroide diluido (los animales de control son
aquellos que no recibieron el esteroide).
230
UNA La Molina - Dpto. de Estadística e Informática Estadística General
d) Con un nivel de significación e 0.05, se puede afirmar que hubo una ganancia de
peso corporal de los animales que recibieron el esteroide con respecto a los que
no la recibieron.
231
UNA La Molina - Dpto. de Estadística e Informática Estadística General
232
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
7. En una prueba unilateral para una media con cola a la izquierda, si el estadístico
tc=3.45, entonces la decisión estadística será _____________________________.
9. Para realizar una prueba de diferencia de medias, si las varianzas son desconocidas,
se debe realizar previamente _________________________________________.
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
233
UNA La Molina - Dpto. de Estadística e Informática Estadística General
CAPÍTULO XI
El análisis de regresión lineal simple, es una técnica estadística que permite estudiar la
relación funcional entre dos variables, una de ellas es la variable dependiente Y (por
ejemplo ventas semanales) y la otra la variable independiente X (por ejemplo el gasto
semanal en publicidad).
234
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 1
8000
6000
Delitos
4000
2000
235
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Yi 0 1 X i i , i 1,2,3,, n (1)
Donde:
Los supuestos del análisis de regresión lineal simple son los siguientes:
En consecuencia:
Y . X E Yi E 0 1 X i i 0 1 X i E i 0 1 X i
Var Yi Var 0 1 X i i Var i 2
i Yi 0 1 X i , por lo tanto:
n n
Q i2 Yi 0 1 X i
2
i 1 i 1
236
UNA La Molina - Dpto. de Estadística e Informática Estadística General
n n
n b0 b1 xi yi
i 1 i 1
n n n
b0 xi b1 xi2 xi yi
i 1 i 1 i 1
SP( XY )
b1 b0 y b1 x
SC ( X )
( xi )2
n
2
Suma de cuadrados de X: SC ( X ) ( xi x) x xi2 n x
2 2
i
i 1 n
n ( xi )( yi )
Suma de productos X e Y: SP( XY ) ( xi x)( yi y ) xi yi xi yi n x y
i 1 n
Yi y b1 x b1 X i y b1 X i x Yi y b1 X i x , es el efecto de la regresión.
550
500
450
400
Precio
350
300
Yˆi
250 ei
200
150 Yi
100
0 5 10
Captura
237
UNA La Molina - Dpto. de Estadística e Informática Estadística General
yi y Yˆi y yi Yˆi De donde se obtiene:
y y Yˆ y y Yˆ
i i i i
n 2 n 2 n 2
yi y Yˆi y yi Yˆi
i 1 i 1 i 1
SCR Yˆi y
2
b12 xi x 2
b1 SP( XY ) b12 SC ( X )
( yi ) 2 2
SCT SC (Y ) y 2
i yi2 n y
n
SCE SCT SCR
Con la información anterior se construye el siguiente cuadro del ANVA.
Prueba de hipótesis
238
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Prueba Estadística
SC ( R) / 2 2 1
CM ( R)
Fc 1 2 1 F 1, n 2
SCE / 2
n 2 CME
n2 n2
Decisión estadística
SCR ( SP( XY )) 2
r2 x100 x100 , 0 r 2 100%
SCT SC ( X ) xSC (Y )
𝑛 ∑ 𝑥𝑦 − (∑ 𝑥)(∑ 𝑦)
𝑟=
√𝑛(∑ 𝑥 2 ) − (∑ 𝑥)2 √𝑛(∑ 𝑦 2 ) − (∑ 𝑦)2
SP XY
r , 1 r 1
SC X SC Y
Si r > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlación es tanto más fuerte cuanto más se aproxime a +1. Por
ejemplo: altura y peso: los alumnos más altos suelen pesar más.
Si r < 0, la correlación lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlación negativa es tanto más fuerte cuanto más se aproxime a
-1. Por ejemplo: peso y velocidad: los alumnos con más peso suelen correr menos.
Si r = 0, no existe correlación lineal entre las variables. Aunque podría existir otro
tipo de correlación (cuadrática, exponencial, etc.)
239
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Ejemplo 1
Y 190 160 134 129 172 197 167 239 542 372 245 376 454
X 7.23 8.53 9.82 10.26 8.96 12.27 10.28 4.45 1.78 4.00 3.30 4.30 0.80
600
500
400
Precio
300
200
100
0 2 4 6 8 10 12
Captura
Cálculos previos
13 13 13 13 13
xi 85.98,
i 1
xi2 732.2376,
i 1
yi 3377,
i 1
yi2 1089365
i 1
x y 17357.8
i 1
i i
SC X x 2
x i
2
163.5791
i
n
SC Y yi2
y i 2 212124.3077
n
SP XY xi yi
x y i i
4977.1585
n
SP XY
b1 30.4266
SC X
13
13
yi
xi
b0 y b1 x i 1
b1 i 1 461.0062
13 13
240
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Prueba de hipótesis
H p : 1 0 ( No hay relación lineal entre X e Y )
H a : 1 0 ( Si hay relación lineal entre X e Y )
c) Estime el precio promedio de harina de pescado (en dólares por tonelada) para una
captura de 5 millones de toneladas métricas de anchoas.
Coeficiente de determinación
SP XY 0.7139 71.39%
2
SC R
2
r
SC Y SC X SC Y
Coeficiente de correlación
SP XY
r 0.84
SC X SC Y
Se puede afirmar que hay una alta asociación negativa entre X e Y en otras
palabras cuando aumenta una de ellas disminuye la otra.
241
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Analysis of Variance
Source DF SS MS F P
Regression 1 151438 151438 27.45 0.000
Residual Error 11 60686 5517
Total 12 212124
242
UNA La Molina - Dpto. de Estadística e Informática Estadística General
243
UNA La Molina - Dpto. de Estadística e Informática Estadística General
d) Estime la tasa de flujo promedio para una caída de presión de 400 mm de agua.
244
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Práctica Dirigida N° 9
En una región de pastizales en la sierra norte del país se estudiaron 4 áreas en los
últimos doce años para valores de cantidad de lluvia (mm) y se midió la productividad
primaria neta del pastizal (ppn). El objetivo de la investigación es predecir la
productividad primaria neta del pastizal. Los datos de la evaluación se presentan a
continuación:
Cantidad de lluvia
anual (mm) 203 242 303 320 473 645 674 687 848 1045 1057 1131
ppn
[g/m²/año] 59 88 116 141 196 278 407 488 644 696 812 832
12 12 12
xi 7628
i 1
yi 4757 x 2
i 6067520
i 1 i 1
12 12
yi2 2814775
i 1
x y
i 1
i i 4067841
b) ¿Existe relación lineal entre la lluvia anual y la productividad del pastizal (ppn)?
Use α=0.05.
245
UNA La Molina - Dpto. de Estadística e Informática Estadística General
246
UNA La Molina - Dpto. de Estadística e Informática Estadística General
EJERCICIOS PROPUESTOS
X 8.3 8.3 12.1 12.1 17.0 17.0 17.0 24.3 24.3 24.3 33.6
Y 227 312 362 521 640 539 728 945 738 759 1263
4. En un centro de salud se han tomado los datos de las edades y la Presión Sistólica
de 12 pacientes, bajo la sospecha de que la edad y la presión estaban relacionadas
de alguna manera. Los datos que se tomaron son los siguientes.
Edad (X) 56 42 72 36 63 47 55 49 38 42 68 60
Presión sistólica (Y) 147 125 160 118 149 128 150 145 115 140 152 155
247
UNA La Molina - Dpto. de Estadística e Informática Estadística General
7. El banco “Préstamo” estudia la relación entre las variables Ingresos (X) y ahorros
(Y) mensuales de sus clientes. Una muestra aleatoria de de sus clientes revelo los
siguientes datos.
Número de 28 17 32 48 6 14 19 24 34 22 20 46
documentos (miles
documentos)
Costo de la auditoría 50 35 65 98 12 24 38 45 65 45 36 85
(miles $)
Humedad en el 42 35 50 43 48 62 31 36 44 39 55 48
almacenamiento (%)
Humedad en la 12 8 14 9 11 16 7 9 12 10 13 11
materia prima (%)
248
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Activo total 22 18 14 8 26 10 16 19 20 7
(millones $)
Rentabilidad 29.3 17.6 16.0 9.5 22.6 12.4 18.5 21.4 18.2 12.5
(%)
11. El gerente de ventas permite que los agentes vendedores que tiene a su cargo reciban
charlas para motivarlos, dichas charlas se dan en diferentes horarios y los agentes
tienen absoluta libertad para elegir el horario que crean conveniente. El gerente cree
que dichas charlas influyen en la eficiencia de las ventas. Para verificar esto toma una
muestra de 10 vendedores y determinó el tiempo acumulado de horas en las que
estuvo presente en una o más charlas durante el último trimestre y la eficiencia de sus
ventas, los datos encontrados fueron:
a)¿Es posible afirmar que existe una relación lineal entre el número de horas de charla
y la eficiencia en las ventas?. Use un α=0.05.
b) Interprete adecuadamente el coeficiente de regresión.
c) El Gerente de ventas afirma que cuando un agente vendedor recibe charlas esto
permite un mejor desempeño en sus nivel de ventas y cree además que por cada
hora adicional de charla su rendimiento se incrementa en más de un punto
porcentual. Utilizando un nivel de significación del 5% ¿Qué puede concluir con
respecto a la afirmación que hace el gerente de ventas?.
249
UNA La Molina - Dpto. de Estadística e Informática Estadística General
13. Un banco quiere determinar la relación entre las variables Ingresos mensuales
(variable independiente) y Ahorros mensuales (variable dependiente) de sus
clientes. Para esto, selecciona una muestra aleatoria de seis clientes y obtiene los
siguientes resultados:
Y: Ahorros
X: Ingresos mensuales mensuales
1.0 0,20
1,2 0,22
1,5 0,25
0,8 0,18
1,8 0,30
2.0 0,35
Tiempo (minutos x) 27 45 41 19 35 39 19 49 15 31
Eficiencia (% Y) 47 84 80 46 62 72 52 87 37 68
n 10 x i 320 x2
i 11490 y i 635 y 2
i 43075 x yi i 22095
a) Determine la ecuación de la regresión entre la eficiencia y el tiempo de extracción.
Interprete el coeficiente de regresión estimado.
b) Pruebe si existe una relación lineal entre las variables. Use un nivel de significación
del 5%.
250
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Preguntas de Autoevaluación
1. El gráfico que permite visualizar la existencia de una posible relación lineal entre la
variable X e Y, se conoce como _______________________________________ .
5. Para probar si existe una relación lineal entre las variables X e Y en un análisis de
regresión, la hipótesis nula formulada es ____________________________ .
10. Indique si es Verdadero (V) o Falso (F) cada uno de los siguientes enunciados:
251
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Bibliografía
252
UNA La Molina - Dpto. de Estadística e Informática Estadística General
Anexo N° 1
TABLAS ESTADÍSTICAS
253