Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Nina Paco
Sucre – Bolivia
2022
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco
INDICE
Tema 1: CONCEPTOS GENERALES Y REPRESENTACIONES GRAFICAS ................................................... 1
FORMULARIO 1. ................................................................................................................................. 1
EJERCICIOS RESUELTOS. ..................................................................................................................... 2
EJERCICIOS PROPUESTOS ................................................................................................................. 13
TEMA 2: MEDIDAS DE POSICIÓN ......................................................................................................... 23
FORMULARIO 2 ................................................................................................................................ 23
EJERCICIOS RESUELTOS .................................................................................................................... 25
EJERCICIOS PROPUESTOS ................................................................................................................. 33
TEMA 3: MEDIDAS DE DISPERSIÓN ..................................................................................................... 39
FORMULARIO 3 ................................................................................................................................ 39
EJERCICIOS RESUELTOS .................................................................................................................... 41
EJERCICIOS PROPUESTOS ................................................................................................................. 49
TEMA 4: MEDIDAS DE FORMA Y MOMENTOS .................................................................................... 55
FORMULARIO 4 ................................................................................................................................ 55
EJERCICIOS RESUELTOS .................................................................................................................... 56
EJERCICIOS PROPUESTOS ................................................................................................................. 65
TEMA 5: NÚMEROS INDICE ................................................................................................................. 71
FORMULARIO 5 ................................................................................................................................ 71
EJERCICIOS RESUELTOS .................................................................................................................... 73
EJERCICIOS PROPUESTOS ................................................................................................................. 84
TEMA 6: DISTRIBUCIONES BIDIMENSIONALES (parte 1) ..................................................................... 87
FORMULARIO ................................................................................................................................... 87
EJERCICIOS RESUELTOS (parte 1)...................................................................................................... 92
EJERCICIOS PROPUESTOS (parte 1) ................................................................................................ 103
TEMA 6: REGRESION Y CORRELACIÓN (parte 2) ............................................................................... 109
FORMULARIO ................................................................................................................................. 109
EJERCICIOS RESUELTOS (parte 2).................................................................................................... 111
EJERCICIOS PROPUESTOS ............................................................................................................... 131
TEMA 7: ANALISIS COMBINATORIO Y PROBABILIDADES.................................................................. 135
FORMULARIO 7 .............................................................................................................................. 135
EJERCICIOS RESUELTOS .................................................................................................................. 137
i
Lic. Isidro W. Nina Paco
ii
Lic. Isidro W. Nina Paco
Tema 1:
CONCEPTOS GENERALES Y
REPRESENTACIONES GRAFICAS
′
𝑥𝑖−1 + 𝑥𝑖′ 𝐿𝑖𝑛𝑓 + 𝐿𝑠𝑢𝑝
𝑋𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = =
2 2
𝑛 = 𝒇1+𝒇2 +…+𝒇m
𝒉i : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝑭i : 𝑓𝑟𝑒𝑐. 𝑎𝑏𝑠. 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 <
𝒇i
𝒉i = , 0 < 𝒉i < 1
𝑭i =𝒇1 +𝒇2 +…+𝒇i 𝑛
𝑚
𝑭1 =𝒇1 , 𝐹𝑚 = 𝑛 ∑ ℎ𝑖 = 1
𝑖=1
𝑭i = 𝑭i−1 + 𝒇i
𝑯i =𝑯i−1 + 𝒉i
1
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS.
EJERCICIO 1.
Ilustra con ejemplos lo que se entiende por población, población finita, población infinita,
muestra, característica, variable.
Solución:
a. Población: supongamos que nos situamos en un departamento del país: Santa Cruz y se
desea hacer una investigación sobre el consumo de un determinado artículo, la población
podría estar constituida por todas las amas de casa del departamento. También se podría
hacer investigación sobre la totalidad de empresas; sobre los vehículos de transporte,
particular o de servicio público que operan en el departamento.
b. Población finita: cuando la población está constituida por un número limitado de elementos,
por ejemplo la totalidad de trabajadores de las gobernaciones del país.
c. Población infinita: Se llama así cuando la población tiene un número grande de elementos.
d. Muestra: se investiga una parte de la población, en este caso sería extraer una muestra
aleatoria, de los trabajadores de las gobernaciones del país.
e. Características: tanto en la población como en la muestra, el ejemplo dado correspondería
al trabajador (como elemento) de las gobernaciones del país, donde las características a
estudiar son múltiples, algunas de ellas podrían ser: sexo, edad, tiempo de servicio, estado
civil, composición familiar, propietario de vivienda, salario, etc.
f. Variable: Llamamos variable estadística a una propiedad característica de la población
que estamos interesados en estudiar. Se denota por las últimas letras del alfabeto, X, Y, Z,
etc.
EJERCICIO 2.
Dar como mínimo tres ejemplos de fenómenos económicos, considerados dentro del campo
de la investigación estadística.
Solución:
Conocer la realidad de la producción de leche PIL Andina. (Todos sus productos)
Determinar los cambios que presentan la demanda, la producción, las ventas y los precios en la
fábrica de cemento FANCESA ya que estos varían en el tiempo.
Determinar la variación de precios en los principales minerales que exporta el país en los
últimos 10 años.
EJERCICIO 3.
Contestar verdadero o falso, según el caso.
1. Después de elaborar el formulario se define el objetivo de la investigación. ( )
2. Al recolectar información por medio de entrevistadores se tiene la ventaja de que estos
pueden observar el sitio de la operación que se está llevando a cabo. ( )
2
Lic. Isidro W. Nina Paco
3
Lic. Isidro W. Nina Paco
4
Lic. Isidro W. Nina Paco
Aceite de ajonjolí 21
Aceite sin especificar 17
Manteca de cerdo 21
Grasas de origen vegetal 6
Aceite de oliva 13
EJERCICIO 8.
Con los datos siguientes elaborar una tabla de frecuencias sabiendo que la distribución es
simétrica.
𝑚 = 7 𝑐 = 10; 𝑓1 = 8; 𝑓2 + 𝑓5 = 62; 𝑥3 𝑓3 = 1260; ℎ3 = 0.21; 𝐻6 = 0.96
Solución:
X i'1 X i' Xi fi Fi hi Hi X i fi
Proceso a seguir:
𝑓𝑖 8 8
a. ℎ𝑖 = 0,04 n 200
𝑛 n 0,04
d. 𝑓2 + 𝑓5 = 62 → 𝑓2 + 42 = 62 → 𝑓2 = 62 − 42 = 20
1260
e. 𝑥3 𝑓3 = 1260 → 𝑥3 (42) = 1260 → 𝑥3 = = 30
42
5
Lic. Isidro W. Nina Paco
𝑐 10
f. 𝑥0′ = 𝑥1 − 2 ; 𝑥0′ = 10 − 2 = 10 − 5 = 5;
𝑐 20
𝑥1′ = 𝑥2 − ; 𝑥1′ = 20 − = 20 − 5 = 15;
2 2
EJERCICIO 9.
¿Qué opinión le merece a usted, si elaboramos una tabla de frecuencias y utilizamos?:
a) Dos marcas o número de clases
b) 28 marcas de clase
c) 12 marcas de clase
Solución:
a. No se debe utilizar este número de marcas de clase, pues la información quedaría muy
concentrada en dos intervalos, cuando lo recomendado son 5 como mínimo.
b. Tampoco es aconsejable un número mayor a 16, pues la amplitud se reduce y nos
quedaría casi igual a una variable discreta, además, una distribución en su presentación
es larga.
c. Está dentro de las recomendaciones.
EJERCICIO 10.
Con los datos de la tabla, se pide elaborar el histograma de frecuencia.
X i'1 X i' fi Fi
10,1 – 18 20 20
18,1 – 26 25 45
26,1 – 34 30 75
34,1 – 42 30 105
42,1 – 50 25 130
50,1 – 58 20 150
150 -
Solución:
Histógrama y polígono Ojiva
de frecuencias
6
Lic. Isidro W. Nina Paco
EJERCICIO 11.
Los ingresos semanales (en $us) de 50 trabajadores de la construcción fueron los siguientes:
170 172 183 164 166 164 160 168 173 176
184 190 163 151 158 166 166 172 170 186
170 166 169 160 158 155 160 157 163 165
170 172 178 183 170 166 165 172 168 158
158 168 166 159 154 166 172 168 163 172
a) Se pide elaborar una tabla de frecuencias.
b) Construir un histograma, el polígono y la ojiva.
Solución:
Rango 190 151 39 m 1 3,3 log 50 6,6 (6 ó 7)
X i'1 X i' fi hi Fi Hi Xi
7
Lic. Isidro W. Nina Paco
Histógrama y polígono
Ojiva ascendente
8
Lic. Isidro W. Nina Paco
EJERCICIO 12.
Elabore la gráfica correspondiente.
Años 2001 2002 2003 2004 2005
Producción (Miles
380 450 700 740 720
ton.)
Ventas (Miles ton.) 260 350 600 520 508
Solución:
Valor producción y ventas Valor producción y ventas
(Miles Ton.) (Miles Ton.)
800
800
700
Millones de toneladas
700
Millones de toneladas
600
600
500
500
400
400
300
300
200
200
100
100
2001 2002 2003 2004 2005 2001 2002 2003 2004 2005
producción
Años Años producción
ventas ventas
EJERCICIO 13.
Los siguientes datos corresponden al número de retrasos (en la mañana) por parte de los
empleados de una empresa, durante el mes:
2 5 0 0 6 3 5 0 0 2 7 4 4 2 3 8 4 3 3 1
3 2 3 2 4 2 2 3 1 3 2 0 0 1 4 2 2 0 3 5
0 7 7 0,18 0,18
1 3 10 0,07 0,25
2 10 20 0,25 0,50
3 9 29 0,22 0,72
9
Lic. Isidro W. Nina Paco
4 5 34 0,12 0,84
5 3 37 0,07 0,91
6 1 38 0,03 0,94
7 1 39 0,03 0,97
8 1 40 0,03 1,00
40 - 1,00 -
EJERCICIO 14.
Una investigación realizada a 120 estudiantes en un instituto universitario requiere elaborar una
gráfica.
Deportes Alumnos
Ajedrez 13
Baloncesto 47
Futbol 62
Natación 34
Ciclismo 20
Tenis 8
Solución:
La mayoría, equivocadamente realiza una gráfica circular, sin darse cuenta que un alumno
puede practicar más de un deporte y el porcentaje se obtiene sobre el número de alumnos
encuestados en este caso son 120.
10
Lic. Isidro W. Nina Paco
Ciclismo 20 16,67
Tenis 8 6,67
Porcentaje de alumnos que practican un determinado deporte
11
Lic. Isidro W. Nina Paco
EJERCICIO 15.
Un almacén al cierre de sus ventas encuentra que el porcentaje de ventas por artículo se
distribuye así: 42% camisas, 8% corbatas, 34% pantalones, 5% calcetines, 11% otros
artículos. Se pide elaborar:
a) Un gráfico de barras
b) Una gráfica circular
Solución:
a.
Artículos Porcentajes
Camisas 42
Corbatas 8
Calcetines 5
Pantalones 34
Otros 11
Total 100
b.
Ventas porcentuales Ventas Porcentuales
Almacén x (agosto 2011) almacén x (agosto 2011)
50
42%
Porcentajes
40
42% 34%
30
11% 20
11%
10
8%
CONVENCIONES 5%
5% cam isas
34% pantalones
0
8%
Camisas
Corb atas
Pantalo nes
Calcetines
Otros
corbata s
calcetines
otro
Artículos
12
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Señalar el literal que más concuerde con cada una de las siguientes aseveraciones.
Una buena muestra industrial debe ser:
a) Pequeña.
b) Grande.
c) Representativa de la población objetivo.
d) Incluir solo los establecimientos grandes.
La clasificación de los establecimientos dedicados al comercio al detalle se hace teniendo en
cuenta:
a) Su función.
b) El valor de las ventas.
c) El valor de la producción.
d) El valor del trabajo realizado.
Una población infinita es aquella en donde:
a) El número de elementos está completamente delimitado.
b) El número de elementos pasa de 1.000.
c) El número de elementos no está delimitado.
EJERCICIO 2.
Un ejemplo de característica cualitativa pueden ser datos sobre:
a) Salario. c) Gastos mensuales en alimentación. e) Temperatura
b) Pulsaciones. d) Nivel de instrucción.
EJERCICIO 3.
¿Por qué es útil la estadística en el campo en el cual se está preparando?
EJERCICIO 4.
“la estadística estudia el comportamiento de fenómenos colectivos y nunca de una
observación individual”. Comentar este principio
EJERCICIO 5.
Una muestra es aleatoria cuando las unidades se seleccionan:
a) En forma caprichosa.
b) Por conveniencia.
c) A través de un censo.
d) En forma repetitiva.
e) De tal manera que todas tengan la misma posibilidad.
13
Lic. Isidro W. Nina Paco
EJERCICIO 6.
Por población o universo se entiende.
a) Un recuento de unidades.
b) Un conjunto de seres humanos.
c) Un conjunto de datos.
d) Un conjunto de medidas o el recuento de todas las unidades que tienen una
característica común.
e) Ninguna de las anteriores
EJERCICIO 7
Diga brevemente qué diferencia hay entre:
a) Parámetro y estimador.
b) Población y muestra.
c) Atributo y variable.
d) Muestreo aleatorio y no aleatorio.
EJERCICIO 8.
Indique y defina en forma brevemente los pasos que se debe seguir en un proceso de
Investigación Estadística.
EJERCICIO 9.
Dé contestación a los siguientes puntos, señalados con una X si es verdadero o falso
Verdadero Falso
a) 𝐻5 = 0.36 𝐹4 = 30 𝑛5 = 6 𝑛 = 50 ( ) ( )
b) Para calcular las marcas de clase, se suma el límite inferior al superior del
intervalo y se divide entre dos. ( ) ( )
c) El número de accidentes según sus causas, es una variable discreta.
( ) ( )
d) Si 𝐻6 = 0.7 y 𝐻4 = 0.3 un 40% de los valores de la variable es menor que 𝑋6 y
mayor que 𝑋4 ( ) ( )
e) 𝐻5 = 1.10 𝐻4 = 0.80 ℎ5 = 0.30 ( ) ( )
f) La suma de las frecuencias absolutas es igual a 1. ( ) ( )
EJERCICIO 10.
Que entiende usted por:
a) Distribución de frecuencias. c) Frecuencia.
b) Variable discreta. d) Frecuencia relativa.
EJERCICIO 11.
En una empresa, se hace un estudio sobre el número de horas que el personal deja de laborar
durante la semana. Los resultados son: 10 horas, 3 obreros; 3 horas, 7 obreros; 9 horas, 1
obrero; 4 horas, 2 obreros; 8 horas, 5 obreros; 5 horas, 8 obreros; 6 horas, 6 obreros.
14
Lic. Isidro W. Nina Paco
a) ¿Cuál es la población?
b) ¿Cuál es la variable?
c) ¿Cuál es la clase de variable?
d) ¿Cuántos valores toma la variable?
e) ¿Cuál es el valor de:
𝑋3 𝑓2 𝐻5 ℎ4
EJERCICIO 12.
De contestación a los siguientes puntos, diciendo si son ciertas o falsas a las siguientes
afirmaciones:
a) Al hacer una gráfica, la variable a estudiar va en el eje de las abscisas y las frecuencias en
la ordenada. ( )
b) El polígono de frecuencias se emplea para representar a la variable continua. ( )
c) Entre más características tenga la gráfica, se le considera como la mejor. ( )
d) Si los intervalos no son iguales, nos facilita la elaboración del histograma por lo tanto será
mucho más representativo. ( )
EJERCICIO 13.
Reconstruya la siguiente distribución simétrica.
𝑿𝒊 𝒇𝒊 𝑯𝒊
10 6 0.12
20 - 0.32
30 - -
40 - -
50 - -
EJERCICIO 14.
Con los siguientes datos, correspondientes a los pagos semanales (en $us.) a trabajadores de la
construcción:
77 70 65 62 53 78 41 48 74 63 34 38 69
79 76 55 59 69 78 75 34 68 56 61 41 83
54 49 68 48 64 84 74 68 73 69 31 69 78 64
15
Lic. Isidro W. Nina Paco
Solución:
𝑋′3 = 57 𝑋5 = 70.5 𝐻4 = 0.50 𝐹5 = 32 𝐶=9
EJERCICIO 15.
Decir si son verdaderas o no las siguientes relaciones:
a) 𝑚 = 6 ℎ1 = 0.2 ℎ4 = 0.2 𝐻2 = 0.6 𝐻3 + 𝐻4 = 1.9
b) 𝐻4 = 0.20 𝐻5 = 0.12 ℎ5 = −0.08
c) 𝑚 = 4 𝐻5 + ℎ6 = 𝐻6
Solución:
a) Falso, porque se deduce que 𝐻4 = 1.05
b) La frecuencia relativa no puede tener signo negativo (falso)
c) Falso, m no puede ser 4, a lo más igual a 6
EJERCICIO 16.
Contestar verdadero si el enunciado es verídico. Si no los es, la palabra en negrilla debe
sustituirse por una expresión con la cual el enunciado sea válido.
a) Un cuadro o tabla es la mejor forma de visualizar la información.
b) El recuento de los empleados en una empresa, de acuerdo al cargo, es un ejemplo de
variable discreta
c) El pictograma es la representación estadística por medio de mapas, dentro de los
cuales se ubican símbolos.
d) El histograma es un tipo de representación en gráfica de rectángulos de una
distribución continua.
e) El grosor de la lámina de metal que la compañía A utiliza en sus procesos de
manufactura es un ejemplo de atributos.
f) La población o universo es un subconjunto de unidades extraídas al azar en tal forma
que nos permita tener información sobre un grupo mayor.
EJERCICIO 17.
Opinión de los electores sobre si van a votar para el Congreso y para Presidente en las
próximas elecciones. Se pide elaborar el gráfico correspondiente:
Opinión Congreso % Presidente %
Afirmativo 22,24 48,32
Negativo 77,76 51,68
Total 100,00 100,00
Solución:
Opinión porcentual de posibles votos (positivos y negativos) para congreso y presidente
16
Lic. Isidro W. Nina Paco
CONVENCIONES
voto negativo
voto positivo
EJERCICIO 18.
¿Qué ventajas tienen las gráficas en un resumen de datos?
EJERCICIO 19.
Una empresa petrolera “Compañía X” en su informe anual mencionó las siguientes ventas
netas y el costo ventas desde 2006 (en miles de dólares)
2006 2007 2008 2009 2010 2011
Ventas netas 19.116 15.586 13.534 21.334 27.342 30.620
Costo de ventas 15.776 12.895 18.287 18.476 20.698 25.382
Se pide:
a) Elaborar un cuadro que represente esta información para ser publicada en una revista
de la facultad.
b) Haga como mínimo dos gráficas que permitan representar la información anterior.
EJERCICIO 20.
Los siguientes datos corresponden el tiempo (minutos) que han necesitado 30 clientes de un
Banco para llevar a cabo una transacción bancaría.
20 42 62 32 28 20 38 26 30 18 42 54 16 32 42
36 18 56 41 16 14 42 34 14 24 51 49 24 18 56
Se pide elaborar:
a) Una tabla de frecuencias.
17
Lic. Isidro W. Nina Paco
Solución:
a.
Tiempo que se gasta en una
transacción bancaria
Xi fi hi Fi Hi
EJERCICIO 21.
Las calificaciones de 30 alumnos que presentaron examen de admisión a la facultad,
utilizando una escala de 0 a 100, fueron:
83 64 51 46 82 91 73 65 82 61 74 64 75 81 94
65 42 81 56 61 72 65 39 54 70 93 42 46 54 72
Elaborar un cuadro de frecuencias y dibujar los gráficos correspondientes (histograma,
polígono y ojiva)
Solución:
X i'1 X i' fi Fi hi Hi Xi
18
Lic. Isidro W. Nina Paco
EJERCICIO 22.
A continuación se transcriben las edades de 50 integrantes de un programa de servicio social
del gobierno:
81 53 67 60 80 64 56 54 91 61
66 88 67 65 52 72 74 65 73 69
43 54 76 70 97 68 82 75 79 60
39 87 76 97 86 45 60 45 65 76
92 72 82 80 70 65 50 58 70 56
Construya con estos datos las distribuciones de frecuencia relativa usando 7 intervalos
iguales. Calcular el porcentaje de adultos que sean mayores de 50 años.
Solución.
(𝑿′𝒊−𝟏 𝑿′ 𝒊 ] 𝑿𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
(36 45] X1 = 40.5 f1 = 4 h1 = 0.08 F1 = 4 H1 = 0.08
(45 54] X2 = 49.5 f2 = 5 h2 = 0.10 F2 = 9 H2 = 0.18
(54 63] X3 = 58.5 f3 = 7 h3 = 0.14 F3 = 16 H3 = 0.32
(63 72] X4 = 67.5 f4 = 15 h4 = 0.30 F4 = 31 H4 = 0.62
(72 81] X5 = 76.5 f5 = 10 h5 = 0.20 F5 = 41 H5 = 0.82
(81 90] X6 = 85.5 f6 = 5 h6 = 0.10 F6 = 46 H6 = 0.92
(90 99] X7 = 94.5 f7 = 4 h7 = 0.08 F7 = 50 H7 = 1.00
n = 50 1.00
43
𝑃 [𝑋 > 50] = 𝑃[𝑋 ≥ 51] = ∗ 100 = 86%
50
19
Lic. Isidro W. Nina Paco
20
TEMA 2:
MEDIDAS DE POSICIÓN
𝒏 𝑛
(Para datos tabulados y agrupados) − 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖𝑛𝑓 + 2 ∗𝐶
𝐹𝑖 − 𝐹𝑖−1
(Para datos agrupados)
MEDIA GEOMETRICA (𝒙𝒊 ≠ 𝟎)
MEDIA ARMONICA (𝒙𝒊 ≠ 𝟎)
𝑛 𝑛 𝑛
𝑛 𝑋̅ 𝐻 = =
̅̅̅̅
𝑋𝐺 = √∏ 𝑋𝑖 = 𝑛√𝑋1 ∗ 𝑋2 ∗ … ∗ 𝑋𝑛 1 1 1 1
∑𝑛𝑖=1 + + ⋯+
𝑋𝑖 𝑋1 𝑋2 𝑋𝑛
𝑖=1
𝑛 𝑛
∑𝑛𝑖=1 log 𝑋𝑖 𝑋̅ 𝐻 = =
̅̅̅̅ 𝑓𝑖 𝑓1 𝑓2 𝑓𝑘
𝑿𝑮 = antilog ( ) ∑𝑘𝑖=1
𝑛 𝑋𝑖 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘
(Para datos tabulados y agrupados)
𝒌
𝒏
𝒇 𝒇 𝒇 𝒏 𝒇
MEDIA CUBICA
̅̅̅̅
𝑿𝑮 = √∏ 𝑿𝒊 𝒊 = √𝑿11 ∗ 𝑿22 ∗ … ∗ 𝑿𝒌𝒌
𝒊=1
3 ∑𝒏𝒊=1 𝑿3𝒊 3 𝑿3 + 𝑿3 + ⋯ + 𝑿3
1 2 𝒏
(Para datos tabulados y agrupados) 𝑴3 = √ =√
𝒏 𝒏
∑𝑘𝑖=1 𝑓𝑖 log 𝑋𝑖
̅̅̅̅
𝑿𝑮 = antilog ( )
𝑛
3 ∑𝒌𝒊=1 𝒇𝒊 𝑿3𝒊 3 𝒇 𝑿3 + 𝒇 𝑿3 + ⋯ + 𝒇 𝑿3
1 1 2 2 𝒌 𝒌
MEDIA CUADRATICA 𝑴3 = √ =√
𝒏 𝒏
(Para datos tabulados y agrupados)
∑𝒏𝒊=1 𝑿2𝒊 𝑿12 + 𝑿22 + ⋯ + 𝑿2𝒏
̅ = 𝑴2 = √
𝑿 =√ MEDIA MUESTRAL CONJUNTA DE
𝑪 𝒏 𝒏 DOS SUB-MUESTRAS
𝑛𝐴̅̅̅
𝑋𝐴 + 𝑛𝐵 ̅̅̅̅
𝑋𝐵
∑𝒌𝒊=1 𝒇𝒊 𝑿2𝒊 𝒇1 𝑿12 + 𝒇2 𝑿22 + ⋯ + 𝒇𝒌𝑿2𝒌 𝑋̅ = , 𝑛𝐴 + 𝑛𝐵 = 𝑛
̅ √ √ 𝑛
𝑿 𝑪 = 𝑴2 = =
𝒏 𝒏 EN GRAL. PARA K-SUBMUESTRAS
(Para datos tabulados y agrupados) ∑𝑘𝑖=1 𝑛𝑖 𝑋̅𝑖
𝑋̅ =
∑𝑘𝑖=1 𝑛𝑖
𝑛1̅̅̅
𝑋1 + 𝑛2 ̅̅̅
𝑋2 + ⋯ + 𝑛𝑘 ̅𝑋̅̅𝑘̅
=
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘
23
Lic. Isidro W. Nina Paco
MODA
DECILES m = 1, 2, 3, … ,9
Moda = dato que se repite con mayor
frecuencia 𝐷𝑚 = 𝑋𝑚(𝑛+1)
∆1
datos tabulados
10
∆1 : 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑚𝑎𝑦𝑜𝑟
𝑓𝑟𝑒𝑐. 𝐴𝑏𝑠. 𝑦 𝑙𝑎 𝑓𝑟𝑒𝑐. 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑚(𝑛 + 1)
𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( )
∆2 : 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑚𝑎𝑦𝑜𝑟 10
𝑓𝑟𝑒𝑐. 𝐴𝑏𝑠. 𝑦 𝑙𝑎 𝑓𝑟𝑒𝑐. 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
𝑚𝑛
− 𝐹𝑖−1
CUARTILES 𝐷𝑚 = 𝐿𝑖𝑛𝑓 + 10 ∗𝑐
𝐹𝑖 − 𝐹𝑖−1
Para una lista de datos y
𝑚(𝑛 + 1) 𝑃𝑚 = 𝑋𝑚(𝑛+1)
𝑄𝑚 = 𝑋𝑗 + ( − 𝑗) (𝑋𝑗+1 − 𝑋𝑗 ) m = 1, 2, … ,99
𝑚(𝑛 + 1) 𝑚(𝑛 + 1)
𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( ) 𝑃𝑚 = 𝑋𝑗 + ( − 𝑗) (𝑋𝑗+1 − 𝑋𝑗 )
4 datos tabulados 100
𝑚𝑛
− 𝐹𝑖−1 𝑚 (𝑛 + 1)
𝑄𝑚 = 𝐿𝑖𝑛𝑓 + 4 ∗𝑐 𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( )
𝐹𝑖 − 𝐹𝑖−1 100
(Para datos agrupados) 𝑚𝑛
− 𝐹𝑖−1
𝑃𝑚 = 𝐿𝑖𝑛𝑓 + 100 ∗𝑐
𝐹𝑖 − 𝐹𝑖−1
FORMULA ABREVIADA DE LA (Para datos agrupados)
MEDIA ARITMÉTICA
Para una lista de datos
PROPIEDADES DE LA MEDIA
𝑂𝑡 : 𝑂𝑟𝑖𝑔𝑒𝑛 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑜 ARITMÉTICA
Sabiendo que:
Para una lista de datos y
𝑑𝑖 : 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠
∑𝑋
d i X i Ot 𝑋̅ = 𝑀[𝑋] =
𝑛
datos tabulados
∑ 𝑑𝑖 1) 𝑀[𝑐] = 𝑐
𝑥̅ = 𝑂𝑡 + 2) 𝑀[𝑐𝑋] = 𝑐𝑀[𝑋]
𝑛
3) 𝑀[𝑐𝑋 + 𝑑] = 𝑐𝑀[𝑋] + 𝑑
Para datos agrupados 4) ∑(𝑋𝑖 − 𝑋̅) = 0
∑ 𝑓𝑖 𝑑𝑖
𝑥̅ = 𝑂𝑡 +
𝑛
X i Ot d i
d i' =
C C
∑ 𝑓𝑖 𝑑′𝑖
𝑥̅ = 𝑂𝑡 + 𝐶
𝑛
24
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Solución:
X i Ot
d i X i Ot d i' 𝑥̅ = 𝑂𝑡 +
∑ 𝑑𝑖 𝑓𝑖
𝑛
C
7
d
7
'
C 10 40
i =7 Ot 55 hi h5 h6 h7
i 1 i5 110
7
40
hi h5 h6 h7
i5 110
7 f5 f f
6 7 40
i5 n n n 110
n 110 𝑓5 + 𝑓6 + 𝑓7 = 40 𝑓5 + 15 + 1 = 40 𝑓5 = 40 − 16 = 24
∑ 𝑥𝑖 𝑓𝑖 7.150
a) 𝑥̅ = 65
𝑛 110
∑ 𝑑𝑖 𝑓𝑖 1.100
b) 𝑥̅ = 𝑂𝑡 + 55 55 10 65
𝑛 110
25
Lic. Isidro W. Nina Paco
∑ 𝑑𝑖′ 𝑓𝑖 110
c) 𝑥̅ = 𝑂𝑡 + 𝑐 55 10 55 10 65
𝑛
110
NOTA: Como la distribución es SIMETRICA, la media ubica en la mitad de la variable (marcas de
clase)
EJERCICIO 2.
Un grupo de 200 estudiantes, cuya estatura media es de 160.96 centímetros se divide en dos grupos,
uno con una estatura media de 163.4 centímetros y otro con una de 157.3 centímetros ¿Cuántos
estudiantes hay en cada grupo?
Solución:
n 200 n1 ? n2 ? n1 n2 200 n1 200 n2
6,1 n2 488
n 2 488 80 Estudiantes
6,1
EJERCICIO 3.
En un curso hay 35 hombres con una edad media de 17,5 años y 15 mujeres las que, en promedio,
son 22% más jóvenes. ¿Cuál es la edad media del curso?
Solución:
n1 35 n2 15 n 50 x ?
x1n1 x2 n2
x
n
EJERCICIO 4.
26
Lic. Isidro W. Nina Paco
Una fábrica de producción múltiple, tiene cuatro líneas de productos. Durante el mes de octubre del
presente año los resultados obtenidos al realizar la operación de rutina de control de calidad, fueron
los siguientes:
Determinar el promedio porcentual de artículos defectuosos producidos por dicha fabrica en el mes
de octubre del presente año.
Solución:
b)
Xi fi X i fi X i fi
X
n
0,008 8.300 66,4
0,011 12.600 138,6
0,026 24.300 631,8
0,014 15.800 221,2 1.058
X 0,0173 1,73%
61.000 1.058,0 61.000
Son 1.058 (miles de unidades) producidas en forma defectuosa, para un porcentaje de 1,73% de la
producción.
EJERCICIO 5.
Solución:
xi 5.770
x x 641,11
n 9
27
Lic. Isidro W. Nina Paco
EJERCICIO 6.
Solución:
Fi 56.278
Xi fi X i fi a) Media 803,97
70
642 2 1.284 2
751 12 9.012 14 Salario promedio mensual
758 8 6.064 22
794 10 7.940 Fi1 b) Mediana n 35
32 2
801 24 19.224 56 Fi M e xi 801
c) Moda M 0 801
EJERCICIO 7.
Una muestra realizada a 12 profesores de colegios públicos, acerca de sus salarios arrojó los
siguientes resultados en dólares: $300; 350; 350; 440; 335; 370; 490; 550; 700; 630; 650 y 685.
Calcular la media, mediana y moda de los salarios. ¿Cuál fue el mejor promedio? ¿Por qué?
Solución:
300 335 350 350 370 440 490 550 630 650 685 700
El mejor promedio es la mediana, por ser el centro, eliminando los extremos, correspondiente al salario
más bajo y al más alto.
28
Lic. Isidro W. Nina Paco
EJERCICIO 8.
X i'1 X i' fi
2.1 – 5 120
5.1 – 9 15
9.1 – 16 8
16.1 – 20 6
20.1 – 28 6
28.1 – 36 5
∑ 160
Solución:
X i'1 X i' fi Xi X i fi Fi ci f i ci
M e 2 3 80 0 2 2 4
120
EJERCICIO 9.
Una persona viaja en coche de la ciudad “A” a la “B” con una velocidad media de 80 km por hora y
vuelve de la ciudad “B” a la “A” con una velocidad media de 120 km por hora, hallar la velocidad media
del viaje completo.
Solución:
2
Vm 96 Vm 96 km. p.h.
1 1
80 120
EJERCICIO 10.
Se sabe que dos obreros gastan en la ejecución de un trabajo 80 y 60 minutos respectivamente, ¿Cuál
es el tiempo medio requerido para hacerlo en conjunto?
Solución:
29
Lic. Isidro W. Nina Paco
2
MH 68,57 Minutos
1 1
80 60
EJERCICIO 11.
Con los datos de la siguiente tabla, se pide calcular la media cuadrática, cúbica y el séptimo decil.
X i'1 X i' Xi fi X i2 f i X i3 f i Fi
3,1 – 8 5,5 8 242 1.331 8
8,1 – 10 9,0 8 648 5.832 16
10,1 – 16 13,0 14 2.366 30.758 30
16,1 – 24 20,0 16 6.400 128.000 46
24,1 – 30 27,0 18 13.122 354.294 64
30,1 – 32 31,0 10 9.610 297.910 74
74 32.388 818.125 -
Solución:
32.388
Media cuadrática M 2 20,92
74
818.125
Media cúbica M 3 3 22,28
74
774
Séptimo decil D7 51,8 Fi 1 46 Fi 64
10
51,8 46
D7 24 6 24 1,93 25,93
18
EJERCICIO 12.
Durante diez días se observó en una importadora, el número de autos vendidos por su empleado
estrella.
Días: 1 2 3 4 5 6 7 8 9 10
Autos: 2 3 2 1 4 1 5 6 3 4
Cada auto vale $18.500 y al empleado se le paga un sueldo de $1.500 básico mensual más el 0,5% del
valor de cada auto vendido. ¿Cuál será el sueldo promedio para el vendedor estrella en este lapso de
10 días?
Solución:
30
Lic. Isidro W. Nina Paco
573.500 (0,005) + 500 = $2.867,5 + 500 = $3.367.5 sería el sueldo promedio en los 10 días.
EJERCICIO 13.
a) La media de una muestra divide los datos en dos partes iguales: la mitad mayores y la mitad
menores que su propio valor.
b) La media armónica es la raíz enésima del producto de los valores que toma la variable
c) El decil ocho representa aquel valor de la variable que supera el 80% de las observaciones y es
superado por el resto 20%.
d) Una distribución o un conjunto de datos permite el cálculo de varias medidas de tendencia
central.
e) Un promedio aplicado o calculado en un conjunto de datos provenientes de una muestra se
denomina parámetro.
Solución:
EJERCICIO 14.
Se tiene dos cursos A y B, donde el primero tiene un promedio de calificación de 60, mientras que en
el B es de 72. Diga qué porcentaje de alumnos tiene A y B, si el promedio de calificación para la suma
de los dos cursos es de 65
Solución:
x1 60 x2 7,2 x 60 (1 h2 ) 72 h2 65
1 h1 h2 65 60 60 h2 72 h2
h1 1 h2 5
5 12 h2 h2 0,417 ; h2 41,7% ; h1 58.3%
12
EJERCICIO 15.
Dados los números 55, 44, 51, 63, 48, 77, encontrar la media armónica, la media geométrica, la
media cúbica y la media cuadrática.
Solución:
6
a) Media armónica = XH 54.44
1 1 1 1 1 1
55 44 51 63 48 77
31
Lic. Isidro W. Nina Paco
32
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Un grupo de 200 empleados, que tiene una compañía, se dividen en operarios y técnicos con un
salario promedio de $us 1.260. Los salarios promedio para cada uno de los grupos son de $us 857 y
$us 1.320 respectivamente.
Solución:
EJERCICIO 2.
En una fábrica de tres secciones se sabe que en la sección A, con 60 obreros, la asistencia promedio
es de 240 días al año; en la sección B, que tiene 90 obreros, la asistencia media es de 216 días al año.
Si la asistencia media en toda la fábrica es de 226,70 días, ¿Cuántos obreros hay en la sección C,
donde la asistencia promedio es de 230 días al año?
Solución:
𝒏𝟑 = 50 𝑜𝑏𝑟𝑒𝑟𝑜𝑠
EJERCICIO 3.
Solución:
n1 32 n2 32 n3 27 𝑥3 = ?
̅̅̅
EJERCICIO 4.
Los siguientes datos corresponden a los salarios mensuales en dólares, pagados por una empresa a
su personal:
33
Lic. Isidro W. Nina Paco
Solución:
xi + 7% xi +49
642 649
749 igual 749
856 favorable 849
963 949
EJERCICIO 5.
Los siguientes datos corresponden a los salarios mensuales (en dólares) de 50 trabajadores.
𝑿′𝒊−𝟏 − 𝑿′𝒊 𝒇𝒊
800 – 1.000 5
1.000 – 1.200 13
1.200 – 1.400 17
1.400 – 1.600 8
1.600 – 1.800 7
Con la siguiente distribución, calcular:
Solución:
EJERCICIO 6.
En una empresa constructora de vivienda, los jornales semanales tienen una media de $us 169.
Como una solución al conflicto laboral surgido se proponen dos soluciones al conflicto: (a) un
34
Lic. Isidro W. Nina Paco
aumento del 6% en el salario semanal; (b) un aumento del 4% más una bonificación semanal de $us
5,8 a cada obrero, ¿Cuál de las dos alternativas mejora la situación del obrero?
Solución:
EJERCICIO 7.
Se tiene que:
𝑥2 = 22 𝑥 ′ 5 = 50 𝑚=6 𝐶 = 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 𝑓2 + 𝑓4 = 15 𝑓1 + 𝑓3 = 25
𝑛 = 50 𝑓5 + 𝑓6 = 10 𝑓1 = 8 𝑓5 = 2 𝑓2 = 7
Solución:
EJERCICIO 8.
Un laboratorio de control de calidad de una empresa quiere lanzar al mercado un nuevo perfume;
seleccionó cincuenta departamentos de una urbanización para determinar el tiempo de permanencia
del aroma; los resultados fueron observados cada hora, habiéndose obtenido: 10 horas, 5
departamentos; 3 horas, 3 departamentos; 5 horas, 10 departamentos; 4 horas, 7 departamentos; 6
horas, 16 departamentos; y 8 horas, 9 departamentos.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es la variable?
d) ¿De qué tipo es la variable?
e) ¿Cuál es el promedio de permanencia del aroma?
f) Elabore una gráfica que represente a la distribución.
Solución:
35
Lic. Isidro W. Nina Paco
e) X 6,1 Horas
EJERCICIO 9.
a) 𝑥̅ = 68 𝑀𝑒 = 62 𝑀𝑜 = 68
b) 𝑥̅ = 70 𝑀𝐺 = 65 𝑀2 = 72,50 𝑀𝐻 = 63 𝑀3 = 76,8
Solución:
EJERCICIO 10.
Un estadístico entrega una hoja con los siguientes datos que se refieren al cálculo de una media
aritmética:
di ' di ' fi
1 2
2 20
3 75
4 100
5 75
6 18
Solución:
M e 46,20
EJERCICIO 11.
3
De tres números se sabe que su media cúbica √657 , su media aritmética es 7 y su mediana es 6. Se
pide calcular los valores de esos tres números.
Solución:
x1 3 x2 6 x3 12
EJERCICIO 12.
Con base en los siguientes datos, correspondientes a medidas de tendencia central, determinar si
hay simetría y cuál es su dirección.
36
Lic. Isidro W. Nina Paco
𝑎) 𝑥̅ = 68 𝑀𝑒 = 74 𝑀0 = 80
𝑏) 𝑥̅ = 80 𝑀𝑒 = 74 𝑀0 = 68
𝑐) 𝑥̅ = 74 𝑀𝑒 = 74 𝑀0 = 74
𝑑) 𝑥̅ = 74 𝑀𝑒 = 74 𝑀0 = 60
Solución:
EJERCICIO 13.
Los gastos (miles de Bs.) en publicidad de 50 empresas comerciales, durante el mes de diciembre de
2006 agruparon en 4 clases de amplitud constante, de la cual se sabe:
Solución:
296 ,5
Media 5,93 Media geométrica 5,81
50
EJERCICIO 14.
x'i 1 x'i fi
6,1 - 12 2
12,1 - 15 14
15,1 - 20 5
20,1 - 28 3
28,1 - 36 7
36,1 - 40 16
40,1 - 50 3
50
a) Media aritmética.
b) Mediana.
c) La Moda
d) Tercer decil.
e) Segundo cuartil.
f) Percentil sesenta.
Solución:
37
Lic. Isidro W. Nina Paco
EJERCICIO 15.
Explique brevemente:
38
TEMA 3:
MEDIDAS DE DISPERSIÓN
39
Lic. Isidro W. Nina Paco
VARIANZA DE SUB-MUESTRAS
̅̅̅
𝑛𝐴 ∗ 𝑠𝐴2 + 𝑛𝐵 ∗ 𝑠𝐵2 + 𝑛𝐴 (𝑋 ̅ 2 ̅̅̅̅ ̅ 2
𝐴 − 𝑋 ) + 𝑛𝐵 (𝑋𝐵 − 𝑋 )
𝑠2 =
𝑛
𝑛𝐴 ̅̅̅
𝑋𝐴 + 𝑛𝐵 ̅̅̅̅
𝑋𝐵
𝑋̅ = , 𝑛𝐴 + 𝑛𝐵 = 𝑛
𝑛
En general para k-submuestras de 𝑀1 , 𝑀2 , … , 𝑀𝑘
1) 𝜎 2 = 𝑉𝑎𝑟[𝑥] ≥ 0
2
𝑅𝑎𝑛𝑔𝑜 𝑠𝑒𝑚𝑖𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = (𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟) 2) 𝜎 2 = 𝑉𝑎𝑟[𝑥] = 𝑀[𝑥 2 ] − (𝑀[𝑥])2
3
3) 𝑉𝑎𝑟[𝑐] = 0 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑐 = 𝑐𝑡𝑡𝑒.
DISPERSIÓN ABSOLUTA Y RELATIVA 4) 𝑉𝑎𝑟[𝑐𝑥] = 𝑐 2 𝑉𝑎𝑟[𝑥]
𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 5) 𝑉𝑎𝑟[𝑥 + 𝑐] = 𝑉𝑎𝑟[𝑥]
𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 =
𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 6) 𝑉𝑎𝑟[𝑐𝑥 + 𝑑] = 𝑐 2 𝑉𝑎𝑟[𝑥]
COEFICIENTE DE VARIACIÓN
𝑠
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = 𝐶𝑉 = ∗ 100
𝑋̅
40
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
x4
y 1 / 4 8 x 2 y 8 x 2 2 x 0,5 Siendo S x 2
4 4
Sx 4
2
EJERCICIO 2.
Tres profesores de contabilidad básica registraron una calificación media en sus exámenes de 55, 64,
70, con desviaciones típicas de 7, 9, 10; sus clases estaban formadas por 65, 60 y 70 estudiantes
respectivamente. Determinar la calificación media y la desviación típica para el conjunto de los 195
estudiantes, ¿Cuáles serían estas medidas, si todos los cursos tienen el mismo número de
estudiantes?
Solución:
S 22 n 2 S 32 n3 x1 x n1 x 2 x n 2 x3 x n3
2 2 2 2
S1 n1
S
2
n1 n 2 n3 n1 n 2 n3
4965 8160 100 70 55 63,15 65 64 63,15 60 70 63,15 70
2 2 2
S
2
195 195
15.045 7645,39
S
2
77,15 39,21 116,36
195 195
S
2
116,36
S 10,79
Si se considera que todos los cursos tienen el mismo número de estudiantes, los estadígrafos serían:
55 64 70 189
x 63
3 3
41
Lic. Isidro W. Nina Paco
230 8 1 7 64 1 49
2 2 2
S
2
76,67
3 3 3
114
S
2
76,67 76,67 38 114,67
3
S 10,71
EJERCICIO 3.
Solución:
xi 16
x : 5, 3, 6, 2 x x 4
n 4
xi2
S
2
x2 Sx
2
74
4 2 18,5 16 2,5
2
Sx 2,5
n 4
y 3x 4 M Y 3 M X 4 M Y 3 4 4 16 y 16
SY
2
9S X2 9 2,5 22,5
EJERCICIO 4.
Un micro mercado vende un promedio mensual de Bs. 300.000 en diferentes artículos con una
desviación típica de Bs. 3.000.
a) El micro mercado paga un impuesto igual al 13% de las ventas. ¿Cuál será la varianza de las
ventas una vez pagado el impuesto?
b) Las utilidades del micro mercado se calculan teniendo en cuentas que mensualmente se
pagan Bs. 245.000 por salarios, gastos, etc. Además del impuesto sobre las ventas. Calcule el
coeficiente de variación de las utilidades.
Solución:
2
S X K S X2 no cambia, por lo tanto S
2
3.0002
42
Lic. Isidro W. Nina Paco
2
S X K S X2 no cambia, por lo tanto S 3.000
S 3.000
CV 100 5,45%
x 55.000
EJERCICIO 5.
En un grupo de 70 personas, se sabe que 30 de ellas tiene un salario medio diario de Bs, 2.800 y los
restantes de Bs. 3.500.
Solución:
30 2.800 40 3.500
a) x Bs.3.200 Salario diario promedio para los 70 primeros
70
b) 0,35
S
S 0,35 3.200 Bs. 1.120
3.200
EJERCICIO 6.
Con los siguientes datos: 4, 7, 10, 15 y 25. Calcular la desviación típica, desviación media y mediana.
Observar que 𝑆 > 𝐷𝑀 ≥ 𝐷𝑀𝑒
Solución:
xi xi x xi M e x i2 x
61
12,2
5
4 8,2 6 16
7 5,2 3 49
10 2,2 0 100
15 2,8 5 225 M e 10
25 12,8 15 625
31,2 29 1.015
xi X 31,2
DM 6,24
n 5
Xi Me 29
DM e 5,8
n 5
43
Lic. Isidro W. Nina Paco
xi2 1.015
S
2
x2 12,2 2 54,16
n 5
S 54,16 7,36
EJERCICIO 7.
28 42 64 32 68 25 34 40 51 62
36 56 76 40 70 28 38 46 58 64
Se pide:
a) Trabajando con los datos originales calcular la desviación típica y desviación mediana y el
coeficiente de variación.
b) Agrupar los datos en una tabla de frecuencias, teniendo en cuenta que la amplitud es constante
(la variable es continua) y m=6, calcular el coeficiente de variación.
Solución:
a) n 20 x 958 47 ,9
20
50 .630 20 47 ,9
2
S
2
237 ,09 S 15,40
20
25 28 28 32 34 36 38 40 40 42 46 51 56 58 62 64 64 68 70 76
42 46
Me 44
2
Desviación mediana: xi M e 19 16 16 12 10 8 6 4 4
2 2 7 12 14 18 20 20 24 26 32 272
xi M e
DM e 272 13,6
n 20
Rango 51
b) Rango 76 25 51 C 9
m 6
44
Lic. Isidro W. Nina Paco
946
X i'1 X i' fi Xi X i fi X i2 f i X 47 ,3
20
23,1 – 32 4 27,5 110,0 3.025,00
32,1 – 41 5 36,5 182,5 6.661,25
49 .379 20 47 ,3
2
41,1 – 50 2 45,5 91,0 4.140,50 S
2
20
50,1 – 59 3 54,5 163,5 8.910,75
59,1 – 68 4 63,5 254,0 16.129,00
68,1 – 77 2 72,5 145,0 10.512,50 S
2
231,66
20 - 946,0 49.379,00
S 15,22
15,22
CV 100 32 ,18 %
47 ,30
EJERCICIO 8.
Los siguientes datos corresponden a la distribución de frecuencias de los gastos de publicidad (miles
de bolivianos) de 50 empresas comerciales, durante el último semestre del 2016. Dichos gastos se
agruparon en cuatro clases de amplitud constante, de la cual se sabe:
Solución:
X i'1 X i' Xi fi Fi X i fi X i2 f i
2,75 – 4,25 3,5 4 4 14,00 49,00
4,25 – 5,75 5,0 16 20 80,00 400,00
5,75 – 7,25 6,5 25 45 162,50 1.056,25
7,25 – 8,75 8,0 5 50 40,00 320,00
- 50 - 296,50 1.825,25
xo'
1
C x1 xo' 4 C x4'
2
3,5C 5,25
5,25
C 1,50
3,50
a) Coeficiente de variación
45
Lic. Isidro W. Nina Paco
xi f i 296,50
x 5,93
n 50
X i2 f i 2
S
2
X
n
1.825 ,25
S
2
5,93 2 36,51 35,16 1,35 S 1,16 1,35
50
S 1,16
CV CV 0,1956 19 ,56 %
x 5,93
b) Desviación media
Xi di di fi di fi
3,5 -2,43 2,43 4 9,72
5,0 -0,93 0,93 16 14,88
6,5 0,57 0,57 25 14,25
8,0 2,07 2,07 5 10,35
- - 50 49,20
d i f i 49,20
DM 0,98
n 50
c) Desviación mediana
xi fi Fi xi M e xi M e f i X i M e fi
DM e
3,5 4 4 3,0 12,0 n
20
5,0 16 1,5 24,0 43,5
N J 1 DM e 0,87
6,5 25 45 Nj 0 0
50
M e xi 6,5
n n 50 25
Fi 1
2 2 2
EJERCICIO 9.
46
Lic. Isidro W. Nina Paco
Solución:
y 6 10 x
Sy
2
100 8 800
Podemos concluir que hay una diferencia entre las dos varianzas.
47
Lic. Isidro W. Nina Paco
48
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Durante un período de 3 años, los precios de un producto fueron en promedio de $us 8.000, con una
desviación típica de $us 120. En el período anterior de 3 años, el promedio fue de $us 5.000 con una
varianza de $us 3.600 ¿En qué período hubo mayor estabilidad?
Solución:
Siendo: 2
SA 14.400 SA 120 2
SB 3.600 SB 60 SB SA
60 120
Hubo mayor estabilidad en B, porque la varianza o la desviación estándar es menor que la de A.
EJERCICIO 2.
Solución:
n 10
EJERCICIO 3.
Hallar la desviación típica de dos números cuya media aritmética es 9,0 y su media geométrica es 7,2
Solución:
S 5,4
EJERCICIO 4.
Solución:
n 20
EJERCICIO 5.
Se analizaron en el primer semestre del año, los gastos de una empresa de construcciones y se
obtuvo un promedio de Bs. 1.740.000 y una desviación típica de Bs. 90.000 se determinó luego que
los contadores de esta empresa habían prescindido de Bs. 13.000 en los gastos por un error de
apreciación. Corrigiendo las medidas enunciadas, obtenga el coeficiente de variación de los gastos de
esta empresa.
Solución:
CV 5,13%
49
Lic. Isidro W. Nina Paco
EJERCICIO 6.
Las notas de 50 alumnos se clasifican en una tabla de frecuencias con cuatro intervalos de igual
magnitud. Se pide calcular el coeficiente de variación, sabiendo que:
𝑥2 = 50 𝑓1 = 4 𝐹2 = 20 𝑓3 = 25 𝑥̅ = 62,4
Solución:
CV = 24,74%
EJERCICIO 7.
a) ¿En cuál de las fábricas los jornales fueron absolutamente más variables?
b) ¿Relativamente más variables?
Solución:
a) SA 96 SB 97 SB SA 97 > 96
Los siguientes datos muestran el número de cuartos habitables en 60 viviendas localizadas en una
ciudad
No. de cuartos: 2 4 6 8 10
No. de viviendas: 6 18 16 12 8
Obtenga e interprete para estos datos la desviación típica, la desviación mediana y el coeficiente de
variación.
Solución:
𝑥𝑖 : 4 6 7 6 10 6 4 15 6
𝑦𝑖 : 10 18 12 20 8 10
50
Lic. Isidro W. Nina Paco
Se pide:
b) Determine en cada una de las submuestras la mejor posición de los siguientes valores 𝑥 = 8 y 𝑦 =
15
c) Trasformando las dos submuestras en una sola muestra, calcular el coeficiente de variación.
Solución:
EJERCICIO 10.
Solución:
CV 15,83%
EJERCICIO 11.
En un grupo de 70 personas, se sabe que 30 de ellas tiene un salario medio diario de $us 27 y los
restantes de $us 32
Solución:
b) S 2 109.20
EJERCICIO 12.
Con los siguientes datos determine la simetría o asimetría de la distribución aplicando las diferentes
vistas.
Xi fi
5 3
7 39
9 10
11 8
51
Lic. Isidro W. Nina Paco
13 7
15 3
70
Solución:
m3 17,06
A3 3
1,07
S 2,523
Hay una asimetría positiva
EJERCICIO 13.
1) 2)
𝑥1 = 12 𝑥3 = 6 𝑥5 = 23 𝑥7 = 4 𝑥9 = 6
X i'1 X i' fi
𝑥2 = 18 𝑥4 = 20 𝑥6 = 17 𝑥8 = 10 𝑥10 = 4
2,1 – 6 22
6,1 – 10 14
10,1 – 14 10
14,1 – 18 8
18,1 – 22 4
22,1 – 26 2
60
Se pide determinar:
Solución:
a) SA 5,71 S B 6,71 SB SA
EJERCICIO 14.
52
Lic. Isidro W. Nina Paco
Los salarios mensuales (en $us) que paga una fábrica a los operarios que trabajan en dos turnos,
tiene las siguientes estadísticas.
a) Comparar los salarios en los dos turnos en cuanto a variabilidad absoluta y relativa.
b) Obtener el coeficiente de variación para el salario de los 100 operarios.
c) Cuál será el coeficiente de variación para el año entrante si el gerente ofrece un aumento de
$22 para los del primer turno y un 7% para los del segundo turno. El coeficiente de variación
a calcular, se refiere al total de los 100 operarios
Solución:
53
Lic. Isidro W. Nina Paco
54
Lic. Isidro W. Nina Paco
TEMA 4:
MEDIDAS DE FORMA Y
MOMENTOS
∑𝐾 𝑟
𝑖=1 𝑓𝑖 𝑋𝑖 ∑ 𝑓𝑋 𝑟
̅̅̅̅
𝑋 𝑟 = 𝑚𝑟,0 = =
𝑁 𝑁 SESGO
(Para datos tabulados y agrupados)
MOMENTOS RESPECTO A LA MEDIA 𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆𝒔 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐 𝒅𝒆 𝑷𝒆𝒂𝒓𝒔𝒐𝒏
𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑜𝑑𝑎 𝑋̅ − 𝑚𝑜𝑑𝑎
∑𝑁 ̅ 𝑟
𝑖=1(𝑋𝑖 − 𝑋 )
𝐶𝑆1 = =
𝑚𝑟 = 𝑚𝑟,𝑋̅ = = ̅̅̅̅̅̅̅̅̅̅̅̅
(𝑋 − 𝑋̅)𝑟 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑠
𝑁
̅ 𝑟 3(𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 ) 3(𝑋̅ − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
∑𝐾
𝑖=1 𝑓𝑖 (𝑋𝑖 − 𝑋 ) 𝐶𝑆2 = =
𝑚𝑟 = 𝑚𝑟,𝑋̅ = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑠
𝑁
(Para datos tabulados y agrupados) 𝑪𝒐𝒆𝒇. 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐 𝒅𝒆 𝑩𝒐𝒘𝒍𝒆𝒚
MOMENTOS RESPECTO A CUALQUIER VALOR 𝑄3 − 2𝑄2 +𝑄1
‘A’ 𝐶𝑞 𝑆 =
∑𝑁𝑖=1(𝑋𝑖 − 𝐴)
𝑟 ∑(𝑋 − 𝐴)𝑟 ∑ 𝑑 𝑟 𝑄3 − 𝑄1
𝑚′𝑟 = 𝑚𝑟,𝐴 = = =
𝑁 𝑁 𝑁
∑𝐾
𝑖=1 𝑓𝑖 (𝑋𝑖 − 𝐴)
𝑟 𝑪𝒐𝒆𝒇. 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐: 𝟏𝟎 − 𝟗𝟎
𝑚′𝑟 = 𝑚𝑟,𝐴 =
𝑁 𝑃90 − 2𝑃50 +𝑃10
𝐶𝑝 𝑆 =
(Para datos tabulados y agrupados) 𝑃90 − 𝑃10
55
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Conteste si es cierto o falso y por qué:
Solución:
a) CIERTO: Como la varianza siempre es mayor o igual a 0, y está definida por:
2
∑ 𝑥𝑖2 ∑ 𝑥𝑖
𝑉[𝑥] = −( ) ≥0
𝑛 𝑛
Entonces:
2
∑ 𝑥𝑖2 ∑ 𝑥𝑖
≥( )
𝑛 𝑛
d) CIERTO: VKX K 2 S X2 8 2 S X2
EJERCICIO 2.
Con los salarios semanales (en $us) de los empleados de una empresa se tienen los siguientes
resultados:
56
Lic. Isidro W. Nina Paco
3 x M e 3 97,25 96,72
AS 0,125 Ligeramente asimétrica positiva
S 12,7
EJERCICIO 3.
Con los siguientes datos:
28 42 64 32 68 25 34 40 51 62
36 56 76 40 70 28 38 46 58 64
Se pide:
a) Trabajando con los datos originales calcular la desviación típica y desviación mediana y coeficiente
de variación.
b) Agrupar los datos en una tabla de frecuencias, teniendo en cuenta que la amplitud es constante (la
variable es continua) y m=6, calcular el coeficiente de variación.
c) Calcular para el inciso b) las medidas de sesgo: 𝐶𝑆1 , 𝑎3 y las medidas de curtosis: 𝑎4 , 𝐾
Solución:
a) n 20 x 958 47 ,9
20
50 .630 20 47 ,9
2
S
2
237 ,09 S 15,40
20
25 28 28 32 34 36 38 40 40 42 46 51 56 58 62 64 64 68 70 76
42 46
Me 44
2
Desviación mediana: xi M e 19 16 16 12 10 8 6 4 4
2 2 7 12 14 18 20 20 24 26 32 272
xi M e
DM e 272 13,6
n 20
Rango 51
b) Rango 76 25 51 C 9
m 6
X i'1 X i' fi Xi X i fi X i2 f i
23,1 – 32 4 27,5 110,0 3.025,00
57
Lic. Isidro W. Nina Paco
S 15,22
15,22
CV 100 32 ,18 %
47 ,30
EJERCICIO 4.
Suponga que se tiene otra distribución que presenta las siguientes medidas:
𝑥̅ = 38.5 𝑦 𝑆 2 = 36
Comparando con los resultados del ejercicio anterior (ejercicio 3), determinar;
a) ¿Cuál de las dos distribuciones presenta una menor variabilidad absoluta?
b) ¿Cuál de ellas presenta una mayor variabilidad relativa?
Solución:
a)
2
S1 36 ; S2
2
231,66 2
S2 S12
231,66 36 Mayor variabilidad en el segundo caso
EJERCICIO 5.
Los salarios mensuales que paga una fábrica a los operarios que trabajan en dos turnos tienen las
siguientes estadísticas.
58
Lic. Isidro W. Nina Paco
a) Comparar los salarios en los dos turnos en cuanto a la variabilidad absoluta y relativa
b) Obtener el coeficiente de variación para el salario de los 100 operarios
c) Cuál será el coeficiente de variación para el año entrante si el gerente ofrece un aumento de Bs. 200
para los del primer turno y un 7% para los del segundo turno. El coeficiente de variación a calcular,
se refiere al total de los 100 operarios.
Solución:
10000
b) CV I 100 3.33%
3000
19600
CV II 100 3.11%
4500
CV1 CV 2 Hay mayor variabilidad relativa en el primer turno.
100
c) x1 K 3000 200 Bs.3200 CV1 100 3.125%
3200
140
x2 K 4500 315 Bs.4815 CV2 100 2.91%
4815
CV1 CV 2
3.125% 2.91%
EJERCICIO 6.
A los trabajadores de una empresa, el próximo año, el salario mensual les será aumentado en un 4,5%
más Bs. 140. La empresa tiene 120 trabajadores y actualmente devengan un salario medio mensual de
Bs. 4.800, con un coeficiente de variación de 0,26.
a) ¿Cuál será la varianza de los salarios el próximo año?
b) El próximo año, ¿Cuál será el valor total de la nómina mensual?
Solución:
x ( x k ) 4.800 4.800 0,045 140 5.156
5.1560,26 Bs.1.340,56
S S
CV 100 0,26 S
x 5.156
a) S
2
1.340,562 y su desviación será Bs.1.340,56
V X K V X VK S X2
59
Lic. Isidro W. Nina Paco
EJERCICIO 7.
Solución.
3(𝑥̅ − 𝑀𝑒 )
𝐶𝑎 =
𝑠
∑(𝑋 ∗ 𝑓) 4.630
𝑋̅ = ; 𝑋̅ = = 79,83 𝑘𝑔
𝑁 58
2
∑(𝑋 − 𝑋̅)
𝑆=√
𝑁
𝑋′𝑖−1 − 𝑋′𝑖 X f (𝑥 − 𝑋̅ ) (𝑥 − 𝑥̅ )
2
(𝑥 − 𝑥̅ )
2
∗ 𝑓
55 - 65 60 8 -19,8275862 393,133175 3145,0654
65 - 75 70 9 -9,82758621 96,5814507 869,233056
75 - 85 80 22 0,17241379 0,02972652 0,65398335
85 - 95 90 14 10,1724138 103,478002 1448,69203
95 - 105 100 5 20,1724138 406,926278 2034,63139
7.498,28
𝑆=√ = 11,37 𝑘𝑔
58
3(79,83 − 80,45)
𝐶𝑎 = = −0,16
11,37
Por lo tanto -0,16 es Moderadamente sesgada hacia la izquierda. El signo – ó + indica si el sesgo
es para la izquierda (-) o para la derecha (+).
𝑃75 − 𝑃25 88,21 − 72,22
𝐾= ; 𝐾= = 0,248
2(𝑃90 − 𝑃10 ) 2(94,43 − 62,25)
60
Lic. Isidro W. Nina Paco
Como el resultado obtenido 0,248 es menor que 0,263 se concluye que la Distribución es
Platicúrtica.
EJERCICIO 8.
En el mes de Enero el sueldo promedio de los trabajadores del sector industrial era de $us 200. Para
el mes de Julio se considera un aumento del 30% al sueldo del mes de Enero más un adicional de $us
50 Si el coeficiente de variación en Enero era de 0.25, ¿Se puede decir que la distribución de sueldos
en Julio es más homogénea?
Solución.
𝑌 = 1.30𝑋 + 50
Entonces, la media de los sueldos de Julio es
Comparando los coeficientes de variación de Enero y Julio se puede decir que la distribución de los
sueldos de Julio es más homogénea.
EJERCICIO 9.
Si el ingreso de 120 obreros tiene una media de $us 300 y una desviación estándar de $us 30
a) ¿Cuántos obreros por lo menos tienen sueldos comprendidos en el intervalo [$240, $360]?.
c) Si el mínimo sueldo es $us 210, en qué porcentaje se puede afirmar que los ingresos son superiores
a $us 390?
Solución.
61
Lic. Isidro W. Nina Paco
1 3
Resulta 𝑘 = 2. Entonces el, 1 − = o 75% (120)=90 obreros por los menos tienen ingresos en el
22 4
intervalo [240, 360].
c) Fuera del intervalo [$us 210, $us 390] está menos del 11.11% de los ingresos. Si el mínimo es $210,
entonces, el porcentaje de ingresos mayor que $us 390 es menos de 11.11 %.
EJERCICIO 10
El costo inicial de producción, X ; de una muestra de 80 objetos de cierto tipo, tiene una desviación
estándar de $us 30. La media del costo de producción es de $us 250 para el 60% de la muestra y de
$us 200 para el resto. El costo final de producción Y es dado por la relación:
𝑌 = 1.2𝑋 + 5
Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo final de
producción, ¿cuánto se recaudaría por la venta total?.
Solución.
DIAGRAMAS DE CAJA.
Existe Una gran variedad de gráficas estadísticas para extraer información acerca de las propiedades
de un conjunto de datos.
Una gráfica útil para reflejar propiedades de los datos es la gráfica de caja (“box plots”) que se basa
en la mediana (o en la media), los cuartiles y valores extremos. La caja representa el rango intercuartil
que encierra el 50% de los valores y tiene la mediana (Me) dibujada dentro. El rango intercuartil tiene
como extremos el percentil 75, 𝑃75 (cuartil superior) y el percentil 25, 𝑃25 (cuartil inferior).
Además de la caja se incluye la extensión de los datos mediante segmentos que se extienden de la caja
hacia el valor máximo (U) y hacia el valor mínimo \L) de los datos. Este recuadro se dibuja con el eje
de la variable en forma horizontal o vertical como se indica en la figura que sigue.
62
Lic. Isidro W. Nina Paco
Las colas (por la longitud de los segmentos que salen de los lados de la caja)
EJERCICIO 11.
1,2, 3, 4, 5, 6 , 7, 8 ,9 , 10, 12, 13, 12, 13, 14, 15, 12, 13, 14, 15
Solución.
Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquellos que se ubican
fuera del intervalo [𝑃25 − 1.5𝑅𝐼, 𝑃75 + 1.5𝑅𝐼], donde 𝑅𝐼 = 𝑃75 − 𝑃25 es el rango intercuartil. En este
caso, el extremo inferior 𝐿 es el dato mínimo no outlier y el extremo superior 𝑈 es el dato máximo no
outlier. Existen muchos paquetes de cómputo que proporcionan las gráficas de caja.
EJERCICIO 12
63
Lic. Isidro W. Nina Paco
manera:
Solución.
La mediana Me = 177.
𝑃75 + 1.5𝑑 = 200 + 1.5 ∗ 36.5 = 254.75. entonces. 𝑈 = 246 (𝑚á𝑥𝑖𝑚𝑜 𝑛𝑜 𝑜𝑢𝑡𝑙𝑖𝑒𝑟).
𝑃25 − 1.5𝑑 = 1 63.5 − 1.5 ∗ 36.5 = 108.9, entonces, 𝐿 = 109 (𝑚í𝑛𝑖𝑚𝑜 𝑛𝑜 𝑜𝑢𝑡𝑙𝑖𝑒𝑟).
Los outlieres (datos aislados) son: 255 en el lado superior y 72, 85 en el lado inferior. La distribución
tiene asimetría positiva.
64
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Con los siguientes datos determine la simetría o asimetría de la distribución aplicando las diferentes
fórmulas vistas.
Solución:
m3 17,06
a) A3 3
1,07 Hay una asimetría positiva
S 2,523
15,69
b) A3 0,85 Asimetría negativa
2,643
c) A3 0 Es simétrico
EJERCICIO 2.
Solución:
a) DM 6 DM
x i x
n
b) DM e 5,6 DM e
x i Me
n
c) S 7,72
d) DM e DM S 5,6 6 7,72
65
Lic. Isidro W. Nina Paco
S 100
e) CV CV 13,78%
x
EJERCICIO 3.
Se tiene una distribución de 6 intervalos de amplitud constante, de la cual se sabe que:
𝑛 = 150 𝑓3 = 𝑓4 = 30 𝑓2 = 𝑓5 = 𝑓1 + 5 𝑓1 = 𝑓6 𝑋5 = 50 𝑋̅ = 41
a) Calcular el coeficiente de variación
b) Calcular el coeficiente de asimetría aplicando las diferentes fórmulas expuestas.
c) Calcular el coeficiente de apuntamiento.
Solución:
a) CV 23,22%
b) AS 0 La distribución es simétrica
c) A4 1,92 3 Achatada
EJERCICIO 4.
Calcular el Coeficiente de Pearson, y la Medida de Fisher dada la siguiente distribución: 6, 9, 9, 12, 12,
12, 15 y 17
Solución.
∑(𝑥𝑖 − 𝑥̅ )3
𝑎3 = = 0,042
𝑛𝜎 3
EJERCICIO 5.
Una prueba de conocimientos, A, se calificó sobre 20 puntos dando una media de 12 y una desviación
estándar de 2 puntos. Mientras que una prueba de aptitud, B, se calificó sobre 100 puntos, dando una
media de 70 y una desviación estándar de 5.
a) ¿En cuál de las dos pruebas los puntajes son más homogéneos?
66
Lic. Isidro W. Nina Paco
Solución.
EJERCICIO 6.
Solución.
𝑥̅ = 29.809. 5 𝑠= 4.885
EJERCICIO 7.
En una prueba de aptitud aplicada a 100 personas se obtuvo la siguiente información: Los puntajes se
tabularon en una distribución de frecuencias de 5 intervalos de amplitud iguales, siendo el puntaje
mínimo. 40 y el máximo, 90.
La frecuencia absoluta del intervalo central fue de 40 y del quinto de 10. La frecuencia relativa del
primer intervalo fue de 0.05 y la del cuarto de 0.15.
Solución.
EJERCICIO 8.
Los siguientes datos muestran los calificativos de 20 personas sometidos a una prueba de aptitud. Los
20 estudiantes fueron divididos en dos grupos, al grupo 1 se calificó de 0 a 1 0 0 y al grupo 2 de 0 a 2 0
:
Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88.
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15.
a) Calcule la media y la desviación estándar en cada grupo, ¿cuál de los grupos es más homogéneo?
b) ¿Se puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor aptitud que el
estudiante con 13 puntos del grupo 2?
Solución.
67
Lic. Isidro W. Nina Paco
EJERCICIO 9.
Los sueldos en dólares de los empleados de dos empresas A y B se dan en la siguiente tabla de
frecuencias:
a) Calcule la asimetría de las distribuciones A y B. Grafique las ojivas relativas. ¿Es el rango intercuartil
de A, menor al rango intercuartil de B?
c) Si un empleado de A y otro de B ganan cada uno $130, ¿quién de ellos está mejor ubicado en su
centro de trabajo?
Solución.
a) 𝐴𝑆𝐴 = - 0.813, 𝑅𝐼𝐴 =61 .75, 𝐴𝑆𝐵 =-1.019. 𝑅𝐼𝐵 =46.667, NO.
c) 𝑍𝐴 = -0.853, 𝑍𝐵 =0.1376 el de A
EJERCICIO 10.
Solución.
15.04
EJERCICIO 11.
Un conjunto habitacional está formado por 3 edificios de departamentos Se tiene los siguientes datos
respecto al consumo mensual de electricidad de cada uno de los edificios.
Edificio 1: Tiene 8 departamentos, la media y la desviación estándar de los consumos es Bs. 85 y Bs. 12
respectivamente.
Edificio 2: Tiene 9 departamentos cuyos consumos en bolivianos son: 88, 92, 106, 110, 93, 102,91,94.
80.
68
Lic. Isidro W. Nina Paco
[80, 90] 3
a) ¿Cuál de los edificios tiene el menor consumo de electricidad?
c) ¿En cuál de los edificios los valores que representan los consumos están más dispersos?.
Solución.
EJERCICIO 12.
En una empresa el coeficiente de variación de los ingresos de 150 empleados es 69%. Después de un
aumento de los sueldos en $us 85 a cada uno de ellos, el coeficiente de variación resultó 54%. La
empresa fija un salario mínimo de $us 350 lo que beneficia a 50 empleados que antes del reajuste
ganaban menos de $us 280 con un sueldo promedio de $us 250. ¿Qué cantidad de dinero necesita
mensualmente la empresa para pagar los sueldos después del reajuste?
Solución.
Antes del reajuste la media de los 150 es $us 306, de los 50 es $us 250, y de los 100 es $us 334. Después
del reajuste la media de los 50 es realmente $us 335 pero sube a $us 350 y de los 100 es $us 419. Se
necesita: 50 x 350+ 100 x 419 = 59,400 $us
EJERCICIO 13.
En una empresa donde trabajan hombres y mujeres la media general de los sueldos es $250. Si la media
y la desviación estándar de los sueldos en el grupo de varones es $270 y $15 y en el grupo de mujeres
es $220 y $ 10.
Solución.
Los tiempos que emplearon 900 personas para hacer una tarea tienen una media de 30 minutos y
una desviación estándar de 3 minutos.
a) ¿Cuántas de estas personas por lo menos, emplearon entre 24 y 36 minutos para hacer esa tarea?
b) Determine un intervalo más corto en el que se encuentren los tiempos empleados por al menos
800 de estas personas.
Solución.
69
Lic. Isidro W. Nina Paco
a) k=2, al menos 675 b ) 1 − 𝑘 2 =8/9. k=3, [21, 39], c) menos de 1/18 o 5.55%.
EJERCICIO 15.
Solución.
a) 𝐶𝑉𝐻=0.187, 𝐶𝑉𝑀=0.212.
c) 𝐶𝑉𝐻=0.228, 𝐶𝑉𝑀=0,224
d) 62.072
70
TEMA 5:
NÚMEROS INDICE
𝐼𝑃0𝑡 (𝑥
𝑛
= √𝐼𝑃𝑥1 ∗ 𝐼𝑃𝑥2 ∗ … ∗ 𝐼𝑃𝑥𝑛 𝐼𝑃𝐹0𝑡 = √𝐼𝑃𝐿𝑡0 ∗ 𝐼𝑃𝑃0𝑡
1 ,𝑥2 ,…,𝑥𝑛 )
71
Lic. Isidro W. Nina Paco
72
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Una empresa estudia la evolución de los precios en dólares de tres componentes (A, B, C) para una
pieza en los últimos 5 años
Año A B C
1 3 4 1
2 4 6 1,5
3 5 6,5 2
4 4,5 7 2,5
5 7 4 3
a) Calcular un índice simple para estudiar la evolución de los precios del componente A tomando
como periodo de referencia el año 1
b) Calcular un índice conjunto de la evolución de los precios utilizando una media aritmética de
índices, simples y tomando como referencia el año 1.
c) Analizar cómo varían los resultados si escoge otros promedios como la media geométrica.
d) Suponiendo que en cada pieza van 5 unidades del componente A, 10 de B y 15 del C, calcule
índices de precios conjuntos para los tres componentes tomando como referencia el periodo 1 y
usando una media aritmética ponderada de los índices simples.
e) Analice cómo varían los resultados, y cuáles el incremento medio anual de precios a partir del
índice compuesto media aritmética ponderada.
Solución:
a) Índice simple de la evolución de los precios tomando como periodo de referencia el año
Índice Simple Precios
Año A B C A B C
1 3 4 1 100 (3 / 3).100 100 (4 / 4).100 100 (1 / 1).100
2 4 6 1,5 133,33 (4 / 3).100 150 (6 / 4).100 150 1, 5.100
3 5 6,5 2 166,67 (5 / 3).100 162,50 (6, 5 / 4).100 200 2.100
4 4,5 7 2,5 150 (4,5 / 3).100 175 (7 / 4).100 250 2, 5.100
5 7 4 3 233,33 (7 / 3).100 100 (4 / 4).100 300 3.100
1
73
Lic. Isidro W. Nina Paco
3
Año A B C Ii 3
3
i1 √∏ |𝑖
𝑖=1
1 100 100 100 1000000 100
2 133,33 150 150 3000000 144,22496
3 166,67 162,50 200 5416666,67 175,62137
4 150 175 250 6562500 187,22181
5 233,33 100 300 7000000 191,29312
A B C Media
Año
(5 unidades) (10 unidades) (15 unidades) ponderada
1 100 100 100 5.100+10.100+15.100/(5+10+15)=100 100
2 133,33 150 150 5.133,33+10.150+15.150/(5+10+15)= 147,22 147,22
3 166,67 162,50 200 5.166,67+10.162,50+15.200/(5+10+15)= 181,94 181,94
4 150 175 250 5.150+10.175+15.250/(5+10+15)= 208,33 208,33
5 233,33 100 300 5.233,33+10.100+15.300/(5+10+15)= 222,22 222,22
EJERCICIO 2.
El consumo de combustible en una empresa (en miles de litros) y los índices de precios del
combustible en seis años están dados por:
Índice
Año Consumo
(base 2014=100%)
2011 60 91
2012 70 93
2013 75 95
2014 78 100
74
Lic. Isidro W. Nina Paco
2015 80 114
2016 85 120
Sabiendo que el precio del combustible fue de 1,5 $us/litro en el a ño 2016, calcular el gasto en
combustible de la empresa en cada año
Solución:
EJERCICIO 3.
A continuación tenemos los precios y cantidades vendidas de tres productos por una determinada
empresa durante tres períodos.
t PA PB PC QA QB QC
0 4 10 15 2 2 3
1 6 11 20 5 1 3
2 5 12 25 4 1 2
Obtener los índices de precios y de cantidades de Paasche, de Laspeyres y de Fisher para estos tres
períodos considerando como referencia el periodo 0
Solución:
Índices ponderados de PRECIOS
∑𝒏 𝒑𝒊𝒕 𝒒𝒊𝟎 ∑𝒏 𝒑𝒊𝒕 𝒒𝒊𝒕
𝑳𝒂𝒔𝒑𝒆𝒚𝒓𝒆𝒔: 𝐿𝒑 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎 𝑷𝒂𝒂𝒔𝒄𝒉𝒆: 𝑝𝒑 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎
𝒊=𝟏 𝒑𝒊𝟎 𝒒𝒊𝟎 𝒊=𝟏 𝒑𝒊𝟎 𝒒𝒊𝒕
𝑭𝒊𝒔𝒉𝒆𝒓: 𝐹𝒑 = √𝐿𝒑 ∗ 𝑃𝑝
6 ∗ 2 + 11 ∗ 2 + 20 ∗ 3 94
𝐿𝑝 1 = ∗ 100 = ∗ 100 = 128.77
0 4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73
5 ∗ 2 + 12 ∗ 2 + 25 ∗ 3 109
𝐿𝑝 2 = ∗ 100 = ∗ 100 = 149.32
0 4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73
75
Lic. Isidro W. Nina Paco
6 ∗ 5 + 11 ∗ 1 + 20 ∗ 3 101
𝑃𝑝 1 = ∗ 100 = ∗ 100 = 134.67
0 4 ∗ 5 + 10 ∗ 1 + 15 ∗ 3 75
5 ∗ 4 + 12 ∗ 1 + 25 ∗ 2 82
𝑃𝑝 2 = ∗ 100 = ∗ 100 = 146.43
0 4 ∗ 4 + 10 ∗ 1 + 15 ∗ 2 56
𝑭𝒊𝒔𝒉𝒆𝒓: 𝐹𝒒 = √𝐿𝒒 ∗ 𝑃𝑞
5 ∗ 4 + 1 ∗ 10 + 3 ∗ 15 75
𝐿𝑞 1 = ∗ 100 = ∗ 100 = 102.74
0 2 ∗ 4 + 2 ∗ 10 + 3 ∗ 15 73
4 ∗ 4 + 1 ∗ 10 + 2 ∗ 15 56
𝐿𝑞 2 = ∗ 100 = ∗ 100 = 76.71
0 2 ∗ 4 + 2 ∗ 10 + 3 ∗ 15 73
5 ∗ 6 + 1 ∗ 11 + 3 ∗ 20 101
𝑃𝑞 1 = ∗ 100 = ∗ 100 = 107.45
0 2 ∗ 6 + 2 ∗ 11 + 3 ∗ 20 94
4 ∗ 5 + 1 ∗ 12 + 2 ∗ 25 82
𝑃𝑞 2 = ∗ 100 = ∗ 100 = 75.23
0 2 ∗ 5 + 2 ∗ 12 + 3 ∗ 25 109
Índice de Valor: Evolución del valor de la serie a precios constantes (se deflactan los valores en
precios corrientes o actuales)
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒𝑠)
í𝑛𝑑𝑖𝑐𝑒 𝑉𝑎𝑙𝑜𝑟 = 𝑉𝑎𝑙𝑜𝑟 𝑛𝑜𝑚𝑖𝑛𝑎𝑙
𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠)
𝑉𝑡 ∑𝑛𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
𝐼𝑉0𝑡 = ∗ 100 = 𝑛 ∗ 100
𝑉0 ∑𝑖=1 𝑝𝑖0 𝑞𝑖0
6 ∗ 5 + 11 ∗ 1 + 20 ∗ 3 101
𝐼𝑉01 = ∗ 100 = ∗ 100 = 138,36
4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73
76
Lic. Isidro W. Nina Paco
5 ∗ 4 + 12 ∗ 1 + 25 ∗ 2 82
𝐼𝑉02 = ∗ 100 = ∗ 100 = 112,33
4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73
EJERCICIO 4.
Se conoce la información sobre la evolución de precios de los bienes y servicios consumidos por un
estudiante. Rellene el siguiente cuadro con las cantidades correspondientes.
Índice Índice Índice Índice
Año Índice ocio
General cafetería transporte otros
2015 149 % 157 % 133 % 142 %
2016 160 % 165 % 143 %
Ponderación 100 % 15 % 35 % 20 %
Variación porcentaje 4,225 %
Solución:
|2015
𝐺 = 149 ∗ 0.15 + 157 ∗ 0.35 + 133 ∗ 0.3 + 142 ∗ 0.2 = 145.6%
𝐼
%Tasa de variación𝑇𝑉𝑡𝑡+1 = [ 𝑡+1 − 1] ∗ 100 Repercusión: 𝑅𝑖 = (𝑇𝑎𝑠𝑎 𝑣𝑎𝑟𝑖𝑐𝑖ó𝑛) ∗ (𝑃𝑜𝑛𝑑𝑒𝑟𝑎𝑐𝑖ó𝑛)
𝐼𝑡
El Índice General es como un IPC para el estudiante, un Índice de Laspeyres, denotando por 𝐼𝑖 los
índices de cada grupo y wi las ponderaciones de cada bien o servicio:
77
Lic. Isidro W. Nina Paco
EJERCICIO 5.
En cierto país el salario medio por hora, en unidades monetarias corrientes, de los trabajadores de un
determinado sector productivo y los índices de precio de consumo a lo largo de los seis últimos años
fueron:
Índice de precios
Años Salario/hora
(2005 = 100)
$us
2011 5,2 144
2012 5,8 166
2013 6 179
2014 6,3 194
2015 6,4 204
2016 8,4 209
𝑖 𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑖 𝑖
𝑇𝑉𝑖−1 = − 1 = [𝐼𝑖−1 − 1]
𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑖−1
78
Lic. Isidro W. Nina Paco
d) Tasa de variación media anual (TVM) de los salarios en términos nominales y reales
𝑡
𝑡
𝑇𝑉𝑀0𝑡 𝑖
= √∏(𝑇𝑉𝑖−1 + 1) − 1
𝑖=1
(TV i
i-1
+ 1) 1,61537 1,11346
i=1
5
√∏5𝑖=1(𝑇𝑉𝑖−1
𝑖
+ 1) 1,10066 1,02173
2016 5
𝑇𝑉𝑀2011 = √∏5𝑖=1(𝑇𝑉𝑖𝑖−1 + 1) − 1
0,10066 0,02173
Precio medio del refrigerador en 2016: Precio2016 = 420 x 1,85966 = 781 dolares.
EJERCICIO 6.
Un sector de la economía nacional dispone del valor de producción a precios corrientes de cada año
(miles de euros) y los índices de precios de Laspeyres y Fisher.
Producción
Año % Lp % Fp
(precios corrientes)
2011 66.112 100 100
2012 78.147 104,22 105,34
2013 91.357 107,25 108,94
79
Lic. Isidro W. Nina Paco
Utilizando el deflactor más idóneo, calcular la producción anual en precios constantes de 2011.
Solución:
Para calcular el valor real (precios constantes) de una magnitud se requiere deflactar el valor nomi
nal (precios corrientes), eliminando la influencia que han experimentado los precios. Para ello, se
deflacta la serie dividiendo el valor nominal entre un índice de precios.
𝑣𝑎𝑙𝑜𝑟 𝑛𝑜𝑚𝑖𝑛𝑎𝑙
𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙 (𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒𝑠)
=
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠) í𝑛𝑑𝑖𝑐𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠
𝑉𝑡𝑁
𝑉𝑡𝑅 = 𝑡 ∗ 100
𝐼𝑝,0
El deflactor más adecuado es el de Paasche, ya que con éste índice de precios se obtiene una relación entre
valores monetarios corrientes y valores monetarios constantes.
𝑛
∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 𝑉𝑡𝑁 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑃𝑎𝑎𝑠𝑐ℎ𝑒: 𝑃𝑝 = 𝑛 𝑉𝑡𝑅 = = 𝑛 = ∑ 𝑃𝑖0 ∗ 𝑞𝑖𝑡
∑𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡 𝑃𝑝 ∑𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
𝑖=1
∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡
2
(𝐹𝑝 )
𝐸𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝐹𝑖𝑐ℎ𝑒𝑟 𝐹𝑝 = √𝐿𝑝 ∗ 𝑃𝑝 ↦ 𝑃𝑝 =
𝐿𝑝
Producción
Producción (precios constantes 2006)
(Fp )2
Año (precios corrientes) % Lp % Fp %Pp R VN
VtN Lp Vt t
Pp
2011 66.112 100 100 100 66112
2012 78.147 104,22 105,34 106,47 73397
2013 91.357 107,25 108,94 110,66 82559
2014 88.854 109,05 111,36 113,72 78135
2015 92.892 114,87 117,67 120,54 77064
2016 101.336 126,35 130,18 134,13 75553
EJERCICIO 7.
En determinado sector económico conservan los índices salariales de distintos periodos temporales
con bases diferentes. Unificar los índices en una serie con la base más actual.
80
Lic. Isidro W. Nina Paco
1995 100
2001 100
1996 104,3
2002 102,2
1997 106,1
2003 105,6
1998 107,7
2004 109,1
1999 110,8
2005 113,3
2000 113,4
2006 117,9
2001 116
2006 100
2007 101,8
2008 105,7
2009 108,9
2010 110,3
Solución:
EJERCICIO 8.
Una empresa ha calculado los índices del precio medio de automóviles (índice de Paasche de precios)
y de los ingresos por ventas, reflejados en la tabla adjunta:
a) Hallar la serie de números índice de automóviles vendidos por la empresa en (2010 – 2016)
b) ¿Qué tipo de índice cuántico se ha hallado en el apartado anterior?
81
Lic. Isidro W. Nina Paco
Solución:
a) En primer lugar hay que unificar las bases. En consecuencia, transformar el índice de ingresos (base
2002) a base de referencia del precio medio 2010
Enlace técnico
Se convierten los índices de ingresos en base 2002 a base 2010.
Para ello, se multiplica cada índice en base 2002 por el enlace técnico (100/335 = 0.2985)
Precio medio automóvil Índice ingresos Índice ingresos
Año
(% base 2010) (% base 2002) (% base 2010)
2010 100 335 100
2011 113 380 113,43
2012 126 416 124,18
2013 114 402 120
2014 117 424 126,57
2015 119 407 121,49
2016 123 461 137,61
𝐼𝑉0𝑡 𝑖𝑛𝑑𝑖𝑐𝑒 𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠
𝐼𝑄,0 = =( )
𝐼𝑝,0 𝑖𝑛𝑑𝑖𝑐𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠
82
Lic. Isidro W. Nina Paco
𝑉𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
𝐼𝑉0𝑡 = = ∗ = ∗ = 𝐿𝑃,0 ∗ 𝑃𝑄,0
𝑉0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0
83
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Un grupo de estudiantes decide estudiar la evolución de los precios de tres artículos que consumen en
sus tiempos de ocio: discoteca, cine, conciertos. Para ello estudian a lo largo de dos años el precio de las
entradas (Pi) en bolivianos y el número de veces que asisten a lo largo de un año (Qi). Los resultados se
recogen en la tabla:
Obtenga los índices de precios y cantidades de Laspeyres, Paasche y Fisher tomando como base el
periodo 2016
Solución:
EJERCICIO 2.
Antonio alquiló un local el 1 de enero de 2015 por 3000 bolivianos mensuales, impuestos no incluidos.
La revisión del alquiler se efectúa según los valores del IPC. Dispone de dos tablas con información
sobre el IPC de cada año. (Base 2010=100).
84
Lic. Isidro W. Nina Paco
EJERCICIO 4.
El conjunto de bienes de consumo se ha clasificado en tres grupos. Los precios y cantidades de cada
grupo, para cuatro años son las siguientes:
Calcular:
a) Los índices de precios de Pasche, con base en el año 2013
b) Dados los salarios monetarios:
Año 2013: 120 u.m.
Año 2014: 140 u.m.
Año 2015: 180 u.m.
Año 2016: 200 u.m.
Exprese dichos salarios en unidades monetarias del año 2013
Solución:
a) Índices ponderados de Precios de Paasche:
85
Lic. Isidro W. Nina Paco
EJERCICIO 5.
Una empresa de electrodomésticos facilita la serie de números índices del precio medio de
refrigeradores durante el período (2010-2016), con base en 2005
86
TEMA 6:
DISTRIBUCIONES
BIDIMENSIONALES (parte 1)
CUALITATIVA
CUALITATIVA
VARIABLE CUALITATIVA
BIDIMENSIONAL CUANTITATIVA
CUANTITATIVA
CUANTITATIVA
Si (X, Y) es una variable bidimensional donde los distintos valores que toman X, Y son:
𝑋: 𝑋1 , 𝑋2 , … , 𝑋𝑖 , … , 𝑋𝑘 𝑌: 𝑌1 , 𝑌2 , … , 𝑌𝑗 , … , 𝑌𝑙
Una Distribución bidimensional de frecuencias es un arreglo de los valores observados (X, Y) en una
tabla de doble entrada de la forma:
𝑌𝑗 𝑌1 𝑌2 … 𝑌𝑗 … 𝑌𝑙 𝑓𝑖∗
𝑋𝑖
𝑋1 𝑓11 𝑓12 … 𝑓1𝑗 … 𝑓1𝑙 𝑓1∗
𝑋2 𝑓21 𝑓22 … 𝑓2𝑗 … 𝑓2𝑙 𝑓2∗
… … … … … … … …
𝑋𝑖 𝑓𝑖1 𝑓𝑖2 … 𝑓𝑖𝑗 … 𝑓𝑖𝑙 𝑓𝑖∗
… … … … … … … …
𝑋𝑘 𝑓𝑘1 𝑓𝑘2 … 𝑓𝑘𝑗 … 𝑓𝑘𝑙 𝑓𝑘∗
𝑓∗𝑗 𝑓∗1 𝑓∗2 𝑓∗𝑗 𝑓∗𝑙 n
DISTRIBUCIÓN BIDIMENSIONAL
𝑙 𝑘 𝑘 𝑙
87
Lic. Isidro W. Nina Paco
𝑋𝑖 𝑓𝑖∗ 𝑌𝑗 𝑓∗𝑗
𝑋1 𝑓1∗ 𝑌1 𝑓∗1
𝑋2 𝑓2∗ 𝑌 𝑓∗2
… … …2 …
𝑋𝑖 𝑓𝑖∗ 𝑌𝐽 𝑓∗𝑗
… … … …
𝑋𝑘 𝑓𝑘∗ 𝑌𝑙 𝑓∗𝑙
Total 𝑛 = ∑𝑘𝑖=1 𝑓𝑖∗ Total 𝑛 = ∑𝑙𝑗=1 𝑓∗𝑗
FRECUENCIAS RELATIVAS
Tal como acontece con la Variable unidimensional, existen ocasiones donde es más conveniente
trabajar con las Frecuencias relativas o proporciones de las Frecuencias con respecto a un total.
Se llama Frecuencia relativa de variable bidimensional h al cociente entre la Frecuencia de un par (X,
Y) respecto a una Frecuencia total
∑𝑙𝑗=1 𝑓∗𝑗 𝑌𝑗
∑𝑘𝑖=1 𝑓𝑖∗ 𝑋𝑖 𝑌̅ =
𝑋̅ = 𝑛
𝑛
Note que se trata de Varianzas muestrales. En la práctica también pueden calcularse mediante las
fórmulas abreviadas:
∑𝑙𝑗=1 𝑓∗𝑗 𝑌𝑗 2 − 𝑛𝑌̅ 2
2
∑𝑘𝑖=1 𝑓𝑖∗ 𝑋𝑖 2 − 𝑛𝑋̅ 2 𝑠𝑌2 =
𝑠𝑋 = 𝑛−1
𝑛−1
COVARIANZA POBLACIONAL
Una medida del grado de asociación entre las variables X, Y es la Covarianza poblacional
𝑘 𝑙
∑𝑘𝑖=1 ∑𝑙𝑗=1 𝑓𝑖𝑗 (𝑋𝑖 − 𝜇𝑥 )(𝑌𝑗 − 𝜇𝑦 )
𝐶𝑂𝑉𝑋𝑌 = 𝜎𝑋𝑌 = ; 𝑁 = ∑ ∑ 𝑓𝑖𝑗
𝑁
𝑖=1 𝑗=1
Para el caso de que se disponga de una Tabulación discreta, tal como la tabla de la distribución
bidimensional se calcula la Covarianza poblacional como:
COVARIANZA MUESTRAL
𝑘 𝑙
∑𝑛𝑖=1(𝑋𝑖 − 𝑥̅ )(𝑌𝑗 − 𝑦̅)
𝐶𝑜𝑣𝑋𝑌 = 𝑆𝑋𝑌 = ; 𝑛 = ∑ ∑ 𝑓𝑖𝑗
𝑛−1
𝑖=1 𝑗=1
Para muestras grandes la división entre 𝑛 − 1 ó 𝑛 no existe mucha diferencia, porque se aproxima a
la varianza poblacional.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
𝑆𝑋𝑌 = = − 𝑥̅ 𝑦̅
𝑛 𝑛
PROPIEDADES DE LA COVARIANZA
2
P1) 𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 + 2𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 + 2𝐶𝑜𝑣𝑋𝑌
2
P2) 𝑆𝑋−𝑌 = 𝑆𝑋2 + 𝑆𝑌2 − 2𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 − 2𝐶𝑜𝑣𝑋𝑌
89
Lic. Isidro W. Nina Paco
CORRELACIÓN
Una de las mayores aplicaciones de la Estadística es la de encontrar y medir relaciones entre dos o
más variables.
Para medir el grado de relación existente entre variables, se usan los Coeficientes de correlación.
2
𝐶𝑜𝑣𝑋𝑌 𝑆𝑋+𝑌 − (𝑆𝑋2 + 𝑆𝑌2 )
𝑟𝑋𝑌 = =
𝑆𝑋 𝑆𝑌 2𝑆𝑋 𝑆𝑌
Coeficientes.
∑ 𝑓𝑖∗ 𝑥𝑖
𝑎10 = 𝑥̅ =
𝑛
∑ 𝑓∗𝑗 𝑦𝑗
𝑎01 = 𝑦̅ =
𝑛
∑ ∑ 𝑓𝑖𝑗 𝑥𝑖 𝑦𝑗
𝑎11 =
𝑛
90
Lic. Isidro W. Nina Paco
∑ 𝑓𝑖∗ 𝑥𝑖2
𝑎20 =
𝑛
∑ 𝑓∗𝑗 𝑦𝑗2
𝑎02 =
𝑛
𝐶𝑂𝑉𝑥𝑦 = 𝑆𝑥𝑦 = 𝑎11 − 𝑎01 𝑎10
6 ∑𝑛𝑖=1 𝑑𝑖2
𝑟𝑆 = 1 −
𝑛(𝑛2 − 1)
𝐷ó𝑛𝑑𝑒:
𝑑𝑖 = R 𝑥 − R 𝑦 (𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑥𝑖𝑠𝑡𝑒𝑛𝑡𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑟𝑎𝑛𝑔𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑖𝑟𝑎𝑏𝑙𝑒𝑠)
𝑛 = Tamaño de la muestra expresada en parejas de rangos de las variables
𝜒2
Φ𝐶𝑟 = √
𝑛(𝑚 − 1)
Dónde:
Donde:
𝑓𝑒𝑖𝑗 = Es la frecuencia esperada de casos en la categoría (k, l). Es un valor adquirido por la
multiplicación entre el subtotal de columna por el subtotal de la fila que le corresponda a la
frecuencia observada de interés el mismo se divide por n. La fórmula puede ser presentada de la
siguiente manera:
𝑓𝑜𝑖∗ × 𝑓𝑜∗𝑗
𝑓𝑒𝑖𝑗 =
𝑛
91
Lic. Isidro W. Nina Paco
X\Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Se pide:
a) c) e)
3 4 3 4 𝑎10 𝑦 𝑎01
∑ ∑ 𝑓𝑖𝑗 ∑ 𝑓𝑖∗ 𝑦 ∑ 𝑓∗𝑗
𝑖=1 𝑗=1 𝑖=1 𝑗=1
f)
b) d) 𝑎11
𝑠𝑥𝑦
Solución.
a)
3 4 3
X\Y 1 2 4 6 𝑓𝑖∗
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
𝑓∗𝑗 5 2 1 7 15
3 3 4
92
Lic. Isidro W. Nina Paco
4 3 4
d)
X\Y 1 2 4 6 𝑓𝑖∗
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
𝑓∗𝑗 5 2 1 7 15
Las frecuencias relativas condicionadas 𝑓(𝑥𝑖 /𝑌 = 2) y 𝑓(𝑦𝑗 ⁄𝑥 = 3)
X 𝑓(𝑥𝑖 /𝑌 = 2) 𝑓(𝑥𝑖 /𝑌 = 2)
ℎ(𝑥𝑖 /𝑌 = 2) =
𝑓∗2
1 0 0
2 1 1/2
3 1 1/2
2 1
Y 𝑓(𝑦𝑗 /𝑋 = 3) 𝑓(𝑦𝑗 /𝑋 = 3)
ℎ(𝑦𝑗 /𝑋 = 3) =
𝑓3∗
1 3 3/5
2 1 1/5
4 0 0/5
6 1 1/5
5 1
e)
∑3𝑖=1 𝑥𝑖 𝑓𝑖∗ 1 ∗ 4 + 3 ∗ 5 + 5 ∗ 6 49
𝑎10 = = == = 3,26
𝑁 15 15
∑4𝑗=1 𝑦𝑗 𝑓∗𝑗 1 ∗ 5 + 2 ∗ 2 + 4 ∗ 1 + 6 ∗ 7 55
𝑎01 = = = = 3,6
𝑁 15 15
f)
93
Lic. Isidro W. Nina Paco
EJERCICIO 2.
Dada la tabla de correlaciones. Hallar 𝑓21 para que las dos variables sean estadísticamente
independientes y calcular su covarianza en este caso.
X\Y 5 7
100 8 4
200 𝑓21 6
Solución.
X\Y 5 7 𝑓𝑖∗
100 8 4 12
200 𝑓21 6 𝑓21 + 6
𝑓∗𝑗 𝑓21 + 8 10 𝑓21 + 18
Por ser independientes:
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ∗ ∀𝑖, 𝑗
𝑁 𝑁 𝑁
4 12 10 120 120 − 72
= ∗ →4= → 4[𝑓21 + 18] = 120 → 𝑓21 = = 12
𝑓21 + 18 𝑓21 + 18 𝑓21 + 18 𝑓21 + 18 4
Covarianza: 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01
X\Y 5 7 𝑓𝑖∗
100 8 4 12
200 12 6 18
𝑓∗𝑗 20 10 30
94
Lic. Isidro W. Nina Paco
EJERCICIO 3.
A partir de la siguiente distribución bidimensional (𝑋𝑖 , 𝑌𝑗 ; 𝑓𝑖𝑗 ), calcular: 𝑥̅ , 𝑦̅, 𝑠𝑥2 , 𝑠𝑦2 y 𝑠𝑥𝑦 . ¿Son
independientes las variables X e Y?
X\Y 1 2 3
-1 0 1 0
0 1 0 1
1 0 1 0
Solución.
X\Y 1 2 3 𝑓𝑖∗
-1 0 1 0 1
0 1 0 1 2
1 0 1 0 1
𝑓∗𝑗 1 2 1 4
Las variables X e Y son independientes cuando se verifica
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ( ) ( ) ∀𝑖, 𝑗
𝑁 𝑁 𝑁
∑3𝑗=1 𝑦𝑗 𝑓∗𝑗 1
𝑎01 = 𝑦̅ = = [1 ∗ 1 + 2 ∗ 2 + 3 ∗ 1] = 2
𝑁 4
∑3𝑗=1 𝑦𝑗2 𝑓∗𝑗 1 18
𝑎02 = = [12 ∗ 1 + 22 ∗ 2 + 32 ∗ 1] = = 4,5
𝑁 4 4
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 4,5 − 22 = 0,5 → 𝑠𝑦 = √0,5 = 0,7
95
Lic. Isidro W. Nina Paco
EJERCICIO 4.
Se han observado, durante un mes determinado, el gasto en el teléfono móvil y el ingreso total en
seis familias. Los resultados obtenidos, expresados en unidades monetarias corrientes, han sido:
b) Para estas 6 familias ¿Qué variables se distribuye de forma más homogénea, el gasto en móvil o en
los ingresos totales?
Solución.
a)
La primera columna (𝑦𝑖 ), gasto del teléfono móvil, corresponde a la variable que se estudia,
dependiendo de la variable ingreso total de las familias (𝑥𝑖 )
∑6𝑖=1 𝑥𝑖 ∗ 𝑦𝑖 504
𝑎11 = = = 84 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 ∗ 𝑎01 = 84 − 10 ∗ 6,83 = 15,7 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑁 6
b)
96
Lic. Isidro W. Nina Paco
𝑠𝑦 3,44
𝑦̅ = 6,83 𝑠𝑦 = √11,85 = 3,44 𝐶𝑉𝑦 = = = 0,5037 (50,37% 𝑑𝑒 𝑑𝑖𝑠𝑝𝑒𝑠𝑖ó𝑛)
𝑦̅ 6,83
𝑠𝑥 5,16
𝑥̅ = 10 𝑠𝑥 = √26,67 = 5,16 𝐶𝑉𝑥 = = = 0,516 (51,6% 𝑑𝑒 𝑑𝑖𝑠𝑝𝑒𝑠𝑖ó𝑛)
𝑥̅ 10
Se distribuye de forma más homogénea el gasto de las familias.
EJERCICIO 5.
Un psicólogo afirma, basándose en los datos obtenidos, que a medida que el niño crece menores son
las respuestas inadecuadas que da en el transcurso de una situación experimental:
Solución.
Como no hay pares repetidos se entiende que son 15 pares de la forma (𝑥𝑖 , 𝑦𝑖 ) que representará
𝑥𝑖 : 𝑒𝑑𝑎𝑑 e 𝑦𝑖 : 𝑛ú𝑚𝑒𝑟𝑜 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑖𝑛𝑎𝑑𝑒𝑐𝑢𝑎𝑑𝑎𝑠 de modo que la frecuencia de cada par es la
unidad.
𝑥𝑖 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
𝑦𝑖 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5
∑15
𝑖=1 𝑥𝑖 𝑦𝑖 2 ∗ 11 + 3 ∗ 12 + 4 ∗ 10 + ⋯ + 11 ∗ 5 + 12 ∗ 5 789
𝑎11 = = = = 52,6
𝑁 15 15
∑15
𝑖=1 𝑥𝑖 2 + 3 + 4 + 4 + 5 + ⋯ + 11 + 11 + 12 105
𝑎10 = = = =7
𝑁 15 15
97
Lic. Isidro W. Nina Paco
∑15
𝑖=1 𝑦𝑖 11 + 12 + 10 + 13 + ⋯ + 6 + 5 + 5 129
𝑎01 = = = = 8,6
𝑁 15 15
En consecuencia, 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 52,6 − 7 ∗ 8,6 = −7,6
∑15 2
𝑖=1 𝑥𝑖 22 + 32 + 42 + 42 + 52 + ⋯ + 112 + 112 + 122 877
𝑎20 = = = = 58,46
𝑁 15 15
∑15 2
𝑖=1 𝑦𝑖 112 + 122 + 102 + 132 + ⋯ + 62 + 52 + 52 1237
𝑎02 = = = = 82,46
𝑁 15 15
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 58,46 − 72 = 9,46 → 𝑠𝑥 = √9,46 = 3,07
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 82,46 − 8,62 = 8,5 → 𝑠𝑦 = √8,5 = 2,91
El coeficiente de correlación:
𝑠𝑥𝑦 −7,6
𝑟= = = −0,85
𝑠𝑥 𝑠𝑦 3,07 ∗ 2,91
La validez solicitada es del 85% en correlación inversa, es decir, a medida que aumenta la edad del
niño (X) disminuye las respuestas inadecuadas (Y).
b) Para poder predecir el número de respuestas para cada edad determinada (caso de María) será
necesario hallar la ecuación de regresión de Y (nº respuesta inadecuadas) sobre X (edad del niño):
𝑠𝑥𝑦 𝑠𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ) 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 ≡ 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛: 𝑏𝑦𝑥 =
𝑠𝑥2 𝑠𝑥2
Adviértase que la pendiente de la recta o coeficiente de regresión 𝑏𝑦𝑥 viene determinado por el
signo de la covarianza 𝑠𝑥𝑦
𝑠𝑥𝑦 7,6
𝑏𝑦𝑥 = =− = −0,80 (𝑟𝑒𝑐𝑡𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑑𝑒𝑐𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒)
𝑠𝑥2 9,46
98
Lic. Isidro W. Nina Paco
𝑠𝑟2 2,35875
% 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑛𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑜 = 100 2 = 100 = 27,75%
𝑠𝑦 8,50
EJERCICIO 6.
Solución.
1
a) La recta de regresión de Y sobre X: 𝑦 = 2 + 𝑥 puede escribirse:
2
1 1 1
𝑦 = 2 + 𝑥 → 𝑦 − 0 = (4 + 𝑥) ⟹ 𝑏𝑦𝑥 =
2 2 2
Análogamente, la recta de regresión de X sobre Y: 𝑥 = −4 + 2𝑦
𝑥 = −4 + 2𝑦 ⟶ 𝑥 − 0 = 2(−2 + 𝑦) ⟹ 𝑏𝑥𝑦 = 2
𝑠𝑦𝑥
1 𝑠𝑥𝑦 1
𝑏𝑦𝑥 = → = = → 𝑠𝑥𝑦 = 4,5
𝑠𝑥2
2 9 2
𝑠𝑎𝑏𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 𝑠𝑥𝑦 4,5 4,5
𝑏𝑥𝑦 = 2 = 2 → 2 = 2 → 𝑠𝑦2 = = 2,25 → 𝑠𝑦 = √2,25 = 1,5
{ 𝑠𝑦 𝑠𝑦 2
𝑠𝑥𝑦 4,5
𝑟= = = 1 con lo que existe una dependencia funcional, cosa que no es de extrañar por
𝑠𝑥 𝑠𝑦 3∗1,5
1
𝑦=2+ 𝑥
tratarse de única recta de regresión. Adviértase que las rectas: { 2 } son la misma recta,
𝑥 = −4 + 2𝑦
basta con multiplicar la primera recta por 2 y despejar la x:
1
2𝑦 = 2 [2 + 𝑥] = 4 + 𝑥 → 𝑥 = −4 + 2𝑦
2
b)
1 1 1
𝑦 = 2 + 𝑥 → 𝑦̅ = 2 + 𝑥̅ → 𝑦̅ = 2 + 2 = 3
2 2 2
2
𝑠𝑥2 = 𝑎20 − 𝑎10 → 32 = 𝑎20 − 22 → 𝑎20 = 32 + 22 = 13
2
𝑠𝑦2 = 𝑎02 − 𝑎01 → 2,25 = 𝑎02 − 32 → 𝑎02 = 2,25 + 32 = 11,25
99
Lic. Isidro W. Nina Paco
EJERCICIO 7.
Se desea estudiar la relación que existe entre la variable X (porcentaje de la población urbana en las
distintas provincias) e Y (renta media por hogar). La tabla adjunta contiene datos referentes a treinta
provincias:
X / Y 1 – 16 16 – 31 31 – 46 46 – 60
10 – 19 1 1 1
19 – 28 8 3
28 – 37 3 7 1
37 – 45 2 3
a) Calcular las rectas de regresión.
Solución.
a)
X / Y 1 – 16 16 – 31 31 – 46 46 – 60 𝑓𝑖∗
10 – 19 1 1 1 3
19 – 28 8 3 11
28 – 37 3 7 1 11
37 – 45 2 3 5
𝑓∗𝑗 1 14 14 1 30
Las distribuciones marginales de X e Y, respectivamente:
100
Lic. Isidro W. Nina Paco
Distribución conjunta
𝑦 = 18,30 + 0,44𝑥
𝑚11 27,1162
Coeficiente de regresión: 𝑏𝑦𝑥 = = = 0,44 > 0 (recta de regresión creciente)
𝜎𝑥2 60,959
𝑠𝑥𝑦 27,1162
𝑹𝒆𝒄𝒕𝒂 𝒅𝒆 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏 𝒅𝒆 𝑿 𝒔𝒐𝒃𝒓𝒆 𝒀: 𝑥 − 𝑥̅ = = (𝑦 − 𝑦̅) ↦ 𝑥 − 28,81 = (𝑦 − 30,98)
𝑠𝑦2 85,7146
𝑥 = 19,20 + 0,31𝑦
𝑠𝑥𝑦 27,1162
Coeficiente de regresión: 𝑏𝑥𝑦 = = = 0,31 > 0 (recta de regresión creciente)
𝑠𝑦2 85,7146
101
Lic. Isidro W. Nina Paco
102
Lic. Isidro W. Nina Paco
E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
a) Hallar la tabla de frecuencias
b) Hallar las distribuciones marginales, media y varianza de las mismas
c) Covarianza
Solución.
a)
E/M 4 5 6 7 8 9 10 𝑓𝑖∗
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
𝑓∗𝑗 2 4 0 5 1 2 3 17
b)
103
Lic. Isidro W. Nina Paco
739
𝑎11 = = 43,47 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 43,47 − 5,82 ∗ 7 = 2,7
17
EJERCICIO 2.
En una experimentación sobre el sector turístico se han observado dos caracteres cuantitativos (X, Y),
obteniéndose los siguientes resultados:
(0, 2), (1, 6), (3, 14), (−1, −2), (2, 10)
a) Hallar las distribuciones marginales
b) Correlación entre ambos caracteres
c) ¿Cómo completaríamos los pares (−3, ∙), (∙ , 4)?. Utilizar para ello la recta de regresión ajustada
a los datos observados.
Solución.
a) Como no hay repetición de los pares, la tabla de doble entrada de frecuencias absolutas vendrá de la
forma:
X/Y 2 6 14 -2 10 𝑓𝑖∗
0 1 1
1 1 1
3 1 1
-1 1 1
2 1 1
𝑓∗𝑗 1 1 1 1 1 5
Las distribuciones marginales de la X e Y, respectivamente, serán:
𝑥𝑖 0 1 3 -1 2 𝑦𝑖 2 6 14 -2 10
𝑓𝑖∗ 1 1 1 1 1 𝑓∗𝑗 1 1 1 1 1
b) Para estudiar la correlación se forma la tabla adjunta, donde no figura la columna de las frecuencias
absolutas por ser la unidad para todos los pares.
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑦𝑖2
0 2 0 0 4
1 6 6 1 36
3 14 42 9 196
-1 -2 2 1 4
2 10 20 4 100
Total 30 70 15 340
∑5𝑖=1 𝑥𝑖 𝑦𝑖 70
𝑎11 = = = 14
𝑁 5
2
𝑥̅ = 𝑎10 == 1 𝑎20 = 3 𝑠𝑥2 = 𝑎20 − 𝑎10 = 3 − 12 = 2
𝑠𝑥 = 1,41
104
Lic. Isidro W. Nina Paco
2
𝑦̅ = 𝑎01 == 6 𝑎02 = 68 𝑠𝑦2 = 𝑎02 − 𝑎01 = 68 − 62 = 32
𝑠𝑦 = 5,66
𝑠𝑥𝑦
𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 14 − 1 ∗ 6 = 8 𝑟= =1
√𝑠𝑥2 𝑠𝑦2
Como el coeficiente de correlación es igual a 1, indica que existe una dependencia funcional entre las
variables (X, Y) estudiadas.
c) Para completar el par (‐3, •) hay que hallar la ecuación de la recta de regresión de Y sobre X.
Análogamente, para completar el par (•, 4) hay que hallar la ecuación de la recta de regresión de X sobre
Y.
EJERCICIO 3.
La siguiente tabla proporciona la distribución conjunta de frecuencias absolutas, donde la variable X
representa el número de tarjetas de débito que posee una persona, y la variable Y representa la cantidad
de veces que accede por semana a los cajeros automáticos para realizar una transacción bancaría con
tarjeta de débito.
X\Y 1 2 3 4
1 3 16 2 18
2 10 14 16 20
3 8 2 8 24
Obtener:
105
Lic. Isidro W. Nina Paco
EJERCICIO 4.
De la siguiente distribución bidimensional.
X\Y 1 2 3 4 5 6
-1 5 8 5 8 4 1
0 4 6 10 7 8 7
1 7 7 15 12 11 12
2 2 8 14 15 14 17
Obtener:
a) Las distribuciones marginales de X e Y
b) Las medias marginales de X e Y
c) Las varianzas marginales de X e Y.
d) La distribución de X condicionada a que Y=4
e) La media de X|Y=4
f) La varianza de la distribución condicionada de Y dado X=1
g) ¿Son independientes las variables X e Y?
EJERCICIO 5.
Dada la siguiente tabla de doble entrada.
X\Y 15 25 35 40 50
10 5 8 10 12 15
20 4 10 12 14 16
30 3 5 7 9 11
40 1 4 8 12 10
a) ¿Qué variable presenta mayor dispersión relativa?
b) Calcule la distribución de la variable Y condicionada a que X=20
c) Calcule la distribución de la variable X condicionada a que Y=15
d) Calcule la distribución de la variable X condicionada a que Y≤35
e) Calcule la media aritmética de la variable Y condicionada a que X=30
f) Calcule la covarianza y la correlación de Pearson.
EJERCICIO 6.
Dadas las siguientes variables.
X 0 10 4 8 9 15 20 15 17 20 17 14 19
Y 5 5 2 7 6 7 6 9 10 10 9 10 9
a) Represente gráficamente la nube de puntos (x, y).
b) Halle la covarianza.
106
Lic. Isidro W. Nina Paco
EJERCICIO 7.
Un estudio sobre la relación entre el nivel de ingresos (A = alto, M = medio, B = bajo) y la preferencia
por una de las tres grandes marcas de automóviles (Toyota, Mitsubishi y Ford) da como resultado la
siguiente tabla de doble entrada de frecuencias porcentuales.
Ingreso
A M B ∑
Marcas Toyota 10 13 2 25
Mitsubishi 20 12 8 40
Ford 30 15 10 55
∑ 60 40 20 120
a) Defina las variables sometidas a estudio.
b) Obtener la distribución marginal de los ingresos y marcas de automóviles. Interprete los
resultados.
c) Obtener la distribución del nivel de ingresos condicionada a que la marca del automóvil es
Toyota.
d) Obtener la distribución de las marcas de automóviles condicionada a que el nivel de ingreso es
medio. Interprete los resultados.
e) Trazar el gráfico de barras 3D, barras múltiples y apiladas.
f) Calcule e interprete la correlación PHI de Cramer.
EJERCICIO 8.
Se han relacionado las edades de los padres de niños recién nacidos en una maternidad obteniéndose la
siguiente distribución de frecuencias.
Edad del
25 22 30 20 40 27 28 36 32 20 38 35 37 30 32 20 25
Padre
Edad de
20 20 32 35 20 25 25 23 22 18 24 33 30 29 30 23 35
la madre
Frecuencia 10 5 2 1 2 7 4 5 8 10 3 11 7 9 5 10 4
a) Elaborar una tabla de doble entrada de frecuencias absolutas y porcentuales usando los
siguientes intervalos de edades 17-22, 22-27, 27-32, 32-37, 37-42.
b) Calcular la covarianza y la correlación lineal entre las edades del padre y la madre.
EJERCICIO 9.
Sean (X, Y) los paquetes diarios que venden dos operadores de viajes cuya distribución de probabilidad
conjunta se refleja en la tabla:
107
Lic. Isidro W. Nina Paco
Solución.
108
TEMA 6:
REGRESION Y CORRELACIÓN
(parte 2)
2
∑(𝑌 − 𝑌̂)2 𝑛 ∑ 𝑓𝑥𝑦 − ∑ 𝑓𝑥 ∑ 𝑓𝑦
𝑆𝑦𝑥 = 𝐵=
𝑛 𝑛 ∑ 𝑓𝑥 2 − (∑ 𝑓𝑥 )2
𝑉 [𝑋 + 𝑌] = 𝑉[𝑋] + 𝑉[𝑌] + 2𝐶𝑂𝑉𝑋𝑌
∑ 𝑓(𝑌̂ − 𝑌̅)2
𝑉 [𝑋 − 𝑌] = 𝑉[𝑋] + 𝑉[𝑌] − 2𝐶𝑂𝑉𝑋𝑌 𝑟 =√ −1≤𝑟 ≤1
2
∑ 𝑓(𝑌 − 𝑌̅)2
2
𝑆𝑦𝑥
% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 sin 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑟 = 1 − 𝑟 = 2
𝑆𝑦 𝐶𝑂𝑉𝑥𝑦 ∑ 𝑓(𝑋 − 𝑋̅ )(𝑌 − 𝑌̅ )
𝑟 = 𝐶𝑂𝑉𝑥𝑦 =
𝜎𝑥 𝜎𝑦 𝑛
ERROR ESTANDAR DE ESTIMACIÓN
109
Lic. Isidro W. Nina Paco
𝑍 = 𝐴 + 𝐵𝑋 + 𝐶𝑌 𝑦 = 𝐴 + 𝐵 ln 𝑥
𝑦 = 𝐴 + 𝐵𝑈, 𝑈 = 𝑙𝑛 𝑥 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙)
𝑛𝐴 + (∑ 𝑋) 𝐵 + (∑ 𝑌) 𝐶 = ∑ 𝑍 ∑(𝑈 − 𝑈 ̅ )(𝒚 − 𝒚
̅)
𝒓= 𝒏
(∑ 𝑋) 𝐴 + (∑ 𝑋 2 ) 𝐵 + (∑ 𝑋𝑌) 𝐶 = ∑ 𝑋𝑍 ̅ 2 ̅ )2
√∑(𝑈 − 𝑈) √∑(𝒚 − 𝒚
𝒏 𝒏
(∑ 𝑌) 𝐴 + (∑ 𝑋𝑌) 𝐵 + (∑ 𝑌 2 ) 𝐶 = ∑ 𝑌𝑍
(∑ 𝑋) 𝐴 + (∑ 𝑋 2 ) 𝐵 + (∑ 𝑋 3 ) 𝐶 = ∑ 𝑋𝑌
REGRESIÓN HIPERBOLICA
1
(∑ 𝑋 2 ) 𝐴 + (∑ 𝑋 3 ) 𝐵 + (∑ 𝑋 4 ) 𝐶 = ∑ 𝑋 2 𝑌 𝑦 = 𝐴 + 𝐵⁄𝑥 = 𝐴 + 𝐵
𝑥
1
𝑦 = 𝐴 + 𝐵 𝑈 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙) , 𝑈 =
2 𝑥
∑𝑛𝑖=1(𝑦̂ 𝑖 − 𝑦̅) ̅ ) ∑(𝑦 − 𝑦̅)
∑(𝑈 − 𝑈
𝑟= √ 𝑛
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 𝑟=
2
̅ ) ∑(𝑦 − 𝑦̅)2
√∑(𝑈 − 𝑈 √
𝑛 𝑛
110
Lic. Isidro W. Nina Paco
Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes sean,
respectivamente, las líneas de regresión mínimo-cuadráticas de Y sobre X y de X sobre Y de una serie
de observaciones
Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes
sean, respectivamente, las líneas de regresión mínimo-cuadráticas de Y sobre X y de X sobre
Y de una serie de observaciones.
𝑌/𝑋: 𝑌 = 2𝑋 + 1 𝑋⁄𝑌 : 𝑋 = 5𝑌 + 10
Solución.
Los coeficientes de regresión deben tener el mismo
𝑌 = 1 + 2𝑥 ⟶ 𝑏𝑦𝑥 = 2 > 0
{ signo, al depender ambos de la misma covarianza.
𝑋 = 10 + 5𝑌 ⟶ 𝑏𝑥𝑦 = 5 < 0
Con lo cual, no pueden ser rectas de regresión.
EJERCICIO 3.
𝑥̅ = 10 𝑠𝑥 = 1,5 𝑦̅ = 20 𝑠𝑦 = 2
Solución.
𝑠𝑥𝑦 𝑠𝑥𝑦
𝐑𝐞𝐜𝐭𝐚 𝐝𝐞 𝐫𝐞𝐠𝐫𝐞𝐬𝐢ó𝐧 𝐝𝐞 𝐘 𝐬𝐨𝐛𝐫𝐞 𝐗: y − 𝑦̅ = = (𝑥 − 𝑥̅ ) ↦ 𝑏𝑦𝑥 = (coeficiente regresión)
𝑠𝑥2 𝑠𝑥2
𝑠𝑥𝑦 𝑠𝑥𝑦
𝐑𝐞𝐜𝐭𝐚 𝐝𝐞 𝐫𝐞𝐠𝐫𝐞𝐬𝐢ó𝐧 𝐝𝐞 𝐗 𝐬𝐨𝐛𝐫𝐞 𝐘: x − 𝑥̅ = = (𝑦 − 𝑦̅) ↦ 𝑏𝑥𝑦 = (coeficiente regresión)
𝑠𝑦2 𝑠𝑦2
𝑠𝑥𝑦 𝑠𝑥𝑦
El coeficiente de correlación: r = √𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = ↦ 0,6 = ↦ 𝑠𝑥𝑦 = 1,8
𝑠𝑥 ∗ 𝑠𝑦 1,5 ∗ 2
111
Lic. Isidro W. Nina Paco
EJERCICIO 4.
a) Media de X
b) Recta de regresión de Y/X
c) Varianza de Y
d) Covarianza de ambas variables
Solución.
𝑋̅ = 0,6 + 0,44𝑌̅
a) Recta de regresión de X sobre Y: 𝑋 = 0,6 + 0,44𝑌 ⟼ { ̅
𝑋 = 0,6 + 0,44 ∗ 4 = 2,36
b) La recta de regresión de 𝑌/𝑋:
𝑎 = 0,6
siendo X = 0,6 + 0,44Y ⟼ {𝑏 = 0,44
𝑥𝑦
0,72
𝑟 2 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 ⟼ 0,72 = 𝑏𝑦𝑥 ∗ 0,44 ⟼ 𝑏𝑦𝑥 = = 1,114
0,44
Con lo cual, la recta de regresión de Y sobre X:
𝑠𝑥𝑦
𝑦 − 𝑦̅ = = (𝑥 − 𝑥̅ ) 𝑠𝑒𝑟á: 𝑦 − 4 = 1,114(𝑥 − 2,36) 𝑦 = 1,370 + 1,114𝑥
𝑠𝑥2
112
Lic. Isidro W. Nina Paco
EJERCICIO 5.
Sean las variables estadísticas bidimensionales (X, Y), donde X = "PIB per cápita (en miles de
dólares) e Y = "Tasa natural de crecimiento demográfico de 162 países del mundo". Se
conocen los datos siguientes:
∑ 𝑥 = 978,9 ∑ 𝑦 = 2886,4 ∑ 𝑥𝑦 = 8938,4
∑ 𝑥 2 = 17569,9 ∑ 𝑦 2 = 172291,2
a) Obtener la recta de regresión que pretende explicar la tasa natural de crecimiento en función
de la renta del país.
b) Interpretar los coeficientes de la recta estimada.
c) Obtener una medida de bondad del ajuste e interpretar si éste es bueno.
Solución.
𝑠𝑥𝑦
𝐚) Se trata de encontrar la recta de regresión de Y sobre X: y − 𝑦̅ = ∗ (𝑥 − 𝑥̅ )
𝑠𝑥2
∑ 𝑥 978,9 ∑ 𝑥 2 17569,9
𝑎10 = 𝑥̅ = = = 6,04 𝑎20 = = = 108,456
𝑁 162 𝑁 162
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 108,456 − 6,042 = 71,97
∑ 𝑦 2886,4 ∑ 𝑦 2 172291,2
𝑎01 = 𝑦̅ = = = 17,82 𝑎02 = = = 1063,526
𝑁 162 𝑁 162
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 1063,526 − 17,822 = 745,97
∑ 𝑥𝑦 8938,4
𝑎11 = = = 55,175 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 55,175 − 6,04 ∗ 17,82 = −52,46
𝑁 162
𝑠𝑥𝑦 −52,46
El coeficiente de regresión de Y sobre X (pendiente de la recta): 𝑏𝑦𝑥 = = = −0,729
𝑠𝑥2 71,91
Adviértase que la pendiente de la recta (−0,729) en el signo depende de la covarianza (𝑠𝑥𝑦 ), al ser
negativa la recta de regresión será decreciente, esto es, a medida que aumenta los valores de la
variable X (PIB per cápita) disminuyen los valores de la variable Y (tasa natural de crecimiento
demográfico).
𝑠𝑥𝑦 −52,46
𝑏𝑥𝑦 = = = −0,07
𝑠𝑦2 745,97
113
Lic. Isidro W. Nina Paco
El coeficiente de correlación lineal: 𝑟 = √0,051 = 0,226 (no existe apenas correlación lineal entre
las variables, pudiendo existir otro tipo de correlación)
EJERCICIO 6.
a)
Para que los ingresos familiares (X) y el tamaño de la vivienda familiar (Y) sean independientes debe
verificarse
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ( ) ( ) ∀𝑖, 𝑗
𝑁 𝑁 𝑁
114
Lic. Isidro W. Nina Paco
𝑦𝑗 𝑓𝑗 /50 − 100 𝑓𝑗 /100 − 200 𝑓𝑗 /200 − 350 𝑓𝑗 /350 − 500 𝑓/> 500
< 60 20 25 5 0 0
60 – 80 18 40 10 5 1
80 – 100 2 30 15 15 2
100 – 150 1 2 25 20 7
> 150 0 1 3 8 10
41 98 58 48 20
Con los datos disponibles no se puede calcular el intervalo modal de la variable X, al no
poder calcular todas las densidades de frecuencias marginales, es imposible hacerlo en el
tramo (> 500) que tiene una amplitud ilimitada.
c) La distribución condicionada de la variable X al intervalo mediano de la Y (vivienda familiar):
115
Lic. Isidro W. Nina Paco
> 500 0 1 2 7 10
EJERCICIO 7.
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋
Se conocen las regresiones {
𝑋⁄𝑌 : 𝑋 = 2 + 0,3𝑌
Sabiendo además que 𝑠𝑥𝑦 = 3,2. Obtener la varianza residual de las dos rectas de regresión.
Solución.
EJERCICIO 8.
Sean las siguientes ecuaciones las rectas de regresión de una variable bidimensional
(𝑌, 𝑋; 𝑓𝑖𝑗 )
𝑋 − 2𝑌 = 3
{
𝑋 − 4𝑌 = 2
a) ¿Cuál de estas rectas corresponde a la regresión de 𝑌/𝑋 y cuál a la regresión de 𝑋/𝑌?
b) Hallar las medias aritméticas de Y sobre X
c) ¿Cuánto vale el coeficiente de correlación lineal?
Solución.
a)
116
Lic. Isidro W. Nina Paco
𝑎=3
𝑋 = 3 + 2𝑌 ↦ {𝑏 = 2
𝑋 − 2𝑌 = 3 ⟶ recta regresión 𝑋⁄𝑌 ⟶ 1 1 𝑥𝑦
{ { ′
𝑋 − 4𝑌 = 2 ⟶ recta regresión 𝑌⁄𝑋 ⟶ 𝑌 = − + 𝑋 𝑎 = − 1⁄2
2 4 ↦{
𝑏𝑦𝑥 = 1⁄4
↦ signo (𝑏𝑥𝑦 ) = signo (𝑏𝑦𝑥 )
1
Coeficiente de determinación 𝑟 2 = 𝑏𝑥𝑦 𝑏𝑦𝑥 = 2 ∗ = 0,5 < 1
4
3
𝑎=−
2
3 1 ↦{ 1
𝑋 − 2𝑌 = 3 ⟶ recta regresión 𝑌⁄𝑋 ⟶ 𝑌 = − + 𝑋
{ { 2 2 𝑏𝑥𝑦 =
𝑋 − 4𝑌 = 2 ⟶ recta regresión 𝑋⁄𝑌 ⟶ 2
𝑋 = 2 + 4𝑌 𝑎′ = 2
↦{
𝑏𝑦𝑥 = 4
↦ signo (𝑏𝑥𝑦 ) = signo (𝑏𝑦𝑥 )
1
Coeficiente de determinación 𝑟 2 = 𝑏𝑦𝑥 𝑏𝑥𝑦 = ∗ 4 = 2 > 1 cosa que no es posible (0 ≤ 𝑟 2 ≤ 1)
2
𝑋⁄𝑌 : 𝑋 = 3 + 2𝑌
En consecuencia { 1 1
𝑌⁄𝑋 : 𝑌 = − + 𝑋
2 4
EJERCICIO 9.
En una distribución bidimensional (𝑋𝑖 , 𝑌𝑗 , 𝑓𝑖𝑗 ) se conoce 𝑥̅ = 10 y 𝑠𝑥𝑦 = 10. Ambas rectas de
regresión pasan por el punto (0, 0). ¿Cuál es el grado de bondad del ajuste?
Solución.
Las rectas de regresión de Y/X e X/Y se cortan en (𝑥̅ , 𝑦̅), en este caso en el punto (10, 𝑦̅).
Por otra parte, según el enunciado se cortan en (0, 0), por lo que se puede concluir que
ambas rectas coinciden al tener dos puntos distintos en común.
En consecuencia, 𝑅2 = 1 → 𝑅 = 1 (100% grado de ajuste)
EJERCICIO 10.
𝑌 = 10 + 0,45𝑋 𝑟 2 = 0,9 𝑥̅ = 20
117
Lic. Isidro W. Nina Paco
EJERCICIO 11.
¿Cuáles de los siguientes pares de posibles rectas de regresión de Y/X y de X/Y realmente
pueden serlo? Razone la respuesta.
a) 𝑌 = 3 + 4𝑋 siendo 𝑋 = 2 + 𝑌 b) 𝑌 = 3 + 2𝑋 siendo 𝑋 = 2 − 0,3𝑌
c) 𝑌 = 3 + 2𝑋 siendo X = 2 + 0,2Y
Solución.
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 4𝑋 ↦ |𝑏 = 4 > 0 signo (𝑏𝑦𝑥 ) = signo (𝑏𝑥𝑦 )
𝑦𝑥
{ ′ ↦{ 2
𝑎 =2 𝑟 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = 4 ∗ 1 = 4 > 1 contradicción
𝑋⁄𝑌 : 𝑋 = 2 + 𝑌 ↦ |
𝑏𝑥𝑦 = 1 > 0
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋 ↦ |𝑏 = 2 > 0
𝑦𝑥
{ ↦ {signo (𝑏𝑦𝑥 ) ≠ signo (𝑏𝑥𝑦 ) contradicción
𝑎′ = 2
𝑋 ⁄𝑌 : 𝑋 = 2 − 0,3𝑌 ↦ |
𝑏𝑥𝑦 = −0,3 < 0
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋 ↦ |𝑏 = 2 > 0
𝑦𝑥
{ ′
𝑎 =2
𝑋⁄𝑌 : 𝑋 = 2 + 0,2𝑌 ↦ |
𝑏𝑥𝑦 = 0,2 > 0
signo (𝑏𝑦𝑥 ) = signo (𝑏𝑥𝑦 )
↦{ 2 } coeficientes coherentes
𝑟 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = 2 ∗ 0,2 = 0,4 < 1
EJERCICIO 12.
Hallar la covarianza si: 𝑉[𝑥+𝑦] = 9.2 y 𝑉[𝑥−𝑦] = 14.8
Solución:
9,2 Vx V y 2m xy
14,8 Vx V y 2m xy mxy
5,6
1,4 m xy 1,4
4
5,6 0 0 4m xy
118
Lic. Isidro W. Nina Paco
EJERCICIO 13.
s 2yx
a) 100 porcentaje de la varianza total que queda sin explicar.
s 2y
m xy
b) Vx y Vx V y 2 mxy b yx byx s x2 mxy 0,40 18 7,2
s x2
2
0,8836
R 2 byx bxy bxy R 2,209
b yx 0,40
EJERCICIO 14.
Al observar el número de sucursales (X) y los costos mensuales (Y) en comunicación telefónica con la
casa central, en miles de Bs., para 10 empresas se encontró:
x: 3 5 3 2 4 1 5 2 6 3
y: 2 3 5 4 6 2 5 1 3 5
Apoyándose en la información anterior, ajuste la recta que muestre la relación de los costos en función
del número de sucursales y estime los costos de una empresa con 10 sucursales.
Solución:
n 10 xi 34 yi 36 xi yi 130
a) Yˆ b yx x C yx Yˆ b yx x x y x 3,4 y 3,6
119
Lic. Isidro W. Nina Paco
Cov
130
3,4 3,6 0,76 s x2 2,24 s 2y 2,44
10
Cov 0,76
b yx 0,3393 0,34
s x2 2,24
Yˆ 0,3393 10 3,4 3,6 5,8394 5,84 miles de Bs. es el costo para una empresa con 10 sucursales
EJERCICIO 15.
Los siguientes datos del semestre pasado, representan el número de días de incapacidad por enfermedad
o accidente de trabajo (Y) y los años de antigüedad en la compañía (X). Se tomó una muestra de 30
empleados que fueron incapacitados.
𝑥𝑖 : 7 8 2 3 5 3 7
𝑦𝑖 : 2 1 5 6 4 9 2
𝑛𝑖 : 2 3 6 5 4 7 3
xi yi ni
7 2 2 n 30 x i f i 127
8 1 3 y i f i 152
2 5 6
3 6 5 x 2
i f i 669 y 2
i f i 984
5 4 4
3 9 7 x 4,23 y 5,07
x i yi f i 513
7 2 3
30
669 984
s x2 4,23 2 4,4071 s 2y 5,07 2 7,095
30 30
120
Lic. Isidro W. Nina Paco
4,3461
byx 0,986
4,4071
EJERCICIO 16.
En un estudio sobre transporte urbano se quiere predecir, mediante un ajuste parabólico, la capacidad
que debe tener un vehículo de servicio (Y) de acuerdo al número de pasajeros que en determinado
momento debe llevar (X). Se tomaron 10 vehículos de diferente capacidad de pasajeros.
𝑦𝑖 : 12 20 12 20 40 12 20 40 12 20
𝑥𝑖 : 8 12 5 10 14 8 11 16 6 5
Solución:
xi yi Por comodidad, cambiamos por yi = Capacidad y xi = el número de pasajeros, con el fin
de estimar Ŷ en vez de estimar X̂ , tal como se hace frecuentemente, obteniéndose
8 12
los mismos resultados.
12 20
xi2 xi3 xi4 xi y i xi2 y i y i2
5 12
64 512 4.096 96 768 144
10 20
144 1.728 20.736 240 2.880 400
14 40
25 125 625 60 300 184
8 12
100 1.000 10.000 200 2.000 400
11 20
196 2.744 38.416 560 7.840 1.600
16 40
64 512 4.096 96 768 144
6 12
121 1.331 14.641 220 2.420 400
5 20
256 4.096 65.536 640 10.240 1.600
95 208
121
Lic. Isidro W. Nina Paco
a) Yˆ a x 2 b x c Yˆ a yx x 2 byx x c yx
1) 1.031a 95 b 10 c 208
2) 12.389 a 1.031b 95 c 2.284
3) 160.067 a 12.389b 1.031c 28.148
s yx2 14,20
R2 1 2
R2 1 0,9683 r R 2 0,98
s y
447 ,35
EJERCICIO 17.
Siendo:
122
Lic. Isidro W. Nina Paco
Solución:
Xˆ 1 a1 a2 x2 a3 x3
x1 na1 a2 x2 a3 x3
x1 x 2 a1 x 2 a 2 x 22 a 3 x3 x 2
x1 x3 a1 x3 a 2 x 2 x3 a3 x32
EJERCICIO 18.
En un curso de microeconomía de 20 estudiantes se dieron los siguientes resultados
correspondientes a las calificaciones parciales (X) y el examen final (Y):
a) ¿Qué porcentaje de la varianza total de y queda sin explicar por la recta de regresión?
b) Un estudiante obtuvo una calificación de: 58 en el examen parcial. ¿Cuál será la predicción de su
calificación en el examen final?
c) ¿Cuál será la varianza total de la suma de las variables (X+Y)?
Solución:
Yˆ
2
y
s 2
ay
i
95
4,75 s x2 16 sx 4 sy 8
n 20
a) VT V R V E s 2y say
2
s 2yx s 2yx s 2y s ay
2
VR 59,25
0,93 93% Porcentaje que no queda explicado por la recta de regresión
VT 64
123
Lic. Isidro W. Nina Paco
b) Yˆ b yx x C yx Yˆ b yx x x y
2
VE s ay 4,75 Cov
R2 R2 2
0,074 R
VT s y 64 sx s y
c) Vx y s x s y 2 Cov
2 2
EJERCICIO 19.
La representación de la nube de puntos nos da la idea de que un buen ajuste va a ser el lineal
aunque tampoco debemos descartar el ajuste exponencial sólo por el dibujo.
Solución.
a) Ajuste por una función lineal:
Como es habitual, introducimos la tabla con las columnas siguientes:
𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒚𝟐𝒊 𝒙 𝒊 𝒚𝒊
-6 2 36 4 -12
-3 2.8 9 7.84 -8.4
0 3.9 0 15.21 0
3 4.2 9 17.64 12.6
6 5.8 6 33.64 34.8
9 6.2 81 38.44 55.8
124
Lic. Isidro W. Nina Paco
125
Lic. Isidro W. Nina Paco
𝑆𝑋𝑌′ 4,7696
𝑏= = = 0,0525
𝑆𝑋2 90,89
𝑎 = 𝑒 𝑎′ = 𝑒 1,259 = 3,522
Luego la función exponencial que mejor se ajusta a las observaciones es
𝑦 = 3,522𝑒 0,0525𝑥
Finalmente, para decidir cuál es el mejor modelo de los dos utilizados, calculamos los
errores típicos:
𝑛
1
𝑒𝑡 = √ ∑(𝑦𝑖 − 𝑦(𝑥𝑖 ))2
𝑛
𝑖=1
a) Modelo lineal:
EJERCICIO 20.
A partir de las siguientes observaciones para 5 años de las variables X e Y, ajústese el modelo
de regresión de Y en función de X más idóneo.
Donde,
X: tiempo
126
Lic. Isidro W. Nina Paco
Año X Y
1995 1 1,25
1996 2 5
1997 3 11,25
1998 4 20
1999 5 30,5
Solución.
a) Ajuste de una función lineal: Y* = a + b X
X Y X2 XY Y2 Y* e=Y-Y* e2
1 1,25 1 1,25 1,56 -1,1 2,35 5,5225
2 5 4 10 25 6,25 -1,25 1,5625
3 11,25 9 33,75 126,56 13,6 -2,35 5,5225
4 20 16 80 400 20,95 -0,95 0,9025
5 30,5 25 152,5 930,25 28,3 2,2 4,84
Y* = -8,45 + 7,35 X
2 S2 * S e2 3,67
Coeficiente de determinación: R = 2 r =XY
Y
2
1- 2
1- 0,9671
S Y S Y
111,715
127
Lic. Isidro W. Nina Paco
S e ECM1
2
e 2
3,67
N
X Y X2 X3 X4 XY X2Y Y* e=Y- e2
Y*
1 1,25 1 1 1 1,25 1,25 1,18 0,07 0,0049
2 5 4 8 16 10 20 5,11 -0,11 0,0121
3 11,25 9 27 81 33,75 101,5 11,32 -0,07 0,0049
4 20 16 64 256 80 320 19,81 0,19 0,0361
5 30,5 25 125 625 152,5 762,5 30,58 -0,08 0,0064
2
S2 * S e2 0,01288
Coeficiente de determinación: R = Y
2
1- 2
1- 0,9998
S Y S Y 111,715
S e ECM 2
2
e 2
0,01288
N
128
Lic. Isidro W. Nina Paco
e0
ECM3
e 2
0,0397
N
(lnY - lnY * ) 2
, de ahí que e 0 .
d) Ajuste de una función exponencial: Y* = a bX
129
Lic. Isidro W. Nina Paco
e0
ECM 4
e 2
19,16
N
130
Lic. Isidro W. Nina Paco
Vx y 116
EJERCICIO 2.
Con los siguientes datos de 10 pares de observaciones, mediante la regresión lineal:
x: 12 22 36 20 26 34 18 20 25 30
y: 5 8 12 10 14 16 10 13 18 19
a) Yˆ 8,81
b) R 2 0,4463
EJERCICIO 3.
La siguiente información corresponde: 𝑋 = edad de autos en años y 𝑌 =gastos de mantenimiento
durante los dos últimos años (en miles de Bs.) Utilizando los datos registrados de cuatro autos, los
cuales fueron: ∑ 𝑥𝑖 = 12 ; ∑ 𝑦𝑖 = 24, ∑ 𝑥𝑖 𝑦𝑖 = 78; ∑ 𝑥𝑖2 = 44. Calcular:
Solución:
b) Yˆ 0,75 x 3,75
c) Yˆ 8,25
EJERCICIO 4.
Dos ecuaciones de regresión, cuyas ecuaciones son: 𝑌̂ = 2,8𝑥 + 10 y 𝑋̂ = 0,3𝑦 + 20 ¿Cuál es el valor
del coeficiente de correlación lineal?
131
Lic. Isidro W. Nina Paco
Solución.
EJERCICIO 5.
Dadas las siguientes variables 𝑋 = 𝑔𝑎𝑠𝑡𝑜𝑠 𝑑𝑒 𝑚𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 de un centro comercial (miles de
bolivianos) y 𝑌 = 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑎𝑟𝑡𝑖𝑐𝑢𝑙𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠 en un mes en el centro comercial.
Solución.
a) Yˆ 12158,3 1,3 X
b) Yˆ 61,7
EJERCICIO 6.
Se dispone de la siguiente información sobre dos variables relacionadas entre sí, obtenidas
mediante una muestra aleatoria de 50 observaciones.
𝑥𝑖 ∶ 2 6 9 14 16 23
𝑦𝑖 ∶ 5 13 20 25 35 52
𝑓𝑖 ∶ 18 12 8 6 4 2
a) Determinar la recta de regresión lineal.
b) Estimar el valor de 𝑦̂ cuando 𝑥 = 30.
Solución.
b) Yˆ 62,14
EJERCICIO 7.
Para cada conjunto de datos, calcular sus ecuaciones de regresión lineal, exponencial, potencial
y parabólica. Decidir cuál es la más conveniente de acuerdo a sus coeficientes de correlación.
a)
X 11 13 15 17 19 21 23
Y 50 80 120 170 260 400 600
132
Lic. Isidro W. Nina Paco
b)
X 2 3 4 5 6 7 8
Y 10 52 126 250 440 732 1120
c)
X 2 4 6 8 10 12 14
Y 30 100 250 450 480 1300 1450
Solución.
a) 𝑌 = −497.68 + 43.39𝑥 , 𝑟 = 0.9441; 𝑌 = 5.43𝑒 0.20𝑥 , 𝒓 = 𝟎. 𝟗𝟗𝟗𝟔
𝑌 = 0.016𝑥 3.32 , 𝑟 = 0.9944; 𝑌 = 664.19 − 101.31𝑥 + 4.26𝑥 2 , 𝑟 = 0.9971
b) 𝑌 = −503.57 + 178.71𝑥 , 𝑟 = 0.9455; 𝑌 = 4.45𝑒 0.74𝑥 , 𝑟 = 0.9705
𝑌 = 1.66𝑥 3.10 , 𝑟 = 0.9983; 𝑌 = 234.43 − 172.71𝑥 + 35.14𝑥 2 , 𝒓 = 𝟎. 𝟗𝟗𝟖𝟖
c) 𝑌 = −404.29 + 123.04𝑥 , 𝑟 = 0.9339; 𝑌 = 26.14𝑒 0.31𝑥 , 𝑟 = 0.9687
𝑌 = 6.92𝑥 2 , 𝒓 = 𝟎. 𝟗𝟗𝟎𝟐; 𝑌 = 82.86 − 39.34𝑥 + 10.15𝑥 2 , 𝑟 = 0.9713
EJERCICIO 8.
El coeficiente de correlación entre dos variables X e Y es 0,6. Sabiendo además
Variable Media Desviación Típica
X 15 1,5
Y 25 2
a) Halle las rectas de regresión estimada de Y sobre X y de X sobre Y.
b) Calcule el coeficiente de determinación y el error estándar de estimación de las dos
regresiones anteriores.
EJERCICIO 9.
Se sostiene que cuando los tipos de interés bajas, las empresas pueden invertir más en bienes
de equipamiento. En la tabla adjunta se dan cifras anuales de interés promedio e inversiones de
capital en millones de dólares:
N° Dato Inversión Interés N° Dato Inversión Interés
1 3 15 9 3 15
2 5 14,5 10 13 10
3 7 4 11 17 9
4 8 13,5 12 20 8,5
5 9 13 13 22 8
6 10 12,5 14 23 7,5
7 12 12 15 30 5
8 12 11,5 16 13 11
Realice un análisis de regresión lineal, cuadrática, exponencial, hiperbólica. Posteriormente
determine que regresión es la más adecuada. (Calculando su coeficientes de correlación).
133
Lic. Isidro W. Nina Paco
EJERCICIO 10.
Los siguientes datos son los precios de venta en dólares Y de una marca de automóviles
usados X años:
X 1 2 3 4 5 6
Y 6350 5695 5790 - 4985 4890
a) Ajustar una curva de mínimos cuadrados de la forma 𝑌 = 𝐴𝐵 𝑥
b) Estimar el precio de venta de un automóvil que tenga 4 años de uso.
c) Calcular el coeficiente de correlación.
Solución:
a) 𝑌 = 6559,78 (0,95) 𝑋
b) 𝑌̂ = 5342,98
c) 𝑟 = −0,9658
134
TEMA 7:
ANALISIS COMBINATORIO Y
PROBABILIDADES
135
Lic. Isidro W. Nina Paco
𝑟 = 1: 𝜇 ′1 = 𝐸 (𝑋1 ) = ∑ 𝑥 𝑓(𝑥) = 𝜇
𝑥
TEOREMA DE CHEBYSHEV
1
1– ≤ 𝑷(𝜇– 𝒌𝜎 < 𝑿 < 𝜇 + 𝒌𝜎)
𝒌2
TEOREMA DE CHEBYSHEV
136
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Un embarque de pintura contiene 200 latas de 18 litros de las cuales 80 son de pintura blanca,
50 de amarilla, 30 de roja, 30 de verde y 10 de azul. Durante el viaje, las latas se han
sumergido accidentalmente en aguas y se han borrado todos los rótulos. A la llegada, las latas
se colocan sobre una plataforma, se coge una y se abre. Respecto del color de la lata elegida.
a) ¿Cuál es el espacio muestral?
b) ¿Qué valores podrían asignarse a los diversos puntos muestrales?
c) ¿Cuál es la probabilidad de que la lata elegida contenga pintura roja, blanca o azul?
Solución:
a) 80 B 50 A 30 R 30V 10 Az
80 50 30 30 10
b)
200 200 200 200 200
R B Az
c) P 30 80 10 120 0,60
200 200 200 200
EJERCICIO 2.
Asignando la misma probabilidad a cada uno de los puntos del espacio muestral
HHH HHM HMM MMM HMH MHM MHH MMH
a) ¿Cuál es la probabilidad de que en una familia con 3 hijos los dos primeros sean mujeres y
el tercero hombre?
b) ¿Cuál es la probabilidad de que dos sean mujeres y uno sea hombre?
Solución:
a) MMH p 1 0,125
8
EJERCICIO 3.
Aseguro mi automóvil contra el riesgo de robo en la suma de Bs. 185.000. Si la probabilidad
de que sea robado en el curso de un año es 0,05 ¿Cuál es el precio justo de la prima anual que
debo pagar?
Solución:
𝐸 = 185.000(0.05) = 𝐵𝑠. 9.250
137
Lic. Isidro W. Nina Paco
EJERCICIO 4.
a) ¿Cuántas permutaciones se pueden hacer con las letras de la palabra REEMPLAZAR?
b) ¿Si se considera que las E deben estar juntas?
Solución:
10! 9!
a) P10 r: 2, 2, 2 453.600 b) P9 r: 2, 2 90.720
2! 2! 2! 2! 2!
EJERCICIO 5.
Desarrolle las siguientes combinaciones:
8 5 5 8 10 10
𝑎) ( ) 𝑏) ( ) 𝑐) ( ) 𝑑) ( ) 𝑒) ( ) 𝑓) ( )
6 3 2 2 4 6
¿Observa algo especial en los ejercicios anteriores? ¿Por qué se dan esos resultados iguales?
Solución:
8 8! 5 5! 5 5!
a) 28 b) 10 c) 10
6 2! 6! 3 2 ! 3! 2 3! 2 !
EJERCICIO 6.
Es necesario elegir un comité de 10 personas entre 5 abogados, 3 economistas y 4 contadores.
Si el comité debe estar integrado por 3 abogados, 2 economistas y 2 contadores.
Solución:
5 3 4
10 3 6 180 Comités
5! 3! 4!
3 2 2 2! 3! 1! 2! 2! 2!
EJERCICIO 7.
La madre lleva a su hijo a una tienda y le ofrece 3 opciones. La probabilidad de que escoja un
helado es del 70%; yogurt es de 50% y helado y yogurt es de 30%. ¿Cuál es la probabilidad
de que compre helado o yogurt?
Solución:
EJERCICIO 8.
138
Lic. Isidro W. Nina Paco
P A 1 ; P B 1 ; PC 1 ; P D 1 ;
2 2 2 2
1 1 1 1 1
P A y B y C y D 0,0625
2 2 2 2 16
EJERCICIO 9.
Se tiene en una caja dos bolas de plástico una azul y otra blanca. ¿Cuál es la probabilidad de
sacar 3 veces sucesivas (con reposición) la bola azul?
Solución:
1 1 1 1
P A y B y C 0,125 12 ,5%
2 2 2 8
EJERCICIO 10.
Se extraen cinco cartas sin reposición de una baraja de 52 cartas, ¿Cuál es la probabilidad de
que las cinco sean diamantes?
Solución:
13 12 11 10 9 154.440
P 0,00049
52 51 50 49 48 311.875.200
EJERCICIO 11.
¿Cuántos números de 4 cifras se pueden formar con los dígitos: 2, 5, 9 y 7 sin repetirlos?
Solución:
P4 4 ! 24 Números.
EJERCICIO 12
Un experimento consiste en lanzar tres veces una moneda. Sea la variable aleatoria: X="número
de caras que se obtienen". Se pide:
a) Distribución de probabilidad de X
b) Función de distribución de X. Representación gráfica
c) Media, varianza y desviación típica de X
d) Probabilidad de que salgan a lo sumo dos caras
e) Probabilidad de que salgan al menos dos caras
139
Lic. Isidro W. Nina Paco
Solución:
2x3 F(x) P(X x) P(X 3) P(X 0) P(X 1) P(X 2) 1/8 3/8 + 3/8 = 7/8
X xi 0 1 2 3
P(X xi ) 1/8 3/8 3/8 1/8
F(x) P(X x) 1/8 4/8 7/ 8 1
0 𝑥<0
1/8 0≤𝑥≤1
F(x) = 4/8 1≤𝑥<2
7/8 2≤𝑥<3
{ 1 𝑥≥3
140
Lic. Isidro W. Nina Paco
Varianza:
4
𝜎𝑥 = √0,75 = 0,87
d) Probabilidad de que salgan a lo sumo dos caras
P(X 2) P(X 0) P(X 1) P(X 2) o bien P(X 2) F(2)= 7/8
EJERCICIO 13.
Completar la ley de probabilidad, conociendo que la esperanza matemática es 1,8
X 0 1 2 3
P(X xi ) pi 0,2 a b 0,3
Solución.
4
a + b = 0,5 b = 0,4
Resolviendo el sistema: { ⇒
a + 2b = 0,9 a = 0,1
141
Lic. Isidro W. Nina Paco
EJERCICIO 14.
Calcular la media, varianza y coeficiente de variación de la variable aleatoria que tiene como
función de distribución:
0 𝑥<2
0,2 2≤𝑥≤4
F(x) = 0,55 4≤𝑥<6
0,85 6≤𝑥<8
{ 1 𝑥≥8
Solución.
La ley de probabilidad o función de cuantía:
X xi 2 4 6 8
P(X xi ) 0,2 0,35 0,30 0,15
Adviértase que la función de distribución F(x) es una función acumulativa, por tanto:
P(X 2) F(2) F(0) 0, 2 P(X 4) F(4) F(2) 0,55 0, 2 0,35
P(X 6) F(6) F(4) 0,85 0,55 0,30 P(X 8) F(8) F(6) 1 0,85 0,15
Media:
4
∝2 = E(X 2)
= ∑ xi2 ∗ P(X = xi ) = 26,8
𝑖=1
Varianza:
𝜎𝑥2 = Var(X) =∝2 −∝12 = 26,8 − 4,82 = 3,76
Desviación Típica:
142
Lic. Isidro W. Nina Paco
𝜎𝑥 = √3,76 = 1,94
Coeficiente variación:
σx 1,94
CV = = = 0,40
μx 4,8
EJERCICIO 15.
En un cine de verano hay instaladas 800 sillas, sabiendo que el número de asistentes es una
variable aleatoria de media 600 y desviación típica 100.
¿Qué probabilidad existe de que el número de personas que vaya al cine un día cualquiera sea
superior al número de sillas instaladas?
Solución.
Sea la variable aleatoria X = "número de sillas del cine", donde 600 , 100
EJERCICIO 16.
Se desea conocer el número de automóviles que se deben poner a la venta durante un periodo
determinado para que se satisfaga una demanda media de 300 unidades con una desviación
típica de 100 unidades, con una probabilidad no inferior al 75%.
Solución.
Sea la variable aleatoria X = "número de automóviles a la venta", donde 300 , 100
Según Chebyshev:
143
Lic. Isidro W. Nina Paco
EJERCICIO 17.
La variable X ="número de centímetros a que un dardo queda del centro de la diana" al ser
tirado por una persona tiene como función de densidad:
k 0 < x < 10
f(x) = {
0 en otros casos
Se pide:
a) Hallar k para que f(x) sea función de densidad. Representarla
b) Hallar la función de distribución. Representarla
c) Media, varianza y desviación típica
d) P(X 1)
e) Probabilidad de acertar en la diana
Solución.
L
10 10
1
1 = ∫ kdx = k ∫ dx = 10[x]10
0 = 10k → k =
10
0 0
1
0 < x < 10
En consecuencia, f(x) = {10
0 en otros casos
x
b) La función de distribución se define: F(x) = ∫−∞ f(t)dt
x
x<0 F(x) = ∫ f(t)dt = 0
−∞
x 0 x x
1 𝑥
x ≤ x ≤ 10 F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt = ∫ dt =
−∞ −∞ 0 0 10 10
144
Lic. Isidro W. Nina Paco
x 0 10 x 10
1
x > 10 F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt + ∫ f(t)dt = ∫ dt = 1
−∞ −∞ 0 10 0 10
En consecuencia,
0 𝑥<0
𝑥
F(x) = {10 0 ≤ 𝑥 ≤ 10
1 𝑥 > 10
c) Media
∞ 10 10 10
1 1 1 x2
∝1 = μx = E(X) = ∫ xf(x)dx = ∫ x ∗ dx = ∫ xdx = [ ] = 5𝑐𝑚
10 10 10 2 0
−∞ 0 0
100 25
σ2x =∝2 −∝12 = − 52 = 𝑐𝑚
3 3
Desviación Típica:
25
σx = √ = 2,9cm
3
EJERCICIO 18.
Gran número de fenómenos aeronáuticos tienen asociada una variable aleatoria con ley de
probabilidad:
−kx 0 < x < ∞ k>0
f(x) = {k e
0 en otros casos
145
Lic. Isidro W. Nina Paco
Se pide:
a) ¿Puede tomar k cualquier valor?
b) Para k = 0,1 representar la función de densidad, la función de distribución y su
gráfica
c) Siendo k = 0,1 hallar P(X > 10)
x
La función de distribución se define: F(x) = ∫−∞ f(t)dt
x
x<0 F(x) = ∫ f(t)dt = 0
−∞
0 x x x
−0,1t
x > 10 F(x) = ∫ f(t)dt + ∫ f(t)dt + ∫ 0,1 e dt = − ∫ −0,1 e−0,1t dt
−∞ 0 0 0
𝑥
1 1
= −[e−0,1t ]0𝑥 = − [ ] = −( − 1) = 1 − e−0,1x
e0,1t 0 e0,1x
0 x≤0
f(x) = { −0,1x
1−e x>0
f)
146
Lic. Isidro W. Nina Paco
1
P(X > 10) = 1 − P(X ≤ 10) = 1 − F(10) = 1 − (1 − e−0,1∗10 ) = e−1 =
e
g)
P(50 < X ≤ 100) = F(100) − F(50) = (1 − e−0,1∗100 ) − (1 − e−0,1∗50 ) = −𝑒 −10 + 𝑒 −5
1 1
= 5 − 10
𝑒 𝑒
EJERCICIO 19.
Una variable aleatoria continua X tiene por función de distribución:
0 x<0
x2
2 0≤x≤1
f(x) =
x2
2x − − 1 1<x≤2
2
{ 1 x>2
Se pide:
a) Hallar la función de distribución y representarla
b) Media, varianza, desviación típica y coeficiente de variación.
1 3
c) P (2 < X ≤ 2)
Solución.
a) La función de densidad es la derivada de la función de distribución en los puntos donde
exista la derivada, entonces:
0 x<0
dF(x) 0≤x≤1
f ( x) = ={ x
dx 2−x 1<x≤2
0 x>2
x 0≤x≤1
f(x) = {2 − x 1<x≤2
0 otros valores
b) Media
147
Lic. Isidro W. Nina Paco
∞ 1 2
∝1 = μx = E(X) = ∫ xf(x)dx = ∫ x ∗ x ∗ dx + ∫ x(2 − x) dx
−∞ 0 1
1 2 3 1 2
x x3
= ∫ 2
x dx + ∫ (2x − x ) dx = [ ] + [x 2 − ]
2
0 1 3 0 3 1
1 8 1
= + (4 − ) − (1 − ) = 1
3 3 3
Varianza: σ2x =∝2 −∝12
∞ 1
2
2)
∝2 = E(X = ∫ x f(x)dx = ∫ x 2 ∗ x ∗ dx + ∫ x 2 (2 − x) dx
2
1
−∞ 0
1 2 1 2
3
x4
2
2x 3 x 4
3
= ∫ x dx + ∫ (2x − x ) dx = [ ] + [ − ]
0 1 4 0 3 4 1
1 16 16 2 1 14 7
= +( − )−( − )= =
4 3 4 3 4 12 6
7 1
σ2x =∝2 −∝12 = − 12 =
6 6
Desviación Típica:
1
σx = √ = 0,41
6
Coeficiente variación:
σx 0,41
CV𝑥 = = = 0,41
μx 1
c)
2 2
1 3 3 1 3 (3⁄2) (1⁄2) 9 1
P ( < X ≤ ) = F ( ) − F ( ) = (2 − − 1) − ( )= 3− −1−
2 2 2 2 2 2 2 8 8
3
= = 0,75
4
EJERCICIO 20.
La función de densidad de una variable aleatoria es:
2 0<x<2 1
f(x) = {ax + b sabiendo que P [ < x < 1] = 0,1666
0 en el resto 2
Determinar a y b
148
Lic. Isidro W. Nina Paco
Solución.
Hay que calcular dos parámetros (a y b), por lo que se necesitan dos ecuaciones:
EJERCICIO 21.
Dada la función f(x) = e−2x
a) Comprobar si puede ser función de densidad de una variable aleatoria X cuando su campo
de variación es el intervalo x 0
b) En caso de que no lo pueda ser, qué modificaciones habría que introducir para que lo fuera.
Solución.
a) Para que sea función de densidad, debe cumplir dos condiciones en el campo de variación
de la variable aleatoria:
• f(x) no puede ser negativa
• La integral de f(x) en el campo de variación es 1
f(x) = e−2x ≥ 0 → L e−2x > L 0 ⟹ −2x > −∞ ⟹ x < ∞ es positiva
∞
−2x
1 −2x ∞ 1 1
∫ e dx = [− e ] = [0 + ] = ≠ 1.
0 2 0 2 2
EJERCICIO 22.
Sea X una variable aleatoria continua con función de densidad tal que
8
( )
f x = {7x 2 1<x<8
0 otro caso
a) Calcular el primer y tercer cuartil, el decil 7 y el percentil 85
b) Calcular la mediana y moda
Solución.
a) La función de distribución:
x
8 x
8 1 x 8(x − 1)
F(x) = P[X ≤ x] = ∫ f(t)dt = ∫ 2 dt = − [ ] = 1≤x≤8
−∞ 1 7t 7 t 1 7x
Sustituyendo, queda:
1 8(Q1 − 1) 32
F(Q1 ) = = → 7Q1 = 32(Q1 − 1) → Q1 = = 1,28
4 7Q1 25
3 8(Q 3 − 1) 32
F(Q3 ) = = → 21Q 3 = 32(Q 3 − 1) → Q 3 = = 2,91
4 7Q 3 11
7 8(D7 − 1) 80
F(D7 ) = = → 49D7 = 80(D7 − 1) → D7 = = 2,58
10 7D7 31
85 8(P85 − 1) 800
F(P85 ) = = → 595P85 = 800(P85 − 1) → P85 = = 3,90
100 7P85 205
b) Me = Q 2 = D5 = P50
1 8(Me − 1) 16
F(Me ) = = → 7Me = 16(Me − 1) → Me = = 1,78
2 7Me 9
La Moda M0 se obtiene calculando el máximo de la función de densidad:
8 16
f(x) = 2
→ f ′ ( x) = 3 < 0 La función es decreciente
7x 7x
f(8) ≤ f(x) ≤ f(1), con lo que M0 = 1
150
Lic. Isidro W. Nina Paco
EJERCICIO 23.
Sea X una variable aleatoria continua, cuya función de densidad es
2
f(x) = { 3x 0<x<1
0 en otro caso
Sea Y = 1 − X2 una transformación de v.a. X
a) Calcular la función de densidad de la v.a. Y
b) Calcular la función de distribución de la v.a. Y
Solución.
a) La transformación asociada a la v.a. Y es derivable y estrictamente monótona cuando X
toma valores en el intervalo (0, 1). En consecuencia, se puede aplicar la transformación,
quedando la función de densidad:
dx −1
=
Y = 1 − X2 → x = √1 − y → { dy 2√1 − y
g −1 (y) = √1 − y
151
Lic. Isidro W. Nina Paco
EJERCICIO 24.
Sea X una variable aleatoria continua con función de densidad tal que
e−𝑥 𝑥 > 0
f(x) = {
0 en otro caso
a) Función generatriz de los momentos (f.g.m.)
b) Esperanza y varianza a partir de la f.g.m.
c) Función característica
Solución.
a)
∞ ∞
1 ∞ 1
M(t) = E[etx] = ∫ etx f(x)dx = ∫ ex(t−1)dx = [ex(t−1) ]0 = si t < 1
−∞ 0 t−1 1−t
b)
dM(t) d 1 1
∝1 = E(X) = M (1) (0) = | = [ ]| = | =1
dt t=0 dt 1 − t t=0 (1 − t)2 t=0
2) (2) ( d2 M(t) d d 1 d 1
∝2 = E(X =M 0) = | = [ ( )]| = ( )|
dt2 t=0 dt dt 1 − t t=0 dt (1 − t)2 𝑡=0
2
= | =2
(1 − t)3 t=0
152
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
Suponga que de un grupo de alumnos, se seleccionan 3 con el fin de observar, si trabajan (T)
o no trabajan (𝑇̅)
a) Enumérense los elementos del espacio muestral, con los tres alumnos seleccionados.
b) Enumérense los elementos en el suceso de que el número de alumnos que trabajan sea
cero.
c) ¿Cómo podría definir usted el suceso {𝑇𝑇𝑇̅, 𝑇𝑇̅𝑇, 𝑇̅𝑇𝑇}?
EJERCICIO 2.
¿Cuántas ordenaciones diferentes de diez letras se pueden hacer utilizando la palabra
CONVERCIÓN?
Solución:
P A o B 0,5
EJERCICIO 4.
Supongamos que se tienen dos recipientes 𝑅1 , 𝑅2 , en la primera se tienen 20 bolitas, de las
cuales 5 son azules y 15 verdes; y en la segunda son 14, distribuidas así: 4 azules y 10 verdes.
Si se elige al azar una urna y de ella se extrae una bolita, ¿Cuál es la probabilidad de que sea
azul?
Solución:
P A 0,268
EJERCICIO 5.
Un fabricante produce 1.500 unidades por semana. Cada unidad pasa por tres puestos de
inspección, antes de ser despachada a sus distribuidores. Por lo general, en el primer puesto se
rechaza el 8%; de las que fueron aceptadas, el 5% se rechazan en la segunda inspección y
finalmente en la tercera inspección el 3% aproximadamente, se rechazan.
a) ¿Cuál es la probabilidad que una unidad seleccionada al azar pase las tres inspecciones?
b) ¿Cuántas unidades pasaron a la semana?
153
Lic. Isidro W. Nina Paco
Solución:
a) La probabilidad de que una unidad pase por las tres inspecciones es del 84,78 %
b) 1.271,7 unidades aprobadas a la semana.
EJERCICIO 6.
En una clase de Estadística, todos los alumnos juegan algún deporte, el 60% juegan al futbol o
baloncesto y el 10% práctica ambos deportes. Si además hay un 60% que no juega al futbol. Si se
elige un alumno al azar, calcula las siguientes probabilidades:
Solución.
EJERCICIO 7.
La variable aleatoria: X ="número de hijos por familia de una ciudad" tiene la siguiente
distribución de probabilidad:
X 0 1 2 3 4 5 6
P(X xi ) 0,47 0,3 0,1 0,06 0,04 0,02 0,01
Se pide:
a) Media o esperanza matemática. Significado
b) Varianza y desviación típica
c) Si la Alcaldia de la ciudad paga 2000 dolares por hijo e Y = 2000*X , ¿cuál es la distribución
de probabilidad?
d) Media, varianza y desviación típica de Y
Solución.
a)
Si se toma al azar una familia de la ciudad, el número de hijos que se espera que tenga por
término medio es uno.
b) Varianza = 1,74; Desviación típica=1,32
154
Lic. Isidro W. Nina Paco
c) . Y yj P(Y yj ) pj
y1 0 0,47
y2 2.000 0,3
y3 4.000 0,1
x4 6.000 0,06
y5 8.000 0,04
y6 10.000 0,02
y7 12.000 0,01
1
EJERCICIO 8.
Al lanzar cuatro monedas se considera el número de caras obtenidas. De la variable aleatoria X
así obtenida, se pide:
a) Ley de probabilidad. Representación gráfica
b) Función de distribución. Representación gráfica
c) Esperanza matemática y varianza
d) Mediana y moda de la distribución
e) Probabilidad de obtener más de una y menos de tres caras
Solución.
a)
X xi 0 1 2 3 4
P(X xi ) 1/16 4/16 6/16 4/16 1/16
b)
X xi 0 1 2 3 4
P(X xi ) 1 /16 4 /16 6 /16 4/16 1/16
F(x) P(X x) 1 /16 5 /16 11 /16 15/16 1
c) ∝1 = μx = E(X) = 2 σ2 = Var(x) = 1
d) 𝑀0 = 2 𝑀𝑒 = 2
e) P(1<X<3) = 0,375 o bien P(1<X<3) = 6/16
155
Lic. Isidro W. Nina Paco
EJERCICIO 9.
La variable discreta X tiene como distribución de probabilidad
X 1 2 3 4
P(X xi ) 0,30 0,25 0,10 0,35
Se realiza un cambio de origen hacia la izquierda de dos unidades y un cambio de escala de 3
unidades.
Se pide:
a) Media y varianza de la X
b) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen
c) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
escala
d) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen y escala.
Solución.
a) μx = E(X) = 2,5 σ 2𝑥 = 1,55 σx = 1,245 CVx = 0,498
b) μy = E(Y) = 4,5 σ 2𝑦 = 1,55 σy = 1,245 CVy = 0,28 ≠ CVx
2,5 1,55 1
c) μy = E(Y) = σ 2𝑦 = σy = 3 √1,55 CVy = 0,498
3 9
1,55 1
d) μy = E(Y) = 1,5 σ 2𝑦 = σy = 3 √1,55 CVy = 0,28 ≠ CVx
9
EJERCICIO 10.
La variable discreta X tiene como distribución de probabilidad
1
P(X = k) = siendo k = 2,3, … , 11
10
Se pide:
a) Función de distribución
b) P(X 7)
c) P(X 5)
d) P(3 X 7)
Solución.
x−1
a) F(x) = P(X ≤ x) = siendo x = 2,3, . . . , 11
10
b) P(X > 7) = 0,4
c) P(X > 5) = 0,4
156
Lic. Isidro W. Nina Paco
0 𝑥<2
𝑥 2 −4
b) F(x) = { 2≤𝑥≤4
12
1 𝑥>4
157
Lic. Isidro W. Nina Paco
EJERCICIO 13.
Una variable aleatoria continua X tiene por función de densidad
1−𝑥 0≤𝑥<1
f ( x) = { 𝑥 − 1 1≤𝑥≤2
0 otros casos
Se pide:
a) Representa la función de densidad.
b) Hallar la función de distribución y su gráfica
1
c) P(0 ≤ x ≤ 1) P(−2 ≤ X ≤ 2) P (2 ≤ X < ∞)
Solución.
a)
b)
0 𝑥<0
𝑥2
𝑥− 0≤𝑥<1
( )
F x = 2
2
𝑥
−𝑥+1 1≤𝑥≤2
2
{ 1 𝑥>2
c)
1 1 5
P(0 ≤ x ≤ 1) = ; P(−2 ≤ X ≤ 2) = 1 ; P ( ≤ X < ∞) =
2 2 8
EJERCICIO 14.
Una variable aleatoria continua X tiene por función de distribución:
0 𝑥<1
f(x) = {𝑥 − 1 1≤𝑥<2
1 x≥2
158
Lic. Isidro W. Nina Paco
159
Lic. Isidro W. Nina Paco
Solución.
1
a) 𝑘 = 16
0 𝑥<0
𝑥 2 +4𝑥
b) F(X) = { 0≤x<4
32
1 x≥4
11
c) σ2𝑥 = 9
9
d) P(2 ≤ 𝑥 ≤ 3) = 32
EJERCICIO 17.
La demanda diaria de un determinado artículo es una variable aleatoria con función de
densidad:
1
0<𝑥≤4
8
f(x) = 12 − 𝑥
4 < x ≤ 12
64
{ 0 otro caso
Los beneficios diarios dependen de la demanda según la siguiente función:
−5 𝑠𝑖 𝑥<2
B={ 5 𝑠í 2<𝑥≤4
10 𝑠í 4<𝑥≤8
15 𝑠í 8 < 𝑥 ≤ 12
Calcular:
a) Probabilidad de que en un día cualquiera la demanda sea superior a 10
b) Probabilidad de que la demanda sea inferior a 3
c) La esperanza y la varianza de la demanda
d) Función de distribución de la demanda
e) Función de cuantía y función de distribución de la variable aleatoria beneficios diarios.
f) Esperanza y varianza de la variable beneficios
Solución.
a) P(X > 10) = 0,03125
b) P(X < 3) = 0,375
c) μ𝑥 = E(X) = 4,33 ; σ2𝑥 = 7.89
160
Lic. Isidro W. Nina Paco
d)
e)
161
Lic. Isidro W. Nina Paco
162
Lic. Isidro W. Nina Paco
TEMA 8:
DISTRIBUCIONES DE
PROBABILIDADES DISCRETAS Y
CONTINUAS
163
Lic. Isidro W. Nina Paco
164
Lic. Isidro W. Nina Paco
𝑋−𝜇 1 1
𝐸 (𝑍 ) = 𝐸 ( ) = [𝐸 (𝑋) − 𝐸 (𝜇 )] = (𝜇 − 𝜇 ) = 0
𝜎 𝜎 𝜎
𝑋−𝜇 1 1
𝑉 (𝑍 ) = 𝑉 ( ) = 𝑤 [𝑉(𝑋) − 𝑉 (𝜇 )] = 2 (𝜎 2 − 0) = 1
𝜎 𝜎 𝜎
APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL CON LA
DISTRIBUCIÓN NORMAL ESTANDAR
𝑋−𝜇 𝑋 − 𝑛𝑝
𝑍= = , 𝑐𝑢𝑎𝑛𝑑𝑜 𝑛 ⟶ ∞
𝜎 √𝑛𝑝(1 − 𝑝)
165
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Si un delantero que al patear un balón de futbol frente al arquero tiene un promedio de 0.60 de
hacer gol, llega a patear 6 veces en un juego, cuál es la probabilidad de que obtenga:
a) Exactamente dos goles b) Menos de dos goles.
Solución:
a) p 0,60 q 0,40 n 6 X 2
EJERCICIO 2.
Por regla, el 8% de facturas manuales tienen algún tipo de error en el llenado. ¿Cuál es la
probabilidad de que en un talonario de 50 facturas haya?:
a) Exactamente 10 con error b) Menos de 3 con error
c) Por lo menos 2 con error.
Solución:
n 50 p 0,08 q 0,92
b) P x2 C050 0,08 0,92 C150 0,08 0,92 C 250 0,08 0,92
0 50 1 49 2 48
EJERCICIO 3.
Los dos quintos de los votantes inscritos en ciertos barrios de Sucre apoyan al partido A.
¿Cuál es la probabilidad de que en una muestra de diez votantes de ese puesto de votación:
a) Exactamente 7 apoyen al partido A?
b) Por lo menos tres apoyen al partido A?
166
Lic. Isidro W. Nina Paco
P x 7 0,4 0,6
10
7
7 3
0,0425 4,25%
P x 7 4,25%
1 0,4
10
0
0
0,610 0,4 0,6 0,4 0,6
10
1
1 9 10
2
2 8
P x 2 1 P x 0 P x 1
x 2,3,4,5,6,7,8,9 y10
1 0,6
10
0
0
0,410 0,6 0,4
10
1
1 9
EJERCICIO 4.
Supongamos que el 12% de los estudiantes que se presentan a un examen de estadística, con
menos de tres ausencias, en el año, lo pierden. Si se seleccionan 10 estudiantes con menos de
3 ausencias, ¿Cuál es la probabilidad de que no lo pierda un número de alumnos no mayor o
igual a siete ni menor a cuatro?
Solución:
0,12 lo pierden 0,88 no lo pierden n 10
167
Lic. Isidro W. Nina Paco
P4 x6 P x 4 P x 5 P x 6
EJERCICIO 5.
Suponga que una empresa aérea, en promedio, uno de cada 100 vuelos se retrasa más de una
hora; si se programan 1.200 vuelos en un mes:
a) ¿Cuál es la probabilidad de que exactamente 5 vuelos se retrasen en una hora?
b) ¿Cuál es la probabilidad, que más de 4 vuelos se retrasen en una hora?
c) ¿Cuál es la probabilidad que menos de 3 vuelos se retrasen más de una hora?
Solución:
1
p 0,01 0,01 1.200 12 n 1.200
100
a) X 5
b) X 5, 6, 7 .......... ....1.200
120 e 12 121 e 12 122 e 12 123 e 12 124 e 12
P x5 1
0! 1! 2! 3! 4!
168
Lic. Isidro W. Nina Paco
EJERCICIO 6.
Un docente dispone en su archivo 20 preguntas sobre un tema específico de la materia; 8 de
ellas son de teoría. Si desea preparar un cuestionario de 10 preguntas:
a) ¿Cuál es la probabilidad de que 3 de las preguntas sean de teoría?
b) ¿Qué cinco no sean de teoría?
Solución:
a) N 20 A8 n 10 X 3
P x 3
0,24
8
3
20 8
10 3
P x3 15,00%
20
24,00%
10
b) N 20 A 12 n 10 X 5
P x 5
0,2400 24,00%
12 2012
105
5
20 P x 5 24,00 %
10
EJERCICIO 7.
Si la media y la desviación estándar de una distribución normal: 𝜇 = 35.7 y 𝜎 = 2.8 cm.
Obtener los valores de Z (redondear en dos decimales las respuestas):
a) x=38,7 cm. b) x=31,5 cm. c) x=53,9 cm. d) x=29,6 cm
Solución:
Fórmula aplicable en estos problemas. Determinar los valores de Z
X
Z 35,7 2,8
38,7 35,7
a) Z 1,07
2,8
Z = 1,07
Z 1,07
169
Lic. Isidro W. Nina Paco
31,5 35,7
b) Z 1,50
2,8
Z = – 1,50
53,9 35,7
c) Z 6,50
2,8
Z = 6,50
29,6 35,7
d) Z 2,18
2,8
Z = – 2,18
EJERCICIO 8.
Tres estudiantes presentan varios exámenes. A obtiene un puntaje de 72, B uno de 85 y C de
17. Todos los estudiantes que presentaron el examen A, obtuvieron un promedio de 85, los
que presentaron B, de 90 y los de C promediaron 25. Las respectivas desviaciones estándar
fueron 7; 3 y 7. Disponga a los estudiantes en orden de capacidad, juzgada por estos
resultados.
Solución:
X 1 72 1 85 1 7
X 2 85 2 90 2 3
X 3 17 3 25 3 7
X
Z
170
Lic. Isidro W. Nina Paco
72 85 13
Z1 1,85
7 7
85 90 5
Z2 1,66
3 3
17 25 8
Z3 1,14
7 7
Z 3 Z 2 Z1
EJERCICIO 9.
En una distribución normal que tiene una desviación estándar de 2, la probabilidad de que el
valor de una variable al azar sea mayor de 30 es de 0,05. a) Calcule la media de la
distribución; b) Obtenga el valor de la variable que es superado por el 95% de los valores.
Solución:
2 P x 30 0,05
a) ?
A 0,4500 Z 1,65
1,65 2 30
3,30 30
30 3,3 26,7
b) A 0,4500 Z 1,65
1,65 2 X 26 ,7
3,30 X 26,7
X 23,4
EJERCICIO 10.
La duración de las pilas Panasonic están distribuidas normalmente con una media de 80 horas
y una varianza de 100 horas. El fabricante garantiza que reemplazará cualquier pila que falle
antes de cumplirse la garantía.
171
Lic. Isidro W. Nina Paco
a) ¿Cuánto tiempo debe dar de garantía de modo que no más del 5% de las pilas fallen antes
de ese tiempo?
b) Si en una semana vende 500 pilas, ¿cuantas reemplazará?
Solución:
80 2 100 10
a) P x ? 0,05
A 0,4500 Z 1,65
X 63,5
EJERCICIO 11.
El gerente de producción de una fábrica de bombillas, estima que la vida útil del producto está
distribuida normalmente, con una media de 5.000 horas. Si, además, el gerente considera que
hay una probabilidad del 60% de que la bombilla dure más de 5.568 y menos de 4.432 horas.
a) ¿Cuál es la desviación típica?
b) Si en un día se producen 20.000 unidades, ¿Cuántas esperamos que tengan una duración
entre 4.500 y 5.500 horas?
Solución:
a) ?
A 0,2000 Z 0,52 y 0,52
5.568
1.092 ,31 1.092 ,31
0,52
172
Lic. Isidro W. Nina Paco
b) P4.500x 5.500 ?
4.500 5.000
Z 0,46 y 0,46
1.092 ,31
Z 0,46 A 0,1772
EJERCICIO 12.
El control de inventarios en las bibliotecas universitarias es un problema bastante complicado.
Si se piden pocos ejemplares de un determinado libro, los costos aumentan, por lo que es
necesario hacer pedidos grandes. Si se piden demasiados ejemplares, se corre el riesgo de que
el libro no se requiera como texto en el futuro, lo que dificultará su venta. Suponga que el
promedio de alumnos matriculados en estadística, en la universidad durante un semestre, tiene
una distribución normal, con media de 150 alumnos por semestre y una desviación típica de 20
estudiantes. ¿Cuántos libros de texto se deben pedir, para que la probabilidad de que se terminen
las existencias no sea mayor de 0,10?
Solución:
150 20
P x ? 10 %
A 0,4000 Z 1,28
EJERCICIO 13.
De un inventario de 48 automóviles que se embarcan a distribuidores locales, 12 tienen
instalados radios defectuosos, ¿Cuál es la probabilidad de que cierto distribuidor reciba 8
automóviles?
a) Todos con radios buenos
b) Por lo menos uno con radio defectuoso
c) Cuantos automóviles con radios defectuosos se esperan recibir
Solución:
12 0,25 radios defectuosos 0,75 radios buenos n 8
48
173
Lic. Isidro W. Nina Paco
8 8
a) P x 8 0,75 0,25 0,25 0,75 0,1001 10,01 %
8 0 0 8
8
0
8
b) P x 1 1 0,25 0,75 1 0,1001 0,8999 89,99 %
0 8
0
c) E np 48 0,25 12 autos
Solución.
La variable aleatoria Y sigue una distribución normal:
E(Y) 4E(X1 ) 5E(X2 ) 6E(X3 ) 6 4 x 0 5 x 2 6 x 4 6 8
174
Lic. Isidro W. Nina Paco
Cálculo prácticamente imposible de calcular, por el teorema central del límite se tiene:
Solución.
̅∪B
P(A ̅ ) = P(̅̅̅̅̅̅̅
A ∩ B) = 0,7 → P(A ∩ B) = 0,3
̅ ) = 0,3
a) P(A ∩ B
P(A∩B) 0,3 3
b) P(A / B) = = = = 0,75
𝑃(𝐵) 0,4 4
c) P(A ̅̅̅̅̅̅̅
̅ ∩ B) = 0,1 → P(A
̅ ∩ B) = 0,9
EJERCICIO 17.
Dada una variable aleatoria X que se distribuye como una B(30; 0,2) y otra variable aleatoria
Y que se distribuye como una B(150; 0,3) .
a) ¿Si X e Y son independientes, se puede afirmar que la variable X+Y se distribuye como una
B(180; 0,5)? Justifica tu respuesta.
b) ¿Se puede afirmar que por el teorema de Moivre la variable Y tiende a una normal? Si fuera
así, ¿qué parámetros tiene esa distribución normal?
Solución.
a) No se distribuye como una B(180; 0,5) , para aplicar la propiedad reproductiva tienen
que tener la misma probabilidad p.
b) Según el TCL Y~N (150 ∗ 0,3 , √150 ∗ 0,3 ∗ 0,7) ≡ N(4,5 , 5,61)
EJERCICIO 18.
La probabilidad de que un paciente mejore tras administrarle un medicamento es de 0,82.
a) Se suministra de manera independiente el medicamento a 10 pacientes en la Clínica Salud.
175
Lic. Isidro W. Nina Paco
¿Qué modelo de distribución de probabilidad sigue la variable número total de pacientes que
mejoran en dicha clínica?
b) Si cada una de las 50 clínicas de una provincia realizan el mismo experimento de manera
independiente, ¿Qué modelo de distribución de probabilidad sigue la variable número total de
pacientes que mejoran en dicha provincia? ¿Cuál es la probabilidad de que al menos 400
pacientes mejoren en esa provincia?
Solución.
a) X=”Mejoraría con el medicamento en una Clínica” X~B(n, p) ≡ B(10, 0,82)
b) Y=”Mejoraría con el medicamento en las 50 clínicas” Y = X1 + X2 + ⋯ + X50 = ∑50
i=1 X i
50
Y~B (∑ Xi , 0,82) ≡ B(500, 0,82)~N (500 ∗ 0,82 , √500 ∗ 0,82 ∗ 0,18) ≡ N(410, 8,59)
i=1
176
Lic. Isidro W. Nina Paco
X−0 σ−0
P[|X| ≥ σ] = P [| |≥ ] = P[|z| ≥ 1] = P[(z ≤ −1) ∪ (z ≥ 1)]
σ σ
= P(z ≤ −1) + P(z ≥ 1) = P(z ≥ 1) + P(z ≥ 1) = 2P(z ≥ 1) = 2 ∗ 0,1587
= 0,3174
1
b) Sea la variable aleatoria Y = X1 + X2 + ⋯ + X10 → y̅ = 10 ∑10
i=1 X i
10 10
1 1 1
𝐸 (y̅) = 𝐸 ( ∑ Xi ) = 𝐸 [∑ Xi ] = 10𝜇 = 𝜇 = 0
10 10 10
i=1 i=1
10 10
1 1 1 𝜎2
𝜎y̅2 ( )
= 𝑉𝑎𝑟 y̅ = 𝑉𝑎𝑟 [ ∑ Xi ] = 𝑉𝑎𝑟 [∑ Xi ] = 2
10𝜎 =
10 100 100 10
i=1 i=1
𝜎
y̅~𝑁 [0, ]
√10
EJERCICIO 21.
El número de millones de metros cúbicos que tiene un embalse sigue una distribución normal
N(980, 50) . El consumo diario de las poblaciones que sirve es una normal N(85, 30) . Si se
sabe que durante una tormenta la cantidad de agua que se embolsa es una normal N(50, 25) .
Un día han caído dos tormentas, calcular la probabilidad de que al final del día el agua
embalsada sea menor o igual que 980 metros cúbicos.
Solución.
Agua del embalse: X1 ~N(μ1 , σ1 ) ≡ N(980, 50)
Consumo diario: X2 ~N(μ2 , σ2 ) ≡ N(85, 30)
𝐴𝑔𝑢𝑎 𝑢𝑛𝑎 𝑡𝑜𝑟𝑚𝑒𝑛𝑡𝑎: X3 ~N(μ3 , σ3 ) ≡ N(50, 25)
{ 𝐸 (2X3 ) = 2𝐸 [X3 ] = 2 ∗ 50 = 100
𝐴𝑔𝑢𝑎 𝑑𝑜𝑠 𝑡𝑜𝑟𝑚𝑒𝑛𝑡𝑎𝑠: {
𝑉𝑎𝑟(2X3 ) = 4𝑉𝑎𝑟[X3 ] = 4 ∗ 252
2 2
3 3
177
Lic. Isidro W. Nina Paco
178
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
En la facultad, la probabilidad de que un alumno apruebe el año es del 85%. Si consideramos
10 alumnos, ¿Cuál es la probabilidad de que:
a) Cuatro aprueben? b) Tres reprueben? c) Por lo menos tres reprueben?
d) Como máximo 7 aprueben? e) seis reprueben el año?
Solución:
d) P x 7 17 ,99 % e) P x 6 0,124%
EJERCICIO 2.
Se sabe que el 65% de los alumnos de una universidad asisten a clases el día viernes; en una
encuesta a ocho alumnos de la universidad, ¿Cuál es la probabilidad de que?:
a) Por lo menos 5 asistan a clase el día viernes
b) Por lo menos 7 no asistan a clases el día viernes.
Solución:
EJERCICIO 3.
Las estadísticas sobre la aplicación de normas de seguridad en una fábrica indican que, en
promedio, se presentan 12 accidentes cada semestre. Utilice la distribución de Poisson para
determinar la probabilidad de que no hay más de 3 accidentes de trabajo en un trimestre.
Solución:
P x 4 23,81%
EJERCICIO 4.
Si la vida media de cierta marca de batería es de 30 meses, con una desviación estándar de 6
meses, ¿Qué porcentaje de estas baterías puede esperarse que tengan una duración de 24 a 36
meses? Se supone que su duración sigue una distribución normal.
Solución:
179
Lic. Isidro W. Nina Paco
EJERCICIO 5.
Si en general el 25% de los pacientes afectados por una enfermedad mueren de ella. ¿Cuál es
la probabilidad de que, en un grupo de 50, mueran 6?
Solución:
EJERCICIO 6.
Una cuarta parte de los documentos archivados diariamente por un empleado de un
departamento de ventas se hace equivocadamente. Si en un día se archivan 100 documentos,
¿Cuál es la probabilidad de que?:
a) Por lo menos 18 documentos estén mal archivados
b) Exactamente 16 documentos estén mal archivados.
c) Exactamente 86 documentos estén correctamente archivados
Solución:
EJERCICIO 7.
La vida útil de cierto producto está distribuida normalmente. Si el 17,68% de ellas duran más
de 540 horas y el 69,83% duran menos de las 486 horas,
a) ¿Cuál es la media y desviación estándar?
b) Si son reemplazadas aquellas unidades con una vida inferior de 450 horas, ¿Cuántas se
reemplazarán si se han venido 20.000?
Solución:
a) 131,71 417 ,51
b) 11.974 unidades
EJERCICIO 8.
En la universidad el departamento de contabilidad y matemáticas está conformado por 40
docentes, 12 de los cuales son de planta. El decano selecciona al azar 5 docentes del
departamento para revisar el plan de estudios. ¿Cuál es la probabilidad de que?:
180
Lic. Isidro W. Nina Paco
a) P x 5 0,24%
b) P x 5 16,81% ´
c) P x 2 47,17%
EJERCICIO 9.
La probabilidad de que un banco reciba un cheque sin fondos es 0.01
a) Si en una hora reciben 20 cheques, ¿Cuál es la probabilidad de que tenga algún cheque sin
fondos?
b) El banco dispone de 12 sucursales en la ciudad. ¿Cuál es la probabilidad de que al menos
cuatro sucursales reciban algún cheque sin fondos?
c) La media del valor de los cheques sin fondos es de 600 dólares. Sabiendo que el banco
trabaja 6 horas diarias, ¿Qué cantidad no se espera pagar?
d) si se computasen los 500 primeros cheques, ¿Cuál es la probabilidad de recibir entre 3 y 6
(inclusive) cheques sin fondos?
Solución.
a) 0.182 b) 0.16 c) 120 d) 0.6375
EJERCICIO 10.
La variación porcentual del PIB de 2017, con respecto al año anterior, es una variable aleatoria
normal 𝑁(2, 0,5). ¿Entre qué limites oscilará la variación del PIB con probabilidad 0,95?
Solución.
x
P(2 − x < PIB < 2 + x) = 0,95 → = 1,96 ⟹ x = 0,98
0,5
En consecuencia, P(1,02 < PIB < 2,98) = 0,95. El PIB oscilará entre 1,02 y 2,98
EJERCICIO 11.
El peso (en gramos) de unas cajas es una variable aleatoria X, con distribución normal, cuya
desviación típica es igual a 12 gramos. Se extraen muestras aleatorias simples de tamaño 100
cajas. ¿Cuál es la probabilidad de que el peso medio de las cajas supere el peso medio real en
al menos 300 miligramos?
181
Lic. Isidro W. Nina Paco
Solución.
Se pide calcular P(x̅ ≥ μ + 0,3) → P(x̅ − μ ≥ 0,3) = 0,4013
EJERCICIO 12.
El peso de un paquete de cigarrillos se distribuye según una N(80, 4) . Se dispone de dos lotes
de 100 paquetes cada uno de ellos. ¿Cuál será la probabilidad de que el peso del primer lote
supere en más de 40 gramos al peso del segundo lote?
Solución.
P(x̅ − y̅ > 0,4) = 0,2389
EJERCICIO 13.
Sea X una variable aleatoria que sigue una distribución 𝜒 2con 200 grados de libertad.
Calcular: (a) P(X ≤ 234) y (b) P(X ≤ 183) sin recurrir a las tablas de la Chi‐cuadrado.
Solución.
(a) P(X ≤ 234) = 0,9554 (b) P(X ≤ 183) = 0,1977
EJERCICIO 14.
Se ha realizado una muestra aleatoria simple (m.a.s) de tamaño 10 de una población considerada
normal, llegando a la conclusión que la varianza muestral es 4. Calcular la probabilidad
P[|x̅ − μ| ≤ 1,22]
Solución.
P[|x̅ − μ| ≤ 1,22] = 0,9
EJERCICIO 15.
̅ ) en cada caso:
Sean A y B dos sucesos tales que P(A) = 0,6. Calcular P(A ∩ B
a) A y B mutuamente excluyentes
b) A está contenido en B
c) B está contenido en A y P(B) = 0,3
d) P(A ∩ B) = 0,1
Solución.
̅ ) = 0,6
a) P(A ∩ B b) A ⊂ B = 0
c) B ⊂ A = 0,3 ̅ ) = 0,5
d) P(A ∩ B
182
Lic. Isidro W. Nina Paco
EJERCICIO 16.
Las variables aleatorias en estudio son independientes.
Sean: X1 ~N(10 , 2), X2 ~N(15 , 2) y X3 ~N(20 , 2) donde Y = 5X1 + 4X2 − 3X3 y
X1 − 10 2 X2 − 15 2 X3 − 20 2
U=( ) +( ) +( )
2 2 2
Calcular:
a) P[20 ≤ Y ≤ 30] b) P[U ≤ 11]
Solución.
a) P[20 ≤ Y ≤ 30] = 0,0623 b) P[U ≤ 11] = 0,95
EJERCICIO 17.
En una población de mujeres, las puntuaciones de un test de ansiedad‐riesgo siguen una
distribución normal N(25 , 10) . Al clasificar la población en cuatro grupos de igual tamaño,
¿cuales serán las puntuaciones que delimiten estos grupos?
Solución.
Las puntuaciones que delimitan estos cuatro grupos serán el primer Q1 , segundo Q 2 y tercer
cuartil Q 3 de la distribución. En la distribución normal la media y la mediana son iguales: 𝜇 =
Me = Q 2 = 25. Por consiguiente, el primer grupo serían las mujeres con puntuaciones
inferiores o iguales a 18,3. El segundo grupos son aquellas mujeres con puntuaciones entre 18,3
y 25. El tercer grupo son las mujeres con puntuaciones entre 25 y 31,7. El cuarto grupo son
mujeres que tengan puntuaciones superiores a 31,7.
EJERCICIO 18.
Un dispositivo está formado por muchos elementos que trabajaban independientemente, siendo
la probabilidad de fallo durante la primera hora de trabajo muy pequeña e iguales en todos los
elementos. Si la probabilidad de que en ese tiempo falle por lo menos un elemento es 0,98.
a) Hallar la media y desviación típica del número de elementos que fallen en la primera hora.
b) Calcular la probabilidad de que fallen a lo sumo dos elementos en ese tiempo
Solución.
a) Habiendo muchos elementos independientes, el tamaño (n) es muy grande, con una
probabilidad de fallo muy pequeña, condiciones para que el dispositivo siga una
distribución de Poisson.
Sea la variable aleatoria X = "fallo en la primera hora de un elemento", X~P(λ) donde:
183
Lic. Isidro W. Nina Paco
λk −λ
P(X = k) = e
k!
P(X ≥ 1) = 0,98 → 𝑃 (𝑋 < 1) = 𝑃(𝑋 = 0) = 0,02
184
TEMA 9:
TEORIA ELEMENTAL DEL
MUESTREO
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛 𝑷(−𝒛𝛼 ≤ 𝒁 ≤ 𝒛𝛼 ) = 1 – 𝛼
2 2
ESTIMACIÓN POR INTERVALO
−𝒛𝛼 ≤ 𝒁 ≤ 𝒛𝛼
𝑳𝒊 ≤ 𝜽 ≤ 𝑳𝒔 2 2
𝑠𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
ESTIMADOR INSESGADO
𝑛 𝑛 𝑛 | 𝒁 | ≤ 𝒛𝛼
1 1 1 1 2
𝐸 (𝑋̅) = 𝐸 [ ∑ 𝑋𝑖 ] = [∑𝐸[𝑋𝑖 ]] = [∑ 𝜇 ] = 𝑛𝜇 = 𝜇 𝑠𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1
𝑋̅ − 𝜇
ESTIMADOR CONSISTENTE 𝒁=
𝜎 ⁄√𝑛
𝜎2 𝜎2 𝑡𝑖𝑒𝑛𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑑𝑒𝑙 𝐿𝑖𝑚𝑖𝑡𝑒 𝐶𝑒𝑛𝑡𝑟𝑎𝑙
𝑉(𝑋̅ ) = ⟹ lim = 0 ⟹ 𝑋̅ ⟶ 𝜇
𝑛 𝑛→∞ 𝑛
SESGO DE UN ESTIMADOR 𝜎
|𝑋̅ − 𝜇 | ≤ 𝒛𝛼 𝑐𝑜𝑛 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
𝑩 = 𝑬(𝜀) – 𝜃
2 √𝑛
185
Lic. Isidro W. Nina Paco
𝑒𝑠 𝑒𝑙 𝑚á𝑥𝑖𝑚𝑜 𝑒𝑟𝑟𝑜𝑟 𝑒𝑛 𝑙𝑎
𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼
𝑍𝛼2 𝑝̂ (1 − 𝑝̂ )
𝑛=
𝐸2
𝜎
𝜇 ≤ 𝑋̅ + 𝑍𝛼 , intervalo de confianza unilateral inferior
√𝑛
𝜎
𝜇 ≥ 𝑋̅ − 𝑍𝛼 , Intervalo de confianza unilateral superior
√𝑛
186
Lic. Isidro W. Nina Paco
̅−𝝁
𝑿
𝑻 = , 𝑐𝑜𝑛 𝜈 = 𝒏 – 𝟏 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝒔/√𝒏
𝑷(−𝒕𝛼⁄2 ≤ 𝑻 ≤ 𝒕𝛼⁄2) = 1 − 𝛼
𝑷(−𝒕𝛼⁄2 ≤ 𝑻 ≤ 𝒕𝛼⁄2 ) = 1 − 𝛼
𝒔 𝒔
̅ − 𝒕𝛼 ⁄ 2
𝑿 ̅ + 𝒕𝛼⁄2
≤𝜇≤𝑿
√𝒏 √𝒏
𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼
187
Lic. Isidro W. Nina Paco
EJERCICIOS RESUELTOS
EJERCICIO 1.
Las estaturas de los estudiantes de una universidad, se distribuyen normalmente con media de
167 centímetros y deviación típica de 15 centímetros. Si se toma una muestra de 70
estudiantes, ¿Cuál es la probabilidad de que tengan una estatura superior a 170 centímetros?
Solución:
167 15 n 70 P x 170 ?
170 167 3
Z 1,67
15 1,7928
70
Z 1,67 A 0,9525
EJERCICIO 2.
Un analista financiero selecciona una muestra aleatoria del 8% de 500 cuentas. La media y la
desviación típica, de los saldos encontrados en las 500 cuentas son: Bs. 417.500 y Bs. 17.000
respectivamente. ¿Cuál es la probabilidad de que con dicha muestra se obtenga una media
superior a Bs. 420.000?
Solución:
420.000 417.500
Z 0,93 A 0,8238
17.000
40
P 1 0,8238 0,1762
P x 420.000 17,62 %
EJERCICIO 3.
188
Lic. Isidro W. Nina Paco
Un fabricante de desodorantes recibe cada semana lotes de 10.000 válvulas para los tarros
rociadores. Para aceptar o rechazar dichos lotes, selecciona al azar 400 válvulas de cada lote;
si el 2% o más resultan defectuosos, se rechaza el lote. En caso contrario se acepta el lote.
¿Cuál es la probabilidad de rechazar un lote que contenga el 1% de válvulas defectuosas?
Solución:
p P 0,02 0,01
Z 2,01
PQ 0,01 0,99
n 400
Z 2,01 A 0,9778
EJERCICIO 4.
En una elección departamental o provincial, el 52% de los electores están a favor del
candidato del partido A, ¿Cuál es la probabilidad de que, en una muestra de 100 electores, el
resultado no muestre una mayoría a favor del candidato?
Solución:
0,49 0,52
Z 0,60 A 0,2743
0,52 0,48
100
P 1 0,7257 0,2743
P p 0 , 49 27 ,43 %
EJERCICIO 5.
Cierta batería de celular tiene una vida promedio de 5.200 horas, con desviación típica de 200
horas; mientras que otra marca de batería tiene un promedio de duración de 4.800 horas, con
desviación estándar de 180 horas. Si se toman dos muestras de 100 y 75 baterías,
respectivamente, ¿Cuál es la probabilidad de que la diferencia registrada entre las dos
muestras sea superior en 350 horas?
Solución:
189
Lic. Isidro W. Nina Paco
350 400 50
Z 1,73 A 0,9582
2002 1802 28,84
100 75
350 400
Z 26,00 A 0
28,84
P 0,9582 0 0,9582
Px y 350 95,82%
EJERCICIO 6.
En dos fábricas A y B, que producen determinados artículos para hombres; se sabe que el 5 y
10% de la producción es defectuosa. Si se extrae una muestra de 200 artículos de cada lote
producido, en cada fábrica, cuál es la probabilidad de que las dos muestras revelen una
diferencia inferior al 4%
Solución:
EJERCICIO 7.
Se selecciona una muestra aleatoria simple de familias de clase media baja en un barrio de la
ciudad, con el fin de estimar el ingreso promedio mensual. El error debe estar en el rango de
Bs. 1.000, con un riesgo de 0.040. ¿De qué tamaño debe ser seleccionada la muestra, si la
desviación normal ha sido calculada en Bs. 4.000?
190
Lic. Isidro W. Nina Paco
Solución:
E 1.000 riesgo de 0,040 1 0,040 0,96 96,0% Z 1,75
4.000 n?
1,752 4.000
2
n 49 Familias de clase media de un barrio
1.0002
EJERCICIO 8.
Un encargado de marketing de una empresa quiere estimar el número promedio de los días
que un cliente hace durar una recarga de Bs. 30 de una empresa telefónica, para lo cual recaba
información de anteriores encuestas similares, con un factor de error de ±5 días y un 95% de
confiabilidad. Toma información de otras encuestas similares para calcular la desviación
típica de días de duración en s=15 días. ¿Cuál es el tamaño requerido, si se pueden llegar a
encuestar hasta 150 clientes?
Solución:
E 5 dias Z 1,645 s 15 dias N 150
n
3000 1,6452 0,50 0,50 248,21 unidades
3000 0,052 1,6452 0,50 0,50
EJERCICIO 10.
Se tiene la siguiente población de 15 valores:
x: 45 70 51 63 65 70 55 51 67 60 62 54 35 43 49
191
Lic. Isidro W. Nina Paco
X i2 N X 2 840 15 562
2
102
N 15
X i 840
X 56
N 15
n
1,6452 15 102 3,34 unidades o valores
15 82 1,6452 102
EJERCICIO 11.
Una muestra aleatoria de 150 departamentos de un área central, produce una renta mensual
promedio de Bs. 387.500. Se calculó una renta promedio de Bs. 390.000, con base en una
muestra aleatoria independiente para 120 departamentos de otra área central. Supongamos que
no hay diferencia entre las dos áreas respecto a las rentas mensuales promedio de los
departamentos. ¿Cuál es la probabilidad de observar una diferencia entre las medias
muestrales, más grande de la que se acaba de presentar, si se supone que la desviación
poblacional es de Bs. 10.000 para ambas áreas?
Solución:
Z
387.500 390.000 0 2.500
2,04
10.000 2
10.0002 1.224,74
150 120
Z 2,04 A 0,0207
P x y 2.500 2,07%
EJERCICIO 12.
Se sabe que el 12% de los estudiantes de una facultad no se presenta a exámenes finales en la
fecha programada. Si se selecciona a 25 alumnos de la facultad, ¿Cuál es la probabilidad de
que 6 o más no se hayan presentado al examen?
Solución:
192
Lic. Isidro W. Nina Paco
P 0,12 n 25 P p 0, 22 ?
0,22 0,12
Z 1,54 A 0,9382
0,1 2 0,88
25
P 1 0,9382 0,0618 6,18%
EJERCICIO 13.
Una muestra aleatoria de 100 docentes universitarios, dio los siguientes resultados:
a) 1) H 0 : 43 2) 0,05 3) s 9,95
H a: 43
4) Z 40 43 3,02
9,95 100
193
Lic. Isidro W. Nina Paco
1) H 0 : 380 2) 0,01 3) sˆ 40 4) n 1 24
H a : 380
7,5 8,10
5) Z 0,91
3,54 29
194
Lic. Isidro W. Nina Paco
xi x
2
xi 6
x 1,2 s 0,84
n 5 n 1
1) H 0 : 2 2) 0,05 3) s 0,84
Ha : 2
x 1,2 2 1,79
4) t 2,13
s 0,84 0,84
n 5
EJERCICIO 17.
Una compañía afirma que el tiempo necesario para fabricar un artículo es de 53 minutos, con
una varianza de 1,35 horas2. Se toma una muestra de 128 artículos, con un tiempo promedio
de 56 minutos.
a) Al nivel del 5% ¿se podrá afirmar que el producto requiere un tiempo mayor de fabricación
que lo afirmado por la compañía?
b) ¿si el tiempo real de fabricación es de 50 minutos, en la prueba de significación se cometió
un error de tipo I?
Solución:
a) 1) H 0 : 53 2) 0,05 3) 0,70
H a : 53
4) Z 56 53 0,48
70 128
Al nivel del 5%, no se puede afirmar que el producto requiere de un tiempo mayor de
fabricación. Observar que Z = 0,48 cae en la ZA, con lo cual aceptamos H 0 . Unilateral
derecha.
195
Lic. Isidro W. Nina Paco
EJERCICIO 18.
Se desea dar una estimación por intervalos a un 95% de confianza para la proporción de
alumnos que están a favor de aumentar en número máximo de convocatorias permitidas por la
normativa de permanencia. ¿Qué tamaño de muestra habría que considerar si se desea un
intervalo con una amplitud de 0,06? Suponga que p = q = 1/2
Solución.
p̂q̂ 1
A = 2z∝/2 √ , z∝/2 = z0,025 = 1,96 → 0,06 = 2 ∗ 1,96 ∗ √
n 4n
0,06 1 1 1
=√ → 0,0153 = √ → 0,000234 = → n = 1068
2 ∗ 1,96 4n 4n 4n
196
Lic. Isidro W. Nina Paco
EJERCICIOS PROPUESTOS
EJERCICIO 1.
El valor promedio de los pedidos que hacen los detallistas de una ciudad a cierto mayorista es
de Bs. 25.900 diarios, con desviación estándar de Bs. 1.800. Si elegimos al azar una muestra
de 200 pedidos, ¿Cuál es la probabilidad de que la media del valor de los pedidos sea superior
a Bs. 26.100?
Solución:
P x 26.100 5,82 %
EJERCICIO 2.
Se sabe que el 7% de los niños que nacen en cierta región, mueren antes de alcanzar un año de
vida por contaminación. Si durante un cierto periodo de tiempo nacieron 40 niños, ¿Cuál es la
probabilidad de que 5 o más de ellos mueran antes de alcanzar el primer año de vida?
Solución:
5
P 0,07 n 40 p 0,125 P p 0,125 ?
40
0,125 0,07
Z 1,36 A 0,9131
0,07 0,93
40
P 1 0,9131 0,0869 P p 0 ,125 8,69%
EJERCICIO 3.
En promedio, los estudiantes de la Universidad A, se retrasan 25 minutos en llegar a la U, con
una desviación estándar de 7 minutos. Los estudiantes de la Universidad B se retrasan 30
minutos en llegar a la U, con una desviación estándar de 9 minutos. Un grupo de 25
estudiantes de la Universidad A y un grupo de 20 alumnos de la B. Se dirigen a sus
respectivas universidades. Encontrar la probabilidad de que la hora media de retraso del grupo
de la Universidad B sea menor que la del grupo de la Universidad A.
Solución:
P x y 0 2,07%
EJERCICIO 4.
Determinar el tamaño máximo de una muestra de proporciones siendo la población de 3.000
amas de casa, con un error estándar de ± 3 % y un nivel de confianza del 99%
Solución:
197
Lic. Isidro W. Nina Paco
EJERCICIO 5.
Un investigador asegura que el salario promedio de los obreros, en cierto sector industrial, es
de $us. 750 y sus edades oscilan entre los 18 y los 40 años, además sus gastos en alimentación
deben encontrarse entre los 40% y 60%. Se desea estimar el salario promedio, (suponiendo
para ello una desviación típica de $us. 40) y el porcentaje de los gastos en alimentos.
Considere un error del 4% para el promedio y un 8% para la proporción, además una
confianza del 99% y un total de 1.000 obreros, para calcular el tamaño de la muestra.
Solución:
a) n 11,69 obreros
b) n 199,75 obreros
EJERCICIO 6.
Los salarios diarios en un sector de la industria están distribuidos normalmente con una media
de Bs. 4.640 y una desviación estándar de Bs. 500. Si una empresa del sector, que cuenta con
50 obreros, paga, en promedio, Bs. 4.440, ¿puede decirse que esta compañía paga salarios
inferiores, al nivel de significación del 1%?
Solución:
Z 2,82
Se ubica en la región de rechazo, por lo tanto, se puede acusar a la compañía de pagar salarios
inferiores, al nivel del 1%.
EJERCICIO 7.
Doscientos estudiantes, elegidos aleatoriamente, se someten a un “test” de rendimiento,
obteniéndose los siguientes resultados: 𝑥̅ = 70 𝑦 𝑠 = 16, con base en esta información
docimar la hipótesis 𝜇 = 68 frente a la alternativa 𝜇 ≠ 68, al nivel de significación del 1%
Solución:
Z 1,76
EJERCICIO 8.
Una muestra aleatoria simple de tamaño 12 de una población, presentó los siguientes
resultados:
128 158 174 201 193 160 172 120 125 136 184 192
198
Lic. Isidro W. Nina Paco
¿Proporcionan estos datos, evidencia suficiente para poder concluir que la media poblacional
es superior a 160? (nivel 1%)
Solución:
t 0,23
Estos datos no nos permiten concluir que la media poblacional sea superior a 160, al nivel del
1%. Unilateral derecha.
EJERCICIO 9.
Un investigador asegura que el gasto promedio semanal de las familias de una determinada
región en alimentación es de Bs. 81.000. Con base en los siguientes resultados para la variable
X (Gastos semanales)
𝑥̅ = 80.600 𝑠 = 1.100 𝑛 = 100
¿Con el nivel de significación del 5%, se puede aceptar lo que dice el investigador?
Solución:
Z 3,64
Se rechaza la hipótesis de que 81 .000 , es decir, que no podemos aceptar lo que dice el
investigador, al nivel del 5%.
EJERCICIO 10.
Una muestra de 200 artículos producidos por una máquina que debe tener como
especificación un diámetro de 3,6 cm, revela un diámetro promedio de 3,62 cm, con
desviación estándar de 0,21 cm. ¿Podría afirmarse que el anterior resultado se ajusta a las
especificaciones de producción?
Solución:
n 200 3,6 x 3,62
x
4) Z 1,35
s n
Z = 1,35 se ubica en la zona de aceptación, por lo tanto se puede afirmar que el resultado de la
muestra se ajusta a las especificaciones de producción, al nivel del 5%.
199
Lic. Isidro W. Nina Paco
EJERCICIO 11.
Los errores que se cometen al estimar el ahorro familiar de un país siguen una distribución
ne−2
normal de media 0 y desviación σe . Comprobar que la función sigue una distribución Chi‐
σ2e
cuadrado, sabiendo que el tamaño muestral es n y el error medio muestral es e̅ .
Solución.
Si X1 , X 2 , ⋯ , Xn son n variables aleatorias independientes N(0, 1), la variable Chi‐cuadrado
de Pearson con n grados de libertad es 𝜒𝑛2 = X12 + X22 + ⋯ + X2n
La variable aleatoria E=”errores al estimar el ahorro familiar” sigue una N(0, σe )
σe
La media muestral de los errores e̅~N (0, ) con lo que la variable tipificada:
√n
2
e̅ − 0 e̅
z= ~N(0 , 1) → z = (2
) = 𝜒12
σe /√n σe /√n
200
Lic. Isidro W. Nina Paco
BIBLIOGRAFIA.
- Chungara Erick Eduardo (2009) ESTADÍSTICA Y PROBABILIDADES, La paz- Bolivia.
- De la Fuente Fernández Santiago, ESTADISTICA DESCRIPTIVA (NUMEROS INDICE) UNIVERSIDAD
AUTÓNOMA DE MADRID
- Kazmier Leonard (2006) ESTADISTICA APLICADA A ADMINISTRACIÓN Y ECONOMIA 4TA
EDICIÓN, México.
- Martínez Ciro (2008) ESTADÍSTICA Y MUESTREO 12DA EDICIÓN, Colombia.
- Moya Rufino (1991) ESTADISTICA DESCRIPTIVA 2DA EDICIÓN, Perú.
- Nuñes del Prado A. (1992) ESTADISTICA BÁSICA PARA PLANIFICACIÓN CON UNA PARTE NUEVA
SOBRE MUESTREO 16TA EDICIÓN, México
- Rodríguez Ojeda Luis (2007) PROBABILIDAD Y ESTADISTICA BÁSICA PARA INGENIEROS, Ecuador
- Spiegel Murray (1991) ESTADISTICA 2DA EDICIÓN, España.
- Taylor Kinnear (1998) INVESTIGACIÓN DE MERCADOS 5TA EDICIÓN, México, Ed McGraw Hill.
- Yamane taro (1980) ESTADISTICA 3RA EDICIÓN, México, Ed. Harla S.A. de CV-1980.
- Rengel Arancibia Grissel Infrid (2013) CONCEPTOS Y APLICACIONES DE ESTADISTICA
DESCRIPTIVA,Sucre-Bolivia, Imprenta-Editorial “Tupac Katari”
201
Lic. Isidro W. Nina Paco
202