Está en la página 1de 224

Lic. Isidro W.

Nina Paco

UNIVERSIDAD MAYOR REAL Y PONTIFICIA DE


SAN FRANCISCO XAVIER DE CHUQUISACA
FACULTAD DE CONTADURIA PÚBLICA Y
CIENCIAS FINANCIERAS

CARRERA DE CONTADURÍA PÚBLICA Y


ADMINISTRACIÓN FINANCIERA

TEXTO: EJERCICIOS RESUELTOS Y PROPUESTOS


DE ESTADISTICA Y PROBABILIDAD
ELABORADO POR:
DOCENTE: Lic. I. Wilfredo Nina Paco

Sucre – Bolivia
2022
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

INDICE
Tema 1: CONCEPTOS GENERALES Y REPRESENTACIONES GRAFICAS ................................................... 1
FORMULARIO 1. ................................................................................................................................. 1
EJERCICIOS RESUELTOS. ..................................................................................................................... 2
EJERCICIOS PROPUESTOS ................................................................................................................. 13
TEMA 2: MEDIDAS DE POSICIÓN ......................................................................................................... 23
FORMULARIO 2 ................................................................................................................................ 23
EJERCICIOS RESUELTOS .................................................................................................................... 25
EJERCICIOS PROPUESTOS ................................................................................................................. 33
TEMA 3: MEDIDAS DE DISPERSIÓN ..................................................................................................... 39
FORMULARIO 3 ................................................................................................................................ 39
EJERCICIOS RESUELTOS .................................................................................................................... 41
EJERCICIOS PROPUESTOS ................................................................................................................. 49
TEMA 4: MEDIDAS DE FORMA Y MOMENTOS .................................................................................... 55
FORMULARIO 4 ................................................................................................................................ 55
EJERCICIOS RESUELTOS .................................................................................................................... 56
EJERCICIOS PROPUESTOS ................................................................................................................. 65
TEMA 5: NÚMEROS INDICE ................................................................................................................. 71
FORMULARIO 5 ................................................................................................................................ 71
EJERCICIOS RESUELTOS .................................................................................................................... 73
EJERCICIOS PROPUESTOS ................................................................................................................. 84
TEMA 6: DISTRIBUCIONES BIDIMENSIONALES (parte 1) ..................................................................... 87
FORMULARIO ................................................................................................................................... 87
EJERCICIOS RESUELTOS (parte 1)...................................................................................................... 92
EJERCICIOS PROPUESTOS (parte 1) ................................................................................................ 103
TEMA 6: REGRESION Y CORRELACIÓN (parte 2) ............................................................................... 109
FORMULARIO ................................................................................................................................. 109
EJERCICIOS RESUELTOS (parte 2).................................................................................................... 111
EJERCICIOS PROPUESTOS ............................................................................................................... 131
TEMA 7: ANALISIS COMBINATORIO Y PROBABILIDADES.................................................................. 135
FORMULARIO 7 .............................................................................................................................. 135
EJERCICIOS RESUELTOS .................................................................................................................. 137

i
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS ............................................................................................................... 153


TEMA 8: DISTRIBUCIONES DE PROBABILIDADES DISCRETAS Y CONTINUAS .................................... 163
FORMULARIO 8 .............................................................................................................................. 163
EJERCICIOS RESUELTOS .................................................................................................................. 166
EJERCICIOS PROPUESTOS ............................................................................................................... 179
TEMA 9: TEORIA ELEMENTAL DEL MUESTREO .................................................................................. 185
FORMULARIO 9 .............................................................................................................................. 185
EJERCICIOS RESUELTOS .................................................................................................................. 188
EJERCICIOS PROPUESTOS ............................................................................................................... 197
BIBLIOGRAFIA. ................................................................................................................................... 201

ii
Lic. Isidro W. Nina Paco

Tema 1:
CONCEPTOS GENERALES Y
REPRESENTACIONES GRAFICAS

“Hemos aprendido a volar como los pájaros, a


nadar como los peces; pero no hemos aprendido el
sencillo arte de vivir como hermanos.” (Martin
Luther King)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

Tema 1: CONCEPTOS GENERALES Y REPRESENTACIONES GRAFICAS


FORMULARIO 1.
PARA LA CONSTRUIR UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
𝑅 = 𝑟𝑎𝑛𝑔𝑜 = 𝑋𝑀á𝑥 -𝑋𝑚𝑖𝑛
Formula de Sturges:
𝑚 = 𝑛𝑟𝑜. 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = 1 + 3,3𝐿𝑜𝑔 𝑛
𝑅
𝑐 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =
𝑚


𝑥𝑖−1 + 𝑥𝑖′ 𝐿𝑖𝑛𝑓 + 𝐿𝑠𝑢𝑝
𝑋𝑖 = 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = =
2 2
𝑛 = 𝒇1+𝒇2 +…+𝒇m
𝒉i : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎
𝑭i : 𝑓𝑟𝑒𝑐. 𝑎𝑏𝑠. 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 <
𝒇i
𝒉i = , 0 < 𝒉i < 1
𝑭i =𝒇1 +𝒇2 +…+𝒇i 𝑛
𝑚
𝑭1 =𝒇1 , 𝐹𝑚 = 𝑛 ∑ ℎ𝑖 = 1
𝑖=1

𝑯i : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 <


𝑯i =𝒉1 +𝒉2 +…+𝒉i
𝑯1 =𝒉1 , 𝐻𝑚 = 1

𝐹𝑖∗ : 𝑓𝑟𝑒𝑐. 𝑎𝑏𝑠. 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 >

𝐹𝑖∗ =𝒇i +𝒇i+1 +…+𝒇m 𝐹1∗ =𝑛, 𝐹𝑚∗ = 𝑓𝑛

𝑭i = 𝑭i−1 + 𝒇i

𝑯i =𝑯i−1 + 𝒉i

1
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS.
EJERCICIO 1.
Ilustra con ejemplos lo que se entiende por población, población finita, población infinita,
muestra, característica, variable.
Solución:
a. Población: supongamos que nos situamos en un departamento del país: Santa Cruz y se
desea hacer una investigación sobre el consumo de un determinado artículo, la población
podría estar constituida por todas las amas de casa del departamento. También se podría
hacer investigación sobre la totalidad de empresas; sobre los vehículos de transporte,
particular o de servicio público que operan en el departamento.
b. Población finita: cuando la población está constituida por un número limitado de elementos,
por ejemplo la totalidad de trabajadores de las gobernaciones del país.
c. Población infinita: Se llama así cuando la población tiene un número grande de elementos.
d. Muestra: se investiga una parte de la población, en este caso sería extraer una muestra
aleatoria, de los trabajadores de las gobernaciones del país.
e. Características: tanto en la población como en la muestra, el ejemplo dado correspondería
al trabajador (como elemento) de las gobernaciones del país, donde las características a
estudiar son múltiples, algunas de ellas podrían ser: sexo, edad, tiempo de servicio, estado
civil, composición familiar, propietario de vivienda, salario, etc.
f. Variable: Llamamos variable estadística a una propiedad característica de la población
que estamos interesados en estudiar. Se denota por las últimas letras del alfabeto, X, Y, Z,
etc.

EJERCICIO 2.
Dar como mínimo tres ejemplos de fenómenos económicos, considerados dentro del campo
de la investigación estadística.
Solución:
Conocer la realidad de la producción de leche PIL Andina. (Todos sus productos)
Determinar los cambios que presentan la demanda, la producción, las ventas y los precios en la
fábrica de cemento FANCESA ya que estos varían en el tiempo.
Determinar la variación de precios en los principales minerales que exporta el país en los
últimos 10 años.
EJERCICIO 3.
Contestar verdadero o falso, según el caso.
1. Después de elaborar el formulario se define el objetivo de la investigación. ( )
2. Al recolectar información por medio de entrevistadores se tiene la ventaja de que estos
pueden observar el sitio de la operación que se está llevando a cabo. ( )

2
Lic. Isidro W. Nina Paco

3. Se conoce como fuente primaria aquella que obtuvo inicialmente la información


directamente de la persona o entidad. ( )
4. Al diseñar un cuestionario no es de gran importancia la forma como se hace la pregunta,
siempre que ésta sea clara. ( )
5. No hay posibilidad alguna de que en una encuesta por correo se interpreten mal las
preguntas de un cuestionario, siempre y cuando la persona que la reciba sepa leer. ( )
6. El examen de la documentación y metodología se efectúa después de tabulada la
información. ( )
Respuestas: 1.F , 2.V , 3.V, 4.F , 5.F , 6.F
EJERCICIO 4.
Cualquier medida aplicada a la característica de las unidades en la población se denomina:
a) Parámetro. c) Estadístico. e) Población.
b) Estimador. d) Variable.
Respuesta: a)
EJERCICIO 5.
Explique brevemente los siguientes puntos:
a) Factores o impedimentos que obligan a realizar una investigación parcial, en vez de
una investigación total.
b) Marco muestral.
c) Hechos que estudia y no estudia la estadística.
Solución:
a) Costo, tiempo, recursos humanos, población infinita o demasiado grande, grado de
homogeneidad en los elementos de la población.
b) Subconjunto representativo de una población que va a ser objeto de investigación, los
cuales deben estar plenamente identificados y actualizados.
c) Estudia: Los colectivos, los que se registran, los que se repiten, los que tienen distinta
frecuencia, los que son cualitativos cuantificables.
No estudia: Hechos individuales, no registrados, aislados, los que no son
cuantificables.
EJERCICIO 6.
Se debe responder verdadero si el enunciado es siempre válido. En caso contrario se deberá
sustituir la palabra subrayada por otra, con la cual el enunciado tenga validez.
a) Parámetro es el resultado al aplicar una medida a las características de las unidades de una
población.
b) El recuento de los empleados de una empresa, de acuerdo al cargo, es un ejemplo de
características cuantitativas.

3
Lic. Isidro W. Nina Paco

c) La estadística descriptiva es el “estudio” de una muestra a fin de poder hacer estimaciones


acerca de los valores estadísticos de la población, de la cual se tomó la muestra.
d) Una muestra aleatoria significa que cada elemento tiene una probabilidad diferente al ser
seleccionado.
e) La estadística inferencial es un ordenamiento sistemático de la información en cuadros y
gráficas que observamos en las diferentes publicaciones e informes.
Respuestas: a) Verdadero, b) Cualitativo, c) Inferencial, d) igual, e) Descriptiva
EJERCICIO 7.
Se realiza un estudio en la ciudad de La Paz a 150 familias de clase media, para conocer el tipo
de aceite o manteca usados en la cocina. Los resultados son los siguientes: Maíz, 14 hogares;
Soya, 65 hogares; Ajonjolí, 21 hogares; compran aceite al detalle sin especificar tipo, 17
hogares; manteca de cerdo, 21 hogares; grasas de origen vegetal, 6 hogares; oliva, 13 hogares.
a) ¿Cuál es la población?
b) ¿Cuál es el tamaño de la muestra?
c) ¿Qué carácter tiene la población?
d) ¿Cuál es la característica?
e) ¿Cuántas clases de características tiene la distribución?
f) Construya una distribución de frecuencias en el mismo orden indicado.
g) ¿Cuál es la 5ª clase?
h) ¿Cómo se explica que la suma de frecuencias sea superior al número de hogares?
Solución:
a. Hogares de clase media en la ciudad de La Paz
b. 150 hogares de clase media en esta ciudad
c. Atributo
d. Tipo de aceite y grasas usados en la cocina
e. 7 clases.
f. Hábitos de consumo de aceites y grasas
g. Manteca de cerdo
h. Algunos hogares informaron que usaban más de un tipo de aceite o grasa.

Tipo No. de hogares


Aceite de maíz 14
Aceite de soya 65

4
Lic. Isidro W. Nina Paco

Aceite de ajonjolí 21
Aceite sin especificar 17
Manteca de cerdo 21
Grasas de origen vegetal 6
Aceite de oliva 13

EJERCICIO 8.
Con los datos siguientes elaborar una tabla de frecuencias sabiendo que la distribución es
simétrica.
𝑚 = 7 𝑐 = 10; 𝑓1 = 8; 𝑓2 + 𝑓5 = 62; 𝑥3 𝑓3 = 1260; ℎ3 = 0.21; 𝐻6 = 0.96
Solución:

X i'1  X i' Xi fi Fi hi Hi X i fi

5,1 – 15 10 8 8 0,04 0,04 80


15,1 – 25 20 20 28 0,10 0,14 400
25,1 – 35 30 42 70 0,21 0,35 1.260
35,1 – 45 40 60 130 0,30 0,65 2.400
45,1 – 55 50 42 172 0,21 0,86 2.100
55,1 – 65 60 20 192 0,10 0,96 1.200
65,1 – 75 70 8 200 0,04 1,00 560
- 200 - 1,00 - 8.000

Proceso a seguir:
𝑓𝑖 8 8
a. ℎ𝑖 =  0,04   n  200
𝑛 n 0,04

b. H 7  H 6  h7  1,00  0,96  h7  h7  1,00  0,96  0,04


𝑓3
c. ℎ3 = → ℎ3 𝑛 = 𝑓3 → 0,21(200) = 42
𝑛

d. 𝑓2 + 𝑓5 = 62 → 𝑓2 + 42 = 62 → 𝑓2 = 62 − 42 = 20
1260
e. 𝑥3 𝑓3 = 1260 → 𝑥3 (42) = 1260 → 𝑥3 = = 30
42

5
Lic. Isidro W. Nina Paco

𝑐 10
f. 𝑥0′ = 𝑥1 − 2 ; 𝑥0′ = 10 − 2 = 10 − 5 = 5;
𝑐 20
𝑥1′ = 𝑥2 − ; 𝑥1′ = 20 − = 20 − 5 = 15;
2 2
EJERCICIO 9.
¿Qué opinión le merece a usted, si elaboramos una tabla de frecuencias y utilizamos?:
a) Dos marcas o número de clases
b) 28 marcas de clase
c) 12 marcas de clase
Solución:
a. No se debe utilizar este número de marcas de clase, pues la información quedaría muy
concentrada en dos intervalos, cuando lo recomendado son 5 como mínimo.
b. Tampoco es aconsejable un número mayor a 16, pues la amplitud se reduce y nos
quedaría casi igual a una variable discreta, además, una distribución en su presentación
es larga.
c. Está dentro de las recomendaciones.
EJERCICIO 10.
Con los datos de la tabla, se pide elaborar el histograma de frecuencia.

X i'1  X i' fi Fi

10,1 – 18 20 20
18,1 – 26 25 45
26,1 – 34 30 75
34,1 – 42 30 105
42,1 – 50 25 130
50,1 – 58 20 150
150 -

Solución:
Histógrama y polígono Ojiva
de frecuencias

6
Lic. Isidro W. Nina Paco

EJERCICIO 11.
Los ingresos semanales (en $us) de 50 trabajadores de la construcción fueron los siguientes:
170 172 183 164 166 164 160 168 173 176
184 190 163 151 158 166 166 172 170 186
170 166 169 160 158 155 160 157 163 165
170 172 178 183 170 166 165 172 168 158
158 168 166 159 154 166 172 168 163 172
a) Se pide elaborar una tabla de frecuencias.
b) Construir un histograma, el polígono y la ojiva.
Solución:
Rango  190  151  39 m  1  3,3 log 50  6,6 (6 ó 7)

Amplitud  39  7 Redefinición del rango  192  150  42


6

X i'1  X i' fi hi Fi Hi Xi

150,1 – 157 4 0,08 4 0,08 153,5


157,1 – 164 13 0,26 17 0,34 160,5
164,1 – 171 19 0,38 36 0,72 167,5
171,1 – 178 9 0,18 45 0,90 174,5
178,1 – 185 3 0,06 48 0,96 181,5
185,1 – 192 2 0,04 50 1,00 188,5
50 1,00 - - -

7
Lic. Isidro W. Nina Paco

Histógrama y polígono

Ojiva ascendente

8
Lic. Isidro W. Nina Paco

EJERCICIO 12.
Elabore la gráfica correspondiente.
Años 2001 2002 2003 2004 2005
Producción (Miles
380 450 700 740 720
ton.)
Ventas (Miles ton.) 260 350 600 520 508
Solución:
Valor producción y ventas Valor producción y ventas
(Miles Ton.) (Miles Ton.)
800
800
700
Millones de toneladas

700

Millones de toneladas
600
600
500
500
400
400
300
300
200
200
100
100

2001 2002 2003 2004 2005 2001 2002 2003 2004 2005
producción
Años Años producción
ventas ventas

EJERCICIO 13.
Los siguientes datos corresponden al número de retrasos (en la mañana) por parte de los
empleados de una empresa, durante el mes:
2 5 0 0 6 3 5 0 0 2 7 4 4 2 3 8 4 3 3 1
3 2 3 2 4 2 2 3 1 3 2 0 0 1 4 2 2 0 3 5

Se pide elaborar una tabla de frecuencias y los diagramas correspondientes.


Solución:
Xi fi Fi hi Hi

0 7 7 0,18 0,18
1 3 10 0,07 0,25
2 10 20 0,25 0,50
3 9 29 0,22 0,72

9
Lic. Isidro W. Nina Paco

4 5 34 0,12 0,84
5 3 37 0,07 0,91
6 1 38 0,03 0,94
7 1 39 0,03 0,97
8 1 40 0,03 1,00

40 - 1,00 -

Diagrama de frecuencias Diagrama de frecuencias


absolutas acumuladas absolutas

EJERCICIO 14.
Una investigación realizada a 120 estudiantes en un instituto universitario requiere elaborar una
gráfica.
Deportes Alumnos
Ajedrez 13
Baloncesto 47
Futbol 62
Natación 34
Ciclismo 20
Tenis 8

Solución:
La mayoría, equivocadamente realiza una gráfica circular, sin darse cuenta que un alumno
puede practicar más de un deporte y el porcentaje se obtiene sobre el número de alumnos
encuestados en este caso son 120.

10
Lic. Isidro W. Nina Paco

Deportes No. de alumnos %


Ajedrez 13 10,83 13
 0,1083  10,83%
Baloncesto 47 39,17 120
47
Futbol 62 51,67  0,3917  39,17%
120
Natación 34 28,33 etc.

Ciclismo 20 16,67
Tenis 8 6,67
Porcentaje de alumnos que practican un determinado deporte

Gráfica mal elaborada


Si la distribución de alumnos por práctica deportiva, se hace mediante una gráfica circular,
queda mal elaborada, ya que la sumatoria de alumnos no es igual al tamaño de la muestra.
Distribución de alumnos por deporte

11
Lic. Isidro W. Nina Paco

EJERCICIO 15.

Un almacén al cierre de sus ventas encuentra que el porcentaje de ventas por artículo se
distribuye así: 42% camisas, 8% corbatas, 34% pantalones, 5% calcetines, 11% otros
artículos. Se pide elaborar:
a) Un gráfico de barras
b) Una gráfica circular
Solución:
a.
Artículos Porcentajes
Camisas 42
Corbatas 8
Calcetines 5
Pantalones 34
Otros 11
Total 100

b.
Ventas porcentuales Ventas Porcentuales
Almacén x (agosto 2011) almacén x (agosto 2011)

50
42%
Porcentajes

40
42% 34%
30

11% 20
11%
10
8%
CONVENCIONES 5%
5% cam isas
34% pantalones
0
8%
Camisas

Corb atas

Pantalo nes
Calcetines

Otros

corbata s
calcetines
otro

Artículos

12
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.
Señalar el literal que más concuerde con cada una de las siguientes aseveraciones.
Una buena muestra industrial debe ser:
a) Pequeña.
b) Grande.
c) Representativa de la población objetivo.
d) Incluir solo los establecimientos grandes.
La clasificación de los establecimientos dedicados al comercio al detalle se hace teniendo en
cuenta:
a) Su función.
b) El valor de las ventas.
c) El valor de la producción.
d) El valor del trabajo realizado.
Una población infinita es aquella en donde:
a) El número de elementos está completamente delimitado.
b) El número de elementos pasa de 1.000.
c) El número de elementos no está delimitado.
EJERCICIO 2.
Un ejemplo de característica cualitativa pueden ser datos sobre:
a) Salario. c) Gastos mensuales en alimentación. e) Temperatura
b) Pulsaciones. d) Nivel de instrucción.
EJERCICIO 3.
¿Por qué es útil la estadística en el campo en el cual se está preparando?
EJERCICIO 4.
“la estadística estudia el comportamiento de fenómenos colectivos y nunca de una
observación individual”. Comentar este principio
EJERCICIO 5.
Una muestra es aleatoria cuando las unidades se seleccionan:
a) En forma caprichosa.
b) Por conveniencia.
c) A través de un censo.
d) En forma repetitiva.
e) De tal manera que todas tengan la misma posibilidad.

13
Lic. Isidro W. Nina Paco

EJERCICIO 6.
Por población o universo se entiende.
a) Un recuento de unidades.
b) Un conjunto de seres humanos.
c) Un conjunto de datos.
d) Un conjunto de medidas o el recuento de todas las unidades que tienen una
característica común.
e) Ninguna de las anteriores
EJERCICIO 7
Diga brevemente qué diferencia hay entre:
a) Parámetro y estimador.
b) Población y muestra.
c) Atributo y variable.
d) Muestreo aleatorio y no aleatorio.
EJERCICIO 8.
Indique y defina en forma brevemente los pasos que se debe seguir en un proceso de
Investigación Estadística.
EJERCICIO 9.
Dé contestación a los siguientes puntos, señalados con una X si es verdadero o falso
Verdadero Falso
a) 𝐻5 = 0.36 𝐹4 = 30 𝑛5 = 6 𝑛 = 50 ( ) ( )
b) Para calcular las marcas de clase, se suma el límite inferior al superior del
intervalo y se divide entre dos. ( ) ( )
c) El número de accidentes según sus causas, es una variable discreta.
( ) ( )
d) Si 𝐻6 = 0.7 y 𝐻4 = 0.3 un 40% de los valores de la variable es menor que 𝑋6 y
mayor que 𝑋4 ( ) ( )
e) 𝐻5 = 1.10 𝐻4 = 0.80 ℎ5 = 0.30 ( ) ( )
f) La suma de las frecuencias absolutas es igual a 1. ( ) ( )
EJERCICIO 10.
Que entiende usted por:
a) Distribución de frecuencias. c) Frecuencia.
b) Variable discreta. d) Frecuencia relativa.
EJERCICIO 11.
En una empresa, se hace un estudio sobre el número de horas que el personal deja de laborar
durante la semana. Los resultados son: 10 horas, 3 obreros; 3 horas, 7 obreros; 9 horas, 1
obrero; 4 horas, 2 obreros; 8 horas, 5 obreros; 5 horas, 8 obreros; 6 horas, 6 obreros.

14
Lic. Isidro W. Nina Paco

a) ¿Cuál es la población?
b) ¿Cuál es la variable?
c) ¿Cuál es la clase de variable?
d) ¿Cuántos valores toma la variable?
e) ¿Cuál es el valor de:
𝑋3 𝑓2 𝐻5 ℎ4

EJERCICIO 12.
De contestación a los siguientes puntos, diciendo si son ciertas o falsas a las siguientes
afirmaciones:
a) Al hacer una gráfica, la variable a estudiar va en el eje de las abscisas y las frecuencias en
la ordenada. ( )
b) El polígono de frecuencias se emplea para representar a la variable continua. ( )
c) Entre más características tenga la gráfica, se le considera como la mejor. ( )
d) Si los intervalos no son iguales, nos facilita la elaboración del histograma por lo tanto será
mucho más representativo. ( )
EJERCICIO 13.
Reconstruya la siguiente distribución simétrica.
𝑿𝒊 𝒇𝒊 𝑯𝒊
10 6 0.12
20 - 0.32
30 - -
40 - -
50 - -

EJERCICIO 14.
Con los siguientes datos, correspondientes a los pagos semanales (en $us.) a trabajadores de la
construcción:
77 70 65 62 53 78 41 48 74 63 34 38 69
79 76 55 59 69 78 75 34 68 56 61 41 83
54 49 68 48 64 84 74 68 73 69 31 69 78 64

Elabore una tabla de frecuencias, calculando m, mediante la fórmula:


𝑚 = 1 + 3.3 log 𝑛
Determine los valores de:
𝑿𝟑 𝑿𝟓 𝑯𝟒 𝑭𝟓 𝑪

15
Lic. Isidro W. Nina Paco

Solución:
𝑋′3 = 57 𝑋5 = 70.5 𝐻4 = 0.50 𝐹5 = 32 𝐶=9
EJERCICIO 15.
Decir si son verdaderas o no las siguientes relaciones:
a) 𝑚 = 6 ℎ1 = 0.2 ℎ4 = 0.2 𝐻2 = 0.6 𝐻3 + 𝐻4 = 1.9
b) 𝐻4 = 0.20 𝐻5 = 0.12 ℎ5 = −0.08
c) 𝑚 = 4 𝐻5 + ℎ6 = 𝐻6
Solución:
a) Falso, porque se deduce que 𝐻4 = 1.05
b) La frecuencia relativa no puede tener signo negativo (falso)
c) Falso, m no puede ser 4, a lo más igual a 6
EJERCICIO 16.
Contestar verdadero si el enunciado es verídico. Si no los es, la palabra en negrilla debe
sustituirse por una expresión con la cual el enunciado sea válido.
a) Un cuadro o tabla es la mejor forma de visualizar la información.
b) El recuento de los empleados en una empresa, de acuerdo al cargo, es un ejemplo de
variable discreta
c) El pictograma es la representación estadística por medio de mapas, dentro de los
cuales se ubican símbolos.
d) El histograma es un tipo de representación en gráfica de rectángulos de una
distribución continua.
e) El grosor de la lámina de metal que la compañía A utiliza en sus procesos de
manufactura es un ejemplo de atributos.
f) La población o universo es un subconjunto de unidades extraídas al azar en tal forma
que nos permita tener información sobre un grupo mayor.
EJERCICIO 17.
Opinión de los electores sobre si van a votar para el Congreso y para Presidente en las
próximas elecciones. Se pide elaborar el gráfico correspondiente:
Opinión Congreso % Presidente %
Afirmativo 22,24 48,32
Negativo 77,76 51,68
Total 100,00 100,00

Solución:
Opinión porcentual de posibles votos (positivos y negativos) para congreso y presidente

16
Lic. Isidro W. Nina Paco

Negativo Positivo Negativo Positivo


77,76% 22,24% 51,68% 48,32%

CONVENCIONES
voto negativo
voto positivo

EJERCICIO 18.
¿Qué ventajas tienen las gráficas en un resumen de datos?
EJERCICIO 19.
Una empresa petrolera “Compañía X” en su informe anual mencionó las siguientes ventas
netas y el costo ventas desde 2006 (en miles de dólares)
2006 2007 2008 2009 2010 2011
Ventas netas 19.116 15.586 13.534 21.334 27.342 30.620
Costo de ventas 15.776 12.895 18.287 18.476 20.698 25.382
Se pide:
a) Elaborar un cuadro que represente esta información para ser publicada en una revista
de la facultad.
b) Haga como mínimo dos gráficas que permitan representar la información anterior.
EJERCICIO 20.
Los siguientes datos corresponden el tiempo (minutos) que han necesitado 30 clientes de un
Banco para llevar a cabo una transacción bancaría.

20 42 62 32 28 20 38 26 30 18 42 54 16 32 42
36 18 56 41 16 14 42 34 14 24 51 49 24 18 56
Se pide elaborar:
a) Una tabla de frecuencias.

b) Histograma y el polígono en una sola gráfica.

17
Lic. Isidro W. Nina Paco

Solución:
a.
Tiempo que se gasta en una
transacción bancaria
Xi fi hi Fi Hi

14,0 – 22 9 0,30 9 0,30


22,1 – 30 5 0,17 14 0,47
30,1 – 38 5 0,17 19 0,64
38,1 – 46 5 0,17 24 0,81
46,1 – 54 4 0,13 28 0,94
54,1 – 62 2 0,06 30 1,00
30 1,00 - -

EJERCICIO 21.
Las calificaciones de 30 alumnos que presentaron examen de admisión a la facultad,
utilizando una escala de 0 a 100, fueron:
83 64 51 46 82 91 73 65 82 61 74 64 75 81 94
65 42 81 56 61 72 65 39 54 70 93 42 46 54 72
Elaborar un cuadro de frecuencias y dibujar los gráficos correspondientes (histograma,
polígono y ojiva)
Solución:

X i'1  X i' fi Fi hi Hi Xi

36,1 – 46 5 5 0,17 0,17 41


46,1 – 56 4 9 0,13 0,30 51
56,1 – 66 7 16 0,23 0,53 61
66,1 – 76 6 22 0,20 0,73 71
76,1 – 86 5 27 0,17 0,90 81
86,1 – 96 3 30 0,10 1,00 91
30 - 1,00 - -

18
Lic. Isidro W. Nina Paco

EJERCICIO 22.
A continuación se transcriben las edades de 50 integrantes de un programa de servicio social
del gobierno:

81 53 67 60 80 64 56 54 91 61
66 88 67 65 52 72 74 65 73 69
43 54 76 70 97 68 82 75 79 60
39 87 76 97 86 45 60 45 65 76
92 72 82 80 70 65 50 58 70 56

Construya con estos datos las distribuciones de frecuencia relativa usando 7 intervalos
iguales. Calcular el porcentaje de adultos que sean mayores de 50 años.

Solución.
(𝑿′𝒊−𝟏 𝑿′ 𝒊 ] 𝑿𝒊 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
(36 45] X1 = 40.5 f1 = 4 h1 = 0.08 F1 = 4 H1 = 0.08
(45 54] X2 = 49.5 f2 = 5 h2 = 0.10 F2 = 9 H2 = 0.18
(54 63] X3 = 58.5 f3 = 7 h3 = 0.14 F3 = 16 H3 = 0.32
(63 72] X4 = 67.5 f4 = 15 h4 = 0.30 F4 = 31 H4 = 0.62
(72 81] X5 = 76.5 f5 = 10 h5 = 0.20 F5 = 41 H5 = 0.82
(81 90] X6 = 85.5 f6 = 5 h6 = 0.10 F6 = 46 H6 = 0.92
(90 99] X7 = 94.5 f7 = 4 h7 = 0.08 F7 = 50 H7 = 1.00
n = 50 1.00

43
𝑃 [𝑋 > 50] = 𝑃[𝑋 ≥ 51] = ∗ 100 = 86%
50

19
Lic. Isidro W. Nina Paco

20
TEMA 2:
MEDIDAS DE POSICIÓN

Nuestra RECOMPENSA se encuentra en el ESFUERZO y


no en el RESULTADO. Un ESFUERZO TOTAL es una
VICTORIA COMPLETA (Mahatma Gandhi)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 2: MEDIDAS DE POSICIÓN


FORMULARIO 2
MEDIA MUESTRAL MEDIANA MUESTRAL
𝒏
̅ = 𝒙1 + 𝒙2 + ⋯ + 𝒙𝒏 = 1 ∑ 𝒙
𝑿 𝑋(𝑛+1) 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
𝒊
𝒏 𝒏 𝑀𝑒 = {1
2
𝒊=1
(𝑋 𝑛 + 𝑋(𝑛+1) ) 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2 (2 )
𝑿̅ = 𝒇1 𝒙1 + 𝒇2 𝒙2 + ⋯ + 𝒇𝒌𝒙𝒌 2

𝒏 𝑛
(Para datos tabulados y agrupados) − 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖𝑛𝑓 + 2 ∗𝐶
𝐹𝑖 − 𝐹𝑖−1
(Para datos agrupados)
MEDIA GEOMETRICA (𝒙𝒊 ≠ 𝟎)
MEDIA ARMONICA (𝒙𝒊 ≠ 𝟎)
𝑛 𝑛 𝑛
𝑛 𝑋̅ 𝐻 = =
̅̅̅̅
𝑋𝐺 = √∏ 𝑋𝑖 = 𝑛√𝑋1 ∗ 𝑋2 ∗ … ∗ 𝑋𝑛 1 1 1 1
∑𝑛𝑖=1 + + ⋯+
𝑋𝑖 𝑋1 𝑋2 𝑋𝑛
𝑖=1

𝑛 𝑛
∑𝑛𝑖=1 log 𝑋𝑖 𝑋̅ 𝐻 = =
̅̅̅̅ 𝑓𝑖 𝑓1 𝑓2 𝑓𝑘
𝑿𝑮 = antilog ( ) ∑𝑘𝑖=1
𝑛 𝑋𝑖 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑘
(Para datos tabulados y agrupados)
𝒌
𝒏
𝒇 𝒇 𝒇 𝒏 𝒇
MEDIA CUBICA
̅̅̅̅
𝑿𝑮 = √∏ 𝑿𝒊 𝒊 = √𝑿11 ∗ 𝑿22 ∗ … ∗ 𝑿𝒌𝒌
𝒊=1
3 ∑𝒏𝒊=1 𝑿3𝒊 3 𝑿3 + 𝑿3 + ⋯ + 𝑿3
1 2 𝒏
(Para datos tabulados y agrupados) 𝑴3 = √ =√
𝒏 𝒏
∑𝑘𝑖=1 𝑓𝑖 log 𝑋𝑖
̅̅̅̅
𝑿𝑮 = antilog ( )
𝑛
3 ∑𝒌𝒊=1 𝒇𝒊 𝑿3𝒊 3 𝒇 𝑿3 + 𝒇 𝑿3 + ⋯ + 𝒇 𝑿3
1 1 2 2 𝒌 𝒌
MEDIA CUADRATICA 𝑴3 = √ =√
𝒏 𝒏
(Para datos tabulados y agrupados)
∑𝒏𝒊=1 𝑿2𝒊 𝑿12 + 𝑿22 + ⋯ + 𝑿2𝒏
̅ = 𝑴2 = √
𝑿 =√ MEDIA MUESTRAL CONJUNTA DE
𝑪 𝒏 𝒏 DOS SUB-MUESTRAS

𝑛𝐴̅̅̅
𝑋𝐴 + 𝑛𝐵 ̅̅̅̅
𝑋𝐵
∑𝒌𝒊=1 𝒇𝒊 𝑿2𝒊 𝒇1 𝑿12 + 𝒇2 𝑿22 + ⋯ + 𝒇𝒌𝑿2𝒌 𝑋̅ = , 𝑛𝐴 + 𝑛𝐵 = 𝑛
̅ √ √ 𝑛
𝑿 𝑪 = 𝑴2 = =
𝒏 𝒏 EN GRAL. PARA K-SUBMUESTRAS
(Para datos tabulados y agrupados) ∑𝑘𝑖=1 𝑛𝑖 𝑋̅𝑖
𝑋̅ =
∑𝑘𝑖=1 𝑛𝑖
𝑛1̅̅̅
𝑋1 + 𝑛2 ̅̅̅
𝑋2 + ⋯ + 𝑛𝑘 ̅𝑋̅̅𝑘̅
=
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘

23
Lic. Isidro W. Nina Paco

MODA
DECILES m = 1, 2, 3, … ,9
Moda = dato que se repite con mayor
frecuencia 𝐷𝑚 = 𝑋𝑚(𝑛+1)
∆1

Para una lista de datos y


10
𝑴𝒐 = 𝑳𝒊𝒏𝒇 + ∗𝑪
∆1 + ∆2
(Para datos agrupados) 𝑚(𝑛 + 1)
𝐷𝑚 = 𝑋𝑗 + ( − 𝑗) (𝑋𝑗+1 − 𝑋𝑗 )

datos tabulados
10
∆1 : 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑚𝑎𝑦𝑜𝑟
𝑓𝑟𝑒𝑐. 𝐴𝑏𝑠. 𝑦 𝑙𝑎 𝑓𝑟𝑒𝑐. 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑚(𝑛 + 1)
𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( )
∆2 : 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑚𝑎𝑦𝑜𝑟 10
𝑓𝑟𝑒𝑐. 𝐴𝑏𝑠. 𝑦 𝑙𝑎 𝑓𝑟𝑒𝑐. 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑎 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
𝑚𝑛
− 𝐹𝑖−1
CUARTILES 𝐷𝑚 = 𝐿𝑖𝑛𝑓 + 10 ∗𝑐
𝐹𝑖 − 𝐹𝑖−1
Para una lista de datos y

(Para datos agrupados)


𝑄𝑚 = 𝑋𝑚(𝑛+1) m = 1, 2, 3
4 PERCENTILES
datos tabulados

𝑚(𝑛 + 1) 𝑃𝑚 = 𝑋𝑚(𝑛+1)
𝑄𝑚 = 𝑋𝑗 + ( − 𝑗) (𝑋𝑗+1 − 𝑋𝑗 ) m = 1, 2, … ,99

Para una lista de datos y


4 100

𝑚(𝑛 + 1) 𝑚(𝑛 + 1)
𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( ) 𝑃𝑚 = 𝑋𝑗 + ( − 𝑗) (𝑋𝑗+1 − 𝑋𝑗 )
4 datos tabulados 100
𝑚𝑛
− 𝐹𝑖−1 𝑚 (𝑛 + 1)
𝑄𝑚 = 𝐿𝑖𝑛𝑓 + 4 ∗𝑐 𝑑𝑜𝑛𝑑𝑒: 𝑗 = 𝑒𝑛𝑡𝑒𝑟𝑜 ( )
𝐹𝑖 − 𝐹𝑖−1 100
(Para datos agrupados) 𝑚𝑛
− 𝐹𝑖−1
𝑃𝑚 = 𝐿𝑖𝑛𝑓 + 100 ∗𝑐
𝐹𝑖 − 𝐹𝑖−1
FORMULA ABREVIADA DE LA (Para datos agrupados)
MEDIA ARITMÉTICA
Para una lista de datos
PROPIEDADES DE LA MEDIA
𝑂𝑡 : 𝑂𝑟𝑖𝑔𝑒𝑛 𝑑𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑜 ARITMÉTICA
Sabiendo que:
Para una lista de datos y

𝑑𝑖 : 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠
∑𝑋
d i  X i  Ot 𝑋̅ = 𝑀[𝑋] =
𝑛
datos tabulados

∑ 𝑑𝑖 1) 𝑀[𝑐] = 𝑐
𝑥̅ = 𝑂𝑡 + 2) 𝑀[𝑐𝑋] = 𝑐𝑀[𝑋]
𝑛
3) 𝑀[𝑐𝑋 + 𝑑] = 𝑐𝑀[𝑋] + 𝑑
Para datos agrupados 4) ∑(𝑋𝑖 − 𝑋̅) = 0
∑ 𝑓𝑖 𝑑𝑖
𝑥̅ = 𝑂𝑡 +
𝑛
X i  Ot d i
d i'  =
C C
∑ 𝑓𝑖 𝑑′𝑖
𝑥̅ = 𝑂𝑡 + 𝐶
𝑛
24
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.

Construya una distribución simétrica cuyos datos son:


7 7
40
𝑓1 = 1; 𝑓2 = 15; 𝑂𝑡 = 55; 𝐹2 = 16; 𝐹4 = 70; 𝐶 = 10; ∑ ℎ𝑖 = ; ∑ 𝑑𝑖′ = 7
110
𝑖=5 𝑖=1

Obtenga de la anterior distribución la media aritmética por los métodos conocidos.

Solución:

X i  Ot
d i  X i  Ot d i'  𝑥̅ = 𝑂𝑡 +
∑ 𝑑𝑖 𝑓𝑖
𝑛
C
7

d
7
'
C  10 40
i =7 Ot  55  hi  h5  h6  h7 
i 1 i5 110

7
40
 hi  h5  h6  h7 
i5 110

7 f5 f f
   6  7  40
i5 n n n 110

n  110 𝑓5 + 𝑓6 + 𝑓7 = 40 𝑓5 + 15 + 1 = 40 𝑓5 = 40 − 16 = 24

X i'1  X i' Xi fi 𝐹𝑖 X i fi di ' di di fi di ' fi


30,1 – 40 35 1 1 35 -2 -20 -20 -2
40,1 – 50 45 15 16 675 -1 -10 -150 -15
 170
50,1 – 60 55 24 40 1.320 0 0 1.270  17
127

60,1 – 70 65 30 70 1.950 1 10 300 30


70,1 – 80 75 24 94 1.800 2 20 480 48
80,1 – 90 85 15 109 1.275 3 30 450 45
90,1 – 100 95 1 110 95 4 40 40 4
 - 110 - 7.150 7 - 1.100 110

Calculamos la media aritmética, aplicando algunas fórmulas ya vistas

∑ 𝑥𝑖 𝑓𝑖 7.150
a) 𝑥̅ =   65
𝑛 110

∑ 𝑑𝑖 𝑓𝑖 1.100
b) 𝑥̅ = 𝑂𝑡 +  55   55  10  65
𝑛 110

25
Lic. Isidro W. Nina Paco

∑ 𝑑𝑖′ 𝑓𝑖 110 
c) 𝑥̅ = 𝑂𝑡 + 𝑐  55  10    55  10  65
𝑛
110 
NOTA: Como la distribución es SIMETRICA, la media ubica en la mitad de la variable (marcas de
clase)

EJERCICIO 2.

Un grupo de 200 estudiantes, cuya estatura media es de 160.96 centímetros se divide en dos grupos,
uno con una estatura media de 163.4 centímetros y otro con una de 157.3 centímetros ¿Cuántos
estudiantes hay en cada grupo?

Solución:
n  200 n1  ? n2  ? n1  n2  200 n1  200  n2

x  160 ,96 x1  163 ,4 x 2  157 ,3

163 ,4n1  157 ,3n 2


160 ,96  ; 32 .192  163 ,4200  n2   157 ,3n2
200
32 .192  32 .680  163 ,4n 2  157 ,3n 2

6,1 n2  488

n 2  488  80 Estudiantes
6,1

n1  200  80  120 Estudiantes

EJERCICIO 3.

En un curso hay 35 hombres con una edad media de 17,5 años y 15 mujeres las que, en promedio,
son 22% más jóvenes. ¿Cuál es la edad media del curso?

Solución:
n1  35 n2  15 n  50 x ?

x1  17 ,5 17 ,5  22  3,85 x 2  x1  22 % x1 ; x 2  17 ,5  3,85  13,65


100

x1n1  x2 n2
x
n

17 ,5 35   13,65 15  612 ,5  204 ,75


x   16,345 Edad media del curso
50 50

EJERCICIO 4.

26
Lic. Isidro W. Nina Paco

Una fábrica de producción múltiple, tiene cuatro líneas de productos. Durante el mes de octubre del
presente año los resultados obtenidos al realizar la operación de rutina de control de calidad, fueron
los siguientes:

Líneas de producción Unidades producidas (miles) Porcentaje defectuoso


A 8300 0.8
B 12600 1.1
C 24300 2.6
D 15800 1.4
∑ 61000 -------

Determinar el promedio porcentual de artículos defectuosos producidos por dicha fabrica en el mes
de octubre del presente año.

Solución:

 xi 0,8  1,1  2,6  1,4 5,9


a) x  x   1,475 %
n 4 4
Porcentaje de artículos defectuosos. Este cálculo se hace para que el alumno note la diferencia con la
media ponderada

b)

Xi fi X i fi  X i fi
X
n
0,008 8.300 66,4
0,011 12.600 138,6
0,026 24.300 631,8
0,014 15.800 221,2 1.058
X   0,0173  1,73%
 61.000 1.058,0 61.000

Son 1.058 (miles de unidades) producidas en forma defectuosa, para un porcentaje de 1,73% de la
producción.

EJERCICIO 5.

Un grupo de obreros tiene los siguientes salarios mensuales (en $us)

730 510 640 680 480 640 710 600 780


Los obreros piden un reajuste general del 15%, pero el empresario ofrece un aumento del 10%, más
una bonificación mensual de $20. ¿Cuál cree usted que debe ser la decisión más ventajosa para el
obrero?

Solución:

 xi 5.770
x  x  641,11
n 9

a) x  641,11 1,15  $737,27

27
Lic. Isidro W. Nina Paco

b) x  641,111,10  $705,22  20  $725,22

Para el obrero la mejor decisión es la primera; para el empresario es la segunda alternativa.

EJERCICIO 6.

Los sueldos mensuales de 70 empleados de una oficina son como sigue:

Ocupación No. Empleados Sueldo en $us


Recepcionista 2 642
Mecanógrafa 12 751
Secretaria 8 758
Aux. Contabilidad 10 794
Técnicos elect. 24 801
Tec. Mecánicos 14 911
Se pide calcular la media aritmética, la mediana y la moda.

Solución:

Fi 56.278
Xi fi X i fi a) Media   803,97
70
642 2 1.284 2
751 12 9.012 14 Salario promedio mensual
758 8 6.064 22
794 10 7.940  Fi1 b) Mediana  n  35
32 2
801 24 19.224 56  Fi M e  xi  801

911 14 12.754 70 Salario promedio mensual


 70 56.278 -

c) Moda  M 0  801

Salario promedio mensual

EJERCICIO 7.

Una muestra realizada a 12 profesores de colegios públicos, acerca de sus salarios arrojó los
siguientes resultados en dólares: $300; 350; 350; 440; 335; 370; 490; 550; 700; 630; 650 y 685.
Calcular la media, mediana y moda de los salarios. ¿Cuál fue el mejor promedio? ¿Por qué?

Solución:

300 335 350 350 370 440 490 550 630 650 685 700

5850 440  490


Media   487,5 ; M 0  350 ; Me   465
12 2

El mejor promedio es la mediana, por ser el centro, eliminando los extremos, correspondiente al salario
más bajo y al más alto.

Media = $487.5 Moda = $350 Mediana = $465

28
Lic. Isidro W. Nina Paco

EJERCICIO 8.

Con los siguientes datos, calcular la media, mediana y moda.

X i'1  X i' fi

2.1 – 5 120
5.1 – 9 15
9.1 – 16 8
16.1 – 20 6
20.1 – 28 6
28.1 – 36 5
∑ 160
Solución:

X i'1  X i' fi Xi X i fi Fi ci f i ci

2,1 – 5 120 3,5 420,0 120 3 40,0


Media  1.037  6,48
5,1 – 9 15 7,0 105,0 135 4 3,75 160
9,1 – 16 8 12,5 100,0 143 7 1,14
Moda  3,6
16,1 – 20 6 18,0 108,0 149 4 1,50
20,1 – 28 6 24,0 144,0 155 8 0,75
28,1 – 36 5 32,0 160,0 160 8 0,63
 160 - 1.037,0 - - - n  80
2

M e  2  3  80  0   2  2  4
 120 

EJERCICIO 9.

Una persona viaja en coche de la ciudad “A” a la “B” con una velocidad media de 80 km por hora y
vuelve de la ciudad “B” a la “A” con una velocidad media de 120 km por hora, hallar la velocidad media
del viaje completo.

Solución:

2
Vm   96 Vm  96 km. p.h.
1 1

80 120
EJERCICIO 10.

Se sabe que dos obreros gastan en la ejecución de un trabajo 80 y 60 minutos respectivamente, ¿Cuál
es el tiempo medio requerido para hacerlo en conjunto?

Solución:

29
Lic. Isidro W. Nina Paco

2
MH   68,57 Minutos
1 1

80 60
EJERCICIO 11.

Con los datos de la siguiente tabla, se pide calcular la media cuadrática, cúbica y el séptimo decil.

X i'1  X i' Xi fi X i2 f i X i3 f i Fi
3,1 – 8 5,5 8 242 1.331 8
8,1 – 10 9,0 8 648 5.832 16
10,1 – 16 13,0 14 2.366 30.758 30
16,1 – 24 20,0 16 6.400 128.000 46
24,1 – 30 27,0 18 13.122 354.294 64
30,1 – 32 31,0 10 9.610 297.910 74
  74 32.388 818.125 -

Solución:

32.388
Media cuadrática  M 2   20,92
74

818.125
Media cúbica  M 3  3  22,28
74
774 
Séptimo decil  D7   51,8 Fi 1  46 Fi  64
10

 51,8  46 
D7  24  6    24  1,93  25,93
 18 

EJERCICIO 12.

Durante diez días se observó en una importadora, el número de autos vendidos por su empleado
estrella.

Días: 1 2 3 4 5 6 7 8 9 10
Autos: 2 3 2 1 4 1 5 6 3 4

Cada auto vale $18.500 y al empleado se le paga un sueldo de $1.500 básico mensual más el 0,5% del
valor de cada auto vendido. ¿Cuál será el sueldo promedio para el vendedor estrella en este lapso de
10 días?

Solución:

=> Número de vehículos vendidos en 10 días es de 31

=> Valor total de las ventas: 31(18.500) = $573.500

30
Lic. Isidro W. Nina Paco

=> El 0,5% = 0,005 gana por cada vehículo

573.500 (0,005) + 500 = $2.867,5 + 500 = $3.367.5 sería el sueldo promedio en los 10 días.

EJERCICIO 13.

Contestar verdadero si el enunciado es verdadero. En caso contrario, la palabra subrayada debe


sustituirse por una expresión con la cual el enunciado si sea válido.

a) La media de una muestra divide los datos en dos partes iguales: la mitad mayores y la mitad
menores que su propio valor.
b) La media armónica es la raíz enésima del producto de los valores que toma la variable
c) El decil ocho representa aquel valor de la variable que supera el 80% de las observaciones y es
superado por el resto 20%.
d) Una distribución o un conjunto de datos permite el cálculo de varias medidas de tendencia
central.
e) Un promedio aplicado o calculado en un conjunto de datos provenientes de una muestra se
denomina parámetro.

Solución:

a) La mediana, b) la media geométrica, c) Verdadero, d) Verdadero, e) Población.

EJERCICIO 14.

Se tiene dos cursos A y B, donde el primero tiene un promedio de calificación de 60, mientras que en
el B es de 72. Diga qué porcentaje de alumnos tiene A y B, si el promedio de calificación para la suma
de los dos cursos es de 65

Solución:

x1  60 x2  7,2 x  60 (1  h2 )  72 h2  65
1  h1  h2 65  60  60 h2  72 h2
h1  1  h2 5
5  12 h2  h2   0,417 ; h2  41,7% ; h1  58.3%
12

EJERCICIO 15.

Dados los números 55, 44, 51, 63, 48, 77, encontrar la media armónica, la media geométrica, la
media cúbica y la media cuadrática.

Solución:

M g  13,24 x  14 M 3  15,30 M 2  14 ,70

6
a) Media armónica = XH   54.44
1 1 1 1 1 1
    
55 44 51 63 48 77

31
Lic. Isidro W. Nina Paco

b) Media geométrica = X G  6 55 * 44 * 51* 63 * 48 * 77  55.34

553  443  513  633  483  773


c) Media cúbica = M 3  3  58.5
6

552  442  512  632  482  772


d) Media cuadrática = M 2  2  57.39
6

32
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.

Un grupo de 200 empleados, que tiene una compañía, se dividen en operarios y técnicos con un
salario promedio de $us 1.260. Los salarios promedio para cada uno de los grupos son de $us 857 y
$us 1.320 respectivamente.

a) ¿Cuántos operarios y cuántos técnicos tiene la compañía?


b) Si el gerente establece una bonificación de $us 30 para los operarios y del 8% para los
técnicos, ¿Cuál será el salario promedio para los 200 empleados de la compañía?

Solución:

a) 𝒏𝟐 = 174 𝑂𝑝𝑒𝑟𝑎𝑟𝑖𝑜𝑠 𝒏1 = 26 𝑇é𝑐𝑛𝑖𝑐𝑜𝑠


̅
𝑏) 𝑿 =? (𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑎 𝑑𝑒 𝑜𝑝𝑒𝑟𝑖𝑜𝑠 𝑦 𝑡é𝑐𝑛𝑖𝑐𝑜𝑠

EJERCICIO 2.

En una fábrica de tres secciones se sabe que en la sección A, con 60 obreros, la asistencia promedio
es de 240 días al año; en la sección B, que tiene 90 obreros, la asistencia media es de 216 días al año.
Si la asistencia media en toda la fábrica es de 226,70 días, ¿Cuántos obreros hay en la sección C,
donde la asistencia promedio es de 230 días al año?

Solución:

𝒏𝟑 = 50 𝑜𝑏𝑟𝑒𝑟𝑜𝑠
EJERCICIO 3.

En un examen tomado a tres secciones de un curso de estadística de 91 alumnos, el puntaje medio


general fue de 69,3. Los puntajes medios de las secciones 1 y 2 fueron 70,4 y 64,2 respectivamente.
Se perdieron los archivos con las notas de la sección 3, pero los ayudantes recuerdan que las
secciones 1 y 2 tenías exactamente el mismo número de alumnos, mientras que el ayudante de la
sección 3 menciona que su sección tenía 5 estudiantes menos que la 1. ¿Cuál fue el promedio de las
notas de la sección 3?

Solución:

n1  32 n2  32 n3  27 𝑥3 = ?
̅̅̅

EJERCICIO 4.

Los siguientes datos corresponden a los salarios mensuales en dólares, pagados por una empresa a
su personal:

Salario (en $us) No. Empleados


500 10
600 16
700 35
800 26
900 13

33
Lic. Isidro W. Nina Paco

En la empresa se presenta un conflicto laboral. El gerente propone un aumento de 7% mensual para


cada uno de los empleados y la Junta Directiva propone un aumento de $49 para cada empleado. Se
solicita su asistencia para que discuta qué es más ventajoso para la empresa y qué para cada grupo
de empleados, según su clasificación por nivel de salarios. ¿Cómo actuaría usted?

Solución:
xi + 7% xi +49

535 549 favorable

642 649
749 igual  749
856 favorable 849
963 949

EJERCICIO 5.

Los siguientes datos corresponden a los salarios mensuales (en dólares) de 50 trabajadores.

𝑿′𝒊−𝟏 − 𝑿′𝒊 𝒇𝒊
800 – 1.000 5
1.000 – 1.200 13
1.200 – 1.400 17
1.400 – 1.600 8
1.600 – 1.800 7
Con la siguiente distribución, calcular:

a) La media, mediana y moda.


b) La media cúbica, cuadrática, armónica y geométrica.

Solución:

a) 𝑀𝑒𝑑𝑖𝑎 = 𝑋̅ = 1.296 b) 𝑀𝑒𝑑𝑖𝑎 𝑐𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 = 𝑀2 = 1.317,12

𝑀𝑜𝑑𝑎 = 𝑀𝑜 = 1.300 𝑀𝑒𝑑𝑖𝑎 𝑐ú𝑏𝑖𝑐𝑎 = 𝑀3 = 1.337,70

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑀𝑒 = 1.282,35 𝑀𝑒𝑑𝑖𝑎 𝐴𝑟𝑚ó𝑛𝑖𝑐𝑎 = 𝑀𝐻 = 1.250,07


𝑀𝑒𝑑𝑖𝑎 𝐺𝑒𝑜𝑚é𝑡𝑟𝑖𝑐𝑎 = 𝑀𝐺 = 1.274,57

EJERCICIO 6.

En una empresa constructora de vivienda, los jornales semanales tienen una media de $us 169.
Como una solución al conflicto laboral surgido se proponen dos soluciones al conflicto: (a) un

34
Lic. Isidro W. Nina Paco

aumento del 6% en el salario semanal; (b) un aumento del 4% más una bonificación semanal de $us
5,8 a cada obrero, ¿Cuál de las dos alternativas mejora la situación del obrero?

Solución:

a) 169 (1,06) = $us 179,14, es el salario semanal

b) 169 (1,04) = $us 175,76 + 5,8 = $us 181,56

La mayor es (b) con salario semanal de $181,56

EJERCICIO 7.

Se tiene que:

𝑥2 = 22 𝑥 ′ 5 = 50 𝑚=6 𝐶 = 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒 𝑓2 + 𝑓4 = 15 𝑓1 + 𝑓3 = 25
𝑛 = 50 𝑓5 + 𝑓6 = 10 𝑓1 = 8 𝑓5 = 2 𝑓2 = 7

Se pide calcular la media armónica y cúbica.

Solución:

Media cúbica  M 3  36,59


Media armónica  M H  26,90

EJERCICIO 8.

Un laboratorio de control de calidad de una empresa quiere lanzar al mercado un nuevo perfume;
seleccionó cincuenta departamentos de una urbanización para determinar el tiempo de permanencia
del aroma; los resultados fueron observados cada hora, habiéndose obtenido: 10 horas, 5
departamentos; 3 horas, 3 departamentos; 5 horas, 10 departamentos; 4 horas, 7 departamentos; 6
horas, 16 departamentos; y 8 horas, 9 departamentos.

a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es la variable?
d) ¿De qué tipo es la variable?
e) ¿Cuál es el promedio de permanencia del aroma?
f) Elabore una gráfica que represente a la distribución.

Solución:

a) El total de departamentos de esa urbanización

b) Los 50 departamentos de esa urbanización

c) Tiempo de permanencia del aroma

d) Tiempo: horas, minutos, segundos, corresponde a una variable continua.

35
Lic. Isidro W. Nina Paco

e) X  6,1 Horas
EJERCICIO 9.

Decir si son verdaderos o falsos y por qué:

a) 𝑥̅ = 68 𝑀𝑒 = 62 𝑀𝑜 = 68
b) 𝑥̅ = 70 𝑀𝐺 = 65 𝑀2 = 72,50 𝑀𝐻 = 63 𝑀3 = 76,8

Solución:

a) Falso ya que: x  Me  Mo no se cumple ésta relación de orden.


68  62  ?
b) Verdadero, ya que:
M3  M2  x  MG  MH
76,8 > 72,50 > 70 > 65 > 63 Se cumple la relación de orden.

EJERCICIO 10.

Un estadístico entrega una hoja con los siguientes datos que se refieren al cálculo de una media
aritmética:

di ' di ' fi
1 2
2 20
3 75
4 100
5 75
6 18

Se pide calcular la mediana en una variable continua. Ot=10, C=10.

Solución:
M e  46,20

EJERCICIO 11.
3
De tres números se sabe que su media cúbica √657 , su media aritmética es 7 y su mediana es 6. Se
pide calcular los valores de esos tres números.

Solución:
x1  3 x2  6 x3  12

EJERCICIO 12.

Con base en los siguientes datos, correspondientes a medidas de tendencia central, determinar si
hay simetría y cuál es su dirección.

36
Lic. Isidro W. Nina Paco

𝑎) 𝑥̅ = 68 𝑀𝑒 = 74 𝑀0 = 80

𝑏) 𝑥̅ = 80 𝑀𝑒 = 74 𝑀0 = 68
𝑐) 𝑥̅ = 74 𝑀𝑒 = 74 𝑀0 = 74

𝑑) 𝑥̅ = 74 𝑀𝑒 = 74 𝑀0 = 60

Solución:

a) Asimetría negativa; b) Asimetría positiva

c) Simétrica d) Ligeramente asimétrica positiva

EJERCICIO 13.

Los gastos (miles de Bs.) en publicidad de 50 empresas comerciales, durante el mes de diciembre de
2006 agruparon en 4 clases de amplitud constante, de la cual se sabe:

𝑋1 = 3.5 𝑋4′ = 8.75 𝑓𝑖 = 4 𝐹2 = 20 𝑓3 = 25

Calcular la media y media geométrica.

Solución:

296 ,5
Media   5,93 Media geométrica  5,81
50
EJERCICIO 14.

Con los siguientes datos, se pide calcular:

x'i 1  x'i fi
6,1 - 12 2
12,1 - 15 14
15,1 - 20 5
20,1 - 28 3
28,1 - 36 7
36,1 - 40 16
40,1 - 50 3
 50
a) Media aritmética.
b) Mediana.
c) La Moda
d) Tercer decil.
e) Segundo cuartil.
f) Percentil sesenta.

Solución:

a) 26,67 b) 29,14 c) 13,5 d) 14,79 e) 29,14 f) 34,86

37
Lic. Isidro W. Nina Paco

EJERCICIO 15.

Explique brevemente:

a) Tres ventajas de la media


b) Dos desventajas de la mediana
c) Dos ventajas de la moda
d) ¿En qué condiciones serán iguales la media, mediana y moda?

38
TEMA 3:
MEDIDAS DE DISPERSIÓN

El secreto de la sabiduría, del poder y del


conocimiento es la humildad. (Ernest Hemingway)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 3: MEDIDAS DE DISPERSIÓN


FORMULARIO 3
RANGO
VARIANZA POBLACIONAL
𝑅 = 𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚á𝑥 − 𝑋𝑚í𝑛 2
∑𝑁
𝑖=1(𝑋𝑖 − 𝜇) ∑(𝑋 − 𝜇 )2 ∑ 𝑑 2
2
𝜎 = = = = ̅̅̅̅̅̅̅̅̅̅̅
( 𝑋 − 𝜇 )2
RANGO INTERCUARTIL 𝑁 𝑁 𝑁
𝑅𝐼 = 𝑄3 − 𝑄1 = 𝑃75 − 𝑃25 ∑𝐾 2 ∑𝑓(𝑋 − 𝜇 )2 ∑ 𝑓𝑑 2
𝑖=1𝑓𝑖 (𝑋𝑖 − 𝜇 )
𝜎2 = = = = ̅̅̅̅̅̅̅̅̅̅̅
(𝑋 − 𝜇 ) 2
𝑁 𝑁 𝑁
RANGO SEMI-INTERCUARTIL (Para datos tabulados y agrupados)
𝑄3 − 𝑄1
𝑄= VARIANZA MUESTRAL
2
RANGO PERCENTIL 10-90 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 ∑(𝑋 − 𝑋̅)2 ∑ 𝑑2
𝑠2 = = =
𝑛−1 𝑛−1 𝑛−1
𝑅𝑎𝑛𝑔𝑜 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 10 − 90 = 𝑃90 − 𝑃10
∑𝐾 ̅ 2 ∑𝑓(𝑋 − 𝑋̅)2 ∑ 𝑓𝑑 2
𝑖=1𝑓𝑖 (𝑋𝑖 − 𝑋 )
RANGO SEMI-PERCENTIL 10-90 𝑠2 = = =
𝑛−1 𝑛−1 𝑛−1
(Para datos tabulados y agrupados)
𝑃90 − 𝑃10
𝑅𝑎𝑛𝑔𝑜 𝑠𝑒𝑚𝑖 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 10 − 90 =
2
DESVIACIÓN ESTANDAR POBLACIONAL
DESVIACIÓN MEDIA
∑𝑁 ̅ 2
𝑖=1(𝑋𝑖 − 𝑋 ) ∑(𝑋 − 𝑋̅)2 ∑ 𝑑2
∑𝑁 ̅
𝑖=1 |𝑋𝑖 − 𝑋 | ∑ |𝑋 − 𝑋̅| ̅̅̅̅̅̅̅̅̅̅ 𝜎=√ = √ = √
DM = = = |𝑋 − 𝑋̅| 𝑁 𝑁 𝑁
𝑁 𝑁
∑𝐾 ̅
𝑖=1 𝑓𝑖 |𝑋𝑖 − 𝑋 | ∑ 𝑓|𝑋 − 𝑋̅| = √̅̅̅̅̅̅̅̅̅̅̅̅
(𝑋 − 𝑋̅)2
DM = =
𝑁 𝑁
(Para datos tabulados y agrupados)
DESVIACIÓN MEDIANA ∑𝐾 ̅ 2
𝑖=1𝑓𝑖 (𝑋𝑖 − 𝑋 ) ∑𝑓(𝑋 − 𝑋̅)2
𝜎=√ = √
∑𝑁 ∑ |𝑋 − 𝑀𝑒 | 𝑁 𝑁
𝑖=1 |𝑋𝑖 − 𝑀𝑒 |
D𝑀𝑒 = = = ̅̅̅̅̅̅̅̅̅̅̅
|𝑋 − 𝑀𝑒 |
𝑁 𝑁 ∑ 𝑓𝑑 2
=√
𝑁
∑𝐾𝑖=1 𝑓𝑖 |𝑋𝑖 − 𝑀𝑒 | ∑ 𝑓|𝑋 − 𝑀𝑒 |
D𝑀𝑒 = = (Para datos tabulados y agrupados)
𝑁 𝑁
(Para datos tabulados y agrupados) TEOREMA DE CHEBYSHEV
1
100 (1 − 2 ) %
𝑘

39
Lic. Isidro W. Nina Paco

VARIANZA DE SUB-MUESTRAS
̅̅̅
𝑛𝐴 ∗ 𝑠𝐴2 + 𝑛𝐵 ∗ 𝑠𝐵2 + 𝑛𝐴 (𝑋 ̅ 2 ̅̅̅̅ ̅ 2
𝐴 − 𝑋 ) + 𝑛𝐵 (𝑋𝐵 − 𝑋 )
𝑠2 =
𝑛
𝑛𝐴 ̅̅̅
𝑋𝐴 + 𝑛𝐵 ̅̅̅̅
𝑋𝐵
𝑋̅ = , 𝑛𝐴 + 𝑛𝐵 = 𝑛
𝑛
En general para k-submuestras de 𝑀1 , 𝑀2 , … , 𝑀𝑘

∑𝑘𝑖=1(𝑛𝑖 ∗ 𝑠𝑖2 ) ∑𝑘𝑖=1 𝑛𝑖 (𝑋̅𝑖 − 𝑋̅)2 ∑𝑘𝑖=1 𝑛𝑖 𝑥̅𝑖


𝑠2 = + , 𝑑𝑜𝑛𝑑𝑒 𝑋̅ =
𝑛 𝑛 𝑛
Intra-varianza Inter-varianza

CORRECCIÓN DE SHEPPARD PARA LA VARIANZA ESTANDARIZACION DE VARIABLE


𝑐2 𝑋 − 𝑋̅
𝑉𝑎𝑟. 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑎 = 𝑉𝑎𝑟. 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠 − 𝑧=
12 𝑠
RELACIONES EMPÍRICAS ENTRE LAS MEDIDAS DE DISPERSIÓN
PROPIEDADES DE LA VARIANZA
4
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑚𝑒𝑑𝑖𝑎 = (𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟) 𝜇 = 𝑀[𝑥]
5

1) 𝜎 2 = 𝑉𝑎𝑟[𝑥] ≥ 0
2
𝑅𝑎𝑛𝑔𝑜 𝑠𝑒𝑚𝑖𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = (𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟) 2) 𝜎 2 = 𝑉𝑎𝑟[𝑥] = 𝑀[𝑥 2 ] − (𝑀[𝑥])2
3
3) 𝑉𝑎𝑟[𝑐] = 0 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑐 = 𝑐𝑡𝑡𝑒.
DISPERSIÓN ABSOLUTA Y RELATIVA 4) 𝑉𝑎𝑟[𝑐𝑥] = 𝑐 2 𝑉𝑎𝑟[𝑥]
𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 5) 𝑉𝑎𝑟[𝑥 + 𝑐] = 𝑉𝑎𝑟[𝑥]
𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 =
𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 6) 𝑉𝑎𝑟[𝑐𝑥 + 𝑑] = 𝑐 2 𝑉𝑎𝑟[𝑥]

COEFICIENTE DE VARIACIÓN
𝑠
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = 𝐶𝑉 = ∗ 100
𝑋̅

40
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.

Con los siguientes datos:


1
𝑦 = (8𝑥 − 2); 𝑥̅ = 4 𝑆𝑥 = 2 𝑆𝑒 𝑝𝑖𝑑𝑒 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑟: 𝑉[𝑌] 𝑦 𝑀[𝑌]
4
Solución:

x4
y  1 / 4  8 x  2  y  8 x  2  2 x  0,5 Siendo S x  2
4 4
Sx  4
2

M  y   2M x   0,5  8  0,5  7,5  y ; V y   V2 x   V0,5

V y   4V X   44 16  2


Sy  16  Sy 4

EJERCICIO 2.

Tres profesores de contabilidad básica registraron una calificación media en sus exámenes de 55, 64,
70, con desviaciones típicas de 7, 9, 10; sus clases estaban formadas por 65, 60 y 70 estudiantes
respectivamente. Determinar la calificación media y la desviación típica para el conjunto de los 195
estudiantes, ¿Cuáles serían estas medidas, si todos los cursos tienen el mismo número de
estudiantes?

Solución:

55 65  64 60  70 70 12315


x    63.15
195 195

 S 22 n 2  S 32 n3 x1  x  n1  x 2  x  n 2  x3  x  n3
2 2 2 2
S1 n1
S
2
 
n1  n 2  n3 n1  n 2  n3

4965  8160  100 70 55  63,15 65  64  63,15 60  70  63,15 70
2 2 2
S
2
 
195 195
15.045 7645,39
S
2
   77,15  39,21  116,36
195 195

S
2
 116,36
S  10,79

Si se considera que todos los cursos tienen el mismo número de estudiantes, los estadígrafos serían:

55  64  70 189
x    63
3 3

41
Lic. Isidro W. Nina Paco

49  81  100 55  63  64  63  70  63


2 2 2
S
2
 
3 3

230  8  1  7   64  1  49 
2 2 2
S
2
   76,67   
3 3  3

114
S
2
 76,67   76,67  38  114,67
3
S  10,71

EJERCICIO 3.

Dada una serie de valores de 𝑥: 5, 3, 6, 2, comprobar que siendo 𝑦 = 3𝑥 + 4, la media de la serie 𝑦 es


𝑦̅ = 3𝑥̅ + 4 y su varianza: 𝑆𝑦2 = 9𝑠𝑥2

Solución:

xi 16
x : 5, 3, 6, 2 x  x  4
n 4

xi2
S
2
  x2 Sx
2

74
 4 2  18,5  16  2,5
2
Sx  2,5
n 4

y  3x  4 M Y   3 M  X   4 M Y   3 4  4  16 y  16

VY   9 V X   0 VY   9 2,5  22,5

SY
2
 9S X2  9 2,5  22,5
EJERCICIO 4.

Un micro mercado vende un promedio mensual de Bs. 300.000 en diferentes artículos con una
desviación típica de Bs. 3.000.

a) El micro mercado paga un impuesto igual al 13% de las ventas. ¿Cuál será la varianza de las
ventas una vez pagado el impuesto?
b) Las utilidades del micro mercado se calculan teniendo en cuentas que mensualmente se
pagan Bs. 245.000 por salarios, gastos, etc. Además del impuesto sobre las ventas. Calcule el
coeficiente de variación de las utilidades.

Solución:

a) 300.0000,13  39.000 y le queda Bs. 261.000

2
S X  K   S X2  no cambia, por lo tanto S
2
 3.0002

42
Lic. Isidro W. Nina Paco

b) Utilidad = ingresos – gastos  300.000  245.000  Bs.55.000

2
S X K   S X2  no cambia, por lo tanto S  3.000

S 3.000
CV  100   5,45%
x 55.000

EJERCICIO 5.

En un grupo de 70 personas, se sabe que 30 de ellas tiene un salario medio diario de Bs, 2.800 y los
restantes de Bs. 3.500.

a) Se pide calcular el salario medio diario de las 70 personas.


b) Si se sabe que el coeficiente de variación es del 35%, ¿Cuál es la desviación típica de los salarios
diarios de las 70 personas?

Solución:

30 2.800  40 3.500
a) x   Bs.3.200 Salario diario promedio para los 70 primeros
70

b) 0,35 
S
 S  0,35 3.200  Bs. 1.120
3.200

EJERCICIO 6.

Con los siguientes datos: 4, 7, 10, 15 y 25. Calcular la desviación típica, desviación media y mediana.
Observar que 𝑆 > 𝐷𝑀 ≥ 𝐷𝑀𝑒

Solución:

xi xi  x xi  M e x i2 x 
61
 12,2
5
4 8,2 6 16
7 5,2 3 49
10 2,2 0 100
15 2,8 5 225 M e  10
25 12,8 15 625
 31,2 29 1.015

 xi  X 31,2
DM    6,24
n 5

 Xi  Me 29
DM e    5,8
n 5

43
Lic. Isidro W. Nina Paco

 xi2 1.015
S
2
  x2   12,2 2  54,16
n 5

S  54,16  7,36

7,36 > 6,24 > 5,8 S  DM  DM e Se cumple la relación

EJERCICIO 7.

Con los siguientes datos:

28 42 64 32 68 25 34 40 51 62
36 56 76 40 70 28 38 46 58 64
Se pide:

a) Trabajando con los datos originales calcular la desviación típica y desviación mediana y el
coeficiente de variación.
b) Agrupar los datos en una tabla de frecuencias, teniendo en cuenta que la amplitud es constante
(la variable es continua) y m=6, calcular el coeficiente de variación.

Solución:

a) n  20 x  958  47 ,9
20

50 .630  20 47 ,9 
2
S
2
  237 ,09  S  15,40
20

 Desviación típica S = 15,40


15,40
 Coeficiente de variación  CV  S
100  100  32 ,15
x 47 ,90
 Mediana:

25 28 28 32 34 36 38 40 40 42 46 51 56 58 62 64 64 68 70 76

42  46
Me   44
2

 Desviación mediana:  xi  M e  19  16  16  12  10  8  6  4  4 

2  2  7  12  14  18  20  20  24  26  32  272

 xi  M e
DM e   272  13,6
n 20

Rango 51
b) Rango  76  25  51 C  9
m 6

44
Lic. Isidro W. Nina Paco

946
X i'1  X i' fi Xi X i fi X i2 f i X   47 ,3
20
23,1 – 32 4 27,5 110,0 3.025,00
32,1 – 41 5 36,5 182,5 6.661,25
49 .379  20 47 ,3
2
41,1 – 50 2 45,5 91,0 4.140,50 S
2

20
50,1 – 59 3 54,5 163,5 8.910,75
59,1 – 68 4 63,5 254,0 16.129,00
68,1 – 77 2 72,5 145,0 10.512,50 S
2
 231,66
 20 - 946,0 49.379,00
S  15,22

15,22
CV  100  32 ,18 %
47 ,30

EJERCICIO 8.

Los siguientes datos corresponden a la distribución de frecuencias de los gastos de publicidad (miles
de bolivianos) de 50 empresas comerciales, durante el último semestre del 2016. Dichos gastos se
agruparon en cuatro clases de amplitud constante, de la cual se sabe:

𝑥1 = 3,5 𝑥4′ = 8,75 𝑓1 = 4 𝐹2 = 20 𝑓3 = 25

Se pide calcular el coeficiente de variación, desviación media y la desviación mediana.

Solución:

X i'1  X i' Xi fi Fi X i fi X i2 f i
2,75 – 4,25 3,5 4 4 14,00 49,00
4,25 – 5,75 5,0 16 20 80,00 400,00
5,75 – 7,25 6,5 25 45 162,50 1.056,25
7,25 – 8,75 8,0 5 50 40,00 320,00
 - 50 - 296,50 1.825,25

xo' 
1
C  x1 xo'  4 C  x4'
2

Reemplazando tenemos: xo'  0,5 C  3,5 xo'  4 C  8,5

Si eliminamos a xo' se obtendrá el valor de C xo'  4 C  8,75


1
 xo'  C   3,50
2

3,5C  5,25

5,25
C   1,50
3,50

a) Coeficiente de variación

45
Lic. Isidro W. Nina Paco

 xi f i 296,50
x   5,93
n 50

 X i2 f i 2
S
2
 X
n
1.825 ,25
S
2
  5,93 2  36,51  35,16  1,35 S  1,16  1,35
50

S 1,16
CV  CV   0,1956  19 ,56 %
x 5,93

b) Desviación media

Xi di di fi di fi
3,5 -2,43 2,43 4 9,72
5,0 -0,93 0,93 16 14,88
6,5 0,57 0,57 25 14,25
8,0 2,07 2,07 5 10,35
 - - 50 49,20

 d i f i 49,20
DM    0,98
n 50

c) Desviación mediana

xi fi Fi xi  M e xi  M e f i  X i  M e fi
DM e 
3,5 4 4 3,0 12,0 n
20
5,0 16 1,5 24,0 43,5
 N J 1 DM e   0,87
6,5 25 45 Nj 0 0
50

8,0 5 50 1,5 7,5


 50 - - 43,5

M e  xi  6,5
n n  50  25
Fi 1 
2 2 2

EJERCICIO 9.

Sabiendo que 𝑦 = 6 − 10𝑥 𝑉[𝑥] = 8. Hallar la varianza de 4𝑥 − 𝑦

46
Lic. Isidro W. Nina Paco

Solución:
y  6  10 x

VY   V6  10 x  0  V10 X   100V X 

Sy
2
 100 8  800

V4 X  Y   V4 X   VY   16V X   VY  S


2
 128 S
2
 800
x y

168  800  128  800  928

Podemos concluir que hay una diferencia entre las dos varianzas.

47
Lic. Isidro W. Nina Paco

48
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.

Durante un período de 3 años, los precios de un producto fueron en promedio de $us 8.000, con una
desviación típica de $us 120. En el período anterior de 3 años, el promedio fue de $us 5.000 con una
varianza de $us 3.600 ¿En qué período hubo mayor estabilidad?

Solución:

Siendo: 2
SA  14.400 SA  120 2
SB  3.600 SB  60 SB  SA

60  120
Hubo mayor estabilidad en B, porque la varianza o la desviación estándar es menor que la de A.

EJERCICIO 2.

Si un conjunto de n valores de 𝑥𝑖 se sabe que: ∑ 𝑥𝑖 = 10 ; ∑ 𝑥𝑖2 = 260 ; 𝑠2 = 25. Se


pide encontrar el valor de n.

Solución:
n  10

EJERCICIO 3.

Hallar la desviación típica de dos números cuya media aritmética es 9,0 y su media geométrica es 7,2

Solución:
S  5,4

EJERCICIO 4.

En un conjunto de n valores de X, se sabe ∑ 𝑥𝑖2 = 1.360 ; ∑ 𝑥𝑖 = 40 y 𝑛𝑠2 = 1.280. Se pide


encontrar n.

Solución:
n  20

EJERCICIO 5.

Se analizaron en el primer semestre del año, los gastos de una empresa de construcciones y se
obtuvo un promedio de Bs. 1.740.000 y una desviación típica de Bs. 90.000 se determinó luego que
los contadores de esta empresa habían prescindido de Bs. 13.000 en los gastos por un error de
apreciación. Corrigiendo las medidas enunciadas, obtenga el coeficiente de variación de los gastos de
esta empresa.

Solución:
CV  5,13%

49
Lic. Isidro W. Nina Paco

EJERCICIO 6.

Las notas de 50 alumnos se clasifican en una tabla de frecuencias con cuatro intervalos de igual
magnitud. Se pide calcular el coeficiente de variación, sabiendo que:

𝑥2 = 50 𝑓1 = 4 𝐹2 = 20 𝑓3 = 25 𝑥̅ = 62,4

Solución:

CV = 24,74%

EJERCICIO 7.

El cuadro de pagos en dos fábricas para el año 2016 fue así:

Medidas Fábrica A Fabrica B


Salario medio semanal Bs. 930 Bs. 1.020
Desviación típica del salario semanal Bs. 96 Bs. 97

a) ¿En cuál de las fábricas los jornales fueron absolutamente más variables?
b) ¿Relativamente más variables?

Solución:

a) SA  96 SB  97 SB  SA 97 > 96

b) CV A  10,32% CVB  9,51% CV A  CVB


EJERCICIO 8.

Los siguientes datos muestran el número de cuartos habitables en 60 viviendas localizadas en una
ciudad

No. de cuartos: 2 4 6 8 10
No. de viviendas: 6 18 16 12 8
Obtenga e interprete para estos datos la desviación típica, la desviación mediana y el coeficiente de
variación.

Solución:

S  2,3943 DM e  1,93 𝐶𝑉 = 40,30%

La desviación mediana debe ser menor que la desviación típica


DM e  S  1,93  2,17 Queda comprobado
EJERCICIO 9.

Con los datos, correspondientes a dos submuestras.

𝑥𝑖 : 4 6 7 6 10 6 4 15 6
𝑦𝑖 : 10 18 12 20 8 10

50
Lic. Isidro W. Nina Paco

Se pide:

a) Calcular las desviaciones típicas de cada submuestra

b) Determine en cada una de las submuestras la mejor posición de los siguientes valores 𝑥 = 8 y 𝑦 =
15
c) Trasformando las dos submuestras en una sola muestra, calcular el coeficiente de variación.

Solución:

a) S1  3,25 S2  4,44 b) Z 1  0,27 Z 2  0,45 c) CV  50,16%

EJERCICIO 10.

Una distribución de frecuencias simétrica presenta las siguientes características:


3 3 3
𝑓𝑖
∑ 𝑓𝑖 = 5 ∏ 𝑋𝑖 = 233.280 ∑ 𝑋𝑖 𝑓𝑖 = 60 𝑓1 = 1
𝑖=1 𝑖=1 𝑖=1

Elabora una tabla de frecuencias y calcule el coeficiente de variación.

Solución:
CV  15,83%

EJERCICIO 11.

En un grupo de 70 personas, se sabe que 30 de ellas tiene un salario medio diario de $us 27 y los
restantes de $us 32

a) Se pide calcular el salario medio diario de las 70 personas.


b) Si se sabe que el coeficiente de variación es del 35%, ¿Cuál es la varianza de los salarios
diarios de las 70 personas?

Solución:

a) x  $29,86 Salario diario promedio para los 70 primeros

b) S 2  109.20

EJERCICIO 12.

Con los siguientes datos determine la simetría o asimetría de la distribución aplicando las diferentes
vistas.

Xi fi
5 3
7 39
9 10
11 8

51
Lic. Isidro W. Nina Paco

13 7
15 3
 70

Realice un histograma y dibuje el polígono de frecuencia.

Solución:

m3 17,06
A3  3
  1,07
S 2,523
Hay una asimetría positiva

EJERCICIO 13.

Se tiene dos distribuciones

1) 2)

𝑥1 = 12 𝑥3 = 6 𝑥5 = 23 𝑥7 = 4 𝑥9 = 6
X i'1  X i' fi
𝑥2 = 18 𝑥4 = 20 𝑥6 = 17 𝑥8 = 10 𝑥10 = 4
2,1 – 6 22
6,1 – 10 14
10,1 – 14 10
14,1 – 18 8
18,1 – 22 4
22,1 – 26 2
 60

Se pide determinar:

a) ¿En cuál distribución se observa una mayor variación absoluta?


b) ¿En cuál distribución se observa una menor variación relativa?
c) Si consideramos un valor de 18, ¿En cuál de las distribuciones se tiene una mayor posición
relativa?

Solución:

a) SA  5,71 S B  6,71 SB  SA

b) CV A  59,48% ; CVB  55,92% CVB  CV A


c) Puntaje típico: Z A  1,47 Z B  0,89 Z A  ZB

EJERCICIO 14.

52
Lic. Isidro W. Nina Paco

Los salarios mensuales (en $us) que paga una fábrica a los operarios que trabajan en dos turnos,
tiene las siguientes estadísticas.

Medidas Turno I Turno II


Número de trabajadores 38 62
Salario medio mensual 978 1.203,5
Varianza 851,6 962,6

a) Comparar los salarios en los dos turnos en cuanto a variabilidad absoluta y relativa.
b) Obtener el coeficiente de variación para el salario de los 100 operarios.
c) Cuál será el coeficiente de variación para el año entrante si el gerente ofrece un aumento de
$22 para los del primer turno y un 7% para los del segundo turno. El coeficiente de variación
a calcular, se refiere al total de los 100 operarios

Solución:

a) 851,6  962,6  Hay una mayor variabilidad absoluta en el turno II


b) CVI  0,094% CVII  0,082%
CV1  CV 2 Hay mayor variabilidad relativa en el primer turno.

c) CV1  0,092% CV2  0,076% CV1  CV 2

53
Lic. Isidro W. Nina Paco

54
Lic. Isidro W. Nina Paco

TEMA 4:
MEDIDAS DE FORMA Y
MOMENTOS

La verdadera ignorancia no es la ausencia de


conocimientos, sino el hecho de negarse a
adquirirlos. (Karl Popper)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 4: MEDIDAS DE FORMA Y MOMENTOS


FORMULARIO 4
MOMENTOS RESPECTO AL ORIGEN
MOMENTOS EN FORMA ADIMENSIONAL
∑𝑁 𝑟
𝑗=1 𝑋𝑗 ∑ 𝑋𝑟
̅̅̅̅
𝑋 𝑟 = 𝑚𝑟,0 = = 𝑚𝑟 𝑚𝑟 𝑚𝑟
𝑁 𝑁 𝑎𝑟 = 𝑟
= 𝑟
=
𝜎 (√𝑚2 ) √𝑚2𝑟

∑𝐾 𝑟
𝑖=1 𝑓𝑖 𝑋𝑖 ∑ 𝑓𝑋 𝑟
̅̅̅̅
𝑋 𝑟 = 𝑚𝑟,0 = =
𝑁 𝑁 SESGO
(Para datos tabulados y agrupados)
MOMENTOS RESPECTO A LA MEDIA 𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆𝒔 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐 𝒅𝒆 𝑷𝒆𝒂𝒓𝒔𝒐𝒏
𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑜𝑑𝑎 𝑋̅ − 𝑚𝑜𝑑𝑎
∑𝑁 ̅ 𝑟
𝑖=1(𝑋𝑖 − 𝑋 )
𝐶𝑆1 = =
𝑚𝑟 = 𝑚𝑟,𝑋̅ = = ̅̅̅̅̅̅̅̅̅̅̅̅
(𝑋 − 𝑋̅)𝑟 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑠
𝑁
̅ 𝑟 3(𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 ) 3(𝑋̅ − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
∑𝐾
𝑖=1 𝑓𝑖 (𝑋𝑖 − 𝑋 ) 𝐶𝑆2 = =
𝑚𝑟 = 𝑚𝑟,𝑋̅ = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑠
𝑁
(Para datos tabulados y agrupados) 𝑪𝒐𝒆𝒇. 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐 𝒅𝒆 𝑩𝒐𝒘𝒍𝒆𝒚
MOMENTOS RESPECTO A CUALQUIER VALOR 𝑄3 − 2𝑄2 +𝑄1
‘A’ 𝐶𝑞 𝑆 =
∑𝑁𝑖=1(𝑋𝑖 − 𝐴)
𝑟 ∑(𝑋 − 𝐴)𝑟 ∑ 𝑑 𝑟 𝑄3 − 𝑄1
𝑚′𝑟 = 𝑚𝑟,𝐴 = = =
𝑁 𝑁 𝑁

∑𝐾
𝑖=1 𝑓𝑖 (𝑋𝑖 − 𝐴)
𝑟 𝑪𝒐𝒆𝒇. 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐: 𝟏𝟎 − 𝟗𝟎
𝑚′𝑟 = 𝑚𝑟,𝐴 =
𝑁 𝑃90 − 2𝑃50 +𝑃10
𝐶𝑝 𝑆 =
(Para datos tabulados y agrupados) 𝑃90 − 𝑃10

RELACIÓN ENTRE MOMENTOS


𝑚1′ = 𝑋̅ − 𝐴 𝑪𝒐𝒆𝒇. 𝒎𝒐𝒎𝒆𝒏𝒕𝒐 𝒅𝒆 𝒔𝒆𝒔𝒈𝒐 𝒅𝒆 𝑭𝒊𝒔𝒉𝒆𝒓
𝑚3,𝑥̅ 𝑚3,𝑥̅ 𝑚3,𝑥̅
𝑎3 = 3 = 3 =
∑ 𝑓𝑢𝑟 𝜎 (√𝑚2,𝑥̅ ) 3
𝑚𝑟′ = 𝑐 𝑟 = 𝑐 𝑟 ̅̅̅
𝑢𝑟 √𝑚2,𝑥̅
𝑁
(Para datos agrupados) CURTOSIS (Medidas para
distribuciones aprox. simétricas)
CORRECCIÓN DE SHEPPARD
1 𝑪𝒐𝒆𝒇. 𝒎𝒐𝒎𝒆𝒏𝒕𝒐 𝒅𝒆 𝒄𝒖𝒓𝒕𝒐𝒔𝒊s de Fisher
𝑚2 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚2 − 𝑐 2 < 3 (𝑝𝑙𝑎𝑡𝑖 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)
12 𝑚4,𝑥̅ 𝑚4,𝑥̅
1 2 7 4 𝑎4 = 4 = 2 = { 3 (𝑚𝑒𝑠𝑜 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)
=
𝑚4 𝑐𝑜𝑟𝑟𝑒𝑔𝑖𝑑𝑜 = 𝑚4 − 𝑐 𝑚2 + 𝑐 𝜎 𝑚2,𝑥̅
2 240 > 3 (𝑙𝑒𝑝𝑡𝑜 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)

𝑪𝒐𝒆𝒇. 𝒑𝒆𝒓𝒄𝒆𝒏𝒕𝒊𝒍 𝒅𝒆 𝒄𝒖𝒓𝒕𝒐𝒔𝒊𝒔


< 0,263 (𝑝𝑙𝑎𝑡𝑖 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)
𝑄 𝑃75 − 𝑃25
𝐾= = = {= 0,263 (𝑚𝑒𝑠𝑜 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)
𝑃90 − 𝑃10 2(𝑃90 − 𝑃10)
> 0,263 (𝑙𝑒𝑝𝑡𝑜 − 𝑐𝑢𝑟𝑡𝑖𝑐𝑎)

55
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.
Conteste si es cierto o falso y por qué:

a) En toda serie de datos ∑ 𝑥𝑖2 /𝑛 es mayor o igual a (∑ 𝑥𝑖 ⁄𝑛)2


b) Si para dos distribuciones 𝑥̅1 = 𝑥̅2 y 𝑆12 > 𝑆22 entonces 𝐶𝑉1 > 𝐶𝑉2
c) Si el coeficiente de asimetría es negativo, la curva es achatada.
d) Sí a los valores de un conjunto de datos se multiplica por 8, la varianza de ese nuevo conjunto de
valores es igual a 64 por la varianza del conjunto de datos original.
e) La varianza está expresada en las mismas unidades de la variable.

Solución:
a) CIERTO: Como la varianza siempre es mayor o igual a 0, y está definida por:
2
∑ 𝑥𝑖2 ∑ 𝑥𝑖
𝑉[𝑥] = −( ) ≥0
𝑛 𝑛
Entonces:
2
∑ 𝑥𝑖2 ∑ 𝑥𝑖
≥( )
𝑛 𝑛

b) CIERTO: 𝑆12 > 𝑆22


1 1
2 > 2 (1)
𝑆2 𝑆1
𝑐𝑜𝑚𝑜 𝑥̅1 = 𝑥̅2 ⟹ 𝑥̅12 = 𝑥̅22 (2)

Multiplicando (2) a (1), se tiene:


𝑥̅22 𝑥̅12 𝑥̅ 2 𝑥̅ 2 𝑥̅2 𝑥̅1
> ⟹ √ 22 > √ 12 ⟹ > ⟹ 𝐶𝑉2 < 𝐶𝑉1
𝑆22 𝑆12 𝑆2 𝑆1 𝑆2 𝑆1

c) FALSO: no hay confirmación alguna respecto a esta relación

d) CIERTO: VKX   K 2 S X2  8 2 S X2

e) FALSO: Las mismas unidades pero elevadas al cuadrado.

EJERCICIO 2.
Con los salarios semanales (en $us) de los empleados de una empresa se tienen los siguientes
resultados:

𝑥̅ = 97,25 𝑀𝑒 = 96,72 𝑆 = 12,7


Calcular el coeficiente de asimetría de Pearson
Solución:

56
Lic. Isidro W. Nina Paco

3  x  M e  3 97,25  96,72
AS    0,125 Ligeramente asimétrica positiva
S 12,7
EJERCICIO 3.
Con los siguientes datos:

28 42 64 32 68 25 34 40 51 62
36 56 76 40 70 28 38 46 58 64

Se pide:
a) Trabajando con los datos originales calcular la desviación típica y desviación mediana y coeficiente
de variación.
b) Agrupar los datos en una tabla de frecuencias, teniendo en cuenta que la amplitud es constante (la
variable es continua) y m=6, calcular el coeficiente de variación.
c) Calcular para el inciso b) las medidas de sesgo: 𝐶𝑆1 , 𝑎3 y las medidas de curtosis: 𝑎4 , 𝐾

Solución:

a) n  20 x  958  47 ,9
20

50 .630  20 47 ,9 
2
S
2
  237 ,09  S  15,40
20

 Desviación típica S = 15,40


15,40
 Coeficiente de variación  CV  S
100  100  32 ,15
x 47 ,90
 Mediana:

25 28 28 32 34 36 38 40 40 42 46 51 56 58 62 64 64 68 70 76

42  46
Me   44
2

 Desviación mediana:  xi  M e  19  16  16  12  10  8  6  4  4 

2  2  7  12  14  18  20  20  24  26  32  272

 xi  M e
DM e   272  13,6
n 20

Rango 51
b) Rango  76  25  51 C  9
m 6

X i'1  X i' fi Xi X i fi X i2 f i
23,1 – 32 4 27,5 110,0 3.025,00

57
Lic. Isidro W. Nina Paco

32,1 – 41 5 36,5 182,5 6.661,25 946


X   47 ,3
41,1 – 50 2 45,5 91,0 4.140,50 20
50,1 – 59 3 54,5 163,5 8.910,75
59,1 – 68 4 63,5 254,0 16.129,00 49 .379  20 47 ,3
2
S
2

68,1 – 77 2 72,5 145,0 10.512,50 20
 20 - 946,0 49.379,00
S
2
 231,66

S  15,22

15,22
CV  100  32 ,18 %
47 ,30

EJERCICIO 4.
Suponga que se tiene otra distribución que presenta las siguientes medidas:

𝑥̅ = 38.5 𝑦 𝑆 2 = 36
Comparando con los resultados del ejercicio anterior (ejercicio 3), determinar;
a) ¿Cuál de las dos distribuciones presenta una menor variabilidad absoluta?
b) ¿Cuál de ellas presenta una mayor variabilidad relativa?
Solución:

a)
2
S1  36 ; S2
2
 231,66  2
S2  S12
231,66  36 Mayor variabilidad en el segundo caso

b) CV1  6 100  15,58 %


38,5

CV2  32 ,18 % CV 2  CV1

32,18 %  15,58% Mayor variabilidad relativa en la


segunda distribución

EJERCICIO 5.
Los salarios mensuales que paga una fábrica a los operarios que trabajan en dos turnos tienen las
siguientes estadísticas.

Medidas Turno I Turno II


Número de trabajadores 38 62
Salario medio mensual 3000 4500
Varianza 10000 19600

58
Lic. Isidro W. Nina Paco

a) Comparar los salarios en los dos turnos en cuanto a la variabilidad absoluta y relativa
b) Obtener el coeficiente de variación para el salario de los 100 operarios
c) Cuál será el coeficiente de variación para el año entrante si el gerente ofrece un aumento de Bs. 200
para los del primer turno y un 7% para los del segundo turno. El coeficiente de variación a calcular,
se refiere al total de los 100 operarios.

Solución:

a) 10000  19600  Hay una mayor variabilidad absoluta en el turno II

10000
b) CV I  100  3.33%
3000

19600
CV II  100  3.11%
4500
CV1  CV 2 Hay mayor variabilidad relativa en el primer turno.

100
c) x1  K  3000 200  Bs.3200 CV1  100  3.125%
3200

140
x2  K  4500  315  Bs.4815 CV2  100  2.91%
4815
CV1  CV 2

3.125%  2.91%

EJERCICIO 6.
A los trabajadores de una empresa, el próximo año, el salario mensual les será aumentado en un 4,5%
más Bs. 140. La empresa tiene 120 trabajadores y actualmente devengan un salario medio mensual de
Bs. 4.800, con un coeficiente de variación de 0,26.
a) ¿Cuál será la varianza de los salarios el próximo año?
b) El próximo año, ¿Cuál será el valor total de la nómina mensual?
Solución:
x  ( x k )  4.800  4.800  0,045  140  5.156

x  Bs.5.156 nueva media aritmética

 5.1560,26  Bs.1.340,56
S S
CV  100  0,26   S
x 5.156

a) S
2
 1.340,562 y su desviación será Bs.1.340,56

b) La varianza no cambia, cuando utilizamos la propiedad que dice:

V X K   V X   VK   S X2

59
Lic. Isidro W. Nina Paco

EJERCICIO 7.

Con la siguiente información, determine el Coeficiente de Asimetría de Pearson y el coeficiente


percentil de Curtosis.
Se sabe:
𝑀𝑒 = 80,45 𝑘𝑔 𝑃10 = 62,25 𝑘𝑔 𝑃25 = 72,22 𝑃75 = 88,21 𝑘𝑔 𝑃90 = 94,43 𝑘𝑔

Peso de los trabajadores:

𝑋′𝑖−1 − 𝑋′𝑖 X f X*f


55 - 65 60 8 480
65 - 75 70 9 630
75 - 85 80 22 1760
85 - 95 90 14 1260
95 - 105 100 5 500
58 4630

Solución.
3(𝑥̅ − 𝑀𝑒 )
𝐶𝑎 =
𝑠
∑(𝑋 ∗ 𝑓) 4.630
𝑋̅ = ; 𝑋̅ = = 79,83 𝑘𝑔
𝑁 58
2
∑(𝑋 − 𝑋̅)
𝑆=√
𝑁

Peso de los trabajadores:

𝑋′𝑖−1 − 𝑋′𝑖 X f (𝑥 − 𝑋̅ ) (𝑥 − 𝑥̅ )
2
(𝑥 − 𝑥̅ )
2
∗ 𝑓
55 - 65 60 8 -19,8275862 393,133175 3145,0654
65 - 75 70 9 -9,82758621 96,5814507 869,233056
75 - 85 80 22 0,17241379 0,02972652 0,65398335
85 - 95 90 14 10,1724138 103,478002 1448,69203
95 - 105 100 5 20,1724138 406,926278 2034,63139

7.498,28
𝑆=√ = 11,37 𝑘𝑔
58

3(79,83 − 80,45)
𝐶𝑎 = = −0,16
11,37
Por lo tanto -0,16 es Moderadamente sesgada hacia la izquierda. El signo – ó + indica si el sesgo
es para la izquierda (-) o para la derecha (+).
𝑃75 − 𝑃25 88,21 − 72,22
𝐾= ; 𝐾= = 0,248
2(𝑃90 − 𝑃10 ) 2(94,43 − 62,25)

60
Lic. Isidro W. Nina Paco

Como el resultado obtenido 0,248 es menor que 0,263 se concluye que la Distribución es
Platicúrtica.
EJERCICIO 8.

En el mes de Enero el sueldo promedio de los trabajadores del sector industrial era de $us 200. Para
el mes de Julio se considera un aumento del 30% al sueldo del mes de Enero más un adicional de $us
50 Si el coeficiente de variación en Enero era de 0.25, ¿Se puede decir que la distribución de sueldos
en Julio es más homogénea?

Solución.

Sea 𝑋: Sueldos de Enero, 𝑌: Sueldos de Julio

La media de Enero es: 𝑥̅ = $us 200.

Coeficiente de variación en Enero, 𝐶𝑉 = 0.25

La desviación estándar de Enero es 𝑠𝑥 = 𝐶𝑉 × 𝑥̅ = 0.25*200 = $us 50

La relación entre las dos variables es:

𝑌 = 1.30𝑋 + 50
Entonces, la media de los sueldos de Julio es

𝑦̅ = 1.3𝑥̅ + 50 = 1.3(200) + 50 = 310

La varianza de los sueldos de Julio es

𝑠𝑌2 = (1.3)2 𝑠𝑋2 = (1.3)2 (50)2 = 4225

La desviación estándar: 𝑠𝑌 = √4225 = 65


𝑆𝑌 65
Coeficiente de variación en Julio: 𝐶𝑉 = = = 0.2097
𝑦̅ 310

Comparando los coeficientes de variación de Enero y Julio se puede decir que la distribución de los
sueldos de Julio es más homogénea.

EJERCICIO 9.

Si el ingreso de 120 obreros tiene una media de $us 300 y una desviación estándar de $us 30

a) ¿Cuántos obreros por lo menos tienen sueldos comprendidos en el intervalo [$240, $360]?.

b) Determinar el intervalo que contiene al menos el 88.889% de los ingresos

c) Si el mínimo sueldo es $us 210, en qué porcentaje se puede afirmar que los ingresos son superiores
a $us 390?

Solución.

a) 𝑥̅ = $300, 𝑠 = $30, de la relación

[300 − 𝑘(30), 300 + 𝑘(30)] = [240, 360]

61
Lic. Isidro W. Nina Paco

1 3
Resulta 𝑘 = 2. Entonces el, 1 − = o 75% (120)=90 obreros por los menos tienen ingresos en el
22 4
intervalo [240, 360].

b) Si al menos el 88.889% de los obreros tienen ingresos en el intervalo

[300 − 𝑘(30), 300 + 𝑘(30)]


1
Entonces, 1 − = 0.8889. De donde resulta k = 3.
𝑘2

Luego, el intervalo es [$us 210, $us 390].

c) Fuera del intervalo [$us 210, $us 390] está menos del 11.11% de los ingresos. Si el mínimo es $210,
entonces, el porcentaje de ingresos mayor que $us 390 es menos de 11.11 %.

EJERCICIO 10

El costo inicial de producción, X ; de una muestra de 80 objetos de cierto tipo, tiene una desviación
estándar de $us 30. La media del costo de producción es de $us 250 para el 60% de la muestra y de
$us 200 para el resto. El costo final de producción Y es dado por la relación:

𝑌 = 1.2𝑋 + 5

Si el precio de venta de cada objeto de la muestra es proporcional al cuadrado del costo final de
producción, ¿cuánto se recaudaría por la venta total?.

Solución.

𝑠𝑥 = $𝑢𝑠 30, 𝑥̅ = 250 ∗ 0.60 + 200 ∗ 0.40 = $𝑢𝑠 230

De 𝑌 = 1.2𝑋 + 5, se tiene, 𝑦̅ = 1.2𝑥̅ + 5 = 1.2(230) + 5 = 281 También,

𝑠𝑌2 = (1 .2)2 𝑠𝑋2 = (1.2)2 (30)2 = 1296


80

Recaudación total = ∑ 𝑦𝑖2 = 80 (𝑠𝑌2 + 𝑦̅ 2 ) = 80(1296 + (281)2 ) = 6,420,560.


𝑖=1

DIAGRAMAS DE CAJA.

Existe Una gran variedad de gráficas estadísticas para extraer información acerca de las propiedades
de un conjunto de datos.

Una gráfica útil para reflejar propiedades de los datos es la gráfica de caja (“box plots”) que se basa
en la mediana (o en la media), los cuartiles y valores extremos. La caja representa el rango intercuartil
que encierra el 50% de los valores y tiene la mediana (Me) dibujada dentro. El rango intercuartil tiene
como extremos el percentil 75, 𝑃75 (cuartil superior) y el percentil 25, 𝑃25 (cuartil inferior).

Además de la caja se incluye la extensión de los datos mediante segmentos que se extienden de la caja
hacia el valor máximo (U) y hacia el valor mínimo \L) de los datos. Este recuadro se dibuja con el eje
de la variable en forma horizontal o vertical como se indica en la figura que sigue.

62
Lic. Isidro W. Nina Paco

De un gráfico de cajas, se obtiene información de los datos acerca de:

La centralización (Observando la ubicación de la mediana)

La dispersión o variabilidad (mediante el rango intercuartil: 𝑅𝐼 = 𝑃75 - 𝑃25 )

La asimetría (comparando: 𝑀𝑒 — 𝑃25 𝑐𝑜𝑛 𝑃75 — 𝑀𝑒)

Las colas (por la longitud de los segmentos que salen de los lados de la caja)

EJERCICIO 11.

En una prueba de conocimientos 20 alumnos han obtenido las notas:

1,2, 3, 4, 5, 6 , 7, 8 ,9 , 10, 12, 13, 12, 13, 14, 15, 12, 13, 14, 15

Analizar los datos utilizando una gráfica de caja.

Solución.

Se observa que la mediana es igual a 11. El percentil 75 es 13 y el percentil 25 es 5.5. La extensión


superior es el dato máximo 15 y la extensión inferior es el dato mínimo 1. Además, la distribución de
los datos tiene asimetría negativa.

Los datos atípicos o discordantes o raros llamados “outliers” (aislados) son aquellos que se ubican
fuera del intervalo [𝑃25 − 1.5𝑅𝐼, 𝑃75 + 1.5𝑅𝐼], donde 𝑅𝐼 = 𝑃75 − 𝑃25 es el rango intercuartil. En este
caso, el extremo inferior 𝐿 es el dato mínimo no outlier y el extremo superior 𝑈 es el dato máximo no
outlier. Existen muchos paquetes de cómputo que proporcionan las gráficas de caja.

EJERCICIO 12

63
Lic. Isidro W. Nina Paco

Los ingresos quincenales en dólares de 40 familias se registraron de la siguiente

manera:

109, 174, 158, 211, 164, 179. 137. 175.

192, 147, 203, 186, 072, 246, 193, 163,

231, 197, 170, 190, 169, 188, 140, 237,

179, 085, 217. 168. 185, 208, 164, 175,

228, 124, 255, 151, 182, 167, 209, 169

analizar los datos utilizando un diagrama de caja.

Solución.

La mediana Me = 177.

El percentil 75 es 200 y el percentil 25 es 163.5. Rango Intercuartil: d =36.5.

𝑃75 + 1.5𝑑 = 200 + 1.5 ∗ 36.5 = 254.75. entonces. 𝑈 = 246 (𝑚á𝑥𝑖𝑚𝑜 𝑛𝑜 𝑜𝑢𝑡𝑙𝑖𝑒𝑟).
𝑃25 − 1.5𝑑 = 1 63.5 − 1.5 ∗ 36.5 = 108.9, entonces, 𝐿 = 109 (𝑚í𝑛𝑖𝑚𝑜 𝑛𝑜 𝑜𝑢𝑡𝑙𝑖𝑒𝑟).

Los outlieres (datos aislados) son: 255 en el lado superior y 72, 85 en el lado inferior. La distribución
tiene asimetría positiva.

64
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.

Con los siguientes datos determine la simetría o asimetría de la distribución aplicando las diferentes
fórmulas vistas.

Solución:

m3 17,06
a) A3  3
  1,07 Hay una asimetría positiva
S 2,523

 15,69
b) A3    0,85 Asimetría negativa
2,643

c) A3  0 Es simétrico
EJERCICIO 2.

Con los siguientes datos no agrupados 𝑥: 55 42 60 58 65, calcular:


a) Desviación media
b) Desviación mediana
c) Desviación típica
d) Comprobar que 𝐷𝑀𝑒 ≤ 𝐷𝑀 ≤ 𝑆
e) Calcular el coeficiente de variación

Solución:

a) DM  6 DM 
x i x
n

b) DM e  5,6 DM e 
x i  Me
n
c) S  7,72

d) DM e  DM  S 5,6  6  7,72

65
Lic. Isidro W. Nina Paco

S 100
e) CV  CV  13,78%
x
EJERCICIO 3.
Se tiene una distribución de 6 intervalos de amplitud constante, de la cual se sabe que:

𝑛 = 150 𝑓3 = 𝑓4 = 30 𝑓2 = 𝑓5 = 𝑓1 + 5 𝑓1 = 𝑓6 𝑋5 = 50 𝑋̅ = 41
a) Calcular el coeficiente de variación
b) Calcular el coeficiente de asimetría aplicando las diferentes fórmulas expuestas.
c) Calcular el coeficiente de apuntamiento.
Solución:

a) CV  23,22%

b) AS  0 La distribución es simétrica

c) A4  1,92  3 Achatada

EJERCICIO 4.

Calcular el Coeficiente de Pearson, y la Medida de Fisher dada la siguiente distribución: 6, 9, 9, 12, 12,
12, 15 y 17

Solución.

Coeficiente de sesgo de Pearson:


3(𝑥̅ − 𝑀𝑒 )
𝐶𝑆2 = = −0,428
𝑠
Coef. Cuartil de sesgo de Bowley:
𝑄1 − 2𝑄2 + 𝑄3
𝐶𝑞 𝑆 = = −0,6
𝑄3 − 𝑄1
Coef. Momento de sesgo de Fisher:

∑(𝑥𝑖 − 𝑥̅ )3
𝑎3 = = 0,042
𝑛𝜎 3
EJERCICIO 5.

Una prueba de conocimientos, A, se calificó sobre 20 puntos dando una media de 12 y una desviación
estándar de 2 puntos. Mientras que una prueba de aptitud, B, se calificó sobre 100 puntos, dando una
media de 70 y una desviación estándar de 5.

a) ¿En cuál de las dos pruebas los puntajes son más homogéneos?

b) Si Juan tiene 14 en A y Luis 73 en B, ¿quién tiene mejor rendimiento?

66
Lic. Isidro W. Nina Paco

Solución.

a) B, 𝐶𝑉𝐴 = 0.167, 𝐶𝑉𝐵 = 0.071,

b) Juan tiene mejor puntuación estándar

EJERCICIO 6.

Al calcular la media y la desviación estándar de 80 datos, resultaron 30 y 4 respectivamente. Un


chequeo mostró que en lugar del valor 1.7 se introdujo 17. Corrija la media y la desviación estándar

Solución.

𝑥̅ = 29.809. 5 𝑠= 4.885

EJERCICIO 7.

En una prueba de aptitud aplicada a 100 personas se obtuvo la siguiente información: Los puntajes se
tabularon en una distribución de frecuencias de 5 intervalos de amplitud iguales, siendo el puntaje
mínimo. 40 y el máximo, 90.

La frecuencia absoluta del intervalo central fue de 40 y del quinto de 10. La frecuencia relativa del
primer intervalo fue de 0.05 y la del cuarto de 0.15.

a) Calcule los cuartiles 1, 2, 3 y utilizando estas medidas analice la asimetría.

b) Calcule la varianza sí a cada persona se bonifica con 10

Solución.

a) 𝑄1 =56.67, 𝑄2 =63.75, 𝑄3 =80, asim. positiva.

b) 𝑠2 =104.75, no cambia si se suma 10

EJERCICIO 8.

Los siguientes datos muestran los calificativos de 20 personas sometidos a una prueba de aptitud. Los
20 estudiantes fueron divididos en dos grupos, al grupo 1 se calificó de 0 a 1 0 0 y al grupo 2 de 0 a 2 0
:

Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88.

Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15.

a) Calcule la media y la desviación estándar en cada grupo, ¿cuál de los grupos es más homogéneo?

b) ¿Se puede aceptar que el estudiante con 73 puntos del grupo 1 tiene mayor aptitud que el
estudiante con 13 puntos del grupo 2?

Solución.

a) 𝐶𝑉1 =0.0744, 𝐶𝑉2 =0.1313

b) No, 𝑧1=-2, 𝑧2 = - 1.67 el del segundo grupo está mejor

67
Lic. Isidro W. Nina Paco

EJERCICIO 9.

Los sueldos en dólares de los empleados de dos empresas A y B se dan en la siguiente tabla de
frecuencias:

Sueldos [50, 90[ [90. 130[ [130, 170[ [170,210[ [210,250]


Empresa A 12 14 16 60 20
Empresa B 30 80 15 14 13

a) Calcule la asimetría de las distribuciones A y B. Grafique las ojivas relativas. ¿Es el rango intercuartil
de A, menor al rango intercuartil de B?

b) ¿En qué empresa los sueldos son más homogéneos?

c) Si un empleado de A y otro de B ganan cada uno $130, ¿quién de ellos está mejor ubicado en su
centro de trabajo?

Solución.

a) 𝐴𝑆𝐴 = - 0.813, 𝑅𝐼𝐴 =61 .75, 𝐴𝑆𝐵 =-1.019. 𝑅𝐼𝐵 =46.667, NO.

b) En A. 𝐶𝑉𝐴 =47.286/170.328=0.278, 𝐶𝑉𝐵 =45.907/123.648=0.371,

c) 𝑍𝐴 = -0.853, 𝑍𝐵 =0.1376 el de A

EJERCICIO 10.

Las notas de un examen se tabularon en una distribución de frecuencias de cuatro intervalos de


amplitud iguales a cuatro, siendo el dato mínimo igual a cuatro y las frecuencias relativas primera y
tercera respectivamente 0.15 y 0.35. Calcule la varianza de la distribución si la media aritmética es
12.4.

Solución.

15.04

EJERCICIO 11.

Un conjunto habitacional está formado por 3 edificios de departamentos Se tiene los siguientes datos
respecto al consumo mensual de electricidad de cada uno de los edificios.

Edificio 1: Tiene 8 departamentos, la media y la desviación estándar de los consumos es Bs. 85 y Bs. 12
respectivamente.

Edificio 2: Tiene 9 departamentos cuyos consumos en bolivianos son: 88, 92, 106, 110, 93, 102,91,94.
80.

Edificio 3: Los consumos se dan en la siguiente tabla:

Consumo en Bs. Departamentos


[50. 60[ 1
[60, 70[ 2
[70, 80[ 4

68
Lic. Isidro W. Nina Paco

[80, 90] 3
a) ¿Cuál de los edificios tiene el menor consumo de electricidad?

b) ¿Cuál es el consumo promedio en todo el conjunto habitacional?

c) ¿En cuál de los edificios los valores que representan los consumos están más dispersos?.

Solución.

a) Edif 1: con Bs.680. b) Bs. 84.296. c) en Edifi 1. CV1=0.14.

EJERCICIO 12.

En una empresa el coeficiente de variación de los ingresos de 150 empleados es 69%. Después de un
aumento de los sueldos en $us 85 a cada uno de ellos, el coeficiente de variación resultó 54%. La
empresa fija un salario mínimo de $us 350 lo que beneficia a 50 empleados que antes del reajuste
ganaban menos de $us 280 con un sueldo promedio de $us 250. ¿Qué cantidad de dinero necesita
mensualmente la empresa para pagar los sueldos después del reajuste?

Solución.

Antes del reajuste la media de los 150 es $us 306, de los 50 es $us 250, y de los 100 es $us 334. Después
del reajuste la media de los 50 es realmente $us 335 pero sube a $us 350 y de los 100 es $us 419. Se
necesita: 50 x 350+ 100 x 419 = 59,400 $us

EJERCICIO 13.

En una empresa donde trabajan hombres y mujeres la media general de los sueldos es $250. Si la media
y la desviación estándar de los sueldos en el grupo de varones es $270 y $15 y en el grupo de mujeres
es $220 y $ 10.

a) Calcule el porcentaje de hombres y mujeres,

b) Calcule la desviación estándar de los sueldos de todos los trabajadores de la empresa.

Solución.

a) 60% hombres. 40% mujeres. b) $us 27.84

EJERCICIO 14. (Desigualdad de Chebyshev)

Los tiempos que emplearon 900 personas para hacer una tarea tienen una media de 30 minutos y
una desviación estándar de 3 minutos.

a) ¿Cuántas de estas personas por lo menos, emplearon entre 24 y 36 minutos para hacer esa tarea?

b) Determine un intervalo más corto en el que se encuentren los tiempos empleados por al menos
800 de estas personas.

c) Si la distribución de los tiempos empleados es simétrica, ¿qué porcentaje de estas personas


emplearon más de 39 minutos?

Solución.

69
Lic. Isidro W. Nina Paco

a) k=2, al menos 675 b ) 1 − 𝑘 2 =8/9. k=3, [21, 39], c) menos de 1/18 o 5.55%.

EJERCICIO 15.

La tabla que se presenta a continuación corresponde a un número de personas que se encontró en


una muestra tomada en 4 distritos y que son consumidores de un producto. La tabla muestra la
clasificación por distrito y por edad y sexo:

Edad Hombres Edad Mujeres


Distrito
20-30 30-40 40-50 20-30 30-40 40-50
D1 15 45 32 22 18 60
D2 50 32 28 35 44 22
D3 15 36 45 32 60 18
D4 40 24 14 46 45 24
a) Compare la variabilidad de las edades de los hombres y mujeres del Distrito 1.

b) Compare la variabilidad de las edades en Distrito 1 y Distrito 3.

c) Compare la variabilidad de las edades de hombres y mujeres de la muestra.

d) Halle la varianza de las edades de toda la muestra.

Solución.

a) 𝐶𝑉𝐻=0.187, 𝐶𝑉𝑀=0.212.

b) 𝐶𝑉𝐷1 =0 235. 𝐶𝑉𝐷3 =0.2<)3.

c) 𝐶𝑉𝐻=0.228, 𝐶𝑉𝑀=0,224

d) 62.072

70
TEMA 5:
NÚMEROS INDICE

Cuando te das cuenta que tu mente es la cuenta de


banco que más interés te renta, empiezas a cuidar
lo que depositas.(Anónimo)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 5: NÚMEROS INDICE


FORMULARIO 5

INDICES SIMPLES ÍNDICE COMPUESTOS PONDERADOS


𝑥𝑡 Índice Precios De Laspeyres
|𝑡0 (𝑋) = ∗ 100
𝑥0
∑ 𝑃𝑡 ∗ 𝑄0
Índice Simple De Precio 𝐼𝑃𝐿 𝑡 = ∗ 100
0 ∑ 𝑃0 ∗ 𝑄0
𝑃𝑡
𝐼𝑃0𝑡 = ∗ 100
𝑃0 Índice De Cantidades De Laspeyres

Índice Simple De Cantidad ∑ 𝑄𝑡 ∗ 𝑃0


𝐼𝑄𝐿𝑡0 = ∗ 100
∑ 𝑄0 ∗ 𝑃0
𝑄𝑡
𝐼𝑄0𝑡 = ∗ 100
𝑄0
Índice De Precios De Paasché
Índice Simple De Valor ∑ 𝑃𝑡 ∗ 𝑄𝑡
𝐼𝑃𝑃0𝑡 = ∗ 100
𝐼𝑉0𝑡 = 𝐼𝑃0𝑡 ∗ 𝐼𝑄0𝑡 ∗ 100 ∑ 𝑃0 ∗ 𝑄𝑡

ÍNDICES COMPUESTOS SIN PONDERAR Índice De Cantidades De Paasché


(Sauerbeck). Media Simple
∑ 𝑄𝑡 ∗ 𝑃𝑡
𝐼𝑄𝑃0𝑡 = ∗ 100
∑ 𝐼𝑃0𝑡 ∑ 𝑄0 ∗ 𝑃𝑡
𝐼𝑃0𝑡 (𝑥 =
1 ,𝑥2 ,…,𝑥𝑛 ) 𝑛
Índices De Precios De Fisher
Media Geométrica

𝐼𝑃0𝑡 (𝑥
𝑛
= √𝐼𝑃𝑥1 ∗ 𝐼𝑃𝑥2 ∗ … ∗ 𝐼𝑃𝑥𝑛 𝐼𝑃𝐹0𝑡 = √𝐼𝑃𝐿𝑡0 ∗ 𝐼𝑃𝑃0𝑡
1 ,𝑥2 ,…,𝑥𝑛 )

Media Armónica Índice De Cantidades De Fisher


𝑛
𝐼𝑃0𝑡 (𝑥 =
1 ,𝑥2 ,…,𝑥𝑛 ) 1 𝐼𝑄𝐹0𝑡 = √𝐼𝑄𝐿𝑡0 ∗ 𝐼𝑄𝑃0𝑡
∑𝑛1
𝐼𝑃0𝑡

Índice Media Agregativa Índice De Precios De Marshall-Edgeworth


Simple
∑ 𝑃𝑡 ∑ 𝑃𝑡 (𝑄0 + 𝑄𝑡 )
𝐼𝑃0𝑡 (𝑥 ,𝑥 ,…,𝑥 ) = ∗ 100 𝐼𝑃𝑀0𝑡 = ∗ 100
1 2 𝑛 ∑ 𝑃0 ∑ 𝑃0 (𝑄0 + 𝑄𝑡 )

71
Lic. Isidro W. Nina Paco

Índice De Precios De Keynes


∑ 𝑃𝑡 (𝑄0 ⋏ 𝑄𝑡 )
𝐼𝑃𝐾0𝑡 = ∗ 100 ; ∧: Valor mínimo entre 𝑄0 y
∑ 𝑃0 (𝑄0 ⋏ 𝑄𝑡 ) 𝑄𝑡
IPC: Describe los cambios de precios de un periodo a otro para una “Canasta de bienes y
servicios”.
El INE (Bolivia) contempla 12 grupos de bienes y servicios con sus ponderaciones
correspondientes. La Canasta contempla 364 productos.

IPC, PARA EVALUAR EL INGRESO REAL TASA DE DESEMPLEO

𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑀𝑜𝑛𝑒𝑡𝑎𝑟𝑖𝑜 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐷𝑒𝑠𝑒𝑚𝑝𝑙𝑒𝑎𝑑𝑜𝑠


𝐼ngreso Real = ∗ 100 𝑇𝐷 = ( ) ∗ 10𝑛
𝐼𝑃𝐶 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝐸𝑐𝑜𝑛𝑜𝑚𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝐴𝑐𝑡𝑖𝑣𝑎
IPC, PARA DEFLACIONAR LAS VENTAS
TASA DE NATALIDAD
𝑉𝑒𝑛𝑡𝑎𝑠 𝑅𝑒𝑎𝑙𝑒𝑠
Ventas Deflacionadas = ∗ 100 𝑁º 𝑑𝑒 𝑛𝑎𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑎ñ𝑜
𝐼𝑛𝑑𝑖𝑐𝑒 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑇𝑁 = ( ) ∗ 10𝑛
𝑁º 𝑑𝑒 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑒𝑠𝑒 𝑎ñ𝑜

IPC, PARA EVALUAR EL PODER ADQUISITIVO TASA DE MORTALIDAD


1
𝑃𝑜𝑑𝑒𝑟 𝐴dquisitivo del dinero = ∗ 100
𝐼𝑃𝐶 𝑁º 𝑑𝑒 𝑑𝑖𝑓𝑢𝑛𝑡𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑎ñ𝑜
𝑇𝑀 = ( ) ∗ 10𝑛
𝑁º 𝑑𝑒 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑒𝑠𝑒 𝑎ñ𝑜

72
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.

Una empresa estudia la evolución de los precios en dólares de tres componentes (A, B, C) para una
pieza en los últimos 5 años

Año A B C
1 3 4 1
2 4 6 1,5
3 5 6,5 2
4 4,5 7 2,5
5 7 4 3
a) Calcular un índice simple para estudiar la evolución de los precios del componente A tomando
como periodo de referencia el año 1
b) Calcular un índice conjunto de la evolución de los precios utilizando una media aritmética de
índices, simples y tomando como referencia el año 1.
c) Analizar cómo varían los resultados si escoge otros promedios como la media geométrica.
d) Suponiendo que en cada pieza van 5 unidades del componente A, 10 de B y 15 del C, calcule
índices de precios conjuntos para los tres componentes tomando como referencia el periodo 1 y
usando una media aritmética ponderada de los índices simples.
e) Analice cómo varían los resultados, y cuáles el incremento medio anual de precios a partir del
índice compuesto media aritmética ponderada.

Solución:

a) Índice simple de la evolución de los precios tomando como periodo de referencia el año
Índice Simple Precios
Año A B C A B C
1 3 4 1 100 (3 / 3).100 100 (4 / 4).100 100 (1 / 1).100
2 4 6 1,5 133,33 (4 / 3).100 150 (6 / 4).100 150 1, 5.100
3 5 6,5 2 166,67 (5 / 3).100 162,50 (6, 5 / 4).100 200 2.100
4 4,5 7 2,5 150 (4,5 / 3).100 175 (7 / 4).100 250 2, 5.100
5 7 4 3 233,33 (7 / 3).100 100 (4 / 4).100 300 3.100
1

b) Índice conjunto de la evolución de los precios utilizando la media aritmética:

Año A B C Media aritmética


1 100 100 100 300/3 = 100 100
2 133,33 150 150 433,33/3= 144,44 144,44
3 166,67 162,50 200 529,17/3=176,39 176,39
4 150 175 250 575/3=191,67 191,67
5 233,33 100 300 633,33/3=211,11 211,11

73
Lic. Isidro W. Nina Paco

c) Índice conjunto de la evolución de los precios utilizando la media geométrica:

3
Año A B C Ii 3
3

i1 √∏ |𝑖
𝑖=1
1 100 100 100 1000000 100
2 133,33 150 150 3000000 144,22496
3 166,67 162,50 200 5416666,67 175,62137
4 150 175 250 6562500 187,22181
5 233,33 100 300 7000000 191,29312

d) Índice conjunto de la evolución de los precios utilizando la media ponderada:

A B C Media
Año
(5 unidades) (10 unidades) (15 unidades) ponderada
1 100 100 100 5.100+10.100+15.100/(5+10+15)=100 100
2 133,33 150 150 5.133,33+10.150+15.150/(5+10+15)= 147,22 147,22
3 166,67 162,50 200 5.166,67+10.162,50+15.200/(5+10+15)= 181,94 181,94
4 150 175 250 5.150+10.175+15.250/(5+10+15)= 208,33 208,33
5 233,33 100 300 5.233,33+10.100+15.300/(5+10+15)= 222,22 222,22

e) El incremento (tasa) medio anual de precios a partir del índice compuesto:


A B C Media % Incremento
Año Incremento
(5 unidades) (10 unidades) (15 unidades) ponderada (Tasa)
1 100 100 100 100 -------
2 133,33 150 150 147,22 (147,22/100) - 1 = 0,47222 47,22
3 166,67 162,50 200 181,94 (181,94/147,22) - 1 = 0,23584 23,58
4 150 175 250 208,33 (208,33/181,94) - 1 = 0,14503 14,50
5 233,33 100 300 222,22 (222,22/208,33) - 1 = 0,06667 6,67

EJERCICIO 2.

El consumo de combustible en una empresa (en miles de litros) y los índices de precios del
combustible en seis años están dados por:
Índice
Año Consumo
(base 2014=100%)
2011 60 91
2012 70 93
2013 75 95
2014 78 100

74
Lic. Isidro W. Nina Paco

2015 80 114
2016 85 120

Sabiendo que el precio del combustible fue de 1,5 $us/litro en el a ño 2016, calcular el gasto en
combustible de la empresa en cada año
Solución:

Año Consumo Índice Índice Precio $us/litro Gasto


(base 2014=100%) (base 2016=100%)
2011 60 91 (91/120).100=75,83 75,83 1,5 x 0,7583=1,137 68,22
2012 70 93 (93/120).100=77,5 77,5 1,5 x 0,775=1,162 81,34
2013 75 95 (95/120).100=79,17 79,17 1,5 x 0,7917=1,187 89,025
2014 78 100 (100/120).100=83,33 83,33 1,5 x 0,8333=1,249 97,422
2015 80 114 (114/120).100=95 95 1,5 x 0,95=1,425 114
2016 85 120 (120/120).100=100 100 1,5 127,5

EJERCICIO 3.

A continuación tenemos los precios y cantidades vendidas de tres productos por una determinada
empresa durante tres períodos.

t PA PB PC QA QB QC
0 4 10 15 2 2 3
1 6 11 20 5 1 3
2 5 12 25 4 1 2

Obtener los índices de precios y de cantidades de Paasche, de Laspeyres y de Fisher para estos tres
períodos considerando como referencia el periodo 0
Solución:
Índices ponderados de PRECIOS
∑𝒏 𝒑𝒊𝒕 𝒒𝒊𝟎 ∑𝒏 𝒑𝒊𝒕 𝒒𝒊𝒕
𝑳𝒂𝒔𝒑𝒆𝒚𝒓𝒆𝒔: 𝐿𝒑 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎 𝑷𝒂𝒂𝒔𝒄𝒉𝒆: 𝑝𝒑 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎
𝒊=𝟏 𝒑𝒊𝟎 𝒒𝒊𝟎 𝒊=𝟏 𝒑𝒊𝟎 𝒒𝒊𝒕

𝑭𝒊𝒔𝒉𝒆𝒓: 𝐹𝒑 = √𝐿𝒑 ∗ 𝑃𝑝

6 ∗ 2 + 11 ∗ 2 + 20 ∗ 3 94
𝐿𝑝 1 = ∗ 100 = ∗ 100 = 128.77
0 4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73
5 ∗ 2 + 12 ∗ 2 + 25 ∗ 3 109
𝐿𝑝 2 = ∗ 100 = ∗ 100 = 149.32
0 4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73

75
Lic. Isidro W. Nina Paco

6 ∗ 5 + 11 ∗ 1 + 20 ∗ 3 101
𝑃𝑝 1 = ∗ 100 = ∗ 100 = 134.67
0 4 ∗ 5 + 10 ∗ 1 + 15 ∗ 3 75
5 ∗ 4 + 12 ∗ 1 + 25 ∗ 2 82
𝑃𝑝 2 = ∗ 100 = ∗ 100 = 146.43
0 4 ∗ 4 + 10 ∗ 1 + 15 ∗ 2 56

𝐹𝑝 1 = √𝐿𝑝 1 ∗ 𝑃𝑝 1 = √128.77 ∗ 134.67 = 131.69


0 0 0

𝐹𝑝 2 = √𝐿𝑝 2 ∗ 𝑃𝑝 2 = √149.32 ∗ 146.43 = 147.87


0 0 0

Índices ponderados de CANTIDADES


∑𝒏 𝒒𝒊𝒕 ∗𝒑𝒊𝟎 ∑𝒏 𝒒𝒊𝒕 ∗𝒑𝒊𝒕
𝑳𝒂𝒔𝒑𝒆𝒚𝒓𝒆𝒔: 𝐿𝒒 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎 𝑷𝒂𝒂𝒔𝒄𝒉𝒆: 𝑝𝒒 = ∑𝒏𝒊=𝟏 ∗ 𝟏𝟎𝟎
𝒊=𝟏 𝒒𝒊𝟎 ∗𝒑𝒊𝟎 𝒊=𝟏 𝒒𝒊𝟎 ∗𝒑𝒊𝒕

𝑭𝒊𝒔𝒉𝒆𝒓: 𝐹𝒒 = √𝐿𝒒 ∗ 𝑃𝑞

5 ∗ 4 + 1 ∗ 10 + 3 ∗ 15 75
𝐿𝑞 1 = ∗ 100 = ∗ 100 = 102.74
0 2 ∗ 4 + 2 ∗ 10 + 3 ∗ 15 73
4 ∗ 4 + 1 ∗ 10 + 2 ∗ 15 56
𝐿𝑞 2 = ∗ 100 = ∗ 100 = 76.71
0 2 ∗ 4 + 2 ∗ 10 + 3 ∗ 15 73
5 ∗ 6 + 1 ∗ 11 + 3 ∗ 20 101
𝑃𝑞 1 = ∗ 100 = ∗ 100 = 107.45
0 2 ∗ 6 + 2 ∗ 11 + 3 ∗ 20 94
4 ∗ 5 + 1 ∗ 12 + 2 ∗ 25 82
𝑃𝑞 2 = ∗ 100 = ∗ 100 = 75.23
0 2 ∗ 5 + 2 ∗ 12 + 3 ∗ 25 109

𝐹𝑞 1 = √𝐿𝑞 1 ∗ 𝑃𝑞 1 = √102.74 ∗ 107.45 = 105.07


0 0 0

𝐹𝑞 2 = √𝐿𝑞 2 ∗ 𝑃𝑞 2 = √76.71 ∗ 75.23 = 75.97


0 0 0

Índice de Valor: Evolución del valor de la serie a precios constantes (se deflactan los valores en
precios corrientes o actuales)
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒𝑠)
í𝑛𝑑𝑖𝑐𝑒 𝑉𝑎𝑙𝑜𝑟 = 𝑉𝑎𝑙𝑜𝑟 𝑛𝑜𝑚𝑖𝑛𝑎𝑙
𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠)
𝑉𝑡 ∑𝑛𝑖=1 𝑝𝑖𝑡 𝑞𝑖𝑡
𝐼𝑉0𝑡 = ∗ 100 = 𝑛 ∗ 100
𝑉0 ∑𝑖=1 𝑝𝑖0 𝑞𝑖0

6 ∗ 5 + 11 ∗ 1 + 20 ∗ 3 101
𝐼𝑉01 = ∗ 100 = ∗ 100 = 138,36
4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73

76
Lic. Isidro W. Nina Paco

5 ∗ 4 + 12 ∗ 1 + 25 ∗ 2 82
𝐼𝑉02 = ∗ 100 = ∗ 100 = 112,33
4 ∗ 2 + 10 ∗ 2 + 15 ∗ 3 73

EJERCICIO 4.

Se conoce la información sobre la evolución de precios de los bienes y servicios consumidos por un
estudiante. Rellene el siguiente cuadro con las cantidades correspondientes.
Índice Índice Índice Índice
Año Índice ocio
General cafetería transporte otros
2015 149 % 157 % 133 % 142 %
2016 160 % 165 % 143 %
Ponderación 100 % 15 % 35 % 20 %
Variación porcentaje 4,225 %

Solución:

Índice Índice Índice


Año Índice ocio Índice otros
General cafetería transporte
2015 145,6 % 149 % 157 % 133 % 142 %
2016 154,25 % 160 % 165 % 143 % 142 x 1,04225 = 148 %
Ponderación 100 % 15 % 35 % 100 % - 70 % = 30 % 20 %
[(143/133) - 1].100 =
Variación porcentaje 5,941 7,383 5,096
= 7,519
4,225 %

|2015
𝐺 = 149 ∗ 0.15 + 157 ∗ 0.35 + 133 ∗ 0.3 + 142 ∗ 0.2 = 145.6%
𝐼
%Tasa de variación𝑇𝑉𝑡𝑡+1 = [ 𝑡+1 − 1] ∗ 100 Repercusión: 𝑅𝑖 = (𝑇𝑎𝑠𝑎 𝑣𝑎𝑟𝑖𝑐𝑖ó𝑛) ∗ (𝑃𝑜𝑛𝑑𝑒𝑟𝑎𝑐𝑖ó𝑛)
𝐼𝑡

El Índice General es como un IPC para el estudiante, un Índice de Laspeyres, denotando por 𝐼𝑖 los
índices de cada grupo y wi las ponderaciones de cada bien o servicio:

∑4𝑖=1 𝐼𝑖 𝑤𝑖 149 ∗ 15 + 157 ∗ 35 + 133 ∗ 30 + 142 ∗ 20


𝐿𝟐𝟎𝟏𝟓
𝒑 = = = 145.6
∑4𝑖=1 𝑤𝑖 15 + 35 + 30 + 20

∑4𝑖=1 𝐼𝑖 𝑤𝑖 160 ∗ 15 + 165 ∗ 35 + 143 ∗ 30 + 148 ∗ 20


𝐿𝟐𝟎𝟏𝟔
𝒑 = = = 154.25
∑4𝑖=1 𝑤𝑖 15 + 35 + 30 + 20

77
Lic. Isidro W. Nina Paco

EJERCICIO 5.

En cierto país el salario medio por hora, en unidades monetarias corrientes, de los trabajadores de un
determinado sector productivo y los índices de precio de consumo a lo largo de los seis últimos años
fueron:

Índice de precios
Años Salario/hora
(2005 = 100)
$us
2011 5,2 144
2012 5,8 166
2013 6 179
2014 6,3 194
2015 6,4 204
2016 8,4 209

a) Calcule los índices de precios con base 2011


b) Exprese el salario en unidades monetarias constantes de 2011
c) ¿Cuáles fueron las variaciones anuales del salario en términos reales durante estos años?
d) ¿Cuáles fueron las variaciones anuales del salario en términos reales durante estos años?
e) Calcule la tasa media anual acumulativa de los salarios en términos nominales y reales.
Solución:
a) Coeficiente de enlace base 2011: k=100/144=0.69445

Índice de precios Índice de precios (2011=100)


Años Salario/hora
(2005 = 100) (0,69445) x base 2005
Bs
2011 5,2 144 100
2012 5,8 166 166 . 0,69445 = 115,28
2013 6 179 179 . 0,69445 = 124,31
2014 6,3 194 194 . 0,69445 = 134,72
2015 6,4 204 204 . 0,69445 = 141,67
2016 8,4 209 209 . 0,69445 = 145,14
b y c) Tasas de variación interanual del salario en términos constantes y reales:

𝑖 𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑖 𝑖
𝑇𝑉𝑖−1 = − 1 = [𝐼𝑖−1 − 1]
𝑠𝑎𝑙𝑎𝑟𝑖𝑜𝑖−1

  Índice de precios Salarios constantes


Tasa variación relativa Tasa variación relativa real
Años Salario (Incremento nominal) (Incremento real) - Deflactada
(2011 = 100) (Salario / IPC2011).100 TVi [ TVi ]constantes
i1 i1
2011 5,2 100 5,2 ------------- -------------
2012 5,8 115,28 (5,8/115,28).100 = 5,03 (5,8/5,2) - 1 = 0,11538 (5,03/5,2) - 1 = -0,03269
2013 6 124,31 (6/124,31).100 = 4,83 (6/5,8) - 1 = 0,03448 (4,83/5,03) - 1 = -0,03976
2014 6,3 134,72 (6,3/134,72).100 = 4,68 (6,3/6) - 1 = 0,00500 (4,68/4,83) - 1 = -0,03106

78
Lic. Isidro W. Nina Paco

2015 6,4 141,67 (6,4/141,67).100 = 4,52 (6,4/6,3) - 1 = 0,01587 (4,52/4,68) - 1 = -0,03419


2016 8,4 145,14 (8,4/145,14).100 = 5,79 (8,4/6,4) - 1 = 0,31250 (5,79/4,52) - 1 = 0,28097

d) Tasa de variación media anual (TVM) de los salarios en términos nominales y reales

𝑡
𝑡
𝑇𝑉𝑀0𝑡 𝑖
= √∏(𝑇𝑉𝑖−1 + 1) − 1
𝑖=1

Tasa variación nominal Tasa variación real i


Años Salario [ TVi ]constantes TVi  1 [ TVi1 ] +1
TVi i1 constantes
i1 i1
2011 5,2 ------------- ------------- ------------- -------------
2012 5,8 0,11538 -0,03269 1,11538 0,96731
2013 6,0 0,03448 -0,03976 1,03448 0,96024
2014 6,3 0,05000 -0,03106 1,05000 0,96894
2015 6,4 0,01587 -0,03419 1,01587 0,96581
2016 8,4 0,31250 0,28097 1,31250 1,28097
5

 (TV i
i-1
+ 1) 1,61537 1,11346
i=1

5
√∏5𝑖=1(𝑇𝑉𝑖−1
𝑖
+ 1) 1,10066 1,02173

2016 5
𝑇𝑉𝑀2011 = √∏5𝑖=1(𝑇𝑉𝑖𝑖−1 + 1) − 1
0,10066 0,02173

Tasa variación media anual de salarios nominales: 10.07%


Tasa variación media anual de salarios reales: 2.173%

Precio medio del refrigerador en 2016: Precio2016 = 420 x 1,85966 = 781 dolares.

EJERCICIO 6.

Un sector de la economía nacional dispone del valor de producción a precios corrientes de cada año
(miles de euros) y los índices de precios de Laspeyres y Fisher.

Producción
Año % Lp % Fp
(precios corrientes)
2011 66.112 100 100
2012 78.147 104,22 105,34
2013 91.357 107,25 108,94

79
Lic. Isidro W. Nina Paco

2014 88.854 109,05 111,36


2015 92.892 114,87 117,67
2016 101.336 126,35 130,18

Utilizando el deflactor más idóneo, calcular la producción anual en precios constantes de 2011.

Solución:

Para calcular el valor real (precios constantes) de una magnitud se requiere deflactar el valor nomi
nal (precios corrientes), eliminando la influencia que han experimentado los precios. Para ello, se
deflacta la serie dividiendo el valor nominal entre un índice de precios.
𝑣𝑎𝑙𝑜𝑟 𝑛𝑜𝑚𝑖𝑛𝑎𝑙
𝑉𝑎𝑙𝑜𝑟 𝑟𝑒𝑎𝑙 (𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑟𝑟𝑖𝑒𝑛𝑡𝑒𝑠)
=
(𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑒𝑠) í𝑛𝑑𝑖𝑐𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠
𝑉𝑡𝑁
𝑉𝑡𝑅 = 𝑡 ∗ 100
𝐼𝑝,0

El deflactor más adecuado es el de Paasche, ya que con éste índice de precios se obtiene una relación entre
valores monetarios corrientes y valores monetarios constantes.
𝑛
∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 𝑉𝑡𝑁 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑃𝑎𝑎𝑠𝑐ℎ𝑒: 𝑃𝑝 = 𝑛 𝑉𝑡𝑅 = = 𝑛 = ∑ 𝑃𝑖0 ∗ 𝑞𝑖𝑡
∑𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡 𝑃𝑝 ∑𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
𝑖=1
∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡
2
(𝐹𝑝 )
𝐸𝑙 í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝐹𝑖𝑐ℎ𝑒𝑟 𝐹𝑝 = √𝐿𝑝 ∗ 𝑃𝑝 ↦ 𝑃𝑝 =
𝐿𝑝

Producción
Producción (precios constantes 2006)
(Fp )2
Año (precios corrientes) % Lp % Fp %Pp  R VN
VtN Lp Vt  t
Pp
2011 66.112 100 100 100 66112
2012 78.147 104,22 105,34 106,47 73397
2013 91.357 107,25 108,94 110,66 82559
2014 88.854 109,05 111,36 113,72 78135
2015 92.892 114,87 117,67 120,54 77064
2016 101.336 126,35 130,18 134,13 75553

EJERCICIO 7.
En determinado sector económico conservan los índices salariales de distintos periodos temporales
con bases diferentes. Unificar los índices en una serie con la base más actual.

80
Lic. Isidro W. Nina Paco

1995 100
2001 100
1996 104,3
2002 102,2
1997 106,1
2003 105,6
1998 107,7
2004 109,1
1999 110,8
2005 113,3
2000 113,4
2006 117,9
2001 116

2006 100
2007 101,8
2008 105,7
2009 108,9
2010 110,3

Solución:

EJERCICIO 8.
Una empresa ha calculado los índices del precio medio de automóviles (índice de Paasche de precios)
y de los ingresos por ventas, reflejados en la tabla adjunta:

2010 2011 2012 2013 2014 2015 2016


Precio medio automóvil
100 113 126 114 117 119 123
(base 2010)
Índice ingresos
335 380 416 402 424 407 461
(base 2002)

a) Hallar la serie de números índice de automóviles vendidos por la empresa en (2010 – 2016)
b) ¿Qué tipo de índice cuántico se ha hallado en el apartado anterior?

81
Lic. Isidro W. Nina Paco

Solución:
a) En primer lugar hay que unificar las bases. En consecuencia, transformar el índice de ingresos (base
2002) a base de referencia del precio medio 2010
Enlace técnico
Se convierten los índices de ingresos en base 2002 a base 2010.
Para ello, se multiplica cada índice en base 2002 por el enlace técnico (100/335 = 0.2985)
Precio medio automóvil Índice ingresos Índice ingresos
Año
(% base 2010) (% base 2002) (% base 2010)
2010 100 335 100
2011 113 380 113,43
2012 126 416 124,18
2013 114 402 120
2014 117 424 126,57
2015 119 407 121,49
2016 123 461 137,61
𝐼𝑉0𝑡 𝑖𝑛𝑑𝑖𝑐𝑒 𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠
𝐼𝑄,0 = =( )
𝐼𝑝,0 𝑖𝑛𝑑𝑖𝑐𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠

El índice del volumen de ventas

Precio medio automóvil Índice ingresos Índice volumen ventas


Año
(% base 2010) (% base 2010) (% base 2010)
2010 100 100 100
2011 113 113,43 (113,43/113).100 = 100,38
2012 126 124,18 (124,18/126).100 = 98,56 b)
2013 114 120 (120/114).100 = 105,26
2014 117 126,57 (126,57/117).100 = 108,18
2015 119 121,49 (121,49/119).100 = 102,09
2016 123 137,61 (137,61/123).100 = 111,88
Partiendo del índice de valor, multiplicando y dividiendo por la misma cifra (cantidades del año t a
precios del año base), se tiene:
𝑉𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡
𝐼𝑉0𝑡 = = ∗ = ∗ = 𝑃𝑃,0 ∗ 𝐿𝑄,0
𝑉0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0

Si el índice de precios es el de Paasche, el índice cuántico hallado es el de Laspeyres.


Análogamente, multiplicando y dividiendo por la misma cifra (cantidades del año base a
precios del año t), se tiene:

82
Lic. Isidro W. Nina Paco

𝑉𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖𝑡
𝐼𝑉0𝑡 = = ∗ = ∗ = 𝐿𝑃,0 ∗ 𝑃𝑄,0
𝑉0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖0 ∗ 𝑞𝑖0 ∑𝑛𝑖=1 𝑃𝑖𝑡 ∗ 𝑞𝑖0

Si el índice de precios es el de Laspeyres, el índice cuántico es el de Paasche.

83
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.

Un grupo de estudiantes decide estudiar la evolución de los precios de tres artículos que consumen en
sus tiempos de ocio: discoteca, cine, conciertos. Para ello estudian a lo largo de dos años el precio de las
entradas (Pi) en bolivianos y el número de veces que asisten a lo largo de un año (Qi). Los resultados se
recogen en la tabla:

discoteca cine conciertos


Año Pi Qi Pi Qi Pi Qi
2016 12 25 5 70 30 10
2017 15 30 6 80 40 25

Obtenga los índices de precios y cantidades de Laspeyres, Paasche y Fisher tomando como base el
periodo 2016
Solución:

EJERCICIO 2.

Antonio alquiló un local el 1 de enero de 2015 por 3000 bolivianos mensuales, impuestos no incluidos.
La revisión del alquiler se efectúa según los valores del IPC. Dispone de dos tablas con información
sobre el IPC de cada año. (Base 2010=100).

Mes de enero 2015 2016 2017


IPC % 128,712 133,413 138,34
Antonio quiere saber cuál será la renta que tendrá que pagar en 2018 si la previsión del IPC para enero
de 2018 está en 1,8% de incremento sobre el año el mes de enero del año 2017.
Solución:
Antonio tiene que pagar en el 2018 una renta de 3282.44 Bs. (3224.40*1.018=3282.44)
EJERCICIO 3.

84
Lic. Isidro W. Nina Paco

En la elaboración de un índice de precios, en un determinado período, se decide cambiar la base


cortándose la serie en dicho período. Enlace las dos series de manera que se obtenga una
serie completa en base 100% en 2018

Índice base Índice base


Año
2015=100 2018=100
2015 100 %
2016 120 %
2017 150 %
2018 180 % 100 %
2019 110 %
2020 133 %
2021 150 %

EJERCICIO 4.

El conjunto de bienes de consumo se ha clasificado en tres grupos. Los precios y cantidades de cada
grupo, para cuatro años son las siguientes:

Grupo 1 Grupo 2 Grupo 3


Año P1 Q1 P2 Q2 P3 Q3
2013 3 5 7 3 8 4
2014 4 7 9 8 10 10
2015 5 8 6 4 8 8
2016 6 5 7 7 10 10

Calcular:
a) Los índices de precios de Pasche, con base en el año 2013
b) Dados los salarios monetarios:
Año 2013: 120 u.m.
Año 2014: 140 u.m.
Año 2015: 180 u.m.
Año 2016: 200 u.m.
Exprese dichos salarios en unidades monetarias del año 2013

Solución:
a) Índices ponderados de Precios de Paasche:

85
Lic. Isidro W. Nina Paco

∑𝑛𝑖=1 𝑝𝑖𝑡 ∗ 𝑞𝑖𝑡


𝑃𝑛 ∗ 100
∑𝑛𝑖=1 𝑝𝑖0 ∗ 𝑞𝑖𝑡

Salarios en unidades monetarias de 2013:

Salarios Índice Precios Paasche Salarios constantes


Año
(2013 = 100) (Salarios/Pp) x 100
2013 120 100 [120 /100] . 100 = 120
2014 140 127,39 [140/127,39] . 100 = 109,91
2015 180 110,34 [180/110,34] . 100 = 163,13
2016 200 124,31 [200/124,31] . 100 = 160,90

EJERCICIO 5.

Una empresa de electrodomésticos facilita la serie de números índices del precio medio de
refrigeradores durante el período (2010-2016), con base en 2005

% Índice precio medio


Año
Refrigeradores (base
2005)
2010 114
2011 123
2012 131
2013 176
2014 202
2015 208
2016 212
El precio del refrigerador en 2010 fue de 420 dólares. ¿Cuál sería el precio del
electrodoméstico en 2016?
Solución:
Coeficiente de enlace base 2016: 𝑘 = 100⁄114 = 0.8772

% Índice precio medio % Índice precio medio


Año
Refrigeradores (base Refrigeradores (base
2005) 2010)
2016 212 212 . 0,8772 = 185,966
Precio medio del refrigerador en 2016: 𝑃𝑟𝑒𝑐𝑖𝑜2016 = 420 ∗ 1,85966 = 781 𝑑ó𝑙𝑎𝑟𝑒𝑠

86
TEMA 6:
DISTRIBUCIONES
BIDIMENSIONALES (parte 1)

En el intento, Gano o aprendo, nunca pierdo.


(Anónimo)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 6: DISTRIBUCIONES BIDIMENSIONALES (parte 1)


FORMULARIO
Para analizar en forma conjunta a las variables X, Y, se considera el par (X, Y) como una sola
variable, llamada Variable estadística bidimensional. Se llama también Variable bivariante.

CUALITATIVA
CUALITATIVA

VARIABLE CUALITATIVA
BIDIMENSIONAL CUANTITATIVA

CUANTITATIVA
CUANTITATIVA
Si (X, Y) es una variable bidimensional donde los distintos valores que toman X, Y son:

𝑋: 𝑋1 , 𝑋2 , … , 𝑋𝑖 , … , 𝑋𝑘 𝑌: 𝑌1 , 𝑌2 , … , 𝑌𝑗 , … , 𝑌𝑙

Una Distribución bidimensional de frecuencias es un arreglo de los valores observados (X, Y) en una
tabla de doble entrada de la forma:

𝑌𝑗 𝑌1 𝑌2 … 𝑌𝑗 … 𝑌𝑙 𝑓𝑖∗
𝑋𝑖
𝑋1 𝑓11 𝑓12 … 𝑓1𝑗 … 𝑓1𝑙 𝑓1∗
𝑋2 𝑓21 𝑓22 … 𝑓2𝑗 … 𝑓2𝑙 𝑓2∗
… … … … … … … …
𝑋𝑖 𝑓𝑖1 𝑓𝑖2 … 𝑓𝑖𝑗 … 𝑓𝑖𝑙 𝑓𝑖∗
… … … … … … … …
𝑋𝑘 𝑓𝑘1 𝑓𝑘2 … 𝑓𝑘𝑗 … 𝑓𝑘𝑙 𝑓𝑘∗
𝑓∗𝑗 𝑓∗1 𝑓∗2 𝑓∗𝑗 𝑓∗𝑙 n

DISTRIBUCIÓN BIDIMENSIONAL

𝑙 𝑘 𝑘 𝑙

𝑓𝑖∗ = ∑ 𝑓𝑖𝑗 𝑓∗𝑗 = ∑ 𝑓𝑖𝑗 𝑛 = ∑ ∑ 𝑓𝑖𝑗


𝑗=1 𝑖=1 𝑖=1 𝑗=1

87
Lic. Isidro W. Nina Paco

DISTRIBUCIÓN MARGINAL DE X DISTRIBUCIÓN MARGINAL DE Y

𝑋𝑖 𝑓𝑖∗ 𝑌𝑗 𝑓∗𝑗
𝑋1 𝑓1∗ 𝑌1 𝑓∗1
𝑋2 𝑓2∗ 𝑌 𝑓∗2
… … …2 …
𝑋𝑖 𝑓𝑖∗ 𝑌𝐽 𝑓∗𝑗
… … … …
𝑋𝑘 𝑓𝑘∗ 𝑌𝑙 𝑓∗𝑙
Total 𝑛 = ∑𝑘𝑖=1 𝑓𝑖∗ Total 𝑛 = ∑𝑙𝑗=1 𝑓∗𝑗

FRECUENCIAS RELATIVAS

Tal como acontece con la Variable unidimensional, existen ocasiones donde es más conveniente
trabajar con las Frecuencias relativas o proporciones de las Frecuencias con respecto a un total.

Se llama Frecuencia relativa de variable bidimensional h al cociente entre la Frecuencia de un par (X,
Y) respecto a una Frecuencia total

Existen tres opciones para calcular las proporciones de Frecuencias.

Con relación al total general n, se llama Frecuencia relativa se calcula como:


𝑓𝑖𝑗 ∀ 𝑖 = 1, 2, … , 𝑘
ℎ𝑖𝑗 =
𝑛 𝑗 = 1, 2, … , 𝑙

Las correspondientes Frecuencias relativas marginales de las variables X, Y son:


𝑓𝑖∗ 𝑓∗𝑗
ℎ𝑖∗ = ∀ 𝑖 = 1, 2, … , 𝑘 ; ℎ∗𝑗 = ∀ 𝑗 = 1, 2, … , 𝑙
𝑛 𝑛
DISTRIBUCIÓN CONDICIONADA

La distribución de frecuencias absoluta condicionada de la variable X, cuando la otra variable toma el


valor 𝑌𝑗 , se expresa por 𝑓𝑋/𝑌=𝑌𝑗 está dada por la columna j, de la tabla de distribución bidimensional
de doble entrada.

La distribución de frecuencia absoluta condicionada de la variable Y, cuando la otra variable toma el


valor de 𝑋𝑖 , se expresa por 𝑓𝑌/𝑋=𝑋𝑖 está dada por la fila i, de la tabla de distribución bidimensional de
doble entrada.

MEDIA MARGINAL DE X MEDIA MARGINAL DE Y

∑𝑙𝑗=1 𝑓∗𝑗 𝑌𝑗
∑𝑘𝑖=1 𝑓𝑖∗ 𝑋𝑖 𝑌̅ =
𝑋̅ = 𝑛
𝑛

VARIANZAS MARGINAL DE X VARIANZAS MARGINAL DE Y

∑𝑘𝑖=1 𝑓𝑖∗ (𝑋𝑖 − 𝑋̅ )2 ∑𝑙𝑗=1 𝑓∗𝑗 (𝑌𝑗 − 𝑌̅ )2


𝑠𝑋2 = 𝑠𝑌2 =
𝑛−1 𝑛−1
88
Lic. Isidro W. Nina Paco

Note que se trata de Varianzas muestrales. En la práctica también pueden calcularse mediante las
fórmulas abreviadas:
∑𝑙𝑗=1 𝑓∗𝑗 𝑌𝑗 2 − 𝑛𝑌̅ 2
2
∑𝑘𝑖=1 𝑓𝑖∗ 𝑋𝑖 2 − 𝑛𝑋̅ 2 𝑠𝑌2 =
𝑠𝑋 = 𝑛−1
𝑛−1

COVARIANZA POBLACIONAL

Una medida del grado de asociación entre las variables X, Y es la Covarianza poblacional

𝑘 𝑙
∑𝑘𝑖=1 ∑𝑙𝑗=1 𝑓𝑖𝑗 (𝑋𝑖 − 𝜇𝑥 )(𝑌𝑗 − 𝜇𝑦 )
𝐶𝑂𝑉𝑋𝑌 = 𝜎𝑋𝑌 = ; 𝑁 = ∑ ∑ 𝑓𝑖𝑗
𝑁
𝑖=1 𝑗=1
Para el caso de que se disponga de una Tabulación discreta, tal como la tabla de la distribución
bidimensional se calcula la Covarianza poblacional como:

∑𝑘𝑖=1 ∑𝑙𝑗=1(𝑋𝑖 − 𝜇𝑥 )(𝑌𝑗 − 𝜇𝑦 )


𝐶𝑂𝑉𝑋𝑌 =
𝑁

Similarmente para el cálculo se puede emplear la fórmula abreviada respectiva:

∑𝑘𝑖=1 ∑𝑙𝑗=1 𝑓𝑖𝑗 𝑋𝑖 𝑌𝑗 ∑𝑘𝑖=1 ∑𝑙𝑗=1 𝑋𝑖 𝑌𝑗


𝐶𝑂𝑉𝑋𝑌 = − 𝜇𝑥 𝜇𝑦 𝐶𝑂𝑉𝑋𝑌 = − 𝜇𝑥 𝜇𝑦
𝑁 𝑁

COVARIANZA MUESTRAL
𝑘 𝑙
∑𝑛𝑖=1(𝑋𝑖 − 𝑥̅ )(𝑌𝑗 − 𝑦̅)
𝐶𝑜𝑣𝑋𝑌 = 𝑆𝑋𝑌 = ; 𝑛 = ∑ ∑ 𝑓𝑖𝑗
𝑛−1
𝑖=1 𝑗=1

Otra forma de calcular de manera más abreviada resulta:


𝑛
1
𝑆𝑋𝑌 = (∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅)
𝑛−1
𝑖=1

Para muestras grandes la división entre 𝑛 − 1 ó 𝑛 no existe mucha diferencia, porque se aproxima a
la varianza poblacional.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) ∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖
𝑆𝑋𝑌 = = − 𝑥̅ 𝑦̅
𝑛 𝑛

PROPIEDADES DE LA COVARIANZA
2
P1) 𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 + 2𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 + 2𝐶𝑜𝑣𝑋𝑌
2
P2) 𝑆𝑋−𝑌 = 𝑆𝑋2 + 𝑆𝑌2 − 2𝑆𝑋𝑌 = 𝑆𝑋2 + 𝑆𝑌2 − 2𝐶𝑜𝑣𝑋𝑌

P3) 𝐶𝑜𝑣(𝑎𝑋 + 𝑏, 𝑐𝑌 + 𝑑) = 𝑎 × 𝑐 × 𝐶𝑜𝑣𝑋𝑌

89
Lic. Isidro W. Nina Paco

CORRELACIÓN

Una de las mayores aplicaciones de la Estadística es la de encontrar y medir relaciones entre dos o
más variables.

 EL ANÁLISIS DE CORRELACIÓN trata de establecer el grado de relación entre dos variables, es


decir se trata de medir cuán dependiente es una variable de la otra.
 EL ANÁLISIS DE REGRESIÓN busca la forma de la relación entre variables, es decir se trata de
encontrar una ecuación, que para el caso de dos variables es de la forma 𝑌 = 𝑓(𝑋). Como se
estudia en el siguiente capítulo.

COEFICIENTE DE CORRELACIÓN DE PEARSON

Para medir el grado de relación existente entre variables, se usan los Coeficientes de correlación.

Se define como Coeficiente de correlación lineal o índice de Pearson a:

𝐶𝑜𝑣𝑋𝑌 𝐷𝑜𝑛𝑑𝑒: 𝐶𝑜𝑣𝑋𝑌 es la 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 entre X, Y


𝑟𝑋𝑌 = 𝑆𝑋 es la 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 de X
𝑆𝑋 𝑆𝑌
𝑆𝑌 es la 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 de Y
De otra forma:

2
𝐶𝑜𝑣𝑋𝑌 𝑆𝑋+𝑌 − (𝑆𝑋2 + 𝑆𝑌2 )
𝑟𝑋𝑌 = =
𝑆𝑋 𝑆𝑌 2𝑆𝑋 𝑆𝑌

El Coeficiente de correlación lineal varía en el intervalo de -1 hasta 1, es decir −1 ≤ 𝑟 ≤ 1

Usualmente se aplica la siguiente escala de r, para estimar una correlación lineal.

Coeficientes.
∑ 𝑓𝑖∗ 𝑥𝑖
𝑎10 = 𝑥̅ =
𝑛
∑ 𝑓∗𝑗 𝑦𝑗
𝑎01 = 𝑦̅ =
𝑛
∑ ∑ 𝑓𝑖𝑗 𝑥𝑖 𝑦𝑗
𝑎11 =
𝑛

90
Lic. Isidro W. Nina Paco

∑ 𝑓𝑖∗ 𝑥𝑖2
𝑎20 =
𝑛
∑ 𝑓∗𝑗 𝑦𝑗2
𝑎02 =
𝑛
𝐶𝑂𝑉𝑥𝑦 = 𝑆𝑥𝑦 = 𝑎11 − 𝑎01 𝑎10

CORRELACIÓN POR RANGOS DE SPEARMAN.

6 ∑𝑛𝑖=1 𝑑𝑖2
𝑟𝑆 = 1 −
𝑛(𝑛2 − 1)

𝐷ó𝑛𝑑𝑒:
𝑑𝑖 = R 𝑥 − R 𝑦 (𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑥𝑖𝑠𝑡𝑒𝑛𝑡𝑒𝑠 𝑒𝑛𝑡𝑟𝑒 𝑙𝑜𝑠 𝑟𝑎𝑛𝑔𝑜𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑖𝑟𝑎𝑏𝑙𝑒𝑠)
𝑛 = Tamaño de la muestra expresada en parejas de rangos de las variables

CORRELACIÓN PHI DE CRAMER

𝜒2
Φ𝐶𝑟 = √
𝑛(𝑚 − 1)

Dónde:

m= es el menor de k filas o l columnas, 𝜒 2 = Chi cuadradro.


n= Número total de datos.
𝑘 𝑙
(𝑓𝑜𝑖𝑗 − 𝑓𝑒𝑖𝑗 )2
𝜒2 = ∑∑
𝑓𝑒𝑖𝑗
𝑖=1 𝑗=1

Donde:

𝑓𝑜𝑖𝑗 = Es la frecuencia observada o frecuencia absoluta conjunta de casos clasificados en las


categorías (k, l). Es un dato suministrado por la tabla de doble entrada.

𝑓𝑒𝑖𝑗 = Es la frecuencia esperada de casos en la categoría (k, l). Es un valor adquirido por la
multiplicación entre el subtotal de columna por el subtotal de la fila que le corresponda a la
frecuencia observada de interés el mismo se divide por n. La fórmula puede ser presentada de la
siguiente manera:
𝑓𝑜𝑖∗ × 𝑓𝑜∗𝑗
𝑓𝑒𝑖𝑗 =
𝑛

91
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS (parte 1)


EJERCICIO 1.

Dada la variable estadística bidimensional (X, Y) con la tabla de frecuencias

X\Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Se pide:

a) c) e)
3 4 3 4 𝑎10 𝑦 𝑎01
∑ ∑ 𝑓𝑖𝑗 ∑ 𝑓𝑖∗ 𝑦 ∑ 𝑓∗𝑗
𝑖=1 𝑗=1 𝑖=1 𝑗=1
f)

b) d) 𝑎11

ℎ23 , ℎ34 , ℎ21 𝑓(𝑥𝑖 /𝑌 = 2) 𝑦 𝑓(𝑦𝑗 /𝑋 = 3) g)

𝑠𝑥𝑦

Solución.

a)
3 4 3

∑ ∑ 𝑓𝑖𝑗 = ∑[𝑓𝑖1 + 𝑓𝑖2 + 𝑓𝑖3 + 𝑓𝑖4 ]


𝑖=1 𝑗=1 𝑖=1
= [𝑓11 + 𝑓12 + 𝑓13 + 𝑓14 ] + [𝑓21 + 𝑓22 + 𝑓23 + 𝑓24 ] + [𝑓31 + 𝑓32 + 𝑓33 + 𝑓34 ]
= [2 + 0 + 1 + 1] + [3 + 1 + 0 + 1] + [0 + 1 + 0 + 5] = 15
b) Cada 𝑓𝑖𝑗 representa la frecuencia absoluta del par (𝑥𝑖 , 𝑦𝑗 ), la frecuencia relativa se define ℎ𝑖𝑗 =
𝑓𝑖𝑗 /𝑁, donde 𝑁 = ∑3𝑖=1 ∑4𝑗=1 𝑓𝑖𝑗 = 15

𝑛23 0 𝑛34 5 𝑛21 3


ℎ23 = = =0 ℎ34 = = ℎ21 = =
𝑁 15 𝑁 15 𝑁 15
c)

X\Y 1 2 4 6 𝑓𝑖∗
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
𝑓∗𝑗 5 2 1 7 15
3 3 4

∑ 𝑓𝑖∗ = [𝑓1∗ + 𝑓2∗ + 𝑓3∗ ] = [4 + 5 + 6] = 15 = ∑ ∑ 𝑓𝑖𝑗


𝑖=1 𝑖=1 𝑗=1

92
Lic. Isidro W. Nina Paco

4 3 4

∑ 𝑓∗𝑗 = [𝑓∗1 + 𝑓∗2 + 𝑓∗3 + 𝐹∗4 ] = [5 + 2 + 1 + 7] = 15 = ∑ ∑ 𝑓𝑖𝑗


𝑗=1 𝑖=1 𝑗=1

d)

X\Y 1 2 4 6 𝑓𝑖∗
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
𝑓∗𝑗 5 2 1 7 15
Las frecuencias relativas condicionadas 𝑓(𝑥𝑖 /𝑌 = 2) y 𝑓(𝑦𝑗 ⁄𝑥 = 3)

X 𝑓(𝑥𝑖 /𝑌 = 2) 𝑓(𝑥𝑖 /𝑌 = 2)
ℎ(𝑥𝑖 /𝑌 = 2) =
𝑓∗2
1 0 0
2 1 1/2
3 1 1/2
2 1

Y 𝑓(𝑦𝑗 /𝑋 = 3) 𝑓(𝑦𝑗 /𝑋 = 3)
ℎ(𝑦𝑗 /𝑋 = 3) =
𝑓3∗
1 3 3/5
2 1 1/5
4 0 0/5
6 1 1/5
5 1
e)

∑3𝑖=1 ∑4𝑗=1 𝑥𝑖 𝑓𝑖𝑗 ∑3𝑖=1 𝑥𝑖 [𝑓𝑖1 + 𝑓𝑖2 + 𝑓𝑖3 + 𝑓𝑖4 ]


𝑎10 = =
𝑁 𝑁
1
= ([𝑥1 𝑓11 + 𝑥1 𝑓12 + 𝑥1 𝑓13 + 𝑥1 𝑓14 ] + [𝑥2 𝑓21 + 𝑥2 𝑓22 + 𝑥2 𝑓23 + 𝑥2 𝑓24 ]
𝑁
+ [𝑥3 𝑓31 + 𝑥3 𝑓32 + 𝑥3 𝑓33 + 𝑥3 𝑓34 ])
[1 ∗ 2 + 1 ∗ 0 + 1 ∗ 1 + 1 ∗ 1] + [3 ∗ 3 + 3 ∗ 1 + 3 ∗ 0 + 3 ∗ 1] + [5 ∗ 0 + 5 ∗ 1 + 5 ∗ 0 + 5 ∗ 5]
=
15
49
= = 3,26
15
O también,

∑3𝑖=1 𝑥𝑖 𝑓𝑖∗ 1 ∗ 4 + 3 ∗ 5 + 5 ∗ 6 49
𝑎10 = = == = 3,26
𝑁 15 15
∑4𝑗=1 𝑦𝑗 𝑓∗𝑗 1 ∗ 5 + 2 ∗ 2 + 4 ∗ 1 + 6 ∗ 7 55
𝑎01 = = = = 3,6
𝑁 15 15
f)

93
Lic. Isidro W. Nina Paco

∑3𝑖=1 ∑4𝑗=1 𝑥𝑖 𝑦𝑗 𝑓𝑖𝑗


𝑎11 =
𝑁
[1.1.2 + 1.2.0 + 1.4.1 + 1.6.1] + [3.1.3 + 3.2.1 + 3.4.0 + 3.6.1] + [5.1.0 + 5.2.1 + 5.4.0 + 5.6.5]
=
15
205
= = 13,66
15
g) 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 13,66 − 3,26 ∗ 3,6 = 1,924

EJERCICIO 2.

Dada la tabla de correlaciones. Hallar 𝑓21 para que las dos variables sean estadísticamente
independientes y calcular su covarianza en este caso.

X\Y 5 7
100 8 4
200 𝑓21 6
Solución.

X\Y 5 7 𝑓𝑖∗
100 8 4 12
200 𝑓21 6 𝑓21 + 6
𝑓∗𝑗 𝑓21 + 8 10 𝑓21 + 18
Por ser independientes:
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ∗ ∀𝑖, 𝑗
𝑁 𝑁 𝑁
4 12 10 120 120 − 72
= ∗ →4= → 4[𝑓21 + 18] = 120 → 𝑓21 = = 12
𝑓21 + 18 𝑓21 + 18 𝑓21 + 18 𝑓21 + 18 4
Covarianza: 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01

X\Y 5 7 𝑓𝑖∗
100 8 4 12
200 12 6 18
𝑓∗𝑗 20 10 30

∑2𝑖=1 𝑥𝑖 𝑓𝑖∗ 100 ∗ 12 + 200 ∗ 18


𝑎10 = 𝑥̅ = = = 160
𝑁 30
∑2𝑗=1 𝑦𝑗 𝑓∗𝑗 5 ∗ 20 + 7 ∗ 10
𝑎01 = 𝑦̅ = = = 5,67
𝑁 30
∑2𝑖=1 ∑2𝑗=1 𝑥𝑖 𝑦𝑗 𝑓𝑖𝑗 100 ∗ 5 ∗ 8 + 100 ∗ 7 ∗ 4 + 200 ∗ 5 ∗ 12 + 200 ∗ 7 ∗ 6 27200
𝑎11 = = =
𝑁 30 30
= 906,67

𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 906,67 − 106 ∗ 5,67 = −0,53

94
Lic. Isidro W. Nina Paco

EJERCICIO 3.

A partir de la siguiente distribución bidimensional (𝑋𝑖 , 𝑌𝑗 ; 𝑓𝑖𝑗 ), calcular: 𝑥̅ , 𝑦̅, 𝑠𝑥2 , 𝑠𝑦2 y 𝑠𝑥𝑦 . ¿Son
independientes las variables X e Y?

X\Y 1 2 3
-1 0 1 0
0 1 0 1
1 0 1 0
Solución.

X\Y 1 2 3 𝑓𝑖∗
-1 0 1 0 1
0 1 0 1 2
1 0 1 0 1
𝑓∗𝑗 1 2 1 4
Las variables X e Y son independientes cuando se verifica
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ( ) ( ) ∀𝑖, 𝑗
𝑁 𝑁 𝑁

No son independientes porque no se verifica la relación:


0 2 2 𝑓22 𝑓2∗ 𝑓∗2
≠ ∗ [ ≠ ( ) ( )]
4 4 4 𝑁 𝑁 𝑁
∑3𝑖=1 ∑3𝑗=1 𝑥𝑖 𝑦𝑗 𝑓𝑖𝑗 1
𝑎11 = = [−1 ∗ 2 ∗ 1 + 1 ∗ 2 ∗ 1] = 0
𝑁 4
∑3𝑖=1 𝑥𝑖 𝑓𝑖∗ 1
𝑎10 = 𝑥̅ = = [−1 ∗ 1 + 0 ∗ 2 + 1 ∗ 1] = 0
𝑁 4
∑3𝑖=1 𝑥𝑖2 𝑓𝑖∗ 1 2
𝑎20 = = [(−1)2 ∗ 1 + 0 ∗ 2 + 12 ∗ 1] = = 0,5
𝑁 4 4
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 0,5 − 0 = 0,5 → 𝑠𝑥 = √0,5 = 0,7

∑3𝑗=1 𝑦𝑗 𝑓∗𝑗 1
𝑎01 = 𝑦̅ = = [1 ∗ 1 + 2 ∗ 2 + 3 ∗ 1] = 2
𝑁 4
∑3𝑗=1 𝑦𝑗2 𝑓∗𝑗 1 18
𝑎02 = = [12 ∗ 1 + 22 ∗ 2 + 32 ∗ 1] = = 4,5
𝑁 4 4
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 4,5 − 22 = 0,5 → 𝑠𝑦 = √0,5 = 0,7

Covarianza 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 0 − 0 ∗ 2 = 0

Adviértase que la covarianza es cero por la simetría de la distribución.

𝑆𝑖 (𝑋, 𝑌)𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 → 𝑠𝑦𝑥 = 0


𝑆𝑖 𝑠𝑦𝑥 = 0 → (𝑋, 𝑌) 𝑁𝑜 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠

95
Lic. Isidro W. Nina Paco

EJERCICIO 4.

Se han observado, durante un mes determinado, el gasto en el teléfono móvil y el ingreso total en
seis familias. Los resultados obtenidos, expresados en unidades monetarias corrientes, han sido:

Gasto teléfono móvil Ingreso total (miles euros)


Familia 1 2 4
Familia 2 3 6
Familia 3 6 8
Familia 4 9 10
Familia 5 10 12
Familia 6 11 20
a) Calcular la covarianza entre el gasto y el ingreso. A la vista de este resultado, ¿puede afirmar que
las variables sean dependientes e independientes?

b) Para estas 6 familias ¿Qué variables se distribuye de forma más homogénea, el gasto en móvil o en
los ingresos totales?

Solución.

a)

Gasto teléfono móvil Ingreso total 𝑥𝑖2 𝑦𝑖2 𝑥𝑖 ∗ 𝑦𝑖


𝑦𝑖 𝑥𝑖
2 4 16 4 8
3 6 36 9 18
6 8 64 36 48
9 10 100 81 90
10 12 144 100 120
11 20 400 121 220
41 60 760 351 504

La primera columna (𝑦𝑖 ), gasto del teléfono móvil, corresponde a la variable que se estudia,
dependiendo de la variable ingreso total de las familias (𝑥𝑖 )

∑6𝑖=1 𝑦𝑖 41 ∑6𝑖=1 𝑦𝑖2 351


𝑎01 = 𝑦̅ = = = 6,83 𝑎02 = = = 58,5
𝑁 6 𝑁 6
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 58,5 − 6,832 = 11,85

∑6𝑖=1 𝑥𝑖 60 ∑6𝑖=1 𝑥𝑖2 760


𝑎10 = 𝑥̅ = = = 10 𝑎20 = = = 126,67
𝑁 6 𝑁 6
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 126,67 − 102 = 26,67

∑6𝑖=1 𝑥𝑖 ∗ 𝑦𝑖 504
𝑎11 = = = 84 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 ∗ 𝑎01 = 84 − 10 ∗ 6,83 = 15,7 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
𝑁 6
b)

96
Lic. Isidro W. Nina Paco

𝑠𝑦 3,44
𝑦̅ = 6,83 𝑠𝑦 = √11,85 = 3,44 𝐶𝑉𝑦 = = = 0,5037 (50,37% 𝑑𝑒 𝑑𝑖𝑠𝑝𝑒𝑠𝑖ó𝑛)
𝑦̅ 6,83
𝑠𝑥 5,16
𝑥̅ = 10 𝑠𝑥 = √26,67 = 5,16 𝐶𝑉𝑥 = = = 0,516 (51,6% 𝑑𝑒 𝑑𝑖𝑠𝑝𝑒𝑠𝑖ó𝑛)
𝑥̅ 10
Se distribuye de forma más homogénea el gasto de las familias.

EJERCICIO 5.

Un psicólogo afirma, basándose en los datos obtenidos, que a medida que el niño crece menores son
las respuestas inadecuadas que da en el transcurso de una situación experimental:

Edad Número respuestas Edad Número respuestas


inadecuadas inadecuadas
2 11 7 12
3 12 9 8
4 10 9 7
4 13 10 3
5 11 11 6
5 9 11 5
6 10 12 5
7 7

a) Determinar la validez de las conclusiones del psicólogo.

b) María, de diez años y medio, participa en el experimento, ¿cuál es el número de respuestas


inadecuadas que se puede predecir para ella?

c) Hallar la varianza residual

Solución.

a) La validez de la afirmación se obtendrá en función del coeficiente de correlación:


𝑠𝑥𝑦
𝑟=
𝑠𝑥 𝑠𝑦

Como no hay pares repetidos se entiende que son 15 pares de la forma (𝑥𝑖 , 𝑦𝑖 ) que representará
𝑥𝑖 : 𝑒𝑑𝑎𝑑 e 𝑦𝑖 : 𝑛ú𝑚𝑒𝑟𝑜 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑖𝑛𝑎𝑑𝑒𝑐𝑢𝑎𝑑𝑎𝑠 de modo que la frecuencia de cada par es la
unidad.

𝑥𝑖 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
𝑦𝑖 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5

∑15
𝑖=1 𝑥𝑖 𝑦𝑖 2 ∗ 11 + 3 ∗ 12 + 4 ∗ 10 + ⋯ + 11 ∗ 5 + 12 ∗ 5 789
𝑎11 = = = = 52,6
𝑁 15 15
∑15
𝑖=1 𝑥𝑖 2 + 3 + 4 + 4 + 5 + ⋯ + 11 + 11 + 12 105
𝑎10 = = = =7
𝑁 15 15

97
Lic. Isidro W. Nina Paco

∑15
𝑖=1 𝑦𝑖 11 + 12 + 10 + 13 + ⋯ + 6 + 5 + 5 129
𝑎01 = = = = 8,6
𝑁 15 15
En consecuencia, 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 52,6 − 7 ∗ 8,6 = −7,6

Para el cálculo de las desviaciones típicas (𝑠𝑥 , 𝑠𝑦 ):

∑15 2
𝑖=1 𝑥𝑖 22 + 32 + 42 + 42 + 52 + ⋯ + 112 + 112 + 122 877
𝑎20 = = = = 58,46
𝑁 15 15
∑15 2
𝑖=1 𝑦𝑖 112 + 122 + 102 + 132 + ⋯ + 62 + 52 + 52 1237
𝑎02 = = = = 82,46
𝑁 15 15
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 58,46 − 72 = 9,46 → 𝑠𝑥 = √9,46 = 3,07
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 82,46 − 8,62 = 8,5 → 𝑠𝑦 = √8,5 = 2,91

El coeficiente de correlación:
𝑠𝑥𝑦 −7,6
𝑟= = = −0,85
𝑠𝑥 𝑠𝑦 3,07 ∗ 2,91

Correlación inversa del 85%

La validez solicitada es del 85% en correlación inversa, es decir, a medida que aumenta la edad del
niño (X) disminuye las respuestas inadecuadas (Y).

b) Para poder predecir el número de respuestas para cada edad determinada (caso de María) será
necesario hallar la ecuación de regresión de Y (nº respuesta inadecuadas) sobre X (edad del niño):
𝑠𝑥𝑦 𝑠𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ) 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 ≡ 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛: 𝑏𝑦𝑥 =
𝑠𝑥2 𝑠𝑥2
Adviértase que la pendiente de la recta o coeficiente de regresión 𝑏𝑦𝑥 viene determinado por el
signo de la covarianza 𝑠𝑥𝑦
𝑠𝑥𝑦 7,6
𝑏𝑦𝑥 = =− = −0,80 (𝑟𝑒𝑐𝑡𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑑𝑒𝑐𝑟𝑒𝑐𝑖𝑒𝑛𝑡𝑒)
𝑠𝑥2 9,46

La ecuación de la recta de regresión será: 𝑦 − 8,6 = −0,80(𝑥 − 7) → 𝑦 = 14,2 − 0,80𝑥

En consecuencia, para la edad de María (𝑥 = 10,5) el número de respuestas inadecuadas que se


puede predecir será:

𝑦 = 14,2 − 0,80 ∗ 10,5 = 5,8 ≅ 6 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑖𝑛𝑎𝑑𝑒𝑐𝑢𝑎𝑑𝑎𝑠.

c) La varianza residual 𝑠𝑟2 = 𝑠𝑦2 (1 − 𝑟 2 )

Coeficiente de Determinación: 𝑟 2 = (−0,85)2 = 0,7225

𝑠𝑟2 = 𝑠𝑦2 (1 − 𝑟 2 ) = 8,50 (1 − 0,7225) = 2,35875

98
Lic. Isidro W. Nina Paco

𝑠𝑟2 2,35875
% 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑛𝑜 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑜 = 100 2 = 100 = 27,75%
𝑠𝑦 8,50

EJERCICIO 6.

De una variable estadística bidimensional (X, Y) se conoce 𝑠𝑥 = 3:


1
 Recta de regresión de Y sobre X: 𝑦 = 2 + 𝑥
2
 Recta de regresión de X sobre Y: 𝑥 = −4 + 2𝑦
a) Hallar el coeficiente de correlación
b) Si 𝑥̅ = 2, determinar 𝑦̅, 𝑎20 , 𝑎02 y 𝑎11

Solución.
1
a) La recta de regresión de Y sobre X: 𝑦 = 2 + 𝑥 puede escribirse:
2
1 1 1
𝑦 = 2 + 𝑥 → 𝑦 − 0 = (4 + 𝑥) ⟹ 𝑏𝑦𝑥 =
2 2 2
Análogamente, la recta de regresión de X sobre Y: 𝑥 = −4 + 2𝑦

𝑥 = −4 + 2𝑦 ⟶ 𝑥 − 0 = 2(−2 + 𝑦) ⟹ 𝑏𝑥𝑦 = 2
𝑠𝑦𝑥
1 𝑠𝑥𝑦 1
𝑏𝑦𝑥 = → = = → 𝑠𝑥𝑦 = 4,5
𝑠𝑥2
2 9 2
𝑠𝑎𝑏𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 𝑠𝑥𝑦 4,5 4,5
𝑏𝑥𝑦 = 2 = 2 → 2 = 2 → 𝑠𝑦2 = = 2,25 → 𝑠𝑦 = √2,25 = 1,5
{ 𝑠𝑦 𝑠𝑦 2
𝑠𝑥𝑦 4,5
𝑟= = = 1 con lo que existe una dependencia funcional, cosa que no es de extrañar por
𝑠𝑥 𝑠𝑦 3∗1,5
1
𝑦=2+ 𝑥
tratarse de única recta de regresión. Adviértase que las rectas: { 2 } son la misma recta,
𝑥 = −4 + 2𝑦
basta con multiplicar la primera recta por 2 y despejar la x:
1
2𝑦 = 2 [2 + 𝑥] = 4 + 𝑥 → 𝑥 = −4 + 2𝑦
2
b)
1 1 1
𝑦 = 2 + 𝑥 → 𝑦̅ = 2 + 𝑥̅ → 𝑦̅ = 2 + 2 = 3
2 2 2
2
𝑠𝑥2 = 𝑎20 − 𝑎10 → 32 = 𝑎20 − 22 → 𝑎20 = 32 + 22 = 13
2
𝑠𝑦2 = 𝑎02 − 𝑎01 → 2,25 = 𝑎02 − 32 → 𝑎02 = 2,25 + 32 = 11,25

𝑠𝑥𝑦 = 𝑎11 − 𝑎11 𝑎01 → 4,5 = 𝑎11 − 2 ∗ 3 → 𝑎11 = 4,5 + 6 = 10,5

99
Lic. Isidro W. Nina Paco

EJERCICIO 7.

Se desea estudiar la relación que existe entre la variable X (porcentaje de la población urbana en las
distintas provincias) e Y (renta media por hogar). La tabla adjunta contiene datos referentes a treinta
provincias:
X / Y 1 – 16 16 – 31 31 – 46 46 – 60
10 – 19 1 1 1
19 – 28 8 3
28 – 37 3 7 1
37 – 45 2 3
a) Calcular las rectas de regresión.

Solución.

a)

X / Y 1 – 16 16 – 31 31 – 46 46 – 60 𝑓𝑖∗
10 – 19 1 1 1 3
19 – 28 8 3 11
28 – 37 3 7 1 11
37 – 45 2 3 5
𝑓∗𝑗 1 14 14 1 30
Las distribuciones marginales de X e Y, respectivamente:

Intervalos 𝑥𝑖 𝑓𝑖∗ 𝑥𝑖 𝑓𝑖∗ 𝑥𝑖2 𝑓𝑖∗


10 – 19 14,5 3 43,5 630,75
19 – 28 23,5 11 258,5 6074,75
28 – 37 32,5 11 357,5 11618,75
37 – 45 41 5 205 8405
30 864,5 26729,25

∑4𝑖=1 𝑥𝑖 𝑓𝑖∗ 864,5 ∑4𝑖=1 𝑥𝑖2 𝑓𝑖∗ 26729,25


𝑥̅ = 𝑎10 = = = 28,81 𝑎20 = = = 890,975
𝑁 30 𝑁 30
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 890,975 − 28,812 = 60,959 𝑠𝑥 = √60,959 = 7,807

Intervalos 𝑦𝑗 𝑓∗𝑗 𝑦𝑗 𝑓∗𝑗 𝑦𝑗2 𝑓∗𝑗


1 – 16 8,5 1 8,5 72,25
16 – 31 23,5 14 329 7731,5
31 – 46 38,5 14 539 20751,5
46 – 60 53 1 53 2809
30 929,5 31364,25
∑4𝑗=1 𝑦𝑗 𝑓∗𝑗 929,5 ∑4𝑗=1 𝑦𝑗2 𝑓∗𝑗 31364,25
𝑦̅ = 𝑎01 = = = 30,98 𝑎02 = = = 1045,475
𝑁 30 𝑁 30
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 1045,475 − 30,982 = 85,7146 𝑠𝑦 = √85,7146 = 9,258

100
Lic. Isidro W. Nina Paco

Distribución conjunta

𝑥𝑖 / 𝑦𝑖 8,5 23,5 38,5 53


14,5 1 1 1
23,5 8 3
32,5 3 7 1
41 2 3
∑4𝑖=1 𝑥𝑖 𝑦𝑖 𝑓𝑖𝑖 14,5 ∗ 8,5 ∗ 1 + 14,5 ∗ 23,5 ∗ 1 + ⋯ + 41 ∗ 38,5 ∗ 3
𝑎11 = = = 919,65
𝑁 30
𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 919,65 − 28,81 ∗ 30,98 = 27,1162
𝑠𝑥𝑦 27,1162
𝐑𝐞𝐜𝐭𝐚 𝐝𝐞 𝐫𝐞𝐠𝐫𝐞𝐬𝐢ó𝐧 𝐝𝐞 𝐘 𝐬𝐨𝐛𝐫𝐞 𝐗: 𝑦 − 𝑦̅ = = (𝑥 − 𝑥̅ ) ↦ 𝑦 − 30,98 = (𝑥 − 28,81)
𝑠𝑥2 60,959

𝑦 = 18,30 + 0,44𝑥
𝑚11 27,1162
Coeficiente de regresión: 𝑏𝑦𝑥 = = = 0,44 > 0 (recta de regresión creciente)
𝜎𝑥2 60,959
𝑠𝑥𝑦 27,1162
𝑹𝒆𝒄𝒕𝒂 𝒅𝒆 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏 𝒅𝒆 𝑿 𝒔𝒐𝒃𝒓𝒆 𝒀: 𝑥 − 𝑥̅ = = (𝑦 − 𝑦̅) ↦ 𝑥 − 28,81 = (𝑦 − 30,98)
𝑠𝑦2 85,7146

𝑥 = 19,20 + 0,31𝑦
𝑠𝑥𝑦 27,1162
Coeficiente de regresión: 𝑏𝑥𝑦 = = = 0,31 > 0 (recta de regresión creciente)
𝑠𝑦2 85,7146

101
Lic. Isidro W. Nina Paco

102
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS (parte 1)


EJERCICIO 1.
Las calificaciones obtenidas por un grupo de alumnos en Estadística (E) y Macroeconomía (M):

E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
a) Hallar la tabla de frecuencias
b) Hallar las distribuciones marginales, media y varianza de las mismas
c) Covarianza

Solución.

a)

E/M 4 5 6 7 8 9 10 𝑓𝑖∗
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
𝑓∗𝑗 2 4 0 5 1 2 3 17
b)

𝐸𝑖 𝑓𝑖∗ 𝐸𝑖 𝑓𝑖∗ 𝐸𝑖2 𝑓𝑖∗ 𝑀𝑗 𝑓∗𝑗 𝑀𝑗 𝑓∗𝑗 𝑀𝑗2 𝑓∗𝑗


3 2 6 18 4 2 8 32
4 2 8 32 5 4 20 100
5 5 25 125 6 0 0 0
6 1 6 36 7 5 35 245
7 2 14 98 8 1 8 64
8 5 40 320 9 2 18 162
17 99 629 10 3 30 300
17 119 903

Distribución Marginal de Estadística:

𝐸̅ = 𝑎10 = 5,82 𝑎20 = 37 𝑠𝐸2 = 𝑎20 − 𝑎10


2
= 37 − 5,822 = 3,13
Distribución Marginal de Macroeconomía:
̅ = 𝑎01 = 7
𝑀 𝑎02 = 53,11 2
𝑠𝑀 2
= 𝑎02 − 𝑎01 = 53,11 − 72 = 4,11

c) Para hallar la covarianza: 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01

∑6𝑖=1 ∑7𝑗=1 𝐸𝑖 𝑀𝑗 𝑓𝑖𝑗


𝑎11 =
𝑁

103
Lic. Isidro W. Nina Paco

739
𝑎11 = = 43,47 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 43,47 − 5,82 ∗ 7 = 2,7
17

EJERCICIO 2.
En una experimentación sobre el sector turístico se han observado dos caracteres cuantitativos (X, Y),
obteniéndose los siguientes resultados:
(0, 2), (1, 6), (3, 14), (−1, −2), (2, 10)
a) Hallar las distribuciones marginales
b) Correlación entre ambos caracteres
c) ¿Cómo completaríamos los pares (−3, ∙), (∙ , 4)?. Utilizar para ello la recta de regresión ajustada
a los datos observados.
Solución.
a) Como no hay repetición de los pares, la tabla de doble entrada de frecuencias absolutas vendrá de la
forma:

X/Y 2 6 14 -2 10 𝑓𝑖∗
0 1 1
1 1 1
3 1 1
-1 1 1
2 1 1
𝑓∗𝑗 1 1 1 1 1 5
Las distribuciones marginales de la X e Y, respectivamente, serán:

𝑥𝑖 0 1 3 -1 2 𝑦𝑖 2 6 14 -2 10
𝑓𝑖∗ 1 1 1 1 1 𝑓∗𝑗 1 1 1 1 1

b) Para estudiar la correlación se forma la tabla adjunta, donde no figura la columna de las frecuencias
absolutas por ser la unidad para todos los pares.

𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖2 𝑦𝑖2
0 2 0 0 4
1 6 6 1 36
3 14 42 9 196
-1 -2 2 1 4
2 10 20 4 100
Total 30 70 15 340

∑5𝑖=1 𝑥𝑖 𝑦𝑖 70
𝑎11 = = = 14
𝑁 5
2
𝑥̅ = 𝑎10 == 1 𝑎20 = 3 𝑠𝑥2 = 𝑎20 − 𝑎10 = 3 − 12 = 2
𝑠𝑥 = 1,41

104
Lic. Isidro W. Nina Paco

2
𝑦̅ = 𝑎01 == 6 𝑎02 = 68 𝑠𝑦2 = 𝑎02 − 𝑎01 = 68 − 62 = 32

𝑠𝑦 = 5,66
𝑠𝑥𝑦
𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 14 − 1 ∗ 6 = 8 𝑟= =1
√𝑠𝑥2 𝑠𝑦2

Como el coeficiente de correlación es igual a 1, indica que existe una dependencia funcional entre las
variables (X, Y) estudiadas.
c) Para completar el par (‐3, •) hay que hallar la ecuación de la recta de regresión de Y sobre X.
Análogamente, para completar el par (•, 4) hay que hallar la ecuación de la recta de regresión de X sobre
Y.

 Recta de regresión de Y sobre X:


𝑠𝑥𝑦 𝑠𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ), donde el coeficiente de regresión 𝑏𝑦𝑥 = (pendiente de la recta)
𝑠𝑥2 𝑠𝑥2
𝑠𝑥𝑦 8
𝑥̅ = 1 𝑦̅ = 6 𝑏𝑦𝑥 = = =4
𝑠𝑥2 2
𝑠𝑥𝑦
𝑦 − 𝑦̅ = (𝑥 − 𝑥̅ ) → 𝑦 − 6 = 4(𝑥 − 1) → 𝑦 = 2 + 4𝑥
𝑠𝑥2
El par (-3, •) se completa: 𝑦 = 2 + 4(−3) = −10 → (−3, −10)

 Recta de regresión de X sobre Y:


𝑠𝑥𝑦 𝑠𝑥𝑦
𝑥 − 𝑥̅ = (𝑦 − 𝑦̅), donde el coeficiente de regresión 𝑏𝑥𝑦 = (pendiente de la recta)
𝑠𝑦2 𝑠𝑦2
𝑠𝑥𝑦 8 1
𝑥̅ = 1 𝑦̅ = 6 𝑏𝑥𝑦 = = =
𝑠𝑦2 32 4
𝑠𝑥𝑦 1 1
𝑥 − 𝑥̅ = (𝑦 − 𝑦̅) → 𝑥 − 1 = (𝑦 − 6) → 𝑥 = (−2 + 𝑦)
𝑠𝑦2 4 4
1 1 1
El par (•, 4) se completa: 𝑥 = [−2 + 4] = → [ , 4]
4 2 2

EJERCICIO 3.
La siguiente tabla proporciona la distribución conjunta de frecuencias absolutas, donde la variable X
representa el número de tarjetas de débito que posee una persona, y la variable Y representa la cantidad
de veces que accede por semana a los cajeros automáticos para realizar una transacción bancaría con
tarjeta de débito.
X\Y 1 2 3 4
1 3 16 2 18
2 10 14 16 20
3 8 2 8 24
Obtener:
105
Lic. Isidro W. Nina Paco

a) Las distribuciones marginales de X e Y


b) ¿Cuántas personas tienen más de tres tarjetas?
c) ¿Cuál es el número más frecuente de tarjetas de debido?
d) ¿Cuántas personas realizan dos o menos transacciones bancarias por tarjeta?
e) ¿Cuál es la media y la varianza del número de tarjetas que posee una persona?
f) ¿Cuál es la media y la varianza del número de uso de los cajeros automáticos semanales
realizadas por tarjeta?

EJERCICIO 4.
De la siguiente distribución bidimensional.
X\Y 1 2 3 4 5 6
-1 5 8 5 8 4 1
0 4 6 10 7 8 7
1 7 7 15 12 11 12
2 2 8 14 15 14 17
Obtener:
a) Las distribuciones marginales de X e Y
b) Las medias marginales de X e Y
c) Las varianzas marginales de X e Y.
d) La distribución de X condicionada a que Y=4
e) La media de X|Y=4
f) La varianza de la distribución condicionada de Y dado X=1
g) ¿Son independientes las variables X e Y?

EJERCICIO 5.
Dada la siguiente tabla de doble entrada.
X\Y 15 25 35 40 50
10 5 8 10 12 15
20 4 10 12 14 16
30 3 5 7 9 11
40 1 4 8 12 10
a) ¿Qué variable presenta mayor dispersión relativa?
b) Calcule la distribución de la variable Y condicionada a que X=20
c) Calcule la distribución de la variable X condicionada a que Y=15
d) Calcule la distribución de la variable X condicionada a que Y≤35
e) Calcule la media aritmética de la variable Y condicionada a que X=30
f) Calcule la covarianza y la correlación de Pearson.

EJERCICIO 6.
Dadas las siguientes variables.

X 0 10 4 8 9 15 20 15 17 20 17 14 19
Y 5 5 2 7 6 7 6 9 10 10 9 10 9
a) Represente gráficamente la nube de puntos (x, y).
b) Halle la covarianza.

106
Lic. Isidro W. Nina Paco

c) Calcule el coeficiente de rangos de Spearman.

EJERCICIO 7.
Un estudio sobre la relación entre el nivel de ingresos (A = alto, M = medio, B = bajo) y la preferencia
por una de las tres grandes marcas de automóviles (Toyota, Mitsubishi y Ford) da como resultado la
siguiente tabla de doble entrada de frecuencias porcentuales.

Ingreso
A M B ∑
Marcas Toyota 10 13 2 25
Mitsubishi 20 12 8 40
Ford 30 15 10 55
∑ 60 40 20 120
a) Defina las variables sometidas a estudio.
b) Obtener la distribución marginal de los ingresos y marcas de automóviles. Interprete los
resultados.
c) Obtener la distribución del nivel de ingresos condicionada a que la marca del automóvil es
Toyota.
d) Obtener la distribución de las marcas de automóviles condicionada a que el nivel de ingreso es
medio. Interprete los resultados.
e) Trazar el gráfico de barras 3D, barras múltiples y apiladas.
f) Calcule e interprete la correlación PHI de Cramer.

EJERCICIO 8.
Se han relacionado las edades de los padres de niños recién nacidos en una maternidad obteniéndose la
siguiente distribución de frecuencias.

Edad del
25 22 30 20 40 27 28 36 32 20 38 35 37 30 32 20 25
Padre
Edad de
20 20 32 35 20 25 25 23 22 18 24 33 30 29 30 23 35
la madre
Frecuencia 10 5 2 1 2 7 4 5 8 10 3 11 7 9 5 10 4

a) Elaborar una tabla de doble entrada de frecuencias absolutas y porcentuales usando los
siguientes intervalos de edades 17-22, 22-27, 27-32, 32-37, 37-42.
b) Calcular la covarianza y la correlación lineal entre las edades del padre y la madre.

EJERCICIO 9.
Sean (X, Y) los paquetes diarios que venden dos operadores de viajes cuya distribución de probabilidad
conjunta se refleja en la tabla:

107
Lic. Isidro W. Nina Paco

Hallar la media, varianza y la desviación típica de las variables: X, Y, X+Y, X-Y

Solución.

 Distribución marginal de la Variable X:  Distribución marginal de la Variable X+Y:


Media: 𝑎10 = 𝜇𝑥 = 0,9 Media: 𝑀[𝑋 + 𝑌] = 𝜇𝑋+𝑌 = 1,9

Varianza: 𝜎𝑥2 = 0,69 2


Varianza: 𝑉[𝑋 + 𝑌] = 𝜎𝑋+𝑌 = 1,49
Desviación Típica: 𝜎𝑥 = 0,83 Desviación Típica: 𝜎𝑋+𝑌 = 1,22

 Distribución marginal de la Variable Y:  Distribución marginal de la Variable X-Y:


Media: 𝑎01 = 𝜇𝑦 = 1 Media: 𝑀[𝑋 − 𝑌] = 𝜇𝑋−𝑌 = −0,1
2
Varianza: 𝜎𝑦2 = 0,6 Varianza: 𝑉[𝑋 − 𝑌] = 𝜎𝑋−𝑌 = 1,09

Desviación Típica: 𝜎𝑦 = 0,77 Desviación Típica: 𝜎𝑋−𝑌 = 1,04

108
TEMA 6:
REGRESION Y CORRELACIÓN
(parte 2)

Nunca consideres el estudio como una obligación,


sino como una oportunidad para penetrar en el
bello y maravilloso mundo del saber. (Albert
Einstein)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 6: REGRESION Y CORRELACIÓN (parte 2)


FORMULARIO

REGRESION LINEAL SIMPLE COEFICIENTE DE DETERMINACIÓN


𝒚 = 𝑨 + 𝑩𝒙 ∑(𝑌̂ − 𝑌̅ )2
𝑟2 = 0 ≤ 𝑟2 ≤ 1
2
∑ 𝑦 ∑ 𝑥 − ∑ 𝑥 ∑ 𝑥𝑦 ̅̅̅2
∑(𝑌 − 𝑌)
𝐴=
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 COEFICIENTE DE CORRELACIÓN
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 ∑(𝑌̂ − 𝑌̅)2
𝐵= 𝑟 =√ −1≤𝑟 ≤1
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 ∑(𝑌 − 𝑌̅)2

OTRA FORMA DE CALCULAR A y B 𝐶𝑂𝑉𝑥𝑦


𝑟 =
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦 𝜎𝑥 𝜎𝑦
𝐵=
𝑛 ∑ 𝑥 2 − (∑ 𝑥 )2 COVARIANZA
𝒏 𝒏
1 1 ∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅)
̅=
𝒙 ∑ 𝒙𝒊 ̅=
𝒚 ∑ 𝒚𝒊 𝐶𝑂𝑉𝑥𝑦 = 𝑚𝑋𝑌
𝒏 𝒏 𝐶𝑂𝑉𝑥𝑦 =
𝒊=1 𝒊=1 𝑛
𝐴 = 𝑦̅ − 𝐵𝑥̅
∑(𝑋 − 𝑋̅)2 ∑(𝑌 − 𝑌̅ )2
𝑌 = 𝐴 + 𝐵𝑋 = 𝐶𝑌𝑋 + 𝑏𝑌𝑋 𝑋 = 𝑏𝑌𝑋 (𝑋 − 𝑋̅) + 𝑌̅ 𝜎𝑥 = √ 𝜎𝑦 = √
𝑛 𝑛
𝑋 = 𝐶 + 𝐷𝑌 = 𝑏𝑋𝑌 (𝑌 − 𝑌̅) + 𝑋̅
𝐶𝑂𝑉𝑋𝑌 𝐶𝑂𝑉𝑋𝑌 REGRESIÓN LINEAL DE DATOS AGRUPADOS
𝑏𝑌𝑋 = 𝐵 = 𝑏𝑋𝑌 = 𝒚 = 𝑨 + 𝑩𝒙
𝜎𝑋2 𝜎𝑌2
𝑟 2 = 𝑏𝑌𝑋 ∗ 𝑏𝑋𝑌 ∑ 𝑓𝑦 ∑ 𝑓𝑥 2 − ∑ 𝑓𝑥 ∑ 𝑓𝑥𝑦
𝐴=
VARIANZA RESIDUAL 𝑛 ∑ 𝑓𝑥 2 − (∑ 𝑓𝑥 )2

2
∑(𝑌 − 𝑌̂)2 𝑛 ∑ 𝑓𝑥𝑦 − ∑ 𝑓𝑥 ∑ 𝑓𝑦
𝑆𝑦𝑥 = 𝐵=
𝑛 𝑛 ∑ 𝑓𝑥 2 − (∑ 𝑓𝑥 )2
𝑉 [𝑋 + 𝑌] = 𝑉[𝑋] + 𝑉[𝑌] + 2𝐶𝑂𝑉𝑋𝑌
∑ 𝑓(𝑌̂ − 𝑌̅)2
𝑉 [𝑋 − 𝑌] = 𝑉[𝑋] + 𝑉[𝑌] − 2𝐶𝑂𝑉𝑋𝑌 𝑟 =√ −1≤𝑟 ≤1
2
∑ 𝑓(𝑌 − 𝑌̅)2
2
𝑆𝑦𝑥
% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 sin 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑟 = 1 − 𝑟 = 2
𝑆𝑦 𝐶𝑂𝑉𝑥𝑦 ∑ 𝑓(𝑋 − 𝑋̅ )(𝑌 − 𝑌̅ )
𝑟 = 𝐶𝑂𝑉𝑥𝑦 =
𝜎𝑥 𝜎𝑦 𝑛
ERROR ESTANDAR DE ESTIMACIÓN

∑(𝑌 − 𝑌̂ )2 ∑ 𝑓(𝑋 − 𝑋̅)2 ∑ 𝑓(𝑌 − 𝑌̅)2


𝑆𝑦𝑥 =√ 𝜎𝑥 = √ 𝜎𝑦 = √
𝑛 𝑛 𝑛

109
Lic. Isidro W. Nina Paco

REGRESIÓN LINEAL MULTIPLE REGRESIÓN LOGARÍTMICA

𝑍 = 𝐴 + 𝐵𝑋 + 𝐶𝑌 𝑦 = 𝐴 + 𝐵 ln 𝑥
𝑦 = 𝐴 + 𝐵𝑈, 𝑈 = 𝑙𝑛 𝑥 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙)
𝑛𝐴 + (∑ 𝑋) 𝐵 + (∑ 𝑌) 𝐶 = ∑ 𝑍 ∑(𝑈 − 𝑈 ̅ )(𝒚 − 𝒚
̅)
𝒓= 𝒏
(∑ 𝑋) 𝐴 + (∑ 𝑋 2 ) 𝐵 + (∑ 𝑋𝑌) 𝐶 = ∑ 𝑋𝑍 ̅ 2 ̅ )2
√∑(𝑈 − 𝑈) √∑(𝒚 − 𝒚
𝒏 𝒏
(∑ 𝑌) 𝐴 + (∑ 𝑋𝑌) 𝐵 + (∑ 𝑌 2 ) 𝐶 = ∑ 𝑌𝑍

COEFICIENTE DE ESTIMACIÓN MULTIPLE REGRESIÓN EXPONENCIAL


𝑦 = 𝐴𝑒 𝐵𝑥 ln y = ln 𝐴 + 𝐵𝑥,
∑(𝑍 − 𝑍̂)2 𝑉 = 𝑎 + 𝐵𝑥, 𝑉 = ln 𝑦 , 𝑎 = ln 𝐴 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙)
𝑆𝑃𝑦𝑥 =√
𝑛 ∑(𝑥 − 𝑥̅ )(𝑉 − 𝑉̅ )
𝑟= 𝑛
COEFICIENTE DE CORRELACIÓN MULTIPLE 2 ̅ 2
√∑(𝑥 − 𝑥̅ ) √∑(𝑉 − 𝑉 )
𝑛 𝑛
𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑟 =√
𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙
REGRESIÓN POTENCIAL
∑(𝑍̂ − 𝑍̅)2
𝑟 =√ −1≤𝑟 ≤1 𝑦 = 𝐴𝑥 𝐵 log y = l𝑜𝑔 𝐴 + 𝐵 𝑙𝑜𝑔 𝑥,
∑(𝑍 − 𝑍̅)2
𝑉 = 𝑎 + 𝐵𝑈 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙)
𝑉 = log 𝑦 , 𝑎 = log 𝐴 , 𝑈 = log 𝑥
REGRESIÓN CUADRATICA
∑(𝑈 − 𝑈̅)(𝑉 − 𝑉̅ )
2 𝑛
𝑦 = 𝐴 + 𝐵𝑥 + 𝐶𝑥 𝑟=
̅ 2 ̅ 2
𝑛𝐴 + (∑ 𝑋) 𝐵 + (∑ 𝑋 2 ) 𝐶 = ∑ 𝑌 √∑(𝑈 − 𝑈) √∑(𝑉 − 𝑉 )
𝑛 𝑛

(∑ 𝑋) 𝐴 + (∑ 𝑋 2 ) 𝐵 + (∑ 𝑋 3 ) 𝐶 = ∑ 𝑋𝑌
REGRESIÓN HIPERBOLICA
1
(∑ 𝑋 2 ) 𝐴 + (∑ 𝑋 3 ) 𝐵 + (∑ 𝑋 4 ) 𝐶 = ∑ 𝑋 2 𝑌 𝑦 = 𝐴 + 𝐵⁄𝑥 = 𝐴 + 𝐵
𝑥
1
𝑦 = 𝐴 + 𝐵 𝑈 (𝑓𝑜𝑟𝑚𝑎 𝑙𝑖𝑛𝑒𝑎𝑙) , 𝑈 =
2 𝑥
∑𝑛𝑖=1(𝑦̂ 𝑖 − 𝑦̅) ̅ ) ∑(𝑦 − 𝑦̅)
∑(𝑈 − 𝑈
𝑟= √ 𝑛
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 𝑟=
2
̅ ) ∑(𝑦 − 𝑦̅)2
√∑(𝑈 − 𝑈 √
𝑛 𝑛

110
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS (parte 2)


EJERCICIO 1.

Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes sean,
respectivamente, las líneas de regresión mínimo-cuadráticas de Y sobre X y de X sobre Y de una serie
de observaciones

𝑌/𝑋: 𝑌 = 2𝑋 + 1 𝑋⁄𝑌 : 𝑋 = −5𝑌 + 10


Solución.
Los coeficientes de regresión deben tener el mismo
𝑌 = 1 + 2𝑥 ⟶ 𝑏𝑦𝑥 = 2 > 0
{ signo, al depender ambos de la misma covarianza.
𝑋 = 10 − 5𝑌 ⟶ 𝑏𝑥𝑦 = −5 < 0
Con lo cual, no pueden ser rectas de regresión.
EJERCICIO 2.

Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes
sean, respectivamente, las líneas de regresión mínimo-cuadráticas de Y sobre X y de X sobre
Y de una serie de observaciones.

𝑌/𝑋: 𝑌 = 2𝑋 + 1 𝑋⁄𝑌 : 𝑋 = 5𝑌 + 10
Solución.
Los coeficientes de regresión deben tener el mismo
𝑌 = 1 + 2𝑥 ⟶ 𝑏𝑦𝑥 = 2 > 0
{ signo, al depender ambos de la misma covarianza.
𝑋 = 10 + 5𝑌 ⟶ 𝑏𝑥𝑦 = 5 < 0
Con lo cual, no pueden ser rectas de regresión.

De otra parte, el coeficiente de correlación: 𝑟 = √𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = √2 ∗ 5 = 3,16 resultado absurdo


cuando el coeficiente de correlación −1 ≤ 𝑟 ≤ 1, concluyendo que no pueden ser rectas de
regresión.

EJERCICIO 3.

El coeficiente de correlación entre dos variables X e Y es 0,6. Sabiendo además que,

𝑥̅ = 10 𝑠𝑥 = 1,5 𝑦̅ = 20 𝑠𝑦 = 2

a) Hallar las rectas de regresión de Y/X y de X/Y


b) Calcular la varianza residual para las dos regresiones anteriores.

Solución.
𝑠𝑥𝑦 𝑠𝑥𝑦
𝐑𝐞𝐜𝐭𝐚 𝐝𝐞 𝐫𝐞𝐠𝐫𝐞𝐬𝐢ó𝐧 𝐝𝐞 𝐘 𝐬𝐨𝐛𝐫𝐞 𝐗: y − 𝑦̅ = = (𝑥 − 𝑥̅ ) ↦ 𝑏𝑦𝑥 = (coeficiente regresión)
𝑠𝑥2 𝑠𝑥2
𝑠𝑥𝑦 𝑠𝑥𝑦
𝐑𝐞𝐜𝐭𝐚 𝐝𝐞 𝐫𝐞𝐠𝐫𝐞𝐬𝐢ó𝐧 𝐝𝐞 𝐗 𝐬𝐨𝐛𝐫𝐞 𝐘: x − 𝑥̅ = = (𝑦 − 𝑦̅) ↦ 𝑏𝑥𝑦 = (coeficiente regresión)
𝑠𝑦2 𝑠𝑦2
𝑠𝑥𝑦 𝑠𝑥𝑦
El coeficiente de correlación: r = √𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = ↦ 0,6 = ↦ 𝑠𝑥𝑦 = 1,8
𝑠𝑥 ∗ 𝑠𝑦 1,5 ∗ 2

111
Lic. Isidro W. Nina Paco

𝑠𝑥𝑦 1,8 𝑠𝑥𝑦 1,8


En consecuencia, 𝑏𝑦𝑥 = = = 0,8 𝑏𝑥𝑦 = = = 0,45
𝑠𝑥2 1,52 𝑠𝑦2 22

𝑌⁄𝑋 : 𝑦 − 20 = 0,8(𝑥 − 10) ⟶𝑦 = 12 + 0,8𝑥


Las rectas de regresión serán: |
𝑋⁄𝑌 : 𝑥 − 10 = 0,45(𝑦 − 20) ⟶𝑥 = 1 + 0,45𝑦
b)

𝑌⁄𝑋 : 𝑠𝑟2 = 𝑠𝑦2 [1 − 𝑟 2 ] 𝑌⁄𝑋 : 𝑠𝑟 = 𝑠𝑦 √1 − 𝑟 2


Varianza residual { Error típico estimación {
𝑋⁄𝑌 : 𝑠𝑟2 = 𝑠𝑥2 [1 − 𝑟 2 ] 𝑋⁄𝑌 : 𝑠𝑟 = 𝑠𝑥 √1 − 𝑟 2

𝑌⁄𝑋 : 𝑠𝑟2 = 22 [1 − 0,62 ] ↦𝑠𝑟2 = 2,56⟶ 𝑠𝑟 = √2,56 = 1,6


por tanto, {
𝑋⁄𝑌 : 𝑠𝑟2 = 1,52 [1 − 0,62 ] ↦𝑠𝑟2 = 1,44⟶ 𝑠𝑟 = √1,44 = 1,2

EJERCICIO 4.

En una distribución bidimensional se conoce:

𝑅 = 0,7 𝑠𝑥 = 1,2 𝑦̅ = 4 𝑋⁄𝑌 : 𝑋 = 0,6 + 0,44𝑌


Obtener:

a) Media de X
b) Recta de regresión de Y/X
c) Varianza de Y
d) Covarianza de ambas variables

Solución.

𝑋̅ = 0,6 + 0,44𝑌̅
a) Recta de regresión de X sobre Y: 𝑋 = 0,6 + 0,44𝑌 ⟼ { ̅
𝑋 = 0,6 + 0,44 ∗ 4 = 2,36
b) La recta de regresión de 𝑌/𝑋:
𝑎 = 0,6
siendo X = 0,6 + 0,44Y ⟼ {𝑏 = 0,44
𝑥𝑦

0,72
𝑟 2 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 ⟼ 0,72 = 𝑏𝑦𝑥 ∗ 0,44 ⟼ 𝑏𝑦𝑥 = = 1,114
0,44
Con lo cual, la recta de regresión de Y sobre X:
𝑠𝑥𝑦
𝑦 − 𝑦̅ = = (𝑥 − 𝑥̅ ) 𝑠𝑒𝑟á: 𝑦 − 4 = 1,114(𝑥 − 2,36) 𝑦 = 1,370 + 1,114𝑥
𝑠𝑥2

c) Varianza de la Y: Sabemos que, 𝑠𝑥 = 1,2 𝑏𝑥𝑦 = 0,44 𝑏𝑦𝑥 = 1,114


𝑚11 𝑠𝑥𝑦
𝑏𝑦𝑥 = 2 → 1,114 = → 𝑠𝑥𝑦 = 1,114 ∗ 1,22 = 1,604
𝜎𝑥 1,22
𝑠𝑥𝑦 1,604 1,604
Recurriendo a 𝑏𝑥𝑦 = → 0,44 = → 𝑠𝑦2 = = 3,645
𝑠𝑦2 2
𝑠𝑦 0,44

112
Lic. Isidro W. Nina Paco

d) La covarianza de ambas ya se ha calculado: 𝑠𝑥𝑦 = 1,604

EJERCICIO 5.

Sean las variables estadísticas bidimensionales (X, Y), donde X = "PIB per cápita (en miles de
dólares) e Y = "Tasa natural de crecimiento demográfico de 162 países del mundo". Se
conocen los datos siguientes:
∑ 𝑥 = 978,9 ∑ 𝑦 = 2886,4 ∑ 𝑥𝑦 = 8938,4

∑ 𝑥 2 = 17569,9 ∑ 𝑦 2 = 172291,2
a) Obtener la recta de regresión que pretende explicar la tasa natural de crecimiento en función
de la renta del país.
b) Interpretar los coeficientes de la recta estimada.
c) Obtener una medida de bondad del ajuste e interpretar si éste es bueno.

Solución.

𝑠𝑥𝑦
𝐚) Se trata de encontrar la recta de regresión de Y sobre X: y − 𝑦̅ = ∗ (𝑥 − 𝑥̅ )
𝑠𝑥2

∑ 𝑥 978,9 ∑ 𝑥 2 17569,9
𝑎10 = 𝑥̅ = = = 6,04 𝑎20 = = = 108,456
𝑁 162 𝑁 162
2
𝑠𝑥2 = 𝑎20 − 𝑎10 = 108,456 − 6,042 = 71,97

∑ 𝑦 2886,4 ∑ 𝑦 2 172291,2
𝑎01 = 𝑦̅ = = = 17,82 𝑎02 = = = 1063,526
𝑁 162 𝑁 162
2
𝑠𝑦2 = 𝑎02 − 𝑎01 = 1063,526 − 17,822 = 745,97

∑ 𝑥𝑦 8938,4
𝑎11 = = = 55,175 𝑠𝑥𝑦 = 𝑎11 − 𝑎10 𝑎01 = 55,175 − 6,04 ∗ 17,82 = −52,46
𝑁 162

𝑠𝑥𝑦 −52,46
El coeficiente de regresión de Y sobre X (pendiente de la recta): 𝑏𝑦𝑥 = = = −0,729
𝑠𝑥2 71,91

Adviértase que la pendiente de la recta (−0,729) en el signo depende de la covarianza (𝑠𝑥𝑦 ), al ser
negativa la recta de regresión será decreciente, esto es, a medida que aumenta los valores de la
variable X (PIB per cápita) disminuyen los valores de la variable Y (tasa natural de crecimiento
demográfico).

La recta de regresión solicitada será: y − 17,82 = −0,729 (x − 6,04)

c) El coeficiente de determinación lineal: 𝑟 2 = 𝑏𝑦𝑥 𝑏𝑥𝑦

𝑠𝑥𝑦 −52,46
𝑏𝑥𝑦 = = = −0,07
𝑠𝑦2 745,97

113
Lic. Isidro W. Nina Paco

Con lo que, 𝑟 2 = (−0,729)(−0,07) = 0,051 (5,1% grado de fiabilidad)

El coeficiente de correlación lineal: 𝑟 = √0,051 = 0,226 (no existe apenas correlación lineal entre
las variables, pudiendo existir otro tipo de correlación)

EJERCICIO 6.

La siguiente distribución bidimensional se expresa en la siguiente tabla de correlaciones. La


variable X representa los ingresos familiares mensuales en unidades de 10 euros. La variable
Y representa, a su vez, los metros cuadrados de la vivienda familiar.
X/Y < 60 60 – 80 80 – 100 100 – 150 > 150
50 – 100 20 18 2 1 0
100 – 200 25 40 30 2 1
200 – 350 5 10 15 25 3
350 – 500 0 5 15 20 8
> 500 0 1 2 7 10

a) Calcular la distribución marginal de las dos variables. ¿Son independientes los


ingresos familiares y el tamaño de la vivienda donde habitan?
b) Obtener la distribución de la superficie de la vivienda condicionada al intervalo modal
de los ingresos familiares.
c) Calcular la distribución de los ingresos condicionada al intervalo mediano de la
vivienda familiar.
Solución.

a)

X/Y < 60 60 – 80 80 – 100 100 – 150 > 150 𝑓𝑖∗ 𝑓𝑖∗


ℎ𝑖∗ =
𝑁
50 – 100 20 18 2 1 0 41 0,155
100 – 200 25 40 30 2 1 98 0,370
200 – 350 5 10 15 25 3 58 0,219
350 – 500 0 5 15 20 8 48 0,181
> 500 0 1 2 7 10 20 0,075
𝑓∗𝑗 50 74 64 55 22 N=265 1
𝑓∗𝑗 0,189 0,279 0,242 0,208 0,083 1
ℎ∗𝑗 =
𝑁

Para que los ingresos familiares (X) y el tamaño de la vivienda familiar (Y) sean independientes debe
verificarse
𝑓𝑖𝑗 𝑓𝑖∗ 𝑓∗𝑗
= ( ) ( ) ∀𝑖, 𝑗
𝑁 𝑁 𝑁

114
Lic. Isidro W. Nina Paco

𝑓43 𝑓4∗ 𝑓∗3 15 48 64


No son independientes porque ≠ → ≠
𝑁 𝑁 𝑁 265 265 265
DISTRIBUCIÓN MARGINAL DE LA VARIABLE X

Intervalos 𝑥𝑖 𝑓𝑖∗ 𝑐𝑖 𝑓𝑖∗ 𝐹𝑖∗ 𝐹𝑖∗ 𝑓𝑖


ℎ𝑖∗ = 𝐻𝑖∗ = 𝐴𝑙𝑡𝑖 =
𝑁 𝑁 𝑐𝑖
50 – 100 75 41 50 0,155 41 0,155 0,82
100 – 200 150 98 100 0,370 139 0,525 0,98
200 – 350 275 58 150 0,219 197 0,744 0,39
350 – 500 425 48 150 0,181 245 0,925 0,32
> 500 ----- 20 ----- 0,075 265 1 ------
265 1

DISTRIBUCIÓN MARGINAL DE LA VARIABLE Y

Intervalos 𝑦𝑖 𝑛∗𝑗 𝑐𝑗 𝑓∗𝑗 𝐹𝑗∗ 𝐹∗𝑗 𝑓𝑗


ℎ∗𝑗 = 𝐻∗𝑗 = 𝐴𝑙𝑡𝑗 =
𝑁 𝑁 𝑐𝑗
< 60 ----- 50 ----- 0,189 50 0,189 -----
60 – 80 70 74 20 0,279 124 0,468 3,7
80 – 100 90 64 20 0,242 188 0,71 3,2
100 – 150 125 55 50 0,208 243 0,918 1,1
> 150 ----- 22 ----- 0,083 265 1 ------
265 1

b) X = “ingreso familiares” e Y= “metros cuadrados de la superficie”

𝑦𝑗 𝑓𝑗 /50 − 100 𝑓𝑗 /100 − 200 𝑓𝑗 /200 − 350 𝑓𝑗 /350 − 500 𝑓/> 500
< 60 20 25 5 0 0
60 – 80 18 40 10 5 1
80 – 100 2 30 15 15 2
100 – 150 1 2 25 20 7
> 150 0 1 3 8 10
41 98 58 48 20
Con los datos disponibles no se puede calcular el intervalo modal de la variable X, al no
poder calcular todas las densidades de frecuencias marginales, es imposible hacerlo en el
tramo (> 500) que tiene una amplitud ilimitada.
c) La distribución condicionada de la variable X al intervalo mediano de la Y (vivienda familiar):

X/Y < 60 60 – 80 80 – 100 100 – 150 > 150


50 – 100 20 18 2 1 0
100 – 200 25 40 30 2 1
200 – 350 5 10 15 25 3
350 – 500 0 5 15 20 8

115
Lic. Isidro W. Nina Paco

> 500 0 1 2 7 10

Intervalos 𝑓𝒊𝟑 (𝑓𝒊∗ /80 − 100)


50 – 100 2
100 – 200 30
200 – 350 15
350 – 500 15
> 500 2

EJERCICIO 7.
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋
Se conocen las regresiones {
𝑋⁄𝑌 : 𝑋 = 2 + 0,3𝑌
Sabiendo además que 𝑠𝑥𝑦 = 3,2. Obtener la varianza residual de las dos rectas de regresión.

Solución.

𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋 𝑏𝑦𝑥 = 2 𝑏𝑦𝑥 = 𝑠𝑥𝑦 ⁄𝑠𝑥2 ⟶ 𝑠𝑥2 = 3,2⁄2 = 1,6


{ ↦{ ↦{
𝑋⁄𝑌 : 𝑋 = 2 + 0,3𝑌 𝑏𝑥𝑦 = 0,3 𝑏𝑥𝑦 = 𝑠𝑥𝑦 ⁄𝑠𝑦2 ⟶ 𝑠𝑦2 = 3,2⁄0,3 = 10,67

Por otra parte, el coeficiente de determinación: 𝑅 2 = 𝑏𝑦𝑥 𝑏𝑥𝑦 = 2 ∗ 0,3 = 0,6

𝑌⁄𝑋 : 𝑠𝑟2 = 𝑠𝑦2 ⌊1 − 𝑟 2 ⌋ ⟶ 𝑠𝑟2 = 10,67[1 − 0,6] = 4,268


Varianza residual {
𝑋⁄𝑌 : 𝑠𝑟2 = 𝑠𝑥2 [1 − 𝑟 2 ] ⟶ 𝑠𝑟2 = 1,6[1 − 0,6] = 0,64

𝑌⁄𝑋 : 𝑠𝑟 = 𝑠𝑦 ⌊1 − 𝑟 2 ⌋ ⟶ 𝑠𝑟 = √4,268 = 2,066


Error típico estimación {
𝑋⁄𝑌 : 𝑠𝑟 = 𝑠𝑥 [1 − 𝑟 2 ] ⟶ 𝑠𝑟 = √0,64 = 0,8

EJERCICIO 8.

Sean las siguientes ecuaciones las rectas de regresión de una variable bidimensional
(𝑌, 𝑋; 𝑓𝑖𝑗 )
𝑋 − 2𝑌 = 3
{
𝑋 − 4𝑌 = 2
a) ¿Cuál de estas rectas corresponde a la regresión de 𝑌/𝑋 y cuál a la regresión de 𝑋/𝑌?
b) Hallar las medias aritméticas de Y sobre X
c) ¿Cuánto vale el coeficiente de correlación lineal?

Solución.

a)

116
Lic. Isidro W. Nina Paco

𝑎=3
𝑋 = 3 + 2𝑌 ↦ {𝑏 = 2
𝑋 − 2𝑌 = 3 ⟶ recta regresión 𝑋⁄𝑌 ⟶ 1 1 𝑥𝑦
{ { ′
𝑋 − 4𝑌 = 2 ⟶ recta regresión 𝑌⁄𝑋 ⟶ 𝑌 = − + 𝑋 𝑎 = − 1⁄2
2 4 ↦{
𝑏𝑦𝑥 = 1⁄4
↦ signo (𝑏𝑥𝑦 ) = signo (𝑏𝑦𝑥 )
1
Coeficiente de determinación 𝑟 2 = 𝑏𝑥𝑦 𝑏𝑦𝑥 = 2 ∗ = 0,5 < 1
4
3
𝑎=−
2
3 1 ↦{ 1
𝑋 − 2𝑌 = 3 ⟶ recta regresión 𝑌⁄𝑋 ⟶ 𝑌 = − + 𝑋
{ { 2 2 𝑏𝑥𝑦 =
𝑋 − 4𝑌 = 2 ⟶ recta regresión 𝑋⁄𝑌 ⟶ 2
𝑋 = 2 + 4𝑌 𝑎′ = 2
↦{
𝑏𝑦𝑥 = 4
↦ signo (𝑏𝑥𝑦 ) = signo (𝑏𝑦𝑥 )
1
Coeficiente de determinación 𝑟 2 = 𝑏𝑦𝑥 𝑏𝑥𝑦 = ∗ 4 = 2 > 1 cosa que no es posible (0 ≤ 𝑟 2 ≤ 1)
2
𝑋⁄𝑌 : 𝑋 = 3 + 2𝑌
En consecuencia { 1 1
𝑌⁄𝑋 : 𝑌 = − + 𝑋
2 4
EJERCICIO 9.

En una distribución bidimensional (𝑋𝑖 , 𝑌𝑗 , 𝑓𝑖𝑗 ) se conoce 𝑥̅ = 10 y 𝑠𝑥𝑦 = 10. Ambas rectas de
regresión pasan por el punto (0, 0). ¿Cuál es el grado de bondad del ajuste?
Solución.

Las rectas de regresión de Y/X e X/Y se cortan en (𝑥̅ , 𝑦̅), en este caso en el punto (10, 𝑦̅).
Por otra parte, según el enunciado se cortan en (0, 0), por lo que se puede concluir que
ambas rectas coinciden al tener dos puntos distintos en común.
En consecuencia, 𝑅2 = 1 → 𝑅 = 1 (100% grado de ajuste)

EJERCICIO 10.

A partir de un conjunto de datos sobre las variables X e Y se ha calculado la regresión de Y


sobre X, obteniéndose los siguientes resultados:

𝑌 = 10 + 0,45𝑋 𝑟 2 = 0,9 𝑥̅ = 20

Calcular los parámetros de regresión de X sobre Y


Solución.
𝑎 = 10 0,9
𝑌 = 10 + 0,45𝑋 ↦ {𝑏 = 0,45 ⟶ 𝑟 2 = 0,9 = 0,45𝑏𝑥𝑦 ⇒ 𝑏𝑥𝑦 = = 2 (pendiente recta)
𝑦𝑥 0,45

117
Lic. Isidro W. Nina Paco

De otra parte, y = a + b ∗ x ⟶ 𝑦̅ = 10 + 0,45 ∗ 20 = 19


Análogamente, x = a′ + b′ ∗ y ⟶ a′ = 𝑥̅ − 𝑏 ′ ∗ 𝑦̅ ⇒ 𝑎′ = 20 − 2 ∗ 19 = −18
La recta de regresión de 𝑋⁄𝑌 : 𝑋 = −18 + 2𝑌

EJERCICIO 11.

¿Cuáles de los siguientes pares de posibles rectas de regresión de Y/X y de X/Y realmente
pueden serlo? Razone la respuesta.
a) 𝑌 = 3 + 4𝑋 siendo 𝑋 = 2 + 𝑌 b) 𝑌 = 3 + 2𝑋 siendo 𝑋 = 2 − 0,3𝑌
c) 𝑌 = 3 + 2𝑋 siendo X = 2 + 0,2Y
Solución.
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 4𝑋 ↦ |𝑏 = 4 > 0 signo (𝑏𝑦𝑥 ) = signo (𝑏𝑥𝑦 )
𝑦𝑥
{ ′ ↦{ 2
𝑎 =2 𝑟 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = 4 ∗ 1 = 4 > 1 contradicción
𝑋⁄𝑌 : 𝑋 = 2 + 𝑌 ↦ |
𝑏𝑥𝑦 = 1 > 0
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋 ↦ |𝑏 = 2 > 0
𝑦𝑥
{ ↦ {signo (𝑏𝑦𝑥 ) ≠ signo (𝑏𝑥𝑦 ) contradicción
𝑎′ = 2
𝑋 ⁄𝑌 : 𝑋 = 2 − 0,3𝑌 ↦ |
𝑏𝑥𝑦 = −0,3 < 0
𝑎=3
𝑌⁄𝑋 : 𝑌 = 3 + 2𝑋 ↦ |𝑏 = 2 > 0
𝑦𝑥
{ ′
𝑎 =2
𝑋⁄𝑌 : 𝑋 = 2 + 0,2𝑌 ↦ |
𝑏𝑥𝑦 = 0,2 > 0
signo (𝑏𝑦𝑥 ) = signo (𝑏𝑥𝑦 )
↦{ 2 } coeficientes coherentes
𝑟 = 𝑏𝑦𝑥 ∗ 𝑏𝑥𝑦 = 2 ∗ 0,2 = 0,4 < 1

EJERCICIO 12.
Hallar la covarianza si: 𝑉[𝑥+𝑦] = 9.2 y 𝑉[𝑥−𝑦] = 14.8

Solución:

(1) Vx  y   Vx   V y   2m xy  9,2 (2) Vx  y   Vx   V y   2m xy 14,8

Multiplicamos a la segunda ecuación por -1 y le restamos a la primera:

9,2  Vx   V y   2m xy
 14,8   Vx   V y   2m xy mxy  
5,6
  1,4 m xy   1,4
4
 5,6  0 0 4m xy

118
Lic. Isidro W. Nina Paco

EJERCICIO 13.

Siendo 𝑏𝑦𝑥 = 0,40 𝑟 = 0,94 𝑆𝑥2 = 18 Se pide:

a) Determinar el porcentaje de la varianza que queda sin explicar, en la regresión de 𝑌̂ en función de


x:
b) La varianza de la suma de las dos variables X y Y
Solución:

s 2yx
a) 100  porcentaje de la varianza total que queda sin explicar.
s 2y

s 2yx s 2yx s 2yx


R 1
2  0,8836  1    1  0,8836  0,1164
s 2y s 2y s 2y
s 2yx VR
100  11,64 % 100  11,64 %
s 2y VT

El porcentaje de la varianza total que queda sin explicar es del 11,64%.

m xy
b) Vx  y   Vx   V y   2 mxy b yx   byx s x2  mxy  0,40  18   7,2
s x2

2
0,8836
R 2  byx bxy  bxy  R   2,209
b yx 0,40

Vx  y   18  3,259  2 7,2  35,659


m xy m xy 7,2
bxy  s 2y    3,259 ;
s 2y bxy 2,209

EJERCICIO 14.
Al observar el número de sucursales (X) y los costos mensuales (Y) en comunicación telefónica con la
casa central, en miles de Bs., para 10 empresas se encontró:

x: 3 5 3 2 4 1 5 2 6 3
y: 2 3 5 4 6 2 5 1 3 5

Apoyándose en la información anterior, ajuste la recta que muestre la relación de los costos en función
del número de sucursales y estime los costos de una empresa con 10 sucursales.
Solución:
n  10  xi  34  yi  36  xi yi  130

 xi2  138  y i2  154

a) Yˆ  b yx x  C yx  Yˆ  b yx x  x   y x  3,4 y  3,6

119
Lic. Isidro W. Nina Paco

Cov 
130
 3,4  3,6   0,76 s x2  2,24 s 2y  2,44
10

Cov 0,76
b yx    0,3393  0,34
s x2 2,24

Yˆ  0,3393 10  3,4  3,6  5,8394  5,84 miles de Bs. es el costo para una empresa con 10 sucursales
EJERCICIO 15.
Los siguientes datos del semestre pasado, representan el número de días de incapacidad por enfermedad
o accidente de trabajo (Y) y los años de antigüedad en la compañía (X). Se tomó una muestra de 30
empleados que fueron incapacitados.

𝑥𝑖 : 7 8 2 3 5 3 7
𝑦𝑖 : 2 1 5 6 4 9 2
𝑛𝑖 : 2 3 6 5 4 7 3

a) De acuerdo a la información dada, se desea estimar el número de días de incapacidad para un


trabajador con una antigüedad de 6 años.
b) Además determine el coeficiente de correlación.
Solución:

xi yi ni

7 2 2 n  30 x i f i  127

8 1 3 y i f i  152

2 5 6

3 6 5 x 2
i f i  669 y 2
i f i  984
5 4 4

3 9 7 x  4,23 y  5,07
x i yi f i  513
7 2 3

 30

669 984
s x2   4,23 2  4,4071 s 2y   5,07 2  7,095
30 30

120
Lic. Isidro W. Nina Paco

 4,23 5,07    4,3461


513
a) Cov 
30

 4,3461
byx    0,986
4,4071

Yˆ   0,986 6  4,23  5,07  3,32 días de incapacidad


30 513   127  152 
b) r    0,78  R 2  0,61
30 669   127   30 984   152  
2 2

EJERCICIO 16.
En un estudio sobre transporte urbano se quiere predecir, mediante un ajuste parabólico, la capacidad
que debe tener un vehículo de servicio (Y) de acuerdo al número de pasajeros que en determinado
momento debe llevar (X). Se tomaron 10 vehículos de diferente capacidad de pasajeros.

𝑦𝑖 : 12 20 12 20 40 12 20 40 12 20
𝑥𝑖 : 8 12 5 10 14 8 11 16 6 5

a) Efectuar la estimación de la capacidad de un vehículo que lleva 13 pasajeros.


b) Calcular el coeficiente de correlación parabólico.

Solución:
xi yi Por comodidad, cambiamos por yi = Capacidad y xi = el número de pasajeros, con el fin
de estimar Ŷ en vez de estimar X̂ , tal como se hace frecuentemente, obteniéndose
8 12
los mismos resultados.
12 20
xi2 xi3 xi4 xi y i xi2 y i y i2
5 12
64 512 4.096 96 768 144
10 20
144 1.728 20.736 240 2.880 400
14 40
25 125 625 60 300 184
8 12
100 1.000 10.000 200 2.000 400
11 20
196 2.744 38.416 560 7.840 1.600
16 40
64 512 4.096 96 768 144
6 12
121 1.331 14.641 220 2.420 400
5 20
256 4.096 65.536 640 10.240 1.600
95 208

121
Lic. Isidro W. Nina Paco

36 216 1.296 72 432 144

25 125 625 100 500 400

1.031 12.389 160.067 2.284 28.148 5.376

a) Yˆ  a x 2  b x  c  Yˆ  a yx x 2  byx x  c yx

1) 1.031a  95 b  10 c  208
2) 12.389 a  1.031b  95 c  2.284
3) 160.067 a  12.389b  1.031c  28.148

Resolviendo el sistema de 3 ecuaciones con 3 incógnitas se obtiene los siguientes resultados.


a  0,3495 b   4,6598 c  29,0347

Yˆ  0,3495 x 2  4,6598 x  29,0347 Siendo x = 13 se tiene:

Yˆ  0,3495 13  4,6598 13  29,0347  27,5228 Yˆ  27 ,52 Pasajeros


2

La capacidad del vehículo, puede ser aproximadamente de 30 pasajeros

5.376  29,0347 208   4,6598 2.284   0,3495 28 .148 


b) s yx2   14,20
10
2
5.376  95 
s 2y      447 ,35
10  10 

s yx2 14,20
R2  1  2
 R2  1   0,9683  r  R 2  0,98
s y
447 ,35

EJERCICIO 17.
Siendo:

∑ 𝑥1 = 129 ∑ 𝑥1 𝑥2 = 1.996 ∑ 𝑥1 𝑥3 = 201,98

∑ 𝑥2 = 79 ∑ 𝑥22 = 1.279 ∑ 𝑥32 = 14,1881

∑ 𝑥3 = 7,23 ∑ 𝑥3 𝑥2 = 129,39 𝑛=6

𝑋1 = Precio de bienes agrícolas; 𝑋2 = Costo unitario de producción

𝑋3 = Expectativas de inflación del 8%


Se pide estimar el precio de los bienes agrícolas, cuando el costo de producción es de 40 y la
expectativa de inflación del 8%

122
Lic. Isidro W. Nina Paco

Solución:

Xˆ 1  a1  a2 x2  a3 x3

 x1  na1  a2  x2  a3  x3
 x1 x 2  a1  x 2  a 2  x 22  a 3  x3 x 2
 x1 x3  a1  x3  a 2  x 2 x3  a3  x32

1 6 a1  79 a 2  7,23 a3  129


2 79 a1  1.279 a 2  129,39 a3  1.996
3 7,23 a1  129,39 a 2  14,1881 a3  201,98
Resolviendo el sistema de ecuaciones con tres incógnitas se tiene:
𝑎1 = 9.730 𝑎2 = 0.2712 𝑎3 = 6,8048

Xˆ 1  9,730  0,2712 x2  6,8048 x3

Xˆ 1  9,730  0,2712 40   6,8048 8  75,0164 Xˆ 1  75,02

EJERCICIO 18.
En un curso de microeconomía de 20 estudiantes se dieron los siguientes resultados
correspondientes a las calificaciones parciales (X) y el examen final (Y):

𝑥̅ = 60 𝑦̅ = 65 ∑(𝑌̂ − 𝑦̅)2 = 95 𝑆𝑥 = 4 𝑆𝑦2 = 64

a) ¿Qué porcentaje de la varianza total de y queda sin explicar por la recta de regresión?
b) Un estudiante obtuvo una calificación de: 58 en el examen parcial. ¿Cuál será la predicción de su
calificación en el examen final?
c) ¿Cuál será la varianza total de la suma de las variables (X+Y)?

Solución:

 Yˆ 
2
 y
s 2
ay 
i

95
 4,75 s x2  16 sx  4 sy  8
n 20

a) VT  V R  V E  s 2y  say
2
 s 2yx  s 2yx  s 2y  s ay
2

s yx2  64  4,75  59,25

VR 59,25
  0,93  93% Porcentaje que no queda explicado por la recta de regresión
VT 64

123
Lic. Isidro W. Nina Paco

b) Yˆ  b yx x  C yx  Yˆ  b yx x  x   y

2
VE s ay 4,75 Cov
R2   R2  2
  0,074  R 
VT s y 64 sx s y

 Cov  0,27 32  8,64


Cov
0,27 
4 8

Yˆ  0,54 58  60  65  63,92


Cov 8,64
b yx    0,54 Yˆ  63,92
s x2 16
Se espera una calificación de 63,92 en el examen final

c) Vx  y   s x  s y  2 Cov
2 2

Vx  y   16  64  2 8,64  97,28

EJERCICIO 19.
La representación de la nube de puntos nos da la idea de que un buen ajuste va a ser el lineal
aunque tampoco debemos descartar el ajuste exponencial sólo por el dibujo.

Solución.
a) Ajuste por una función lineal:
Como es habitual, introducimos la tabla con las columnas siguientes:

𝒙𝒊 𝒚𝒊 𝒙𝟐𝒊 𝒚𝟐𝒊 𝒙 𝒊 𝒚𝒊
-6 2 36 4 -12
-3 2.8 9 7.84 -8.4
0 3.9 0 15.21 0
3 4.2 9 17.64 12.6
6 5.8 6 33.64 34.8
9 6.2 81 38.44 55.8

124
Lic. Isidro W. Nina Paco

12 7.5 144 56.25 90


15 8.2 225 67.24 123
20 9.3 400 86.49 186
25 10.9 625 118.81 272.5
Suma 81 60.8 1535 445.56 754.3
81 60,8
𝑋̅ = = 8,1 𝑌̅ = = 6,08
10 10
754,3
𝑆𝑋𝑌 = − 8,1 ∗ 6,08 = 26,182
10
1565
𝑆𝑋2 = − 8,12 = 90,89
10
Luego:
𝑆𝑋𝑌 26,182
𝑏= = = 0,288
𝑆𝑋2 90,89

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 6,08 − 0,288 ∗ 8,1 = 3,7467


Por tanto, la recta de regresión es 𝑦 = 3,7467 + 0,288𝑥.
b) Ajuste por una función exponencial: Como la función buscada es 𝑦 = 𝑎𝑒 𝑏𝑥 , tomando
logaritmos tenemos que log 𝑦 = log 𝑎 + 𝑏𝑥. Llamamos a la nueva variable 𝑦 ′ = log 𝑦 y
también hacemos 𝑎′ = log 𝑎. Tenemos entonces que calcular entonces la recta de regresión
𝑦 ′ = 𝑎′ + 𝑏𝑥 para las nuevas variables 𝑦′ y 𝑥.
𝑥𝑖 𝑦𝑖 𝑦′𝑖 = 𝑙𝑜𝑔 𝑦𝑖 𝑥𝑖2 (𝑦′𝑖 )2 𝑥𝑖 𝑦′𝑖
-6 2 0.693 36 0.480249 -4.158
-3 2.8 1.03 9 1.0609 -3.09
0 3.9 1.361 0 1.852321 0
3 4.2 1.435 9 2.059225 4.305
6 5.8 1.758 6 3.090564 10.548
9 6.2 1.825 81 3.330625 16.425
12 7.5 2.015 144 4.060225 24.18
15 8.2 2.104 225 4.426816 31.56
20 9.3 2.23 400 4.9729 44.6
25 10.9 2.389 625 5.707321 59.725
Suma 81 60.8 16.84 1535 31.041146 184.095

𝑋̅ = 8,1 ̅ = 16,84 = 1,684


𝑌′
10
184,1
𝑆𝑋𝑌′ = − 8,1 ∗ 1,684 = 4,7696
10
𝑆𝑋2 = 90,89
Luego:

125
Lic. Isidro W. Nina Paco

𝑆𝑋𝑌′ 4,7696
𝑏= = = 0,0525
𝑆𝑋2 90,89

𝑎′ = 𝑌̅′ − 𝑏𝑋̅ = 1,684 − 0,0525 ∗ 8,1 = 1,259


El valor que buscamos para la función exponencial es a, no a0; pero

𝑎 = 𝑒 𝑎′ = 𝑒 1,259 = 3,522
Luego la función exponencial que mejor se ajusta a las observaciones es

𝑦 = 3,522𝑒 0,0525𝑥
Finalmente, para decidir cuál es el mejor modelo de los dos utilizados, calculamos los
errores típicos:
𝑛
1
𝑒𝑡 = √ ∑(𝑦𝑖 − 𝑦(𝑥𝑖 ))2
𝑛
𝑖=1

a) Modelo lineal:

𝑦1 − 𝑦(𝑥1 ) = 0,0187 𝑦2 − 𝑦(𝑥2 ) = 0,0827 𝑦3 − 𝑦(𝑥3 ) = 0,1533 𝑦4 − 𝑦(𝑥4 )


= 0,0772 𝑦5 − 𝑦(𝑥5 ) = 0,3253 𝑦6 − 𝑦(𝑥6 ) = −0,1387 𝑦7 − 𝑦(𝑥7 )
= 0,2973 𝑦8 − 𝑦(𝑥8 ) = 0,1333 𝑦9 − 𝑦(𝑥9 ) = −0,2067 𝑦10 − 𝑦(𝑥10 )
= −0,0467
Tomamos estas diferencias, hacemos sus cuadrados y las sumamos. Finalmente dividimos
por 10 y hacemos la raíz cuadrada. Entonces,
𝑒𝑡 = 0,218
b) Modelo exponencial:
𝑦1 − 𝑦(𝑥1 ) = −0,57 𝑦2 − 𝑦(𝑥2 ) = 0,2088 𝑦3 − 𝑦(𝑥3 ) = 0,378 𝑦4 − 𝑦(𝑥4 )
= 0,0772 𝑦5 − 𝑦(𝑥5 ) = 0,974 𝑦6 − 𝑦(𝑥6 ) = 0,551 𝑦7 − 𝑦(𝑥7 )
= 0,887 𝑦8 − 𝑦(𝑥8 ) = 0,459 𝑦9 − 𝑦(𝑥9 ) = 0,765 𝑦10 − 𝑦(𝑥10 )
= −2,186
Análogamente, 𝑒𝑡 = 0,902
El error menor es el correspondiente al modelo lineal, que será, por tanto, el más adecuado.

EJERCICIO 20.
A partir de las siguientes observaciones para 5 años de las variables X e Y, ajústese el modelo
de regresión de Y en función de X más idóneo.

Donde,

Y: producción nacional de un subsector industrial, en millones de toneladas.

X: tiempo

126
Lic. Isidro W. Nina Paco

Año X Y
1995 1 1,25
1996 2 5
1997 3 11,25
1998 4 20
1999 5 30,5

Solución.
a) Ajuste de una función lineal: Y* = a + b X

X Y X2 XY Y2 Y* e=Y-Y* e2
1 1,25 1 1,25 1,56 -1,1 2,35 5,5225
2 5 4 10 25 6,25 -1,25 1,5625
3 11,25 9 33,75 126,56 13,6 -2,35 5,5225
4 20 16 80 400 20,95 -0,95 0,9025
5 30,5 25 152,5 930,25 28,3 2,2 4,84

 15 68 55 277,5 1483,3 68 0 18,35

1/5  3 13,6 11 55,5 296,67 13,6 0 3,67

S XY 1/5  XY - X Y 55,5 - (3  13,6) 14,7


b     7,35
S 2X 1/5  X 2  X 2 11  3 2 2

a  Y - b X  13,6 - 7,35  3  - 8,45

Y* = -8,45 + 7,35 X

Bondad del Ajuste:

2 S2 * S e2 3,67
Coeficiente de determinación: R = 2 r =XY
Y
2
 1- 2
 1-  0,9671
S Y S Y
111,715

127
Lic. Isidro W. Nina Paco

S 2Y  1/5 Y 2  Y 2  296,675 - 13,6 2  111,715

S e  ECM1
2

e 2

 3,67
N

b) Ajuste de una función parabólica: Y * = a + b X + c X2

X Y X2 X3 X4 XY X2Y Y* e=Y- e2
Y*
1 1,25 1 1 1 1,25 1,25 1,18 0,07 0,0049
2 5 4 8 16 10 20 5,11 -0,11 0,0121
3 11,25 9 27 81 33,75 101,5 11,32 -0,07 0,0049
4 20 16 64 256 80 320 19,81 0,19 0,0361
5 30,5 25 125 625 152,5 762,5 30,58 -0,08 0,0064

 15 68 55 225 979 277,5 1205 68 0 0,0644

1/5 3 13,6 11 55,5 13,6 0 0,0128

Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones:


 Y  Na  b  X  c  X2  68  5a  15b  55c 

 XY  a X  b X  c  X   277,5  15a  55b  225c 
2 3

 X2 Y  a X2  b X3  c  X4  1205  55a  225b  979c  

Resolviendo este sistema se obtiene: a= -0,47 b= 0,51 c= 1,14


* 2
Y = -0,47 + 0,51 X + 1,14 X

Bondad del Ajuste:

2
S2 * S e2 0,01288
Coeficiente de determinación: R = Y
2
 1- 2
 1-  0,9998
S Y S Y 111,715

S e  ECM 2
2

e 2

 0,01288
N

128
Lic. Isidro W. Nina Paco

c) Ajuste de una función potencial: Y* = a Xb

En primer lugar linealizamos: 𝑙𝑛𝑌 ∗ = 𝑙𝑛𝑎 + 𝑏 𝑙𝑛𝑋  𝑉 ∗ = 𝐴 + 𝑏 𝑈


X Y U=lnX V=lnY U2 UV Y* e=Y-Y* e2
1 1,25 0 0,2231 0 0 1,2557 -0,0057 0,0000
2 5 0,6931 1,6094 0,4803 1,1156 4,9888 0,0112 0,0001
3 11,25 1,0986 2,4203 1,2069 2,6590 11,18 0,0697 0,0049
4 20 1,3863 2,9957 1,9215 4,1530 19,82 0,1799 0,0324
5 30,5 1,6094 3,4177 2,5901 5,5006 30,901 -0,4012 0,1610

 15 68 4,7875 10,666 6,1988 13,428 68,146 -0,1461 0,1984

1/5 3 13,6 0,9575 2,1332 1,2397 2,6856 13,629 -0,0292 0,0397

e0

SUV 1/5 UV - U V 2,6856 - 0,9575  2,1332


b    1,9902
SU2 1/5 U2  U 2 1,2397  0,9575 2

A  V - b U  2,1332 - 1,9902  0,9575  0,2277

Deshacemos el cambio efectuado: a= antilnA = antiln 0,2277 = 1,2557


Por lo que el ajuste efectuado es: Y* = 1,2557 X 1,9902

Bondad del Ajuste:

ECM3 
e 2

 0,0397
N

Nótese que al haber transformado la variable dependiente ya no se minimiza e 2


sino

 (lnY - lnY * ) 2
, de ahí que e  0 .
d) Ajuste de una función exponencial: Y* = a bX

En primer lugar linealizamos: 𝑙𝑛𝑌 ∗ = 𝑙𝑛𝑎 + 𝑋 𝑙𝑛𝑏  𝑉∗= 𝐴 + 𝐵𝑋


X Y V=lnY X2 XV Y* e=Y-Y* e2
1 1,25 0,2231 1 0,2231 1,7794 -0,529 0,2798

129
Lic. Isidro W. Nina Paco

2 5 1,6094 4 3,2188 3,86 1,138 1,2950


3 11,25 2,4203 9 7,2609 8,37 2,88 8,2944
4 20 2,9957 16 11,983 18,18 1,82 3,3124
5 30,5 3,4177 25 17,088 39,45 -8,95 80,102

 15 68 10,666 55 39,774 71,64 -3,641 95,803

1/5 3 13,6 2,1332 11 7,9548 14,328 -0,728 19,16

e0

S XV 1/5 XV - X V 7,9548 - 2,1332  3


B    0,7776
S 2
X 1/5 X  X 2 2
11  3 2

A  V - b X  2,1332 - 0,7776  3  - 0,1996

Deshacemos los cambios efectuados: a= antilnA = antiln-0,1996 = 0,819


b= antilnB =antiln 0,7776 = 2,176
Por lo que el ajuste efectuado es: Y = 0,819 . 2,176 X
*

Bondad del Ajuste:

ECM 4 
e 2

 19,16
N

La comparación de la bondad de modelos de regresión mediante el coeficiente de determinación


sólo es correcta cuando la variable dependiente no ha sido sometida a transformaciones no
lineales (por ejemplo, una transformación logarítmica). En este ejercicio, mediante R 2 sólo
podemos comparar la regresión lineal y la parabólica. Por eso, para comparar los cuatro ajustes
efectuados utilizamos el Error Cuadrático Medio. El mejor ajuste resulta ser el parabólico
puesto que presenta el menor valor para el ECM.

130
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS (parte 2)


EJERCICIO 1.
De una tabla de correlación se han calculado los siguientes datos:

𝑏𝑥𝑦 = −0.2 𝑅 2 = 0.9 𝑆𝑥2 = 8 𝑥̅ = 2

Se pide calcular la varianza de la suma de dos variables.


Solución:

Vx  y   116

EJERCICIO 2.
Con los siguientes datos de 10 pares de observaciones, mediante la regresión lineal:

x: 12 22 36 20 26 34 18 20 25 30
y: 5 8 12 10 14 16 10 13 18 19

a) Estimar el valor de 𝑌̂ cuando 𝑥 = 15


b) Calcular el coeficiente de determinación.
Solución:

a) Yˆ  8,81

b) R 2  0,4463
EJERCICIO 3.
La siguiente información corresponde: 𝑋 = edad de autos en años y 𝑌 =gastos de mantenimiento
durante los dos últimos años (en miles de Bs.) Utilizando los datos registrados de cuatro autos, los
cuales fueron: ∑ 𝑥𝑖 = 12 ; ∑ 𝑦𝑖 = 24, ∑ 𝑥𝑖 𝑦𝑖 = 78; ∑ 𝑥𝑖2 = 44. Calcular:

a) El valor de 𝑐𝑦𝑥 ; b) 𝑌̂ = 𝑏𝑦𝑥 𝑥 + 𝑐𝑦𝑥 ; c) 𝑌̂ para x = 6

Solución:

a) C yx  3,75 byx  0,75

b) Yˆ  0,75 x  3,75

c) Yˆ  8,25

EJERCICIO 4.
Dos ecuaciones de regresión, cuyas ecuaciones son: 𝑌̂ = 2,8𝑥 + 10 y 𝑋̂ = 0,3𝑦 + 20 ¿Cuál es el valor
del coeficiente de correlación lineal?

131
Lic. Isidro W. Nina Paco

Solución.

byx  2,8 bxy  0,3 r  0,92

EJERCICIO 5.
Dadas las siguientes variables 𝑋 = 𝑔𝑎𝑠𝑡𝑜𝑠 𝑑𝑒 𝑚𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 de un centro comercial (miles de
bolivianos) y 𝑌 = 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑎𝑟𝑡𝑖𝑐𝑢𝑙𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠 en un mes en el centro comercial.

∑ 𝑦𝑖 = 194 ; ∑ 𝑦𝑖2 = 323.200 ; 𝑥̅ = 9.360; 𝑠𝑥2 = 7.694; 𝑟 = 0,9; 𝑛 = 20

a) Hallar la recta de regresión lineal para 𝑌̂ e interprete el valor de b.


b) ¿Cuantos artículos se venderán en un mes, si se gasta Bs. 9.400 en mantenimiento?

Solución.

a) Yˆ  12158,3  1,3 X

b) Yˆ  61,7
EJERCICIO 6.
Se dispone de la siguiente información sobre dos variables relacionadas entre sí, obtenidas
mediante una muestra aleatoria de 50 observaciones.
𝑥𝑖 ∶ 2 6 9 14 16 23
𝑦𝑖 ∶ 5 13 20 25 35 52
𝑓𝑖 ∶ 18 12 8 6 4 2
a) Determinar la recta de regresión lineal.
b) Estimar el valor de 𝑦̂ cuando 𝑥 = 30.
Solución.

a) Yˆ  2,049 x  0,6735

b) Yˆ  62,14
EJERCICIO 7.
Para cada conjunto de datos, calcular sus ecuaciones de regresión lineal, exponencial, potencial
y parabólica. Decidir cuál es la más conveniente de acuerdo a sus coeficientes de correlación.
a)
X 11 13 15 17 19 21 23
Y 50 80 120 170 260 400 600

132
Lic. Isidro W. Nina Paco

b)
X 2 3 4 5 6 7 8
Y 10 52 126 250 440 732 1120

c)
X 2 4 6 8 10 12 14
Y 30 100 250 450 480 1300 1450
Solución.
a) 𝑌 = −497.68 + 43.39𝑥 , 𝑟 = 0.9441; 𝑌 = 5.43𝑒 0.20𝑥 , 𝒓 = 𝟎. 𝟗𝟗𝟗𝟔
𝑌 = 0.016𝑥 3.32 , 𝑟 = 0.9944; 𝑌 = 664.19 − 101.31𝑥 + 4.26𝑥 2 , 𝑟 = 0.9971
b) 𝑌 = −503.57 + 178.71𝑥 , 𝑟 = 0.9455; 𝑌 = 4.45𝑒 0.74𝑥 , 𝑟 = 0.9705
𝑌 = 1.66𝑥 3.10 , 𝑟 = 0.9983; 𝑌 = 234.43 − 172.71𝑥 + 35.14𝑥 2 , 𝒓 = 𝟎. 𝟗𝟗𝟖𝟖
c) 𝑌 = −404.29 + 123.04𝑥 , 𝑟 = 0.9339; 𝑌 = 26.14𝑒 0.31𝑥 , 𝑟 = 0.9687
𝑌 = 6.92𝑥 2 , 𝒓 = 𝟎. 𝟗𝟗𝟎𝟐; 𝑌 = 82.86 − 39.34𝑥 + 10.15𝑥 2 , 𝑟 = 0.9713
EJERCICIO 8.
El coeficiente de correlación entre dos variables X e Y es 0,6. Sabiendo además
Variable Media Desviación Típica
X 15 1,5
Y 25 2
a) Halle las rectas de regresión estimada de Y sobre X y de X sobre Y.
b) Calcule el coeficiente de determinación y el error estándar de estimación de las dos
regresiones anteriores.

EJERCICIO 9.
Se sostiene que cuando los tipos de interés bajas, las empresas pueden invertir más en bienes
de equipamiento. En la tabla adjunta se dan cifras anuales de interés promedio e inversiones de
capital en millones de dólares:
N° Dato Inversión Interés N° Dato Inversión Interés
1 3 15 9 3 15
2 5 14,5 10 13 10
3 7 4 11 17 9
4 8 13,5 12 20 8,5
5 9 13 13 22 8
6 10 12,5 14 23 7,5
7 12 12 15 30 5
8 12 11,5 16 13 11
Realice un análisis de regresión lineal, cuadrática, exponencial, hiperbólica. Posteriormente
determine que regresión es la más adecuada. (Calculando su coeficientes de correlación).
133
Lic. Isidro W. Nina Paco

EJERCICIO 10.
Los siguientes datos son los precios de venta en dólares Y de una marca de automóviles
usados X años:
X 1 2 3 4 5 6
Y 6350 5695 5790 - 4985 4890
a) Ajustar una curva de mínimos cuadrados de la forma 𝑌 = 𝐴𝐵 𝑥
b) Estimar el precio de venta de un automóvil que tenga 4 años de uso.
c) Calcular el coeficiente de correlación.
Solución:
a) 𝑌 = 6559,78 (0,95) 𝑋
b) 𝑌̂ = 5342,98
c) 𝑟 = −0,9658

134
TEMA 7:
ANALISIS COMBINATORIO Y
PROBABILIDADES

Estudia no para saber algo más, si no para


saberlo mejor, ya que el saber más que los otros
es fácil, lo difícil es saber algo mejor que los
otros. (Seneca)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 7: ANALISIS COMBINATORIO Y PROBABILIDADES


FORMULARIO 7
PERMUTACIONES y VARIACIONES PROBABILIDAD CONDICIONAL
𝑷(𝑨 ∩ 𝑩)
𝑛! 𝑷(𝑨|𝑩) = 𝑷(𝑩) ≠ 0
𝑷 = 𝑉𝑟𝑛 =
𝒏 𝒓
= 𝑷(𝑩)
(𝑛 − 𝑟 )!
= 𝒏(𝒏 − 1)(𝒏 − 2) … (𝒏 − 𝒓 + 1) PROBABILIDAD
𝒌 TOTAL
𝑷(𝑨) = ∑𝑷(𝑩𝒊 )𝑷(𝑨|𝑩𝒊 )
PERMUTACIONES CON TODOS LOS ELEMENTOS 𝒊=1
𝒏! 𝒏!
𝑷 = = = 𝒏! TEOREMA DE BAYES
𝒏 𝒏 (𝒏 − 𝒏)! 0!
𝑃(𝐵𝑖 )𝑃(𝐴|𝐵𝑖 ) 𝑃(𝐵𝑖 )𝑃 (𝐴|𝐵𝑖 )
PERMUTACIONES CON ELEMENTOS REPETIDOS 𝑃 ( 𝐵𝑖 |𝐴 ) = = ,
𝑃 (𝐴 ) ∑𝑘𝑖=1 𝑃 (𝐵𝑖 )𝑃(𝐴|𝐵𝑖 )
𝒏! 𝒊 = 1, 2, … , 𝒌
𝑷
𝒏 𝒏𝟏 ,𝒏𝟐
=
𝒏1 ! 𝒏2 ! DISTRIBUCIÓN DE PROBABILIDAD DE UNA
VARIABLE ALEATORIA DISCRETA
COMBINACIONES ∑ 𝑓 (𝑥 ) = 1
𝑃 𝒏! 𝑛 ( 𝑛 − 1 )( 𝑛 − 1) … (𝑛 − 𝑟 + 1) ∀𝑥 [𝑓(𝑥 ) ≥ 0]
𝑟 𝑥
𝐶 = 𝑛 =
𝑛 𝑟
=
𝑟! (𝒏 − 𝒓)! 𝒓! 𝑟! DISTRIBUCIÓN DE PROBABILIDAD
ACUMULADA DE UNA VARIABLE ALEATORIA
PROBABILIDAD DE UN EVENTO
DISCRETA
Ω: Espacio muestral E: Evento de Omega E⊂Ω
𝐹 (𝑥 ) = 𝑃(𝑋 ≤ 𝑥 ) = ∑𝑓(𝑡)
Se cumple:
𝑡≤𝑥
𝐴1 : 0 ≤ P[E] ≤ 1
VALOR ESPERADO DE UNA VARIABLE
𝐴2 : P[Ω] = 1 ALEATORIA
𝐴3 : Si E1 y 𝐸2 son eventos mutuamente excluyentes 𝜇 = 𝐸 (𝑋) = ∑𝑋𝑓(𝑋)
(E1 ∩ 𝐸2 = 𝜙) → P[E1 ∪ 𝐸2 ] = P[E1 ] + P[𝐸2 ] 𝑋

PROPIEDADES DE EVENTOS VALOR ESPERADO DE EXPRESIONES CON


UNA VARIABLE ALEATORIA
P1 ) Si ϕ es el evento imposible → P[ϕ] = 0
P2 ) Si E es un evento seguro → P[E] = 1 𝜇𝐺(𝑋) = 𝐸[𝐺 (𝑥 )] = ∑𝐺(𝑥)𝑓(𝑥)
P3 ) Si E 𝐶 es el evento complemento de E → P[E] = 1 − P[𝐸𝐶 ] 𝑥
𝑃4 ) Si E1 y 𝐸2 son eventos cuales quiera → PROPIEDADES DEL VALOR ESPERADO
P[E1 ∪ 𝐸2 ] = P[E1 ] + P[𝐸2 ] − P[E1 ∩ 𝐸2 ]
𝐸(𝑎𝑋 + 𝑏) = 𝑎 ∑ 𝑥𝑓 (𝑥 ) + 𝑏 ∑ 𝑓(𝑥)
𝑃5 ) Si E1 y 𝐸2 son eventos cuales quiera →
𝑥 𝑥
P[E1 ∪ 𝐸2 ] ≤ P[E1 ] + P[𝐸2 ]
𝑃6 ) Si E1 , 𝐸2 y E3 son eventos cuales quiera → VARIANZA DE UNA VARIABLE
P[E1 ∪ 𝐸2 ∪ E3 ] = P[E1 ] + P[𝐸2 ] + P[E3 ] − P[E1 ∩ 𝐸2 ] ALEATORIA DISCRETA
−P[E1 ∩ 𝐸3 ] − P[E2 ∩ 𝐸3 ] + P[E1 ∩ 𝐸2 ∩ 𝐸3 ]
𝜎 2 = 𝑉(𝑥 ) = 𝐸 [(𝑥 − 𝜇 )2 ] = ∑(𝑥 − 𝜇 )2 𝑓(𝑥 )
𝑥

135
Lic. Isidro W. Nina Paco

FORMULA PARA CALCULAR LA VARIANZA

𝜎 2 = 𝑽(𝑿) = 𝑬[(𝑿– 𝜇 )2 ] = 𝑬(𝑿2 ) – 𝜇 2 ; 𝜇 = 𝐸(𝑋)

MOMENTO ALREDEDOR DEL ORIGEN

𝜇′𝑟 = 𝐸(𝑋 𝑟 ) = ∑ 𝑥 𝑟 𝑓(𝑥)


𝑥

(𝟏𝒆𝒓 𝑴𝒐𝒎𝒆𝒏𝒕𝒐 𝒂𝒍𝒓𝒆𝒅𝒆𝒅𝒐𝒓 𝒅𝒆𝒍 𝒐𝒓𝒊𝒈𝒆𝒏. 𝑬𝒔 𝒍𝒂 𝒎𝒆𝒅𝒊𝒂)

𝑟 = 1: 𝜇 ′1 = 𝐸 (𝑋1 ) = ∑ 𝑥 𝑓(𝑥) = 𝜇
𝑥

MOMENTO ALREDEDOR DEL LA MEDIA

𝜇𝑟 = 𝐸 [(𝑋 − 𝜇 )𝑟 ] = ∑(𝑥 − 𝜇 )𝑟 𝑓(𝑥 )


𝑥
FUNCION GENERADORA DE MOMENTOS

𝑴(𝒕) = 𝑬(𝒆𝒕𝒙 ) = ∑𝒆𝒕𝒙 𝒇(𝒙)


𝒙

TEOREMA DE CHEBYSHEV
1
1– ≤ 𝑷(𝜇– 𝒌𝜎 < 𝑿 < 𝜇 + 𝒌𝜎)
𝒌2
TEOREMA DE CHEBYSHEV

136
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.
Un embarque de pintura contiene 200 latas de 18 litros de las cuales 80 son de pintura blanca,
50 de amarilla, 30 de roja, 30 de verde y 10 de azul. Durante el viaje, las latas se han
sumergido accidentalmente en aguas y se han borrado todos los rótulos. A la llegada, las latas
se colocan sobre una plataforma, se coge una y se abre. Respecto del color de la lata elegida.
a) ¿Cuál es el espacio muestral?
b) ¿Qué valores podrían asignarse a los diversos puntos muestrales?
c) ¿Cuál es la probabilidad de que la lata elegida contenga pintura roja, blanca o azul?
Solución:
a)  80 B 50 A 30 R 30V 10 Az 
 80 50 30 30 10 
b)  
 200 200 200 200 200

R B Az

c) P  30  80  10  120  0,60
200 200 200 200

EJERCICIO 2.
Asignando la misma probabilidad a cada uno de los puntos del espacio muestral
HHH HHM HMM MMM HMH MHM MHH MMH
a) ¿Cuál es la probabilidad de que en una familia con 3 hijos los dos primeros sean mujeres y
el tercero hombre?
b) ¿Cuál es la probabilidad de que dos sean mujeres y uno sea hombre?
Solución:
a) MMH p  1  0,125
8

b) MMH, MHM, HMM p  3  0,375


8

EJERCICIO 3.
Aseguro mi automóvil contra el riesgo de robo en la suma de Bs. 185.000. Si la probabilidad
de que sea robado en el curso de un año es 0,05 ¿Cuál es el precio justo de la prima anual que
debo pagar?
Solución:
𝐸 = 185.000(0.05) = 𝐵𝑠. 9.250

137
Lic. Isidro W. Nina Paco

EJERCICIO 4.
a) ¿Cuántas permutaciones se pueden hacer con las letras de la palabra REEMPLAZAR?
b) ¿Si se considera que las E deben estar juntas?
Solución:
10! 9!
a) P10 r: 2, 2, 2    453.600 b) P9 r: 2, 2    90.720
2! 2! 2! 2! 2!

EJERCICIO 5.
Desarrolle las siguientes combinaciones:
8 5 5 8 10 10
𝑎) ( ) 𝑏) ( ) 𝑐) ( ) 𝑑) ( ) 𝑒) ( ) 𝑓) ( )
6 3 2 2 4 6
¿Observa algo especial en los ejercicios anteriores? ¿Por qué se dan esos resultados iguales?
Solución:

8 8!  5 5! 5 5!
a)     28 b)     10 c)     10
 6  2! 6!  3  2 ! 3!  2  3! 2 !

8 8! 10  10 ! 10  10 !


d)     28 e)     210 f)     210
 2  6! 2!  4  6! 4!  6  6! 4!

EJERCICIO 6.
Es necesario elegir un comité de 10 personas entre 5 abogados, 3 economistas y 4 contadores.
Si el comité debe estar integrado por 3 abogados, 2 economistas y 2 contadores.
Solución:

 5  3  4
 10 3 6  180 Comités
5! 3! 4!
        
 3  2   2  2! 3! 1! 2! 2! 2!

EJERCICIO 7.
La madre lleva a su hijo a una tienda y le ofrece 3 opciones. La probabilidad de que escoja un
helado es del 70%; yogurt es de 50% y helado y yogurt es de 30%. ¿Cuál es la probabilidad
de que compre helado o yogurt?
Solución:

P A o B   0,70  0,50  0,30  0,90 (Sucesos compatibles)

EJERCICIO 8.

138
Lic. Isidro W. Nina Paco

¿Cuál es la probabilidad, al seleccionar 4 personas en un grupo, de que las 4 sean mujeres?


Solución:

P A   1 ; P B   1 ; PC   1 ; P D   1 ;
2 2 2 2

1 1 1 1 1
P A y B y C y D        0,0625
2 2 2 2 16
EJERCICIO 9.
Se tiene en una caja dos bolas de plástico una azul y otra blanca. ¿Cuál es la probabilidad de
sacar 3 veces sucesivas (con reposición) la bola azul?
Solución:
1 1 1 1
P A y B y C      0,125  12 ,5%
2 2 2 8

EJERCICIO 10.
Se extraen cinco cartas sin reposición de una baraja de 52 cartas, ¿Cuál es la probabilidad de
que las cinco sean diamantes?
Solución:
13 12 11 10 9 154.440
P        0,00049
52 51 50 49 48 311.875.200

EJERCICIO 11.
¿Cuántos números de 4 cifras se pueden formar con los dígitos: 2, 5, 9 y 7 sin repetirlos?
Solución:

P4  4 !  24 Números.
EJERCICIO 12
Un experimento consiste en lanzar tres veces una moneda. Sea la variable aleatoria: X="número
de caras que se obtienen". Se pide:
a) Distribución de probabilidad de X
b) Función de distribución de X. Representación gráfica
c) Media, varianza y desviación típica de X
d) Probabilidad de que salgan a lo sumo dos caras
e) Probabilidad de que salgan al menos dos caras

139
Lic. Isidro W. Nina Paco

Solución:

c) Espacio muestral:   (c,c,c),(c,c,e),(c, e,c),(e,c,c),(c, e,e),(e,c,e),(e, e,c),(e, e,e) 


X(c,c,c)  3 P(X=3)= 1/8
X(c,c, e)  X(c, e,c)  X(e,c,c)  2 P(X=2)= 3/8
X(c, e, e)  X(e,c, e)  X(e, e,c)  1 P(X=1)= 3/8
X(e, e, e)  0 P(X=0)= 1/8

La distribución de probabilidad será:

b) La función de distribución: 𝐹 (𝑥 ) = 𝑃 (𝑋 ≤ 𝑥 ) = ∑𝑋𝑖 ≤𝑋 𝑃 (𝑋 ≤ 𝑥𝑖 ) = ∑𝑋𝑖 ≤𝑋 𝑝𝑖

x0 F(x)  P(X  x)  P()  0

0  x 1 F(x)  P(X  x)  P(X  0)  1/8

1 x  2 F(x)  P(X  x)  P(X  2)  P(X  0)  P(X  1)  1/8 + 3/8 = 4/8

2x3 F(x)  P(X  x)  P(X  3)  P(X  0)  P(X  1)  P(X  2)  1/8  3/8 + 3/8 = 7/8

x3 F(x)  P(X  3)  P(X  0)  P(X  1)  P(X  2)  P(X  3)  1

x3 F(x)  P(X  x)  P()  1

X  xi 0 1 2 3
P(X  xi ) 1/8 3/8 3/8 1/8
F(x)  P(X  x) 1/8 4/8 7/ 8 1

0 𝑥<0
1/8 0≤𝑥≤1
F(x) = 4/8 1≤𝑥<2
7/8 2≤𝑥<3
{ 1 𝑥≥3

140
Lic. Isidro W. Nina Paco

c) Media, varianza y desviación típica de X


Media:
4 4
12
∝1 = μx = E(X) = ∑ xi ∗ P(X = xi ) = ∑ xi pi = = 1,5
8
𝑖=1 𝑖=1
4 4
24
∝2 = E(X2 ) = ∑ xi2 ∗ P(X = xi ) = ∑ xi2 pi = =3
8
𝑖=1 𝑖=1

Varianza:
4

𝜎𝑥2 = E(X − μx )2 = ∑(xi − μx )2 ∗ P(X = xi ) =∝2 −∝12


i=1

𝜎𝑥2 =∝2 −∝12 = 3 − 1,52 = 0,75


Desviación Típica:

𝜎𝑥 = √0,75 = 0,87
d) Probabilidad de que salgan a lo sumo dos caras
P(X  2)  P(X  0)  P(X  1)  P(X  2) o bien P(X  2) F(2)= 7/8

e) Probabilidad de que salgan al menos dos caras.


P(X  2)  P(X  2)  P(X  3) o bien P(X  2) F(1)= 4/8= ½

EJERCICIO 13.
Completar la ley de probabilidad, conociendo que la esperanza matemática es 1,8

X 0 1 2 3
P(X  xi )  pi 0,2 a b 0,3
Solución.
4

∑ pi = 0,2 + a + b + 0,3 = 1 ⟶ a + b = 0,5


i=1
4

∑ xi pi = a + 2b + 0,9 = 1,8 ⟶ a + 2b = 0,9


i=1

a + b = 0,5 b = 0,4
Resolviendo el sistema: { ⇒
a + 2b = 0,9 a = 0,1

141
Lic. Isidro W. Nina Paco

EJERCICIO 14.
Calcular la media, varianza y coeficiente de variación de la variable aleatoria que tiene como
función de distribución:
0 𝑥<2
0,2 2≤𝑥≤4
F(x) = 0,55 4≤𝑥<6
0,85 6≤𝑥<8
{ 1 𝑥≥8

Solución.
La ley de probabilidad o función de cuantía:

X  xi 2 4 6 8
P(X  xi ) 0,2 0,35 0,30 0,15
Adviértase que la función de distribución F(x) es una función acumulativa, por tanto:
P(X  2)  F(2)  F(0)  0, 2 P(X  4)  F(4)  F(2)  0,55  0, 2  0,35

P(X  6)  F(6)  F(4)  0,85  0,55  0,30 P(X  8)  F(8)  F(6)  1 0,85  0,15

Cálculo de la esperanza matemática y varianza

Media:
4

∝1 = μx = E(X) = ∑ xi ∗ P(X = xi ) = 4,8


𝑖=1
4

∝2 = E(X 2)
= ∑ xi2 ∗ P(X = xi ) = 26,8
𝑖=1

Varianza:
𝜎𝑥2 = Var(X) =∝2 −∝12 = 26,8 − 4,82 = 3,76
Desviación Típica:

142
Lic. Isidro W. Nina Paco

𝜎𝑥 = √3,76 = 1,94

Coeficiente variación:
σx 1,94
CV = = = 0,40
μx 4,8
EJERCICIO 15.
En un cine de verano hay instaladas 800 sillas, sabiendo que el número de asistentes es una
variable aleatoria de media 600 y desviación típica 100.
¿Qué probabilidad existe de que el número de personas que vaya al cine un día cualquiera sea
superior al número de sillas instaladas?
Solución.
Sea la variable aleatoria X = "número de sillas del cine", donde   600 ,   100

EJERCICIO 16.
Se desea conocer el número de automóviles que se deben poner a la venta durante un periodo
determinado para que se satisfaga una demanda media de 300 unidades con una desviación
típica de 100 unidades, con una probabilidad no inferior al 75%.
Solución.
Sea la variable aleatoria X = "número de automóviles a la venta", donde   300 ,   100
Según Chebyshev:

143
Lic. Isidro W. Nina Paco

EJERCICIO 17.
La variable X ="número de centímetros a que un dardo queda del centro de la diana" al ser
tirado por una persona tiene como función de densidad:
k 0 < x < 10
f(x) = {
0 en otros casos
Se pide:
a) Hallar k para que f(x) sea función de densidad. Representarla
b) Hallar la función de distribución. Representarla
c) Media, varianza y desviación típica
d) P(X  1)
e) Probabilidad de acertar en la diana

Solución.

a) Para que f(x) sea función de densidad debe verificar:


∞ 0 10 ∞ 10

1 = ∫ f(x)dx = ∫ f(x)dx + ∫ f(x)dx + ∫ f(x)dx = ∫ f(x)dx


−∞ −∞ 0 10 0

L
10 10
1
1 = ∫ kdx = k ∫ dx = 10[x]10
0 = 10k → k =
10
0 0

1
0 < x < 10
En consecuencia, f(x) = {10
0 en otros casos

x
b) La función de distribución se define: F(x) = ∫−∞ f(t)dt
x
x<0 F(x) = ∫ f(t)dt = 0
−∞
x 0 x x
1 𝑥
x ≤ x ≤ 10 F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt = ∫ dt =
−∞ −∞ 0 0 10 10

144
Lic. Isidro W. Nina Paco

x 0 10 x 10
1
x > 10 F(x) = ∫ f(t)dt = ∫ f(t)dt + ∫ f(t)dt + ∫ f(t)dt = ∫ dt = 1
−∞ −∞ 0 10 0 10

En consecuencia,

0 𝑥<0
𝑥
F(x) = {10 0 ≤ 𝑥 ≤ 10
1 𝑥 > 10

c) Media
∞ 10 10 10
1 1 1 x2
∝1 = μx = E(X) = ∫ xf(x)dx = ∫ x ∗ dx = ∫ xdx = [ ] = 5𝑐𝑚
10 10 10 2 0
−∞ 0 0

Varianza: 𝜎𝑥2 =∝2 −∝12


∞ 10 10 10
1 1 1 x3 1 1000
∝2 = E(X2 ) = ∫ x 2 f(x)dx = ∫ x 2 ∗ dx = ∫ x 2 dx = [ ] = [ − 0]
10 10 10 3 0 10 3
−∞ 0 0
100
=
3

100 25
σ2x =∝2 −∝12 = − 52 = 𝑐𝑚
3 3
Desviación Típica:
25
σx = √ = 2,9cm
3

d) P(X  1) = F(1) = 1/10 o también,


1
1 1 1 1 1
𝑃(𝑋 ≤ 1) = ∫ 𝑑𝑥 = ∫ 𝑑𝑥 = [𝑥 ]10 =
0 10 10 0 10 10
e) Probabilidad de acertar en la diana: P(X=0)=0 por ser una variable continua.
0 0
1 1 0
𝑃 (𝑋 = 0) = ∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑑𝑥 = ∫ 𝑑𝑥 = 0
0 0 10 10 0

EJERCICIO 18.
Gran número de fenómenos aeronáuticos tienen asociada una variable aleatoria con ley de
probabilidad:
−kx 0 < x < ∞ k>0
f(x) = {k e
0 en otros casos

145
Lic. Isidro W. Nina Paco

Se pide:
a) ¿Puede tomar k cualquier valor?
b) Para k = 0,1 representar la función de densidad, la función de distribución y su
gráfica
c) Siendo k = 0,1 hallar P(X > 10)

d) Para k = 0,1 calcular P(50 < X  100)


Solución.
d) Para que f(x) sea función de densidad debe verificar:
∞ 0 ∞ ∞ ∞

1 = ∫ f(x)dx = ∫ f(x)dx + ∫ f(x)dx = ∫ k e−kx dx = − ∫ −k e−kx dx = −[e−kx ]0
−∞ −∞ 0 0 0
1 ∞
= − [ kx ] = 1
e 0
La función de densidad no depende del valor del parámetro k, pudiendo tomar éste cualquier
valor positivo.
e) La función de densidad para k = 0,1 será
−0,1x x>0
f(x) = {0,1 e
0 en otros casos

x
La función de distribución se define: F(x) = ∫−∞ f(t)dt
x
x<0 F(x) = ∫ f(t)dt = 0
−∞
0 x x x
−0,1t
x > 10 F(x) = ∫ f(t)dt + ∫ f(t)dt + ∫ 0,1 e dt = − ∫ −0,1 e−0,1t dt
−∞ 0 0 0
𝑥
1 1
= −[e−0,1t ]0𝑥 = − [ ] = −( − 1) = 1 − e−0,1x
e0,1t 0 e0,1x

0 x≤0
f(x) = { −0,1x
1−e x>0

f)

146
Lic. Isidro W. Nina Paco

1
P(X > 10) = 1 − P(X ≤ 10) = 1 − F(10) = 1 − (1 − e−0,1∗10 ) = e−1 =
e
g)
P(50 < X ≤ 100) = F(100) − F(50) = (1 − e−0,1∗100 ) − (1 − e−0,1∗50 ) = −𝑒 −10 + 𝑒 −5
1 1
= 5 − 10
𝑒 𝑒

EJERCICIO 19.
Una variable aleatoria continua X tiene por función de distribución:
0 x<0
x2
2 0≤x≤1
f(x) =
x2
2x − − 1 1<x≤2
2
{ 1 x>2
Se pide:
a) Hallar la función de distribución y representarla
b) Media, varianza, desviación típica y coeficiente de variación.
1 3
c) P (2 < X ≤ 2)

Solución.
a) La función de densidad es la derivada de la función de distribución en los puntos donde
exista la derivada, entonces:
0 x<0
dF(x) 0≤x≤1
f ( x) = ={ x
dx 2−x 1<x≤2
0 x>2

x 0≤x≤1
f(x) = {2 − x 1<x≤2
0 otros valores

b) Media

147
Lic. Isidro W. Nina Paco

∞ 1 2
∝1 = μx = E(X) = ∫ xf(x)dx = ∫ x ∗ x ∗ dx + ∫ x(2 − x) dx
−∞ 0 1
1 2 3 1 2
x x3
= ∫ 2
x dx + ∫ (2x − x ) dx = [ ] + [x 2 − ]
2
0 1 3 0 3 1
1 8 1
= + (4 − ) − (1 − ) = 1
3 3 3
Varianza: σ2x =∝2 −∝12
∞ 1
2
2)
∝2 = E(X = ∫ x f(x)dx = ∫ x 2 ∗ x ∗ dx + ∫ x 2 (2 − x) dx
2
1
−∞ 0
1 2 1 2
3
x4
2
2x 3 x 4
3
= ∫ x dx + ∫ (2x − x ) dx = [ ] + [ − ]
0 1 4 0 3 4 1
1 16 16 2 1 14 7
= +( − )−( − )= =
4 3 4 3 4 12 6

7 1
σ2x =∝2 −∝12 = − 12 =
6 6
Desviación Típica:

1
σx = √ = 0,41
6

Coeficiente variación:
σx 0,41
CV𝑥 = = = 0,41
μx 1
c)
2 2
1 3 3 1 3 (3⁄2) (1⁄2) 9 1
P ( < X ≤ ) = F ( ) − F ( ) = (2 − − 1) − ( )= 3− −1−
2 2 2 2 2 2 2 8 8
3
= = 0,75
4

EJERCICIO 20.
La función de densidad de una variable aleatoria es:
2 0<x<2 1
f(x) = {ax + b sabiendo que P [ < x < 1] = 0,1666
0 en el resto 2
Determinar a y b

148
Lic. Isidro W. Nina Paco

Solución.
Hay que calcular dos parámetros (a y b), por lo que se necesitan dos ecuaciones:

EJERCICIO 21.
Dada la función f(x) = e−2x
a) Comprobar si puede ser función de densidad de una variable aleatoria X cuando su campo
de variación es el intervalo x  0
b) En caso de que no lo pueda ser, qué modificaciones habría que introducir para que lo fuera.
Solución.
a) Para que sea función de densidad, debe cumplir dos condiciones en el campo de variación
de la variable aleatoria:
• f(x) no puede ser negativa
• La integral de f(x) en el campo de variación es 1
f(x) = e−2x ≥ 0 → L e−2x > L 0 ⟹ −2x > −∞ ⟹ x < ∞ es positiva

−2x
1 −2x ∞ 1 1
∫ e dx = [− e ] = [0 + ] = ≠ 1.
0 2 0 2 2

No se cumple, luego la función dada no es de densidad en el intervalo.


b) Para que sea función de densidad, se define f(x) = k e−2x

−2x

−2x
1 −2x ∞ k
∫ ke dx = k ∫ e dx = k [− e ] = = 1 → k = 2.
0 0 2 0 2

En consecuencia, f(x) = 2 e−2x


149
Lic. Isidro W. Nina Paco

EJERCICIO 22.
Sea X una variable aleatoria continua con función de densidad tal que
8
( )
f x = {7x 2 1<x<8
0 otro caso
a) Calcular el primer y tercer cuartil, el decil 7 y el percentil 85
b) Calcular la mediana y moda
Solución.
a) La función de distribución:
x
8 x
8 1 x 8(x − 1)
F(x) = P[X ≤ x] = ∫ f(t)dt = ∫ 2 dt = − [ ] = 1≤x≤8
−∞ 1 7t 7 t 1 7x
Sustituyendo, queda:
1 8(Q1 − 1) 32
F(Q1 ) = = → 7Q1 = 32(Q1 − 1) → Q1 = = 1,28
4 7Q1 25
3 8(Q 3 − 1) 32
F(Q3 ) = = → 21Q 3 = 32(Q 3 − 1) → Q 3 = = 2,91
4 7Q 3 11
7 8(D7 − 1) 80
F(D7 ) = = → 49D7 = 80(D7 − 1) → D7 = = 2,58
10 7D7 31
85 8(P85 − 1) 800
F(P85 ) = = → 595P85 = 800(P85 − 1) → P85 = = 3,90
100 7P85 205
b) Me = Q 2 = D5 = P50
1 8(Me − 1) 16
F(Me ) = = → 7Me = 16(Me − 1) → Me = = 1,78
2 7Me 9
La Moda M0 se obtiene calculando el máximo de la función de densidad:
8 16
f(x) = 2
→ f ′ ( x) = 3 < 0 La función es decreciente
7x 7x
f(8) ≤ f(x) ≤ f(1), con lo que M0 = 1

150
Lic. Isidro W. Nina Paco

EJERCICIO 23.
Sea X una variable aleatoria continua, cuya función de densidad es
2
f(x) = { 3x 0<x<1
0 en otro caso
Sea Y = 1 − X2 una transformación de v.a. X
a) Calcular la función de densidad de la v.a. Y
b) Calcular la función de distribución de la v.a. Y
Solución.
a) La transformación asociada a la v.a. Y es derivable y estrictamente monótona cuando X
toma valores en el intervalo (0, 1). En consecuencia, se puede aplicar la transformación,
quedando la función de densidad:
dx −1
=
Y = 1 − X2 → x = √1 − y → { dy 2√1 − y
g −1 (y) = √1 − y

La función de densidad de la variable continua Y se obtiene:


dx 2 −1 3
fY (y) = fx [g −1 (y)] ∙ | | = 3(√1 − y) | | = √1 − y
dy 2√1 − y 2
3
La función de densidad de la v.a. Y: fY (y) = { 2
√1 − y 0<y<1
0 en otro caso
b) Función de distribución:
y
y ≤ 0 → FY (y) = ∫ f(t)dt = 0
−∞

151
Lic. Isidro W. Nina Paco

EJERCICIO 24.
Sea X una variable aleatoria continua con función de densidad tal que
e−𝑥 𝑥 > 0
f(x) = {
0 en otro caso
a) Función generatriz de los momentos (f.g.m.)
b) Esperanza y varianza a partir de la f.g.m.
c) Función característica
Solución.
a)
∞ ∞
1 ∞ 1
M(t) = E[etx] = ∫ etx f(x)dx = ∫ ex(t−1)dx = [ex(t−1) ]0 = si t < 1
−∞ 0 t−1 1−t
b)
dM(t) d 1 1
∝1 = E(X) = M (1) (0) = | = [ ]| = | =1
dt t=0 dt 1 − t t=0 (1 − t)2 t=0

2) (2) ( d2 M(t) d d 1 d 1
∝2 = E(X =M 0) = | = [ ( )]| = ( )|
dt2 t=0 dt dt 1 − t t=0 dt (1 − t)2 𝑡=0
2
= | =2
(1 − t)3 t=0

𝑉𝑎𝑟(𝑋) =∝2 −∝12 = 2 − 1 = 1


c) La función característica se puede calcular utilizando la relación entre función
característica y los momentos:

152
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.
Suponga que de un grupo de alumnos, se seleccionan 3 con el fin de observar, si trabajan (T)
o no trabajan (𝑇̅)
a) Enumérense los elementos del espacio muestral, con los tres alumnos seleccionados.
b) Enumérense los elementos en el suceso de que el número de alumnos que trabajan sea
cero.
c) ¿Cómo podría definir usted el suceso {𝑇𝑇𝑇̅, 𝑇𝑇̅𝑇, 𝑇̅𝑇𝑇}?
EJERCICIO 2.
¿Cuántas ordenaciones diferentes de diez letras se pueden hacer utilizando la palabra
CONVERCIÓN?
Solución:

P10 r: 2, 2,2  453.600


EJERCICIO 3.
Considere una baraja de 52 cartas, al extraer una carta, ¿Cuál es la probabilidad de obtener un
corazón o espada?
Solución:

P A o B   0,5

EJERCICIO 4.
Supongamos que se tienen dos recipientes 𝑅1 , 𝑅2 , en la primera se tienen 20 bolitas, de las
cuales 5 son azules y 15 verdes; y en la segunda son 14, distribuidas así: 4 azules y 10 verdes.
Si se elige al azar una urna y de ella se extrae una bolita, ¿Cuál es la probabilidad de que sea
azul?
Solución:

P A   0,268

EJERCICIO 5.
Un fabricante produce 1.500 unidades por semana. Cada unidad pasa por tres puestos de
inspección, antes de ser despachada a sus distribuidores. Por lo general, en el primer puesto se
rechaza el 8%; de las que fueron aceptadas, el 5% se rechazan en la segunda inspección y
finalmente en la tercera inspección el 3% aproximadamente, se rechazan.
a) ¿Cuál es la probabilidad que una unidad seleccionada al azar pase las tres inspecciones?
b) ¿Cuántas unidades pasaron a la semana?

153
Lic. Isidro W. Nina Paco

Solución:
a) La probabilidad de que una unidad pase por las tres inspecciones es del 84,78 %
b) 1.271,7 unidades aprobadas a la semana.

EJERCICIO 6.
En una clase de Estadística, todos los alumnos juegan algún deporte, el 60% juegan al futbol o
baloncesto y el 10% práctica ambos deportes. Si además hay un 60% que no juega al futbol. Si se
elige un alumno al azar, calcula las siguientes probabilidades:

a) juegue sólo al futbol.

b) Juegue sólo al baloncesto.

c) Practique uno solo de los deportes.

d) No juegue ni al futbol ni al baloncesto.

Solución.

f) 0.4 b) 0.2 c) 0.5 d) 0.4

EJERCICIO 7.
La variable aleatoria: X ="número de hijos por familia de una ciudad" tiene la siguiente
distribución de probabilidad:

X 0 1 2 3 4 5 6
P(X  xi ) 0,47 0,3 0,1 0,06 0,04 0,02 0,01
Se pide:
a) Media o esperanza matemática. Significado
b) Varianza y desviación típica
c) Si la Alcaldia de la ciudad paga 2000 dolares por hijo e Y = 2000*X , ¿cuál es la distribución
de probabilidad?
d) Media, varianza y desviación típica de Y
Solución.

a)
Si se toma al azar una familia de la ciudad, el número de hijos que se espera que tenga por
término medio es uno.
b) Varianza = 1,74; Desviación típica=1,32

154
Lic. Isidro W. Nina Paco

c) . Y  yj P(Y  yj )  pj
y1  0 0,47
y2  2.000 0,3
y3  4.000 0,1
x4  6.000 0,06
y5  8.000 0,04
y6  10.000 0,02
y7  12.000 0,01
1

d) Media= 2000 ; Varianza=6.960.000 ; Desviación típica=2638,18

EJERCICIO 8.
Al lanzar cuatro monedas se considera el número de caras obtenidas. De la variable aleatoria X
así obtenida, se pide:
a) Ley de probabilidad. Representación gráfica
b) Función de distribución. Representación gráfica
c) Esperanza matemática y varianza
d) Mediana y moda de la distribución
e) Probabilidad de obtener más de una y menos de tres caras
Solución.
a)

X  xi 0 1 2 3 4
P(X  xi ) 1/16 4/16 6/16 4/16 1/16
b)

X  xi 0 1 2 3 4
P(X  xi ) 1 /16 4 /16 6 /16 4/16 1/16
F(x)  P(X  x) 1 /16 5 /16 11 /16 15/16 1

c) ∝1 = μx = E(X) = 2 σ2 = Var(x) = 1
d) 𝑀0 = 2 𝑀𝑒 = 2
e) P(1<X<3) = 0,375 o bien P(1<X<3) = 6/16

155
Lic. Isidro W. Nina Paco

EJERCICIO 9.
La variable discreta X tiene como distribución de probabilidad

X 1 2 3 4
P(X  xi ) 0,30 0,25 0,10 0,35
Se realiza un cambio de origen hacia la izquierda de dos unidades y un cambio de escala de 3
unidades.
Se pide:
a) Media y varianza de la X
b) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen
c) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
escala
d) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen y escala.
Solución.
a) μx = E(X) = 2,5 σ 2𝑥 = 1,55 σx = 1,245 CVx = 0,498
b) μy = E(Y) = 4,5 σ 2𝑦 = 1,55 σy = 1,245 CVy = 0,28 ≠ CVx
2,5 1,55 1
c) μy = E(Y) = σ 2𝑦 = σy = 3 √1,55 CVy = 0,498
3 9
1,55 1
d) μy = E(Y) = 1,5 σ 2𝑦 = σy = 3 √1,55 CVy = 0,28 ≠ CVx
9

EJERCICIO 10.
La variable discreta X tiene como distribución de probabilidad
1
P(X = k) = siendo k = 2,3, … , 11
10
Se pide:
a) Función de distribución
b) P(X  7)
c) P(X  5)
d) P(3  X  7)
Solución.
x−1
a) F(x) = P(X ≤ x) = siendo x = 2,3, . . . , 11
10
b) P(X > 7) = 0,4
c) P(X > 5) = 0,4

156
Lic. Isidro W. Nina Paco

d) P(3 ≤ X < 7) = 0,4


EJERCICIO 11.
La demanda media de un producto es de 100 unidades con una desviación típica de 40 unidades.
Calcular la cantidad del producto que se debe tener a la venta para satisfacer la demanda de
forma que puedan ser atendidos al menos el 80% de los clientes.
Solución.
k = 89,44 ≅ 90 unidades.
EJERCICIO 12.
Se ha verificado que la variable X ="peso en kilos de los niños al nacer" es una variable aleatoria
continua con función de densidad
𝑘𝑥 2≤𝑥≤4
f(x) = {
0 en otro caso
Se pide:
a) Hallar k para que f(x) sea función de densidad. Representarla
b) Hallar la función de distribución. Representarla
c) Media, varianza y desviación típica
d) Probabilidad de que un niño elegido al azar pese más de 3 kilos
e) Probabilidad de que pese entre 2 y 3,5 kilos
f) Qué debe pesar un niño para tener un peso igual o inferior al 90% de los niños
Solución.
1
a) 𝑘 = 6

0 𝑥<2
𝑥 2 −4
b) F(x) = { 2≤𝑥≤4
12
1 𝑥>4

c) μx = E(X) = 3,1 kilos σ 2𝑥 = 0,39 kilos 2 σx = 0,62 kilos


d) 𝑃 (𝑋 > 3) = 0,58
e) 𝑃 (2 ≤ 𝑋 ≤ 3,5) = 0,6875
f) F(k) = P(X ≤ k) = 0,9 k = 3,85 kilos

157
Lic. Isidro W. Nina Paco

EJERCICIO 13.
Una variable aleatoria continua X tiene por función de densidad
1−𝑥 0≤𝑥<1
f ( x) = { 𝑥 − 1 1≤𝑥≤2
0 otros casos
Se pide:
a) Representa la función de densidad.
b) Hallar la función de distribución y su gráfica
1
c) P(0 ≤ x ≤ 1) P(−2 ≤ X ≤ 2) P (2 ≤ X < ∞)

Solución.
a)

b)
0 𝑥<0
𝑥2
𝑥− 0≤𝑥<1
( )
F x = 2
2
𝑥
−𝑥+1 1≤𝑥≤2
2
{ 1 𝑥>2

c)
1 1 5
P(0 ≤ x ≤ 1) = ; P(−2 ≤ X ≤ 2) = 1 ; P ( ≤ X < ∞) =
2 2 8
EJERCICIO 14.
Una variable aleatoria continua X tiene por función de distribución:
0 𝑥<1
f(x) = {𝑥 − 1 1≤𝑥<2
1 x≥2
158
Lic. Isidro W. Nina Paco

a) Calcular la función de densidad o función de cuantía.


b) Calcular la media, mediana y coeficiente de variación.
Solución.
1 1≤𝑥<2
a) f(x) = {
0 en otro caso
b) μx = E(X) = 1,5 𝑀𝑒 = 1,5 CVx = 0,05
EJERCICIO 15.
La función de distribución asociada a la producción de una máquina, en miles de unidades, es
del tipo:
0 𝑥<0
F(X) = {𝑥 (2 − 𝑥 ) 0≤x≤k
1 x>k
a) Determinar k para que sea función de distribución
b) Hallar la función de densidad
c) Calcular la media, mediana. moda y varianza de la producción.
d) Hallar P(X < 0,5) y P(X > 0,25)
Solución.
a) k = 1
2 − 2𝑥 0≤𝑥≤1
b) f(x) = {
0 en otro caso
1 √2 1
c) μx = E(X) = M0 = 0 Me = 1 ± σ2𝑥 =
3 2 18
d) P(X < 0,5) = 0,75 ; P(X > 0,25) = 0,5625
EJERCICIO 16.
Dada la variable aleatoria continua X con función de densidad:
𝑘(𝑥 + 2) 0≤𝑥≤4
f(x) = {
0 en el resto
Hallar:
a) El valor de k para que sea realmente una función de densidad
b) La función de distribución
c) La varianza
d) P(2 ≤ 𝑥 ≤ 3)

159
Lic. Isidro W. Nina Paco

Solución.
1
a) 𝑘 = 16
0 𝑥<0
𝑥 2 +4𝑥
b) F(X) = { 0≤x<4
32
1 x≥4
11
c) σ2𝑥 = 9
9
d) P(2 ≤ 𝑥 ≤ 3) = 32

EJERCICIO 17.
La demanda diaria de un determinado artículo es una variable aleatoria con función de
densidad:
1
0<𝑥≤4
8
f(x) = 12 − 𝑥
4 < x ≤ 12
64
{ 0 otro caso
Los beneficios diarios dependen de la demanda según la siguiente función:
−5 𝑠𝑖 𝑥<2
B={ 5 𝑠í 2<𝑥≤4
10 𝑠í 4<𝑥≤8
15 𝑠í 8 < 𝑥 ≤ 12
Calcular:
a) Probabilidad de que en un día cualquiera la demanda sea superior a 10
b) Probabilidad de que la demanda sea inferior a 3
c) La esperanza y la varianza de la demanda
d) Función de distribución de la demanda
e) Función de cuantía y función de distribución de la variable aleatoria beneficios diarios.
f) Esperanza y varianza de la variable beneficios
Solución.
a) P(X > 10) = 0,03125
b) P(X < 3) = 0,375
c) μ𝑥 = E(X) = 4,33 ; σ2𝑥 = 7.89

160
Lic. Isidro W. Nina Paco

d)
e)

f) μ𝐵 = E(B) = 5,625 ; σ2𝐵 = 46,48

161
Lic. Isidro W. Nina Paco

162
Lic. Isidro W. Nina Paco

TEMA 8:
DISTRIBUCIONES DE
PROBABILIDADES DISCRETAS Y
CONTINUAS

Un estadístico podría meter su cabeza en un


horno y sus pies en hielo y decir que en
promedio se encuentra bien.
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 8: DISTRIBUCIONES DE PROBABILIDADES DISCRETAS Y


CONTINUAS
FORMULARIO 8
DISTRIBUCIÓN DE BERNOULLI DISTRIBUCIÓN GEOMÉTRICA

𝑝, 𝑥=1 𝑷(𝑿 = 𝒙) = 𝒇(𝒙) = 𝒑(1 − 𝒑)𝒙−1 , 𝒙 = 1, 2, 3, . ..


𝑓 (𝑥 ) = {
1 − 𝑝, 𝑥 = 0 MEDIA Y VARIANZA DE LA DISTRIBUCIÓN
GEOMÉTRICA
DISTRIBUCIÓN BINOMIAL 1
𝑴𝒆𝒅𝒊𝒂: 𝝁 = 𝑬[𝑿] =
𝒏 𝒑
𝒇(𝒙) = ( ) 𝒑𝒙 (1 − 𝒑)𝒏−𝒙 , 𝒙 = 0,1,2, … , 𝒏
𝒙 1 1
𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝝈2 = 𝑽[𝑿] = ( − 1)
PARAMETROS Y VARIABLES 𝒑 𝒑
DISTRIBUCIÓN HIPERGEOMÉTRICA
𝑛
𝑓 (𝑥; 𝑛, 𝑝) = ( ) 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 , 𝑥 = 0, 1, 2, … , 𝑛 (𝐾𝑥)(𝑁−𝐾 )
𝑥 𝑛−𝑥
𝑓 (𝑥 ) = , 𝑥 = 0, 1, 2, … , 𝑛
(𝑁
𝑛
)
DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL
ACUMULADA MEDIA Y VARIANZA DE LA DISTRIBUCIÓN
𝒏 HIPERGOMÉTRICA
( ) 𝒑𝒕 (1 − 𝒑)𝒏−𝒕 , 𝐾
𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙) = ∑ 𝒕 𝑀𝑒𝑑𝑖𝑎: 𝜇 = 𝐸 [𝑋] = 𝑛
𝒕≤𝒙 𝑁
PARAMETROS Y VARIABLES 𝑛𝐾 𝐾 𝑁−𝑛
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝜎 2 = 𝑉 [𝑋] = (1 − )( )
𝑁 𝑁 𝑁−1
𝜇 = 𝑬(𝑿) = 𝒏𝒑
DISTRIBUCIÓN DE POISSON
𝜎 2 = 𝑽(𝑿) = 𝒏𝒑(𝟏 − 𝒑)
𝑒 −𝜆 𝜆𝑥
FUNCIÓN GENERADORA DE MOMENTOS 𝑓 (𝑥 ) = , 𝑥 = 0,1,2, … 𝑒 = 2.71828 …
𝑥!
DE LA DISTRIBUCIÓN BINOMIAL
FUNCIÓN GENERADORA DE MOMENTOS DE LA
𝒎(𝒕) = (𝒒 + 𝒆𝒕𝒑)𝒏 DISTRIBUCIÓN DE POISSON
𝑡𝜆
𝑚(𝑡) = 𝑒 −𝜆 𝑒 𝑒
𝑑 𝑑 𝑡
𝜇 = 𝜇′1 = 𝑚(𝑡)|𝑡=0 = 𝑒 −𝜆 𝑒 𝑒 𝜆 |𝑡=0
𝑑𝑡 𝑑𝑡
−𝜆 𝑒 𝑡 𝜆 𝑡
= 𝑒 𝑒 𝑒 𝜆|𝑡=0 = 𝜆

163
Lic. Isidro W. Nina Paco

FUNCIÓN DE DENSIDAD DE PROBABILIDAD MOMENTOS Y FUNCIÓN GENERADORA DE


𝑏 MOMENTOS PARA VARIABLES ALEATORIAS
CONTÍNUAS
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓 (𝑥 )𝑑𝑥, 𝑠𝑖𝑒𝑛𝑑𝑜 𝑎, 𝑏 ∈ ℜ
+∞
𝑎
𝜇’𝑟 = 𝑬(𝑿𝒓 ) = ∫ 𝒙𝒓 𝒇(𝒙)𝒅𝒙
lim 𝑃 (𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃 (𝑏 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑋 = 𝑏)
−∞
𝑏

= ∫ 𝑓 (𝑥 )𝑑𝑥 = 0 MOMENTOS DE X ALREDEDOR DE LA MEDIA


+∞
𝑏
𝜇𝑟 = 𝑬[(𝑿 − 𝜇 )𝒓 ] = ∫ (𝑿 − 𝝁)𝒓 𝒇(𝒙)𝒅𝒙
FUNCIÓN DE DISTRIBUCIÓN −∞
𝑥 FUNCION GENERADORA DE MOMENTOS
𝐹 (𝑥 ) = 𝑃(𝑋 ≤ 𝑥 ) = ∫ 𝑓 (𝑡)𝑑𝑡, +∞

−∞ 𝑴(𝒕) = 𝑬(𝒆 ) = ∫ 𝒆𝒕𝑿 𝒇(𝒙)𝒅𝒙


𝒕𝑿
𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < +∞ −∞
𝑑 MOMENTOS ALREDEDOR DEL ORIGEN
𝐹 ( 𝑥 ) = 𝑓 (𝑥 ) 𝑎 < 𝑏 ⇒ 𝐹 (𝑎 ) < 𝐹 (𝑏 )
𝑑𝑥
𝑑𝑡
𝜇’𝑟 = 𝑀(𝑡)|𝑡=0
𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = 𝐹 (𝑏) − 𝐹(𝑎) 𝑑𝑡 𝑟
TEOREMA DE CHEBYSHEV
MEDIA Y VARIANZA DE VARIABLES
ALEATORIAS CONTINUAS 𝑷(𝜇 − 𝒌𝜎 < 𝒙 < 𝜇 − 𝒌𝜎) ≥ 1– 1⁄𝒌2 , 𝒌 ∈ ℜ +
+∞

𝜇 = 𝑬 (𝑿 ) = ∫ 𝒙𝒇(𝒙)𝒅𝒙 DISTRIBUCIÓN NORMAL


−∞ 1 1 𝑥−𝜇 2
𝑒 2 𝜎 ) , − ∞ < 𝑥 < +∞
− (
+∞
( )
𝑓 𝑥 =
𝜎√2𝜋
2 2 2
𝜎 = 𝑽(𝑿) = 𝑬[(𝑿 − 𝜇 ) ] = ∫ (𝒙 − 𝝁) 𝒇(𝒙)𝒅𝒙
−∞ 𝑏

VALOR ESPERADO DE EXPRESIONES CON 𝑃 (𝑎 ≤ 𝑥 ≤ 𝑏) = ∫ 𝑓(𝑥 )𝑑𝑥, 𝑠𝑖𝑒𝑛𝑑𝑜 𝑎, 𝑏 ∈ ℜ


UNA VARIABLE ALEATORIA CONTINUA 𝑎
𝑥
+∞
𝐹 (𝑋) = 𝑃 (𝑋 ≤ 𝑥 ) = ∫ 𝑓 (𝑡)𝑑𝑡, 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < +∞
( ) [ ( )] ( ) ( )
𝜇𝑮 𝑿 = 𝑬 𝑮 𝑿 = ∫ 𝑮 𝒙 𝒇 𝒙 𝒅𝒙, −∞
−∞
𝑷(𝒂 ≤ 𝑿 ≤ 𝒃) = 𝑭(𝒃) – 𝑭(𝒂)
𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑜 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑜 𝑑𝑒 G(x)

164
Lic. Isidro W. Nina Paco

DISTRIBUCIÓN NORMAL ESTÁNDAR


1 1 2
𝑓 (𝑍 ) = 𝑒 −2𝑍 , − ∞ < 𝑍 < +∞
√2𝜋
𝑧 𝑧
1 1 2
𝐹 (𝑧) = 𝑃 (𝑍 ≤ 𝑧) = ∫ 𝑓 (𝑡)𝑑𝑡 = ∫ 𝑒 −2𝑡 𝑑𝑡,
√2𝜋
−∞ −∞
− ∞ < 𝑍 < +∞

𝑭(– 𝒛) = 𝑷(𝒁 ≤– 𝒛) = 𝑷(𝒁 ≥ 𝒛) = 1– 𝑷(𝒁 ≤ 𝒛) = 1– 𝑭(𝒛)


⇒ 𝑭(– 𝒛) = 1– 𝑭(𝒛)

ESTANDARIZACIÓN DE LA DISTRIBUCIÓN NORMAL

𝑋−𝜇 1 1
𝐸 (𝑍 ) = 𝐸 ( ) = [𝐸 (𝑋) − 𝐸 (𝜇 )] = (𝜇 − 𝜇 ) = 0
𝜎 𝜎 𝜎
𝑋−𝜇 1 1
𝑉 (𝑍 ) = 𝑉 ( ) = 𝑤 [𝑉(𝑋) − 𝑉 (𝜇 )] = 2 (𝜎 2 − 0) = 1
𝜎 𝜎 𝜎
APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL CON LA
DISTRIBUCIÓN NORMAL ESTANDAR
𝑋−𝜇 𝑋 − 𝑛𝑝
𝑍= = , 𝑐𝑢𝑎𝑛𝑑𝑜 𝑛 ⟶ ∞
𝜎 √𝑛𝑝(1 − 𝑝)

165
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.
Si un delantero que al patear un balón de futbol frente al arquero tiene un promedio de 0.60 de
hacer gol, llega a patear 6 veces en un juego, cuál es la probabilidad de que obtenga:
a) Exactamente dos goles b) Menos de dos goles.
Solución:
a) p  0,60 q  0,40 n 6 X 2

P x 2   C 26 0,6 0,4  0,1382  13,82%


2 4
P x2   13,82%

b) P x1  C06 0,6 0,4  C16 0,6  0,4


0 6 1 5

P x1  0,0041  0,037  0,0411 4,11% (Menos de 2 goles)


P x1  4,11%

EJERCICIO 2.
Por regla, el 8% de facturas manuales tienen algún tipo de error en el llenado. ¿Cuál es la
probabilidad de que en un talonario de 50 facturas haya?:
a) Exactamente 10 con error b) Menos de 3 con error
c) Por lo menos 2 con error.
Solución:
n  50 p  0,08 q  0,92

a) P x 10   C1050 0,08 0,9240  0,003927  0,3927%


10
P x 10   0,3927 %

b) P x2   C050 0,08 0,92  C150 0,08 0,92  C 250 0,08 0,92
0 50 1 49 2 48

 0,0154 0,0672  0,1432  0,2258  22,58% P x2   22,58%

c) P x2   1  [C050 0,08 0,92  C150 0,08 0,92 ]


0 50 1 49

 1  0,0154  0,0672   0,9174  91,74%

EJERCICIO 3.
Los dos quintos de los votantes inscritos en ciertos barrios de Sucre apoyan al partido A.
¿Cuál es la probabilidad de que en una muestra de diez votantes de ese puesto de votación:
a) Exactamente 7 apoyen al partido A?
b) Por lo menos tres apoyen al partido A?

166
Lic. Isidro W. Nina Paco

c) Por lo menos dos no apoyen al partido A?


Solución:
2
 0,40  40% Apoyan al grupo A 0,60  60% No apoyan al grupo A
5

a) Exactamente 7 apoyen al grupo A x7

P x 7     0,4 0,6
10
7
7 3
 0,0425  4,25%
P x  7   4,25%

b) Por lo menos 3 apoyen al partido A x  3,4,5,6,7

P x3  1  P x 0   P x 1  P x2  

1   0,4
10
0
0
0,610    0,4 0,6    0,4 0,6 
10
1
1 9 10
2
2 8

 1  0,00605  0,0403 0,121  1  0,16735 0,833  83,3%


P x  3  83,3%

c) Por lo menos dos no apoyen al grupo A

P x 2   1  P x 0   P x 1 
x  2,3,4,5,6,7,8,9 y10

1   0,6
10
0
0
0,410    0,6 0,4 
10
1
1 9

 1  0,000104  0,00157  1  0,00167  0,9983  99,83%


P x  2   99,83%

EJERCICIO 4.
Supongamos que el 12% de los estudiantes que se presentan a un examen de estadística, con
menos de tres ausencias, en el año, lo pierden. Si se seleccionan 10 estudiantes con menos de
3 ausencias, ¿Cuál es la probabilidad de que no lo pierda un número de alumnos no mayor o
igual a siete ni menor a cuatro?
Solución:
0,12 lo pierden 0,88  no lo pierden n  10

No mayor a 7 ni menor a 4 no lo pierdan X  4, 5, 6

167
Lic. Isidro W. Nina Paco

P4  x6   P x  4   P x 5   P x 6 

   0,88 0,12    0,88 0,12    0,88 0,12


10
4
4 6 10
5
5 5 10
6
6 4

 0,000376  0,00331  0,0202  0,0239  2,39%

P4 x6   2,39%

EJERCICIO 5.
Suponga que una empresa aérea, en promedio, uno de cada 100 vuelos se retrasa más de una
hora; si se programan 1.200 vuelos en un mes:
a) ¿Cuál es la probabilidad de que exactamente 5 vuelos se retrasen en una hora?
b) ¿Cuál es la probabilidad, que más de 4 vuelos se retrasen en una hora?
c) ¿Cuál es la probabilidad que menos de 3 vuelos se retrasen más de una hora?

Solución:
1
p  0,01   0,01 1.200  12 n  1.200
100

a) X 5

125 e 12 248832 0,000006144 1,5288


P x 5      0,0127  1,27%
5! 120 120
P x 5   1,27 %

b) X  5, 6, 7 .......... ....1.200

120 e 12 121 e 12 122 e 12 123 e 12 124 e 12 
P x5   1       
 0! 1! 2! 3! 4! 

1 0,000006144 12 0,000006144 20736 0,000006144 


P x 5   1     ...  
 1 1 24 

P x5  1  0,000006144 0,0000737  0,000442  0,001769 0,005308

P x5  1  0,007599  0,9924  99,24%


P x 5   99,24 %

120 e 12 121 e 12 122 e 12


c) P x3    
0! 1! 2!

168
Lic. Isidro W. Nina Paco

P x3  0,000006144 0,0000737  0,000442

P x3  0,000522  0,05% P x3  0,05%

EJERCICIO 6.
Un docente dispone en su archivo 20 preguntas sobre un tema específico de la materia; 8 de
ellas son de teoría. Si desea preparar un cuestionario de 10 preguntas:
a) ¿Cuál es la probabilidad de que 3 de las preguntas sean de teoría?
b) ¿Qué cinco no sean de teoría?
Solución:
a) N  20 A8 n  10 X 3

P x 3  
    0,24 
8
3
20 8
10 3

  P x3  15,00%
20
24,00%
10

b) N  20 A  12 n  10 X 5

P x 5  
    0,2400  24,00%
12 2012
105

 
5
20 P x 5   24,00 %
10

EJERCICIO 7.
Si la media y la desviación estándar de una distribución normal: 𝜇 = 35.7 y 𝜎 = 2.8 cm.
Obtener los valores de Z (redondear en dos decimales las respuestas):
a) x=38,7 cm. b) x=31,5 cm. c) x=53,9 cm. d) x=29,6 cm
Solución:
Fórmula aplicable en estos problemas. Determinar los valores de Z

X 
Z    35,7   2,8

38,7  35,7
a) Z   1,07
2,8

Z = 1,07

Z  1,07

169
Lic. Isidro W. Nina Paco

31,5  35,7
b) Z    1,50
2,8

Z = – 1,50

53,9  35,7
c) Z   6,50
2,8

Z = 6,50

29,6  35,7
d) Z    2,18
2,8

Z = – 2,18

EJERCICIO 8.
Tres estudiantes presentan varios exámenes. A obtiene un puntaje de 72, B uno de 85 y C de
17. Todos los estudiantes que presentaron el examen A, obtuvieron un promedio de 85, los
que presentaron B, de 90 y los de C promediaron 25. Las respectivas desviaciones estándar
fueron 7; 3 y 7. Disponga a los estudiantes en orden de capacidad, juzgada por estos
resultados.
Solución:
X 1  72 1  85 1  7

X 2  85  2  90 2  3

X 3  17 3  25 3  7

X 
Z

170
Lic. Isidro W. Nina Paco

72  85  13
Z1     1,85
7 7
85  90  5
Z2     1,66
3 3
17  25  8
Z3     1,14
7 7
Z 3  Z 2  Z1

EJERCICIO 9.
En una distribución normal que tiene una desviación estándar de 2, la probabilidad de que el
valor de una variable al azar sea mayor de 30 es de 0,05. a) Calcule la media de la
distribución; b) Obtenga el valor de la variable que es superado por el 95% de los valores.
Solución:

 2 P x  30  0,05

a)   ?
A 0,4500   Z  1,65

1,65 2   30  

3,30  30  

  30  3,3  26,7

  26,7 El valor más cercano a 0,4500 es 0,4505

b) A 0,4500   Z  1,65
1,65 2  X  26 ,7

 3,30  X  26,7

X  26,7  3,3  23,4

X  23,4

EJERCICIO 10.
La duración de las pilas Panasonic están distribuidas normalmente con una media de 80 horas
y una varianza de 100 horas. El fabricante garantiza que reemplazará cualquier pila que falle
antes de cumplirse la garantía.

171
Lic. Isidro W. Nina Paco

a) ¿Cuánto tiempo debe dar de garantía de modo que no más del 5% de las pilas fallen antes
de ese tiempo?
b) Si en una semana vende 500 pilas, ¿cuantas reemplazará?
Solución:

  80  2  100    10

a) P x  ?   0,05

Z  0,500  0,0500  0,4500

A 0,4500   Z   1,65

 1,65 10   X  80  X  80  16,50  63,5 horas

X  63,5

b) E  np  500 0,05   25 pilas de las 500 tendrá que reemplazar

EJERCICIO 11.
El gerente de producción de una fábrica de bombillas, estima que la vida útil del producto está
distribuida normalmente, con una media de 5.000 horas. Si, además, el gerente considera que
hay una probabilidad del 60% de que la bombilla dure más de 5.568 y menos de 4.432 horas.
a) ¿Cuál es la desviación típica?
b) Si en un día se producen 20.000 unidades, ¿Cuántas esperamos que tengan una duración
entre 4.500 y 5.500 horas?
Solución:

  5.000 P4.432 x 5.568  60 %

a)   ?
A 0,2000   Z  0,52 y  0,52

0,52   5.568  5.000

5.568
   1.092 ,31   1.092 ,31
0,52

172
Lic. Isidro W. Nina Paco

b) P4.500x  5.500  ?

4.500  5.000
Z    0,46 y 0,46
1.092 ,31

Z  0,46  A 0,1772 

0,1772  0,1772  0,3544  35,44%


P4.500 X 5.500   35,44%
E  np  20 .000 0,3544   7.088 unidades

EJERCICIO 12.
El control de inventarios en las bibliotecas universitarias es un problema bastante complicado.
Si se piden pocos ejemplares de un determinado libro, los costos aumentan, por lo que es
necesario hacer pedidos grandes. Si se piden demasiados ejemplares, se corre el riesgo de que
el libro no se requiera como texto en el futuro, lo que dificultará su venta. Suponga que el
promedio de alumnos matriculados en estadística, en la universidad durante un semestre, tiene
una distribución normal, con media de 150 alumnos por semestre y una desviación típica de 20
estudiantes. ¿Cuántos libros de texto se deben pedir, para que la probabilidad de que se terminen
las existencias no sea mayor de 0,10?
Solución:
  150   20

P x  ?  10 %

A 0,4000   Z  1,28

1,28 20   X  150

X  150  1,28 20   175,60  176 libros

EJERCICIO 13.
De un inventario de 48 automóviles que se embarcan a distribuidores locales, 12 tienen
instalados radios defectuosos, ¿Cuál es la probabilidad de que cierto distribuidor reciba 8
automóviles?
a) Todos con radios buenos
b) Por lo menos uno con radio defectuoso
c) Cuantos automóviles con radios defectuosos se esperan recibir

Solución:
12  0,25 radios defectuosos 0,75  radios buenos n 8
48

173
Lic. Isidro W. Nina Paco

8 8 
a) P x  8     0,75  0,25     0,25  0,75   0,1001  10,01 %
8 0 0 8

 
8  
0

 8  
b) P x  1  1    0,25  0,75    1  0,1001  0,8999  89,99 %
0 8

 0  

c) E  np  48 0,25   12 autos

NOTA: Se puede resolver mediante la distribución hipergeométrica.


EJERCICIO 14.
Dadas tres variables aleatorias independientes, con características: X1 ∼ N(0, 2) , X2 ∼ N(2, 2) , X3
∼ N(4, 1) . Calcúlese P(7  Y  10) , siendo Y  4 X1  5X2  6 X3  6

Solución.
La variable aleatoria Y sigue una distribución normal:
E(Y)  4E(X1 )  5E(X2 )  6E(X3 )  6  4 x 0  5 x 2  6 x 4  6  8

V(Y) = 42 V(X1 ) + 52 V(X2 ) + (−6)2 V(X3 ) = 16 ∗ 4 + 25 ∗ 4 + 36 ∗ 1 = 200

Siendo Y ∼ N(8,√𝟐𝟎𝟎)  N(8, 14,14)


−7 − (−8) Y − (−8) 10 − (−8)
P(−7 ≤ Y ≤ 10) = P ( ≤ ≤ ) = P(0,07 ≤ z ≤ 1,27)
14,14 14,14 14,14
= P(z ≥ 0,07) − P(z ≥ 1,27) = 0,4721 − 0,1020 = 0,3701
EJERCICIO 15.
El número de llamadas independientes a la central de una agencia de viajes durante un día es
una distribución de Poisson de parámetro 𝜆 = 100 . ¿Cuál es la probabilidad de que durante 30
días, el total de llamadas se encuentre entre 2900 y 3100?
Solución.
La distribución de Poisson es reproductiva, en el sentido de que la suma de variables de Poisson
independientes es otra variable de Poisson.
n

Xi ~P(λ) → Y = ∑ Xi ~P(nλ) donde E(Y) = nλ , V(Y) = nλ


i=1

En 30 dias n = 30: Y~P(3000) donde E(Y) = 3000, V(Y) = 3000


3100
3000k −3000
P(2900 ≤ Y ≤ 3100) = ∑ e
k!
k=2900

174
Lic. Isidro W. Nina Paco

Cálculo prácticamente imposible de calcular, por el teorema central del límite se tiene:

Y~P(nλ) → Y~N(nλ, √nλ) E(Y) = nλ , V(Y) = nλ


2900 − 3000 Y − 3000 3100 − 3000
P(2900 ≤ Y ≤ 3100) = P ( ≤ ≤ )
√3000 √3000 √3000
= P(−1,82 ≤ z ≤ 1,82) = 1 − 2 ∗ P(z ≥ 1,82) = 1 − 2 ∗ 0,0344 = 0,9312
EJERCICIO 16
̅∪B
Sean A y B dos sucesos aleatorios tales que P(A) = 0,6 , P(B) = 0,4 y P(A ̅ ) = 0,7.
Calcular:
̅)
a) P(A ∩ B b) P(A / B) ̅̅̅̅̅̅̅
̅ ∩ B)
c) P(A

Solución.
̅∪B
P(A ̅ ) = P(̅̅̅̅̅̅̅
A ∩ B) = 0,7 → P(A ∩ B) = 0,3
̅ ) = 0,3
a) P(A ∩ B
P(A∩B) 0,3 3
b) P(A / B) = = = = 0,75
𝑃(𝐵) 0,4 4
c) P(A ̅̅̅̅̅̅̅
̅ ∩ B) = 0,1 → P(A
̅ ∩ B) = 0,9

EJERCICIO 17.
Dada una variable aleatoria X que se distribuye como una B(30; 0,2) y otra variable aleatoria
Y que se distribuye como una B(150; 0,3) .
a) ¿Si X e Y son independientes, se puede afirmar que la variable X+Y se distribuye como una
B(180; 0,5)? Justifica tu respuesta.
b) ¿Se puede afirmar que por el teorema de Moivre la variable Y tiende a una normal? Si fuera
así, ¿qué parámetros tiene esa distribución normal?
Solución.
a) No se distribuye como una B(180; 0,5) , para aplicar la propiedad reproductiva tienen
que tener la misma probabilidad p.
b) Según el TCL Y~N (150 ∗ 0,3 , √150 ∗ 0,3 ∗ 0,7) ≡ N(4,5 , 5,61)

EJERCICIO 18.
La probabilidad de que un paciente mejore tras administrarle un medicamento es de 0,82.
a) Se suministra de manera independiente el medicamento a 10 pacientes en la Clínica Salud.

175
Lic. Isidro W. Nina Paco

¿Qué modelo de distribución de probabilidad sigue la variable número total de pacientes que
mejoran en dicha clínica?
b) Si cada una de las 50 clínicas de una provincia realizan el mismo experimento de manera
independiente, ¿Qué modelo de distribución de probabilidad sigue la variable número total de
pacientes que mejoran en dicha provincia? ¿Cuál es la probabilidad de que al menos 400
pacientes mejoren en esa provincia?
Solución.
a) X=”Mejoraría con el medicamento en una Clínica” X~B(n, p) ≡ B(10, 0,82)
b) Y=”Mejoraría con el medicamento en las 50 clínicas” Y = X1 + X2 + ⋯ + X50 = ∑50
i=1 X i
50

Y~B (∑ Xi , 0,82) ≡ B(500, 0,82)~N (500 ∗ 0,82 , √500 ∗ 0,82 ∗ 0,18) ≡ N(410, 8,59)
i=1

Y − 410 400 − 410


P(Y ≥ 400) = P [ ≥ ] = P(z ≥ −1,16) = P(z ≤ 1,16)
8,59 8,59
= 1 − P(z ≥ 1,16) = 1 − 0,1230 = 0,877
EJERCICIO 19.
Sean A y B dos sucesos incompatibles con 𝑃(𝐴 ∪ 𝐵) > 0. Demostrar que:
P(B)
P(B/ A ∪ B) =
P(A) + P(B)
Solución.
A y B incompatibles → A ∩ B = 0 → P(A ∪ B) = P(A) + P(B)
P[B ∩ (A ∪ B)] P(B)
P(B/ A ∪ B) = =
P(A ∪ B) P(A) + P(B)
EJERCICIO 20.
El error cometido en expedir tickets por una maquina sigue una normal N(0, σ).
a) ¿Cuál es la probabilidad de que el error cometido en valor absoluto de una medida
cualquiera sea al menos σ?
b) ¿Cuánto valdría la probabilidad si se toma como medida la media aritmética de 10 medidas
independientes?
Solución.
a) Sea la variable aleatoria X=”Expedir tickets por la maquina”, N(0, σ)

176
Lic. Isidro W. Nina Paco

X−0 σ−0
P[|X| ≥ σ] = P [| |≥ ] = P[|z| ≥ 1] = P[(z ≤ −1) ∪ (z ≥ 1)]
σ σ
= P(z ≤ −1) + P(z ≥ 1) = P(z ≥ 1) + P(z ≥ 1) = 2P(z ≥ 1) = 2 ∗ 0,1587
= 0,3174

1
b) Sea la variable aleatoria Y = X1 + X2 + ⋯ + X10 → y̅ = 10 ∑10
i=1 X i

10 10
1 1 1
𝐸 (y̅) = 𝐸 ( ∑ Xi ) = 𝐸 [∑ Xi ] = 10𝜇 = 𝜇 = 0
10 10 10
i=1 i=1
10 10
1 1 1 𝜎2
𝜎y̅2 ( )
= 𝑉𝑎𝑟 y̅ = 𝑉𝑎𝑟 [ ∑ Xi ] = 𝑉𝑎𝑟 [∑ Xi ] = 2
10𝜎 =
10 100 100 10
i=1 i=1

𝜎
y̅~𝑁 [0, ]
√10
EJERCICIO 21.
El número de millones de metros cúbicos que tiene un embalse sigue una distribución normal
N(980, 50) . El consumo diario de las poblaciones que sirve es una normal N(85, 30) . Si se
sabe que durante una tormenta la cantidad de agua que se embolsa es una normal N(50, 25) .
Un día han caído dos tormentas, calcular la probabilidad de que al final del día el agua
embalsada sea menor o igual que 980 metros cúbicos.
Solución.
Agua del embalse: X1 ~N(μ1 , σ1 ) ≡ N(980, 50)
Consumo diario: X2 ~N(μ2 , σ2 ) ≡ N(85, 30)
𝐴𝑔𝑢𝑎 𝑢𝑛𝑎 𝑡𝑜𝑟𝑚𝑒𝑛𝑡𝑎: X3 ~N(μ3 , σ3 ) ≡ N(50, 25)
{ 𝐸 (2X3 ) = 2𝐸 [X3 ] = 2 ∗ 50 = 100
𝐴𝑔𝑢𝑎 𝑑𝑜𝑠 𝑡𝑜𝑟𝑚𝑒𝑛𝑡𝑎𝑠: {
𝑉𝑎𝑟(2X3 ) = 4𝑉𝑎𝑟[X3 ] = 4 ∗ 252

2 2

2X 3 ~N ∑ λi μi , √∑ λ2i σ2i ≡ N(2 ∗ 0 , 2 ∗ 25)


i=1 i=1
( )
Agua embalse un día con dos tormentas: Y = X1 − X2 + 2X3 siendo

3 3

𝑌~𝑁 ∑ λi μi , √∑ λ2i σ2i


i=1 i=1
( )

177
Lic. Isidro W. Nina Paco

𝑌~𝑁 (980 − 85 + 100 , √502 + 302 + 4 ∗ 252 ) ≡ 𝑁(995 , 76,81)

𝑌 − 995 980 − 995


𝑃(𝑌 ≤ 980) = 𝑃 [ ≤ ] = 𝑃 (𝑧 ≤ −0,19) = 𝑃 (𝑧 ≥ 0,19)
76,81 76,81
= 2𝑃(𝑧 ≥ 0,19) = 0,4247

178
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.
En la facultad, la probabilidad de que un alumno apruebe el año es del 85%. Si consideramos
10 alumnos, ¿Cuál es la probabilidad de que:
a) Cuatro aprueben? b) Tres reprueben? c) Por lo menos tres reprueben?
d) Como máximo 7 aprueben? e) seis reprueben el año?
Solución:

a) P x4  0,1248% b) P x 3   12,983 % c) P x3   17,98%

d) P x 7   17 ,99 % e) P x 6   0,124%

EJERCICIO 2.
Se sabe que el 65% de los alumnos de una universidad asisten a clases el día viernes; en una
encuesta a ocho alumnos de la universidad, ¿Cuál es la probabilidad de que?:
a) Por lo menos 5 asistan a clase el día viernes
b) Por lo menos 7 no asistan a clases el día viernes.
Solución:

a) Por lo menos 5 asistan P x5   70,64%

b) Por lo menos 7 no asistan P x 7   3,19 %

EJERCICIO 3.
Las estadísticas sobre la aplicación de normas de seguridad en una fábrica indican que, en
promedio, se presentan 12 accidentes cada semestre. Utilice la distribución de Poisson para
determinar la probabilidad de que no hay más de 3 accidentes de trabajo en un trimestre.
Solución:

P x  4   23,81%

EJERCICIO 4.
Si la vida media de cierta marca de batería es de 30 meses, con una desviación estándar de 6
meses, ¿Qué porcentaje de estas baterías puede esperarse que tengan una duración de 24 a 36
meses? Se supone que su duración sigue una distribución normal.

Solución:

179
Lic. Isidro W. Nina Paco

P24 x36  68,26 %

EJERCICIO 5.
Si en general el 25% de los pacientes afectados por una enfermedad mueren de ella. ¿Cuál es
la probabilidad de que, en un grupo de 50, mueran 6?
Solución:

P5,5  x  6,5   1,40 %

EJERCICIO 6.
Una cuarta parte de los documentos archivados diariamente por un empleado de un
departamento de ventas se hace equivocadamente. Si en un día se archivan 100 documentos,
¿Cuál es la probabilidad de que?:
a) Por lo menos 18 documentos estén mal archivados
b) Exactamente 16 documentos estén mal archivados.
c) Exactamente 86 documentos estén correctamente archivados
Solución:

a) Como mínimo 18 equivocados Px 17,5  95,82 %

b) Exactamente 16 equivocados P15,5 x16,5   1,07%

c) Exactamente 86 correctos P85,5 x 86,5  0,39 %

EJERCICIO 7.
La vida útil de cierto producto está distribuida normalmente. Si el 17,68% de ellas duran más
de 540 horas y el 69,83% duran menos de las 486 horas,
a) ¿Cuál es la media y desviación estándar?
b) Si son reemplazadas aquellas unidades con una vida inferior de 450 horas, ¿Cuántas se
reemplazarán si se han venido 20.000?
Solución:
a)   131,71   417 ,51

b) 11.974 unidades

EJERCICIO 8.
En la universidad el departamento de contabilidad y matemáticas está conformado por 40
docentes, 12 de los cuales son de planta. El decano selecciona al azar 5 docentes del
departamento para revisar el plan de estudios. ¿Cuál es la probabilidad de que?:
180
Lic. Isidro W. Nina Paco

a) Todos sean de planta


b) Todos no sean de planta
c) Por lo menos dos sean de planta
Solución:

a) P x  5  0,24%

b) P x  5  16,81% ´

c) P x  2  47,17%

EJERCICIO 9.
La probabilidad de que un banco reciba un cheque sin fondos es 0.01
a) Si en una hora reciben 20 cheques, ¿Cuál es la probabilidad de que tenga algún cheque sin
fondos?
b) El banco dispone de 12 sucursales en la ciudad. ¿Cuál es la probabilidad de que al menos
cuatro sucursales reciban algún cheque sin fondos?
c) La media del valor de los cheques sin fondos es de 600 dólares. Sabiendo que el banco
trabaja 6 horas diarias, ¿Qué cantidad no se espera pagar?
d) si se computasen los 500 primeros cheques, ¿Cuál es la probabilidad de recibir entre 3 y 6
(inclusive) cheques sin fondos?
Solución.
a) 0.182 b) 0.16 c) 120 d) 0.6375
EJERCICIO 10.
La variación porcentual del PIB de 2017, con respecto al año anterior, es una variable aleatoria
normal 𝑁(2, 0,5). ¿Entre qué limites oscilará la variación del PIB con probabilidad 0,95?
Solución.
x
P(2 − x < PIB < 2 + x) = 0,95 → = 1,96 ⟹ x = 0,98
0,5
En consecuencia, P(1,02 < PIB < 2,98) = 0,95. El PIB oscilará entre 1,02 y 2,98
EJERCICIO 11.
El peso (en gramos) de unas cajas es una variable aleatoria X, con distribución normal, cuya
desviación típica es igual a 12 gramos. Se extraen muestras aleatorias simples de tamaño 100
cajas. ¿Cuál es la probabilidad de que el peso medio de las cajas supere el peso medio real en
al menos 300 miligramos?

181
Lic. Isidro W. Nina Paco

Solución.
Se pide calcular P(x̅ ≥ μ + 0,3) → P(x̅ − μ ≥ 0,3) = 0,4013
EJERCICIO 12.
El peso de un paquete de cigarrillos se distribuye según una N(80, 4) . Se dispone de dos lotes
de 100 paquetes cada uno de ellos. ¿Cuál será la probabilidad de que el peso del primer lote
supere en más de 40 gramos al peso del segundo lote?
Solución.
P(x̅ − y̅ > 0,4) = 0,2389
EJERCICIO 13.
Sea X una variable aleatoria que sigue una distribución 𝜒 2con 200 grados de libertad.
Calcular: (a) P(X ≤ 234) y (b) P(X ≤ 183) sin recurrir a las tablas de la Chi‐cuadrado.
Solución.
(a) P(X ≤ 234) = 0,9554 (b) P(X ≤ 183) = 0,1977
EJERCICIO 14.
Se ha realizado una muestra aleatoria simple (m.a.s) de tamaño 10 de una población considerada
normal, llegando a la conclusión que la varianza muestral es 4. Calcular la probabilidad
P[|x̅ − μ| ≤ 1,22]
Solución.
P[|x̅ − μ| ≤ 1,22] = 0,9
EJERCICIO 15.
̅ ) en cada caso:
Sean A y B dos sucesos tales que P(A) = 0,6. Calcular P(A ∩ B
a) A y B mutuamente excluyentes
b) A está contenido en B
c) B está contenido en A y P(B) = 0,3
d) P(A ∩ B) = 0,1
Solución.
̅ ) = 0,6
a) P(A ∩ B b) A ⊂ B = 0
c) B ⊂ A = 0,3 ̅ ) = 0,5
d) P(A ∩ B

182
Lic. Isidro W. Nina Paco

EJERCICIO 16.
Las variables aleatorias en estudio son independientes.
Sean: X1 ~N(10 , 2), X2 ~N(15 , 2) y X3 ~N(20 , 2) donde Y = 5X1 + 4X2 − 3X3 y

X1 − 10 2 X2 − 15 2 X3 − 20 2
U=( ) +( ) +( )
2 2 2
Calcular:
a) P[20 ≤ Y ≤ 30] b) P[U ≤ 11]
Solución.
a) P[20 ≤ Y ≤ 30] = 0,0623 b) P[U ≤ 11] = 0,95
EJERCICIO 17.
En una población de mujeres, las puntuaciones de un test de ansiedad‐riesgo siguen una
distribución normal N(25 , 10) . Al clasificar la población en cuatro grupos de igual tamaño,
¿cuales serán las puntuaciones que delimiten estos grupos?
Solución.
Las puntuaciones que delimitan estos cuatro grupos serán el primer Q1 , segundo Q 2 y tercer
cuartil Q 3 de la distribución. En la distribución normal la media y la mediana son iguales: 𝜇 =
Me = Q 2 = 25. Por consiguiente, el primer grupo serían las mujeres con puntuaciones
inferiores o iguales a 18,3. El segundo grupos son aquellas mujeres con puntuaciones entre 18,3
y 25. El tercer grupo son las mujeres con puntuaciones entre 25 y 31,7. El cuarto grupo son
mujeres que tengan puntuaciones superiores a 31,7.

EJERCICIO 18.
Un dispositivo está formado por muchos elementos que trabajaban independientemente, siendo
la probabilidad de fallo durante la primera hora de trabajo muy pequeña e iguales en todos los
elementos. Si la probabilidad de que en ese tiempo falle por lo menos un elemento es 0,98.
a) Hallar la media y desviación típica del número de elementos que fallen en la primera hora.
b) Calcular la probabilidad de que fallen a lo sumo dos elementos en ese tiempo
Solución.
a) Habiendo muchos elementos independientes, el tamaño (n) es muy grande, con una
probabilidad de fallo muy pequeña, condiciones para que el dispositivo siga una
distribución de Poisson.
Sea la variable aleatoria X = "fallo en la primera hora de un elemento", X~P(λ) donde:

183
Lic. Isidro W. Nina Paco

λk −λ
P(X = k) = e
k!
P(X ≥ 1) = 0,98 → 𝑃 (𝑋 < 1) = 𝑃(𝑋 = 0) = 0,02

𝜇 = λ = 3,91 𝜎 = √3,91 = 1,98


b) P(X ≤ 2) = 0,2531

184
TEMA 9:
TEORIA ELEMENTAL DEL
MUESTREO

La inteligencia consiste no solo en el


conocimiento, sino también en la destreza de
aplicar los conocimientos en la práctica
(Aristóteles)
Lic. Isidro W. Nina Paco
Lic. Isidro W. Nina Paco

TEMA 9: TEORIA ELEMENTAL DEL MUESTREO


FORMULARIO 9
DISTRIBUCIÓN DE MUESTREO DE LA MEDIA ERROR CUADRÁTICO MEDIO (ECM)
MUESTRAL
𝑛
𝐸𝐶𝑀(𝜀) = 𝐸 [𝜀– 𝜃 ]2
1
𝑋̅ = ∑ 𝑋𝑖 2
𝑛 𝐸𝐶𝑀(𝜀) = 𝑉(𝜀) + [𝐸(𝜀) – 𝜃] = 𝑉(𝜀) + 𝐵2
𝑖=1
ESTIMACIÓN PUNTUAL DE LA MEDIA
𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑋̅: 𝜇𝑋̅ = 𝐸 (𝑋̅) = 𝜇
𝑛
𝜎2 1 𝜎2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑋̅: 2 ̅
𝜎𝑋̅ = 𝑉(𝑋) = 𝑋̅ = ∑ 𝑋𝑖 , 𝑀𝑒𝑑𝑖𝑎: 𝜇𝑋̅ = 𝜇, 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝜎𝑋2̅ =
𝑛 𝑛 𝑛
𝑖=1

CORRECCIÓN DE LA VARIANZA FORMULA PARA ESTIMACIÓN PUNTUAL


DE LA MEDIA
𝜎2 𝑁 − 𝑛
𝜎𝑋2̅ = ( ), 𝑠𝑖 𝑛 > 5%𝑁
𝑛 𝑁−1

TEOREMA DEL LIMITE CENTRAL

𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛 𝑷(−𝒛𝛼 ≤ 𝒁 ≤ 𝒛𝛼 ) = 1 – 𝛼
2 2
ESTIMACIÓN POR INTERVALO
−𝒛𝛼 ≤ 𝒁 ≤ 𝒛𝛼
𝑳𝒊 ≤ 𝜽 ≤ 𝑳𝒔 2 2
𝑠𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
ESTIMADOR INSESGADO
𝑛 𝑛 𝑛 | 𝒁 | ≤ 𝒛𝛼
1 1 1 1 2
𝐸 (𝑋̅) = 𝐸 [ ∑ 𝑋𝑖 ] = [∑𝐸[𝑋𝑖 ]] = [∑ 𝜇 ] = 𝑛𝜇 = 𝜇 𝑠𝑒 𝑠𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑒 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1

𝑋̅ − 𝜇
ESTIMADOR CONSISTENTE 𝒁=
𝜎 ⁄√𝑛
𝜎2 𝜎2 𝑡𝑖𝑒𝑛𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑑𝑒𝑙 𝐿𝑖𝑚𝑖𝑡𝑒 𝐶𝑒𝑛𝑡𝑟𝑎𝑙
𝑉(𝑋̅ ) = ⟹ lim = 0 ⟹ 𝑋̅ ⟶ 𝜇
𝑛 𝑛→∞ 𝑛

SESGO DE UN ESTIMADOR 𝜎
|𝑋̅ − 𝜇 | ≤ 𝒛𝛼 𝑐𝑜𝑛 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 − 𝛼
𝑩 = 𝑬(𝜀) – 𝜃
2 √𝑛

185
Lic. Isidro W. Nina Paco

ESTIMACIÓN PUNTUAL DE LA MEDIA FORMULA PARA ESTIMACIÓN POR


n ≥ 30 INTERVALO PARA LA MEDIA
𝜎
𝐸 = 𝒛𝛼
2 √𝑛

𝑒𝑠 𝑒𝑙 𝑚á𝑥𝑖𝑚𝑜 𝑒𝑟𝑟𝑜𝑟 𝑒𝑛 𝑙𝑎
𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼

FORMULA DEL ERROR


𝑷(−𝒛𝛼⁄2 ≤ 𝒁 ≤ 𝒛𝛼⁄2 ) = 1 − 𝛼
𝜎 𝑁−𝑛 𝜎 𝜎
𝐸 = 𝑍𝛼 √ 𝑋̅ − 𝑧𝛼 ≤ 𝜇 ≤ 𝑋̅ + 𝑧𝛼
√𝑛 𝑁 − 1 2 √𝑛 2 √𝑛
𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼

ESTIMACIÓN POR INTERVALO PARA LA MEDIA


CON MUESTRAS GRANDES n ≥ 30
𝜎 𝜎
𝑋̅ − 𝑧𝛼 ≤ 𝜇 ≤ 𝑋̅ + 𝑧𝛼
TAMAÑO DE LA MUESTRA (Conocido el 2 √𝑛 2 √𝑛
tamaño de la población)
INTERVALOS DE CONFIANZA
UNILATERALES
𝑁 𝑍𝛼2 𝜎 2
𝑛=
𝐸2 (𝑁 − 1) + 𝑍𝛼2 𝜎 2
TAMAÑO DE LA MUESTRA (Sin conocer el
tamaño de la población)
𝑍𝛼2 𝜎 2
𝑛=
𝐸2

TAMAÑO DE LA MUESTRA (para proporciones)

𝑍𝛼2 𝑝̂ (1 − 𝑝̂ )
𝑛=
𝐸2
𝜎
𝜇 ≤ 𝑋̅ + 𝑍𝛼 , intervalo de confianza unilateral inferior
√𝑛

𝜎
𝜇 ≥ 𝑋̅ − 𝑍𝛼 , Intervalo de confianza unilateral superior
√𝑛

186
Lic. Isidro W. Nina Paco

ESTIMACIÓN PUNTUAL DE LA MEDIA MUESTRAS


PEQUEÑAS n<30

̅−𝝁
𝑿
𝑻 = , 𝑐𝑜𝑛 𝜈 = 𝒏 – 𝟏 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝒔/√𝒏

ESTIMACIÓN PUNTUAL DE LA MEDIA

𝑷(−𝒕𝛼⁄2 ≤ 𝑻 ≤ 𝒕𝛼⁄2) = 1 − 𝛼

ESTIMACIÓN PUNTUAL DE LA MEDIA n<30


𝑠
𝐸 = 𝑡𝛼
2 √𝑛
𝑒𝑠 𝑒𝑙 𝑚á𝑥𝑖𝑚𝑜 𝑒𝑟𝑟𝑜𝑟 𝑒𝑛 𝑙𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼

ESTIMACIÓN POR INTERVALO PARA LA MEDIA (Muestras pequeñas


n<30)
̅−𝝁
𝑿
𝑻 = , 𝑐𝑜𝑛 𝜈 = 𝒏 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝒔⁄√𝒏
ESTIMACIÓN POR INTERVALO PARA LA MEDIA

𝑷(−𝒕𝛼⁄2 ≤ 𝑻 ≤ 𝒕𝛼⁄2 ) = 1 − 𝛼
𝒔 𝒔
̅ − 𝒕𝛼 ⁄ 2
𝑿 ̅ + 𝒕𝛼⁄2
≤𝜇≤𝑿
√𝒏 √𝒏
𝑐𝑜𝑛 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 1 – 𝛼

187
Lic. Isidro W. Nina Paco

EJERCICIOS RESUELTOS
EJERCICIO 1.
Las estaturas de los estudiantes de una universidad, se distribuyen normalmente con media de
167 centímetros y deviación típica de 15 centímetros. Si se toma una muestra de 70
estudiantes, ¿Cuál es la probabilidad de que tengan una estatura superior a 170 centímetros?
Solución:

  167   15 n  70 P  x 170  ?

170  167 3
Z    1,67
15 1,7928
70
Z  1,67  A 0,9525

P  1  0,9525  0,0475 P  x 170  4,75%

EJERCICIO 2.
Un analista financiero selecciona una muestra aleatoria del 8% de 500 cuentas. La media y la
desviación típica, de los saldos encontrados en las 500 cuentas son: Bs. 417.500 y Bs. 17.000
respectivamente. ¿Cuál es la probabilidad de que con dicha muestra se obtenga una media
superior a Bs. 420.000?
Solución:

  417 .500   17.000 n  0,08500   40 P x  420.000  ?

420.000  417.500
Z  0,93  A 0,8238
17.000
40
P  1  0,8238  0,1762

P x  420.000  17,62 %

EJERCICIO 3.

188
Lic. Isidro W. Nina Paco

Un fabricante de desodorantes recibe cada semana lotes de 10.000 válvulas para los tarros
rociadores. Para aceptar o rechazar dichos lotes, selecciona al azar 400 válvulas de cada lote;
si el 2% o más resultan defectuosos, se rechaza el lote. En caso contrario se acepta el lote.
¿Cuál es la probabilidad de rechazar un lote que contenga el 1% de válvulas defectuosas?
Solución:

P  0,01 n  400 P p  0,02   ?

p  P 0,02  0,01
Z    2,01
PQ 0,01 0,99 
n 400
Z  2,01  A 0,9778

P  1  0,9778  0,0222 P p  0,02  2,22 %

EJERCICIO 4.
En una elección departamental o provincial, el 52% de los electores están a favor del
candidato del partido A, ¿Cuál es la probabilidad de que, en una muestra de 100 electores, el
resultado no muestre una mayoría a favor del candidato?
Solución:

P  0,52 n  100 P p  49%  ?

0,49  0,52
Z   0,60  A 0,2743
0,52 0,48
100
P  1  0,7257  0,2743

P p  0 , 49   27 ,43 %

EJERCICIO 5.
Cierta batería de celular tiene una vida promedio de 5.200 horas, con desviación típica de 200
horas; mientras que otra marca de batería tiene un promedio de duración de 4.800 horas, con
desviación estándar de 180 horas. Si se toman dos muestras de 100 y 75 baterías,
respectivamente, ¿Cuál es la probabilidad de que la diferencia registrada entre las dos
muestras sea superior en 350 horas?

Solución:

 x  5.200  y  4.800  x  200  y  180 n1  100 n2  75 Px  y  350  ?

189
Lic. Isidro W. Nina Paco

350  400  50
Z     1,73  A 0,9582
2002 1802 28,84

100 75

 350  400
Z   26,00  A 0
28,84
P  0,9582  0  0,9582
Px  y  350   95,82%

EJERCICIO 6.
En dos fábricas A y B, que producen determinados artículos para hombres; se sabe que el 5 y
10% de la producción es defectuosa. Si se extrae una muestra de 200 artículos de cada lote
producido, en cada fábrica, cuál es la probabilidad de que las dos muestras revelen una
diferencia inferior al 4%
Solución:

P1  0,05 P2  0,10 n1  200 n2  200 P p1  p2  0, 04  ?

0,04  0,05  0,10 0,09


Z   3,46
0,050,95 0,10 0,90 0,026

200 200

 0,04  0,05  0,10 0,01


Z   0,38
0,026 0,026

Z  3,46  A 0,9997 ; Z  0,38  A 0,6480

P  0,9997  0,6480  0,3517 P p1  p2  0, 04   35,17%

EJERCICIO 7.
Se selecciona una muestra aleatoria simple de familias de clase media baja en un barrio de la
ciudad, con el fin de estimar el ingreso promedio mensual. El error debe estar en el rango de
Bs. 1.000, con un riesgo de 0.040. ¿De qué tamaño debe ser seleccionada la muestra, si la
desviación normal ha sido calculada en Bs. 4.000?

190
Lic. Isidro W. Nina Paco

Solución:
E  1.000 riesgo de 0,040  1  0,040  0,96  96,0%  Z  1,75

  4.000 n?

1,752 4.000
2
n  49 Familias de clase media de un barrio
1.0002
EJERCICIO 8.
Un encargado de marketing de una empresa quiere estimar el número promedio de los días
que un cliente hace durar una recarga de Bs. 30 de una empresa telefónica, para lo cual recaba
información de anteriores encuestas similares, con un factor de error de ±5 días y un 95% de
confiabilidad. Toma información de otras encuestas similares para calcular la desviación
típica de días de duración en s=15 días. ¿Cuál es el tamaño requerido, si se pueden llegar a
encuestar hasta 150 clientes?
Solución:
E  5 dias Z  1,645 s  15 dias N  150

1,6452 150 15


2
n  21,07  21 Clientes n  21 clientes
 
150  1 52  1,6452 152
EJERCICIO 9.
¿Qué tamaño de muestra se requiere para una población de 3.000 unidades, si se desea un
error del 5% y un intervalo de confianza del 95%?
Solución:
n? Z  1,645 E  0,05 N  3.000 P  0,50

n
3000 1,6452 0,50 0,50  248,21 unidades
3000 0,052  1,6452 0,50 0,50

EJERCICIO 10.
Se tiene la siguiente población de 15 valores:

x: 45 70 51 63 65 70 55 51 67 60 62 54 35 43 49

Información adicional ∑ 𝑥𝑖 = 840 ∑ 𝑥𝑖2 = 48570


Determine el tamaño de la muestra, si se desea un error de ±8 y una confianza del 95%
Solución:

191
Lic. Isidro W. Nina Paco

n? E 8 Z  1,645 N  15  2  102 valores2

 X i2  N X 2 840  15 562
 
2
  102
N 15
 X i 840
X    56
N 15

n
1,6452 15 102  3,34 unidades o valores
15 82  1,6452 102
EJERCICIO 11.
Una muestra aleatoria de 150 departamentos de un área central, produce una renta mensual
promedio de Bs. 387.500. Se calculó una renta promedio de Bs. 390.000, con base en una
muestra aleatoria independiente para 120 departamentos de otra área central. Supongamos que
no hay diferencia entre las dos áreas respecto a las rentas mensuales promedio de los
departamentos. ¿Cuál es la probabilidad de observar una diferencia entre las medias
muestrales, más grande de la que se acaba de presentar, si se supone que la desviación
poblacional es de Bs. 10.000 para ambas áreas?
Solución:

n1  150 x  387.500  x 10.000  x  y

n2  120 y  390.000  y  10.000

Z 
387.500  390.000  0   2.500
  2,04
10.000 2
10.0002 1.224,74

150 120
Z   2,04  A 0,0207

0,5000  0,4793  0,0207  2,07%

P x  y  2.500   2,07%

EJERCICIO 12.
Se sabe que el 12% de los estudiantes de una facultad no se presenta a exámenes finales en la
fecha programada. Si se selecciona a 25 alumnos de la facultad, ¿Cuál es la probabilidad de
que 6 o más no se hayan presentado al examen?
Solución:

192
Lic. Isidro W. Nina Paco

P  0,12 n  25 P p  0, 22  ?

0,22  0,12
Z  1,54  A 0,9382
0,1 2 0,88
25
P  1  0,9382  0,0618  6,18%

EJERCICIO 13.
Una muestra aleatoria de 100 docentes universitarios, dio los siguientes resultados:

∑ 𝑥𝑖 = 4.000 ∑(𝑥𝑖 − 𝑥̅ )2 = 9.900

a) La autoridad educativa afirma que el promedio de edad de un profesor es de 43 años,


promedio que consideramos diferente. Pruebe dicha hipótesis al nivel del 5%
b) Si en verdad el promedio en la población es de 39 años, ¿Qué tipo de error cometeríamos?
Solución:

n  100 x  4.000  40 s 2  9.900  99  s  9,95  S 2 2


 99 años 
100 100  

a) 1) H 0 :   43 2)  0,05 3) s  9,95
H a:   43

4) Z  40  43  3,02
9,95 100

El valor de  3,02 cae en la RC; por lo tanto al nivel


del 5% se puede afirmar que la edad promedio de
los profesores es diferente a 43 años. Prueba
unilateral.
b) Si el promedio verdadero, se conoce (39 años), no se comete ERROR, pues estamos
rechazando que sea de 43 años, (rechazamos algo falso).
EJERCICIO 14.

193
Lic. Isidro W. Nina Paco

El departamento de admisiones de una universidad, sostiene que el promedio de calificación


de los alumnos admitidos es de 380 puntos, de un total de 450 que exige. Si se toma una
muestra de 25 alumnos cuyo promedio es de 360, con una desviación típica de 40 puntos. Al
nivel del 1%, ¿se puede afirmar que el puntaje de los admitidos es inferior al señalado?
Solución:
  380 n  25 x  360 sˆ  40   1%

1) H 0 :   380 2)   0,01 3) sˆ  40 4)   n  1  24

H a :   380

5) t  360  380  2,45


40 24

No se puede admitir la afirmación de que el porcentaje es


inferior al solicitado, al nivel del 1%. Unilateral
izquierda.
EJERCICIO 15.
Un distribuidor de botas especiales para trabajo, garantiza al gerente de una fábrica, que el
promedio de duración de las botas es de 8,10 meses. La fábrica decide comprar 30 pares de
botas, que en promedio duran 7 meses y 15 días, con una varianza de 12,5 meses 2. ¿Al nivel
del 5% se podrá decir que la duración de botas es inferior al señalado por el distribuidor?
Solución:
  8,10 meses n  30 x  7,5 meses sˆ 2  12,5  sˆ  3,54

1) H 0 :   8,10 2)   0,05 3) sˆ  3,54 4)   n  1  29


H a :   8,10

7,5  8,10
5) Z   0,91
3,54 29

La duración de las botas, no es inferior al señalado


por el gerente de la empresa, al nivel del 5%. Unilateral izquierda.
EJERCICIO 16.
Supongamos que una persona quiere tener desconectado su teléfono, si el promedio de
llamadas que hace el día es menor de 2. Elige aleatoriamente 5 días y anota el número de
llamadas, así: 0, 2, 1, 1, 2. Utilizando 𝛼 = 0,05 ¿debería retirar el teléfono?
Solución:

194
Lic. Isidro W. Nina Paco

n5   0,05  2 4 t  2,1318

xi  x 
2
 xi 6
x   1,2 s  0,84
n 5 n 1

1) H 0 :   2 2)   0,05 3) s  0,84

Ha :   2

x   1,2  2  1,79
4) t     2,13
s 0,84 0,84
n 5

Se ubica  2,13 en la zona de aceptación, por lo tanto al


nivel del 5%, no debería desconectar el teléfono. También por la cercanía al punto crítico (
 2,1318 ) se podría no tomar ninguna decisión, es decir, omitir juicio.

EJERCICIO 17.
Una compañía afirma que el tiempo necesario para fabricar un artículo es de 53 minutos, con
una varianza de 1,35 horas2. Se toma una muestra de 128 artículos, con un tiempo promedio
de 56 minutos.
a) Al nivel del 5% ¿se podrá afirmar que el producto requiere un tiempo mayor de fabricación
que lo afirmado por la compañía?
b) ¿si el tiempo real de fabricación es de 50 minutos, en la prueba de significación se cometió
un error de tipo I?
Solución:

  53 Minutos  2  1,35 Horas 2    1,35  1,16 Horas  0,6  70 Minutos


n  128 Artículos x  56 Minutos

a) 1) H 0 :   53 2)  0,05 3)   0,70
H a :   53

4) Z  56  53  0,48
70 128

Al nivel del 5%, no se puede afirmar que el producto requiere de un tiempo mayor de
fabricación. Observar que Z = 0,48 cae en la ZA, con lo cual aceptamos H 0 . Unilateral
derecha.

195
Lic. Isidro W. Nina Paco

c) Si el trabajo real es de 50 minutos, estamos cometiendo un error de tipo II, ya que


estamos aceptando a   53

EJERCICIO 18.
Se desea dar una estimación por intervalos a un 95% de confianza para la proporción de
alumnos que están a favor de aumentar en número máximo de convocatorias permitidas por la
normativa de permanencia. ¿Qué tamaño de muestra habría que considerar si se desea un
intervalo con una amplitud de 0,06? Suponga que p = q = 1/2
Solución.

p̂q̂ 1
A = 2z∝/2 √ , z∝/2 = z0,025 = 1,96 → 0,06 = 2 ∗ 1,96 ∗ √
n 4n

0,06 1 1 1
=√ → 0,0153 = √ → 0,000234 = → n = 1068
2 ∗ 1,96 4n 4n 4n

196
Lic. Isidro W. Nina Paco

EJERCICIOS PROPUESTOS
EJERCICIO 1.
El valor promedio de los pedidos que hacen los detallistas de una ciudad a cierto mayorista es
de Bs. 25.900 diarios, con desviación estándar de Bs. 1.800. Si elegimos al azar una muestra
de 200 pedidos, ¿Cuál es la probabilidad de que la media del valor de los pedidos sea superior
a Bs. 26.100?
Solución:
P  x  26.100  5,82 %

EJERCICIO 2.
Se sabe que el 7% de los niños que nacen en cierta región, mueren antes de alcanzar un año de
vida por contaminación. Si durante un cierto periodo de tiempo nacieron 40 niños, ¿Cuál es la
probabilidad de que 5 o más de ellos mueran antes de alcanzar el primer año de vida?
Solución:
5
P  0,07 n  40 p  0,125 P p  0,125  ?
40

0,125  0,07
Z  1,36  A 0,9131
0,07 0,93
40
P  1  0,9131  0,0869 P p  0 ,125   8,69%

EJERCICIO 3.
En promedio, los estudiantes de la Universidad A, se retrasan 25 minutos en llegar a la U, con
una desviación estándar de 7 minutos. Los estudiantes de la Universidad B se retrasan 30
minutos en llegar a la U, con una desviación estándar de 9 minutos. Un grupo de 25
estudiantes de la Universidad A y un grupo de 20 alumnos de la B. Se dirigen a sus
respectivas universidades. Encontrar la probabilidad de que la hora media de retraso del grupo
de la Universidad B sea menor que la del grupo de la Universidad A.
Solución:
P x  y  0  2,07%

EJERCICIO 4.
Determinar el tamaño máximo de una muestra de proporciones siendo la población de 3.000
amas de casa, con un error estándar de ± 3 % y un nivel de confianza del 99%

Solución:

197
Lic. Isidro W. Nina Paco

n  1.143,94 amas de casa

EJERCICIO 5.
Un investigador asegura que el salario promedio de los obreros, en cierto sector industrial, es
de $us. 750 y sus edades oscilan entre los 18 y los 40 años, además sus gastos en alimentación
deben encontrarse entre los 40% y 60%. Se desea estimar el salario promedio, (suponiendo
para ello una desviación típica de $us. 40) y el porcentaje de los gastos en alimentos.
Considere un error del 4% para el promedio y un 8% para la proporción, además una
confianza del 99% y un total de 1.000 obreros, para calcular el tamaño de la muestra.
Solución:
a) n  11,69 obreros

b) n  199,75 obreros

EJERCICIO 6.
Los salarios diarios en un sector de la industria están distribuidos normalmente con una media
de Bs. 4.640 y una desviación estándar de Bs. 500. Si una empresa del sector, que cuenta con
50 obreros, paga, en promedio, Bs. 4.440, ¿puede decirse que esta compañía paga salarios
inferiores, al nivel de significación del 1%?
Solución:
Z  2,82

Se ubica en la región de rechazo, por lo tanto, se puede acusar a la compañía de pagar salarios
inferiores, al nivel del 1%.
EJERCICIO 7.
Doscientos estudiantes, elegidos aleatoriamente, se someten a un “test” de rendimiento,
obteniéndose los siguientes resultados: 𝑥̅ = 70 𝑦 𝑠 = 16, con base en esta información
docimar la hipótesis 𝜇 = 68 frente a la alternativa 𝜇 ≠ 68, al nivel de significación del 1%
Solución:
Z  1,76

Se ubica en la zona de aceptación; aceptamos que   68 , al nivel del 1%

EJERCICIO 8.
Una muestra aleatoria simple de tamaño 12 de una población, presentó los siguientes
resultados:
128 158 174 201 193 160 172 120 125 136 184 192

198
Lic. Isidro W. Nina Paco

¿Proporcionan estos datos, evidencia suficiente para poder concluir que la media poblacional
es superior a 160? (nivel 1%)
Solución:
t  0,23

Estos datos no nos permiten concluir que la media poblacional sea superior a 160, al nivel del
1%. Unilateral derecha.
EJERCICIO 9.
Un investigador asegura que el gasto promedio semanal de las familias de una determinada
región en alimentación es de Bs. 81.000. Con base en los siguientes resultados para la variable
X (Gastos semanales)
𝑥̅ = 80.600 𝑠 = 1.100 𝑛 = 100
¿Con el nivel de significación del 5%, se puede aceptar lo que dice el investigador?
Solución:
Z  3,64

Se rechaza la hipótesis de que   81 .000 , es decir, que no podemos aceptar lo que dice el
investigador, al nivel del 5%.
EJERCICIO 10.
Una muestra de 200 artículos producidos por una máquina que debe tener como
especificación un diámetro de 3,6 cm, revela un diámetro promedio de 3,62 cm, con
desviación estándar de 0,21 cm. ¿Podría afirmarse que el anterior resultado se ajusta a las
especificaciones de producción?
Solución:
n  200   3,6 x  3,62

1) H 0 :   3,6 2)  0,05 3) s  0,21


H a :   3,6

x
4) Z   1,35
s n

Z = 1,35 se ubica en la zona de aceptación, por lo tanto se puede afirmar que el resultado de la
muestra se ajusta a las especificaciones de producción, al nivel del 5%.

199
Lic. Isidro W. Nina Paco

EJERCICIO 11.
Los errores que se cometen al estimar el ahorro familiar de un país siguen una distribución
ne−2
normal de media 0 y desviación σe . Comprobar que la función sigue una distribución Chi‐
σ2e
cuadrado, sabiendo que el tamaño muestral es n y el error medio muestral es e̅ .
Solución.
Si X1 , X 2 , ⋯ , Xn son n variables aleatorias independientes N(0, 1), la variable Chi‐cuadrado
de Pearson con n grados de libertad es 𝜒𝑛2 = X12 + X22 + ⋯ + X2n
La variable aleatoria E=”errores al estimar el ahorro familiar” sigue una N(0, σe )
σe
La media muestral de los errores e̅~N (0, ) con lo que la variable tipificada:
√n
2
e̅ − 0 e̅
z= ~N(0 , 1) → z = (2
) = 𝜒12
σe /√n σe /√n

200
Lic. Isidro W. Nina Paco

BIBLIOGRAFIA.
- Chungara Erick Eduardo (2009) ESTADÍSTICA Y PROBABILIDADES, La paz- Bolivia.
- De la Fuente Fernández Santiago, ESTADISTICA DESCRIPTIVA (NUMEROS INDICE) UNIVERSIDAD
AUTÓNOMA DE MADRID
- Kazmier Leonard (2006) ESTADISTICA APLICADA A ADMINISTRACIÓN Y ECONOMIA 4TA
EDICIÓN, México.
- Martínez Ciro (2008) ESTADÍSTICA Y MUESTREO 12DA EDICIÓN, Colombia.
- Moya Rufino (1991) ESTADISTICA DESCRIPTIVA 2DA EDICIÓN, Perú.
- Nuñes del Prado A. (1992) ESTADISTICA BÁSICA PARA PLANIFICACIÓN CON UNA PARTE NUEVA
SOBRE MUESTREO 16TA EDICIÓN, México
- Rodríguez Ojeda Luis (2007) PROBABILIDAD Y ESTADISTICA BÁSICA PARA INGENIEROS, Ecuador
- Spiegel Murray (1991) ESTADISTICA 2DA EDICIÓN, España.
- Taylor Kinnear (1998) INVESTIGACIÓN DE MERCADOS 5TA EDICIÓN, México, Ed McGraw Hill.
- Yamane taro (1980) ESTADISTICA 3RA EDICIÓN, México, Ed. Harla S.A. de CV-1980.
- Rengel Arancibia Grissel Infrid (2013) CONCEPTOS Y APLICACIONES DE ESTADISTICA
DESCRIPTIVA,Sucre-Bolivia, Imprenta-Editorial “Tupac Katari”

201
Lic. Isidro W. Nina Paco

202

También podría gustarte