Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA DESCRIPTIVA
Y PROBABILIDADES
Segunda edición
mayo 2023
1
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
El autor:
Salvador Pérez Leonardo Patricio
Correo-e: leosalvador54@hotmail.com
Magister en Auditoría de Gestión de la Calidad,
Magister en Gerencia de Proyectos Sociales y Educativos
Ingeniero Comercial,
Docente de Pregrado y Posgrado de la Facultad de Ciencias Administrativas de la Universidad
Central del Ecuador
Docente de Pregrado de la Universidad Politécnica Salesiana.
2
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Segunda edición
Quito, Ecuador
mayo 2023
ISBN: 978-9942-44-481-3
Editorial: LEOSalvador
Primera edición
Quito, Ecuador
noviembre 2022
ISBN: 978-9942-42-822-6
Editorial: LEOSalvador
Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin la
autorización escrita del autor.
3
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Dedicatoria
Para Lucía Margoth, mi esposa y mejor amiga, nuestros hijos y nietos:
Verónica Joselyn, Lucía Carolina y Leonardo Patricio; Ana Paula, Karla
Kamila, María Alejandra, Isabela Valentina y Leonardo Josué.
A mis hermanos, sobrinos y más familiares.
Leonardo Salvador Pérez
4
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Tabla de contenido
1.1 Definición de estadística ...................................................................................................... 8
1.2 Tipos de estadística ............................................................................................................. 9
1.2.1 Estadística descriptiva ......................................................................................................... 9
1.2.2 Estadística inferencial........................................................................................................... 9
1.3 Variables ............................................................................................................................. 10
1.3.1 Variable cualitativa............................................................................................................. 10
1.3.2 Variable cuantitativa ......................................................................................................... 10
1.4 Niveles de medición .......................................................................................................... 11
1.4.1 Datos de nivel nominal...................................................................................................... 11
1.4.2 Datos de nivel ordinal ....................................................................................................... 11
1.4.3 Datos de nivel de intervalo ............................................................................................... 11
1.4.4 Datos de nivel de razón ..................................................................................................... 12
CAPÍTULO 2 ....................................................................................................................................... 13
2.1 Tablas de frecuencias ......................................................................................................... 13
2.2 Distribución de frecuencias ................................................................................................ 17
2.2.1 Número de clases ............................................................................................................... 18
2.3 Representación gráfica de distribución de frecuencias .................................................... 22
CAPÍTULO 3 ....................................................................................................................................... 28
3. Medidas de tendencia central ................................................................................................ 28
3.1 Medidas de ubicación ........................................................................................................ 28
3.1.1 Media aritmética ................................................................................................................ 28
3.1.2 Propiedades de la media aritmética .................................................................................. 30
3.1.4 Mediana de datos no agrupados ....................................................................................... 33
3.1.6 Moda de datos no agrupados ............................................................................................ 37
3.1.8 Posiciones relativas de la media, mediana y moda .......................................................... 39
3.1.9 Media geométrica .............................................................................................................. 41
3.2 Medidas de dispersión ....................................................................................................... 46
3.2.1 Rango .................................................................................................................................. 47
3.2.2 Desviación media ............................................................................................................... 47
3.2.3 Varianza y desviación estándar ......................................................................................... 50
3.2.4 Interpretación y usos de la desviación estándar ............................................................... 54
3.2.5 Media aritmética y desviación estándar de datos agrupados .......................................... 59
CAPÍTULO 4 ....................................................................................................................................... 62
4.1 Otras medidas de posición ................................................................................................. 62
5
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
6
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
7
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 1
1. Introducción
La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, resumir
y presentar los datos observados de manera comprensible, resumiendo las características de los
conjuntos de datos. No realiza generalizaciones o inferencias.
Las técnicas estadísticas se aplican de manera amplia en administración, mercadotecnia,
contabilidad, economía, sociología, control de calidad, entre otros. En los negocios cotidianos, las
compras del ama de casa en el mercado, el volumen de ventas del almacén TIA en las épocas de
navidad, el volumen de compras de mercadería de la Corporación Favorita para el mes de febrero, etc.,
y así un sin número de actividades en donde se necesite trabajar con un registro de datos.
Ética y estadística
Dado que la estadística trabaja con datos, es muy importante que las personas involucradas en todas
las fases donde se recogen organizan, presentan, analizan, interpretan resultados, y finalmente se
informa a la sociedad, en cualquier ámbito, sean íntegros y honestos, de conducta y moral intachable
8
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
para no sesgar los resultados, esto quiere decir que debe imperar la ética en el proceder de la
aplicación de la estadística.
Ejemplo: en el caso de la pandemia del COVID 19, las autoridades de la Salud deben informar con
exactitud el número de personas contagiadas y de defunciones, para que la población esté informada
con datos verdaderos.
Población
Es el conjunto universo de personas, cosas u objetos que se van a estudiar en su totalidad.
Ejemplo: La población de estudiantes de la Universidad Central del Ecuador.
Muestra
Parte de la población que se quiere estudiar.
9
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
1.3 Variables
La variable es una característica de una población o muestra que se está observando. (Webster,
2000, pág. 9).
Existen dos tipos de variables: cualitativas y cuantitativas.
Variable discreta
Se expresan en números enteros como la edad, el número de unidades vendidas, etc.
Ejemplos: número de autos en Quito; número de hijos; número de personas contagiadas por COVID
19, etc.
Variable continua
Se expresan en números decimales y enteros y son el resultado de mediciones. Se expresan con
números decimales o con fracciones.
Ejemplos: estatura de las personas (se mide con un flexómetro); las calificaciones de los estudiantes
(se mide con las evaluaciones); la temperatura ambiente (se mide con termómetro), etc.
10
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
11
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo: el intervalo de edades entre 10 y 60 años clasificados cada 10 años presenta 6 clases de 10
años.
12
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 2
Observando el ejemplo, las variables son las ciudades y no necesitan un orden específico, en ellas se
han vendido cierto número de autos, que se denomina frecuencia absoluta. Para hacer un informe
de ventas, es necesario expresar en porcentaje las ventas y estos valores se denominan frecuencia
relativa.
Para calcular la frecuencia relativa solamente debe dividir cada frecuencia absoluta para el
total y se multiplica por 100, y al final la suma debe ser siempre 100%.
La información obtenida de la tabla de frecuencias se expresa estadísticamente en forma
gráfica a través de un diagrama de barras o circular (pastel).
13
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
250 200
180
Autos vendidos
200
140
150
100
50
0
Quito Guayaquil Cuenca
Ciudad
50,00%
38,46%
40,00% 34,62%
Autos vendidos
26,92%
30,00%
20,00%
10,00%
0,00%
Quito Guayaquil Cuenca
Ciudad
Guayaquil;
200
14
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Quito;
Cuenca; 26,92%
34,62%
Guayaquil;
38,46%
Ejemplo:
Una empresa de turismo realizó una encuesta a una muestra de 900 residentes de la ciudad de
Sangolquí, para saber que estación del año preferían. Los resultados obtenidos fueron los siguientes:
a 100 les gusta el invierno, a 400 la primavera, a 300 el verano y a 100 el otoño. Se desea resumir los
datos en una tabla de frecuencias.
Estaciones climaticas
(frecuencia absoluta)
Primavera
300 Verano
400
Otoño
15
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Interpretación:
De las 900 personas entrevistadas, 400 prefieren la primavera; 300 prefieren el verano, mientras que
el invierno y el otoño son preferidos por 100 personas respectivamente.
Frecuencias relativas
Verano; 33%
Primavera;
44%
Interpretación:
De las 900 personas entrevistadas se observa que el 44% (400 personas) prefieren la primavera, el 33%
(300 personas) prefieren el verano, mientras que el invierno y el otoño son preferidos por 11% (100
personas) respectivamente.
Ejercicios
En los siguientes ejercicios, elabore una tabla de frecuencias, grafique y elabore un informe de lo
observado (interpretación de los resultados):
1) En la ciudad de Quito, en el sector del mercado Santa Clara, el lunes 1 de junio 2021 se han
vendido la siguiente cantidad de gaseosas en envases de 1 litro: Coca Cola 500 unidades, Pepsi
Cola 400, Fruit 200, Orangine 150.
2) En la ciudad de Sangolquí, en la frutería “La papaya sabrosa” el martes 4 de mayo del 2022 se
ha vendido la siguiente cantidad de frutas, en unidades: piñas 100; papayas 50; cocos 25;
guanábanas 14.
3) Para producir yogurt, el gerente de "Lechera la Vaquita" realiza una encuesta a 1,500 personas
para conocer la preferencia de sabores y los resultados fueron los siguientes: mora 450; fresa
350; granadilla 220; banano 180; tamarindo 300. Con esta información, la empresa se propone
producir 3,000 litros por semana. ¿Cuántos litros de cada sabor deberán producir?
4) En la ciudad de Quito, sector La Magdalena, en la frutería de la señora Rosita el martes 4 de
mayo del 2022 se ha vendido la siguiente cantidad de frutas, en unidades: piñas 100; papayas
50; cocos 25; guanábanas 14.
16
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
5) Una fábrica de estuches de teléfonos celulares planifica producir 3,000 unidades y desea saber
que cantidades deberá producir de cada color; previamente realiza una encuesta a un grupo de
estudiantes para que elijan su color favorito y los resultados fueron los siguientes:
color blanco negro naranja verde amarillo rojo azul
preferencia 100 50 25 45 26 35 49
13 16 16 14
17 17 12 14
16 19 16 15
17 11 20 15
Número de datos = 16
Valor máximo = 20
Valor mínimo = 11
Rango 9
N° clases = K 4
Intervalo 2,25 → 3
17
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Nota: ¡¡ Es decisión del profesional Administrador o Estadístico utilizar la metodología que mejor
considere para calcular el valor k!!
Ejemplo 1:
Determine cuantas clases o categorías serán necesarias para la distribución de frecuencias, en los
siguientes casos: a) n = 45
Constante k 2^k
2^ 2 4
2^ 3 8
2^ 4…5 16 … 32
2^ 6 64
18
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
64 es mayor que 45, por lo tanto, se utilizarán 6 clases o categorías en la distribución de frecuencias.
b) n = 250
2k n → 28 = 256 mayor que 250 → k = 8
Ejemplo 2:
En un conjunto de datos se tienen 230 observaciones entre 135 y 321. Determinar el intervalo
conveniente.
N° datos = 230
V max = 321
V min = 135
Rango = 186
N° clases = K → 2k = 8
Intervalo = 23,25
Intervalo adoptado = 24
Ejemplo 3:
En un conjunto de datos se tienen 115 observaciones entre 16,35 y 45,24. Determinar el intervalo
conveniente.
N° datos = 115
V Max = 45,24
V min = 16,35
Rango = 28,89
N° clases = K = 7
Intervalo = 4,13
Intervalo adoptado= 4,20
19
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo 4:
Las siguientes son las calificaciones de 30 estudiantes de estadística en un curso de la Carrera de
Administración de Empresas. Organice los datos en una distribución de frecuencias.
13 16 15 16 14 14 17 13
17 17 16 12 14 12 17 16
13 13 16 14 17 19 14 16
15 17 11 16 20 15
N° datos = 30
Vmáx = 20
Vmín = 11
Rango = 9
N° clases = K = 5
1,80
Intervalo =
2,00
20
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Notas:
• Los valores de punto medio pueden tener decimales y se recomienda trabajar con 2 cifras
decimales.
• Para los valores de las frecuencias relativas parciales y acumuladas es recomendable trabajar
con dos cifras decimales.
Procedimiento:
a) El valor del límite inferior en la primera clase será el valor mínimo del conjunto de datos, o el
valor que el profesional escoja, siempre que sea menor al valor mínimo.
b) El límite superior es el límite inferior más el intervalo seleccionado. En este caso es 2.
c) El siguiente límite inferior es el límite superior anterior. Y nuevamente se suma el intervalo.
d) El punto medio es el promedio o media aritmética entre los límites inferior y superior en cada
clase.
e) La frecuencia absoluta es el conteo de datos que se encuentran en el intervalo (límites
señalados en las clases). Si hay uno o varios datos iguales a los del límite superior de la clase
analizada, estos se contarán en esta clase y en la siguiente clase ya no serán tomados en cuenta
21
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
frec_absol
15 13
frecuencia
10 7 8
5
1 1
0
13 15 17 19 21
11 13 15 17 19
calificaciones
22
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Interpretación:
Con calificaciones de 16 a 20 se encuentran 15 (13 + 1 + 1) estudiantes, así como 15 (7 + 8) estudiantes
tiene entre 11 y 15 puntos.
frec_relat
50,00% 43,33%
40,00%
frecuencia
30,00% 23,33% 26,67%
20,00%
10,00% 3,33% 3,33%
0,00%
13 15 17 19 21
11 13 15 17 19
calificaciones
Interpretación:
Con calificaciones de 16 a 20 se encuentran 50% (43,3% + 3,3% + 3,3%%) de los estudiantes, mientras
que el otro 50% tienen entre 11 y 15 puntos.
28 29
20
15
10
7
0
12 14 16 18 20
calificaciones
Figura 11. Representación gráfica polígono de frecuencias absolutas acumuladas (ojiva menor que)
23
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
frecuencia
100,0% 93,3% 96,7% 100,0%
50,0% 50,0%
23,3%
0,0%
12 14 16 18 20
calificaciones
Figura 12. Representación gráfica polígono de frecuencias relativas acumuladas (ojiva menor que)
30
20 23
15
10
0 2 1
12 14 16 18 20
calificaciones
Figura 13. Representación gráfica polígono de frecuencias absolutas acumuladas (ojiva mayor que)
100,0% 100,0%
76,7%
50,0% 50,0%
Figura 14. Representación gráfica polígono de frecuencias relativas acumuladas (ojiva menor que)
Interpretación:
a) De los 30 estudiantes, 13 tienen calificaciones entre 15 y 17, que representan el 43,33% del
total del curso.
b) Quince estudiantes tienen calificaciones entre 11 y 15, que representa el 50%, mientras el otro
50% tienen calificaciones entre 16 y 20.
Con los resultados obtenidos se puede tomar decisiones. En este caso se observa que apenas un 50%
de estudiantes tiene buenas calificaciones y para el docente es importante que este porcentaje sea
24
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
mayor, por lo tanto, deberá implementar una nueva estrategia de enseñanza para que los estudiantes
mejoren las calificaciones.
Casos particulares:
Es posible que el cliente, el jefe departamental, el gerente de producción, el profesor le pida construir
una distribución de frecuencias con datos predeterminados, como, por ejemplo, iniciando con un valor
específico que deberá ser inferior al valor mínimo del conjunto de datos.
Igualmente, el intervalo también puede ser un valor escogido.
En estos casos, ya no se utiliza la regla para calcular el número de clases a través de la expresión 𝟐𝒌 ≥
𝒏 y luego el intervalo.
Ejemplo 5:
Con las calificaciones del ejemplo 4:
13 16 15 16 14 14 17 13
17 17 16 12 14 12 17 16
13 13 16 14 17 19 14 16
15 17 11 16 20 15
a) Construya una distribución de frecuencias iniciando con 10 como límite inferior de la primera
clase y un intervalo de clase de 3.
b) ¿Dónde tienden a acumularse los datos?
Valores
N° datos = 20 predetermin
ados
Vmáx = 20
Vmín = 11 10
Rango = 9
N° clases = K = 5
1,8
Intervalo =
2,00 3,00
Comparando con los resultados del ejemplo 4, se observa que las frecuencias variaron y por
consiguiente los gráficos y las interpretaciones.
25
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
7) Se dispone de un conjunto de datos con 54 observaciones. ¿Cuántas clases recomendaría para la
distribución de frecuencias?
9) Un conjunto de datos contiene 46 observaciones. El valor más bajo es 24 y el más alto es 125. Para
organizar en una distribución de frecuencias:
a. ¿Cuántas clases sugiere?
b. ¿Qué intervalo recomienda?
10) Bioingredientes C.L. produjo la siguiente cantidad de productos en los primeros 20 días del mes de
mayo 2022:
110 160 120 150 180 185 170 150 180 150
115 160 130 150 140 180 170 180 180 180
11) Con la información del ejercicio anterior, organice los datos como distribución de frecuencias
utilizando 100 como límite inferior de la primera clase y un intervalo de 20. Organice la
información en una tabla de frecuencias y determine:
a) El número de clases
b) Realice el histograma de frecuencias absolutas
c) Realice el polígono de frecuencias relativas
d) Realice un informe de resultados
12) El Ministerio de Turismo del Ecuador estudia la cantidad que gastan al día en alimento y bebida las
familias que visitan el parque Metropolitano. Una muestra de 30 familias que visitó el parque ayer
revela que éstas gastaron las siguientes cantidades:
65 19 63 80 38 62 43 63
54 50 59 54 56 62 62 52
34 26 50 34 44 52 53 41
48 32 53 19 51 61
26
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
a) Organice los datos como distribución de frecuencias utilizando el 15 como límite inferior
de la primera clase y un intervalo de 12.
b) ¿Cuántas clases se utilizaron?
c) ¿Dónde tienden a acumularse los datos?
d) Realice un informe
13) A continuación, se muestra la cantidad de minutos que emplea un grupo de estudiantes para
llegar desde la casa a la Universidad.
62 65 48 37 41 58 42
39 32 56 38 53 85 31
23 47 36 66 46 82 35
43 38 33 28
a) Organice los datos como distribución de frecuencias utilizando el 20 como límite inferior
de la primera clase y 6 clases.
b) ¿Qué intervalo se utilizó?
c) ¿Dónde tienden a acumularse los datos?
d) Realice un informe
27
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 3
Media poblacional
Ejemplo:
Existen 42 tiendas comerciales en el centro comercial el Condado ubicado al norte de Quito. A
continuación, tenemos los valores de ingresos del mes de noviembre 2021 en miles de dólares.
12 15 14 47 45 22 12 21 9 20 5 19 55 18
2 8 12 2 13 59 14 25 15 20 16 45 17 50
4 5 8 1 10 12 26 11 22 10 5 9 2 8
28
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
La media muestral es una característica del análisis de una porción de la población que se denomina
“estadístico”, y permite identificar una característica específica de la población.
Por ejemplo, una empresa dedicada a la fabricación de mayonesa no puede medir todos los envases
de lote de producción para conocer cuál es el contenido, así que se selecciona 30 envases y se obtiene
la media muestral; este valor se infiere (deduce o generaliza) para todo el lote.
En el lenguaje matemático también esta expresada esta fórmula con su respectiva nomenclatura:
𝛴𝑥
𝑋̅ = ; Xm
𝑛
Tabla 6. Nomenclatura media muestral
Símbolo Significado
𝑥̅ = Xm Media muestral
Σ Épsilon (sumatoria de valores x)
x Valores encontrados
n Número de valores de la muestra (n minúscula)
Σx Sumatoria de x valores de la muestra
Ejemplo:
Con la información del ejemplo 1: 42 tiendas comerciales en el centro comercial el Condado ubicado
al norte de Quito. A continuación, tenemos los valores de ingresos del mes de noviembre 2021 en
miles de dólares.
De la población de 42 tiendas comerciales, tomamos al azar una muestra de 10 tiendas:
29
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
12 15 14 47 45 22 12 21 9 20 5 19 55 18
2 8 12 2 13 59 14 25 15 20 16 45 17 50
4 5 8 1 10 12 26 11 22 10 5 9 2 8
Σ𝑋 12+15+14…+2+8 745
𝜇= = = = 17,7 (parámetro)
𝑁 42 42
Este valor es un “estadístico” que sirve para inferir (deducir) a la población, siendo un valor
aproximado.
1. La media aritmética se calcula con todos los valores del conjunto de datos,
2. La media aritmética es única,
3. Todo conjunto de datos de intervalo o de razón contiene una media,
4. La suma de las diferencias o desviaciones de cada valor 𝑋 respecto a la media 𝑋̅ es cero.
Σ𝑋 12 + 10 + 8 + 5 + 7 + 30 + 15 87
𝜇= = = = 12.43
𝑁 7 7
2. Encontrar la media de los siguientes valores muestrales: 5, 11, 9, 15 y 18
30
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝛴𝑥 5+11+9+15+18
𝑥= → = 5
= 11,60
𝑛
Ejemplo 1:
38 40 41 45 48 48 50 50 51 51
59 59 59 62 62 62 63 64 65 66
Utilizando el Excel:
Ejemplo 2:
AUTOS ROSALINDA emplea a 10 vendedores. El número de autos nuevos que vendieron el mes pasado
los respectivos vendedores fueron:
59 59 59 62 62 62 63 64 65 66
66 67 67 69 69 71 77 78 79 79
31
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Utilizando el Excel:
Ejemplo 1:
La “Heladería del Valle” vende helados en tamaños grande, mediano y pequeñ0 a $3,00; $2.75 y $2.50
respectivamente. De los últimos 10 helados que se vendieron 3 fueron grandes, 2 medianas y 5
pequeñas. Determine el precio promedio por helado.
Calculando de la forma tradicional se tiene:
3,00+3.00+3.00+2,75+2,75+2.50+2.50+2.50+2.50+2.50
media aritmética 𝑋𝑤 = 10
32
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
1) La Heladería CUCARDAS se especializa en hacer helados de paila. En mayo 2022 vendió 30 helados
de 3 sabores; 25 helados de dos sabores y 40 helados de 1 sabor. Los helados de 3 sabores cuestan
$ 2,50; de 2 sabores $ 1,50 y de 1 sabor a $ 0,80. ¿Cuál es el precio promedio ponderado de un
helado?
3) Una ama de casa realiza las siguientes compras en el mercado: 8 kg de pollo a $ 1,50; 12 kg de
carne de res a $ 3,50; 18 kg de papas a $ 2,30; 3 quesos a $ 3,60. ¿Cuál es el promedio de compras
por unidad de producto?
33
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Datos ordenados:
5 15 45 62 90
El punto medio o posición es la casilla 3. Por tanto, la mediana es el valor $ 45 que se encuentra en la
posición 3, mientras que la media aritmética es $ 43,40.
a) En la siguiente muestra de calificaciones, determinar la mediana:
8 15 11 19 14 11
Datos ordenados:
8 11 11 14 15 19
El punto medio (posición) está entre las casillas 3 y 4, por tanto, la mediana es el promedio de los
valores que se encuentra de estas casillas: (11+14) /2 = 12,5; mientras que Xm = 13,00.
En grupos de datos pequeños como los de los ejemplos es fácil ubica la mediana, tan solo por
observación. En casos donde se tienen decenas o más cantidad de datos, es conveniente aplicar la
siguiente fórmula para ubicar la posición de mediana:
𝑛+1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 (𝑝𝑚𝑒𝑑 ) =
2
Ejemplo:
En el Almacén PEPITO se han vendido la siguiente cantidad de camisas en los últimos 30 días:
determine cuál es el valor de la mediana y compare con la media aritmética.
2 9 13 16 17 9
10 2 16 13 12 17
4 13 11 18 16 15
5 11 15 19 16 17
7 12 15 16 19 20
34
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
2 2 4 5 7 9
9 10 11 11 12 12
13 13 13 15 15 15
16 16 16 16 16 17
17 17 18 19 19 20
30 + 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 (𝑝𝑚𝑒𝑑 ) = = 15,5
2
El valor de la mediana se encuentra entre la décima quinta y décima sexta casilla.
Entonces, el valor de la mediana = (13 + 15) / 2 = 14 camisas.
Este valor representa el punto medio del conjunto de datos, sin importar valores pequeños y altos.
La media aritmética es: 12,83 camisas. En este valor se consideran la venta de los valores pequeños
(como 2-2-4-5-7-9) y a su vez los valores grandes (como 18-19-19-20) y hay un poco de distorsión.
𝑛
−𝐹(𝑖−1)
2
𝑀𝑑 = 𝐿𝑖 + *A
𝑓𝑖
Donde:
A= amplitud o intervalo (Ls-Li)
n= número total de datos del ejercicio
n / 2 = se refiere a la posición para el análisis: se busca en las F_acum (Fi) el primer valor mayor que
n/2, se ubica la clase y se trabaja en ella
Li = límite inferior de la clase donde se encuentra el intervalo de la mediana
fi = frecuencia absoluta del intervalo de la mediana
F(i-1) = frecuencia acumulada anterior al intervalo de la mediana
35
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
En la siguiente distribución de frecuencia, determinar la mediana.
Marca de
valores frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
Desarrollo:
Marca de
Ingreso neto (millones) frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
𝑛
− (𝑖−1)
𝑀𝑒𝑑 = 𝐿𝑖 + 2 *A
𝑖
25 −24
𝑀𝑒𝑑 = 34 + *9
5
Med = 34 + 1,60
Med = 35,60
36
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
6) Los siguientes son los ingresos en miles de dólares en el almacén Ana Paula, determine la
mediana.
Marca de
Ingreso neto (millones) frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 20 15 13 13 13
20 30 25 19 32 32
30 40 35 16 48 48
40 50 45 20 68 68
50 60 55 12 80 80
80 2410
Ejemplo:
La empresa AMBACAR vendió durante el año 2022 la siguiente cantidad de autos. Determine la moda
respecto al número de autos vendidos.
septiemb noviemb diciembr
enero febrero marzo abril mayo junio julio agosto octubre
re re e
3 15 6 11 19 14 11 15 15 14 20 12
Conclusión: en los meses de febrero, agosto y septiembre se vendieron 15 autos en cada mes.
Utilizando Excel:
37
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
𝑓𝑖 −(𝑓𝑖−1)
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [𝑓𝑖−(𝑓𝑖−1)] + [𝑓𝑖− 𝑓𝑖+1 ]
*A
A= 8
fi = 11 clase 2 frecuencia que más se repite
Li = 18 clase 2 límite inferior de la clase 2
f(i-1) = 5
f(i+1) = 8
fi - (fi-1) = 6
fi - (fi+1) = 3
11−5
𝑀𝑜𝑑𝑎 = 18 + *8
11−5 +(11−8)
Moda = 18 + 5,33
Moda = 23,33
38
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
7) Los siguientes son los ingresos en millones de dólares en el almacén Ana Paula, determine la
moda.
Marca de
Ingreso neto (millones) frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 20 15 13 13 13
20 30 25 19 32 32
30 40 35 16 48 48
40 50 45 20 68 68
50 60 55 12 80 80
80 2410
30
20 20
20
10 10
10
0
100 200 300 400 500 600 700
Utilidades
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑚𝑜𝑑𝑎
En el caso de que una distribución no sea simétrica, se tiene dos tipos de sesgos:
El sesgo positivo o derecho tiene como característica que, el valor de la media es mayor que
la mediana y la moda y su gráfica muestra un sesgo a la derecha.
39
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
La mediana como medida de ubicación es el mejor parámetro para hacer la comparación con
la media aritmética, antes que la moda, ya que esta no se presenta en todos los casos.
1200
1000
Frecuencia
800
600
400
200
0
150 200 250 300 350 400 450
Ingresos
ediana = 250
𝑥̅ > 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 > 𝑚𝑜𝑑𝑎
El sesgo negativo o izquierdo que se presenta cuando el valor de la media es menor que la
mediana y la moda y, su gráfica presenta un sesgo a la izquierda.
Ejemplo: media = 250; mediana = 300
1200
1000
800
600
400
200
0
150 200 250 300 350 400 450
ediana = 250
𝑥̅ < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑚𝑜𝑑𝑎
En un conjunto de datos, no siempre se tendrá la moda, entonces, la evaluación se realizará en base a
la media y a la mediana.
Ejemplo:
Los ingresos mensuales del Almacén ROSITA se organizaron en una distribución de frecuencias y se
determinó una media de $ 96.000, la mediana de $ 93.000 y la moda de $ 91.000. Grafique las ventas
y determine si la distribución es simétrica, tiene sesgo positivo o sesgo negativo. Explique la respuesta.
40
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝑥̅ = 96.000
Mediana = 93.000
Moda = 91.000
Solución: La distribución tiene sesgo positivo por cuanto la media de las ventas es mayor que la
mediana y la moda.
Ejercicios
Determine la media, la mediana y el sesgo de los siguientes ejercicios:
8) Autos Vittoria emplea a 10 vendedores quienes vendieron en diciembre 2022 la siguiente
cantidad de autos respectivamente:
15 23 4 19 18
10 10 8 28 19
9) El supermercado Kamila tuvo los siguientes ingresos en miles de dólares en los últimos 7 meses:
14 24 19 31 36 26 17
10) Los siguientes valores se pagaron por electricidad a la Empresa Eléctrica Quito en los 12 meses
del año 2022:
54 48 58 50 25 20
47 75 46 60 70 15
11) Se analizan las horas de trabajo extra de 16 trabajadores en determinado proyecto, para lo que
se obtuvieron las siguientes cantidades trabajadas.
13 13 12 15 7 15 5 12
6 7 12 10 9 13 12 12
41
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
b) Si un valor Xi = 0, la MG es cero.
Se utiliza en dos casos:
1) Para determinar los cambios promedio de porcentajes, razones, índices y tasas de crecimiento,
siendo de gran importancia tanto para la matemática como para la estadística y la economía
ya que ayuda a conocer cuál es el cambio verdadero que se produce ya sea en cuanto a salarios,
ventas realizadas u otro tipo de datos numéricos.
En el primer caso, es la raíz n-ésima del producto de todos los valores considerados (porcentajes o
números índice).
La fórmula de la media geométrica es la siguiente:
𝑛
𝑀𝐺 = √(𝑥1)(𝑥2)(𝑥3) … … … . (𝑥𝑛)
1⁄
MG = (x1 ∗ x2 ∗ x3 ∗ … . . xn) n
Ejemplo 1
Un inversionista obtuvo un rendimiento en los últimos 3 años del 10%, 14% y 15% respectivamente,
en una inversión en un supermercado. ¿Cuál es la media geométrica de la recuperación de la inversión?
Año 1: 10% ------110% ----- 1,10
42
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝑛
𝑀𝐺 = √(𝑥1)(𝑥2)(𝑥3)
3
𝑀𝐺 = √(1,10)(1,14)(1,15) = 1,1298
Este resultado indica que la media geométrica de recuperación es de 1,1298, es decir, 12,98% más que
la base 100 que se considera.
Nota: La media geométrica se puede considerar como una tasa de crecimiento para proyecciones
futuras.
Ejemplo:
Conociendo el rendimiento promedio de 12,98%, el inversionista se propone incrementar la inversión
en el supermercado para iniciar el año 2022 en $ 100.000,00. ¿Cuánto llegará a tener en el año 2024?
43
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Aplicando la fórmula para calcular el valor futuro de un valor inicial a una tasa de interés y a un
determinado tiempo:
𝑉 = 𝑉𝑖(1 + 𝑖)𝑛
y el interés se reemplaza con la tasa de crecimiento que da la MG, se tiene
𝑉 = 𝑉𝑖(1 + 𝑀𝐺)𝑛
Respuesta: 144.213,10
Ejemplo 2
Calcular la media geométrica de los siguientes porcentajes: 6%, -8%, 10% y 15% que representan los
rendimientos reportados en los últimos 4 años por el departamento financiero en la empresa
BIOINGREDIENTS C.L.
El valor -8% representa una pérdida en relación al 100% de la inversión, y como la media
geométrica no trabaja con números negativos:
(-8% + 100% = 92%; dividido para 100 = 0,92)
4
𝑀𝐺 = √(1,06)(𝟎, 𝟗𝟐)(1,10)(1,15)
MG = 1, 0539 x 100 = 105,39% - 100% = 5,39%
Las ganancias del departamento de ventas fueron el 5,39% → menor que 𝑥̅ = 5,75%
44
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
12) El incremento salarial de un obrero en los dos últimos años fue de 5% y 15%, determine la
media geométrica del incremento salarial.
13) Durante el año 2020, la utilidad de una empresa constructora en cuatro proyectos fue de 2%,
4%, 7% y 9% ¿Cuál es la media geométrica de las ganancias?
14) Durante el año 2020, la utilidad de una empresa constructora en cuatro proyectos fue de 2%,
4%, -7% y 9% ¿Cuál es la media geométrica de las ganancias?
16) En el Supermercado ISABELLA se presentan las siguientes ganancias porcentuales en los años
indicados. Determine el incremento porcentual de los años considerados. Suponga que al
finalizar el año 2022, el supermercado termina con un capital invertido de 10.000 dólares.
Utilice la MG como tasa de incremento y determine cuáles serán los valores futuros para los
años 2023 y 2025.
Año 2016 2017 2018 2019 2020 2021 2022 2323 2025
12 8 -4 5 -3 6 10
En el segundo caso, la Media Geométrica (MG) se aplica para determinar el cambio porcentual
promedio en ciertos períodos de tiempo y para ello se usa la siguiente fórmula:
Ejemplo 3
Según el censo del año 2010, el Ecuador registró 14.306.876 habitantes. Una proyección del INEC
determinada para el 2020 estimó a la población en 17.511.000. ¿Cuál es la media geométrica del
incremento anual de dicho período?
Final período = noviembre 2020
Inicio período = noviembre 2010
45
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Períodos transcurridos = 10
10 17.511.000
MG = √ -1 MG = 0,0196
14.306.876
Igualmente, esta tasa de incremento puede ser aplicada para proyecciones en diferentes casos.
Ejercicios
17) La población de estudiantes de la Facultad de Ciencias Administrativas en el año 2010 fue de
5.400 estudiantes y en el año 2022 se tienen 6.500. ¿Cuál es la media geométrica del
incremento anual de dicho período? Con la MG como tasa de incremento, ¿cuál será la
población de estudiantes para el año 2030?
18) Con los datos del ejemplo 3, se determinó un incremento porcentual anual MG = 1,854%.
Determine la población aproximada para los años 2022 y 2025.
46
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
3.2.1 Rango
La medida más simple que existe es el rango porque representa la diferencia entre los valores máximo
y mínimo de un conjunto de datos.
Esta medida solo considera los valores de los extremos y no los intermedios.
Rango = Valor máximo – valor mínimo
Nota: El rango se emplea mucho en aplicaciones de control de procesos estadísticos, debido a que
resulta fácil calcular e interpretar.
Clientes 1 2 3 4 5 6 7 8 9 10
Tiempo minutos 18 12 13 15 16 11 17 16 13 10
Desarrollo:
Nº cliente X minutos (𝑿 − ̅𝑿)
̅̅̅ ̅̅̅
|𝑿 − 𝑿| ̅
𝑿 Lim sup Lim inf
1 18 3,90 3,90 14,10 16,40 11,80
2 12 -2,10 2,10 14,10 16,40 11,80
3 13 -1,10 1,10 14,10 16,40 11,80
4 15 0,90 0,90 14,10 16,40 11,80
5 16 1,90 1,90 14,10 16,40 11,80
6 11 -3,10 3,10 14,10 16,40 11,80
7 17 2,90 2,90 14,10 16,40 11,80
8 16 1,90 1,90 14,10 16,40 11,80
9 13 -1,10 1,10 14,10 16,40 11,80
10 10 -4,10 4,10 14,10 16,40 11,80
∑ = 141 ∑ = 0,00 ∑ = 23,00
47
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Utilizando Excel:
Conclusión: Los clientes son atendidos en un tiempo medio de 14,10 minutos con una desviación media
de 2,30 minutos (14,10 ± 2,30); es decir, entre 11,80 y 16,40 minutos, siendo este el rango de atención
óptimo.
Ejercicios
19) Los pesos en kilos de un grupo de 5 deportistas son:
50 65 78 84 60
Determine:
e) interprete el resultado.
20) LEO’s Milk empresa de lácteos realiza un estudio de mercado para conocer la aceptación de la leche de
avena con canela haciendo la encuesta a 10 personas, con una valoración del 1 al 10 siendo el 1 que no
48
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
agrada para nada y 10 una valoración muy aceptable al público. La empresa decide que si la media se
encuentra en un rango de desviación entre 7 y 9 se realiza la producción.
Clientes 1 2 3 4 5 6 7 8 9 10
valoración 8 7 9 9 8 7 9 10 7 7
Determine:
21) Colchones Pepito dispone de 6 locales comerciales, donde se han vendido en el mes de mayo 2022 la
siguiente cantidad de colchones:
local 1 2 3 4 5 6
número 12 8 17 19 6 15
Determine:
22) Un grupo de jóvenes emprendedores decide invertir en un nuevo tipo de yogurt griego con sabor de
mango y banano. Previamente realizan un estudio de mercado donde realizan una degustación y una
encuesta a un grupo de 10 personas elegidas al azar, en el norte de Quito, calificando el sabor del yogurt
del 1 al 10, en donde 1 no le gusta y 10 si les gusta. Las calificaciones fueron las siguientes:
personas 1 2 3 4 5 6 7 8 9 10
valoración 6 6 9 10 8 6 8 10 8 7
personas 1 2 3 4 5 6 7 8 9 10
valoración 7 8 9 8 8 6 7 10 7 8
Los inversionistas deciden que el negocio se instalará donde se tenga un promedio igual o
mayor a 7,5. Determine la mejor ubicación para poner el negocio.
23) La empresa INVENTIVA CL produce perfumes para mujer en presentación de 200 ml. El gerente de
producción decide analizar una muestra y medir el volumen de 10 unidades, cuyos valores son los
siguientes:
49
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
201 197 203 210 178 187 201 180 215 188
Determine:
a) La media de la muestra; b) la desviación media; c) el rango de desviación;
d) el coeficiente de variación; e) comente el resultado.
𝛴(𝑋−µ)² 𝛴(𝑋−𝑋̅)²
Varianza σ² = S² =
𝑁 𝑛−1
Varianza
Es la media aritmética de las desviaciones de la media elevadas al cuadrado.
La varianza nunca será negativa y será cero sólo si todas las observaciones son las mismas.
Desviación estándar
En los dos casos, la desviación estándar es la raíz cuadrada de la varianza
Nomenclatura:
σ² = varianza de la población
σ= desviación estándar de la población
S² = varianza de la muestra
50
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo 1
La empresa Constructora LEO instala bombas de agua en 5 casas residenciales con 5 obreros
diferentes. Los tiempos que los obreros registraron en sus instalaciones fueron los siguientes:
28 32 24 46 44
𝛴(𝑋−µ)²
N=5 U = 174/5 = 34,8 min σ² =
𝑁
380.80 σ² = 76,16 ---→ σ = 8,73
𝜎2 =
5
51
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Utilizando el Excel:
Conclusión (interpretación):
a) La empresa instala las bombas de agua en un tiempo medio de 34,8 minutos, con una
desviación estándar de 8,73 minutos (34,8 ± 8,73) con un tiempo mínimo de 29,07 minutos y
un máximo de 43,58 minutos,
b) En la casa N°5 se demoran 46 minutos, esto es, más tiempo del rango de desviación establecido
por las otras instalaciones,
c) En la casa N°3 se demoran 24 minutos, algo menos del rango de desviación establecido.
d) Tan solo dos empleados instalan dentro de la banda de tiempo establecida.
e) Se observa un coeficiente de variación de 25,09% de la desviación estándar respecto a la
media.
52
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
23) Con las ventas en miles de dólares en los últimos cinco días:
8 6 10 7 5
24) Se realizo una encuesta en los cinco hoteles de la ciudad de Atacames para conocer las tarifas
que tienen en temporada alta, siendo las siguientes:
101 97 103 120 78
25) Considere que en los meses de julio a diciembre del año 2021 se vendió la siguiente cantidad
de autos:
julio agosto septiembre octubre noviembre diciembre
9 6 7 11 9 7
26) Las ganancias de la inversión realizada en el supermercado LEO en los años 2016 a 2021 fueron
(miles de dólares):
2016 2017 2018 2019 2020 2021
125 184 220 205 50 85
27) Las ventas realizadas en la Lavandería Kamila en los 6 últimos meses del año 2022 fueron (miles
de dólares):
julio agosto septiembre octubre noviembre diciembre
35 46 31 23 30 85
53
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
29) Una muestra de 7 empresas productoras de lácteos obtuvo las siguientes ganancias (miles de
dólares) en el año 2021.
1 2 3 4 5 6 7
12,5 15,6 14,8 10,3 11,3 5,6 8,6
30) Las edades de una muestra de 8 personas de la tercera edad que se encuentran en la Casa de
reposo LEO son las siguientes:
65 82 76 93 78 81 73 80
31) La empresa INVENTIVA CL produce perfumes para mujer en presentación de 200 ml. El gerente
de producción decide analizar una muestra de 10 unidades para saber si se está cumpliendo
con lo proyectado.
En la producción del perfume, los costos de fabricación contemplan el volumen de 200 ml con
una dispersión de (±) 8 ml; si esta es mayor, aumentan los costos y se reduce la utilidad de la
empresa y si es menor las clientes no compran y disminuyen las ventas. ¿Se encuentra correcta
la fabricación?
201 197 203 210 178
187 201 180 215 188
33) LEO’s Milk empresa de lácteos realiza un estudio de mercado para conocer la aceptación de
un producto que contiene avena con mora; realiza una encuesta a 10 personas, con una
valoración del 1 al 10 siendo el 1 que no agrada para nada y 10 una valoración muy aceptable.
La empresa decide que si la media se encuentra en un rango entre 7 y 10 se realiza la
producción.
Clientes 1 2 3 4 5 6 7 8 9 10
valoración 8 8 9 9 8 7 9 10 7 7
54
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Teorema de Chebyshev
El Teorema de Chebyshev se considera una desigualdad probabilística y se utiliza para medir la
dispersión en los conjuntos de datos.
El conjunto de datos usualmente presenta una distribución normal con una curva con forma
de campana (simétrica) donde se tiene que al menos el 68% de los datos se encuentran en una
desviación estándar de la media, el 95% en dos desviaciones estándar de la media y el 99,7% en tres
desviaciones estándar de la media.
Sin embargo, si los datos no se distribuyen adecuadamente y presenta sesgos derecho o
izquierdo, la regla 68-95-99,7 puede ser inexacta y es mejor aproximar las probabilidades mediante la
1
fórmula: 𝑝=1− 𝑘2
encontrando que los datos de una muestra se encuentran dentro de K desviaciones estándar de la
media, siendo K un número real positivo mayor que uno.
Frecuencia absoluta
20 18
16
15
9 8
10 7
4 5 4
5 3
1
0
5 10 15 20 25 30 35 40 45 50
0 5 10 15 20 25 30 35 40 45
75%
Xm - 2S Xm + 2S
Xm - 3S 88,88% Xm + 3S
Ejemplo:
De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto de
valores se encontrará a k = 2 y K = 3 desviaciones estándar?
1 1
1 − 𝑘2 → 1 − 22 = 1 – 0,25 = 0,75 --→ aproximadamente 75%
1 1
1 − 𝑘2 → 1 − 32 = 1 – 0,11 = 0,88 --→ aproximadamente 88,88%
55
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
34) De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto
de valores se encontrará a k = 1,5 desviaciones estándar?
35) De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto
de valores se encontrará a k = 3,5 desviaciones estándar?
99,70%
95%
68%
0,34 0,34
0,475 0,475
0,4985 0,4985
Cualquier distribución normal [escala X: N (µ ; σ) ] puede convertirse a una del tipo normal estándar
[escala Z: N (0 ; 1)] mediante la siguiente fórmula:
Donde:
µ = media poblacional
σ = desviación estándar poblacional
0 = valor de Z en el medio de la curva
1 = valor máximo de probabilidad
56
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
En la escala Z, en el centro de la curva de distribución es igual a cero, que significa que no hay desviación
respecto a la media.
Las observaciones (se asumen la totalidad, pero en realidad es aproximado 99,7%) se encuentran bajo
la curva acampanada que representa 3 desviaciones estándar.
Una desviación estándar pequeña indica que los datos se encuentran cercanos a la media (poco
dispersos), mientras que una desviación estándar grande significa que los datos se encuentran alejados
de la media (muy dispersos).
Ejemplo 1:
En un grupo de trabajadores se tienen salarios con una media de $ 650, con una desviación estándar
es de $ 25. De acuerdo con el teorema de Chebyshev, determine:
a) ¿entre qué dos valores se encontrarán aproximadamente el 68% de los salarios?
b) ¿entre qué dos valores se encontrarán aproximadamente el 95 de los salarios?
c) ¿entre qué dos valores se encontrarán aproximadamente el 99,7 de los salarios?
d) ¿por lo menos qué porcentaje de ingresos se encontrará entre $ 575 y $ 725 dólares?
Datos:
Xm = 650
S= 25
X1 = 575
X2 = 725
Xm k desvest
a) 𝑋𝑚 ± 1𝑆 68% 650,00 -1 25 625,00
650,00 1 25 675,00
57
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
d)
0,4987 0,4987
X Xm Z Area probab %
575 650 -3,00 0,4987 49,87%
X Xm Z Area probab %
725 650 3,00 0,4987 49,87%
Ejercicios
36) En un rango de calificaciones entre 0 y 50, la distribución de calificaciones de una muestra de
45 estudiantes de estadística presenta una media de 40 con una desviación estándar de 2.
Aplicando la regla empírica, que valores se encuentran entre: 68%, 95% y 99,7%.
37) Un grupo de observaciones presenta una media en ventas de $ 300 con una desviación
estándar de $ 20. Aplicando el Teorema de Chebyshev, ¿por lo menos que porcentaje de
ventas se encuentra entre $ 250 y $ 350?
38) En los 30 días del mes pasado se vendieron un promedio de 30 sanduches diarios con una
desviación estándar de 6. Utilizando la regla empírica:
a) ¿entre que dos valores será la venta del 68% de los sanduches?
b) ¿entre que dos valores será la venta del 95% de los sanduches?
c) ¿entre que dos valores será la venta del 99,7% de los sanduches?
39) En un grupo de observaciones de una muestra se tiene una media de $ 250, con una desviación
estándar es de $ 50. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje
de ingresos se encontrará entre $ 150 y $ 300?
58
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
40) En un conjunto de datos que presenta una media de 420 con una desviación estándar de 15.
Utilizando la regla empírica:
a) ¿entre que dos valores se encuentran aproximadamente el 68%?
b) ¿entre que dos valores se encuentran aproximadamente el 95%?
c) ¿entre que dos valores se encuentran aproximadamente el 99,7%?
41) En una muestra de salarios se tiene una media de $ 650, con una desviación estándar es de $
25. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje de ingresos se
encontrará entre $ 590 y $ 680?
∑ (𝑀 − 𝑋̅)2
𝑆=√
𝑛−1
Como en el caso de la desviación estándar de datos no agrupados, nos indica el grado de dispersión de
un conjunto de datos organizados en una distribución de frecuencias, respecto a la media.
59
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo 1:
Los gastos en publicidad constituyen un elemento significativo en el costo de los artículos vendidos.
Se tienen los siguientes gastos de publicidad de una muestra de 60 compañías manufactureras del
Ecuador.
Determinar la media aritmética y la desviación estándar:
Gastos en publicidad
Nº compañías
($ millones)
Límite inferior Límite superior frecuencia
25 35 5
35 45 10
45 55 21
55 65 16
65 75 8
Desarrollo:
M
Li Ls f f*M ̅ )2
(M-𝑿 ̅ )2
f*(M-𝑿
P. medio
25 35 5 30 150 484,00 2.420,00
35 45 10 40 400 144,00 1.440,00
45 55 21 50 1050 4,00 84,00
55 65 16 60 960 64,00 1.024,00
65 75 8 70 560 324,00 2.592,00
60 3.120 7.560,00
∑ 𝑓𝑀 3.120
n = 60 𝑋̅ = 𝑛 𝑋̅ = 60 𝑋̅ = 52 -----→ clase 3
∑ 𝑓(𝑀−𝑋̅)2 7.560
𝑆=√ 𝑛−1
𝑆=√ 59
S = 11,32
Conclusiones:
a) Los gastos en publicidad presentan una media de $ 52 millones con una desviación estándar
de $ 11,32 millones.
b) La media se encuentra en la clase tres (45 – 55).
c) Se tiene una media de 52 ± 11,32 millones.
d) Se tiene una media de 52 millones en un rango de 40,68 y 63,32 (clases 2 y 4).
e) Existe una variación de ± 21,76% de la desviación estándar respecto a la media.
60
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
Determine la media y la desviación estándar de las siguientes distribuciones de frecuencias:
42)
Ventas (miles
Frecuencia
dólares)
0-2 2
2-4 9
4-6 3
6-8 12
8 - 10 4
43)
Edad (años) Frecuencia
10-20 6
20-30 15
30-40 27
40-50 20
50-60 12
44)
Número visitas Frecuencia
10-15 3
15-20 8
20-25 15
25-30 20
30-35 12
45)
Calificaciones Frecuencia
11-13 7
13-15 8
15-17 13
17-19 1
19-21 1
61
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 4
La medida de dispersión más utilizada es la desviación estándar, sin embargo, existen otras formas de
describir la variación o dispersión de un conjunto de datos, siendo estas, los cuartiles, deciles y
percentiles. (Lind , Marchal, & Whaten, 2012, pág. 111).
La mediana también es parte de esta familia de medidas, ya que divide el conjunto de datos
en dos partes iguales.
Para trabajar con estas medidas de dispersión se requiere que el conjunto de datos u
observaciones se encuentren ordenados de menor a mayor.
Las medidas de posición trabajan en base a percentiles, que se indican a continuación:
Los cuartiles (C): dividen un conjunto de datos ordenados en 4 partes iguales: el 25% - 50% - 75% de
las observaciones.
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
decil 1 decil 2 decil 3 4 5 6 decil 7 8 decil 9 10
Los percentiles (P): dividen un conjunto de datos ordenados en 100 partes iguales.
50% 100%
62
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Otra medida de posición muy utilizada a nivel mundial es el Quintil. Es una medida socio económica
oficial que sirve para medir los ingresos de la población. El quintil uno representa a la población más
pobre; el quintil cinco representa la población más rica.
Los quintiles (Q): dividen un conjunto de datos ordenados en 5 partes iguales:
Otra medida de dispersión estadística es el “Rango intercuartil”, que es la diferencia entre el cuartil 1
y el cuartil 3:
25% 50% 75% 100%
cuartil 1 cuartil 2 cuartil 3 cuartil 4
RC = C3 – C1
Con esta medida, se eliminan los valores extremadamente alejados, y permite desarrollar el diagrama
de caja, que es un instrumento para evaluar la dispersión.
En todos los casos de cálculos de percentiles, se debe ubicar inicialmente la posición del percentil,
mediante la fórmula:
𝑝
𝐿𝑝 = (𝑛 + 1)
100
p: representa el percentil de la medida que se busca.
n: número de datos a analizar.
Ejemplo:
Pollo GUS realiza entregas a domicilio en la zona de San Rafael. En una muestra de diez entregas el
Gerente recopiló la siguiente información en minutos y quiere conocer: el cuartil 1, el cuartil 3, el rango
intercuartil, la mediana, el decil 3, el quintil 2.
Desarrollo:
Los datos siempre deben estar ordenados:
17 18 20 22 26 27 28 30 31 34
63
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
25
𝐿25 = (10 + 1) 100 𝐿25 = 𝟐, 𝟕𝟓 (el C1 se encuentra entre las casillas 2 y 3)
Cálculo de la mediana:
50
Posición de la mediana: 𝐿50 = (10 + 1) 𝐿50 = 5,50
100
64
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Utilizando el Excel:
Para las posiciones cuartil 1, 2 y 3 se tiene una función directa: CUARTIL.EXC(datos; número de cuartil)
Cuartil 1:
Para todas las posiciones (incluyendo cuartiles) se aplica la función: PERCENTIL.EXC(datos; percentil
correspondiente)
Quintil 2:
65
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Decil 3
Ejercicios
1) Determine los cuartiles 1, 2, 3 y el rango Intercuartil de los siguientes datos:
13 13 20 26 27 34 34
41 43 45 47 51 53 62
17 19 19 26 27 29 34
42 43 45 47 51 53 62
3) Determine la mediana, el cuartil 1 y 3, los quintiles 2 y 3, los deciles 4 y 6, los percentiles 25,
40 y 65, el rango intercuartil de los siguientes datos:
15 17 19 21 25 25 34
34 38 38 47 51 53 62
También se conoce como diagrama de caja y bigotes. Es un gráfico que se construye en base a los
cuartiles y permite visualizar la distribución de los cuartiles en un conjunto de datos.
En su representación se utilizan: los cuartiles, el valor mínimo y máximo y los datos atípicos.
66
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
En base al ejemplo del tiempo de entrega de los pollos GUS, visto anteriormente, el Gerente desea
conocer ¿cuánto tiempo tarda una entrega normal? ¿en qué margen de tiempo se realizan la mayoría
de las entregas?
Se presenta la información ordenada
17 18 20 22 26 27 28 30 31 34
Valor mínimo = 17
Valor máximo = 34
Cuartil 1 = 19,50
Cuartil 3 = 30,25
Mediana = 26,50
x̅ = Xm = 25,30
Diagrama de caja
Utilizando el grafico de Excel: es importante considerar que los datos estén en una sola fila o columna,
caso contrario el Excel interpreta como dos o más fuentes de datos y muestra dos o más cajas, que
servirán para hacer comparaciones. Más adelante veremos un ejemplo de esto.
67
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
El diagrama de caja muestra que el 50% de las entregas se encuentra entre 19,50 y 30,25 minutos.
El rango intercuartil representa la dispersión de la mayoría de las entregas (extremos de la caja) y es
10, 75 minutos.
Los datos presentan un sesgo negativo por cuanto la mediana es mayor que la media aritmética.
𝑥̅ mediana
A 17 18 20 22 26 20,6 20
B 27 28 30 31 34 30 30
68
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
En el curso de 2do semestre de educación presencial se supone que estarán estudiantes que tienen
entre 21 y 23 años; un estudiante de 45 o de 10 años estarían fuera de la normalidad, lo que los
convierte en atípicos.
Estos datos se calculan con las fórmulas:
a) Dato atípico superior > (C3 + 1,5 RC)
Ejercicios
4) Desarrolle el diagrama de caja y bigotes y determine los datos atípicos de los siguientes
datos:
13 13 20 26 27 34 34
41 43 45 47 51 53 62
5) Desarrolle el diagrama de caja y bigotes y determine los datos atípicos de los siguientes
datos:
17 19 19 26 27 29 34
42 43 45 47 51 53 62
6) Desarrolle el diagrama de caja y bigotes y determine los datos atípicos de los siguientes
datos:
15 17 19 21 25 25 34
34 38 38 47 51 53 62
La asimetría es una medida para conocer la forma de la distribución de un conjunto de datos sin
necesidad de realizar el grafico y es importante para determinar si una curva de distribución es normal.
1
Posiciones relativas de media, la mediana y la moda (pág. 39)
69
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
La asimetría, también conocida como sesgo, es una medida estadística que describe la falta de
simetría en la distribución de un conjunto de datos. Indica si la distribución está desplazada
hacia la izquierda o hacia la derecha en relación con la media.
Existen diferentes coeficientes de asimetría utilizados para medir esta característica, siendo el
coeficiente de asimetría de Pearson y el coeficiente de asimetría de Fisher los más comunes.
El coeficiente de asimetría de Pearson se calcula tomando el tercer momento central de los
datos y se divide por la desviación estándar elevada al cubo. Un coeficiente de asimetría
positivo indica una asimetría hacia la derecha (cola larga hacia la derecha) y un coeficiente de
asimetría negativo indica una asimetría hacia la izquierda (cola larga hacia la izquierda).
(https://chat.openai.com/c/cb1197b0-b692-4e09-a034-c13b8e8b7400, s.f.)
(𝑋𝑖 − 𝑋𝑚)3
𝐶𝐴 =
𝑛 ∗ 𝜎3
donde:
n = número de datos
Xi = cada uno de los valores
Xm = media aritmética
σ = desviación estándar de la población
2
https://www.google.com/search?client=firefox-b-d&q=karl+pearson+estadistica
3
https://www.youtube.com/watch?v=rPZuj8bQ6zY
70
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝑛 𝑋𝑖 − 𝑋𝑚 3
𝐶𝐴𝑠𝑜 𝑡 = [⅀ ( ) ]
(𝑛 − 1)(𝑛 − 2) 𝑆
donde:
n = número de datos
Xi = cada uno de los valores
Xm = media aritmética
S = desviación estándar de la muestra
Solo en este caso se puede utilizar la función Excel: =COEFICIENTE.ASIMETRIA(datos)
Ejemplo:
Los siguientes valores son los sueldos anuales iniciales, en miles de dólares, de una muestra de cinco
graduados de administración, quienes aceptaron puestos de gerentes empresariales en el año 2019.
Calcule la asimetría por el método de Pearson, de Fisher y de software.
Desarrollo:
7 9 10 12 13 15 17
∗(𝑿 − 𝒏 ) ∑(𝑿−𝑿 )
CAP = CAF =
𝒏∗
n= 7 X (X-Xm)^3
Xm = 11,86 7 -114,59
mediana = 12,00 Sig pob = 3,23 9 -23,32
S= 3,48 Sig^3 = 33,58 10 -6,41
CAP = -0,12 n *Sig^3 = 235,05 12 0,00
CAF = 0,1031 13 1,49
15 31,04
17 136,02
suma 24,24
Mètodo de software
𝒏 𝑿−𝑿
= 𝒏− (𝒏−𝟐)
*Σ
X [(X-Xm)/S]^3 𝑛
7 -2,7081 = 0,233
𝑛−1 (𝑛−2)
9 -0,5512
10 -0,1514 CA softw = 0,1337 con formula
12 0,0001 CA softw = 0,1337 con excel semejante a Fisher
13 0,0353
15 0,7337
17 3,2146
suma 0,5730
4
https://support.microsoft.com/es-es/office/funci%C3%B3n-coeficiente-asimetria-bdf49d86-b1ef-4804-a046-
28eaea69c9fa
71
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Los resultados son diferentes porque son metodologías diferentes. Lo importantes es determinar el
grado de asimetría para deducir si se trata de una curva de distribución normal, característica muy
importante cuando se trata de realizar pruebas de hipótesis.
El resultado por el método de Software es semejante al del método de Fisher.
Con Pearson se tiene una curva con distribución asimétrica negativa (-0,12), con Fisher el resultado es
positivo (0,10), con software el positivo (0,13).
El método más utilizado es el de Pearson, pero puede darse el caso de este ejemplo donde el valor es
muy cercano a cero (-0,12) y nos pone a dudar, entonces se puede probar con el de software para
tener otra apreciación y si se tiene otro valor negativo cercano a cero o un valor positivo cercano a
cero (0,10) se podría concluir que es una curva con distribución normal. Esto depende del grado de
complejidad del análisis que se esté realizando.
4.2.2 Curtosis
El Coeficiente de Curtosis analiza el grado de concentración de valores alrededor de la media
aritmética que representa la zona central de la distribución en la curva de distribución normal.
La curtosis mide la forma de las colas de la distribución y se utiliza para determinar si los datos
tienen colas más pesadas o más ligeras en comparación con la distribución normal. En otras
palabras, indica si los valores extremos de la distribución son más pronunciados (colas pesadas)
o menos pronunciados (colas ligeras) que los de una distribución normal.
72
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Distribuciones
∑(𝑋 − 𝑋𝑚)4
𝐶𝐶 =
𝑛 ∗ 𝑆4
Nota:
Si CCF < 3 → la distribución es platicúrtica
Si CCF = 3 → la distribución es normal o mesocúrtica
Si CCF > 3 → la distribución es leptocúrtica
Ejemplo:
Con los datos del ejemplo anterior calcule el coeficiente de curtosis.
7 9 10 12 13 15 17
Método de Fisher
X (X-Xm)^4
∑(X − X )4
= 7 556,57
n∗ 4 9 66,64
10 11,90
n= 7 12 0,00
Xm = 11,86 13 1,71
σ= 3,23 15 97,57
σ^4 = 108,33 17 699,55
n * σ^4 = 758,31 Suma 1.433,93
73
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
En los siguientes conjuntos de datos, determine los coeficientes de asimetría de Pearson y de software;
el de curtosis de Fisher:
7) Los siguientes valores se pagaron por electricidad a la Empresa Eléctrica Quito en los 12 meses del
año 2022:
54 48 58 50 25 20
8) Se analizan las horas de trabajo extra de 16 trabajadores en determinado proyecto, para lo que se
obtuvieron las siguientes cantidades trabajadas.
13 13 12 15 7 15 5 12
9)
17 18 20 22 26 39 31 34 35 36
10)
6 7 12 10 9 13 12 12
74
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 5
¿Qué es la probabilidad?
Es un indicador que tiene un “Valor entre cero y uno, inclusive, que describe la posibilidad relativa
(oportunidad o casualidad) de que ocurra un evento” (Lind , Marchal, & Whaten, Estadística aplicada a
los negocios y la economía, 2012, pág. 146).
En el cálculo de probabilidades se tienen tres enfoques principales:
a) el modelo clásico (a priori);
b) el modelo subjetivo;
c) el método de frecuencia relativa (a posteriori).
En los conceptos de la probabilidad se conocen los siguientes términos:
75
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Mutuamente excluyente
Significa que un evento es único y no puede suceder otro evento al mismo tiempo.
Ejemplo:
- es hombre o mujer
- es gordo o flaco
- es soltero o casado
Colectivamente exhaustivo
Cuando se realiza un experimento, el resultado debe ser por lo menos uno de los eventos que debe
ocurrir: éxito o fracaso; cierto o falso; correcto o incorrecto; positivo o negativo, etc.
b) Probabilidad empírica
Se basa en hechos ocurridos. Ocurre cuando el número de veces que sucedió un evento en el pasado
(datos históricos) se divide ahora entre la cantidad total de observaciones. Su fórmula es:
𝑁° 𝑣𝑒𝑐𝑒𝑠 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑝𝑎𝑠𝑎𝑑𝑜
𝑃(𝐴) =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Ejemplo:
De 100 accidentes de tránsito registrados en el mes de junio 2022 en Quito, 30 fueron causados por
conductores en estado etílico. ¿Cuál es la probabilidad de que el próximo mes, los accidentes sean
causados por un conductor en estado etílico?
P (accidentes por estado etílico) = 30 / 100 = 0,30 = 30%
76
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
c) Probabilidad subjetiva
Se basa en cualquier información disponible, experiencia, conocimiento que disponga el investigador.
No tiene una fórmula específica.
Ejemplos:
a) El Índice de Precios al Consumidor IPC en el Ecuador para el mes de julio 2022 tendrá poca
variación respecto a junio 2022 (109,34). (La realidad es que el IPC de julio 2022 es = xxxxxx ).
b) El número de contagiados por COVID 19 en el mes de julio 2021 fueron 2.000, y probablemente
en julio 2022 sea similar, si no hay las medidas adecuadas.
c) Es probable que ocurra un nuevo deslave en la Av. La Gasca si no se toman las medidas
adecuadas.
Reglas de la suma
Para combinar eventos se utiliza como conector la letra “o”, que significa que se deben sumar (o unir)
los eventos.
1
A B
C
Diagrama de VENN
Ejemplo:
¿Cuál es la probabilidad de que al lanzar un dado salga 3 o 5?
77
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
La probabilidad conjunta P (A y B) es aquella en la cual pueden ocurrir dos eventos al mismo tiempo
(intersección de elementos).
P (A o B) = P(A) + P(B) – P (A y B) → P(A U B) = P(A) + P(B) – P(A ꓵ B)
A = 1-2-4-6-7
1
B = 6-7-9-10 6
1-2-4 9-10
-
7
Ejemplo 5:
¿Cuál es la probabilidad de que al sacar una carta de un naipe salga un 3 o un trébol? (recuerde que
un naipe está compuesto por 52 cartas).
P (3 o trébol) = P (3) + P(trébol) – P (3 y trébol)
P (3 o trébol) = 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 = 30,77%
Ejemplo:
En la empresa BIOINGREDIENTS C.L. se realizan anualmente exámenes físicos de rutina como parte de
un programa de servicios de salud. Se descubrió que 25% de los empleados tienen el colesterol
elevado; 35% tienen diabetes y 5% tienen colesterol elevado y diabetes.
a) ¿Cuál es la probabilidad de que un empleado elegido de forma aleatoria tenga colesterol
elevado o diabetes?
b) Muestre esta situación en forma de diagrama de Venn.
A = colesterol 25% 1
B = diabetes = 35%
A = 0,25
(A y B) = 5% (AyB) = 0,05
78
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
1
P(A)
Ejemplo:
Regla especial de la suma: no tiene intersección
A = 20% = 0,20
1
B = 30% = 0,30 A = 0,20 B = 0,30
P (A o B) = P(A) + P(B)
P (A o B) = 20% + 30% = 50% 1-(AoB) = 0,50
Ejemplo:
Eventos que no son mutuamente excluyentes y tienen una probabilidad conjunta.
Regla general de la suma: si tiene intersección
A = 20%
B = 30%
1
(A y B) = 15%
A AyB B
P (A o B) = P(A) + P(B) – P (A y B) 15%
20% 30%
P (A o B) = 20% + 30% – 15% = 35% ---→ 0,35
Pno(AoB) = 0,65 1-(AoB) = 65%
Ejemplo:
Si la probabilidad que llueva el día de hoy es 0,30 ¿Cuál es la probabilidad de que NO llueva?
P (NO llueve) = 1 – P (llueve ) = 1 – 0,30 = 0,70
79
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Reglas de la multiplicación
Se usan también para combinar eventos y se utiliza como conector la letra “y”.
Las reglas de la multiplicación se refieren a probabilidades conjuntas (caso de las intersecciones).
a) Regla especial de multiplicación. - Se utiliza para combinar eventos que son independientes.
Los eventos son independientes, cuando la ocurrencia de un evento no afecta la ocurrencia del otro
evento.
P(A y B) = P(A) x P(B) → P(A ꓵ B) = P(A) x P(B)
Ejemplo:
¿Cuál es la probabilidad de que al lanzar un dado salga el cuatro y al lanzar una moneda salga cruz?
P (4 y cruz) = P(4) x P(cruz)
P (4 y cruz) = 1/6 * 1/2 = 1/12 = 0,0833 = 8,33%
La probabilidad condicional es la de que suceda un evento, dado que otro este por ocurrir o ya ocurrió.
El símbolo es una barra vertical “|” y se lee “dado que”.
Ejemplo:
Sharon es una chica presentadora de eventos. Tiene 12 blusas en su clóset: 9 son blancas y 3 son
azules. Para cada presentación dentro de un mismo evento se cambia de blusa 3 veces. Como tiene
un tiempo limitado y se viste de noche, simplemente toma una blusa y se la pone. ¿Cuál es la
probabilidad de que las tres blusas elegidas sean blancas?
80
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
1) Considere que los eventos A y B son mutuamente excluyentes, donde P(A) = 0,40 y P(B) = 0,50.
¿Cuál es la probabilidad de que ocurran ya sea A o B? ¿Cuál es la probabilidad de que ni A ni B
sucedan?
2) Si P(A) = 0,30; P(B) = 0,40 ¿cuál es la probabilidad de que ocurran A o B? ¿Y que no sucedan A
o B?
3) Se conoce que las probabilidades de los eventos A y B son 0,30 y 0,40 respectivamente. La
probabilidad de que A y B ocurran es de 0,20. ¿Cuál es la probabilidad de que A o B no ocurran?
4) Si P(A) = 0,50; P(B) = 0,35 y P(A y B) = 0,15 ¿cuál es la probabilidad de que ocurran ya sea A o
B? ¿Y que no sucedan A o B?
5) Continental Tire garantiza que los neumáticos RX-16 rinden 60.000 kilómetros con una
probabilidad de 0,95 antes de que falle o se desgaste. Cuando no cumple este parámetro se le
devuelve al comprador. Si Leo Salvador adquiere cuatro de estos neumáticos RX-16, ¿cuál es
la probabilidad de que los cuatro tengan una duración de 60.000 km? ¿Y cuantos no alcancen
ese kilometraje?
81
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
1. Tabla de contingencia
2. Tabla de probabilidades
Probabilidades conjuntas
82
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Probabilidad clasica
P(A1) = 700 0,5833 58,33% P(B1) = 800 0,6667 66,67%
1200 1200
b) P(A1 o B2) = P(A1) + P(B2) - P(A1 y B2) 700 + 400 100 0,8333 83,33%
-
1200 1200 1200
83
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
9) Con la siguiente tabla de contingencias:
Segundo evento
Primer evento B1 B2 B3 Total
A1 2 5 6 13
A2 1 4 5 10
Total 3 9 11 23
Determine:
a) P(A1); b) P (B2); c) P(A1 o A2); d) P(B2 o B3); e) P(A1 o B2); f) P(B1 o A2); g) P(A1 y A2);
h) P(B2 y B3); i) P(A2 y B1); j) P(B2 y A2); k) P(A1|B3); l) P(B2|A2)
P(A y B)
Probabilidad clásica Probabilidad condicional P(Ai) P(Bi|Ai)
2 13 2 2 0,0870 8,70%
P(B1|A1) = * =
13 23 13 23
13 5 13 5 5 0,2174 21,74%
P(A1) = P(B2|A1) = * =
23 13 23 13 23
6 13 6 6 0,2609 26,09%
P(B3|A1) = *
13 23 13 = 23
1 10 1 1 0,0435 4,35%
P(B1|A2) = * =
10 23 10 23
10 4 10 4 = 4 0,1739 17,39%
P(A2) = P(B2|A2) = *
23 10 23 10 23
5 10 5 5 0,2174 21,74%
P(B3|A2) = * =
10 23 10 23
1,0000 100,00%
84
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
10) Desarrolle el diagrama de árbol de la siguiente tabla de contingencias:
B1 B2 B3
A1 5 4 1
A2 3 6 4
A3 4 5 2
11) Se realiza una encuesta a un grupo de personas para conocer el estado civil según la edad y los
resultados fueron los siguientes:
Estado civil
Eventos B1 B2 B3
Edad (años) Soltero Casado Divorciado
A1 menos de 25 66 12 2
A2 25 a 35 44 58 8
A3 35 a 45 15 65 10
A4 45 o más 5 92 23
85
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝑃(𝐴𝑖) ∗ 𝑃(𝐵|𝐴𝑖)
𝑃(𝐴𝑖|𝐵) =
𝑃(𝐴1) ∗ 𝑃(𝐵|𝐴1) + 𝑃(𝐴2) ∗ 𝑃(𝐵|𝐴2)
Ejemplo 1:
Una fábrica de Snacks en la ciudad de Quito produce: el 25% de Tostitos; el 40% de Doritos y el 35%
de Papas. En la producción, los tres tienen defectos en el sellado de fundas; en Tostitos el 5%; en
Doritos el 6% y el 10% en Papas. Todos los productos llegan a una sola caja. ¿Cuál es la probabilidad
de que, al sacar una funda de un producto, este sea: a) tostitos con defectos; b) tostitos sin defectos?:
Desarrollo:
P(A1) = 0,25 P(Ai y B)
P(Ai|B) =
P(A2) = 0,40 P(A1 y B) + P(A2 y B)
P(A3) = 0,35
1,00
B1
P(B1|A1) = 0,05
P(B1|A2) = 0,06 desarrollo horizontal:
P(B1|A3) = 0,10 P(A1|B1) = P(A1 y B1)
B2 P(A1 y B1) + P(A2 y B1) + P(A3 y B1)
P(B2|A1) = 0,95
P(B2|A2) = 0,94
P(B2|A3) = 0,90
desarrollo vertical:
P(A1 y B1) P(A1) P(B1|A1) 0,25 0,05 0,0125
P(A1 y B1) P(A1) P(B1|A1) 0,25 0,05 0,0125 P(A1|B1) = 0,1748
P(A1|B1) =
+ P(A2 y B1) P(A2) P(B1|A2) 0,40 0,06 0,0240 17,48%
+ P(A3 y B1) P(A3) P(B1|A3) 0,35 0,10 0,0350
0,0715
86
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo 2:
Una fábrica de televisores LED recibe los componentes LED de tres proveedores que están ubicados
en las ciudades de Quito, Guayaquil y Cuenca. De la ciudad de Quito recibe el 65%, de Guayaquil el
20% y de Cuenca el resto. Se conoce que los componentes LED de Quito tienen un 3% de defectos, de
Guayaquil un 5% y de Cuenca un 4%. Todos los componentes ingresan en una sola bodega sin
especificar su procedencia. Si se toma un componente al azar, cuál es la probabilidad de que:
a) ¿Sea de Quito y defectuoso?
b) ¿Sea de Cuenca y no defectuoso?
c) ¿La probabilidad de ser defectuosos?
d) ¿La probabilidad de no ser defectuosos?
Desarrollo:
Proveedor Defectos = B1 Sin defectos = B2
Quito P(A1) = 0,65 0,03 0,97
Guayaquil P(A2) = 0,20 0,05 0,95
Cuenca P(A3) = 0,15 0,04 0,96
1,00
P(Ai y B)
P(Ai|B) =
P(A1 y B) + P(A2 y B) + P(A2 y B)
a) De Quito
P(A1) P(B1|A1) = 0,0195 = P(A1|B1) = 0,5493
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
b) De Guayaquil
P(A2) P(B1|A2) = 0,0100 = P(A2|B1) = 0,2817
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
c) De Cuenca
P(A3) P(B1|A3) = 0,0060 = P(A3|B1) = 0,1690
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
87
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
B1 = defectuosos B2 = no defectuosos
Probabilidad
Probabilida Probabilidad Probabilida Probabilida
a_priori Probabilidad Probabilidad Probabilida
Proveedor d a_posteriori d da
(conocida conjunta a priori d conjunta
condicional (despues de) condicional posteriori
antes de)
Ai P(Ai) P(B1|Ai) P(Ai y B1) P(Ai|B1) P(Ai) P(B2|Ai) P(Ai y B2) P(Ai|B2)
A1 Quito 0,6500 0,03 0,01950 0,54930 0,6500 0,970 0,63050 0,65371
A2 Guayaquil 0,2000 0,05 0,01000 0,28169 0,2000 0,950 0,19000 0,19699
A3 Cuenca 0,1500 0,04 0,00600 0,16901 0,1500 0,960 0,14400 0,14930
Total 1,0000 0,0400 0,03550 1,00000 1,0000 0,96450 1,00000
Ejercicios
12) Con los datos del ejemplo 1: P(A1) = 0,25; P(A2) = 0,40; P(A3) = 0,35; P(B1|A1) = 0,05; P(B1|A2)
= 0,06; P(B1|A3) = 0,10.
Aplique el teorema de Bayes para determinar:
a) P(A2|B1); b) P(A3|B1); c) P(A2|B2); d) P(A3|B2)
13) Una fábrica de microondas dispone de dos máquinas A1 y A2 que elaboran el 60% y el 40% de
la producción. El porcentaje de productos defectuosos de cada máquina es del 5% y 10 %
respectivamente.
88
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
a) ¿Cuál es la probabilidad que el microondas haya sido fabricado por la máquina A1 sabiendo
que es defectuoso?
b) ¿Cuál es la probabilidad que el microondas haya sido fabricado por la máquina A2 sabiendo
que no es defectuoso?
c) ¿Cuál es la probabilidad conjunta de tener defectos?
14) Una distribuidora de mascarillas en Quito compra el producto en cuatro países: China provee
el 30%, Taiwán 25%, Corea del Sur 25%, e India el 20%. La empresa conoce de inicio que las
mascarillas producidas en China presentan el 3,5% de defectos; las de Taiwán el 4%; las de
Corea del Sur el 6%; y las de India el 6,5%. Si se toma un lote de mascarillas al azar:
a) ¿Cuál es la probabilidad que el lote de mascarillas defectuosa provenga de India?
b) ¿Cuál es la probabilidad conjunta de tener defectos?
15) De los turistas que visitan las Islas Galápagos, el 70% llegan a la Isla Santa Cruz y el resto a la
Isla San Cristóbal. El 35% de los turistas de Isla Santa Cruz y el 50% de San Cristóbal se hospedan
en hoteles, mientras que el resto lo hace en cabañas turísticas. Se elige al azar un turista que
se encuentra en las Islas Galápagos.
a) ¿Cuál es la probabilidad de que se haya hospedado en un hotel?
b) Si se sabe que el turista se ha hospedado en una cabaña turística, ¿cuál es la probabilidad
de que se encuentre en Santa Cruz?
La regla de la multiplicación
Establece que si existen m modos en que un evento pueda suceder y n formas en que otro pueda
ocurrir también, existirán entonces (m)*(n) modos en que los dos eventos pueden suceder.
Número de arreglos (o disposiciones) = (m)*(n)
Ejemplo 13:
Para armar un equipo de sonido se tienen 3 modelos de parlantes, 4 modelos de discos compactos y 5
modelos de amplificadores. ¿Cuántos modelos de equipos diferentes se pueden armar?
Número de arreglos = 3 x 4 x 5 = 60
Se pueden armar 60 modelos de equipos de sonido diferentes.
89
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Combinatoria
Es una parte de las matemáticas que estudia las diversas formas de realizar agrupaciones o arreglos
con los elementos de un conjunto, formándolas y calculado su número.
𝑛!
𝑛𝑃𝑟 = (𝑛−𝑟)!
𝑛!
Si n = r → = 𝑛𝑃𝑛 = (𝑛−𝑛)! --→ 𝑃𝑛 = 𝑛!
90
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
a) ¿De cuantas maneras pueden sentarse 6 personas en una fila de 6 sillas?
6 5 4 3 2 1
n = 6; r = 6
6P6 = 720 maneras
P6 = 6! → 720 maneras
Permutación circular:
Son todos los arreglos de elementos de manera circular, en donde:
1. SI importa el orden que ocupa cada uno de los elementos.
2. SI entran todos los elementos.
3. NO se pueden repetir los elementos.
𝑃𝐶𝑛 = (𝑛 − 1)!
Ejemplo:
¿De cuantas maneras pueden sentarse 6 personas en una mesa redonda?
𝑛!
𝑛𝑃𝑅𝑎, 𝑏, 𝑐 =
𝑎!∗𝑏!∗𝑐!
Ejemplo:
a) ¿De cuantas formas pueden colocarse en línea 9 bolas (canicas), de las que 4 son blancas, 3
amarillas y 2 azules?
n = 9; r = 9 (4+3+2)
91
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
9!
9PR4,3,2 = = 1.260 maneras
4!∗3!∗2!
7!
7PR4,2,1 = = 105 formas
4!∗2!∗1!
𝑛!
𝑛𝑉𝑟 =
(𝑛 − 𝑟)!
𝑛!
(Es similar a Permutación sin repetición: 𝑛𝑃𝑟 = (𝑛−𝑟)! ) ; como n = r → Pn = n!
Ejemplo:
¿Cuántos números de tres cifras distintas se pueden formar con las nueve cifras significativas del
sistema decimal?
n = 9; r = 3
𝑛! 9!
𝑛𝑉𝑟 = (𝑛−𝑟)! 9V3 = (9−3)!
9V3 = 9 x 8 x 7 = 504 formas
𝑛𝑉𝑅𝑟 = 𝑛ʳ
Ejemplo:
1. Con las cifras 1, 2 y 3 ¿cuántos números de 5 cifras se pueden formar?
92
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
n = 3; r = 5
3VR5 = 35 = 243 números
𝑛!
𝑛𝐶𝑟 =
𝑟! ∗ (𝑛 − 𝑟)!
Ejemplo:
Un alumno decide rendir tres de cinco pruebas. ¿De cuántas maneras distintas puede elegir esas tres
pruebas?
5!
n = 5; r = 3 5C3 = = 10 maneras
3!(5−3)!
(𝑛 + 𝑟 − 1)!
𝑛𝐶𝑅𝑟 =
𝑟! ∗ (𝑛 − 1)!
Ejemplo:
En una bodega hay 5 diferentes tipos de gaseosas (coca cola, fanta, fruit, inca, quintuple). ¿De
cuantas formas se pueden elegir 4 gaseosas?
n = 5; r = 4
(5+4−1)!
5CR4 = 4!(5−1)!
= 70 maneras diferentes de elegir gaseosa
8*7*6*5*4*3*2*1 1680
(4*3*2*1)(4*3*2*1) 24
93
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Las disposiciones de eventos “sin repetición”, que son de uso más generalizado, se pueden calcular
directamente en una calculadora científica.
Con el Excel también se pueden calcular los arreglos de eventos.
Ejemplo 14:
nPr --→ n = número de elementos a ordenar; r = número objetos seleccionados
nCr --→ n = número de elementos a ordenar; r = número objetos seleccionados
5P5 = 5 (shift tecla multip) 5 = 120 -------- P5 = 5!
5V3 = 5 (shift tecla multip) 3 = 60
6C4 = 6 (shift division) 4 = 15
Resumen:
¿Importa el
SI SI SI SI SI NO NO
orden?
¿Entran todos
SI SI SI NO NO NO NO
los elementos?
94
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
Resuelva las siguientes operaciones:
16) 20! / 5!
17) 25! + 3!
18) 10! * 3!
19) 12! – 5!
20) 0!
21) 1!
22) 5P5
23) 9PR3,2,4
24) PC5
25) 5V4
26) 6VR3
27) 6C3
28) 8CR3
29) ¿Cuántos números de 5 cifras diferentes se pueden formar con los dígitos: 1, 2, 3, 4, 5?
30) En una clase de 30 alumnos se quiere elegir un comité formado por tres alumnos. ¿Cuántos
comités diferentes se pueden formar?
31) ¿De cuántas formas distintas pueden sentarse 7 personas en una fila de 7 butacas?
32) ¿De cuántas formas pueden mezclarse los siete colores del arco iris tomándolos de cuatro en
cuatro?
33) En el palo de señales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las nueve
banderas?
34) Una persona desea invitar a 5 de sus amigos entre un grupo de 10 amistades. ¿De cuántas
maneras puede hacerlo en total?
35) ¿De cuántas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de fútbol sabiendo que hay 10 posibles candidatos?
36) ¿De cuántas maneras se pueden ordenar 6 personas en una fila?
37) En una carrera compiten 10 caballos. En los boletos hay que indicar el nombre del 1º, 2º y 3º.
¿Cuántos boletos deberemos rellenar para asegurarnos de que ganaremos?
95
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 6
5
https://www.google.com/search?client=firefox-b-d&q=probabilidad+discreta
96
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Términos relacionados:
Esperanza matemática o valor esperado, de una variable aleatoria discreta, es igual al sumatorio de
las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio.6
En matemáticas se llama simplemente media aritmética.
Ejemplo: La siguiente información que se presenta a continuación corresponde al número de
vehículos de una empresa que necesitó algún tipo de mantenimiento, en el primer trimestre del año
2022.
Mantenimiento
Frecuencia (f)
vehículos (x)
0 4
1 6
2 7
3 5
4 3
Total 25
6
José Francisco López. https://economipedia.com/definiciones/esperanza-matematica.html
97
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Se pide:
Elaborar una distribución de probabilidad discreta
Mantenimiento
Probabilidad
vehículos Frecuencia f
P(x)
(x)
0 4 4/25 = 0,16
1 6 6/25 = 0,24
2 7 7/25 = 0,28
3 5 5/25 = 0,20
4 3 3/25 = 0,12
Total 25 25/25 = 1,0
𝜇 = ∑ [𝑥 ∗ 𝑃(𝑥)]
• La varianza es igual a:
98
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
P(X)
0,3 0,28
0,24
0,25 0,2
0,2 0,16
P(X)
0,15 0,12
0,1
0,05
0
0 1 2 3 4
Mantenimientos
Ejercicios
1) Se ha determinado que el número de taxis que llegan cada hora al aeropuerto Mariscal Sucre
sigue la siguiente distribución de probabilidad. Calcule la media, la varianza y la desviación
estándar.
Número taxis 0 1 2 3 4 5 6
2) La probabilidad de que las familias del conjunto habitacional Las Cucardas tengan 0, 1, 2, 3 o 4
autos se presenta a continuación. Calcule la media, la varianza y la desviación estándar.
autos 0 1 2 3 4
llegada clientes 0 1 2 3 4 5
4) Se conoce que las ventas del edulcorante Biodolce en el supermercado LEO, sigue la siguiente
distribución de probabilidades. Calcule el valor esperado y la desviación estándar.
99
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
• n = población
• x = probabilidad a investigar
(Nota: n y π son las variables por identificar en los ejercicios).
100
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Como consecuencia de la pandemia del COVID 19, la empresa LEO informa que el 40% de sus cuentas
por cobrar a sus clientes están vencidas. El gerente toma una muestra aleatoria de cinco de estas
cuentas, para determinar la probabilidad de que:
a) Ninguna de las cuentas está vencida,
b) Dos cuentas están vencidas,
c) Las cinco cuentas estén vencidas.
101
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
En la Tabla B9 pág. 792 del libro de Lynd y Marchal se tienen las probabilidades para diferentes
casos de n y π (pi), de donde se pueden sacar directamente las probabilidades y además calcular
media y desviación estándar.
Ejercicios
5) Se seleccionan aleatoriamente tres artículos de un proceso que se conoce que produce el
10% de artículos defectuosos. Determine la probabilidad de que exactamente:
a) 1 artículo sea defectuoso,
b) 3 artículos sean defectuosos.
c) Determine la media y la desviación estándar
6) Se ha determinado que 5 taxis llegan cada hora al aeropuerto Mariscal Sucre. Suponga que la
probabilidad de que cualquier taxi llegue tarde es de 0,20. Cuál es la probabilidad de que en la
siguiente hora:
a) ninguno de los taxis llegue tarde,
b) uno de los taxis llegue tarde.
c) Determine la media y la desviación estándar
102
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Un 33% de automóviles nuevos requerirá servicio por garantía en el primer año. La agencia LEO
autos vendió 7 automóviles en el mes de abril 2022.
Ejercicios
7) Con la información del ejemplo último, determinar:
a) P (x ≤ 3)
b) P (x ≥ 4)
c) P (x > 5)
d) P (x < 6)
103
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝐶𝑥𝑆 ∗ 𝐶𝑛−𝑥
𝑁−𝑆
𝑃(𝑋) =
𝐶𝑛𝑁
N = tamaño población
S = número éxitos en la población
n = tamaño de la muestra o número de ensayos
X = número de éxitos en la muestra
C = símbolo de la combinación
Media 𝝁 = 𝒏𝒑 ; 𝒑= 𝑵
; 𝒒= −𝒑
𝑵−𝒏
Varianza 𝝈𝟐 = 𝒏𝒑𝒒 ∗ 𝑵−
Ejemplo:
El Departamento de Sistemas de Informática de una institución está formado por doce profesores de
los cuales cuatro son mujeres. La directora, desea establecer un comité de cuatro miembros del
profesorado del departamento para que revise el plan de estudios.
Si selecciona el comité al azar:
104
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Se demuestra que aplicando la distribución discreta también se puede calcular la media, varianza y
desviación estándar (ver casillas color beige). No se requiere que este cálculo adicional se haga
siempre. Tan solo se pueden aplicar las fórmulas para media y varianza.
Ejercicios
9) Quince de los 30 estudiantes del curso de Estadística inferencial se encuentran satisfechos
con el texto que se utiliza. Si una muestra de 5 estudiantes es interrogada sobre el texto,
determine la probabilidad de que:
a) exactamente 2 estudiantes se encuentren satisfechos con el texto,
b) al menos 2 estudiantes se encuentren satisfechos con el texto
11) De cada 30 piezas fabricadas por una máquina, hay 2 que son defectuosas. Para realizar un
control de calidad, se observan 10 elementos y se rechaza el lote si hay alguna que sea
defectuoso. Vamos a calcular la probabilidad de que el lote sea rechazado.
105
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Los automóviles de una cooperativa de taxis de la ciudad de Quito llegan a su estación en un promedio
de cuatro por minuto. ¿Cuál es la probabilidad de que en un minuto específico:
a) No lleguen automóviles P (x) = 0
b) Lleguen cuatro automóviles P (x) = 4
c) Lleguen cuatro o menos automóviles P (x ≤ 4)
d) Lleguen cuatro o más automóviles P (x ≥ 4)
En la tabla B5 (pag 788) del libro de Lind & Marchall se puede conseguir los resultados.
Se calcula mediante el uso de la función Excel POISSON.DIST(X;U;0)
106
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
POISSON.DIST(X;U;0)
n= x p(x)
π= 0 0,0183
µ= 4 1 0,0733
2 0,1465
3 0,1954
a) 0,0183 4 0,1954
b) 0,1954 5 0,1563
c) 0,6288 6 0,1042
d) 0,5665 7 0,0595
8 0,0298
9 0,0132
10 0,0053
11 0,0019
12 0,0006
13 0,0002
14 0,0001
1,0000
Ejercicios
13) En una distribución de Poisson, µ = 0,4
a) ¿Cuál es la probabilidad de que x = 0?
b) ¿Cuál es la probabilidad de que x > 0?
14) Un promedio de 6 personas por hora utiliza el cajero automático de un banco durante el
horario pico de compras en el supermercado LEO. Cuál es la probabilidad de que:
a) exactamente 6 personas usen el cajero en una hora aleatoriamente seleccionada
b) menos de 5 personas usen el cajero en una hora aleatoriamente seleccionada,
c) ninguna persona la use.
107
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
𝑵−
𝒙 ∗ 𝒏−𝒙
Fórmula 𝑷(𝒙) = 𝒏 𝒙 ∗ 𝝅𝒙 ∗ ( − 𝝅)𝒏−𝒙 𝑷(𝑿) = 𝑵
𝒏
µ (media) µ = nπ no tiene µ = nπ
e (base de logaritmo
no tiene no tiene e = 2,71828
natural)
108
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 7
P(x)
1
altura = 𝑏−𝑎
0,2500
6 7 8 9 10
a) a= 6
b= 10 i= (b - a) = 4
1
𝑃(𝑥) = Si a ≤ X ≤ b y 0 en cualquier otro lugar
𝑏−𝑎
𝑎+𝑏
Media: 𝜇= 2
(𝑏−𝑎)2
Desviación estándar: 𝜎= √ 12
1
P(X) = Área = (base) (altura) (𝑏 − 𝑎) ∗ (𝑏−𝑎) = 1,00 (para todo el intervalo)
Base (Intervalo) = 𝑖 = (𝑏 − 𝑎)
Ejemplo:
Una distribución uniforme se define en el intervalo de 4 a 8.
a) ¿Cuáles son los valores de a y de b?
b) ¿Cuál es la media de esta distribución uniforme?
c) ¿Cuál es la desviación estándar?
d) Demuestre que el área total es de 1,00.
e) Calcule la probabilidad de un valor mayor que 6.
f) Calcule la probabilidad de un valor entre 5 y 7.
109
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Desarrollo:
P(x)
1
altura = 0,2500
𝑏−𝑎
4 5 6 7 8
a) a= 4
b= 8 i= (b - a) = 4
b) 𝑎 +𝑏 U= 6
𝜇=
2
1
altura = = 0,250
𝑏−𝑎
c) (𝑏 − 𝑎)2 σ= 1,15
𝜎=
12
d) Area = 4 0,250 = 1
e) P(X > 6) = i= 2
Ejemplo:
La mayoría de las mariposas monarca nacen en la primavera y en el verano y viven entre 2 y 6
semanas como adulto, observándose una distribución uniforme.
g) Trace la distribución uniforme. ¿Cuáles son los valores de la altura y de la base?
h) Determine la media aritmética
i) Determine la desviación estándar
j) Demuestre que el área total bajo la curva es de 1,00.
k) ¿Cuál es la probabilidad de que una mariposa viva entre 5 y 6 semanas?
l) ¿Cuál es la probabilidad de que una mariposa viva menos de 5 semanas?
Desarrollo:
110
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
P(x)
1
= 0,2500
𝑏−𝑎
2 3 4 5 6
b
a= 2
b= 6 i= (b - a) = 4
b) 𝑎 +𝑏 U= 4,00 semanas
𝜇=
2
c)
(𝑏 − 𝑎)2 σ= 1,15 semanas
𝜎=
12
e) P(5 ≤ X ≤ 6) = i= 1
f) P(< X 5) = i= 3
Ejercicios
1) Una distribución uniforme se define en el intervalo de 4 a 10.
a) ¿Cuáles son los valores de a y de b?
b) ¿Cuál es la media de esta distribución uniforme?
c) ¿Cuál es la desviación estándar?
d) Demuestre que el área total es de 1,00.
e) Calcule la probabilidad de un valor mayor que 7.
f) Calcule la probabilidad de un valor entre 6 y 8.
3) La cantidad de bebida en una lata de cerveza de 12 onzas tiene una distribución uniforme
entre 11,91 y 12,08 onzas.
111
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
U = mediana = moda
No existe una sola curva de distribución normal, sino una familia de estas, donde se pueden
observar:
112
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Donde:
µ = media poblacional
σ = desviación estándar poblacional
0 = valor de Z en el medio de la curva
1 = valor máximo de probabilidad
Esta regla menciona que: En cualquier distribución de frecuencias simétrica con forma de campana,
aproximadamente 68% de las observaciones se encontrarán entre más y menos una desviación
estándar de la media; cerca de 95% de las observaciones se encontrarán entre más y menos dos
desviaciones estándares de la media y, de hecho todas (99,7%), estarán entre más y menos tres
desviaciones estándares de la media (Lind , Marchal, & Whaten, 2012, pág. 86).
113
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
68 % Xm ± 1 S
95 % Xm ± 2 S
-3 -2 -1 0 1 2 3
99,7 % Xm ± 3 S
Cualquier distribución normal [escala X: N (µ ; σ) ] puede convertirse a una del tipo normal estándar
[escala Z: N (0 ; 1)] mediante la siguiente fórmula:
Donde:
µ = media poblacional
σ = desviación estándar poblacional
0 = valor de Z en el medio de la curva
1 = valor máximo de probabilidad
En la escala Z, en el centro de la curva de distribución es igual a cero, que significa que no hay desviación
respecto a la media.
114
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Las observaciones (se asumen la totalidad, pero en realidad es aproximado 99,7%) se encuentran bajo
la curva acampanada que representa 3 desviaciones estándar.
Ejemplo:
Un grupo de trabajadores tienen salarios con una media de $ 650, con una desviación estándar de $
25. De acuerdo con el teorema de Chebyshev, determinar:
a) ¿Entre que valores se encontrará aproximadamente el 68% de salarios?
b) ¿Entre que valores se encontrará aproximadamente el 95 % de salarios?
c) ¿Entre que valores se encontrará aproximadamente el 99,7 % de salarios?
d) ¿por lo menos qué porcentaje de ingresos se encontrará entre $ 575 y $ 725?
Desarrollo:
Datos:
Xm = 650
S= 25
X1 = 575
X2 = 725
Xm k desvest
a) 𝑋𝑚 ± 1𝑆 68% 650,00 -1 25 625,00
650,00 1 25 675,00
115
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
d)
0,4987 0,4987
X Xm Z Area probab %
575 650 -3,00 0,4987 49,87%
X Xm Z Area probab %
725 650 3,00 0,4987 49,87%
Conclusión: entre 575 y 725 se encuentra aproximadamente el 99,74% de los salarios que es el
porcentaje aproximado que señala Chebyshev.
Ejercicios
5) En un rango de calificaciones entre 0 y 50, la distribución de calificaciones de una muestra de
45 estudiantes de estadística presenta una media de 40 con una desviación estándar de 2.
Aplicando la regla empírica, que valores se encuentran entre: 68%, 95% y 99,7%.
6) Un grupo de observaciones presenta una media en ventas de $ 300 con una desviación
estándar de $ 20. Aplicando el Teorema de Chebyshev, ¿por lo menos que porcentaje de
ventas se encuentra entre $ 250 y $ 350?
7) En los 30 días del mes pasado se vendieron un promedio de 30 sanduches diarios con una
desviación estándar de 6. Utilizando la regla empírica:
a) ¿entre que dos valores será la venta del 68% de los sanduches?
b) ¿entre que dos valores será la venta del 95% de los sanduches?
c) ¿entre que dos valores será la venta del 99,7% de los sanduches?
8) En un grupo de observaciones de una muestra se tiene una media de $ 250, con una desviación
estándar es de $ 50. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje
de ingresos se encontrará entre $ 150 y $ 300?
9) En un conjunto de datos que presenta una media de 420 con una desviación estándar de 15.
Utilizando la regla empírica:
116
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Una población normal tiene una media de 15 y una desviación estándar de 5,5.
a) Calcule el valor de z asociado con 20
b) ¿Qué proporción de la población se encuentra entre 15 y 20?
Desarrollo:
µ= 15
σ= 5,5
X= 20
0,5 0,318
0,3186
𝒙−µ 15 20 0,1814
=
𝝈 0 0,91
X U Z
a) 20 15 0,91
b) entre 15 20 área p = 0,3186 31,86%
mayor a 20 área p = 0,5 -0,3186 = 0,1814 18,14%
menor a 20 área p = 0,5 0,3186 = 0,8186 81,86%
El área p se obtiene de la tabla B1 (pág. 782): Se localiza Z en la columna izquierda para los enteros y
el decimal y los valores de la fila horizontal superior para las centésimas: luego, el valor de la
probabilidad es la intersección de los parámetros indicados.
Ejemplo: Z = 0,91
117
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
=ABS(INV.NORM.ESTAND(0,5-E43))
118
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
10) Un estudio reciente de salarios por hora de los empleados del supermercado LEO demostró
que el salario medio por hora era de $12 con una desviación estándar de $2,50. Suponga que
la distribución de los salarios por hora es una distribución de probabilidad normal. Si elige un
integrante de un equipo al azar, ¿cuál es la probabilidad de que gane:
a) entre $10 y $12 la hora?
b) más de $13 la hora?
c) menos de $10 la hora?
11) La media de una distribución de probabilidad normal es de 550 kg. La desviación estándar es
de 15 kg.
a) ¿Cuál es el área entre 530 kg y la media de 550 kg?
b) ¿Cuál es el área entre la media y 580 kg?
c) ¿Cuál es la probabilidad de seleccionar un valor al azar y descubrir que se encuentra
entre 535 y 580 kg?
13) Una población normal tiene una media de 20 y una desviación estándar de 2,5. Determine:
a) Calcule el valor de z asociado con 25
b) ¿Qué proporción de la población se encuentra entre 20 y 25?
c) ¿Qué proporción de la población es menor que 18?
d) ¿Qué proporción se encuentra entre 18 y 25?
e) ¿Qué proporción de la población se encuentra entre 25 y 27?
f) ¿Qué proporción de la población se encuentra entre 16 y 18?
g) ¿Qué proporción se encuentra entre 16 y 30?
14) La media de los pesos de 500 estudiantes de la Facultad de Ciencias Administrativas de la UCE
es de 68 kg con una desviación estándar de 2,5 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuantos estudiantes pesan:
a) entre 65 y 68 kg
b) menos de 65 kg
c) más de 65 kg
d) entre 75 y 77 kg
e) menos de 74 kg
f) más de 74 kg
g) entre 65 y 74 kg
119
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Distribución exponencial:
−𝝀𝒙
𝑷(𝒙) = 𝝀 ∗
1
Parámetro de ritmo: 𝜆=
𝑢
120
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Los tiempos de espera para recibir la comida después de hacer el pedido en Pollos LEO siguen una
distribución exponencial con una media de 8 minutos. Calcule la probabilidad de que un cliente
espere:
a) Menos de 7 minutos,
b) Más de 7 minutos,
c) Entre 6 y 7 minutos,
d) ¿Cincuenta por ciento de los clientes espera menos de cuántos segundos? ¿Cuál es la
mediana?
Desarrollo:
e= 2,71828
µ= 8
1
𝜆= 0,1250 parámetro de ritmo
𝑢
a) X= 7
−𝜆𝑥 = -0,88
b) X= 7
−𝜆𝑥 = -0,88
c) X= 6 X= 7
−𝜆𝑥 = -0,75 −𝜆𝑥 = -0,88
121
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejercicios
15) El tiempo de vida de los teléfonos celulares sigue una distribución exponencial con una media
de 45.000 horas. Calcule la probabilidad de que el teléfono celular:
a) Falle en menos de 10.000 horas.
b) Dure más de 45.000 horas.
c) Falle entre 25.000 y 45.000 horas de uso.
d) Encuentre el 90o. percentil. ¿Diez por ciento de los televisores duran más de cuánto
tiempo?
16) El tiempo de vida de una lámpara especial sigue una distribución exponencial con media
de 100 horas.
a) ¿Cuál es la probabilidad de que una lámpara dure por lo menos 30 horas?
b) Si una lámpara ya lleva 50 horas de uso, ¿cuál es la probabilidad de que dure más de 80
horas?
c) Se seleccionan cinco lámparas, ¿Cuál es el número esperado de lámparas que duran por
lo menos 30 hs (considerando las 5)?
122
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
CAPÍTULO 8
8. Números Índice
El índice es una herramienta estadística útil que expresa el cambio relativo de un valor de un período
a otro (Lind , Marchal, & Whaten, 2012, pág. 574). Compara una magnitud en dos situaciones distintas,
una de las cuales se considera como referencia. Se trata de comparar períodos de tiempos distintos,
situación geográfica, ingresos, o cualquier otra característica, expresado como porcentaje, que mide
un periodo dado contra un periodo base determinado.
Un caso de estos es el Índice de precios al consumidor (IPC), que es un indicador mensual, a nivel local
o nacional, que mide los cambios en el tiempo del nivel general de los precios, correspondientes al
consumo final de bienes y servicios de los hogares de estratos de ingreso: alto, medio y bajo, residentes
en el área urbana y rural del país. La variable principal que se investiga es el precio.
Ejemplos:
El precio de una libra de pollo en enero 2022 (pt) es de $ 1,20. En diciembre 2021 el precio (po) fue
de $ 1,00. ¿Cuál es el incremento?
𝑝𝑡 1,20
𝐼𝑠𝑝 = 𝑝𝑜 𝑥 100 𝐼𝑠𝑝 = 1,00 ∗ 100 = 120 → 20% (adicional al 100%)
123
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Determinar el índice de precios de cada artículo, considerando como base el año 2009, con los precios
de 6 artículos de una canasta en dos períodos:
Índice simple Pi
Artículo Precio 2009 (po) Precio 2021 (pt)
(2009 = 100)
Huevos (docena) 0,70 1,20 171,43
Pan (7 unidades) 0,50 1,10 220
Leche (litro) 0,55 0,85 154,54
Queso (libra) 1,00 2,30 230
Arroz (libra) 0,30 0,50 166,67
Total ∑𝑝𝑜 = 3,05 ∑𝑝𝑡 = 5,95 ∑𝑝𝑖 = 942,64
124
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
El aumento de precio mayor afectó al queso en 130% (230 - 100 = 130), y el pan quedó en segundo
lugar, con 120% (220 - 100 = 120).
125
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Interpretación:
a) El precio de las ganancias de SUPERMERCADO LEO en el año 2018 aumento en 128,21%,
respecto al año 2013.
b) Se concluye que cada año va aumentando sus ganancias considerablemente.
Ejemplo:
A continuación, se enumeran las ventas netas de Corporación SALVADOR en el Ecuador, en el período
2013 a 2017. Determine el índice 2013 = 100 y 2016-2017 = 100. ¿En cuánto aumentaron las ventas
netas desde el periodo base?
Interpretación
• Las ventas netas aumentaron en el año 2015 en un 5,06 %, con respecto al año base 2013.
• Las ventas aumentaron 23,76% en el año de 2015, con respecto a los años base (2016-2017).
Estos índices permiten observar cómo es la evolución del costo de vida de un país, entre un:
1. período actual con variables de precios pto y cantidades consumidas qt (ejemplo: enero 2021)
y,
2. un período anterior con variables de precios po y cantidades consumidas qo (ejemplo: enero
2020).
Los métodos que más se utilizan para calcular el índice de precios y cantidades consumidas son el de
Laspeyres y el de Paasche. Sin embargo, existen otros métodos expresados por otros investigadores
como Fisher y Edgeworth.
126
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
La madre de Paola decide salir a comprar algunos artículos de aseo con la misma cantidad de dinero
que salía hace dos años atrás, es decir en el año 2015. El valor es de $30 dólares, y lo que necesita
saber es si puede comprar la misma cantidad de artículos con la misma cantidad de dinero.
2015 2017
Precio Cantidad Precio Cantidad
Artículos po*qo po*qt pt*qo pt*qt
(po) (qo) (pt) (qt)
Detergente 0,80 5 1,20 3 4,00 2,40 6,00 3,60
Des i nfecta nte 2,15 2 3,54 1 4,30 2,15 7,08 3,54
Ja bon a nti ba cteri a l 1,00 3 1,38 2 3,00 2,00 4,14 2,76
Toa l l a 4,75 1 5,80 1 4,75 4,75 5,80 5,80
La va va ji l l a 1,25 2 2,30 1 2,50 1,25 4,60 2,30
Suman 18,55 12,55 27,62 18,00
27,62
𝑰𝑳 = ∗ 100 = 148,89
18,55
Interpretación:
Según el índice de precios de Laspeyres los precios en el mercado han aumentado en 48,49% y la madre
de Paola ya no puede comprar los mismos artículos con los US$ 30,00
127
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ante esta situación se origina la propuesta de Paasche, misma que dedujo que se utilizaría las
cantidades del periodo actual; no obstante, se han presentado algunos inconvenientes, uno de los más
relevantes, es el ponderar para cada año corriente, ya que es algo laborioso y lleva de mucho tiempo
para tener los resultados y poder ser analizado.
∑(𝑝𝑡 ∗ 𝑞𝑡)
𝑰𝑷 = ∗ 100
∑(𝑝𝑜 ∗ 𝑞𝑡)
Mediante este índice ponderado de Paasche, se puede observar los cambios de precios dentro de un
determinado periodo; es decir que nos permitirá conocer la situación actual, sea el caso de que un país
quiere conocer el valor o el costo de la canasta básica, por lo que actualizado sus valores se obtendrá
un porcentaje de incremento o disminución en comparación al año base.
Ejemplo:
En base al ejemplo 5, determinar la variación de precios según Paashe.
18,00
𝑰𝑷 = ∗ 100 = 143,43
12,55
Según Paasche, los precios del 2017 al 2015 variaron en 43,43%.
Comparando los índices de Laspeyres y Paasche en el ejemplo 5 y 6 se tiene que son 48,89% y 43,43%
respectivamente.
Se observa una variación de 5,06%, que puede ser significativa según el caso en análisis, pero cuando
se trata de calcular mensual y anualmente la variación de los índices de precios de un país se pone de
manifiesto el gasto económico que representa.
𝑰𝑭 = √𝐼𝐿 ∗ 𝐼𝑃
Ejemplo:
Tomando los mismos valores de los ejemplos 5 y 6, se determina el índice según Fisher.
𝑰𝑭 = √(48,89 ∗ 43,43)
𝑰𝑭 = 46,07
128
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
En realidad, para calcular este índice, obligatoriamente se deben calcular los otros, lo que implica
utilizar más recursos.
Para el cálculo de este índice se toma en cuenta los precios y cantidades del año base, asimismo, los
precios y cantidades del año actual, solo así se podrá observar los cambios o variaciones entre precios
y cantidades de los dos años.
∑(𝑝𝑡 ∗ 𝑞𝑡)
𝑰𝑽 = ∗ 100
∑(𝑝0 ∗ 𝑞0)
Ejemplo 8:
Aplicando el ejemplo 5, determinar el Índice de Valores.
2015 2017
Precio Cantidad Precio Cantidad
Artículos po*qo po*qt pt*qo pt*qt
(po) (qo) (pt) (qt)
Detergente 0,80 5 1,20 3 4,00 2,40 6,00 3,60
Des i nfecta nte 2,15 2 3,54 1 4,30 2,15 7,08 3,54
Ja bon a nti ba cteri a l 1,00 3 1,38 2 3,00 2,00 4,14 2,76
Toa l l a 4,75 1 5,80 1 4,75 4,75 5,80 5,80
La va va ji l l a 1,25 2 2,30 1 2,50 1,25 4,60 2,30
Suman 18,55 12,55 27,62 18,00
18,00
𝑰𝑽 = ∗ 100
18,55
𝑰𝑽 = 97,03
Los precios y cantidades del año 2017 han decrecido en 3% respecto al año 2015
129
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
El IPC permite medir la variación de precios en el tiempo de una canasta de bienes y servicios
representativos del consumo nacional de los hogares. Dicha variación se conoce como
inflación. El IPC tiene un uso generalizado como factor de ajuste para los valores monetarios
de ciertos pagos como: salarios, prestaciones sociales, rentas de viviendas, intereses,
impuestos, valor del capital de activos y pasivos monetarios, etc. Además, el IPC constituye
un insumo directo en la elaboración de las cuentas nacionales (por su influencia en el
deflactor del gasto de consumo de los hogares) y por tanto, es una variable macroeconómica
de monitoreo continuo por su reconocida relevancia económica, social, jurídica y política.
En el IPC, la variable principal que se investiga es el “precio de comprador”, para una canasta
fija de 359 productos, seleccionados por su frecuencia y relevancia en la estructura del gasto
familiar de la Encuesta Nacional de Ingresos y Gastos de los Hogares Urbanos y Rurales
(ENIGHUR) del periodo abril 2011 – marzo 2012.
El año base del IPC es el 2014. Actualización metodológica que contó con el acompañamiento
técnico de la Comisión Económica para América Latina y el Caribe (CEPAL). Para mayor
detalle de la metodología del IPC (http://www.ecuadorencifras.gob.ec//indice-de-precios-al-
consumidor/).
El principal objetivo de esta operación estadística es generar el indicador económico que
permite calcular la inflación del país, a través de una recopilación mensual de precios al
consumidor final urbano.
El proceso de captación de precios se realiza directamente en los establecimientos
económicos y viviendas alquiladas del área urbana de las ciudades con mayor representación
demográfica y en el gasto de consumo: Quito, Ambato, Cuenca, Loja, Guayaquil, Esmeraldas,
Machala, Manta y Santo Domingo de los Colorados; en donde se indaga el precio de contado
que pagan los consumidores al momento de adquirir un bien o servicio, incluyendo el pago
por concepto de impuestos que gravan al consumo como el Impuesto al Valor Agregado
(IVA), o el Impuesto a los Consumos Especiales (ICE) (SCN 2008).
La investigación mensual de precios se realiza en aproximadamente 5.276 establecimientos
económicos y 3.942 viviendas alquiladas (casa, departamento o pieza) del área urbana, en 9
ciudades auto representadas.
El cambio de año base del IPC (Base: 2014=100), tiene como finalidad actualizar la estructura
de consumo de los hogares ecuatorianos.
Con fines académicos, se ha copiado la evolución del IPC del mes de marzo 2023.
https://www.ecuadorencifras.gob.ec Boletín Técnico 03-2023 IPC
130
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Como resumen de esta tabla se observa que el IPC en marzo 2023 es de 110,45 en comparación a
marzo 2022 que fue de 107,39. Se observa una variación de 3,06%.
La inflación anual en marzo 2023 es de 2,85% mientras que el año pasado fue de 2,64%. Variación de
0,21%.
Estos son breves datos informativos observados en el mes de marzo 2023. Para tener más información,
se debe acudir a investigar en los boletines técnicos que el INEC publica mensualmente.
Ejemplo:
IPC marzo 2023 = 110,45
1
𝑃𝑜𝑑𝑒𝑟 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑ó𝑙𝑎𝑟 = = 90,54 𝑐𝑡𝑣𝑠
110,45
131
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Ejemplo:
Salario básico 2023 = 450,00
IPC marzo 2023 = 110,45
450
𝐼𝑅𝑀 = 𝑥 100 = 407,42 dólares
110,45
Interpretación: En marzo 2023, el salario básico tiene un valor real de 407,42 dólares, mientras que en
marzo 2022 fue de 395,73 dólares.
El salario básico nominal subió en 25 dólares mientras que el incremento real por efecto del IPC es de
11,69 dólares.
132
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
133
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Referencias bibliográficas
Ditutor. (2015). www.ditutor.com. Obtenido de
http://www.ditutor.com/estadistica/medidas_posicion.html
Lind , D., Marchal, W., & Whaten, S. (2012). Estadística aplicada a los negocios y la economía (Decima
quinta ed.). México, DF, México: Mc Graw Hill.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadística aplicada a los negocios y la economía. México:
McGRAW-HILL.
Webster, A. (2000). Estadística aplicada a los negocios y la economía. Santa Fe de Bogotá: Mc Graw
Hill.
134
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
Z= 2,52
área p = 0,4941
=ABS(DISTR.NORM.ESTAND.N(Z;1)-0,5)
área p = 0,4929
Z= 2,452
=ABS(INV.NORM.ESTAND(0,5-E43))
135
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
136
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
137
Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.
_________________________________________________________________________________________
138