Estadística Descriptiva y Probabilidades 2da Edición Mayo 2023

Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)
Autor: Ing. Leonardo Salvador Pérez, MSc.

_________________________________________________________________________________________
ESTADÍSTICA DESCRIPTIVA
Y PROBABILIDADES
Segunda edición
Guía didáctica de aprendizaje
Leonardo Salvador Pérez
mayo 2023
1
_________________________________________________________________________________________
El autor:
Salvador Pérez Leonardo Patricio
Correo-e: leosalvador54@hotmail.com
Magister en Auditoría de Gestión de la Calidad,
Magister en Gerencia de Proyectos Sociales y Educativos
Ingeniero Comercial,
Docente de Pregrado y Posgrado de la Facultad de Ciencias Administrativas de la Universidad
Central del Ecuador
Docente de Pregrado de la Universidad Politécnica Salesiana.
2
_________________________________________________________________________________________
ESTADÍSTICA DESCRIPTIVA Y PROBABILIDADES
Segunda edición
Quito, Ecuador
mayo 2023
ISBN: 978-9942-44-481-3
Editorial: LEOSalvador
Primera edición
Quito, Ecuador
noviembre 2022
ISBN: 978-9942-42-822-6
Editorial: LEOSalvador
Prohibida la reproducción total o parcial de esta obra, por cualquier medio, sin la
autorización escrita del autor.
3
_________________________________________________________________________________________
Dedicatoria
Para Lucía Margoth, mi esposa y mejor amiga, nuestros hijos y nietos:
Verónica Joselyn, Lucía Carolina y Leonardo Patricio; Ana Paula, Karla
Kamila, María Alejandra, Isabela Valentina y Leonardo Josué.
A mis hermanos, sobrinos y más familiares.
Leonardo Salvador Pérez
4
_________________________________________________________________________________________
Tabla de contenido
1.1 Definición de estadística ...................................................................................................... 8
1.2 Tipos de estadística ............................................................................................................. 9
1.2.1 Estadística descriptiva ......................................................................................................... 9
1.2.2 Estadística inferencial........................................................................................................... 9
1.3 Variables ............................................................................................................................. 10
1.3.1 Variable cualitativa............................................................................................................. 10
1.3.2 Variable cuantitativa ......................................................................................................... 10
1.4 Niveles de medición .......................................................................................................... 11
1.4.1 Datos de nivel nominal...................................................................................................... 11
1.4.2 Datos de nivel ordinal ....................................................................................................... 11
1.4.3 Datos de nivel de intervalo ............................................................................................... 11
1.4.4 Datos de nivel de razón ..................................................................................................... 12
CAPÍTULO 2 ....................................................................................................................................... 13
2.1 Tablas de frecuencias ......................................................................................................... 13
2.2 Distribución de frecuencias ................................................................................................ 17
2.2.1 Número de clases ............................................................................................................... 18
2.3 Representación gráfica de distribución de frecuencias .................................................... 22
CAPÍTULO 3 ....................................................................................................................................... 28
3. Medidas de tendencia central ................................................................................................ 28
3.1 Medidas de ubicación ........................................................................................................ 28
3.1.1 Media aritmética ................................................................................................................ 28
3.1.2 Propiedades de la media aritmética .................................................................................. 30
3.1.4 Mediana de datos no agrupados ....................................................................................... 33
3.1.6 Moda de datos no agrupados ............................................................................................ 37
3.1.8 Posiciones relativas de la media, mediana y moda .......................................................... 39
3.1.9 Media geométrica .............................................................................................................. 41
3.2 Medidas de dispersión ....................................................................................................... 46
3.2.1 Rango .................................................................................................................................. 47
3.2.2 Desviación media ............................................................................................................... 47
3.2.3 Varianza y desviación estándar ......................................................................................... 50
3.2.4 Interpretación y usos de la desviación estándar ............................................................... 54
3.2.5 Media aritmética y desviación estándar de datos agrupados .......................................... 59
CAPÍTULO 4 ....................................................................................................................................... 62
4.1 Otras medidas de posición ................................................................................................. 62
5
_________________________________________________________________________________________
4.1.1 Diagrama de caja ................................................................................................................ 66

4.1.2 Datos atípicos ..................................................................................................................... 68
4.2 Medidas de forma .............................................................................................................. 69
4.2.1 Asimetría............................................................................................................................. 69
4.2.2 Curtosis ............................................................................................................................... 72
CAPÍTULO 5 ....................................................................................................................................... 75
5.1 Introducción a las probabilidades...................................................................................... 75
5.1.1 Enfoques de probabilidad .................................................................................................. 76
5.1.2 Reglas para calcular probabilidades .................................................................................. 77
5.1.3 Tablas de contingencia ....................................................................................................... 82
5.1.4 Diagrama de árbol .............................................................................................................. 84
5.1.6 Técnicas de conteo ............................................................................................................. 89
CAPÍTULO 6 ....................................................................................................................................... 96
6. Distribuciones de probabilidad discreta ................................................................................ 96
6.1. Distribución probabilística discreta ................................................................................... 96
6.1.1 Variable aleatoria ............................................................................................................... 96
6.2 Distribución de probabilidad binomial ............................................................................ 100
6.3 Distribución hipergeométrica .......................................................................................... 104
6.4 Distribución de Poisson .................................................................................................... 106
CAPÍTULO 7 ......................................................................................................................................... 109
7. Distribuciones de probabilidad continua.............................................................................. 109
7.1 Distribuciones de probabilidad uniforme ........................................................................ 109
7.2 Distribución de probabilidad normal ............................................................................... 112
7.2.1 Distribución de probabilidad normal estándar ............................................................... 113
7.2.2 Distribuciones exponenciales ......................................................................................... 120
CAPÍTULO 8 ..................................................................................................................................... 123
8. Números Índice ...................................................................................................................... 123
8.1.1 Índices no ponderados ..................................................................................................... 124
8.1.2 Índices ponderados .......................................................................................................... 126
8.1.3 Índice de valores............................................................................................................... 129
8.1.5 Índices para propósitos especiales .................................................................................. 132
8.1.6 Cálculo de la canasta básica familiar (CBF)...................................................................... 132
Referencias bibliográficas................................................................................................................... 134
Tabla B2: Distribución T de Student (continuación) .......................................................................... 137
Tabla B6: Tabla de números aleatorios.............................................................................................. 138
6
_________________________________________________________________________________________
7
_________________________________________________________________________________________
CAPÍTULO 1
1. Introducción
La estadística descriptiva es una rama de la estadística que se encarga de recopilar, organizar, resumir
y presentar los datos observados de manera comprensible, resumiendo las características de los
conjuntos de datos. No realiza generalizaciones o inferencias.
Las técnicas estadísticas se aplican de manera amplia en administración, mercadotecnia,
contabilidad, economía, sociología, control de calidad, entre otros. En los negocios cotidianos, las
compras del ama de casa en el mercado, el volumen de ventas del almacén TIA en las épocas de
navidad, el volumen de compras de mercadería de la Corporación Favorita para el mes de febrero, etc.,
y así un sin número de actividades en donde se necesite trabajar con un registro de datos.
¿Por qué estudiar estadística?

Por qué permite realizar un análisis comparativo e interpretativo de datos que servirán para la toma
de decisiones y de esta manera determinar los cambios o variaciones que se dan en cualquier ámbito
de estudio.
Por medio de la recopilación de datos obtenidos en la muestra, podremos interpretar de mejor
manera la información para solucionar un problema.
1.1 Definición de estadística

Cuando se habla de estadística, las personas rápidamente se imaginan estar ante una colección de
datos, tales como la estatura y peso de personas, el promedio de calificaciones de los estudiantes de
Administración, número de partidos ganados por la LDU, cantidad de accidentes de autos, número de
personas contagiadas por el COVID 19, número de personas fallecidas por el COVID 19, etc.
Spiegel & Stephens (2009) definen que “La estadística se ocupa de los métodos científicos que
se utilizan para recolectar, organizar, resumir, presentar y analizar datos, así como para obtener
conclusiones válidas y tomar decisiones razonables con base en este análisis” (pág. 1).
Coincidiendo con los autores antes mencionados, Lind, Marchal & Whaten (2012) definen que
la estadística es la “Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar una toma de decisiones más eficaz” (pág. 5).
La información generalmente se presenta en gráficos donde se visualiza y deduce rápidamente
los resultados de los análisis.
Ética y estadística
Dado que la estadística trabaja con datos, es muy importante que las personas involucradas en todas
las fases donde se recogen organizan, presentan, analizan, interpretan resultados, y finalmente se
informa a la sociedad, en cualquier ámbito, sean íntegros y honestos, de conducta y moral intachable
8
_________________________________________________________________________________________
para no sesgar los resultados, esto quiere decir que debe imperar la ética en el proceder de la
aplicación de la estadística.
Ejemplo: en el caso de la pandemia del COVID 19, las autoridades de la Salud deben informar con
exactitud el número de personas contagiadas y de defunciones, para que la población esté informada
con datos verdaderos.
1.2 Tipos de estadística

La estadística se divide en dos categorías: descriptiva e inferencial.
1.2.1 Estadística descriptiva

Se ocupa de describir y analizar la información de una población.
Una definición de estadística descriptiva señala que son los “(…) Métodos para organizar,
resumir y presentar datos de manera informativa” (Lind , Marchal, & Whaten, 2012, pág. 6).
Ejemplos: a) Número de habitantes del Ecuador establecido mediante un censo; b) el número de
enfermos con COVID 19; c) el número de fallecidos con COVID 19; d) volumen de ventas de la empresa
Movistar durante el año 2021; e) El número de estudiantes de estadística en la Carrera de
Administración de Empresas.
1.2.2 Estadística inferencial

Técnica que analiza determinadas características de una muestra para posteriormente deducir o inferir
sobre la población investigada.
Lind, Marchal, & Whaten (2012) definen a la estadística inferencial como los “(…) Métodos que
se emplean para determinar una propiedad de una población con base en la información de una
muestra de ella” (pág. 7).
Ejemplo: a) Una persona tiene mareos y el médico en base a una muestra de sangre puede determinar
si tiene el colesterol elevado; b) Para probar la resistencia de los vidrios de seguridad que una fábrica
está produciendo, se somete a prueba hasta la rotura de una muestra de vidrios y de allí se deduce
cual es la resistencia de toda la producción.
Población
Es el conjunto universo de personas, cosas u objetos que se van a estudiar en su totalidad.
Ejemplo: La población de estudiantes de la Universidad Central del Ecuador.
Muestra
Parte de la población que se quiere estudiar.
9
_________________________________________________________________________________________
Ejemplo: Los estudiantes de la Facultad de Ciencias Administrativas.
1.3 Variables
La variable es una característica de una población o muestra que se está observando. (Webster,
2000, pág. 9).
Existen dos tipos de variables: cualitativas y cuantitativas.
1.3.1 Variable cualitativa

Su característica es que no se expresan numéricamente. Detallan cualidades de un objeto, persona,
problema.
Ejemplos: frutas, color de ojos, alto o bajo, color de autos, etc.
1.3.2 Variable cuantitativa

Se expresan en forma numérica y se dividen en discretas y continuas.
Variable discreta
Se expresan en números enteros como la edad, el número de unidades vendidas, etc.
Ejemplos: número de autos en Quito; número de hijos; número de personas contagiadas por COVID
19, etc.
Variable continua
Se expresan en números decimales y enteros y son el resultado de mediciones. Se expresan con
números decimales o con fracciones.
Ejemplos: estatura de las personas (se mide con un flexómetro); las calificaciones de los estudiantes
(se mide con las evaluaciones); la temperatura ambiente (se mide con termómetro), etc.
10
_________________________________________________________________________________________
Figura 1. Resumen de los tipos de variables.
1.4 Niveles de medición

El resumen y presentación de los datos estadísticos se expresan a través de cuatro niveles de medición:
1.4.1 Datos de nivel nominal

Son observaciones de variables cualitativas, donde los resultados se clasifican y se cuentan, no
necesitan un orden al momento de expresar los resultados. Al aplicar la variable de interés se divide
en categorías o resultados. (Lind , Marchal, & Whaten, 2012, pág. 10).
Ejemplo: En el curso AP 3-1 se tienen 23 mujeres y 21 hombres.
1.4.2 Datos de nivel ordinal

Los resultados se clasifican y ordenan.
Ejemplo: a) en las calificaciones se tiene: excelente, muy bueno, bueno, regular; b) en la estatura: alto,
medio, bajo, etc.
1.4.3 Datos de nivel de intervalo

Considera todas las características del nivel ordinal, pero la diferencia entre valores constituye una
magnitud constante. Los resultados se ordenan de acuerdo con el grado de la característica analizada.
Ejemplo: La talla de ropa: 8 – 10 – 12 - 14. La diferencia de 2” (2 pulgadas), es constante en los números
por talla. (S – M – L – XL- XXL).
El intervalo es una cantidad entre dos límites, uno superior y otro inferior y se convierte en un valor
constante.
11
_________________________________________________________________________________________
Ejemplo: el intervalo de edades entre 10 y 60 años clasificados cada 10 años presenta 6 clases de 10
años.
1.4.4 Datos de nivel de razón

Los resultados se expresan comparando valores. Expresan cuanto más grande o pequeño es un valor
en relación con otro.
Ejemplo: Juan tiene 40 años y Luis tiene 20 años, entonces, Juan tiene el doble de edad que Luis.
Posee todas las características del nivel de intervalo, pero considera que el punto 0 tiene
sentido y la razón entre dos números es significativa. Las propiedades son:
3. La clasificación de datos se ordena de acuerdo con la cantidad de características que poseen.
4. Diferencias iguales en la característica representan diferencias iguales en los números
asignados a las clasificaciones.
5. El punto cero representa la ausencia de características y la razón entre dos números es
significativa (Lind , Marchal, & Whaten, 2012, pág. 13).
Figura 2. Resumen de niveles de medición.
12
_________________________________________________________________________________________
CAPÍTULO 2
2.1 Tablas de frecuencias

Es muy importante considerar que se trabaja con varias variables cualitativas.
La recolección de datos se realiza aplicando encuestas para determinar preferencias en
determinados productos y servicios. Ejemplo: el sabor de yogurt, la marca de celulares, la preferencia
de candidatos en elecciones, etc.
La sola recolección de datos registrados en el papel poco o nada revelan por si solos, por lo
que es indispensable que sean organizados de manera concisa para determinar su significancia y se
pueda ver a simple vista que es lo que nos dicen.
Se consideran datos cualitativos que se agrupan en clases mutuamente excluyentes que
contienen el número de observaciones en cada clase. (Lind , Marchal, & Whaten, 2012, pág. 23).
En este caso, las variables cualitativas se clasifican en diferentes categorías o clases, sin
establecer un orden particular.
Es imprescindible que las categorías pertenezcan a un mismo grupo o sector. Es más sencillo
trabajar con los datos cualitativos.
Tabla 1. Ejemplo 1 de tabla de frecuencias

Número de autos
Porcentaje de autos
Categoría: Ciudades Toyota vendidos en
vendidos
enero 2021
Variable frecuencia absoluta frecuencia relativa
Quito 140 140/520 *100 =26,92%
Guayaquil 200 38,46%
Cuenca 180 34,62%
Total 520 100,00%
Observando el ejemplo, las variables son las ciudades y no necesitan un orden específico, en ellas se
han vendido cierto número de autos, que se denomina frecuencia absoluta. Para hacer un informe
de ventas, es necesario expresar en porcentaje las ventas y estos valores se denominan frecuencia
relativa.
Para calcular la frecuencia relativa solamente debe dividir cada frecuencia absoluta para el
total y se multiplica por 100, y al final la suma debe ser siempre 100%.
La información obtenida de la tabla de frecuencias se expresa estadísticamente en forma
gráfica a través de un diagrama de barras o circular (pastel).
13
_________________________________________________________________________________________
Representación gráfica con diagramas de barras
Número de autos vendidos

(frecuencia absoluta)
250 200
180
Autos vendidos
200
140
150
100
50
0
Quito Guayaquil Cuenca
Ciudad
Figura 3. Histograma de frecuencias absolutas

(frecuencia relativa)
50,00%
38,46%
40,00% 34,62%
Autos vendidos
26,92%
30,00%
20,00%
10,00%
0,00%
Quito Guayaquil Cuenca
Ciudad
Figura 4. Histograma de frecuencias relativas
Representación gráfica con diagrama circular: pastel

Cuenca; 180 Quito; 140
Guayaquil;
200
Figura 5. Representación gráfica circular frecuencias absolutas
14
_________________________________________________________________________________________

(frecuencia relativa)
Quito;
Cuenca; 26,92%
34,62%
Guayaquil;
38,46%
Figura 6. Representación gráfica circular frecuencias relativas
Ejemplo:
Una empresa de turismo realizó una encuesta a una muestra de 900 residentes de la ciudad de
Sangolquí, para saber que estación del año preferían. Los resultados obtenidos fueron los siguientes:
a 100 les gusta el invierno, a 400 la primavera, a 300 el verano y a 100 el otoño. Se desea resumir los
datos en una tabla de frecuencias.
Tabla 2. Ejemplo 2 de tabla de frecuencias

Frecuencia Frecuencia relativa
Variable (Clases)
absoluta %
Invierno 100 100/900 = 11%
Primavera 400 44%
Verano 300 33%
Otoño 100 11%
Total 900 100%
Estaciones climaticas
100 100 Invierno
Primavera
300 Verano
400
Otoño
Figura 7. Representación gráfica circular frecuencias absolutas
15
_________________________________________________________________________________________
Interpretación:
De las 900 personas entrevistadas, 400 prefieren la primavera; 300 prefieren el verano, mientras que
el invierno y el otoño son preferidos por 100 personas respectivamente.
Frecuencias relativas
Otoño; 11% Invierno; 11%
Verano; 33%
Primavera;
44%
Figura 8. Representación gráfica circular frecuencias relativas
Interpretación:
De las 900 personas entrevistadas se observa que el 44% (400 personas) prefieren la primavera, el 33%
(300 personas) prefieren el verano, mientras que el invierno y el otoño son preferidos por 11% (100
personas) respectivamente.
Ejercicios
En los siguientes ejercicios, elabore una tabla de frecuencias, grafique y elabore un informe de lo
observado (interpretación de los resultados):
1) En la ciudad de Quito, en el sector del mercado Santa Clara, el lunes 1 de junio 2021 se han
vendido la siguiente cantidad de gaseosas en envases de 1 litro: Coca Cola 500 unidades, Pepsi
Cola 400, Fruit 200, Orangine 150.
2) En la ciudad de Sangolquí, en la frutería “La papaya sabrosa” el martes 4 de mayo del 2022 se
ha vendido la siguiente cantidad de frutas, en unidades: piñas 100; papayas 50; cocos 25;
guanábanas 14.
3) Para producir yogurt, el gerente de "Lechera la Vaquita" realiza una encuesta a 1,500 personas
para conocer la preferencia de sabores y los resultados fueron los siguientes: mora 450; fresa
350; granadilla 220; banano 180; tamarindo 300. Con esta información, la empresa se propone
producir 3,000 litros por semana. ¿Cuántos litros de cada sabor deberán producir?
4) En la ciudad de Quito, sector La Magdalena, en la frutería de la señora Rosita el martes 4 de
mayo del 2022 se ha vendido la siguiente cantidad de frutas, en unidades: piñas 100; papayas
50; cocos 25; guanábanas 14.
16
_________________________________________________________________________________________
5) Una fábrica de estuches de teléfonos celulares planifica producir 3,000 unidades y desea saber
que cantidades deberá producir de cada color; previamente realiza una encuesta a un grupo de
estudiantes para que elijan su color favorito y los resultados fueron los siguientes:
color blanco negro naranja verde amarillo rojo azul
preferencia 100 50 25 45 26 35 49
6) Un concesionario de venta de autos Toyota ha vendido las siguientes cantidades en el segundo

semestre de 2022 en 5 ciudades del país:
ciudad Quito Cuenca Guayaquil Manta Ambato
frecuencia 100 50 25 45 26
2.2 Distribución de frecuencias

Se trabaja con una sola variable cuantitativa.
Al construir una distribución de frecuencias los datos de la variable considerada se agrupan en
clases, de acuerdo con las necesidades de la investigación.
Las clases definidas tienen una distribución de frecuencias, lo que se denomina datos
agrupados.
La distribución de frecuencias es la “Agrupación de datos en clases mutuamente excluyentes,
que muestra el número de observaciones que hay en cada clase” (Lind , Marchal, & Whaten, 2012,
pág. 29).
Tabla 3. Variable: calificaciones de evaluaciones de estudiantes
13 16 16 14
17 17 12 14
16 19 16 15
17 11 20 15
Tabla 4. Organización de datos para realizar distribución de frecuencias
Número de datos = 16
Valor máximo = 20
Valor mínimo = 11
Rango 9
N° clases = K 4
Intervalo 2,25 → 3
17
_________________________________________________________________________________________
2.2.1 Número de clases

Para desarrollar una distribución de frecuencias, se deben considerar los siguientes pasos:
1) Establecer el número de datos
2) Determinar el valor máximo y valor mínimo del conjunto de datos recolectados.
3) Definir el rango = valor máximo menos el valor mínimo.
4) Determinar el número de clases o categorías (k) presentes en el conjunto de datos, utilizando
la Regla: 𝟐𝒌 ≥ 𝒏. El dígito “2” es un valor constante que no será cambiado por ninguna
circunstancia; n = número de datos.
5) Calcular el intervalo (i) que es el espacio que habrá entre dos valores del conjunto de datos.
Para obtener el intervalo i se divide el rango (valor máximo – valor mínimo) para el número
de clases k.
Se recomienda:
a) Si el conjunto de datos contiene solo números enteros, se recomienda que el intervalo
siempre sea el número entero siguiente a la fracción resultante, sin importar si los
decimales son menores a 0,5 (ejemplo: i = 2,1 - 2,3 – 2,6 – 2,8 → i = 3).
b) Si el conjunto de datos contiene valores con decimas y centésimas, el intervalo deberá ser
aproximado a la décima o centésima más alta (ejemplo: 3,47 ---→ 3,5).
El profesional Administrador o Estadístico también puede escoger el intervalo a utilizar como se verá
más adelante.
También se puede calcular el número de clases k utilizando la Regla de Sturges:
K = 1 + 3,33 log (n)

n = número de datos
log = logaritmo base 10
Nota: ¡¡ Es decisión del profesional Administrador o Estadístico utilizar la metodología que mejor
considere para calcular el valor k!!
En el desarrollo de este libro, se aplicará la regla de 𝟐𝒌 ≥𝒏
Ejemplo 1:
Determine cuantas clases o categorías serán necesarias para la distribución de frecuencias, en los
siguientes casos: a) n = 45
Constante k 2^k
2^ 2 4
2^ 3 8
2^ 4…5 16 … 32
2^ 6 64
18
_________________________________________________________________________________________
64 es mayor que 45, por lo tanto, se utilizarán 6 clases o categorías en la distribución de frecuencias.
Aplicando la Regla de Sturges:
K = 1 + 3,33 * log 45 → K = 6,51 → K = 7
b) n = 250
2k  n → 28 = 256 mayor que 250 → k = 8
Aplicando la Regla de Sturges:

K = 1 + 3,33 * log 250 → K = 8,99 → K = 9
Cuando no se dispone de una calculadora a la mano, es facil aplicar la Regla de 𝟐𝒌 ≥ 𝒏.

En el desarrollo de la asignatura se aplicará esta Regla.
Ejemplo 2:
En un conjunto de datos se tienen 230 observaciones entre 135 y 321. Determinar el intervalo
conveniente.
N° datos = 230
V max = 321
V min = 135
Rango = 186
N° clases = K → 2k = 8
Intervalo = 23,25
Intervalo adoptado = 24
Ejemplo 3:
En un conjunto de datos se tienen 115 observaciones entre 16,35 y 45,24. Determinar el intervalo
conveniente.
N° datos = 115
V Max = 45,24
V min = 16,35
Rango = 28,89
N° clases = K = 7
Intervalo = 4,13
Intervalo adoptado= 4,20
19
_________________________________________________________________________________________
Ejemplo 4:
Las siguientes son las calificaciones de 30 estudiantes de estadística en un curso de la Carrera de
Administración de Empresas. Organice los datos en una distribución de frecuencias.
13 16 15 16 14 14 17 13
17 17 16 12 14 12 17 16
13 13 16 14 17 19 14 16
15 17 11 16 20 15
Utilizando la Regla de 𝟐𝒌 ≥𝒏 se tienen 5 clases, y con esto un intervalo de 1,8 -→ i = 2
N° datos = 30
Vmáx = 20
Vmín = 11
Rango = 9
N° clases = K = 5
1,80
Intervalo =
2,00
ojiva menor que ojiva mayor que

N° clases punto frec_abs_acu frec_abs_acu frec_rel_acu
Li Ls frec_absol frec_relat frec_rel_acum
K medio m m m
1 11 13 12 7 23,33% 7 23,3% 30 100,0%
2 13 15 14 8 26,67% 15 50,0% 23 76,7%
3 15 17 16 13 43,33% 28 93,3% 15 50,0%
4 17 19 18 1 3,33% 29 96,7% 2 6,7%
5 19 21 20 1 3,33% 30 100,0% 1 3,3%
Suma 30 100,0%
Se aplicaron las funciones que proporciona el software del Excel:

1) CONTAR
2) MAXIMO
3) MINIMO
4) FRECUENCIA
20
_________________________________________________________________________________________
Tabla 5. Representación de cálculos con funciones Excel
Notas:
• Los valores de punto medio pueden tener decimales y se recomienda trabajar con 2 cifras
decimales.
• Para los valores de las frecuencias relativas parciales y acumuladas es recomendable trabajar
con dos cifras decimales.
Procedimiento:
a) El valor del límite inferior en la primera clase será el valor mínimo del conjunto de datos, o el
valor que el profesional escoja, siempre que sea menor al valor mínimo.
b) El límite superior es el límite inferior más el intervalo seleccionado. En este caso es 2.
c) El siguiente límite inferior es el límite superior anterior. Y nuevamente se suma el intervalo.
d) El punto medio es el promedio o media aritmética entre los límites inferior y superior en cada
clase.
e) La frecuencia absoluta es el conteo de datos que se encuentran en el intervalo (límites
señalados en las clases). Si hay uno o varios datos iguales a los del límite superior de la clase
analizada, estos se contarán en esta clase y en la siguiente clase ya no serán tomados en cuenta
21
_________________________________________________________________________________________
(criterio de mutuamente excluyente). Al trabajar de esta manera se puede comprobar usando

el Excel.
f) La frecuencia absoluta acumulada es la suma sucesiva de las frecuencias parciales de cada
clase. (Clase 1: 7; clase 2: 7+ 8 = 15; etc.)
g) La frecuencia relativa es el porcentaje que representa cada una de las frecuencias absolutas
dividido para el total de datos. (Clase 1: 7/30*100 = 23,3%; clase 2: 8/30*100 = 26.7%; clase 3:
13/30*100 = 43,3%; etc.)
h) La frecuencia acumulada, tanto absoluta como relativa, es de dos tipos: “ojiva menor que”
(inicia con la menor frecuencia y va ascendiendo) y “ojiva mayor que” (inicia con el total de
frecuencias y va descendiendo).
Este es un caso sencillo trabajado con calificaciones de estudiantes. De la misma manera se puede
trabajar con datos obtenidos en ventas de productos, en compras, en rentabilidades de las empresas,
etc.
2.3 Representación gráfica de distribución de frecuencias

Los datos obtenidos a través de la distribución de frecuencias se pueden mostrar de manera más
expresiva a través de gráficos estadísticos, donde se pueden visualizar de mejor manera las
características de la variable observada.
El gráfico más común de utilizar es el diagrama de barras, más conocido como “histograma de
frecuencias” que pueden ser absolutas o relativas.
En el diagrama de barras, en el eje horizontal (eje X) se colocan las clases con sus límites y en
el eje vertical (eje Y) se colocan los valores de las frecuencias.
Cada barra representa una clase.
Gráficas de frecuencias parciales
frec_absol
15 13
frecuencia
10 7 8
5
1 1
0
13 15 17 19 21
11 13 15 17 19
calificaciones
Figura 9. Representación gráfica histograma de frecuencias absolutas
22
_________________________________________________________________________________________
Interpretación:
Con calificaciones de 16 a 20 se encuentran 15 (13 + 1 + 1) estudiantes, así como 15 (7 + 8) estudiantes
tiene entre 11 y 15 puntos.
frec_relat
50,00% 43,33%
40,00%
frecuencia
30,00% 23,33% 26,67%
20,00%
10,00% 3,33% 3,33%
0,00%
13 15 17 19 21
11 13 15 17 19
calificaciones
Figura 10. Representación gráfica histograma de frecuencias relativas
Interpretación:
Con calificaciones de 16 a 20 se encuentran 50% (43,3% + 3,3% + 3,3%%) de los estudiantes, mientras
que el otro 50% tienen entre 11 y 15 puntos.
Gráficos de frecuencias acumuladas

Otro gráfico comúnmente utilizado es el polígono de frecuencias, donde se trabaja con los valores de
los puntos medios (promedio de los límites inferior y superior) en el eje horizontal.
frec_abs_acum "ojiva menor que"

40
30 30
frecuencia
28 29
20
15
10
7
0
12 14 16 18 20
calificaciones
Figura 11. Representación gráfica polígono de frecuencias absolutas acumuladas (ojiva menor que)
23
_________________________________________________________________________________________
frec_rel_acum "ojiva menor que"

150,0%
frecuencia
100,0% 93,3% 96,7% 100,0%
50,0% 50,0%
23,3%
0,0%
12 14 16 18 20
calificaciones
Figura 12. Representación gráfica polígono de frecuencias relativas acumuladas (ojiva menor que)
frec_abs_acum "ojiva mayor que"

40
30
frecuencia
30
20 23
15
10
0 2 1
12 14 16 18 20
calificaciones
Figura 13. Representación gráfica polígono de frecuencias absolutas acumuladas (ojiva mayor que)
frec_rel_acum "ojiva mayor que"

150,0%
frecuencia
100,0% 100,0%
76,7%
50,0% 50,0%
0,0% 6,7% 3,3%

12 14 16 18 20
calificaciones
Figura 14. Representación gráfica polígono de frecuencias relativas acumuladas (ojiva menor que)
Las interpretaciones se hacen de acuerdo con lo que se observa y se quiere informar.
Interpretación:
a) De los 30 estudiantes, 13 tienen calificaciones entre 15 y 17, que representan el 43,33% del
total del curso.
b) Quince estudiantes tienen calificaciones entre 11 y 15, que representa el 50%, mientras el otro
50% tienen calificaciones entre 16 y 20.
Con los resultados obtenidos se puede tomar decisiones. En este caso se observa que apenas un 50%
de estudiantes tiene buenas calificaciones y para el docente es importante que este porcentaje sea
24
_________________________________________________________________________________________
mayor, por lo tanto, deberá implementar una nueva estrategia de enseñanza para que los estudiantes
mejoren las calificaciones.
Casos particulares:
Es posible que el cliente, el jefe departamental, el gerente de producción, el profesor le pida construir
una distribución de frecuencias con datos predeterminados, como, por ejemplo, iniciando con un valor
específico que deberá ser inferior al valor mínimo del conjunto de datos.
Igualmente, el intervalo también puede ser un valor escogido.
En estos casos, ya no se utiliza la regla para calcular el número de clases a través de la expresión 𝟐𝒌 ≥
𝒏 y luego el intervalo.
Ejemplo 5:
Con las calificaciones del ejemplo 4:
13 16 15 16 14 14 17 13
17 17 16 12 14 12 17 16
13 13 16 14 17 19 14 16
15 17 11 16 20 15
a) Construya una distribución de frecuencias iniciando con 10 como límite inferior de la primera
clase y un intervalo de clase de 3.
b) ¿Dónde tienden a acumularse los datos?
Valores
N° datos = 20 predetermin
ados
Vmáx = 20
Vmín = 11 10
Rango = 9
N° clases = K = 5
1,8
Intervalo =
2,00 3,00
ojiva menor que ojiva mayor que

frec_abs_ac frec_rel_acu frec_abs_acu
N° clases frec_rel_acum
Li Ls punto medio frec_absol frec_relat um "ojiva m "ojiva m "ojiva
K "ojiva mayor que"
menor que" menor que" mayor que"
1 10 13 12 5 25,00% 5 25,0% 20 100,0%

2 13 16 14,5 10 50,00% 15 75,0% 15 75,0%
3 16 19 17,5 4 20,00% 19 95,0% 5 25,0%
4 19 22 20,5 1 5,00% 20 100,0% 1 5,0%
Suma 20 100,0%
Comparando con los resultados del ejemplo 4, se observa que las frecuencias variaron y por
consiguiente los gráficos y las interpretaciones.
25
_________________________________________________________________________________________
Ejercicios
7) Se dispone de un conjunto de datos con 54 observaciones. ¿Cuántas clases recomendaría para la
distribución de frecuencias?
8) Un conjunto de datos contiene 65 observaciones que se van a organizar en una distribución de

frecuencias. El valor más bajo es 15 y el más alto es 90. ¿Qué intervalo de clase recomendaría?
9) Un conjunto de datos contiene 46 observaciones. El valor más bajo es 24 y el más alto es 125. Para
organizar en una distribución de frecuencias:
a. ¿Cuántas clases sugiere?
b. ¿Qué intervalo recomienda?
10) Bioingredientes C.L. produjo la siguiente cantidad de productos en los primeros 20 días del mes de
mayo 2022:
110 160 120 150 180 185 170 150 180 150
115 160 130 150 140 180 170 180 180 180
Organice la información en una tabla de frecuencias y determine:

a) El número de clases
b) El intervalo
c) El límite inferior
d) Realice el histograma de frecuencias absolutas
e) Realice el polígono de frecuencias relativas
f) Realice un informe de resultados
11) Con la información del ejercicio anterior, organice los datos como distribución de frecuencias
utilizando 100 como límite inferior de la primera clase y un intervalo de 20. Organice la
información en una tabla de frecuencias y determine:
a) El número de clases
b) Realice el histograma de frecuencias absolutas
c) Realice el polígono de frecuencias relativas
d) Realice un informe de resultados
12) El Ministerio de Turismo del Ecuador estudia la cantidad que gastan al día en alimento y bebida las
familias que visitan el parque Metropolitano. Una muestra de 30 familias que visitó el parque ayer
revela que éstas gastaron las siguientes cantidades:
65 19 63 80 38 62 43 63
54 50 59 54 56 62 62 52
34 26 50 34 44 52 53 41
48 32 53 19 51 61
26
_________________________________________________________________________________________
a) Organice los datos como distribución de frecuencias utilizando el 15 como límite inferior
de la primera clase y un intervalo de 12.
b) ¿Cuántas clases se utilizaron?
c) ¿Dónde tienden a acumularse los datos?
d) Realice un informe
13) A continuación, se muestra la cantidad de minutos que emplea un grupo de estudiantes para
llegar desde la casa a la Universidad.
62 65 48 37 41 58 42
39 32 56 38 53 85 31
23 47 36 66 46 82 35
43 38 33 28
a) Organice los datos como distribución de frecuencias utilizando el 20 como límite inferior
de la primera clase y 6 clases.
b) ¿Qué intervalo se utilizó?
c) ¿Dónde tienden a acumularse los datos?
d) Realice un informe
27
_________________________________________________________________________________________
CAPÍTULO 3
3. Medidas de tendencia central

Se tienen dos formas numéricas para describir los datos cuantitativos: 1) medidas de ubicación y 2)
medidas de dispersión.
3.1 Medidas de ubicación

3.1.1 Media aritmética
Generalmente se les denomina promedio.
De acuerdo con la clasificación de población y muestra se tiene:
Media poblacional
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

𝑀𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 =
𝑁º 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
En el lenguaje matemático también esta expresada esta fórmula con su respectiva nomenclatura:
Σ𝑋
𝜇=
𝑁
Tabla 6. Nomenclatura media poblacional
Símbolo Significado
𝜇 Media poblacional
Σ Epsilon (sumatoria de valores X)
X Valores analizados de la población
N Número de valores (N mayúscula)
ΣX Sumatoria de X valores poblacionales
La media poblacional que se busca es una característica de la población y se denomina “parámetro”.
Ejemplo:
Existen 42 tiendas comerciales en el centro comercial el Condado ubicado al norte de Quito. A
continuación, tenemos los valores de ingresos del mes de noviembre 2021 en miles de dólares.
12 15 14 47 45 22 12 21 9 20 5 19 55 18
2 8 12 2 13 59 14 25 15 20 16 45 17 50
4 5 8 1 10 12 26 11 22 10 5 9 2 8
28
_________________________________________________________________________________________
Se requiere encontrar la media aritmética e interpretar porque esta información es un parámetro

poblacional.
Al considerar la información de las ganancias anuales de todas las tiendas del centro comercial se
convierte en una población. Para calcular la media aritmética se tiene que sumar todos los valores de
la población obteniendo un ingreso total de 745 y dividir para e 42. Así la media aritmética es de 17.7
(miles de dólares).
Σ𝑋 12 + 15 + 14 … + 2 + 8 745
𝜇= = = = 17.7
𝑁 42 42
La media poblacional de 17,7 es un “parámetro” poblacional y representa el número típico de ingresos

anuales de las tiendas.
Media de una muestra

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 =
𝑛 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
La media muestral es una característica del análisis de una porción de la población que se denomina
“estadístico”, y permite identificar una característica específica de la población.
Por ejemplo, una empresa dedicada a la fabricación de mayonesa no puede medir todos los envases
de lote de producción para conocer cuál es el contenido, así que se selecciona 30 envases y se obtiene
la media muestral; este valor se infiere (deduce o generaliza) para todo el lote.
En el lenguaje matemático también esta expresada esta fórmula con su respectiva nomenclatura:
𝛴𝑥
𝑋̅ = ; Xm
𝑛
Tabla 6. Nomenclatura media muestral
Símbolo Significado
𝑥̅ = Xm Media muestral
Σ Épsilon (sumatoria de valores x)
x Valores encontrados
n Número de valores de la muestra (n minúscula)
Σx Sumatoria de x valores de la muestra
Ejemplo:
Con la información del ejemplo 1: 42 tiendas comerciales en el centro comercial el Condado ubicado
al norte de Quito. A continuación, tenemos los valores de ingresos del mes de noviembre 2021 en
miles de dólares.
De la población de 42 tiendas comerciales, tomamos al azar una muestra de 10 tiendas:
29
_________________________________________________________________________________________
12 15 14 47 45 22 12 21 9 20 5 19 55 18
2 8 12 2 13 59 14 25 15 20 16 45 17 50
4 5 8 1 10 12 26 11 22 10 5 9 2 8
Σ𝑋 12+15+14…+2+8 745
𝜇= = = = 17,7 (parámetro)
𝑁 42 42
Los datos determinados al azar son:

12 47 9 55 13 14 20 8 11 9
Determine la media muestral:

Σ𝑋 12+47+9+55+13+14+20+8+11+9 198
𝑋𝑚 = = = = 19,80 (estadístico)
𝑛 10 10
Este valor es un “estadístico” que sirve para inferir (deducir) a la población, siendo un valor
aproximado.
3.1.2 Propiedades de la media aritmética
1. La media aritmética se calcula con todos los valores del conjunto de datos,
2. La media aritmética es única,
3. Todo conjunto de datos de intervalo o de razón contiene una media,
4. La suma de las diferencias o desviaciones de cada valor 𝑋 respecto a la media 𝑋̅ es cero.
Expresado simbólicamente: 𝛴(𝑋 − 𝑋) = 0
Ejemplo: La media de los valores: 9, 5, 14, 3 µ = 𝑋̅ = 7,75
𝛴(𝑋 − 𝑋) = 0 → [(9 − 7.75) + (5 − 7.75) + (14 − 7.75) + (3 − 7.75)] = 0
Esto significa que la media es el punto de equilibrio de los datos.

La media aritmética tiene un punto débil cuando se tiene un conjunto de datos con valores
extremadamente pequeños o extremadamente grandes comparados con la mayoría de los datos, lo
que hace que este valor no tenga una representación significativa de los datos.
Ejercicios de aplicación:
1. Encontrar la media de los siguientes valores poblacionales: 12, 10, 8, 5, 7, 30 y 15
Σ𝑋 12 + 10 + 8 + 5 + 7 + 30 + 15 87
𝜇= = = = 12.43
𝑁 7 7
2. Encontrar la media de los siguientes valores muestrales: 5, 11, 9, 15 y 18
30
_________________________________________________________________________________________
𝛴𝑥 5+11+9+15+18
𝑥= → = 5
= 11,60
𝑛
3. Con los datos del ejercicio anterior, demuestre que 𝛴(𝑋 − 𝑋) = 0
= [(5 − 11,60) + (11 − 11,60) + (9 − 11,60) + (15 − 11,60) + (18 − 11,60)] = 0
Ejemplo 1:
Para los ejercicios propuestos:

a) Calcule la media aritmética
b) Indique si se trata de un parámetro o un estadístico
1) En el conjunto residencial VITTORIA se seleccionó una muestra de 20 copropietarios. A

continuación, aparecen los gastos que realizaron el último mes en el pago de energía eléctrica:
38 40 41 45 48 48 50 50 51 51
59 59 59 62 62 62 63 64 65 66
𝑋̅ = 54,15 → es un estadístico porque se trata de una muestra
Utilizando el Excel:
Ejemplo 2:
AUTOS ROSALINDA emplea a 10 vendedores. El número de autos nuevos que vendieron el mes pasado
los respectivos vendedores fueron:
59 59 59 62 62 62 63 64 65 66
66 67 67 69 69 71 77 78 79 79
μ = 67,15 → es un parámetro porque se trata de una población
31
_________________________________________________________________________________________
3.1.3 Media ponderada

La media ponderada es un caso especial de la media aritmética que se aplica cuando se tienen valores
X que se ven afectados por otros valores que se denominan “pesos”.
Los pesos W son la cantidad o frecuencia de la variable considerada.
Ejemplo 1:
La “Heladería del Valle” vende helados en tamaños grande, mediano y pequeñ0 a $3,00; $2.75 y $2.50
respectivamente. De los últimos 10 helados que se vendieron 3 fueron grandes, 2 medianas y 5
pequeñas. Determine el precio promedio por helado.
Calculando de la forma tradicional se tiene:
3,00+3.00+3.00+2,75+2,75+2.50+2.50+2.50+2.50+2.50
media aritmética 𝑋𝑤 = 10
Una forma más fácil de calcular es aplicando la media ponderada:

𝛴(𝑤𝑋)
𝑋𝑊 =
𝛴𝑤
𝑤1 𝑋1 + 𝑤2 𝑋2 + 𝑤3 𝑋3 + ⋯ . +𝑤𝑛 𝑋𝑛
𝑋𝑊 =
𝑤1 + 𝑤2 + 𝑤3 + ⋯ . . +𝑤𝑛
5(2,50) + 3(3,00) + 2(2,75) 27,00
𝑋𝑊 = 𝑋𝑊 = = 2,70
10 10
El precio promedio en el que se vendió cada helado sin importar el tamaño es $ 2,70.
Ejemplo 2:
En enero 2022, un inversionista compró 200 acciones del Supermercado VITTORIA a $ 20 dólares cada
una; en febrero compró 300 acciones a $ 25; en abril compró 250 acciones a $ 22. ¿Cuál es el precio
promedio ponderado de cada acción?
N° acciones valor $ inversion
200 20 4.000,00
300 25 7.500,00
250 22 5.500,00
750 22,67 17.000,00
Precio promedio ponderado 17.000 / 750 = 22,67
32
_________________________________________________________________________________________
Ejercicios
1) La Heladería CUCARDAS se especializa en hacer helados de paila. En mayo 2022 vendió 30 helados
de 3 sabores; 25 helados de dos sabores y 40 helados de 1 sabor. Los helados de 3 sabores cuestan
$ 2,50; de 2 sabores $ 1,50 y de 1 sabor a $ 0,80. ¿Cuál es el precio promedio ponderado de un
helado?
2) Un estudiante de la Facultad de Ciencias Administrativas ha sacado las siguientes calificaciones en

la asignatura de estadística descriptiva: 14 en el examen parcial del 1er hemisemestre que cuenta
30%; 18 en las actividades individuales que vale un 20%; 12 en las actividades grupales que valen
15%, y un 18 en el examen final que tiene un peso del 35%. ¿Cuál es su nota final de la asignatura?
3) Una ama de casa realiza las siguientes compras en el mercado: 8 kg de pollo a $ 1,50; 12 kg de
carne de res a $ 3,50; 18 kg de papas a $ 2,30; 3 quesos a $ 3,60. ¿Cuál es el promedio de compras
por unidad de producto?
4) Determine el precio promedio ponderado de cada unidad de producto.
Artículo Precio Cantidad

Pan, unidad 0,20 50
Huevos, docena 1,05 26
Leche, litro 0,95 102
Manzanas, libra 0,86 30
Jugo de naranja, 12 onzas 1,75 40
Café, libra 3,43 12
5) Determine el precio promedio ponderado de cada unidad de producto
Artículo Precio Cantidad

Dentífrico 2,49 6
Shampoo 3,29 4
Pastillas tos 1,59 2
Antitranspirante 1,79 3
3.1.4 Mediana de datos no agrupados

La mediana es el valor que se encuentra en el punto medio de un conjunto de datos previamente
ordenados.
Esta medida de ubicación se utiliza cuando se tienen valores extremadamente grandes o
pequeños con relación a los demás del conjunto, tal que la media aritmética no resulta representativa.
Se consideran las siguientes principales propiedades de la mediana:
33
_________________________________________________________________________________________
1. No está influenciada por valores extremadamente grandes o pequeños. Por tanto, se

considera únicamente el valor en la ubicación central del grupo de datos ordenados
convenientemente.
2. Se calcula con datos de nivel ordinal o más altos.
3. Es única, sólo existe una mediana para un conjunto de datos, a semejanza de la media
aritmética.
Ejemplo:
a) Con el ejemplo de la venta de 5 días en un almacén, determine la mediana de la cantidad de
dinero en miles de dólares.
1 2 3 4 5
45 90 5 62 15
Datos ordenados:
5 15 45 62 90
El punto medio o posición es la casilla 3. Por tanto, la mediana es el valor $ 45 que se encuentra en la
posición 3, mientras que la media aritmética es $ 43,40.
a) En la siguiente muestra de calificaciones, determinar la mediana:
8 15 11 19 14 11
Datos ordenados:
8 11 11 14 15 19
El punto medio (posición) está entre las casillas 3 y 4, por tanto, la mediana es el promedio de los
valores que se encuentra de estas casillas: (11+14) /2 = 12,5; mientras que Xm = 13,00.
En grupos de datos pequeños como los de los ejemplos es fácil ubica la mediana, tan solo por
observación. En casos donde se tienen decenas o más cantidad de datos, es conveniente aplicar la
siguiente fórmula para ubicar la posición de mediana:
𝑛+1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 (𝑝𝑚𝑒𝑑 ) =
2
Ejemplo:
En el Almacén PEPITO se han vendido la siguiente cantidad de camisas en los últimos 30 días:
determine cuál es el valor de la mediana y compare con la media aritmética.
2 9 13 16 17 9
10 2 16 13 12 17
4 13 11 18 16 15
5 11 15 19 16 17
7 12 15 16 19 20
Ordenando los valores en forma ascendente:
34
_________________________________________________________________________________________
2 2 4 5 7 9
9 10 11 11 12 12
13 13 13 15 15 15
16 16 16 16 16 17
17 17 18 19 19 20
30 + 1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 (𝑝𝑚𝑒𝑑 ) = = 15,5
2
El valor de la mediana se encuentra entre la décima quinta y décima sexta casilla.
Entonces, el valor de la mediana = (13 + 15) / 2 = 14 camisas.
Este valor representa el punto medio del conjunto de datos, sin importar valores pequeños y altos.
La media aritmética es: 12,83 camisas. En este valor se consideran la venta de los valores pequeños
(como 2-2-4-5-7-9) y a su vez los valores grandes (como 18-19-19-20) y hay un poco de distorsión.
Utilizando Excel: no se requiere un ordenamiento previo, ya que el Excel lo realiza internamente.
3.1.5 Mediana de datos agrupados

En datos agrupados la mediana se calcula mediante la fórmula:
𝑛
−𝐹(𝑖−1)
2
𝑀𝑑 = 𝐿𝑖 + *A
𝑓𝑖
Donde:
A= amplitud o intervalo (Ls-Li)
n= número total de datos del ejercicio
n / 2 = se refiere a la posición para el análisis: se busca en las F_acum (Fi) el primer valor mayor que
n/2, se ubica la clase y se trabaja en ella
Li = límite inferior de la clase donde se encuentra el intervalo de la mediana
fi = frecuencia absoluta del intervalo de la mediana
F(i-1) = frecuencia acumulada anterior al intervalo de la mediana
35
_________________________________________________________________________________________
Ejemplo:
En la siguiente distribución de frecuencia, determinar la mediana.
Marca de
valores frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
Desarrollo:
Marca de
Ingreso neto (millones) frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
A= 8 amplitud (intervalo Ls - Li)

n= 50 Número total de datos del ejercicio
se busca en las F_acum (Fi) el primer valor mayor que n/2, se
posición n/2 = 25 clase 3
ubica la clase y se trabaja en ella
Límite inferior de la clase donde se encuentra el intervalo de la
Li = 34
mediana
fi = 5 frecuencia absoluta del intervalo de la mediana
F(i-1) = 24 frec_ acum anterior al intervalo de la mediana
𝑛
− (𝑖−1)
𝑀𝑒𝑑 = 𝐿𝑖 + 2 *A
𝑖
25 −24
𝑀𝑒𝑑 = 34 + *9
5
Med = 34 + 1,60
Med = 35,60
36
_________________________________________________________________________________________
Ejercicios
6) Los siguientes son los ingresos en miles de dólares en el almacén Ana Paula, determine la
mediana.
Marca de
clase
X Xi fi Fi f*M
10 20 15 13 13 13
20 30 25 19 32 32
30 40 35 16 48 48
40 50 45 20 68 68
50 60 55 12 80 80
80 2410
3.1.6 Moda de datos no agrupados

La Moda también es una medida de ubicación. Es el valor que más se repite en el conjunto de datos.
Para facilitar la búsqueda de la moda, los datos tienen que estar ordenados de mayor a menor o
viceversa, permitiendo una mayor visualización del valor repetido.
Ejemplo:
La empresa AMBACAR vendió durante el año 2022 la siguiente cantidad de autos. Determine la moda
respecto al número de autos vendidos.
septiemb noviemb diciembr
enero febrero marzo abril mayo junio julio agosto octubre
re re e
3 15 6 11 19 14 11 15 15 14 20 12
Ordenando los datos:

septiemb noviemb diciembr
enero febrero marzo abril mayo junio julio agosto octubre
re re e
3 6 11 11 12 14 14 15 15 15 19 20
Conclusión: en los meses de febrero, agosto y septiembre se vendieron 15 autos en cada mes.
Utilizando Excel:
37
_________________________________________________________________________________________
3.1.7 Moda de datos agrupados

En datos agrupados la moda se calcula mediante la fórmula:
𝑓𝑖 −(𝑓𝑖−1)
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + ([𝑓𝑖−(𝑓𝑖−1)] + [𝑓𝑖−(𝑓𝑖+1)] ) *A
Ejemplo:
En la siguiente distribución de frecuencia, determinar la moda:

Marca de
valores frec_abs frec_acum media
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
Desarrollo:
Marca de
clase
X Xi fi Fi f*M
10 18 14 5 5 70
18 26 22 11 16 242
26 34 30 8 24 240
34 42 38 5 29 190
42 50 46 8 37 368
50 58 54 6 43 324
58 66 62 7 50 434
50 1868
𝑓𝑖 −(𝑓𝑖−1)
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [𝑓𝑖−(𝑓𝑖−1)] + [𝑓𝑖− 𝑓𝑖+1 ]
*A
A= 8
fi = 11 clase 2 frecuencia que más se repite
Li = 18 clase 2 límite inferior de la clase 2
f(i-1) = 5
f(i+1) = 8
fi - (fi-1) = 6
fi - (fi+1) = 3
11−5
𝑀𝑜𝑑𝑎 = 18 + *8
11−5 +(11−8)
Moda = 18 + 5,33
Moda = 23,33
38
_________________________________________________________________________________________
Ejercicios
7) Los siguientes son los ingresos en millones de dólares en el almacén Ana Paula, determine la
moda.
Marca de
clase
X Xi fi Fi f*M
10 20 15 13 13 13
20 30 25 19 32 32
30 40 35 16 48 48
40 50 45 20 68 68
50 60 55 12 80 80
80 2410
3.1.8 Posiciones relativas de la media, mediana y moda

En un histograma se puede observar la distribución de la media, mediana y moda para lo cual
dependiendo del gráfico podremos saber si tiene una distribución simétrica o asimétrica.
En el caso de una distribución de forma simétrica o en forma de campana, la media, mediana
y moda siempre son iguales, como podemos observar en la imagen la moda, mediana y media son
iguales.
Distribución simétrica (sesgo cero)

50
40
40 35 35
Frecuencia
30
20 20
20
10 10
10
0
100 200 300 400 500 600 700
Utilidades
Figura 15. Distribución simétrica
media = mediana = moda = 400
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑚𝑜𝑑𝑎
En el caso de que una distribución no sea simétrica, se tiene dos tipos de sesgos:
El sesgo positivo o derecho tiene como característica que, el valor de la media es mayor que
la mediana y la moda y su gráfica muestra un sesgo a la derecha.
39
_________________________________________________________________________________________
La mediana como medida de ubicación es el mejor parámetro para hacer la comparación con
la media aritmética, antes que la moda, ya que esta no se presenta en todos los casos.
Distribución con sesgo positivo

(sesgo a la derecha)
1200
1000
Frecuencia
800
600
400
200
0
150 200 250 300 350 400 450
Ingresos
Figura 16. Distribución con sesgo positivo (derecho)
mediana = 250 media = 300
ediana = 250
𝑥̅ > 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 > 𝑚𝑜𝑑𝑎
El sesgo negativo o izquierdo que se presenta cuando el valor de la media es menor que la
mediana y la moda y, su gráfica presenta un sesgo a la izquierda.
Ejemplo: media = 250; mediana = 300
Distribución con sesgo negativo

(sesgo a la izquierda)
1200
1000
800
600
400
200
0
150 200 250 300 350 400 450
Figura 17. Distribución con sesgo negativo (izquierdo)

media = 250 mediana = 300
ediana = 250
𝑥̅ < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑚𝑜𝑑𝑎
En un conjunto de datos, no siempre se tendrá la moda, entonces, la evaluación se realizará en base a
la media y a la mediana.
Ejemplo:
Los ingresos mensuales del Almacén ROSITA se organizaron en una distribución de frecuencias y se
determinó una media de $ 96.000, la mediana de $ 93.000 y la moda de $ 91.000. Grafique las ventas
y determine si la distribución es simétrica, tiene sesgo positivo o sesgo negativo. Explique la respuesta.
40
_________________________________________________________________________________________
𝑥̅ = 96.000
Mediana = 93.000
Moda = 91.000
Solución: La distribución tiene sesgo positivo por cuanto la media de las ventas es mayor que la
mediana y la moda.
Ejercicios
Determine la media, la mediana y el sesgo de los siguientes ejercicios:
8) Autos Vittoria emplea a 10 vendedores quienes vendieron en diciembre 2022 la siguiente
cantidad de autos respectivamente:
15 23 4 19 18
10 10 8 28 19
9) El supermercado Kamila tuvo los siguientes ingresos en miles de dólares en los últimos 7 meses:
14 24 19 31 36 26 17
10) Los siguientes valores se pagaron por electricidad a la Empresa Eléctrica Quito en los 12 meses
del año 2022:
54 48 58 50 25 20
47 75 46 60 70 15
11) Se analizan las horas de trabajo extra de 16 trabajadores en determinado proyecto, para lo que
se obtuvieron las siguientes cantidades trabajadas.
13 13 12 15 7 15 5 12
6 7 12 10 9 13 12 12
3.1.9 Media geométrica

Es otra medida de tendencia central de ubicación, se aplica para determinar el cambio promedio de
porcentajes, razones, tasas de crecimiento, interés compuesto y números índices.
Ventajas:
a) Es menos sensible a valores extremadamente grandes o pequeños) que podrían alterar la
media de una muestra estadística.
b) Considera todos los valores de la distribución.
Desventajas:
a) No se puede aplicar con porcentajes negativos.
41
_________________________________________________________________________________________
b) Si un valor Xi = 0, la MG es cero.
Se utiliza en dos casos:
1) Para determinar los cambios promedio de porcentajes, razones, índices y tasas de crecimiento,
siendo de gran importancia tanto para la matemática como para la estadística y la economía
ya que ayuda a conocer cuál es el cambio verdadero que se produce ya sea en cuanto a salarios,
ventas realizadas u otro tipo de datos numéricos.
2) Para determinar tasas de crecimiento o incremento en períodos conocidos.

Una característica importante para observar es que siempre será menor o igual a la media aritmética.
En el primer caso, es la raíz n-ésima del producto de todos los valores considerados (porcentajes o
números índice).
La fórmula de la media geométrica es la siguiente:
𝑛
𝑀𝐺 = √(𝑥1)(𝑥2)(𝑥3) … … … . (𝑥𝑛)
1⁄
MG = (x1 ∗ x2 ∗ x3 ∗ … . . xn) n
Donde los valores Xi son números índices.

Los valores porcentuales generalmente representan utilidad o ganancia sobre una inversión al final de
un período. Así, si el 100% de una inversión es $ 100 y la ganancia al final del período considerado es
el 20% ($ 20) quiere decir que finalmente tiene 120% ($120).
Si en lugar de utilidad tiene una pérdida respecto a la inversión hay que restar del 100% de la inversión.
Si el 100% de una inversión es $ 100 y la pérdida al final del período es de 15% ($ 15) finalmente tendrá
85% ($ 85).
El número índice es el valor sobre la base 100.
Ejemplo:
Inversión = $ 100 (100%)
Rendimiento, ganancia o utilidad = $ 25 (25%)
Resultado final = $ 125 (125%)
Número índice = 125% / 100% = 1,25
Ejemplo 1
Un inversionista obtuvo un rendimiento en los últimos 3 años del 10%, 14% y 15% respectivamente,
en una inversión en un supermercado. ¿Cuál es la media geométrica de la recuperación de la inversión?
Año 1: 10% ------110% ----- 1,10
Año 2: 14% ----- 114% ----- 1,14
AÑO 3: 15% ----- 115% ----- 1,15
42
_________________________________________________________________________________________
𝑛
𝑀𝐺 = √(𝑥1)(𝑥2)(𝑥3)
3
𝑀𝐺 = √(1,10)(1,14)(1,15) = 1,1298
Este resultado indica que la media geométrica de recuperación es de 1,1298, es decir, 12,98% más que
la base 100 que se considera.
MG = 12,98% menor que la media aritmética 𝑥̅ = 13,00%

La media geométrica se puede obtener directamente utilizando la función Excel
MEDIA.GEOM(números índice).
Aplicando el Excel: puede aplicar en base a la unidad
Aplicando el Excel: puede aplicar en base a 100
Nota: La media geométrica se puede considerar como una tasa de crecimiento para proyecciones
futuras.
Ejemplo:
Conociendo el rendimiento promedio de 12,98%, el inversionista se propone incrementar la inversión
en el supermercado para iniciar el año 2022 en $ 100.000,00. ¿Cuánto llegará a tener en el año 2024?
43
_________________________________________________________________________________________
Aplicando la fórmula para calcular el valor futuro de un valor inicial a una tasa de interés y a un
determinado tiempo:
𝑉 = 𝑉𝑖(1 + 𝑖)𝑛
y el interés se reemplaza con la tasa de crecimiento que da la MG, se tiene
𝑉 = 𝑉𝑖(1 + 𝑀𝐺)𝑛
Año de inicio = 2022

Año final = 2024
n = 3 años
Vi = 100.000
Tasa incremento = MG = 12,98%
𝑉 = 100.000 ∗ (1 + 0,1298)^3
Vf = 144.213,10
Si se realiza el cálculo año por año: (método que no se debe aplicar)

tasa
año valor inicial incremento valor final
crecimiento
2022 100.000,00 12,980% 12.980,000 112.980,00
2023 112.980,00 12,980% 14.664,804 127.644,80
2024 127.644,80 12,980% 16.568,296 144.213,10
Respuesta: 144.213,10
Ejemplo 2
Calcular la media geométrica de los siguientes porcentajes: 6%, -8%, 10% y 15% que representan los
rendimientos reportados en los últimos 4 años por el departamento financiero en la empresa
BIOINGREDIENTS C.L.
El valor -8% representa una pérdida en relación al 100% de la inversión, y como la media
geométrica no trabaja con números negativos:
(-8% + 100% = 92%; dividido para 100 = 0,92)
4
𝑀𝐺 = √(1,06)(𝟎, 𝟗𝟐)(1,10)(1,15)
MG = 1, 0539 x 100 = 105,39% - 100% = 5,39%
Las ganancias del departamento de ventas fueron el 5,39% → menor que 𝑥̅ = 5,75%
44
_________________________________________________________________________________________
Ejercicios
12) El incremento salarial de un obrero en los dos últimos años fue de 5% y 15%, determine la
media geométrica del incremento salarial.
13) Durante el año 2020, la utilidad de una empresa constructora en cuatro proyectos fue de 2%,
4%, 7% y 9% ¿Cuál es la media geométrica de las ganancias?
14) Durante el año 2020, la utilidad de una empresa constructora en cuatro proyectos fue de 2%,
4%, -7% y 9% ¿Cuál es la media geométrica de las ganancias?
15) En la empresa LEOAUTOCAR S.A. dedicada a la compra y venta de autos se presentaron

incrementos porcentuales en las ganancias en los 6 últimos años siendo estos 5%, 7%, 9%,
10%, 11% y 11,5%. Calcular la media geométrica del incremento de las ganancias.
16) En el Supermercado ISABELLA se presentan las siguientes ganancias porcentuales en los años
indicados. Determine el incremento porcentual de los años considerados. Suponga que al
finalizar el año 2022, el supermercado termina con un capital invertido de 10.000 dólares.
Utilice la MG como tasa de incremento y determine cuáles serán los valores futuros para los
años 2023 y 2025.
Año 2016 2017 2018 2019 2020 2021 2022 2323 2025
12 8 -4 5 -3 6 10
En el segundo caso, la Media Geométrica (MG) se aplica para determinar el cambio porcentual
promedio en ciertos períodos de tiempo y para ello se usa la siguiente fórmula:
𝑛 𝑉𝑎𝑙𝑜𝑟 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜

MG = √ -1
𝑉𝑎𝑙𝑜𝑟 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟í𝑜𝑑𝑜
1⁄
𝑉 𝑝 𝑛
𝑀𝐺 = ( ) −1
𝑉𝑖𝑝
Ejemplo 3
Según el censo del año 2010, el Ecuador registró 14.306.876 habitantes. Una proyección del INEC
determinada para el 2020 estimó a la población en 17.511.000. ¿Cuál es la media geométrica del
incremento anual de dicho período?
Final período = noviembre 2020
Inicio período = noviembre 2010
45
_________________________________________________________________________________________
Períodos transcurridos = 10
10 17.511.000
MG = √ -1 MG = 0,0196
14.306.876
Por lo tanto, el incremento anual de la población fue de 1,96%
Igualmente, esta tasa de incremento puede ser aplicada para proyecciones en diferentes casos.
Ejercicios
17) La población de estudiantes de la Facultad de Ciencias Administrativas en el año 2010 fue de
5.400 estudiantes y en el año 2022 se tienen 6.500. ¿Cuál es la media geométrica del
incremento anual de dicho período? Con la MG como tasa de incremento, ¿cuál será la
población de estudiantes para el año 2030?
18) Con los datos del ejemplo 3, se determinó un incremento porcentual anual MG = 1,854%.
Determine la población aproximada para los años 2022 y 2025.
3.2 Medidas de dispersión

La dispersión es el grado de concentración de valores respecto a la media aritmética.
Una medida de dispersión pequeña indica que los datos se encuentran acumulados cerca de
la media aritmética, mientras que una dispersión grande indica que los datos se encuentran alejados.
Entre las medidas de dispersión se encuentran: 1) el rango; 2) la desviación media; 3) la

desviación estándar.
46
_________________________________________________________________________________________
3.2.1 Rango
La medida más simple que existe es el rango porque representa la diferencia entre los valores máximo
y mínimo de un conjunto de datos.
Esta medida solo considera los valores de los extremos y no los intermedios.
Rango = Valor máximo – valor mínimo
Nota: El rango se emplea mucho en aplicaciones de control de procesos estadísticos, debido a que
resulta fácil calcular e interpretar.
3.2.2 Desviación media

La desviación media toma en cuenta a todos los valores de un conjunto de datos sea de una población
o una muestra, y calcula la sumatoria del valor absoluto de la diferencia de los valores X respecto a la
media, dividido para el número de datos.
∑ |𝑋 − ̅̅̅
𝑋|
𝐷𝑀 =
𝑛
Ejemplo:
En una muestra de 10 clientes, la empresa Pizzas LEO contabilizó el tiempo que se demora en entregar
la pizza en sus domicilios. Determine la desviación media y comente al respecto.
Clientes 1 2 3 4 5 6 7 8 9 10
Tiempo minutos 18 12 13 15 16 11 17 16 13 10
Desarrollo:
Nº cliente X minutos (𝑿 − ̅𝑿)
̅̅̅ ̅̅̅
|𝑿 − 𝑿| ̅
𝑿 Lim sup Lim inf
1 18 3,90 3,90 14,10 16,40 11,80
2 12 -2,10 2,10 14,10 16,40 11,80
3 13 -1,10 1,10 14,10 16,40 11,80
4 15 0,90 0,90 14,10 16,40 11,80
5 16 1,90 1,90 14,10 16,40 11,80
6 11 -3,10 3,10 14,10 16,40 11,80
7 17 2,90 2,90 14,10 16,40 11,80
8 16 1,90 1,90 14,10 16,40 11,80
9 13 -1,10 1,10 14,10 16,40 11,80
10 10 -4,10 4,10 14,10 16,40 11,80
∑ = 141 ∑ = 0,00 ∑ = 23,00
n = 10 𝑋̅ = 141/10 = 14,10 minutos

̅̅̅
∑ |𝑋−𝑋|
𝐷𝑀 = DM = 23/10 = 2,30 minutos
𝑛
47
_________________________________________________________________________________________
Rango de dispersión o desviación = 𝑋̅ ± DM → 14,10 ± 2,30 = [11,80 – 16,40]
Utilizando Excel:
Representación gráfica: gráfico de dispersión
Conclusión: Los clientes son atendidos en un tiempo medio de 14,10 minutos con una desviación media
de 2,30 minutos (14,10 ± 2,30); es decir, entre 11,80 y 16,40 minutos, siendo este el rango de atención
óptimo.
Ejercicios
19) Los pesos en kilos de un grupo de 5 deportistas son:
50 65 78 84 60
Determine:
a) El peso medio; b) la desviación media; c) el rango de desviación; d) el coeficiente de variación;
e) interprete el resultado.
20) LEO’s Milk empresa de lácteos realiza un estudio de mercado para conocer la aceptación de la leche de
avena con canela haciendo la encuesta a 10 personas, con una valoración del 1 al 10 siendo el 1 que no
48
_________________________________________________________________________________________
agrada para nada y 10 una valoración muy aceptable al público. La empresa decide que si la media se
encuentra en un rango de desviación entre 7 y 9 se realiza la producción.
Clientes 1 2 3 4 5 6 7 8 9 10
valoración 8 7 9 9 8 7 9 10 7 7
Determine:
a) La media de la muestra; b) la desviación media; c) el rango de desviación;

d) el coeficiente de variación; e) comente el resultado.
21) Colchones Pepito dispone de 6 locales comerciales, donde se han vendido en el mes de mayo 2022 la
siguiente cantidad de colchones:
local 1 2 3 4 5 6
número 12 8 17 19 6 15
Determine:

22) Un grupo de jóvenes emprendedores decide invertir en un nuevo tipo de yogurt griego con sabor de
mango y banano. Previamente realizan un estudio de mercado donde realizan una degustación y una
encuesta a un grupo de 10 personas elegidas al azar, en el norte de Quito, calificando el sabor del yogurt
del 1 al 10, en donde 1 no le gusta y 10 si les gusta. Las calificaciones fueron las siguientes:
personas 1 2 3 4 5 6 7 8 9 10
valoración 6 6 9 10 8 6 8 10 8 7
Paralelamente, realiza la degustación y la encuesta a otro grupo de 10 personas en el sur de Quito,

elegidos al azar, y las calificaciones fueron las siguientes:
personas 1 2 3 4 5 6 7 8 9 10
valoración 7 8 9 8 8 6 7 10 7 8
Los inversionistas deciden que el negocio se instalará donde se tenga un promedio igual o
mayor a 7,5. Determine la mejor ubicación para poner el negocio.
23) La empresa INVENTIVA CL produce perfumes para mujer en presentación de 200 ml. El gerente de
producción decide analizar una muestra y medir el volumen de 10 unidades, cuyos valores son los
siguientes:
49
_________________________________________________________________________________________
201 197 203 210 178 187 201 180 215 188
Determine:
3.2.3 Varianza y desviación estándar

La varianza y la desviación estándar se fundamentan en la desviación media, pero en lugar de trabajar
con el valor absoluto de las desviaciones lo hacen con el cuadrado de las desviaciones.
La varianza y la desviación estándar se calcula tanto para la población como para la muestra. En la
muestra varía por que se utiliza (n-1) en lugar de N.
Las fórmulas son las siguientes:
Fórmulas Población Muestra
𝛴(𝑋−µ)² 𝛴(𝑋−𝑋̅)²
Varianza σ² = S² =
𝑁 𝑛−1
Desviación estándar 𝛴(𝑋 − µ)² 𝛴(𝑋 − 𝑋̅)²

𝜎= √ 𝑆= √
𝑁 𝑛−1
𝜎 𝑆
Coeficiente de variación CV 𝐶𝑉 = 𝐶𝑉 =
𝜇 𝑋̅
Varianza
Es la media aritmética de las desviaciones de la media elevadas al cuadrado.
La varianza nunca será negativa y será cero sólo si todas las observaciones son las mismas.
Desviación estándar
En los dos casos, la desviación estándar es la raíz cuadrada de la varianza
Nomenclatura:
σ² = varianza de la población
σ= desviación estándar de la población
S² = varianza de la muestra
50
_________________________________________________________________________________________
S= desviación estándar de la muestra

µ = media de la población
𝑋̅ = media de la muestra
X= valor observado de una población o muestra
N= número de datos de la población
n= número de datos de la muestra
Coeficiente de variación o variabilidad (CV)

Expresa en porcentaje la variación (dispersión) que existe entre la desviación estándar y la media
aritmética.
El coeficiente de variación se mide entre 0 y 1 o entre 0 y 100%. Si el coeficiente es próximo al
0, significa que existe poca o ninguna variabilidad en los datos y es una muestra muy compacta. En
cambio, si tienden a 1 (100%) es una muestra muy dispersa y la media pierde confiabilidad.
Se considera que si el CV es menor o igual a 0,30 (30%), la media aritmética es representativa
del conjunto de datos, y el conjunto de datos es "homogéneo".
Si el CV es mayor que 0,30 se puede considerar que el conjunto de datos es heterogéneo.
Ejemplo 1
La empresa Constructora LEO instala bombas de agua en 5 casas residenciales con 5 obreros
diferentes. Los tiempos que los obreros registraron en sus instalaciones fueron los siguientes:
28 32 24 46 44
Determine la media, varianza, la desviación estándar y comente el resultado:
Nº obrero X minutos X-U (X - U)² U Lim sup Lim inf

1 28 (6,80) 46,24 34,80 43,53 26,07
2 32 (2,80) 7,84 34,80 43,53 26,07
3 24 (10,80) 116,64 34,80 43,53 26,07
4 46 11,20 125,44 34,80 43,53 26,07
5 44 9,20 84,64 34,80 43,53 26,07
∑ = 174 ∑ = 0.00 ∑ = 380,80
𝛴(𝑋−µ)²
N=5 U = 174/5 = 34,8 min σ² =
𝑁
380.80 σ² = 76,16 ---→ σ = 8,73
𝜎2 =
5
51
_________________________________________________________________________________________
𝑟𝑎𝑛𝑔𝑜 𝑑𝑒 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 = 𝑙𝑖𝑚𝑖𝑡𝑒𝑠 = 𝑈 ± 𝛔

CV = 8,72 / 34,8 --→ CV = 25,09%
En un gráfico de dispersión se ve así:
Conclusión (interpretación):
a) La empresa instala las bombas de agua en un tiempo medio de 34,8 minutos, con una
desviación estándar de 8,73 minutos (34,8 ± 8,73) con un tiempo mínimo de 29,07 minutos y
un máximo de 43,58 minutos,
b) En la casa N°5 se demoran 46 minutos, esto es, más tiempo del rango de desviación establecido
por las otras instalaciones,
c) En la casa N°3 se demoran 24 minutos, algo menos del rango de desviación establecido.
d) Tan solo dos empleados instalan dentro de la banda de tiempo establecida.
e) Se observa un coeficiente de variación de 25,09% de la desviación estándar respecto a la
media.
52
_________________________________________________________________________________________
Ejercicios
Considere los siguientes ejercicios como población y determine:

a) La media; b) la varianza, c) la desviación estándar; d) el rango de desviación; e) el coeficiente de
variación; f) comente el resultado.
23) Con las ventas en miles de dólares en los últimos cinco días:
8 6 10 7 5
24) Se realizo una encuesta en los cinco hoteles de la ciudad de Atacames para conocer las tarifas
que tienen en temporada alta, siendo las siguientes:
101 97 103 120 78
25) Considere que en los meses de julio a diciembre del año 2021 se vendió la siguiente cantidad
de autos:
julio agosto septiembre octubre noviembre diciembre
9 6 7 11 9 7
26) Las ganancias de la inversión realizada en el supermercado LEO en los años 2016 a 2021 fueron
(miles de dólares):
2016 2017 2018 2019 2020 2021
125 184 220 205 50 85
27) Las ventas realizadas en la Lavandería Kamila en los 6 últimos meses del año 2022 fueron (miles
de dólares):
julio agosto septiembre octubre noviembre diciembre
35 46 31 23 30 85
Considere los siguientes ejercicios como muestra y determine:

a) La media; b) la varianza, c) la desviación estándar; d) el rango de desviación; e) el coeficiente de
variación; f) comente el resultado.
28) Con el número de visitas a un almacén:

28 32 24 46 44 28
53
_________________________________________________________________________________________
29) Una muestra de 7 empresas productoras de lácteos obtuvo las siguientes ganancias (miles de
dólares) en el año 2021.
1 2 3 4 5 6 7
12,5 15,6 14,8 10,3 11,3 5,6 8,6
30) Las edades de una muestra de 8 personas de la tercera edad que se encuentran en la Casa de
reposo LEO son las siguientes:
65 82 76 93 78 81 73 80
31) La empresa INVENTIVA CL produce perfumes para mujer en presentación de 200 ml. El gerente
de producción decide analizar una muestra de 10 unidades para saber si se está cumpliendo
con lo proyectado.
En la producción del perfume, los costos de fabricación contemplan el volumen de 200 ml con
una dispersión de (±) 8 ml; si esta es mayor, aumentan los costos y se reduce la utilidad de la
empresa y si es menor las clientes no compran y disminuyen las ventas. ¿Se encuentra correcta
la fabricación?
201 197 203 210 178
187 201 180 215 188
32) Con los resultados del ejercicio 31:
a) Para un CV = 5%, ¿cuánto es la Desvest?

b) Con una Desvest = 10, ¿cuánto es el CV?
c) En un rango de desviación entre 195 y 205, ¿cuánto es la media, la Desvest y el CV?
33) LEO’s Milk empresa de lácteos realiza un estudio de mercado para conocer la aceptación de
un producto que contiene avena con mora; realiza una encuesta a 10 personas, con una
valoración del 1 al 10 siendo el 1 que no agrada para nada y 10 una valoración muy aceptable.
La empresa decide que si la media se encuentra en un rango entre 7 y 10 se realiza la
producción.
Clientes 1 2 3 4 5 6 7 8 9 10
valoración 8 8 9 9 8 7 9 10 7 7
a) Interprete el resultado obtenido,

b) ¿El estudio cumple con lo previsto?
3.2.4 Interpretación y usos de la desviación estándar
La desviación estándar generalmente se utiliza como medida para comparar la dispersión en un

conjunto de observaciones o en dos o más conjuntos de observaciones.
54
_________________________________________________________________________________________
Teorema de Chebyshev
El Teorema de Chebyshev se considera una desigualdad probabilística y se utiliza para medir la
dispersión en los conjuntos de datos.
El conjunto de datos usualmente presenta una distribución normal con una curva con forma
de campana (simétrica) donde se tiene que al menos el 68% de los datos se encuentran en una
desviación estándar de la media, el 95% en dos desviaciones estándar de la media y el 99,7% en tres
desviaciones estándar de la media.
Sin embargo, si los datos no se distribuyen adecuadamente y presenta sesgos derecho o
izquierdo, la regla 68-95-99,7 puede ser inexacta y es mejor aproximar las probabilidades mediante la
1
fórmula: 𝑝=1− 𝑘2
encontrando que los datos de una muestra se encuentran dentro de K desviaciones estándar de la
media, siendo K un número real positivo mayor que uno.
Frecuencia absoluta
20 18
16
15
9 8
10 7
4 5 4
5 3
1
0
5 10 15 20 25 30 35 40 45 50
0 5 10 15 20 25 30 35 40 45
75%
Xm - 2S Xm + 2S
Xm - 3S 88,88% Xm + 3S
Ejemplo:
De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto de
valores se encontrará a k = 2 y K = 3 desviaciones estándar?
1 1
1 − 𝑘2 → 1 − 22 = 1 – 0,25 = 0,75 --→ aproximadamente 75%
1 1
1 − 𝑘2 → 1 − 32 = 1 – 0,11 = 0,88 --→ aproximadamente 88,88%
55
_________________________________________________________________________________________
Ejercicios
34) De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto
de valores se encontrará a k = 1,5 desviaciones estándar?
35) De acuerdo con el teorema de Chebyshev ¿por lo menos que porcentaje de cualquier conjunto
de valores se encontrará a k = 3,5 desviaciones estándar?
La regla empírica (basada en la experiencia y en la observación de los hechos)

Chebyshev establece que, en cualquier distribución simétrica, aproximadamente el 68% de
observaciones se encuentran entre más y menos una desviación estándar de la media; 95% a más y
menos dos desviaciones estándar de la media y 99,7% a más y menos tres desviaciones estándar de la
media.
Estas características se demuestran en la figura que es simétrica y tiene forma de campana.
99,70%
95%
68%
0,34 0,34
0,475 0,475
0,4985 0,4985
escala X Xm-3S Xm-2S Xm-1S Xm Xm+1S Xm+2S Xm+3S

escala Z -3 -2 -1 0 1 2 3
Cualquier distribución normal [escala X: N (µ ; σ) ] puede convertirse a una del tipo normal estándar
[escala Z: N (0 ; 1)] mediante la siguiente fórmula:
Donde:
µ = media poblacional
σ = desviación estándar poblacional
0 = valor de Z en el medio de la curva
1 = valor máximo de probabilidad
56
_________________________________________________________________________________________
El valor U + 1𝝈 de la escala X se convierte en un valor Z = 1, y así sucesivamente.
Valor Z.- Es la distancia de la media aritmética poblacional o muestral a un valor seleccionado X,

medida en unidades de la desviación estándar.
(𝑋−𝑢) (𝑋−𝑋̅ )
Población: 𝑍= Muestra: 𝑍=
𝜎 𝑆
En la escala Z, en el centro de la curva de distribución es igual a cero, que significa que no hay desviación
respecto a la media.
Las observaciones (se asumen la totalidad, pero en realidad es aproximado 99,7%) se encuentran bajo
la curva acampanada que representa 3 desviaciones estándar.
Una desviación estándar pequeña indica que los datos se encuentran cercanos a la media (poco
dispersos), mientras que una desviación estándar grande significa que los datos se encuentran alejados
de la media (muy dispersos).
Ejemplo 1:
En un grupo de trabajadores se tienen salarios con una media de $ 650, con una desviación estándar
es de $ 25. De acuerdo con el teorema de Chebyshev, determine:
a) ¿entre qué dos valores se encontrarán aproximadamente el 68% de los salarios?
b) ¿entre qué dos valores se encontrarán aproximadamente el 95 de los salarios?
c) ¿entre qué dos valores se encontrarán aproximadamente el 99,7 de los salarios?
d) ¿por lo menos qué porcentaje de ingresos se encontrará entre $ 575 y $ 725 dólares?
Datos:
Xm = 650
S= 25
X1 = 575
X2 = 725
575 600 625 650 675 700 725 escala X

-3 -2 -1 0 1 2 3 escala Z
Xm k desvest
a) 𝑋𝑚 ± 1𝑆 68% 650,00 -1 25 625,00
650,00 1 25 675,00
b) 𝑋𝑚 ± 2𝑆 95% 650,00 -2 25 600,00

650,00 2 25 700,00
c) 𝑋𝑚 ± 3𝑆 99,70% 650,00 -3 25 575,00

650,00 3 25 725,00
57
_________________________________________________________________________________________
Calculando con áreas bajo la curva se comprueba lo expresado por Chebishev
d)
0,4987 0,4987
escala X 575 650 725

escala Z -3,00 0 3,00
(𝑿 − 𝑿 )
Formula para transformar la escala X a Z =
X Xm Z Area probab %
575 650 -3,00 0,4987 49,87%
725 650 3,00 0,4987 49,87%
entre 575 y 725

P= 0,4987 0,4987 0,9974 99,74%
Conclusión: Entre 575 y 725 dólares se tiene el 99,74% de las observaciones.
Ejercicios
36) En un rango de calificaciones entre 0 y 50, la distribución de calificaciones de una muestra de
45 estudiantes de estadística presenta una media de 40 con una desviación estándar de 2.
Aplicando la regla empírica, que valores se encuentran entre: 68%, 95% y 99,7%.
37) Un grupo de observaciones presenta una media en ventas de $ 300 con una desviación
estándar de $ 20. Aplicando el Teorema de Chebyshev, ¿por lo menos que porcentaje de
ventas se encuentra entre $ 250 y $ 350?
38) En los 30 días del mes pasado se vendieron un promedio de 30 sanduches diarios con una
desviación estándar de 6. Utilizando la regla empírica:
a) ¿entre que dos valores será la venta del 68% de los sanduches?
b) ¿entre que dos valores será la venta del 95% de los sanduches?
c) ¿entre que dos valores será la venta del 99,7% de los sanduches?
39) En un grupo de observaciones de una muestra se tiene una media de $ 250, con una desviación
estándar es de $ 50. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje
de ingresos se encontrará entre $ 150 y $ 300?
58
_________________________________________________________________________________________
40) En un conjunto de datos que presenta una media de 420 con una desviación estándar de 15.
Utilizando la regla empírica:
a) ¿entre que dos valores se encuentran aproximadamente el 68%?
b) ¿entre que dos valores se encuentran aproximadamente el 95%?
c) ¿entre que dos valores se encuentran aproximadamente el 99,7%?
41) En una muestra de salarios se tiene una media de $ 650, con una desviación estándar es de $
25. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje de ingresos se
encontrará entre $ 590 y $ 680?
3.2.5 Media aritmética y desviación estándar de datos agrupados
Media aritmética de datos agrupados

Cuando los datos se encuentran en una tabla de distribución de frecuencias, entre límites de intervalos,
se dice que son datos agrupados.
Se representa de la siguiente manera:
∑( ∗ 𝑀)
𝑋̅ =
𝑛
Siendo:
f = frecuencia en cada clase
n = suma total de las frecuencias
M = Pm = marca de clase o punto medio de cada clase (promedio de los valores de cada clase).
Desviación estándar de datos agrupados

Se representa con la siguiente formula:
∑ (𝑀 − 𝑋̅)2
𝑆=√
𝑛−1
Como en el caso de la desviación estándar de datos no agrupados, nos indica el grado de dispersión de
un conjunto de datos organizados en una distribución de frecuencias, respecto a la media.
59
_________________________________________________________________________________________
Ejemplo 1:
Los gastos en publicidad constituyen un elemento significativo en el costo de los artículos vendidos.
Se tienen los siguientes gastos de publicidad de una muestra de 60 compañías manufactureras del
Ecuador.
Determinar la media aritmética y la desviación estándar:
Gastos en publicidad
Nº compañías
($ millones)
Límite inferior Límite superior frecuencia
25 35 5
35 45 10
45 55 21
55 65 16
65 75 8
Desarrollo:
M
Li Ls f f*M ̅ )2
(M-𝑿 ̅ )2
f*(M-𝑿
P. medio
25 35 5 30 150 484,00 2.420,00
35 45 10 40 400 144,00 1.440,00
45 55 21 50 1050 4,00 84,00
55 65 16 60 960 64,00 1.024,00
65 75 8 70 560 324,00 2.592,00
60 3.120 7.560,00
∑ 𝑓𝑀 3.120
n = 60 𝑋̅ = 𝑛 𝑋̅ = 60 𝑋̅ = 52 -----→ clase 3
∑ 𝑓(𝑀−𝑋̅)2 7.560
𝑆=√ 𝑛−1
𝑆=√ 59
S = 11,32
Rango desvest = (52 ± 11,32) = 40,68 (clase 2) y 63,32 (clase 4)

CV = 11,32 / 52 = 21,76%
Conclusiones:
a) Los gastos en publicidad presentan una media de $ 52 millones con una desviación estándar
de $ 11,32 millones.
b) La media se encuentra en la clase tres (45 – 55).
c) Se tiene una media de 52 ± 11,32 millones.
d) Se tiene una media de 52 millones en un rango de 40,68 y 63,32 (clases 2 y 4).
e) Existe una variación de ± 21,76% de la desviación estándar respecto a la media.
60
_________________________________________________________________________________________
Ejercicios
Determine la media y la desviación estándar de las siguientes distribuciones de frecuencias:
42)
Ventas (miles
Frecuencia
dólares)
0-2 2
2-4 9
4-6 3
6-8 12
8 - 10 4
43)
Edad (años) Frecuencia
10-20 6
20-30 15
30-40 27
40-50 20
50-60 12
44)
Número visitas Frecuencia
10-15 3
15-20 8
20-25 15
25-30 20
30-35 12
45)
Calificaciones Frecuencia
11-13 7
13-15 8
15-17 13
17-19 1
19-21 1
61
_________________________________________________________________________________________
CAPÍTULO 4
4.1 Otras medidas de posición
La medida de dispersión más utilizada es la desviación estándar, sin embargo, existen otras formas de
describir la variación o dispersión de un conjunto de datos, siendo estas, los cuartiles, deciles y
percentiles. (Lind , Marchal, & Whaten, 2012, pág. 111).
La mediana también es parte de esta familia de medidas, ya que divide el conjunto de datos
en dos partes iguales.
Para trabajar con estas medidas de dispersión se requiere que el conjunto de datos u
observaciones se encuentren ordenados de menor a mayor.
Las medidas de posición trabajan en base a percentiles, que se indican a continuación:
Los cuartiles (C): dividen un conjunto de datos ordenados en 4 partes iguales: el 25% - 50% - 75% de
las observaciones.
25% 50% 75% 100%

cuartil 1 cuartil 2 cuartil 3 cuartil 4
Los deciles (D): dividen un conjunto de datos ordenados en 10 partes iguales.
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
decil 1 decil 2 decil 3 4 5 6 decil 7 8 decil 9 10
Los percentiles (P): dividen un conjunto de datos ordenados en 100 partes iguales.
1% 2% 3% ----- 50% 51% --------- 98% 99% 100%

Per 1 Per 2 P 50 P 51
La mediana (Med): divide al conjunto de datos en dos partes iguales:
50% 100%
62
_________________________________________________________________________________________
Otra medida de posición muy utilizada a nivel mundial es el Quintil. Es una medida socio económica
oficial que sirve para medir los ingresos de la población. El quintil uno representa a la población más
pobre; el quintil cinco representa la población más rica.
Los quintiles (Q): dividen un conjunto de datos ordenados en 5 partes iguales:
20% 40% 60% 80% 100%

quintil 1 quintil 2 quintil 3 quintil 4 quintil 5
Otra medida de dispersión estadística es el “Rango intercuartil”, que es la diferencia entre el cuartil 1
y el cuartil 3:
25% 50% 75% 100%
cuartil 1 cuartil 2 cuartil 3 cuartil 4
RC = C3 – C1
Con esta medida, se eliminan los valores extremadamente alejados, y permite desarrollar el diagrama
de caja, que es un instrumento para evaluar la dispersión.
En todos los casos de cálculos de percentiles, se debe ubicar inicialmente la posición del percentil,
mediante la fórmula:
𝑝
𝐿𝑝 = (𝑛 + 1)
100
p: representa el percentil de la medida que se busca.
n: número de datos a analizar.
Ejemplo:
Pollo GUS realiza entregas a domicilio en la zona de San Rafael. En una muestra de diez entregas el
Gerente recopiló la siguiente información en minutos y quiere conocer: el cuartil 1, el cuartil 3, el rango
intercuartil, la mediana, el decil 3, el quintil 2.
Desarrollo:
Los datos siempre deben estar ordenados:
17 18 20 22 26 27 28 30 31 34
Cálculo del cuartil 1 (C1):

𝑝
𝐿𝑝 = (𝑛 + 1) 100
63
_________________________________________________________________________________________
25
𝐿25 = (10 + 1) 100 𝐿25 = 𝟐, 𝟕𝟓 (el C1 se encuentra entre las casillas 2 y 3)
El C1 se encuentra entre los valores de la segunda y tercera posición.

2da posición, valor = 18
3era posición, valor = 20; diferencia entre los dos valores = 2
Decimal de la ubicación (2,75) = 0,75 se multiplica por la diferencia entre valores 2 = 1,50
Valor del C1: el valor menor 18 + 1,50 = 19,50
2−→ 18 (2
∗ 0,75) = 1,50 → ⟦18 + 1,50 = 19,50⟧
3−→ 20
C1 = 19,50 minutos
Cálculo del cuartil 3 (C3):

75
𝐿75 = (10 + 1) 𝐿75 = 8,25 (entre 8 y 9)
100
El C3 se encuentra entre los valores de la octava y novena posición.

8−→ 30 (1
∗ 0,25) = 0,25 → ⟦30 + 0,25 = 30,25⟧
9−→ 31
C3 = 30,25 minutos
El rango intercuartil: RC = 30,25 – 19,50 = 10,75 minutos
Cálculo de la mediana:
50
Posición de la mediana: 𝐿50 = (10 + 1) 𝐿50 = 5,50
100
Se encuentra en el medio de los valores de la quinta y sexta posición

26+27
𝑀𝑒𝑑 = 2
= 26,5 𝑀𝑒𝑑 = 26,5 minutos
Cálculo del decil 3 (D3):

30
𝐿30 = (10 + 1) 100 𝐿75 = 3,30
El D3 se encuentra entre los valores de la tercera y cuarta posición.

3−→ 20 (2
∗ 0,30) = 0,60 → ⟦20 + 0,60 = 20,60⟧
4−→ 22
D3 = 20,60 minutos
Cálculo del quintil 2 (Q2):

40
𝐿40 = (10 + 1) 100 𝐿75 = 4,40
64
_________________________________________________________________________________________
El Q2 se encuentra entre los valores de la cuarta y quinta posición.

4−→ 22 (4
∗ 0,40) = 1,60 → ⟦22 + 1,60 = 23,60⟧
5−→ 26
Q2 = 23,60 minutos
Para las posiciones cuartil 1, 2 y 3 se tiene una función directa: CUARTIL.EXC(datos; número de cuartil)
Cuartil 1:
Para todas las posiciones (incluyendo cuartiles) se aplica la función: PERCENTIL.EXC(datos; percentil
correspondiente)
Quintil 2:
65
_________________________________________________________________________________________
Decil 3
Ejercicios
1) Determine los cuartiles 1, 2, 3 y el rango Intercuartil de los siguientes datos:
13 13 20 26 27 34 34
41 43 45 47 51 53 62
2) Determine los deciles 2, 4 y 6 de los siguientes datos:
17 19 19 26 27 29 34
42 43 45 47 51 53 62
3) Determine la mediana, el cuartil 1 y 3, los quintiles 2 y 3, los deciles 4 y 6, los percentiles 25,
40 y 65, el rango intercuartil de los siguientes datos:
15 17 19 21 25 25 34
34 38 38 47 51 53 62
4.1.1 Diagrama de caja
También se conoce como diagrama de caja y bigotes. Es un gráfico que se construye en base a los
cuartiles y permite visualizar la distribución de los cuartiles en un conjunto de datos.
En su representación se utilizan: los cuartiles, el valor mínimo y máximo y los datos atípicos.
66
_________________________________________________________________________________________
Ejemplo:
En base al ejemplo del tiempo de entrega de los pollos GUS, visto anteriormente, el Gerente desea
conocer ¿cuánto tiempo tarda una entrega normal? ¿en qué margen de tiempo se realizan la mayoría
de las entregas?
Se presenta la información ordenada
17 18 20 22 26 27 28 30 31 34
Valor mínimo = 17
Valor máximo = 34
Cuartil 1 = 19,50
Cuartil 3 = 30,25
Mediana = 26,50
x̅ = Xm = 25,30
Diagrama de caja
Utilizando el grafico de Excel: es importante considerar que los datos estén en una sola fila o columna,
caso contrario el Excel interpreta como dos o más fuentes de datos y muestra dos o más cajas, que
servirán para hacer comparaciones. Más adelante veremos un ejemplo de esto.
67
_________________________________________________________________________________________
El diagrama de caja muestra que el 50% de las entregas se encuentra entre 19,50 y 30,25 minutos.
El rango intercuartil representa la dispersión de la mayoría de las entregas (extremos de la caja) y es
10, 75 minutos.
Los datos presentan un sesgo negativo por cuanto la mediana es mayor que la media aritmética.
Ejemplo con dos conjuntos de datos:

Se tiene la información de número de horas de estudio de dos grupos de estudiantes de la materia de
Estadística descriptiva:
Este tipo de gráfico puede servir para hacer comparaciones entre los dos grupos, sacar conclusiones y
tomar decisiones.
𝑥̅ mediana
A 17 18 20 22 26 20,6 20
B 27 28 30 31 34 30 30
Gráfico con Excel:
4.1.2 Datos atípicos

Son aquellos valores cuyas características o propiedades son diferentes o no son similares al grupo
típico.
El concepto de atípico se puede vincular a ideas como: extraño, irregular, extravagante.
68
_________________________________________________________________________________________
Ejemplo:
En el curso de 2do semestre de educación presencial se supone que estarán estudiantes que tienen
entre 21 y 23 años; un estudiante de 45 o de 10 años estarían fuera de la normalidad, lo que los
convierte en atípicos.
Estos datos se calculan con las fórmulas:
a) Dato atípico superior > (C3 + 1,5 RC)
b) Dato atípico inferior < (C1 – 1,5 RC)
Ejercicios
4) Desarrolle el diagrama de caja y bigotes y determine los datos atípicos de los siguientes
datos:
13 13 20 26 27 34 34
41 43 45 47 51 53 62
datos:
17 19 19 26 27 29 34
42 43 45 47 51 53 62
datos:
15 17 19 21 25 25 34
34 38 38 47 51 53 62
4.2 Medidas de forma

4.2.1 Asimetría
En el ítem 3.1.71 se observó que una curva de distribución de datos no siempre tiene los dos lados
iguales, lo que se denomina asimetría. En este ítem se determinó la asimetría o sesgo en base a la
posición: izquierda, derecha o simétrica en base la media aritmética.
La asimetría es una medida para conocer la forma de la distribución de un conjunto de datos sin
necesidad de realizar el grafico y es importante para determinar si una curva de distribución es normal.
1
Posiciones relativas de media, la mediana y la moda (pág. 39)
69
_________________________________________________________________________________________
La asimetría, también conocida como sesgo, es una medida estadística que describe la falta de
simetría en la distribución de un conjunto de datos. Indica si la distribución está desplazada
hacia la izquierda o hacia la derecha en relación con la media.
En una distribución simétrica, la media, la mediana y la moda coinciden y la asimetría es cero.

Sin embargo, en una distribución asimétrica, estas medidas de tendencia central pueden
diferir.
Existen diferentes coeficientes de asimetría utilizados para medir esta característica, siendo el
coeficiente de asimetría de Pearson y el coeficiente de asimetría de Fisher los más comunes.
El coeficiente de asimetría de Pearson se calcula tomando el tercer momento central de los
datos y se divide por la desviación estándar elevada al cubo. Un coeficiente de asimetría
positivo indica una asimetría hacia la derecha (cola larga hacia la derecha) y un coeficiente de
asimetría negativo indica una asimetría hacia la izquierda (cola larga hacia la izquierda).
(https://chat.openai.com/c/cb1197b0-b692-4e09-a034-c13b8e8b7400, s.f.)
El coeficiente de asimetría más utilizado es el de Karl Pearson2:
Coeficiente de asimetría de Pearson:

3 ∗ (𝑋𝑚 − 𝑀𝑒𝑑)
𝐶𝐴𝑃 =
𝑆
donde:
Xm = media aritmética
Med = mediana
S = desviación estándar de la muestra
Coeficiente de asimetría de Fisher:3
(𝑋𝑖 − 𝑋𝑚)3
𝐶𝐴 =
𝑛 ∗ 𝜎3
donde:
Xi = cada uno de los valores
σ = desviación estándar de la población
Otro método utilizado se denomina Software.
2
https://www.google.com/search?client=firefox-b-d&q=karl+pearson+estadistica
3
https://www.youtube.com/watch?v=rPZuj8bQ6zY
70
_________________________________________________________________________________________
Coeficiente de asimetría por Software4:
𝑛 𝑋𝑖 − 𝑋𝑚 3
𝐶𝐴𝑠𝑜 𝑡 = [⅀ ( ) ]
(𝑛 − 1)(𝑛 − 2) 𝑆
donde:
Xi = cada uno de los valores
S = desviación estándar de la muestra
Solo en este caso se puede utilizar la función Excel: =COEFICIENTE.ASIMETRIA(datos)
Ejemplo:
Los siguientes valores son los sueldos anuales iniciales, en miles de dólares, de una muestra de cinco
graduados de administración, quienes aceptaron puestos de gerentes empresariales en el año 2019.
Calcule la asimetría por el método de Pearson, de Fisher y de software.
Desarrollo:
7 9 10 12 13 15 17
Mètodo de Pearson Metodo de Fisher
∗(𝑿 − 𝒏 ) ∑(𝑿−𝑿 )
CAP = CAF =
𝒏∗
n= 7 X (X-Xm)^3
Xm = 11,86 7 -114,59
mediana = 12,00 Sig pob = 3,23 9 -23,32
S= 3,48 Sig^3 = 33,58 10 -6,41
CAP = -0,12 n *Sig^3 = 235,05 12 0,00
CAF = 0,1031 13 1,49
15 31,04
17 136,02
suma 24,24
Mètodo de software
𝒏 𝑿−𝑿
= 𝒏− (𝒏−𝟐)
*Σ
X [(X-Xm)/S]^3 𝑛
7 -2,7081 = 0,233
𝑛−1 (𝑛−2)
9 -0,5512
10 -0,1514 CA softw = 0,1337 con formula
12 0,0001 CA softw = 0,1337 con excel semejante a Fisher
13 0,0353
15 0,7337
17 3,2146
suma 0,5730
4
https://support.microsoft.com/es-es/office/funci%C3%B3n-coeficiente-asimetria-bdf49d86-b1ef-4804-a046-
28eaea69c9fa
71
_________________________________________________________________________________________
Los resultados son diferentes porque son metodologías diferentes. Lo importantes es determinar el
grado de asimetría para deducir si se trata de una curva de distribución normal, característica muy
importante cuando se trata de realizar pruebas de hipótesis.
El resultado por el método de Software es semejante al del método de Fisher.
Con Pearson se tiene una curva con distribución asimétrica negativa (-0,12), con Fisher el resultado es
positivo (0,10), con software el positivo (0,13).
El método más utilizado es el de Pearson, pero puede darse el caso de este ejemplo donde el valor es
muy cercano a cero (-0,12) y nos pone a dudar, entonces se puede probar con el de software para
tener otra apreciación y si se tiene otro valor negativo cercano a cero o un valor positivo cercano a
cero (0,10) se podría concluir que es una curva con distribución normal. Esto depende del grado de
complejidad del análisis que se esté realizando.
4.2.2 Curtosis
El Coeficiente de Curtosis analiza el grado de concentración de valores alrededor de la media
aritmética que representa la zona central de la distribución en la curva de distribución normal.
La curtosis mide la forma de las colas de la distribución y se utiliza para determinar si los datos
tienen colas más pesadas o más ligeras en comparación con la distribución normal. En otras
palabras, indica si los valores extremos de la distribución son más pronunciados (colas pesadas)
o menos pronunciados (colas ligeras) que los de una distribución normal.
Existen diferentes medidas de curtosis, pero la más comúnmente utilizada es la curtosis de

Fisher, también conocida como curtosis de cuarto momento. Esta medida compara el cuarto
momento central de la distribución con el cuadrado del segundo momento central (la
varianza). Si la curtosis de Fisher es igual a cero, la distribución tiene una forma similar a la
normal. Si es positiva, la distribución tiene colas más pesadas (más concentración en los valores
extremos), y si es negativa, tiene colas más ligeras (menos concentración en los valores
extremos).
Es importante destacar que la curtosis no está relacionada con la dispersión o variabilidad de

los datos, que se mide mediante la desviación estándar o la varianza. La curtosis se enfoca
exclusivamente en la forma de la distribución. (https://chat.openai.com/c/cb1197b0-b692-
4e09-a034-c13b8e8b7400, s.f.)
Se definen 3 tipos de distribuciones según su grado de curtosis:
Distribución leptocúrtica: presenta un elevado grado de concentración de valores alrededor de la

media aritmética, la curva tiende a una punta.
Distribución mesocúrtica: presenta una curva con distribución normal.
Distribución platicúrtica: presenta un bajo grado de concentración de valores alrededor de la media

aritmética; la curva es más plana.
72
_________________________________________________________________________________________
Distribuciones
Leptocúrtica Mesocùrtica Platicúrtica
Coeficiente de curtosis de Fisher:
∑(𝑋 − 𝑋𝑚)4
𝐶𝐶 =
𝑛 ∗ 𝑆4
Nota:
Si CCF < 3 → la distribución es platicúrtica
Si CCF = 3 → la distribución es normal o mesocúrtica
Si CCF > 3 → la distribución es leptocúrtica
Ejemplo:
Con los datos del ejemplo anterior calcule el coeficiente de curtosis.
7 9 10 12 13 15 17
Método de Fisher
X (X-Xm)^4
∑(X − X )4
= 7 556,57
n∗ 4 9 66,64
10 11,90
n= 7 12 0,00
Xm = 11,86 13 1,71
σ= 3,23 15 97,57
σ^4 = 108,33 17 699,55
n * σ^4 = 758,31 Suma 1.433,93
CC = 1,89 positivo distribución leptocùrtica
Metodo de Software Nota:

Si CCF > 3 → la distribución es leptocúrtica
CCsoft = -0,8617 más 3 2,1383 Si CCF = 3 → la distribución es normal o mesocúrtica
semejante a Fisher Si CCF < 3 → la distribución es platicúrtica
Conclusión: La distribución es platicúrtica (aplanada)
Utilizando la función Excel: =CURTOSIS(datos)

Los resultados son diferentes porque son metodologías diferentes. Lo importantes es determinar el
grado de agrupamiento de los valores alrededor de la media aritmética.
73
_________________________________________________________________________________________
El resultado por el método de Software es semejante al del método de Fisher.
Ejercicios
En los siguientes conjuntos de datos, determine los coeficientes de asimetría de Pearson y de software;
el de curtosis de Fisher:
7) Los siguientes valores se pagaron por electricidad a la Empresa Eléctrica Quito en los 12 meses del
año 2022:
54 48 58 50 25 20
8) Se analizan las horas de trabajo extra de 16 trabajadores en determinado proyecto, para lo que se
obtuvieron las siguientes cantidades trabajadas.
13 13 12 15 7 15 5 12
9)
17 18 20 22 26 39 31 34 35 36
10)
6 7 12 10 9 13 12 12
74
_________________________________________________________________________________________
CAPÍTULO 5
5.1 Introducción a las probabilidades
La teoría de la probabilidad se conocida como la ciencia de la incertidumbre: es probable o no es

probable que suceda un evento.
En muchas situaciones de negocios es necesario conocer previamente alguna condición futura
que estaría por suceder, con el fin de tomar decisiones para evitar o minimizar los riesgos de pérdidas.
Ejemplos:
a) Altamente probable el incremento de personas contagiadas de COVID 19 por efecto de las
manifestaciones del mes de junio 2022;
b) No todos los estudiantes aprobarán la materia de estadística descriptiva, etc.
Las predicciones trabajan en base a muestras, luego, este estudio corresponde a la estadística
inferencial ya que las conclusiones relacionadas con una población son en base de una muestra que se
toma de ella.
¿Qué es la probabilidad?
Es un indicador que tiene un “Valor entre cero y uno, inclusive, que describe la posibilidad relativa
(oportunidad o casualidad) de que ocurra un evento” (Lind , Marchal, & Whaten, Estadística aplicada a
los negocios y la economía, 2012, pág. 146).
En el cálculo de probabilidades se tienen tres enfoques principales:
a) el modelo clásico (a priori);
b) el modelo subjetivo;
c) el método de frecuencia relativa (a posteriori).
En los conceptos de la probabilidad se conocen los siguientes términos:
Experimento. - Es la observación de alguna actividad o el acto de efectuar una medición.

Ejemplo:
- Lanzar un dado para saber qué valor se obtiene.
Resultado. - Es lo que se obtiene particularmente cuando se realiza un experimento.
Evento. - Es el conjunto de uno o más resultados de un experimento.

Ejemplos:
75
_________________________________________________________________________________________
- Que caiga un número par al lanzar el dado. (Podría ser 2, 4, o 6).

- Que hayan nacido diez o más niñas en la maternidad.
Mutuamente excluyente
Significa que un evento es único y no puede suceder otro evento al mismo tiempo.
Ejemplo:
- es hombre o mujer
- es gordo o flaco
- es soltero o casado
Colectivamente exhaustivo
Cuando se realiza un experimento, el resultado debe ser por lo menos uno de los eventos que debe
ocurrir: éxito o fracaso; cierto o falso; correcto o incorrecto; positivo o negativo, etc.
5.1.1 Enfoques de probabilidad

a) Probabilidad clásica (a priori)
Se aplica cuando existen N° posibles resultados probables en un experimento. Se asocia con lo
referente al azar. Para el cálculo se utiliza la siguiente fórmula:
𝑁° 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃(𝐴) =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Ejemplo:
Calcular la probabilidad de sacar una cara al lanzar una moneda al aire.
P(cara) = ½ = 0,50 = 50%
Conceptos para utilizar en probabilidades:
b) Probabilidad empírica
Se basa en hechos ocurridos. Ocurre cuando el número de veces que sucedió un evento en el pasado
(datos históricos) se divide ahora entre la cantidad total de observaciones. Su fórmula es:
𝑁° 𝑣𝑒𝑐𝑒𝑠 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑎𝑠 𝑒𝑛 𝑒𝑙 𝑝𝑎𝑠𝑎𝑑𝑜
𝑃(𝐴) =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Ejemplo:
De 100 accidentes de tránsito registrados en el mes de junio 2022 en Quito, 30 fueron causados por
conductores en estado etílico. ¿Cuál es la probabilidad de que el próximo mes, los accidentes sean
causados por un conductor en estado etílico?
P (accidentes por estado etílico) = 30 / 100 = 0,30 = 30%
76
_________________________________________________________________________________________
c) Probabilidad subjetiva
Se basa en cualquier información disponible, experiencia, conocimiento que disponga el investigador.
No tiene una fórmula específica.
Ejemplos:
a) El Índice de Precios al Consumidor IPC en el Ecuador para el mes de julio 2022 tendrá poca
variación respecto a junio 2022 (109,34). (La realidad es que el IPC de julio 2022 es = xxxxxx ).
b) El número de contagiados por COVID 19 en el mes de julio 2021 fueron 2.000, y probablemente
en julio 2022 sea similar, si no hay las medidas adecuadas.
c) Es probable que ocurra un nuevo deslave en la Av. La Gasca si no se toman las medidas
adecuadas.
5.1.2 Reglas para calcular probabilidades
Para el cálculo de probabilidades se va a utilizar reglas para la suma (o adición) y para la

multiplicación.
Reglas de la suma
Para combinar eventos se utiliza como conector la letra “o”, que significa que se deben sumar (o unir)
los eventos.
1. Regla especial de la suma. - Se emplea para combinar eventos que son:

a) mutuamente excluyentes,
b) independientes.
Dos eventos son mutuamente excluyentes si, en virtud de la ocurrencia de uno, el otro no puede
suceder.
P (A o B o C) = P(A) + P(B) + P(C) → P(A U B U C) = P(A) + P(B) + P(C)
1
A B
C
Diagrama de VENN
Ejemplo:
¿Cuál es la probabilidad de que al lanzar un dado salga 3 o 5?
77
_________________________________________________________________________________________
P (3 o 5) = P (3) + P (5) = 1/6 + 1/6 = 2/6 = 1/3 = 0,3333 = 33,33%
2. Regla general de la suma. – Se utiliza para combinar eventos:

a) que no son mutuamente excluyentes,
b) que contienen una probabilidad conjunta (intersección de elementos).
La probabilidad conjunta P (A y B) es aquella en la cual pueden ocurrir dos eventos al mismo tiempo
(intersección de elementos).
P (A o B) = P(A) + P(B) – P (A y B) → P(A U B) = P(A) + P(B) – P(A ꓵ B)
A = 1-2-4-6-7
1
B = 6-7-9-10 6
1-2-4 9-10
-
7
Ejemplo 5:
¿Cuál es la probabilidad de que al sacar una carta de un naipe salga un 3 o un trébol? (recuerde que
un naipe está compuesto por 52 cartas).
P (3 o trébol) = P (3) + P(trébol) – P (3 y trébol)
P (3 o trébol) = 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 = 30,77%
Ejemplo:
En la empresa BIOINGREDIENTS C.L. se realizan anualmente exámenes físicos de rutina como parte de
un programa de servicios de salud. Se descubrió que 25% de los empleados tienen el colesterol
elevado; 35% tienen diabetes y 5% tienen colesterol elevado y diabetes.
a) ¿Cuál es la probabilidad de que un empleado elegido de forma aleatoria tenga colesterol
elevado o diabetes?
b) Muestre esta situación en forma de diagrama de Venn.
A = colesterol 25% 1
B = diabetes = 35%
A = 0,25
(A y B) = 5% (AyB) = 0,05
P(A o B) = P(A) + P(B) – P(A y B) B = 0,35
P (A o B) = 0,25 + 0,35 – 0,05 = 0,55 ---→ 55%
78
_________________________________________________________________________________________
Regla del complemento. – Es la diferencia entre 1 que es el conjunto universo y la combinación de

eventos.
Se simboliza como P (no A).
P(no A) = 1 – P(A)
1
P(A)
1 – P(A) = P(no A) = azul
Ejemplo:
Regla especial de la suma: no tiene intersección
A = 20% = 0,20
1
B = 30% = 0,30 A = 0,20 B = 0,30
P (A o B) = P(A) + P(B)
P (A o B) = 20% + 30% = 50% 1-(AoB) = 0,50
P (A o B) = (0,20 + 0,30 = 0,50)

Pno(AoB) = 0,50
Ejemplo:
Eventos que no son mutuamente excluyentes y tienen una probabilidad conjunta.
Regla general de la suma: si tiene intersección
A = 20%
B = 30%
1
(A y B) = 15%
A AyB B
P (A o B) = P(A) + P(B) – P (A y B) 15%
20% 30%
P (A o B) = 20% + 30% – 15% = 35% ---→ 0,35
Pno(AoB) = 0,65 1-(AoB) = 65%
Ejemplo:
Si la probabilidad que llueva el día de hoy es 0,30 ¿Cuál es la probabilidad de que NO llueva?
P (NO llueve) = 1 – P (llueve ) = 1 – 0,30 = 0,70
79
_________________________________________________________________________________________
Reglas de la multiplicación
Se usan también para combinar eventos y se utiliza como conector la letra “y”.
Las reglas de la multiplicación se refieren a probabilidades conjuntas (caso de las intersecciones).
a) Regla especial de multiplicación. - Se utiliza para combinar eventos que son independientes.
Los eventos son independientes, cuando la ocurrencia de un evento no afecta la ocurrencia del otro
evento.
P(A y B) = P(A) x P(B) → P(A ꓵ B) = P(A) x P(B)
Ejemplo:
¿Cuál es la probabilidad de que al lanzar un dado salga el cuatro y al lanzar una moneda salga cruz?
P (4 y cruz) = P(4) x P(cruz)
P (4 y cruz) = 1/6 * 1/2 = 1/12 = 0,0833 = 8,33%
b) Regla general de la multiplicación. - Se utiliza cuando hay una probabilidad condicional.
La probabilidad condicional es la de que suceda un evento, dado que otro este por ocurrir o ya ocurrió.
El símbolo es una barra vertical “|” y se lee “dado que”.
P (A y B y C) = P(A) x P(B|A) x P (C|A y B)

Ejemplo:
¿Cuál es la probabilidad de que, al sacar tres cartas de un naipe, salga un cuatro, luego un seis y
luego un nueve?
P (4 y 6 y 9) = P (4) x P (6|4) x P (9|4 y 6)

P (4 y 6 y 9) = 4/52 * 4/51 * 4/50 = 0,000482 = 0,0482%
Ejemplo:
Sharon es una chica presentadora de eventos. Tiene 12 blusas en su clóset: 9 son blancas y 3 son
azules. Para cada presentación dentro de un mismo evento se cambia de blusa 3 veces. Como tiene
un tiempo limitado y se viste de noche, simplemente toma una blusa y se la pone. ¿Cuál es la
probabilidad de que las tres blusas elegidas sean blancas?
80
_________________________________________________________________________________________
P(B1 y B2 y B3) = P(B1) x P(B2|B1) x P(B3|B1 y B2)

P(B1 y B2 y B3) = (9/12) * (8/11) * (7/10) = 504 / 1320 = 0,38 = 38%
Ejercicios
1) Considere que los eventos A y B son mutuamente excluyentes, donde P(A) = 0,40 y P(B) = 0,50.
¿Cuál es la probabilidad de que ocurran ya sea A o B? ¿Cuál es la probabilidad de que ni A ni B
sucedan?
2) Si P(A) = 0,30; P(B) = 0,40 ¿cuál es la probabilidad de que ocurran A o B? ¿Y que no sucedan A
o B?
3) Se conoce que las probabilidades de los eventos A y B son 0,30 y 0,40 respectivamente. La
probabilidad de que A y B ocurran es de 0,20. ¿Cuál es la probabilidad de que A o B no ocurran?
4) Si P(A) = 0,50; P(B) = 0,35 y P(A y B) = 0,15 ¿cuál es la probabilidad de que ocurran ya sea A o
B? ¿Y que no sucedan A o B?
5) Continental Tire garantiza que los neumáticos RX-16 rinden 60.000 kilómetros con una
probabilidad de 0,95 antes de que falle o se desgaste. Cuando no cumple este parámetro se le
devuelve al comprador. Si Leo Salvador adquiere cuatro de estos neumáticos RX-16, ¿cuál es
la probabilidad de que los cuatro tengan una duración de 60.000 km? ¿Y cuantos no alcancen
ese kilometraje?
6) La probabilidad de que un estudiante talentoso apruebe una asignatura es de 0,90. ¿cuál es la

probabilidad de que apruebe las 4 asignaturas del semestre?
7) La Dirección de Carrera de la Facultad de Ciencias Administrativas consta de cuatro hombres y

tres mujeres. Un comité de tres personas debe ser elegido al azar para llevar a cabo una
investigación sobre la incidencia del COVID.
a) ¿Cuál es la probabilidad de que los tres miembros del comité sean mujeres?
b) ¿De que los tres miembros del comité sean hombres?
8) En un concurso para desarrollar un proyecto de investigación se han elegido 10 estudiantes: 6

mujeres y 4 hombres. Se debe elegir al azar un comité 4 estudiantes.
a) ¿Cuál es la probabilidad de que sean escogidos dos mujeres y dos hombres?
b) ¿Cuál es la probabilidad de que sean elegidas 4 mujeres?
c) ¿Cuál es la probabilidad de que sean elegidos 4 hombres?
81
_________________________________________________________________________________________
5.1.3 Tablas de contingencia

La tabla de contingencias es una matriz que representa los valores cruzados de dos variables de
interés relacionadas entre sí (Lind , Marchal, & Whaten, Estadística aplicada a los negocios y la
economía, 2012, pág. 162).
Ejemplo:
En una encuesta realizada a 1.200 jóvenes de 18 años, 700 tienen empleo y 800 son bachilleres; de
los 800 bachilleres, 600 tienen trabajo. Con estos datos se pide:
1. Elaborar una tabla de contingencia
2. Construir una tabla de probabilidad
3. Si se selecciona una persona al azar, ¿Cuál es la probabilidad de que un joven de 18 años
sea?
a) Empleado y bachiller
b) No empleado y bachiller
c) Un bachiller dado que tiene empleo
1. Tabla de contingencia
Ocupación / Título Bachiller No bachiller Total

Empleado 600 100 700
No empleado 200 300 500
Total 800 400 1.200
Frecuencias absolutas conjuntas
2. Tabla de probabilidades
Ocupación/Título Bachiller No bachiller Total

Empleado 600/1200 100/1200 700/1200
No empleado 200/1200 300/1200 500/1200
Total 800/1200 400/1200 1.200/1.200
Probabilidades conjuntas
Desarrollo del ejemplo:
82
_________________________________________________________________________________________
Bachiller No bachiller Calcular:

Evento B1 B2 Total a) P(A1 o A2)
A1 Empleado 600 100 700 b) P(A1 o B2)
A2 No empleado 200 300 500 c) P(A1 y A2)
Total 800 400 1200 d) P(A1 y B2)
Probabilidad clasica
P(A1) = 700 0,5833 58,33% P(B1) = 800 0,6667 66,67%
1200 1200
P(A2) = 500 0,4167 41,67% P(B2) = 400 0,3333 33,33%

1200 1200
Regla especial de la suma RES Eventos mutuamente excluyentes
a) P(A1 o A2) = P(A1) + P(A2) 700 500 1,0000 100,00%

+
1200 1200
Regla general de la suma RGS Intersección Eventos no mutuamente excluyentes
b) P(A1 o B2) = P(A1) + P(B2) - P(A1 y B2) 700 + 400 100 0,8333 83,33%
-
1200 1200 1200
Regla especial de la multiplicación REM Eventos independientes
c) P(A1 y A2) = P(A1) * P(A2) 700 500 0,2431 24,31%

x
1200 1200
Regla general de la multiplicación RGM Eventos condicionales
d) P(A2 y B1) = P(A2) * P(B1|A2) 500 200 200 0,1667 16,67%

x =
1200 500 1200
83
_________________________________________________________________________________________
Ejercicios
9) Con la siguiente tabla de contingencias:
Segundo evento
Primer evento B1 B2 B3 Total
A1 2 5 6 13
A2 1 4 5 10
Total 3 9 11 23
Determine:
a) P(A1); b) P (B2); c) P(A1 o A2); d) P(B2 o B3); e) P(A1 o B2); f) P(B1 o A2); g) P(A1 y A2);
h) P(B2 y B3); i) P(A2 y B1); j) P(B2 y A2); k) P(A1|B3); l) P(B2|A2)
5.1.4 Diagrama de árbol

Es una representación gráfica de todos los posibles resultados de un experimento.
Ejemplo: con la tabla del ejercicio 9:
Segundo evento
Primer evento B1 B2 B3 Total
A1 2 5 6 13
A2 1 4 5 10
Total 3 9 11 23
P(A y B)
Probabilidad clásica Probabilidad condicional P(Ai) P(Bi|Ai)
2 13 2 2 0,0870 8,70%
P(B1|A1) = * =
13 23 13 23
13 5 13 5 5 0,2174 21,74%
P(A1) = P(B2|A1) = * =
23 13 23 13 23
6 13 6 6 0,2609 26,09%
P(B3|A1) = *
13 23 13 = 23
1 10 1 1 0,0435 4,35%
P(B1|A2) = * =
10 23 10 23
10 4 10 4 = 4 0,1739 17,39%
P(A2) = P(B2|A2) = *
23 10 23 10 23
5 10 5 5 0,2174 21,74%
P(B3|A2) = * =
10 23 10 23
1,0000 100,00%
84
_________________________________________________________________________________________
Ejercicios
10) Desarrolle el diagrama de árbol de la siguiente tabla de contingencias:
B1 B2 B3
A1 5 4 1
A2 3 6 4
A3 4 5 2
11) Se realiza una encuesta a un grupo de personas para conocer el estado civil según la edad y los
resultados fueron los siguientes:
Estado civil
Eventos B1 B2 B3
Edad (años) Soltero Casado Divorciado
A1 menos de 25 66 12 2
A2 25 a 35 44 58 8
A3 35 a 45 15 65 10
A4 45 o más 5 92 23
Determine la probabilidad de que una persona elegida al azar:

a) Sea de menos de 25 años o tenga entre 35 a 45 años
b) Tenga de 25 a 35 o tenga 45 o más años
c) Sea soltero o sea divorciado
d) Tenga menos de 25 años o sea casado
e) Tenga 45 o más años o sea divorciado
f) Sea soltero o tenga 45 o más años
g) Tenga menos de 25 años y también entre 35 y 45 años
h) Tenga entre 35 y 45 años y sea divorciado
i) Que sea divorciado y tenga menos de 25 años
j) Que tenga 45 o más años y sea divorciado
k) Que tenga menos de 25 años siendo soltero
l) Que tenga entre 25 a 35 años siendo divorciado
m) Que tenga 45 o más años sabiendo que es divorciado
n) Que sea soltero sabiendo que es menor de 25 años
o) Que sea casado sabiendo que tiene entre 35 a 45 años
p) Que sea divorciado sabiendo que tiene 45 o más años
q) Desarrolle el diagrama de probabilidades (diagrama de árbol).
85
_________________________________________________________________________________________
5.1.5 Teorema de Bayes

Analiza la probabilidad condicional de un evento aleatorio A dado B [ P(A|B) ], en función de la
probabilidad condicional del evento B dado A [P(B|A)] y la distribución de probabilidad marginal de
sólo A.
𝑃(𝐴 𝑦 𝐵)
𝑃(𝐴|𝐵) =
𝑃(𝐴)
𝑃(𝐴) ∗ 𝑃(𝐵|𝐴)
𝑃(𝐴|𝐵) =
𝑃(𝐴)
Si (A1, A2, ….. Ai, …. An) es un conjunto de sucesos mutuamente excluyentes y exhaustivos, tales que
la probabilidad de cada uno de ellos es distinta de cero y, sea B un suceso cualquiera del que se
conocen las probabilidades condicionales P(B|Ai), entonces, la P(Ai|B) es igual a:
𝑃(𝐴𝑖) ∗ 𝑃(𝐵|𝐴𝑖)
𝑃(𝐴𝑖|𝐵) =
𝑃(𝐴1) ∗ 𝑃(𝐵|𝐴1) + 𝑃(𝐴2) ∗ 𝑃(𝐵|𝐴2)
Ejemplo 1:
Una fábrica de Snacks en la ciudad de Quito produce: el 25% de Tostitos; el 40% de Doritos y el 35%
de Papas. En la producción, los tres tienen defectos en el sellado de fundas; en Tostitos el 5%; en
Doritos el 6% y el 10% en Papas. Todos los productos llegan a una sola caja. ¿Cuál es la probabilidad
de que, al sacar una funda de un producto, este sea: a) tostitos con defectos; b) tostitos sin defectos?:
Desarrollo:
P(A1) = 0,25 P(Ai y B)
P(Ai|B) =
P(A2) = 0,40 P(A1 y B) + P(A2 y B)
P(A3) = 0,35
1,00
B1
P(B1|A1) = 0,05
P(B1|A2) = 0,06 desarrollo horizontal:
P(B1|A3) = 0,10 P(A1|B1) = P(A1 y B1)
B2 P(A1 y B1) + P(A2 y B1) + P(A3 y B1)
P(B2|A1) = 0,95
P(B2|A2) = 0,94
P(B2|A3) = 0,90
desarrollo vertical:
P(A1 y B1) P(A1) P(B1|A1) 0,25 0,05 0,0125
P(A1 y B1) P(A1) P(B1|A1) 0,25 0,05 0,0125 P(A1|B1) = 0,1748
P(A1|B1) =
+ P(A2 y B1) P(A2) P(B1|A2) 0,40 0,06 0,0240 17,48%
+ P(A3 y B1) P(A3) P(B1|A3) 0,35 0,10 0,0350
0,0715
P(A1|B2) = P(A1 y B2) P(A1) P( B2|A1) 0,25 0,95 0,2375

P(A1 y B2) P(A1) P( B2|A1) 0,25 0,95 0,2375 P(A1|B2) = 0,2558
P(A2 y B2) P(A2) P( B2|A2) 0,40 0,94 0,3760 25,58%
P(A3 y B2) P(A3) P( B2|A3) 0,35 0,90 0,3150
0,9285
Se observa que el porcentaje total de defectos en toda la producción es de 0,0715 (71,5%) y la

producción con cero defectos es del 0,9285 (92,85%).
86
_________________________________________________________________________________________
Ejemplo 2:
Una fábrica de televisores LED recibe los componentes LED de tres proveedores que están ubicados
en las ciudades de Quito, Guayaquil y Cuenca. De la ciudad de Quito recibe el 65%, de Guayaquil el
20% y de Cuenca el resto. Se conoce que los componentes LED de Quito tienen un 3% de defectos, de
Guayaquil un 5% y de Cuenca un 4%. Todos los componentes ingresan en una sola bodega sin
especificar su procedencia. Si se toma un componente al azar, cuál es la probabilidad de que:
a) ¿Sea de Quito y defectuoso?
b) ¿Sea de Cuenca y no defectuoso?
c) ¿La probabilidad de ser defectuosos?
d) ¿La probabilidad de no ser defectuosos?
Desarrollo:
Proveedor Defectos = B1 Sin defectos = B2
Quito P(A1) = 0,65 0,03 0,97
Guayaquil P(A2) = 0,20 0,05 0,95
Cuenca P(A3) = 0,15 0,04 0,96
1,00
Aplicando la fórmula de Bayes con 3 eventos Ai
P(Ai y B)
P(Ai|B) =
P(A1 y B) + P(A2 y B) + P(A2 y B)
Proveedor Ai Defectos B1 Sin defectos B2

Quito P(A1) = 0,65 P(B1|A1) = 0,03 P(B2|A1) = 0,97
Guayaquil P(A2) = 0,20 P(B1|A2) = 0,05 P(B2|A2) = 0,95
Cuenca P(A3) = 0,15 P(B1|A3) = 0,04 P(B2|A3) = 0,96
a) De Quito
P(A1) P(B1|A1) = 0,0195 = P(A1|B1) = 0,5493
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
b) De Guayaquil
P(A2) P(B1|A2) = 0,0100 = P(A2|B1) = 0,2817
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
c) De Cuenca
P(A3) P(B1|A3) = 0,0060 = P(A3|B1) = 0,1690
P(A1) P(B1|A1) + 0,0195
P(A2) P(B1|A2) + 0,0100
P(A3) P(B1|A3) + 0,0060 0,0355
87
_________________________________________________________________________________________
Aplicando el criterio de probabilidad conjunta

Regla general de la multiplicación P(A y B) = P(A) x P(B|A)
B1 = defectuosos B2 = no defectuosos
Probabilidad
Probabilida Probabilidad Probabilida Probabilida
a_priori Probabilidad Probabilidad Probabilida
Proveedor d a_posteriori d da
(conocida conjunta a priori d conjunta
condicional (despues de) condicional posteriori
antes de)
Ai P(Ai) P(B1|Ai) P(Ai y B1) P(Ai|B1) P(Ai) P(B2|Ai) P(Ai y B2) P(Ai|B2)
A1 Quito 0,6500 0,03 0,01950 0,54930 0,6500 0,970 0,63050 0,65371
A2 Guayaquil 0,2000 0,05 0,01000 0,28169 0,2000 0,950 0,19000 0,19699
A3 Cuenca 0,1500 0,04 0,00600 0,16901 0,1500 0,960 0,14400 0,14930
Total 1,0000 0,0400 0,03550 1,00000 1,0000 0,96450 1,00000
Probabilidad conjunta de defectos

P(Ai y B1) = 0,0355 Probab conjunta de cero defectos
P(Ai y B2) = 0,9645
Diagrama de árbol P(A y B) = P(A) x P(B|A)
Probabilidad clásica (a priori) Probabilidad condicional Probabilidad conjunta Probabilidad a posterior

P(Ai) P(Bi|Ai) P(Ai)*P(Bi|Ai) P(Ai|B)
Probabilidad clásica Probabilidad condicional P(Ai) P(Bi|Ai)
defectuoso P(B1|A1) = 0,03 0,65 X 0,03 = 0,0195 P(A1 y B1) = 0,5493

P(A1) = 0,6500
no defectuoso
P(B2|A1) = 0,970 0,65 X 0,97 = 0,6305 P(A1 y B2) = 0,6537

P(A2) = 0,2000
X =
no defectuoso
P(B2|A2) = 0,950 0,20 0,95 0,1900 P(A2 y B2) = 0,1970

P(A3) = 0,1500
no defectuosoP(B2|A3) = 0,960 0,15 X 0,96 = 0,1440 P(A3 y B2) = 0,1493
1,0000
suman defectuosos 0,0355
suman no defectuosos 0,9645
Ejercicios
12) Con los datos del ejemplo 1: P(A1) = 0,25; P(A2) = 0,40; P(A3) = 0,35; P(B1|A1) = 0,05; P(B1|A2)
= 0,06; P(B1|A3) = 0,10.
Aplique el teorema de Bayes para determinar:
a) P(A2|B1); b) P(A3|B1); c) P(A2|B2); d) P(A3|B2)
13) Una fábrica de microondas dispone de dos máquinas A1 y A2 que elaboran el 60% y el 40% de
la producción. El porcentaje de productos defectuosos de cada máquina es del 5% y 10 %
respectivamente.
88
_________________________________________________________________________________________
a) ¿Cuál es la probabilidad que el microondas haya sido fabricado por la máquina A1 sabiendo
que es defectuoso?
b) ¿Cuál es la probabilidad que el microondas haya sido fabricado por la máquina A2 sabiendo
que no es defectuoso?
c) ¿Cuál es la probabilidad conjunta de tener defectos?
14) Una distribuidora de mascarillas en Quito compra el producto en cuatro países: China provee
el 30%, Taiwán 25%, Corea del Sur 25%, e India el 20%. La empresa conoce de inicio que las
mascarillas producidas en China presentan el 3,5% de defectos; las de Taiwán el 4%; las de
Corea del Sur el 6%; y las de India el 6,5%. Si se toma un lote de mascarillas al azar:
a) ¿Cuál es la probabilidad que el lote de mascarillas defectuosa provenga de India?
b) ¿Cuál es la probabilidad conjunta de tener defectos?
15) De los turistas que visitan las Islas Galápagos, el 70% llegan a la Isla Santa Cruz y el resto a la
Isla San Cristóbal. El 35% de los turistas de Isla Santa Cruz y el 50% de San Cristóbal se hospedan
en hoteles, mientras que el resto lo hace en cabañas turísticas. Se elige al azar un turista que
se encuentra en las Islas Galápagos.
a) ¿Cuál es la probabilidad de que se haya hospedado en un hotel?
b) Si se sabe que el turista se ha hospedado en una cabaña turística, ¿cuál es la probabilidad
de que se encuentre en Santa Cruz?
5.1.6 Técnicas de conteo

Existen las siguientes reglas de conteo, útiles para determinar el número total de modos o formas en
que puedan ocurrir eventos.
La regla de la multiplicación
Establece que si existen m modos en que un evento pueda suceder y n formas en que otro pueda
ocurrir también, existirán entonces (m)*(n) modos en que los dos eventos pueden suceder.
Número de arreglos (o disposiciones) = (m)*(n)
Ejemplo 13:
Para armar un equipo de sonido se tienen 3 modelos de parlantes, 4 modelos de discos compactos y 5
modelos de amplificadores. ¿Cuántos modelos de equipos diferentes se pueden armar?
Número de arreglos = 3 x 4 x 5 = 60
Se pueden armar 60 modelos de equipos de sonido diferentes.
89
_________________________________________________________________________________________
Combinatoria
Es una parte de las matemáticas que estudia las diversas formas de realizar agrupaciones o arreglos
con los elementos de un conjunto, formándolas y calculado su número.
Sirve para encontrar el número de elementos del espacio muestral.

La combinación de eventos se puede clasificar:
1) importancia del orden de los elementos en: a) Permutaciones; b) Variaciones y c) Combinaciones,
2) la entrada de los elementos,
3) la repetición de los elementos.
A continuación, un resumen de estas condiciones:
Mapa conceptual de Combinatoria
Permutaciones SIN repetición

Son todos los arreglos de elementos en donde:
1. SI importa el orden que ocupa cada uno de los elementos.
2. SI entran todos los elementos en los arreglos.
3. NO se pueden repetir los elementos.
𝑛!
𝑛𝑃𝑟 = (𝑛−𝑟)!
𝑛!
Si n = r → = 𝑛𝑃𝑛 = (𝑛−𝑛)! --→ 𝑃𝑛 = 𝑛!
90
_________________________________________________________________________________________
Ejemplo:
a) ¿De cuantas maneras pueden sentarse 6 personas en una fila de 6 sillas?
6 5 4 3 2 1
n = 6; r = 6
6P6 = 720 maneras
P6 = 6! → 720 maneras
Permutación circular:
Son todos los arreglos de elementos de manera circular, en donde:
2. SI entran todos los elementos.
𝑃𝐶𝑛 = (𝑛 − 1)!
Ejemplo:
¿De cuantas maneras pueden sentarse 6 personas en una mesa redonda?
PC6 = (6 – 1)! = 5! = 120 maneras
Permutaciones CON repetición

1. SI importa el orden que ocupa cada uno de los elementos,
2. SI entran todos los elementos,
3. SI se pueden repetir los elementos.
Los n elementos se repiten de (a en a), de (b en b), de (c en c), etc.
Se verifica que a + b + c = n.
𝑛!
𝑛𝑃𝑅𝑎, 𝑏, 𝑐 =
𝑎!∗𝑏!∗𝑐!
Ejemplo:
a) ¿De cuantas formas pueden colocarse en línea 9 bolas (canicas), de las que 4 son blancas, 3
amarillas y 2 azules?
n = 9; r = 9 (4+3+2)
91
_________________________________________________________________________________________
9!
9PR4,3,2 = = 1.260 maneras
4!∗3!∗2!
b) Se quiere ordenar 7 libros: 4 de matemáticas, 2 de estadística y 1 de física.
7!
7PR4,2,1 = = 105 formas
4!∗2!∗1!
Variaciones SIN repetición:

2. NO entran todos los elementos en los arreglos.
𝑛!
𝑛𝑉𝑟 =
(𝑛 − 𝑟)!
𝑛!
(Es similar a Permutación sin repetición: 𝑛𝑃𝑟 = (𝑛−𝑟)! ) ; como n = r → Pn = n!
Ejemplo:
¿Cuántos números de tres cifras distintas se pueden formar con las nueve cifras significativas del
sistema decimal?
n = 9; r = 3
𝑛! 9!
𝑛𝑉𝑟 = (𝑛−𝑟)! 9V3 = (9−3)!
9V3 = 9 x 8 x 7 = 504 formas
Variaciones CON repetición:

2. NO entran todos los elementos.
𝑛𝑉𝑅𝑟 = 𝑛ʳ
Ejemplo:
1. Con las cifras 1, 2 y 3 ¿cuántos números de 5 cifras se pueden formar?
92
_________________________________________________________________________________________
n = 3; r = 5
3VR5 = 35 = 243 números
Combinaciones SIN repetición:

1. NO importa el orden que ocupa cada uno de los elementos.
𝑛!
𝑛𝐶𝑟 =
𝑟! ∗ (𝑛 − 𝑟)!
Ejemplo:
Un alumno decide rendir tres de cinco pruebas. ¿De cuántas maneras distintas puede elegir esas tres
pruebas?
5!
n = 5; r = 3 5C3 = = 10 maneras
3!(5−3)!
Combinaciones CON repetición:

1. NO importa el orden que ocupa cada uno de los elementos.
(𝑛 + 𝑟 − 1)!
𝑛𝐶𝑅𝑟 =
𝑟! ∗ (𝑛 − 1)!
Ejemplo:
En una bodega hay 5 diferentes tipos de gaseosas (coca cola, fanta, fruit, inca, quintuple). ¿De
cuantas formas se pueden elegir 4 gaseosas?
n = 5; r = 4
(5+4−1)!
5CR4 = 4!(5−1)!
= 70 maneras diferentes de elegir gaseosa
8*7*6*5*4*3*2*1 1680
(4*3*2*1)(4*3*2*1) 24
93
_________________________________________________________________________________________
Uso de calculadora y Excel para calcular permutaciones, variaciones y combinaciones
Las disposiciones de eventos “sin repetición”, que son de uso más generalizado, se pueden calcular
directamente en una calculadora científica.
Con el Excel también se pueden calcular los arreglos de eventos.
Cálculo con calculadora

Caso Cálculo con Excel
científica
Permutaciones sin repetición
nPr : n (shift tecla multip) r PERMUTACIONES(n;r)
Variaciones sin repetición
Combinaciones sin repetición nCr : n (shift tecla división) r COMBINAT(n;r)
Permutaciones con repetición N/A
PERMUTACIONES.A(n;r)
Variaciones con repetición N/A
Combinaciones con repetición N/A COMBINA(n;r)
Ejemplo 14:
nPr --→ n = número de elementos a ordenar; r = número objetos seleccionados
nCr --→ n = número de elementos a ordenar; r = número objetos seleccionados
5P5 = 5 (shift tecla multip) 5 = 120 -------- P5 = 5!
5V3 = 5 (shift tecla multip) 3 = 60
6C4 = 6 (shift division) 4 = 15
Resumen:
Permutación Permutación Permutación Variación sin Variación con Combinación Combinación

sin repetición circular con repetición repetición repetición sin repetición con repetición
PCn = nPRa,b,c = nVr = nCr = nCRr =

Pn = n! 𝑛! 𝑛! nVRr = nr 𝑛! (𝑛+𝑟−1)!
(n – 1)! 𝑎!𝑏!𝑐! (𝑛−𝑟)! 𝑟!(𝑛−𝑟)! 𝑟!(𝑛−1)!
¿Importa el
SI SI SI SI SI NO NO
orden?
¿Entran todos
SI SI SI NO NO NO NO
los elementos?
¿Se repiten los

NO NO SI NO SI NO SI
elementos?
94
_________________________________________________________________________________________
Ejercicios
Resuelva las siguientes operaciones:
16) 20! / 5!
17) 25! + 3!
18) 10! * 3!
19) 12! – 5!
20) 0!
21) 1!
22) 5P5
23) 9PR3,2,4
24) PC5
25) 5V4
26) 6VR3
27) 6C3
28) 8CR3
29) ¿Cuántos números de 5 cifras diferentes se pueden formar con los dígitos: 1, 2, 3, 4, 5?
30) En una clase de 30 alumnos se quiere elegir un comité formado por tres alumnos. ¿Cuántos
comités diferentes se pueden formar?
31) ¿De cuántas formas distintas pueden sentarse 7 personas en una fila de 7 butacas?
32) ¿De cuántas formas pueden mezclarse los siete colores del arco iris tomándolos de cuatro en
cuatro?
33) En el palo de señales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las nueve
banderas?
34) Una persona desea invitar a 5 de sus amigos entre un grupo de 10 amistades. ¿De cuántas
maneras puede hacerlo en total?
35) ¿De cuántas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de fútbol sabiendo que hay 10 posibles candidatos?
36) ¿De cuántas maneras se pueden ordenar 6 personas en una fila?
37) En una carrera compiten 10 caballos. En los boletos hay que indicar el nombre del 1º, 2º y 3º.
¿Cuántos boletos deberemos rellenar para asegurarnos de que ganaremos?
95
_________________________________________________________________________________________
CAPÍTULO 6
6. Distribuciones de probabilidad discreta

Distribución Probabilística. - Es un listado o agrupación de todos los resultados posibles de un
experimento y la probabilidad asociada a cada uno.
6.1. Distribución probabilística discreta

Puede considerar solo ciertos valores. Sus características principales son:
✓ La probabilidad de un resultado particular debe estar entre 0,00 y 1,00;
✓ La suma de probabilidades de un evento no puede ser menor o mayor a 1,00;
✓ Los resultados son mutuamente excluyentes.
6.1.1 Variable aleatoria

Variable aleatoria es toda función que asocia a cada elemento del espacio muestral E un número real.
Es un valor numérico determinado por el resultado de un experimento. Las variables pueden ser
discretas y continuas.
6.1.2 Variable discreta

Son aquellas que solo asumen ciertos valores, son producto de contar algo y son números enteros.
Ejemplo. El número de hijos de una familia, número de autos, etc.
6.1.3 Variable continua

Son aquellas que pueden asumir cualquier valor, son producto de medir algo y pueden ser números
enteros o decimales.
Ejemplo. La estatura de un estudiante (se mide con un flexometro); la presión de aire de un neumático
(se mide con barómetro); la temperatura del clima (se mide con un termómetro).
6.1.4 Probabilidad discreta5

Una distribución discreta describe la probabilidad de ocurrencia de cada valor de una variable aleatoria
discreta. Una variable aleatoria discreta es una variable aleatoria que tiene valores contables, tales
como una lista de enteros no negativos.
5
https://www.google.com/search?client=firefox-b-d&q=probabilidad+discreta
96
_________________________________________________________________________________________
Las distribuciones de probabilidad discretas describen valores distintos, normalmente números

enteros, sin valores intermedios, y se muestran como una serie de columnas verticales.
Entre las variables discretas (números enteros), se tienen: distribución binomial (eventos
independientes con reposición); distribución de Poisson (eventos independientes con reposición);
distribución hipergeométrica (eventos dependientes sin reposición).
Las distribuciones binomiales y de Poisson modelan situaciones en las que se realizan pruebas donde
la probabilidad de obtener uno de dos resultados mutuamente excluyentes es constante (proceso de
Bernoulli), en donde, en cada experimento se extraen o seleccionan los elementos y nuevamente se
reponen, mientras que, en la distribución hipergeométrica, se realizan experiencias sin devolución del
elemento extraído.
A diferencia de la distribución discreta, una distribución continua asume que hay un número infinito
de valores entre dos puntos de la distribución.
Términos relacionados:
Esperanza matemática o valor esperado, de una variable aleatoria discreta, es igual al sumatorio de
las probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso aleatorio.6
En matemáticas se llama simplemente media aritmética.
Ejemplo: La siguiente información que se presenta a continuación corresponde al número de
vehículos de una empresa que necesitó algún tipo de mantenimiento, en el primer trimestre del año
2022.
Mantenimiento
Frecuencia (f)
vehículos (x)
0 4
1 6
2 7
3 5
4 3
Total 25
6
José Francisco López. https://economipedia.com/definiciones/esperanza-matematica.html
97
_________________________________________________________________________________________
Se pide:
Elaborar una distribución de probabilidad discreta
Mantenimiento
Probabilidad
vehículos Frecuencia f
P(x)
(x)
0 4 4/25 = 0,16
1 6 6/25 = 0,24
2 7 7/25 = 0,28
3 5 5/25 = 0,20
4 3 3/25 = 0,12
Total 25 25/25 = 1,0
6.1.5 Media aritmética, varianza y desviación estándar de una distribución de

probabilidad discreta
La media y la varianza de una distribución probabilística se calcula como sigue:

• La media conocida también como valor esperado o esperanza matemática es igual a:
𝜇 = ∑ [𝑥 ∗ 𝑃(𝑥)]
• La varianza es igual a:
𝜎2 = ∑[(𝑥 − 𝜇)2 ∗ 𝑃(𝑥)]

Ejemplo:
Con los datos del ejercicio anterior calcular la media, varianza y desviación estándar de la
distribución.
X f P(x) X * P(x) (x - µ) (x - µ)² ( x - µ )² * P(x)

0 4 0,16 0,00 -1.88 3.5344 0.5655
1 6 0,24 0,24 -0.88 0.7744 0.1859
2 7 0,28 0,56 0.12 0.0144 0.0040
3 5 0,20 0,60 1.12 1.2544 0.2509
4 3 0,12 0,48 2.12 4.4944 0.5393
Total 25 1,00 1,88 1.5456
Media poblacional = µ = 1,88 (valor esperado o esperanza matemática

Varianza = σ² = 1,546
Desviación estándar = σ = 1,25
98
_________________________________________________________________________________________
Distribuciones de probabilidad discreta
P(X)
0,3 0,28
0,24
0,25 0,2
0,2 0,16
P(X)
0,15 0,12
0,1
0,05
0
0 1 2 3 4
Mantenimientos
Ejercicios
1) Se ha determinado que el número de taxis que llegan cada hora al aeropuerto Mariscal Sucre
sigue la siguiente distribución de probabilidad. Calcule la media, la varianza y la desviación
estándar.
Número taxis 0 1 2 3 4 5 6
probabilidad 0,05 0,10 0,15 0,25 0,30 0,10 0,05
2) La probabilidad de que las familias del conjunto habitacional Las Cucardas tengan 0, 1, 2, 3 o 4
autos se presenta a continuación. Calcule la media, la varianza y la desviación estándar.
autos 0 1 2 3 4
probabilidad 0,01 0,40 0,45 0,10 0,04
3) Se conoce que, durante intervalos aleatoriamente elegidos de 10 minutos, la llegada de clientes

al supermercado LEO sigue la distribución de probabilidades que se presenta. Calcule el número
esperado de llegadas en intervalos de 10 minutos y la desviación estándar.
llegada clientes 0 1 2 3 4 5
probabilidad 0,15 0,25 0,25 0,20 0,10 0,05
4) Se conoce que las ventas del edulcorante Biodolce en el supermercado LEO, sigue la siguiente
distribución de probabilidades. Calcule el valor esperado y la desviación estándar.
99
_________________________________________________________________________________________
Ventas (X) (miles) 15 16 17 18 19 20
probabilidad 0,15 0,25 0,25 0,20 0,10 0,05
6.2 Distribución de probabilidad binomial

Es una distribución de probabilidad discreta donde cada experimento:
a) es independiente,
b) solo puede tener uno de dos resultados posibles (mutuamente excluyentes), ejemplo: al
lanzar una moneda se tendrá cara o cruz,
c) es independiente de los demás que se realicen y su resultado no influye en las probabilidades
de los siguientes,
d) En cada uno la probabilidad de que se dé uno de los dos resultados será exactamente la
misma.
e) La distribución resulta de un conteo de número de éxitos en una cantidad fija de ensayos.
En la distribución binomial se tienen 3 variables:
1) n: número de veces que se repite el experimento,
2) p: probabilidad de éxito,
3) q: probabilidad de fracaso.
Siendo p y q los dos únicos resultados posibles, la suma será 1,00 por lo que p = 1 - q
Para realizar el experimento primero se debe definir p; ejemplo: en el lanzamiento de un dado se
debe definir si p (éxito) es que salga un número par o impar; a partir de ahí, q será la otra posibilidad.
Una probabilidad binomial se determina como sigue:
𝑃(𝑥) = 𝑛𝐶𝑥 ∗ 𝜋 𝑥 ∗ (1 − 𝜋)𝑛−𝑥
La media se calcula por: µ=𝑛∗𝜋

La varianza es: 𝜎2 = µ ∗ (1 − 𝜋)
• n = población
• π = probabilidad de éxito en cada ensayo --→ (p)
• (1 - π) = probabilidad de fracaso --→ (q)
• x = probabilidad a investigar
(Nota: n y π son las variables por identificar en los ejercicios).
100
_________________________________________________________________________________________
Ejemplo:
Como consecuencia de la pandemia del COVID 19, la empresa LEO informa que el 40% de sus cuentas
por cobrar a sus clientes están vencidas. El gerente toma una muestra aleatoria de cinco de estas
cuentas, para determinar la probabilidad de que:
a) Ninguna de las cuentas está vencida,
b) Dos cuentas están vencidas,
c) Las cinco cuentas estén vencidas.
n = 5; π = 0,40 (probabilidad éxito de que llegue tarde)

P(x) = 0
(0) = 5C0 * 0,400 * (0,60)5 = 0,078 comparar valores de tabla B9 (pag.792)
P(X) =2
P(2) = 5C2 * 0,402 * (0,60)3 = 0,346
P(X) =5
P(5) = 5C5 * 0,405 * (0,60)0 = 0,010
μ = n*π --→ μ = 5 * 0,40 = 2,00
𝛔² = μ *(1-π) -→ 𝛔² = 2 * (0,60) = 1,20
σ = 1,10
Directamente se puede resolver aplicando la fórmula Excel: DISTRIB.BINOM.N(X;n;π;0)

El cálculo de probabilidades, media, varianza y desviación estándar se puede obtener únicamente
de las casillas color azul.
Se demuestra que aplicando la distribución discreta también se puede calcular la media, varianza y
desviación estándar. Ver casillas color beige. No se requiere que este cálculo adicional se haga
siempre.
101
_________________________________________________________________________________________
Aplicando fórmula excel para distribución binomial:

DISTR.BINOM.N(X;n;pi;0)
X p(x) X * p(X) X-µ (X - µ)² (X - µ)²*P(X)

n= 5 0 0,078 - -2 4 0,3110
π= 0,4 1 0,259 0,259 -1 1 0,2592
2 0,346 0,691 0 0 -
3 0,230 0,691 1 1 0,2304
4 0,077 0,307 2 4 0,3072
5 0,010 0,051 3 9 0,0922
1,000 2,000 1,2000
µ = n*π 2,00 rango de desviación

σ² = u *(1-π) 1,20 0,90 3,10
des est = 1,10
En la Tabla B9 pág. 792 del libro de Lynd y Marchal se tienen las probabilidades para diferentes
casos de n y π (pi), de donde se pueden sacar directamente las probabilidades y además calcular
media y desviación estándar.
En este ejemplo se debe buscar n y π (pi):
Ejercicios
5) Se seleccionan aleatoriamente tres artículos de un proceso que se conoce que produce el
10% de artículos defectuosos. Determine la probabilidad de que exactamente:
a) 1 artículo sea defectuoso,
b) 3 artículos sean defectuosos.
c) Determine la media y la desviación estándar
6) Se ha determinado que 5 taxis llegan cada hora al aeropuerto Mariscal Sucre. Suponga que la
probabilidad de que cualquier taxi llegue tarde es de 0,20. Cuál es la probabilidad de que en la
siguiente hora:
a) ninguno de los taxis llegue tarde,
b) uno de los taxis llegue tarde.
c) Determine la media y la desviación estándar
102
_________________________________________________________________________________________
6.2.1 Distribuciones de probabilidad binomial acumulada

En este caso se desea conocer la probabilidad acumulada mayor o menor a la ocurrencia de un
evento “X”.
Ejemplo:
Un 33% de automóviles nuevos requerirá servicio por garantía en el primer año. La agencia LEO
autos vendió 7 automóviles en el mes de abril 2022.
a) ¿Cuál es la probabilidad de que exactamente ningún auto necesite servicio de garantía?

b) Determine la probabilidad de que al menos uno de ellos necesite servicio de garantía.
c) Calcule la media, la varianza y la desviación estándar de esta distribución probabilística.
X p(x) X * p(X) X-µ (X - µ)² (X - µ)²*P(X)

n= 7 0 0,0606 - -2 5,3361 0,3234
π= 0,33 1 0,2090 0,209 -1 1,7161 0,3586
2 0,3088 0,618 0 0,0961 0,0297
3 0,2535 0,760 1 0,4761 0,1207
4 0,1248 0,499 2 2,8561 0,3566
5 0,0369 0,184 3 7,2361 0,2670
6 0,0061 0,036 4 13,6161 0,0825
7 0,0004 0,003 5 21,9961 0,0094
1,0000 2,310 1,5477
µ = n*π 2,31 rango de desviación

σ² = u *(1-π) 1,55 1,07 3,55
des est = 1,24
Ejercicios
7) Con la información del ejemplo último, determinar:
a) P (x ≤ 3)
b) P (x ≥ 4)
c) P (x > 5)
d) P (x < 6)
8) En una distribución binomial donde n = 5 y pi = 0,25 determinar:

a) P (X ≤ 4)
b) P (X < 4)
c) P (X ≥ 2)
d) P (X > 2)
e) P (X al menos igual a 3)
103
_________________________________________________________________________________________
6.3 Distribución hipergeométrica

Tiene las siguientes características:
1) Tiene solo dos resultados posibles.
2) Cada experimento es sin reposición
3) La probabilidad de un éxito no es la misma en cada ensayo.
4) La distribución resulta de un conteo del número de éxitos en una cantidad fija de ensayos.
La probabilidad hipergeométrica se calcula por medio de la siguiente ecuación:
𝐶𝑥𝑆 ∗ 𝐶𝑛−𝑥
𝑁−𝑆
𝑃(𝑋) =
𝐶𝑛𝑁
N = tamaño población
S = número éxitos en la población
n = tamaño de la muestra o número de ensayos
X = número de éxitos en la muestra
C = símbolo de la combinación
Media 𝝁 = 𝒏𝒑 ; 𝒑= 𝑵
; 𝒒= −𝒑
𝑵−𝒏
Varianza 𝝈𝟐 = 𝒏𝒑𝒒 ∗ 𝑵−
(Nota: N, S, n son las variables a identificar en los ejercicios).
Ejemplo:
El Departamento de Sistemas de Informática de una institución está formado por doce profesores de
los cuales cuatro son mujeres. La directora, desea establecer un comité de cuatro miembros del
profesorado del departamento para que revise el plan de estudios.
Si selecciona el comité al azar:
a) ¿Cuál es la probabilidad de que exactamente dos profesores sean mujeres?

b) ¿Cuál es la probabilidad de que los cuatro docentes sean mujeres?
c) ¿Cuál es la probabilidad de que por lo menos uno de ellos sea mujer?
Se aplica la función Excel: DISTR.HIPERGEOM.N(X;n;S;N;0)
104
_________________________________________________________________________________________
Se demuestra que aplicando la distribución discreta también se puede calcular la media, varianza y
desviación estándar (ver casillas color beige). No se requiere que este cálculo adicional se haga
siempre. Tan solo se pueden aplicar las fórmulas para media y varianza.
Ejercicios
9) Quince de los 30 estudiantes del curso de Estadística inferencial se encuentran satisfechos
con el texto que se utiliza. Si una muestra de 5 estudiantes es interrogada sobre el texto,
determine la probabilidad de que:
a) exactamente 2 estudiantes se encuentren satisfechos con el texto,
b) al menos 2 estudiantes se encuentren satisfechos con el texto
10) En el departamento técnico de Electrónica LEO trabajan 3 ingenieros y 6 técnicos. Si se elige

aleatoriamente a 4 personas para ser asignados a un proyecto, ¿cuál es la probabilidad de
que el grupo encargado incluya a 2 ingenieros?
11) De cada 30 piezas fabricadas por una máquina, hay 2 que son defectuosas. Para realizar un
control de calidad, se observan 10 elementos y se rechaza el lote si hay alguna que sea
defectuoso. Vamos a calcular la probabilidad de que el lote sea rechazado.
12) En una bodega se tienen 20 computadoras, 3 de las cuales están defectuosas. Si se

seleccionan al azar 4 computadoras ¿cuál será la probabilidad de que dos de ellas tengan
desperfectos?
105
_________________________________________________________________________________________
6.4 Distribución de Poisson

Una variable sigue una distribución de Poisson si se cumplen las siguientes condiciones:
1. Los datos son conteos de eventos (enteros no negativos, sin límite superior).
2. Todos los eventos son independientes.
3. La tasa promedio no cambia durante el período de interés.
4. Cada resultado se clasifica en una de dos categorías mutuamente excluyentes.
5. La probabilidad de un éxito permanece igual de un ensayo a otro.
Una probabilidad de Poisson se determina a partir de la siguiente ecuación:
Donde “e” es la base del logaritmo natural igual a 2,718281...

(Nota: µ es la variable a identificar en los ejercicios).
Media 𝜇 = 𝑛𝜋
Varianza 𝜎 2 = 𝑛𝜋
Ejemplo:
Los automóviles de una cooperativa de taxis de la ciudad de Quito llegan a su estación en un promedio
de cuatro por minuto. ¿Cuál es la probabilidad de que en un minuto específico:
a) No lleguen automóviles P (x) = 0
b) Lleguen cuatro automóviles P (x) = 4
c) Lleguen cuatro o menos automóviles P (x ≤ 4)
d) Lleguen cuatro o más automóviles P (x ≥ 4)
En la tabla B5 (pag 788) del libro de Lind & Marchall se puede conseguir los resultados.
Se calcula mediante el uso de la función Excel POISSON.DIST(X;U;0)
106
_________________________________________________________________________________________
POISSON.DIST(X;U;0)
n= x p(x)
π= 0 0,0183
µ= 4 1 0,0733
2 0,1465
3 0,1954
a) 0,0183 4 0,1954
b) 0,1954 5 0,1563
c) 0,6288 6 0,1042
d) 0,5665 7 0,0595
8 0,0298
9 0,0132
10 0,0053
11 0,0019
12 0,0006
13 0,0002
14 0,0001
1,0000
Ejercicios
13) En una distribución de Poisson, µ = 0,4
a) ¿Cuál es la probabilidad de que x = 0?
b) ¿Cuál es la probabilidad de que x > 0?
14) Un promedio de 6 personas por hora utiliza el cajero automático de un banco durante el
horario pico de compras en el supermercado LEO. Cuál es la probabilidad de que:
a) exactamente 6 personas usen el cajero en una hora aleatoriamente seleccionada
b) menos de 5 personas usen el cajero en una hora aleatoriamente seleccionada,
c) ninguna persona la use.
107
_________________________________________________________________________________________
Resumen para identificar las distribuciones probabilísticas discretas
Binomial Hipergeométrica Poisson
𝑵−
𝒙 ∗ 𝒏−𝒙
Fórmula 𝑷(𝒙) = 𝒏 𝒙 ∗ 𝝅𝒙 ∗ ( − 𝝅)𝒏−𝒙 𝑷(𝑿) = 𝑵
𝒏
pequeña pequeña grande

muestra (n)
n< 30 n< 30 n≥30
π (probabilidad de
cualquier valor entre 60% y el 95% no tiene pequeña no más del 5%
éxito)
pequeña
N (población) no tiene no tiene
(poblaciones finitas)
S (cantidad de éxitos en
no tiene se obtiene de la población no tiene
N)
µ (media) µ = nπ no tiene µ = nπ
σ² (varianza) σ² = nπ(1 - π) no tiene σ² = nπ
σ (desviación estándar) raíz cuadrada de la σ² no tiene raíz cuadrada de la σ²
e (base de logaritmo
no tiene no tiene e = 2,71828
natural)
X (número de éxitos) en la pregunta en la pregunta en la pregunta
108
_________________________________________________________________________________________
CAPÍTULO 7
7. Distribuciones de probabilidad continua
7.1 Distribuciones de probabilidad uniforme
P(x)
1
altura = 𝑏−𝑎
0,2500
6 7 8 9 10
a) a= 6
b= 10 i= (b - a) = 4
La distribución de probabilidad uniforme es probablemente la más simple de una variable aleatoria.

Tiene forma rectangular y tiene valores mínimos y máximos.
1
𝑃(𝑥) = Si a ≤ X ≤ b y 0 en cualquier otro lugar
𝑏−𝑎
𝑎+𝑏
Media: 𝜇= 2
(𝑏−𝑎)2
Desviación estándar: 𝜎= √ 12
1
P(X) = Área = (base) (altura) (𝑏 − 𝑎) ∗ (𝑏−𝑎) = 1,00 (para todo el intervalo)
Base (Intervalo) = 𝑖 = (𝑏 − 𝑎)
Ejemplo:
Una distribución uniforme se define en el intervalo de 4 a 8.
a) ¿Cuáles son los valores de a y de b?
b) ¿Cuál es la media de esta distribución uniforme?
c) ¿Cuál es la desviación estándar?
d) Demuestre que el área total es de 1,00.
e) Calcule la probabilidad de un valor mayor que 6.
f) Calcule la probabilidad de un valor entre 5 y 7.
109
_________________________________________________________________________________________
Desarrollo:
P(x)
1
altura = 0,2500
𝑏−𝑎
4 5 6 7 8
a) a= 4
b= 8 i= (b - a) = 4
b) 𝑎 +𝑏 U= 6
𝜇=
2
1
altura = = 0,250
𝑏−𝑎
c) (𝑏 − 𝑎)2 σ= 1,15
𝜎=
12
d) Area = 4 0,250 = 1
e) P(X > 6) = i= 2
P(X > 6) = 2,0 0,250 = 0,50
P(5 ≤ X ≤ 7) = 2,0 0,250 = 0,50
Ejemplo:
La mayoría de las mariposas monarca nacen en la primavera y en el verano y viven entre 2 y 6
semanas como adulto, observándose una distribución uniforme.
g) Trace la distribución uniforme. ¿Cuáles son los valores de la altura y de la base?
h) Determine la media aritmética
i) Determine la desviación estándar
j) Demuestre que el área total bajo la curva es de 1,00.
k) ¿Cuál es la probabilidad de que una mariposa viva entre 5 y 6 semanas?
l) ¿Cuál es la probabilidad de que una mariposa viva menos de 5 semanas?
Desarrollo:
110
_________________________________________________________________________________________
P(x)
1
= 0,2500
𝑏−𝑎
2 3 4 5 6
b
a= 2
b= 6 i= (b - a) = 4
b) 𝑎 +𝑏 U= 4,00 semanas
𝜇=
2
c)
(𝑏 − 𝑎)2 σ= 1,15 semanas
𝜎=
12
d) (b-a) * (1/b-a) = 4 * 0,250 = 1
e) P(5 ≤ X ≤ 6) = i= 1
P(5 ≤ X ≤ 6) = 0,250 x 1 0,250
f) P(< X 5) = i= 3
P(< X 5) = 0,250 x 3 0,750
Ejercicios
1) Una distribución uniforme se define en el intervalo de 4 a 10.
e) Calcule la probabilidad de un valor mayor que 7.
f) Calcule la probabilidad de un valor entre 6 y 8.
2) Una distribución uniforme se define en el intervalo de 2 a 6.

e) Calcule la probabilidad de un valor mayor que 2,6.
f) Calcule la probabilidad de un valor entre 3,5 y 5,9
3) La cantidad de bebida en una lata de cerveza de 12 onzas tiene una distribución uniforme
entre 11,91 y 12,08 onzas.
111
_________________________________________________________________________________________
a) ¿Cuál es la cantidad media de bebida por lata?

b) ¿Cuál es la desviación estándar de bebida por lata?
c) ¿Cuál es la probabilidad de elegir una lata de cerveza que contenga menos de 12 onzas?
d) ¿Cuál es la probabilidad de elegir una lata de cerveza que contenga más de 11,9 onzas?
4) Las horas de sol en la ciudad de Quito fluctúa entre 4 y 7

a) ¿Cuál es la cantidad media de sol?
b) ¿Cuál es la desviación estándar de sol?
c) ¿Cuál es la probabilidad de tener entre 4 y 6 horas de sol?
d) ¿Cuál es la probabilidad de tener entre 5 y 7 horas de sol?
7.2 Distribución de probabilidad normal

Características:
✓ Es acampanada,
✓ La media, la mediana y la moda son iguales,
✓ Es simétrica,
✓ Es asintótica; la curva se aproxima al eje X pero nunca lo toca; alfa es ± infinita.
✓ El área total bajo la curva es 1.
U = mediana = moda
No existe una sola curva de distribución normal, sino una familia de estas, donde se pueden
observar:
a. medias iguales y desviaciones estándar diferentes,
b. medias diferentes y desviaciones estándar iguales:
112
_________________________________________________________________________________________
c. medias diferentes y desviaciones estándar diferentes:
7.2.1 Distribución de probabilidad normal estándar

Donde:

Teorema de Chebyshev .- La regla empírica o regla normal
Esta regla menciona que: En cualquier distribución de frecuencias simétrica con forma de campana,
aproximadamente 68% de las observaciones se encontrarán entre más y menos una desviación
estándar de la media; cerca de 95% de las observaciones se encontrarán entre más y menos dos
desviaciones estándares de la media y, de hecho todas (99,7%), estarán entre más y menos tres
desviaciones estándares de la media (Lind , Marchal, & Whaten, 2012, pág. 86).
113
_________________________________________________________________________________________
68 % Xm ± 1 S
95 % Xm ± 2 S
-3 -2 -1 0 1 2 3
99,7 % Xm ± 3 S
Donde:
El valor U + 1𝝈 de la escala X se convierte en un valor Z = 1, y así sucesivamente.

(𝑋−𝑢) (𝑋−𝑋𝑚)
Población: 𝑍= Muestra: 𝑍=
𝜎 𝑆
En la escala Z, en el centro de la curva de distribución es igual a cero, que significa que no hay desviación
respecto a la media.
114
_________________________________________________________________________________________
Las observaciones (se asumen la totalidad, pero en realidad es aproximado 99,7%) se encuentran bajo
la curva acampanada que representa 3 desviaciones estándar.
Ejemplo:
Un grupo de trabajadores tienen salarios con una media de $ 650, con una desviación estándar de $
25. De acuerdo con el teorema de Chebyshev, determinar:
a) ¿Entre que valores se encontrará aproximadamente el 68% de salarios?
b) ¿Entre que valores se encontrará aproximadamente el 95 % de salarios?
c) ¿Entre que valores se encontrará aproximadamente el 99,7 % de salarios?
d) ¿por lo menos qué porcentaje de ingresos se encontrará entre $ 575 y $ 725?
Desarrollo:
Datos:
Xm = 650
S= 25
X1 = 575
X2 = 725
Xm k desvest
a) 𝑋𝑚 ± 1𝑆 68% 650,00 -1 25 625,00
650,00 1 25 675,00
b) 𝑋𝑚 ± 2𝑆 95% 650,00 -2 25 600,00

650,00 2 25 700,00
c) 𝑋𝑚 ± 3𝑆 99,70% 650,00 -3 25 575,00

650,00 3 25 725,00
575 600 625 650 675 700 725 escala X

-3 -2 -1 0 1 2 3 escala Z
115
_________________________________________________________________________________________
Calculando con áreas bajo la curva se comprueba lo expresado por Chebishev
d)
0,4987 0,4987
escala X 575 650 725

escala Z -3,00 0 3,00
(𝑿 − 𝑿 )
Formula para transformar la escala X a Z =
575 650 -3,00 0,4987 49,87%
725 650 3,00 0,4987 49,87%
entre 575 y 725

P= 0,4987 0,4987 0,9974 99,74%
Conclusión: entre 575 y 725 se encuentra aproximadamente el 99,74% de los salarios que es el
porcentaje aproximado que señala Chebyshev.
Ejercicios
5) En un rango de calificaciones entre 0 y 50, la distribución de calificaciones de una muestra de
45 estudiantes de estadística presenta una media de 40 con una desviación estándar de 2.
Aplicando la regla empírica, que valores se encuentran entre: 68%, 95% y 99,7%.
6) Un grupo de observaciones presenta una media en ventas de $ 300 con una desviación
estándar de $ 20. Aplicando el Teorema de Chebyshev, ¿por lo menos que porcentaje de
ventas se encuentra entre $ 250 y $ 350?
7) En los 30 días del mes pasado se vendieron un promedio de 30 sanduches diarios con una
desviación estándar de 6. Utilizando la regla empírica:
a) ¿entre que dos valores será la venta del 68% de los sanduches?
b) ¿entre que dos valores será la venta del 95% de los sanduches?
c) ¿entre que dos valores será la venta del 99,7% de los sanduches?
8) En un grupo de observaciones de una muestra se tiene una media de $ 250, con una desviación
estándar es de $ 50. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje
de ingresos se encontrará entre $ 150 y $ 300?
9) En un conjunto de datos que presenta una media de 420 con una desviación estándar de 15.
Utilizando la regla empírica:
116
_________________________________________________________________________________________
a) ¿entre que dos valores se encuentran aproximadamente el 68%?

b) ¿entre que dos valores se encuentran aproximadamente el 95%?
c) ¿entre que dos valores se encuentran aproximadamente el 99,7%?
Determinación de áreas bajo la curva normal
A continuación, se observa que la aplicación de la distribución normal estándar se relaciona con la

determinación del área en una distribución normal entre la media y un valor elegido X.
Ejemplo:
Una población normal tiene una media de 15 y una desviación estándar de 5,5.
a) Calcule el valor de z asociado con 20
b) ¿Qué proporción de la población se encuentra entre 15 y 20?
Desarrollo:
µ= 15
σ= 5,5
X= 20
0,5 0,318
0,3186
𝒙−µ 15 20 0,1814
=
𝝈 0 0,91
X U Z
a) 20 15 0,91
b) entre 15 20 área p = 0,3186 31,86%
mayor a 20 área p = 0,5 -0,3186 = 0,1814 18,14%
menor a 20 área p = 0,5 0,3186 = 0,8186 81,86%
El área p se obtiene de la tabla B1 (pág. 782): Se localiza Z en la columna izquierda para los enteros y
el decimal y los valores de la fila horizontal superior para las centésimas: luego, el valor de la
probabilidad es la intersección de los parámetros indicados.
Ejemplo: Z = 0,91
117
_________________________________________________________________________________________
Utilizando la función Excel: =ABS(DISTR.NORM.ESTAND.N(Z;VERDADERO)-0,5) se tiene directamente

el valor del área o probabilidad desde el valor medio hasta la posición del valor Z (izquierda o derecha):
Igualmente se puede tener el valor Z a partir del área o probabilidad, utilizando:

=ABS (INV.NORM.ESTAND(0,5-Z))
área p = 0,3186
Z= 0,910
=ABS(INV.NORM.ESTAND(0,5-E43))
118
_________________________________________________________________________________________
Ejercicios
10) Un estudio reciente de salarios por hora de los empleados del supermercado LEO demostró
que el salario medio por hora era de $12 con una desviación estándar de $2,50. Suponga que
la distribución de los salarios por hora es una distribución de probabilidad normal. Si elige un
integrante de un equipo al azar, ¿cuál es la probabilidad de que gane:
a) entre $10 y $12 la hora?
b) más de $13 la hora?
c) menos de $10 la hora?
11) La media de una distribución de probabilidad normal es de 550 kg. La desviación estándar es
de 15 kg.
a) ¿Cuál es el área entre 530 kg y la media de 550 kg?
b) ¿Cuál es el área entre la media y 580 kg?
c) ¿Cuál es la probabilidad de seleccionar un valor al azar y descubrir que se encuentra
entre 535 y 580 kg?
12) La media de las calificaciones de 120 estudiantes de la Facultad de Ciencias Administrativas de

la UCE es de 15,5 sobre 20 puntos con una desviación estándar de 1,25. Suponiendo que los
puntajes se distribuyen normalmente, hallar cuántos estudiantes obtienen:
a) menos de 13,5 puntos,
b) entre 16 y 18 puntos,
c) 19 o más puntos.
13) Una población normal tiene una media de 20 y una desviación estándar de 2,5. Determine:
a) Calcule el valor de z asociado con 25
b) ¿Qué proporción de la población se encuentra entre 20 y 25?
c) ¿Qué proporción de la población es menor que 18?
d) ¿Qué proporción se encuentra entre 18 y 25?
e) ¿Qué proporción de la población se encuentra entre 25 y 27?
f) ¿Qué proporción de la población se encuentra entre 16 y 18?
g) ¿Qué proporción se encuentra entre 16 y 30?
14) La media de los pesos de 500 estudiantes de la Facultad de Ciencias Administrativas de la UCE
es de 68 kg con una desviación estándar de 2,5 kg. Suponiendo que los pesos se distribuyen
normalmente, hallar cuantos estudiantes pesan:
a) entre 65 y 68 kg
b) menos de 65 kg
c) más de 65 kg
d) entre 75 y 77 kg
e) menos de 74 kg
f) más de 74 kg
g) entre 65 y 74 kg
119
_________________________________________________________________________________________
15) Con los siguientes datos:

Xm = 22
S = 3,5
Calcule los valores X que corresponden a Z1 = -1,30 y Z2 = 2,00
16) ¿Cuál es el área o probabilidad entre:

a) Z1 = -1,00 y Z2 = -0,50

a) Z1 = -1,00 y Z2 = 1,50
b) ¿Cuál es el área o probabilidad mayor que Z1 = - 1,00?
c) ¿Cuál es el área o probabilidad menor que Z1 = - 1,00?
d) ¿Cuál es el área o probabilidad mayor que Z2 = 1,50?
e) ¿Cuál es el área o probabilidad menor que Z2 = 1,50?

f) Z1 = 1,50 y Z2 = 2,50
g) ¿Cuál es el área o probabilidad mayor que Z1 = 1,50?
h) ¿Cuál es el área o probabilidad menor que Z1 = 1,50?
i) ¿Cuál es el área o probabilidad mayor que Z2 = 2,50?
j) ¿Cuál es el área o probabilidad menor que Z2 = 2,50?
7.2.2 Distribuciones exponenciales
Distribución exponencial:
−𝝀𝒙
𝑷(𝒙) = 𝝀 ∗
1
Parámetro de ritmo: 𝜆=
𝑢
120
_________________________________________________________________________________________
Probabilidad usando la distribución exponencial:
Tiempo de llegada después de X: 𝑃(𝑡 > 𝑥) = ⅇ−𝜆𝑥

Tiempo de llegada antes de X: 𝑃(𝑡 < 𝑥) = 1 − 𝑒 −𝜆𝑥
ⅇdiana = − 𝑈 ∗ 𝑙𝑛(0,5)
Ejemplo:
Los tiempos de espera para recibir la comida después de hacer el pedido en Pollos LEO siguen una
distribución exponencial con una media de 8 minutos. Calcule la probabilidad de que un cliente
espere:
a) Menos de 7 minutos,
b) Más de 7 minutos,
c) Entre 6 y 7 minutos,
d) ¿Cincuenta por ciento de los clientes espera menos de cuántos segundos? ¿Cuál es la
mediana?
Desarrollo:
e= 2,71828
µ= 8
1
𝜆= 0,1250 parámetro de ritmo
𝑢
a) X= 7
−𝜆𝑥 = -0,88
𝑡 < 7 = 1 − 𝑒 −𝜆𝑥 0,5831
b) X= 7
−𝜆𝑥 = -0,88
𝑡 > 7 = 𝑒 −𝜆𝑥 0,4169
c) X= 6 X= 7
−𝜆𝑥 = -0,75 −𝜆𝑥 = -0,88
𝑡 < 6 = 1 − 𝑒 −𝜆𝑥 𝑡 < 7 = 1 − 𝑒 −𝜆𝑥

P(X) = 0,5276 P(X) = 0,5831
entre 6 y 7 minutos = 0,5831 (-) 0,5276 = 0,0555
d) 𝑝𝑒𝑟𝑐 50 = −𝑈 ∗ n(0,5) 5,55 minutos
121
_________________________________________________________________________________________
Ejercicios
15) El tiempo de vida de los teléfonos celulares sigue una distribución exponencial con una media
de 45.000 horas. Calcule la probabilidad de que el teléfono celular:
a) Falle en menos de 10.000 horas.
b) Dure más de 45.000 horas.
c) Falle entre 25.000 y 45.000 horas de uso.
d) Encuentre el 90o. percentil. ¿Diez por ciento de los televisores duran más de cuánto
tiempo?
16) El tiempo de vida de una lámpara especial sigue una distribución exponencial con media
de 100 horas.
a) ¿Cuál es la probabilidad de que una lámpara dure por lo menos 30 horas?
b) Si una lámpara ya lleva 50 horas de uso, ¿cuál es la probabilidad de que dure más de 80
horas?
c) Se seleccionan cinco lámparas, ¿Cuál es el número esperado de lámparas que duran por
lo menos 30 hs (considerando las 5)?
122
_________________________________________________________________________________________
CAPÍTULO 8
8. Números Índice
El índice es una herramienta estadística útil que expresa el cambio relativo de un valor de un período
a otro (Lind , Marchal, & Whaten, 2012, pág. 574). Compara una magnitud en dos situaciones distintas,
una de las cuales se considera como referencia. Se trata de comparar períodos de tiempos distintos,
situación geográfica, ingresos, o cualquier otra característica, expresado como porcentaje, que mide
un periodo dado contra un periodo base determinado.
Un caso de estos es el Índice de precios al consumidor (IPC), que es un indicador mensual, a nivel local
o nacional, que mide los cambios en el tiempo del nivel general de los precios, correspondientes al
consumo final de bienes y servicios de los hogares de estratos de ingreso: alto, medio y bajo, residentes
en el área urbana y rural del país. La variable principal que se investiga es el precio.
8.1 Índice simple

Expresa el cambio relativo de precio, cantidad o el valor en función de un período base (Lind , Marchal,
& Whaten, 2012, pág. 574)
𝑝𝑡
𝐼𝑠𝑝 = 𝑥 100 base = 100
𝑝𝑜
Ejemplos:
El precio de una libra de pollo en enero 2022 (pt) es de $ 1,20. En diciembre 2021 el precio (po) fue
de $ 1,00. ¿Cuál es el incremento?
𝑝𝑡 1,20
𝐼𝑠𝑝 = 𝑝𝑜 𝑥 100 𝐼𝑠𝑝 = 1,00 ∗ 100 = 120 → 20% (adicional al 100%)
Se observa un incremento de 20%

Ejemplo: con el sueldo básico del Ecuador
Año 2021 Sueldo básico $ 400,00
Año 2022 Sueldo básico $ 425,00
425
𝐼𝑠𝑝 = 400 ∗ 100 = 106,25 → 6,25% (incremento en el salario básico)
Clasificación de los índices. -

1. Índices no ponderados: Trabaja solo con la variable precios.
2. Índices ponderados: Trabaja con las variables precios y cantidades.
123
_________________________________________________________________________________________
8.1.1 Índices no ponderados
Índice simple de precios (ISP)

El ISP se calcula con el precio de un año seleccionado para analizar (ejemplo: 2020) designado como
“pt” dividido para el precio de un año o período anterior (2019 = 100) designado como “po”.
Al período base se le identifica con: año = 100.
En otros casos se utiliza el promedio de precios de dos años como referencia (ejemplo: base = 2018 –
2019 = 100
Ejemplo 1:
a) Se requiere calcular los índices simples de precios de un teléfono celular, en base al año 2000.
b) Se requiere calcular los índices de precios del teléfono celular, en base a los años 2005 y 2010.
Los precios del teléfono celular, en varios periodos son:
𝑝𝑡
𝐼𝑠𝑝 = 𝑥 100
𝑝𝑜
Precio teléfono Índices simples de precios Isp Índice de precios

Año (base: 2000 = 100) (2005-2006 = 100)
celular dólares
90 90
2000 90 𝑥100 = 100 𝑥100 = 70,58
90 127,5
120 120
2005 120 𝑥100 = 133,33 𝑥100 = 94,12
90 127,5
135 135
2006 135 𝑥100 = 150 𝑥100 = 105,88
90 127,5
147 147
2007 147 𝑥100 = 163,33 𝑥100 = 115,29
90 127,5
2008 160 177,77 --→ 77,77% 125,49 --→ 25,49%
Ejemplo:
Determinar el índice de precios de cada artículo, considerando como base el año 2009, con los precios
de 6 artículos de una canasta en dos períodos:
Índice simple Pi
Artículo Precio 2009 (po) Precio 2021 (pt)
(2009 = 100)
Huevos (docena) 0,70 1,20 171,43
Pan (7 unidades) 0,50 1,10 220
Leche (litro) 0,55 0,85 154,54
Queso (libra) 1,00 2,30 230
Arroz (libra) 0,30 0,50 166,67
Total ∑𝑝𝑜 = 3,05 ∑𝑝𝑡 = 5,95 ∑𝑝𝑖 = 942,64
124
_________________________________________________________________________________________
El aumento de precio mayor afectó al queso en 130% (230 - 100 = 130), y el pan quedó en segundo
lugar, con 120% (220 - 100 = 120).
Índice promedio de precios relativos

∑𝐼𝑠𝑝𝑖
𝐼𝑃𝑟 =
𝑛
Donde Pi representa el índice simple de cada uno de los artículos, y n, el número de artículos.
Con los índices simples del ejemplo 2:
∑𝐼𝑠𝑝𝑖 171,43 + 220 + 154,54 + 230 + 166,67
𝐼𝑃𝑟 = = = 188,53
𝑛 5
Esto indica que la media ponderada del grupo de productos aumentó en 88.53% desde el 2009 al
2019.
Índice agregado simple

Es la media aritmética de los precios po y pt de n artículos en los períodos seleccionados.
∑𝑝𝑡
𝐼𝐴𝑠 = 𝑥100
∑𝑝𝑜
Con los precios del ejemplo 2:
∑𝑝𝑡 5,95
𝐼𝐴𝑠 = 𝑥100 = 𝑥100 = 195,08
∑𝑝𝑜 3,05
Ejemplo:
En la siguiente tabla se reportan las ganancias del Supermercado LEO en el período 2013 a 2018.
Desarrolle un índice, con 2013 como base, que muestre el cambio de las ganancias durante el periodo.
Ganancia en Índice de precios

Año
millones (2013 = 100)
345,93
2013 345,93 𝑥100 = 100
345,93
567,43
2014 567,43 𝑥100 = 164,03
345,93
475,98
2015 475,98 𝑥100 = 137,59
345,93
378,78
2016 378,78 𝑥100 = 109,50
345,93
679,34
2017 679,34 𝑥100 = 196,38
345,93
789,45
2018 789,45 𝑥100 = 228,21
345,93
125
_________________________________________________________________________________________
Interpretación:
a) El precio de las ganancias de SUPERMERCADO LEO en el año 2018 aumento en 128,21%,
respecto al año 2013.
b) Se concluye que cada año va aumentando sus ganancias considerablemente.
Ejemplo:
A continuación, se enumeran las ventas netas de Corporación SALVADOR en el Ecuador, en el período
2013 a 2017. Determine el índice 2013 = 100 y 2016-2017 = 100. ¿En cuánto aumentaron las ventas
netas desde el periodo base?
Índice de precios Índice de precios

Años Ventas (Millones)
(2013=100) (2016-2017) =100
568,76 568,76
2013 568,76 𝑥100 = 100 𝑥100 = 117,79
568,76 482,83
457,65 457,65
2014 457.65 𝑥100 = 80,46 𝑥100 = 94,78
568,76 482,83
597,56 597,56
2015 597.56 𝑥100 = 105,06 𝑥100 = 123,76
568,76 482,83
532,12 532,12
2016 532.12 𝑥100 = 93,55 𝑥100 = 110,21
568,76 482,83
433,54 433,54
2017 433,54 𝑥100 = 76,22 𝑥100 = 89,79
568,76 482,83
Interpretación
• Las ventas netas aumentaron en el año 2015 en un 5,06 %, con respecto al año base 2013.
• Las ventas aumentaron 23,76% en el año de 2015, con respecto a los años base (2016-2017).
8.1.2 Índices ponderados
Estos índices permiten observar cómo es la evolución del costo de vida de un país, entre un:
1. período actual con variables de precios pto y cantidades consumidas qt (ejemplo: enero 2021)
y,
2. un período anterior con variables de precios po y cantidades consumidas qo (ejemplo: enero
2020).
Los métodos que más se utilizan para calcular el índice de precios y cantidades consumidas son el de
Laspeyres y el de Paasche. Sin embargo, existen otros métodos expresados por otros investigadores
como Fisher y Edgeworth.
126
_________________________________________________________________________________________
Índice de Precios de Laspeyres

∑(𝑝𝑡 ∗ 𝑞𝑜)
𝑰𝑳 = ∗ 100
∑(𝑝𝑜 ∗ 𝑞𝑜)
Este método es el más acogido para calcular los índices de precios, porque implica gastar menos
recursos. Únicamente se tiene que actualizar los precios de los productos para el período analizado.
El Instituto Nacional de Estadísticas y Censos INEC utiliza esta metodología para calcular el IPC.
El Índice de Precios al Consumidor (IPC) es un indicador mensual, nacional y para nueve ciudades, que
mide los cambios en el tiempo del nivel general de los precios, correspondientes al consumo final de
bienes y servicios de los hogares de estratos de ingreso: alto, medio y bajo, residentes en el área urbana
del país. Mensualmente se levantan aproximadamente 25.350 tomas de precios para los artículos, que
conforman los 359 productos de la Canasta de bienes y servicios del IPC (INEC, Indice de Precios al
Consumidor, ecuadorencifras.gob.ec, 29 enero 2021).
Ejemplo:
La madre de Paola decide salir a comprar algunos artículos de aseo con la misma cantidad de dinero
que salía hace dos años atrás, es decir en el año 2015. El valor es de $30 dólares, y lo que necesita
saber es si puede comprar la misma cantidad de artículos con la misma cantidad de dinero.
2015 2017
Precio Cantidad Precio Cantidad
Artículos po*qo po*qt pt*qo pt*qt
(po) (qo) (pt) (qt)
Detergente 0,80 5 1,20 3 4,00 2,40 6,00 3,60
Des i nfecta nte 2,15 2 3,54 1 4,30 2,15 7,08 3,54
Ja bon a nti ba cteri a l 1,00 3 1,38 2 3,00 2,00 4,14 2,76
Toa l l a 4,75 1 5,80 1 4,75 4,75 5,80 5,80
La va va ji l l a 1,25 2 2,30 1 2,50 1,25 4,60 2,30
Suman 18,55 12,55 27,62 18,00
27,62
𝑰𝑳 = ∗ 100 = 148,89
18,55
Interpretación:
Según el índice de precios de Laspeyres los precios en el mercado han aumentado en 48,49% y la madre
de Paola ya no puede comprar los mismos artículos con los US$ 30,00
Índice de precios de Paasche

Este método surge como alternativa a la fórmula planteada por Laspeyres, puesto que al parecer su
teoría no es muy realista, pues se dice, que no puede ser que las cantidades de productos utilizadas en
un año base sean las mismas para años posteriores, y que siempre habrá una variación por más mínima
que sea.
127
_________________________________________________________________________________________
Ante esta situación se origina la propuesta de Paasche, misma que dedujo que se utilizaría las
cantidades del periodo actual; no obstante, se han presentado algunos inconvenientes, uno de los más
relevantes, es el ponderar para cada año corriente, ya que es algo laborioso y lleva de mucho tiempo
para tener los resultados y poder ser analizado.
∑(𝑝𝑡 ∗ 𝑞𝑡)
𝑰𝑷 = ∗ 100
∑(𝑝𝑜 ∗ 𝑞𝑡)
Mediante este índice ponderado de Paasche, se puede observar los cambios de precios dentro de un
determinado periodo; es decir que nos permitirá conocer la situación actual, sea el caso de que un país
quiere conocer el valor o el costo de la canasta básica, por lo que actualizado sus valores se obtendrá
un porcentaje de incremento o disminución en comparación al año base.
Ejemplo:
En base al ejemplo 5, determinar la variación de precios según Paashe.
18,00
𝑰𝑷 = ∗ 100 = 143,43
12,55
Según Paasche, los precios del 2017 al 2015 variaron en 43,43%.
Comparando los índices de Laspeyres y Paasche en el ejemplo 5 y 6 se tiene que son 48,89% y 43,43%
respectivamente.
Se observa una variación de 5,06%, que puede ser significativa según el caso en análisis, pero cuando
se trata de calcular mensual y anualmente la variación de los índices de precios de un país se pone de
manifiesto el gasto económico que representa.
Índice ideal de Fisher

Este índice trata de suavizar los valores de Laspeyres y de Paasche, calculado mediante la raíz cuadrada
del producto de estos.
𝑰𝑭 = √𝐼𝐿 ∗ 𝐼𝑃
Ejemplo:
Tomando los mismos valores de los ejemplos 5 y 6, se determina el índice según Fisher.
𝑰𝑭 = √(48,89 ∗ 43,43)
𝑰𝑭 = 46,07
128
_________________________________________________________________________________________
En realidad, para calcular este índice, obligatoriamente se deben calcular los otros, lo que implica
utilizar más recursos.
8.1.3 Índice de valores
Para el cálculo de este índice se toma en cuenta los precios y cantidades del año base, asimismo, los
precios y cantidades del año actual, solo así se podrá observar los cambios o variaciones entre precios
y cantidades de los dos años.
∑(𝑝𝑡 ∗ 𝑞𝑡)
𝑰𝑽 = ∗ 100
∑(𝑝0 ∗ 𝑞0)
Ejemplo 8:
Aplicando el ejemplo 5, determinar el Índice de Valores.
2015 2017
Precio Cantidad Precio Cantidad
Artículos po*qo po*qt pt*qo pt*qt
(po) (qo) (pt) (qt)
Detergente 0,80 5 1,20 3 4,00 2,40 6,00 3,60
Des i nfecta nte 2,15 2 3,54 1 4,30 2,15 7,08 3,54
Ja bon a nti ba cteri a l 1,00 3 1,38 2 3,00 2,00 4,14 2,76
Toa l l a 4,75 1 5,80 1 4,75 4,75 5,80 5,80
La va va ji l l a 1,25 2 2,30 1 2,50 1,25 4,60 2,30
Suman 18,55 12,55 27,62 18,00
18,00
𝑰𝑽 = ∗ 100
18,55
𝑰𝑽 = 97,03
Los precios y cantidades del año 2017 han decrecido en 3% respecto al año 2015
8.1.4 Índice de precios al consumidor (IPC)

Este índice mide el cambio de precios de una canasta básica de bienes y servicios de un período a
otro.
Este índice es calculado por el INEC a través del índice de precios de Laspeyres.
Es un indicador que mide la tasa de inflación en el país ya que determina el grado en que se reduce el
poder de compra de la moneda como consecuencia del incremento de los precios.
Es una medida para revisar los salarios, pensiones y otros ingresos con el fin de mantener una
paridad con los cambios de los precios.
En el Ecuador, el Instituto Nacional de Estadísticas y Censos (INEC), en el Boletín Técnico informativo
que publica mensualmente puntualiza que:
129
_________________________________________________________________________________________
El IPC permite medir la variación de precios en el tiempo de una canasta de bienes y servicios
representativos del consumo nacional de los hogares. Dicha variación se conoce como
inflación. El IPC tiene un uso generalizado como factor de ajuste para los valores monetarios
de ciertos pagos como: salarios, prestaciones sociales, rentas de viviendas, intereses,
impuestos, valor del capital de activos y pasivos monetarios, etc. Además, el IPC constituye
un insumo directo en la elaboración de las cuentas nacionales (por su influencia en el
deflactor del gasto de consumo de los hogares) y por tanto, es una variable macroeconómica
de monitoreo continuo por su reconocida relevancia económica, social, jurídica y política.
En el IPC, la variable principal que se investiga es el “precio de comprador”, para una canasta
fija de 359 productos, seleccionados por su frecuencia y relevancia en la estructura del gasto
familiar de la Encuesta Nacional de Ingresos y Gastos de los Hogares Urbanos y Rurales
(ENIGHUR) del periodo abril 2011 – marzo 2012.
El año base del IPC es el 2014. Actualización metodológica que contó con el acompañamiento
técnico de la Comisión Económica para América Latina y el Caribe (CEPAL). Para mayor
detalle de la metodología del IPC (http://www.ecuadorencifras.gob.ec//indice-de-precios-al-
consumidor/).
El principal objetivo de esta operación estadística es generar el indicador económico que
permite calcular la inflación del país, a través de una recopilación mensual de precios al
consumidor final urbano.
El proceso de captación de precios se realiza directamente en los establecimientos
económicos y viviendas alquiladas del área urbana de las ciudades con mayor representación
demográfica y en el gasto de consumo: Quito, Ambato, Cuenca, Loja, Guayaquil, Esmeraldas,
Machala, Manta y Santo Domingo de los Colorados; en donde se indaga el precio de contado
que pagan los consumidores al momento de adquirir un bien o servicio, incluyendo el pago
por concepto de impuestos que gravan al consumo como el Impuesto al Valor Agregado
(IVA), o el Impuesto a los Consumos Especiales (ICE) (SCN 2008).
La investigación mensual de precios se realiza en aproximadamente 5.276 establecimientos
económicos y 3.942 viviendas alquiladas (casa, departamento o pieza) del área urbana, en 9
ciudades auto representadas.
El cambio de año base del IPC (Base: 2014=100), tiene como finalidad actualizar la estructura
de consumo de los hogares ecuatorianos.
Con fines académicos, se ha copiado la evolución del IPC del mes de marzo 2023.
https://www.ecuadorencifras.gob.ec Boletín Técnico 03-2023 IPC
Evolución del Índice de Precios al Consumidor y sus variaciones: estructura e incidencia

nacional
En marzo 2023, el Índice de Precios al Consumidor se ubicó en 110,45. Con esto, la inflación se
ubicó en 0,06%, comparado con el mes anterior que fue de 0,02%; mientras que en marzo
2022 se ubicó en 0,11%.
130
_________________________________________________________________________________________
Como resumen de esta tabla se observa que el IPC en marzo 2023 es de 110,45 en comparación a
marzo 2022 que fue de 107,39. Se observa una variación de 3,06%.
La inflación anual en marzo 2023 es de 2,85% mientras que el año pasado fue de 2,64%. Variación de
0,21%.
Estos son breves datos informativos observados en el mes de marzo 2023. Para tener más información,
se debe acudir a investigar en los boletines técnicos que el INEC publica mensualmente.
Efectos del IPC

Poder de compra del dólar
El poder de compra del dólar se mide a través del IPC:
1
𝑃𝑜𝑑𝑒𝑟 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑ó𝑙𝑎𝑟 = 𝑥 100
𝐼𝑃𝐶
Ejemplo:
IPC marzo 2023 = 110,45
1
𝑃𝑜𝑑𝑒𝑟 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑ó𝑙𝑎𝑟 = = 90,54 𝑐𝑡𝑣𝑠
110,45
131
_________________________________________________________________________________________
IPC marzo 2022 = 107,39

1
𝑃𝑜𝑑𝑒𝑟 𝑐𝑜𝑚𝑝𝑟𝑎 𝑑ó𝑙𝑎𝑟 = = 93,11 𝑐𝑡𝑣𝑠
107,39
Interpretación: En marzo 2023, el dólar vale 90,54 ctvs mientras que en marzo 2022 valía 93,11 ctvs.
Ingreso real monetario

El ingreso real monetario se mide a través del IPC:
𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑚𝑜𝑛𝑒𝑡𝑎𝑟𝑖𝑜
𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑟𝑒𝑎𝑙 𝑚𝑜𝑛𝑒𝑡𝑎𝑟𝑖𝑜 = 𝑥 100
𝐼𝑃𝐶
Ejemplo:
Salario básico 2023 = 450,00
IPC marzo 2023 = 110,45
450
𝐼𝑅𝑀 = 𝑥 100 = 407,42 dólares
110,45
Salario básico 2022 = 425,00

IPC marzo 2022 = 107,39
425
𝐼𝑅𝑀 = 𝑥 100 = 395,73 dólares
107,39
Interpretación: En marzo 2023, el salario básico tiene un valor real de 407,42 dólares, mientras que en
marzo 2022 fue de 395,73 dólares.
El salario básico nominal subió en 25 dólares mientras que el incremento real por efecto del IPC es de
11,69 dólares.
8.1.5 Índices para propósitos especiales

El índice especial, también es denominado índice de satisfacción del Consumidor, ya que sirve para
medir el grado de bienestar en relación del consumidor y factores como el producto, salario, entre
otros.
Dentro de los índices para propósitos especiales también se encuentra inmerso el índice de precios al
productor que, como menciona se trata de recopilar información sobre precios en base a los
productores.
8.1.6 Cálculo de la canasta básica familiar (CBF)

Canasta básica familiar en marzo 2023 = US$ 766,62 para una familia de 4 personas con 1,6
perceptores que viven con salario básico.
132
_________________________________________________________________________________________
Salario básico 2019 = US$ 394,00

Salario básico SB = 450,00
Décimo tercer sueldo = 37,50 (Total ganado en el año dividido para 12)
Décimo cuarto sueldo = 37,50 (Salario básico dividido para 12)
Remuneración básica unificada RBU = 525,00
N° personas por familia = 4 (INEC censo 2010)
N° perceptores de ingreso SB por familia = 1,6
Ingreso familiar = 525,00 x 1,6 = US$ 840,00 > US$ 766,62
840,00 / 766,62 *100 → Índice = 109,57 → 9,57%%
Canasta vital septiembre 2022 = US$ 541,91
133
_________________________________________________________________________________________
Referencias bibliográficas
Ditutor. (2015). www.ditutor.com. Obtenido de
http://www.ditutor.com/estadistica/medidas_posicion.html
Equipo de redacción, R. e. (2016). Tipos de gráficos estadísticos. Obtenido de

http://www.mastiposde.com/graficos_estadisticos.html
Lind , D., Marchal, W., & Whaten, S. (2012). Estadística aplicada a los negocios y la economía (Decima
quinta ed.). México, DF, México: Mc Graw Hill.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadística aplicada a los negocios y la economía. México:
McGRAW-HILL.
Spiegel, M., & Stephens, L. (2009). Estadística. México: Mc Graw Hill.
Webster, A. (2000). Estadística aplicada a los negocios y la economía. Santa Fe de Bogotá: Mc Graw
Hill.
134
_________________________________________________________________________________________
Tabla B1: Áreas bajo la curva normal
Tomado del libro de Lynd y Marchall
Z= 2,52
área p = 0,4941
=ABS(DISTR.NORM.ESTAND.N(Z;1)-0,5)
área p = 0,4929
Z= 2,452
=ABS(INV.NORM.ESTAND(0,5-E43))
135
_________________________________________________________________________________________
Tabla B2: Distribución T de Student

136
_________________________________________________________________________________________
Tabla B2: Distribución T de Student (continuación)
137
_________________________________________________________________________________________
Tabla B6: Tabla de números aleatorios
138

Estadística Descriptiva y Probabilidades 2da Edición Mayo 2023

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Descriptiva y Probabilidades 2da Edición Mayo 2023

Cargado por

Copyright:

Formatos disponibles

Estadística Descriptiva y Probabilidades 2da edición (30-05-2023)

Autor: Ing. Leonardo Salvador Pérez, MSc.

Guía didáctica de aprendizaje

Leonardo Salvador Pérez

ESTADÍSTICA DESCRIPTIVA Y PROBABILIDADES

4.1.1 Diagrama de caja ................................................................................................................ 66

¿Por qué estudiar estadística?

1.1 Definición de estadística

1.2 Tipos de estadística

1.2.1 Estadística descriptiva

1.2.2 Estadística inferencial

Ejemplo: Los estudiantes de la Facultad de Ciencias Administrativas.

1.3.1 Variable cualitativa

1.3.2 Variable cuantitativa

Figura 1. Resumen de los tipos de variables.

1.4 Niveles de medición

1.4.1 Datos de nivel nominal

1.4.2 Datos de nivel ordinal

1.4.3 Datos de nivel de intervalo

1.4.4 Datos de nivel de razón

Figura 2. Resumen de niveles de medición.

2.1 Tablas de frecuencias

Tabla 1. Ejemplo 1 de tabla de frecuencias

Total 520 100,00%

Representación gráfica con diagramas de barras

Número de autos vendidos

Figura 3. Histograma de frecuencias absolutas

Número de autos vendidos

Figura 4. Histograma de frecuencias relativas

Representación gráfica con diagrama circular: pastel

Número de autos vendidos

Cuenca; 180 Quito; 140

Figura 5. Representación gráfica circular frecuencias absolutas

Número de autos vendidos

Figura 6. Representación gráfica circular frecuencias relativas

Tabla 2. Ejemplo 2 de tabla de frecuencias

100 100 Invierno

Figura 7. Representación gráfica circular frecuencias absolutas

Otoño; 11% Invierno; 11%

Figura 8. Representación gráfica circular frecuencias relativas

6) Un concesionario de venta de autos Toyota ha vendido las siguientes cantidades en el segundo

2.2 Distribución de frecuencias

Tabla 3. Variable: calificaciones de evaluaciones de estudiantes

Tabla 4. Organización de datos para realizar distribución de frecuencias

2.2.1 Número de clases

También se puede calcular el número de clases k utilizando la Regla de Sturges:

K = 1 + 3,33 log (n)

En el desarrollo de este libro, se aplicará la regla de 𝟐𝒌 ≥𝒏

Aplicando la Regla de Sturges:

K = 1 + 3,33 * log 45 → K = 6,51 → K = 7

Aplicando la Regla de Sturges:

Cuando no se dispone de una calculadora a la mano, es facil aplicar la Regla de 𝟐𝒌 ≥ 𝒏.

Utilizando la Regla de 𝟐𝒌 ≥𝒏 se tienen 5 clases, y con esto un intervalo de 1,8 -→ i = 2

ojiva menor que ojiva mayor que

Se aplicaron las funciones que proporciona el software del Excel:

Tabla 5. Representación de cálculos con funciones Excel

(criterio de mutuamente excluyente). Al trabajar de esta manera se puede comprobar usando

2.3 Representación gráfica de distribución de frecuencias

Gráficas de frecuencias parciales

Figura 9. Representación gráfica histograma de frecuencias absolutas

Figura 10. Representación gráfica histograma de frecuencias relativas

Gráficos de frecuencias acumuladas

frec_abs_acum "ojiva menor que"