Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva
Profesor Ricardo Montoya González
1
Media 14
Mediana 14
Moda 15
Ejemplo Media, mediana y moda para datos agrupados 16
Medidas de dispersión para datos agrupados 19
Varianza poblacional 19
Varianza muestral 20
Desviación estándar poblacional 20
Desviación estándar muestral 21
Ejemplo medidas de dispersión para datos agrupados 21
Cuantiles 24
Cuartil 24
Decil 25
Percentil 25
Ejemplo cuantiles 25
Fuentes de consulta 27
2
Bloque IV. Estadística descriptiva
La estadística descriptiva es la técnica matemática que obtiene, organiza, presenta
y describe un conjunto de datos con el propósito de facilitar el uso, generalmente
con el apoyo de tablas, medidas numéricas o gráficas.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Existen tres tipos de medidas de
tendencia central, los cuales se presentan a continuación:
3
Moda: La moda es el valor con mayor frecuencia en una de las distribuciones
de datos. Gráficamente lo podemos observar de la siguiente manera, dónde
la moda es la altura repetida de las personas:
4
Dónde moda representa la mayor frecuencia de los datos, la mediana se muestra
justo a la mitad del conjunto de datos ordenados y la media recopila todos los datos
y se localiza justo a la mitad de ellos
Medidas de dispersión
Es una medida que es cero si todos los datos son iguales y aumenta a medida que
los datos se vuelven más diversos.
5
Existen varias medidas de dispersión para las principales son las siguientes:
6
Medidas de tendencia central para datos no agrupados
Media
Dónde:
• 𝑥̅ = Media
• 𝑥𝑖 =Dato i
• 𝑛 = Número de dato
Mediana
7
Moda
a) Media
b) Mediana
c) Moda
Solución
El primer paso será ordenar los datos de menor a mayor y para un mejor manejo de
los datos serán organizados en forma de tabla, la cual se muestra a continuación:
Número Variable
de dato (𝑥𝑖 )
1 3
2 5
3 8
4 10
5 24
6 36
8
7 79
8 255
a) Media
Para calcular la media realizaremos la suma de todos los datos para posteriormente
dividirlos entre el número total de datos, el procedimiento se muestra a continuación:
3 + 5 + 8 + 10 + 24 + 36 + 79 + 255
𝑥̅ = = 52.5
8
b) Mediana
Número Variable
de dato (𝑥𝑖 )
1 3
2 5
3 8
4 10
9
5 24
6 36
7 79
8 255
Por lo tanto, la mediana será el promedio del dato 4 y 4l dato 5, dando como
resultado 13
c) Moda
Recordando que la moda es el dato que más se repite en nuestro conjunto y no hay
ninguno que se repita en los daos del problema no existe una moda.
En este tema se estudiará cómo calcular las medidas de dispersión para datos NO
agrupados.
Rango
𝑅 = 𝑀𝑎𝑥𝑥 − 𝑀í𝑛𝑥
• 𝑅= Rango
10
• 𝑀𝑎𝑥𝑥 = Valor Máximo
• 𝑥= Variable
Varianza
𝑛
∑𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
Donde:
• 𝜎= Varianza
• 𝑥𝑖 = Cualquier variable
11
• 𝑥̅ = Media
• 𝑛= Número de datos
Desviación estándar
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎=√
𝑛
Donde:
𝜎=Desviación estándar
𝑥𝑖 = Cualquier variable
𝑥̅ = Media
𝑛= Número de datos
12
Ejemplo varianza, desviación estándar y rango para datos no
agrupados
a) Varianza
b) Desviación estándar
c) Rango
Solución
a) Varianza
2+4+6+8
𝑥̅ = =5
4
b) Desviación estándar
𝜎 = √5 = 2.236
13
c) Rango
Para encontrar el rango hay que encontrar la diferencia entre el valor máximo y el
valor mínimo, a continuación, se presenta el procedimiento:
𝑅 = 8−2 =6
En este tema se estudiará cómo calcular las medidas de tendencia central para
datos agrupados.
Media
𝑛
𝑥𝑖 ⋅ 𝑓𝑖
𝑥̅ = ∑
𝑛
𝑖=1
Donde:
• 𝑥̅ = Media
𝐿𝑖 +𝐿𝑠
• 𝑥𝑖 = Marca de clase i (𝑥𝑖 = )
2
• 𝑛 = Número de datos
• 𝑓𝑖 = Frecuencia de la variable i
Mediana
14
𝑛+1
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 =
2
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ⋅ 𝐴𝑖
𝑓𝑖
Donde:
• 𝑛= Número de datos
Moda
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ⋅𝐴
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1 𝑖
Donde:
15
• 𝐿𝑖 = Límite inferior del intervalo en el cual se encuentra la moda.
a) Media
b) Mediana
c) Moda
[0-4) 2 3 3
[4-8) 6 5 8
[8-12) 10 6 14
[12-16) 14 4 18
[16-20) 19 3 21
16
TOTAL 21
Solución
En este ejemplo. La marca de clase, así como la frecuencia acumulada ya está dada
a) Media
𝑥1 ⋅ 𝑓2 + 𝑥2 ⋅ 𝑓2 + 𝑥3 ⋅ 𝑓3 + 𝑥4 ⋅ 𝑓4 + 𝑥5 ⋅ 𝑓5
𝑥̅ =
𝑛
2 ⋅ 3 + 6 ⋅ 5 + 10 ⋅ 6 + 14 ⋅ 4 + 19 ⋅ 3
𝑥̅ = = 9.809
21
b) Mediana
Para encontrar la mediana hay que seguir dos pasos, el primero es encontrar el
intervalo en el que se encuentra, utilizando la siguiente expresión:
𝑛+1
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 =
2
17
21 + 1
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 = = 11
2
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ⋅ 𝐴𝑖
𝑓𝑖
21
−8
𝑀𝑒 = 8 + 2 ⋅ 4 = 9.667
6
c) Moda
Al igual que con la mediana se requieren dos pasos para encontrar la moda, el
primero es encontrar el intervalo en el cual se encuentra la moda, es decir el
intervalo con mayor frecuencia absoluta, remarcado en amarillo en la siguiente
tabla.
[0-4) 2 3 3
[4-8) 6 5 8
18
[8-12) 10 6 14
[12-16) 14 4 18
[16-20) 19 3 21
Una vez que se ha identificado el intervalo con una mayor frecuencia absoluta se
pasa al paso dos para encontrar la moda, utilizando la siguiente fórmula:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ⋅𝐴
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1 𝑖
Sustituyendo los valores del problema y del intervalo en el que se encuentra la moda
se obtiene la siguiente expresión:
6−5
𝑀𝑜 = 8 + ⋅ 4 = 9.333
6−5+6−4
Aquí se estudiará cómo calcular las medidas de dispersión para datos agrupados.
Varianza poblacional
𝑛
∑𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
Donde:
19
• xi= marca de clase. Es el punto medio del límite inferior y del límite superior
𝐿𝑖 +𝐿𝑠
(𝑥𝑖 = ).
2
• σ2=varianza de la población.
• x̄ = media.
Varianza muestral
𝑛
∑𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1
Donde:
• xi: marca de clase. Es el punto medio del límite inferior y del límite superior
𝐿𝑖 +𝐿𝑠
(𝑥𝑖 = ).
2
• 𝑠 2 : varianza de la muestra.
• x̄ : media.
20
𝜎 = √𝜎 2
Donde:
• 𝜎 2 =varianza de la población.
• 𝜎= desviación estándar de la población.
s = √𝑠 2
Donde:
• 𝑠 2 = varianza de la muestra.
• s= desviación estándar de la muestra.
a) Varianza.
b) Desviación estándar.
Edad Frecuencia
(𝒇𝒊 )
(años)
[0-2) 7
21
[2-4) 8
[4-6) 8
[6-8] 7
TOTAL 30
Solución
El primer paso será calcular la marca de clase para cada intervalo, esto utilizando
la siguiente expresión:
𝐿𝑖 + 𝐿𝑠
𝑥𝑖 =
2
0+2
𝑥1 = =1
2
[0-2) 7 1
22
[2-4) 8 3
[4-6) 8 6
[6-8] 7 7
TOTAL 30
𝑛
𝑥𝑖 ⋅ 𝑓𝑖
𝑥̅ = ∑
𝑛
𝑖=1
2
7(1 − 4)2 + 8(3 − 4)2 + 8(5 − 4)2 + 7(7 − 4)2
𝜎 = = 4.73
30
23
𝜎 = √𝜎 2 = √4.73 = 2.175
Cuantiles
Por tanto, no es más que una técnica estadística para separar los datos de una
distribución. Se debe cumplirse que los grupos sean iguales. Por eso, existen
diversos tipos de cuantil, en función del número de particiones que hacen.
Cuartil.
Decil.
Precentil.
Cuartil
Separa los valores en cuatro grupos iguales y existen tres cuartiles. El cuartil uno
(Q1) son los datos menores y el tres (Q3) los mayores. Por otro lado, el cuartil dos
(Q2) se corresponde con la mediana que es un estadístico de posición que divide la
distribución de los datos a la mitad. Los valores del cuantil serían 0.25 (Q1), 0.5(Q2)
y 0.75 (Q3).
24
Decil
En este caso se dividen en diez partes y, por tanto, hay nueve deciles. Sus valores
serían de 0.1 a 0.9.
Percentil
Esta es una variante en que la distribución se divide en cien partes iguales. Sus
valores van de 0.01 a 0.99.
Ejemplo cuantiles
3,5,2,7,6,4,9, 1
Solución
Lo que sebe hacer para encontrar los cuartiles es ordenarlos de menor a mayor
para después dividir el número total de datos en 4 partes iguale y si son un número
se calculará el promedio de las partes, esto se muestra a continuación:
1, 2, 3, 4, 5, 6, 7, 9
2+3 2+3
𝑄1 = 𝑄3 =
2 2
4+5
𝑀𝑒 =
2
25
Obteniendo así que 𝑸𝟏 =2.5, 𝑴𝒆 = 𝟒. 𝟓 y 𝑸𝟑 = 𝟔. 𝟓
26
Fuentes de consulta
Google Arts y Culture. (s/a). Estadística descriptiva. Disponible en:
https://artsandculture.google.com/entity/m028sz?hl=es
27