Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICO DE CENTRALIZACIÓN
1.1 MEDIA
La media (𝑥𝑥) se calcula a partir de la suma de todos los datos (𝜎𝜎) dividida entre la
cantidad de datos existentes (n). Esta permite establecer el valor al que los datos
más se acercan. En este caso la media de acuerdo con los datos manejados en el
archivo anterior quedaría de la siguiente manera:
𝑛𝑛 = 40
𝜕𝜕 = 12 + 36 + 50 + 17 + 36 + 29 + 23 + 50 + 17 + 46 + 34 + 22 + 40 + 31 + 38
+ 15 + 11 + 37 + 39 + 27 + 12 + 34 + 43 + 20 + 39 + 29 + 40 + 14
+ 25 + 29 + 24 + 25 + 23 + 43 + 26 + 20 + 17 + 48 + 22 + 34
𝜕𝜕 1177
𝑥𝑥 = = = 29.4250
𝑛𝑛 40
1.2 MEDIANA
11 12 12 14 15 17 17 17 20 20 22 22 23 23 24 25 25 26 27 29 29 29 31 34
34 34 36 36 37 38 39 39 40 40 43 43 46 48 50 50
29 + 29
𝑥𝑥� = = 29
2
1.3 MODA
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos.
En el conjunto de datos proporcionado, las modas son 17, 29 y 34, ya que
aparecen tres veces, más que cualquier otro valor:
11 12 12 14 15 17 17 17 20 20 22 22 23 23 24 25 25 26 27 29 29 29 31 34
34 34 36 36 37 38 39 39 40 40 43 43 46 48 50 50
1.4. APLICACIÓN EN CÓDIGO:
2. ESTADÍSTICO DE FORMA
Sin embargo, esta asimetría es bastante pequeña ya que las discrepancias entre
las medidas de tendecia central son mínimas, lo que se ve reflejado en la gráfica,
puesto que la mediana y la media solo estan un poco desplazadas a la izquierda.
3. ESTADÍSTICO DE DISPERSIÓN
3.1. VARIANZA
La varianza mide qué tan dispersos están los datos respecto a la media. Su
fórmula es la siguiente:
∑(𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ )2
𝛼𝛼 =
𝑛𝑛
Donde:
- 𝛼𝛼 es la varianza.
- 𝑥𝑥𝑖𝑖 son los datos individuales.
- 𝑥𝑥̅ es la media de los datos.
- n es el número de datos.
La desviación estándar es una medida que indica cuánto varían, en promedio, los
valores de un conjunto de datos con respecto a la media. Su fórmula es
equivalente a la raíz cuadrada de la varianza:
𝜎𝜎 = √𝛼𝛼
𝜎𝜎 = √124 ≈ 11.1356
𝜎𝜎
𝐶𝐶𝑉𝑉 = ∗ 100
𝑥𝑥̅
Donde:
- 𝐶𝐶𝑉𝑉 es el coeficiente de varianza
- 𝜎𝜎 la desviación estándar
- 𝑥𝑥̅ es la media de los datos.
11.1356
𝐶𝐶𝑉𝑉 = ∗ 100 = 38.3984
29.425
3.4. ERROR ESTÁNDAR
El error estándar es una medida estadística que indica la precisión de una
estimación o la dispersión de un conjunto de datos. Este se calcula a partir de la
desviación estándar y el número de clases de la siguiente manera:
𝜎𝜎
𝑆𝑆𝑆𝑆𝑆𝑆 =
√𝑛𝑛
Donde:
- 𝜎𝜎 la desviación estándar
- √𝑛𝑛 es el número de clases.
11.1356
𝑆𝑆𝑆𝑆𝑆𝑆 = = 1.7607
√40
El cuál es un error pequeño, lo que indica que hay una dispersión muy pequeña
entre los datos.
El error estándar puede ser visualizado en todos los datos a partir del siguiente
código usando Matplotlib:
4. ESTADÍSTICO DE POSICIÓN
4.1. PERCENTILES
𝐴𝐴 𝑘𝑘 ∗ 𝑛𝑛
𝑃𝑃𝑘𝑘 = 𝐿𝐿𝑖𝑖 + ( − 𝐹𝐹𝐴𝐴−1 )
𝐹𝐹𝑖𝑖 100
Donde:
- 𝐿𝐿𝑖𝑖 es el límite inferior de la clase del percentil
- 𝐹𝐹𝑖𝑖 es la frecuencia absoluta de la clase del percentil
- A es la amplitud de clase
- k es el percentil
- n el número de datos
- 𝐹𝐹𝐴𝐴−1 es la frecuencia absoluta acumulada de la clase anterior al percentil
𝑘𝑘 ∗ 𝑛𝑛 60 ∗ 40
= = 24
100 100
6
𝑃𝑃60 = 29 + (24 − 19) ≈ 33.2857
7
Además de los percentiles es posible obtener grupos de división distintos como los
cuartiles que agrupan el 25% de los datos, los quintiles que agrupan el 20% de los
datos y los deciles que agrupan el 10% de los datos todos se rigen por la formula
𝑘𝑘∗𝑛𝑛
anterior con un ligero cambio en la misma en , que será reemplazado por la
100
siguiente fórmula:
𝑘𝑘 ∗ 𝑛𝑛
𝐼𝐼𝐼𝐼𝐼𝐼é𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 =
𝑟𝑟
Donde:
- 𝑘𝑘 es el cuartil, quintil o decil
- 𝑛𝑛 el número de datos
- 𝑟𝑟 el número de grupos que se formaran con los datos. Para el cuartil 4, para
el quintil 5 y para el decil 10.
2 ∗ 40
𝐼𝐼𝐼𝐼𝐼𝐼é𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 = =8
10
6
𝐷𝐷2 = 17 + (8 − 5) ≈ 19.5714
7