Está en la página 1de 8

Resumen estadístico

Después de haber aprendido a construir tablas de frecuencias y haber realizado algunas


representaciones gráficas, el siguiente paso para llevar a cabo un estudio preliminar de los
datos recolectados es el cálculo de diferentes magnitudes características de la distribución
(Centro, homogeneidad, etc.). Se definen entonces diversas medidas que serán capaces de
resumir toda la información recogida a un pequeño número de valores.

INDICADORES DE TENDENCIA CENTRAL


INDICADORES DE DISPERSIÓN
INDICADORES DE POSICIÓN
Indicadores de tendencia central
La media o promedio se define como el valor Ejemplo: Los solicitantes de préstamo deben
característico o central de un conjunto de números
(Punto de equilibrio). Una propiedad importante de la
proporcionar a un banco algunos datos, entre
media es que incluye cada valor en su conjunto de datos ellos la edad. El administrador del banco desea
como parte del cálculo. analizar estos datos para determinar la mejor
manera de agruparlos y comunicarlos. Los
datos son:

28,35,36,35,38,41,29,34,32,30,28,26,38,29,36,
38,39,40,27,30,29,31,27,40,34,30,26,29,34,35
𝑥1 + 𝑥2 +. . . +𝑥𝑛 Muestral
𝑋ሜ = ¿Cuál es la edad promedio?
𝑛

𝑥1 + 𝑥2 +. . . +𝑥𝑁 Poblacional 28 + 35 + ⋯ + 34 + 35 984


𝜇=
𝑁 𝑋ሜ = = = 32.8
30 30
Una característica importante de la media como medida
de tendencia central es que es poco robusta, es decir
que depende mucho de los valores de los datos. La edad promedio de los solicitantes de
préstamos es de 32.8 años.
Por ejemplo: Si nuestros datos son: 1,2,1,1,1 entonces
𝑋ሜ = 1.2 y si por error se registrará los datos como
1,2,1,1,100 entonces 𝑋ሜ = 21.

La media es por tanto muy dependiente de


observaciones extremas.
Indicadores de tendencia central
La mediana (Me o 𝑿෩ ) es otra medida de localización central. Es el punto central de los datos, es la medida
que deja a cada lado el 50% de los datos. El propósito de la mediana es reflejar la tendencia central de
manera que no sea influida por observaciones extremas.

Ejemplo (n impar): En la empresa “Mena Ejemplo (n par): En la empresa “Mena


Ingenieros” se ha tomado una muestra de la Ingenieros” se ha tomado una muestra de la
cantidad cobrada por consultorías, los datos cantidad cobrada por consultorías, los datos son
son (en millones): (en millones):

166, 158, 173, 170 y 179 166, 158, 173, 170, 172, 179
Ordenamos los datos:
Para identificar la mediana, se ordenan los 158 166 170 172 173 179
datos: 170 + 172
158 166 170 173 179 𝑀𝑒 = = 171
2
Interpretación: El 50% de las consultorías tienen Interpretación: El 50% de las consultorías tienen
un costo superior a $170.000.000. un costo inferior a $171.000.000.

Para calcular la mediana de una serie de datos se ordenada la muestra en forma creciente y se
calcula de la siguiente forma:

• Si la cantidad de datos (n) es impar, la mediana es el valor del centro, se encuentra en la


𝑛+1
posición .
2
• Si la cantidad de datos (n) es par, la mediana es el promedio de los dos valores centrales, se
𝑛 𝑛
encuentran en las posiciones y + 1.
2 2
Indicadores de tendencia central

La moda (Mo) corresponde al dato de la muestra que Es posible calcular la moda para variables
tiene mayor frecuencia, o que más se repite. cualitativas.
Ejemplo: ¿Cuál es el programa académico más
Ejemplo: Si se tiene el siguiente número de defectos frecuente para los cursos de Estadística 2021?
por lote producido ¿Cuál es el valor más frecuente?
2, 3, 1, 1, 1, 4, 3, 1, 5, 1, 5, 2 ni fi
xi
Frecuencia Frecuencia
Valor observado
Absoluta Relativa
Ingeniería de Alimentos 8 0.182
Mo=1 Ingeniería Mecánica 9 0.205

El número de defectos por lotes más frecuente observado en Negocios internacionales 7 0.159
la muestra fue 1. Finanzas 8 0.182
Administración de empresas 12 0.273
La moda es relevante solamente en algunos casos ya
que puede que: Total 44 1.0
• No exista (no haya observaciones que se
repitan). El mayor número de estudiantes del curso de
• No está ubicada en el centro de la distribución. Estadística corresponde a Administración de
• Exista más de una. empresa.
Indicadores de dispersión
El reporte de una medida de tendencia central da sólo Rango: La medida más simple de variabilidad en una
información parcial sobre un conjunto de datos. Diferentes muestra es el rango, el cual es la diferencia entre los
muestras o poblaciones pueden tener medidas idénticas de valores muestrales más grande y más pequeño.
centro y aún diferir entre sí en otras importantes maneras.
𝑅𝑎𝑛𝑔𝑜 = 𝑀𝑎𝑥 𝑥1 , 𝑥,2 , … , 𝑥𝑛 − 𝑀𝑖𝑛 𝑥1 , 𝑥,2 , … , 𝑥𝑛

El rango puede ser muy útil en temas de control


estadístico de calidad. Un defecto del rango, es que
depende de sólo las dos observaciones más extremas y
hace caso omiso de los valores restantes.

La figura muestra gráficas de puntos de tres muestras con Por ejemplo, El valor del rango de la muestra 1 en la
las mismas media y mediana, aunque el grado de dispersión siguiente figura es mucho más grande que el de la
(Variabilidad) en torno al centro es diferente para las tres muestra 3, lo que refleja más variabilidad en la primera
muestras. La primera tiene la cantidad más grande de muestra que en la tercera.
variabilidad, la tercera tiene la cantidad más pequeña y la
segunda es intermedia con respecto a las otras dos en este
aspecto.

Además de conocer el punto central de un conjunto de


datos, también nos interesa describir su dispersión o
variabilidad, es decir cuán lejos tienden a estar los datos de
su centro.
Las muestras 1 y 2 tienen rangos idénticos, aunque
Así como hay muchas medidas de tendencia central o de cuando se toman en cuenta las observaciones entre los
localización, hay muchas medidas de dispersión o dos extremos, existe mucho menos variabilidad o
variabilidad. Entre ellas: dispersión en la segunda muestra que en la primera.
Indicadores de dispersión
La medida de dispersión que se utiliza más a menudo es la Una posibilidad es trabajar con las desviaciones al cuadrado,
desviación estándar de la muestra. La idea básica detrás de es decir:
ella es que cuando la dispersión es grande, los valores de la 𝑥1 − 𝑋ത 2 + 𝑥2 − 𝑋ത 2 + 𝑥𝑛 − 𝑋ത 2
muestra tenderán alejarse de media, pero cuando la
dispersión es pequeña, los valores de la muestra tenderán A partir de las desviaciones al cuadrado se puede calcular
acercarse a su media. una medida de dispersión llamada varianza muestral, esta
es:
Para calcular la desviación estándar de la muestra, el 2
𝑥1 − 𝑋ത 2 + 𝑥2 − 𝑋ത 2 + ⋯ + 𝑥𝑛 − 𝑋ത 2
𝑆 =
primer paso es calcular las distancias (también llamadas 𝑛−1
desviaciones) de cada valor de la muestra a la media, es
decir: La cantidad 𝑛 − 1 se denomina grados de libertad asociado
𝑥1 − 𝑋ത 𝑥2 − 𝑋ത ⋯ 𝑥𝑛 − 𝑋ത con la varianza estimada. Los grados de libertad representan
el número de piezas de información independientes (n)
2
Una desviación será positiva si la observación es más grande disponibles para calcular la variabilidad (𝑆 ).
que la media y negativa si la observación es más pequeña
que la media. Por ejemplo: La desviación estándar muestral, denotada por S, es la raíz
- cuadrada (positiva) de la varianza:
-
- La varianza tiene una seria desventaja como medida de
dispersión. Sus unidades no son las mismas que las unidades
de los valores de la muestra; éstas tienen unidades al
cuadrado. Para solucionar esto, podemos obtener:
Una forma simple de combinar las desviaciones en una sola
cantidad es promediarlas. Desafortunadamente, 𝑆 = 𝑆2
Se puede interpretar como una cantidad que nos dice en
𝑥1 − 𝑋ത + 𝑥2 − 𝑋ത + ⋯ + 𝑥𝑛 − 𝑋ത = 0 promedio cuanto se desvían los datos con respecto a la
media.
¿Cómo se puede evitar que la suma de las desviaciones sea
cero?
Indicadores de dispersión
Ejemplo: Los solicitantes de préstamo deben proporcionar a un banco algunos datos, entre
ellos la edad. El administrador del banco desea analizar estos datos para determinar la mejor
manera de agruparlos y comunicarlos. Los datos son:

28,35,36,35,38,41,29,34,32,30,28,26,38,29,36,38,39,40,27,30,29,31,27,40,34,30,26,29,34,35

¿Cuál es la desviación estándar para la edad de los solicitantes de préstamo?


2 2 2
28 − 32.8 + 35 − 32.8 + ⋯ + 35 − 32.8
𝑆2 =
30 − 1

2
−4.8 + 2.2 2 + ⋯ + 2.2 2
𝑆2 =
29
620.8
𝑆2 = = 21.4069
29
𝑆 = 21.4069 = 4.6267

En promedio la edad se desvían (diferencian) con respecto a su media en 4.627 años.


Indicadores de dispersión
Un problema que plantean las medidas de dispersión Ejemplo: La calificación promedio de las mujeres
vistas es que vienen expresadas en las unidades que se del curso de estadística es 3.34 con una desviación
ha medido la variable. Es decir, son medidas absolutas y
con el único dato de su valor no es posible decir que
estándar de 0.75 mientras que los hombres
tenemos una dispersión importante o no. Para solucionar obtuvieron una calificación promedio de 4.81 con
esto, se definen medidas de dispersión relativa, una desviación de 1.08. ¿En qué grupo se presenta
independientes de las unidades usadas. una mayor variabilidad en las calificación?

El coeficiente de variación de Pearson es una medida 𝑥ҧ𝑀𝑢𝑗 = 3.34 𝑥ҧ𝐻𝑜𝑚 = 4.81


relativa de la variabilidad; indica cuán grande es la 𝑆𝑀𝑢𝑗 = 0.74 𝑆𝐻𝑜𝑚 = 1.08
desviación estándar en relación con al promedio.
𝑆
𝐶𝑉 = ത ∗ 100 %
𝑋
1.08
𝐶𝑣𝐻𝑜𝑚 = ∗ 100 = 22.45%
4.81
Se usa para comparar la variabilidad relativa de una
característica, en poblaciones que tiene diferente media. 0.75
No se puede utilizar si el valor de la media es nulo. De 𝐶𝑣𝑀𝑢𝑗 = ∗ 100 = 22.45%
manera acordada empíricamente, se tiene la siguiente 3.34
clasificación:
– Si CV < 5%, altamente homogéneos.
Por lo cual, se observa una variabilidad porcentual con
– Si 5% ≤ CV < 20%, homogéneos.
respecto a la media aproximadamente igual.
– Si 20% ≤ CV < 50%, heterogéneos.
– Si CV ≥ 50%, altamente heterogéneos.
Nota: En finanzas, el coeficiente de variación es importante en la
selección de inversiones. Desde una perspectiva financiera, representa
la relación riesgo-recompensa donde la desviación muestra el riesgo de
una inversión y la media indica la recompensa de una inversión.

https://corporatefinanceinstitute.com/resources/knowledge/other/coe
fficient-of-variation/

También podría gustarte