Está en la página 1de 22

ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

TEMA: MEDIDAS DESCRIPTIVAS

Como lo hemos podido ver hasta ahora, la principal función de la estadística es que permite
describir una situación o fenómeno particular en un momento específico, conocer una o más
variables y su comportamiento. Apoya a lo anterior un conjunto de herramientas llamadas
Medidas Descriptivas.

Las medidas descriptivas son valores representativos de una distribución. Son cifras individuales
que resumen la información, utilizadas para describir ciertas características de los datos
permitiendo una comprensión más precisa. Así a partir de estas medidas se podrán realizar
inferencias y pronósticos.

El análisis de la información a partir de las medidas descriptivas, se pueden realizar a través de:

- Las medidas de posición


- Las medidas de dispersión
- Las medidas de forma

MEDIDAS DESCRIPTIVAS DE POSICIÓN:

¿Por qué estudiar la posición de los datos?

Las medidas de posición, llamadas también de ubicación, permiten identificar valores típicos
dentro de una distribución y conocer así valores específicos que ayudan a la interpretación de
la información y la toma de decisiones. Las más utilizadas tienen que ver con las medidas de
tendencia central, considerando las más importantes: media aritmética (promedio), media
ponderada, media geométrica, moda y mediana.

MEDIA ARITMÉTICA (Ma) (PROMEDIO)

La media es la cantidad total de la variable distribuida a partes iguales entre cada observación.

De forma simple, si en una habitación hay tres personas, la media de dinero que tendrán en sus
bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre
cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución
(dinero en el bolsillo) suponiendo que cada observación (persona) tendría la misma cantidad de la
variable. Cualquier característica medible de una población se denomina parámetro.

Media de una Población = Suma de todos los valores de la población


Número de valores en la población

1
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

De manera algebraica: u = E xi
N

Donde
u : media de la población (letra griega “mu” minúscula) (se puede usar indistintamente x)
N : número total de elementos de la población / muestra
xi : representa cualquier valor en particular (variable)
E : representa la sumatoria de las variables (letra griega “sigma” mayúscula)

 Dados los siguientes datos, ¿Cuál es la media aritmética del sueldo de una compañía, si los
trabajadores perciben los siguientes salarios (en miles de pesos)?

320 360 330 340 355 325 346

u = $2.376.000 = $339.430
7
Así el promedio de los sueldos de los empleados es de$339.430

Consideraciones de la media:
- Un conjunto de datos solo tendrá una media
- Al calcular la media se incluyen todos los valores
- Resulta una medida muy útil para comparar dos poblaciones o muestras

MEDIA PARA UNA DISTRIBUCIÓN DE FRECUENCIA:

MEDIA PONDERADA

Como se trabaja habitualmente con una cantidad no menor de datos, se utiliza la media
ponderada, que es un caso especial de la media aritmética. Se presenta cuando hay varias
observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una
distribución de frecuencias.

Media Ponderada X= E (xi*ni)


N
Donde:
X : media ponderada
N : número total de datos
xi : representa cualquier valor en particular (variable)
ni : frecuencia absoluta o número de datos para cada clase
E : representa la sumatoria de las variables (letra griega “sigma” mayúscula)
 Dado el siguiente ejemplo, calcule la media ponderada.

2
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Sea X una variable que representa el volumen de facturación de una empresa considerando los
últimos 25 días laborales de un mes.

xi ni
(miles de euros)
10,5 2
12,4 3
13,2 9
14,8 6
15,8 4
16,5 1
Total 25

Media Ponderada = (10,5*2) + (12,4*3) + (13,2*9) + (14,8*6) + (15,8*4) + (16,5*1) = 13,82


25

De esta manera el volumen de facturación promedio ponderado es de 13,82 (miles de euros).

MEDIANA (Me)

Es definida como aquel valor de la distribución que ocupa el lugar central, una vez que los valores
han sido ordenados de forma creciente, de menor a mayor. Al ser ordenados de esta forma deja
a su izquierda y a su derecha el mismo número de observaciones.

En palabras simples, luego de ordenarlas de menor a mayor, la mediana es el punto o tendencia


media de los datos. Esta medida suele ser más representativa que la media, cuando los datos
contienen uno o más valores sumamente grandes o pequeños que distorsionan el promedio.

Consideraciones de la mediana:
- Un conjunto de datos solo tendrá una mediana
- No se ve afectada por valores grandes o pequeños
- Al calcular la mediana se incluyen todos los valores

MEDIANA PARA UNA DISTRIBUCIÓN DE FRECUENCIA

Para valores que se repiten dentro de un conjunto de datos y que de acuerdo a ello son
organizados en base a la distribución de frecuencia, al igual que la media ponderada, se
considera en su cálculo tanto el valor de la variable como la frecuencia en que ésta se repite.

3
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Cuando se presentan datos de este tipo, donde existe un xi específico para cada ni, se utiliza
Ni (frecuencia absoluta acumulada como referencia) y ese es el dato que ordenado de menor a
mayor, se considera para su cálculo final. Recordemos que la mediana, es el punto medio, que deja
la misma cantidad de datos hacia arriba y hacia abajo, por lo tanto se ubicará la clase en la que
esté presente este punto medio (N/2).

 Del mismo ejemplo del volumen de facturación de una empresa a lo largo de los 25 días
laborales del mes, calcule la Me.

xi ni Ni
(miles de euros)
10,5 2 2
12,4 3 5
13,2 9 14
14,8 6 20
15,8 4 24
16,5 1 25
Total 25

Dado que son 25 datos en total, el punto medio corresponde a 12,5 y este se encuentra
presente en la frecuencia de clase 13,2 (ya que se incluye en Ni=14)

Así la mediana o tendencia media del volumen de facturación es de 13,2 miles de euros

MODA (Mo)

La moda es aquel valor de la distribución que más se repite o que presenta mayor frecuencia. Es
una medida adecuada para el análisis de variables cualitativas y para describir niveles nominales
y ordinales, como el estado civil, nivel de educación o el color favorito.

 Supongamos que los salarios de 10 trabajadores, en miles de pesos son:

365 320 340 370 380 340 355 340 326 340

Como el número de trabajadores que percibe $340.000 es mayor que cualquier otro, la moda es
340.

Consideraciones de la moda:
- En un conjunto de datos puede haber una, dos o más modas y en algunas distribuciones
puede no haber moda ya que no hay ningún valor que se presente con la mayor frecuencia.
- No se ve afectada por valores muy altos o muy bajos.

4
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

MODA PARA UNA DISTRIBUCIÓN DE FRECUENCIA

Si los datos para cada clase se repiten, y son presentados bajo distribución de frecuencia, esta
simplemente facilitará la identificación del dato que más se repite.

 Indique la moda, dada la siguiente información que refleja el volumen de facturación de


una empresa a lo largo de los 25 días laborales de un mes.

xi ni
(miles de euros)
10,5 2
12,4 3
13,2 9
14,8 6 La moda o variable que
15,8 4 más se repite es $13.2, se
16,5 1 repite 9 veces, o en este
Total 25 caso se repite en 9 de los
25 días.

¿QUÉ OCURRE CUANDO LOS DATOS SON AGRUPADOS?

Como lo aprendimos al analizar las distribuciones de frecuencia, para cierta cantidad o tipos de
datos, es conveniente agruparlos en intervalos.

Para evaluar la media aritmética de datos agrupados o presentados en intervalos, se considera


que las observaciones en cada clase son representadas por el punto medio de ésta.

Ma para datos agrupados X = E (ni*Xi)


N
Donde:
X = media aritmética
Xi = es el valor central o punto medio de cada clase (marca de clase)
ni = frecuencia absoluta de cada clase
N = número total de observaciones

5
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

 Si consideráramos la facturación de ventas de 300 días, los datos necesariamente


deberán estar agrupados o por intervalos. Calcule la media para la distribución que se
presenta en la tabla siguiente:

Venta (xi) ni Ni Xi
(en miles de euros) (frecuencia absoluta)
10 – 12 40 40 11
12 – 13 60 100 12,5
13 – 14 110 210 13,5
14 – 15 50 260 14,5
15 – 16 30 290 15,5
16 – 18 10 300 17
Total 300 - -

Luego:

X = (40*11)+(60*12,5)+(110*13,5)+(50*14,5)+(30*15,5)+(10*17) = 13,45
300

De esta manera el promedio de la facturación es de $13,45 euros.

Para el caso de la MEDIANA, una vez que los datos se han organizado en una distribución de
frecuencias, se debe localizar la clase en la que se encuentra el punto medio y luego interpolar
dentro de esa clase para obtener el valor exacto.

N
Mediana de datos agrupados Mediana = Li + ( 2 - Ni(i-1))* ai
ni

Donde:
Li : límite inferior de la clase que contiene a la mediana
N : número total de observaciones
ni : frecuencia absoluta de la clase del intervalo que contiene a la mediana
ai : amplitud o ancho del intervalo en que se encuentra la mediana
Ni(i-1) : frecuencia acumulada de la clase que precede inmediatamente a la que posee el punto
medio

6
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

 Para el mismo ejercicio anterior, determine la mediana.

Venta (xi) ni Xi Ni
(en miles de euros) (frecuencia absoluta)
10 – 12 40 11 40
12 – 13 60 12,5 100
13 – 14 110 13,5 210
14 – 15 50 14,5 260
15 – 16 30 15,5 290
16 – 18 10 17 300
Total 300 - -

Resp: Considerando que 150 es el punto medio del total de datos, contenido en el intervalo 3, la
mediana o tendencia central de las tasas de interés corresponde a 13,45.

Me= 13 + (300/2) – 100 * 1 = 13,45


110

Si se requiere conocer la MODA para datos agrupados, se puede considerar un intervalo modal,
ahora bien, si se desea determinar en forma específica su valor, se debe considerar la siguiente
ecuación:

Mo = Li + ni (i+1) * ai
ni(i-1) + ni (ni+1)

Donde:
Li = Límite inferior del intervalo de cálculo
ai = Amplitud del intervalo de cálculo
ni (i+1) = frecuencia absoluta del intervalo siguiente al de cálculo
ni (i-1) = frecuencia absoluta del intervalo anterior al de cálculo

7
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

 Considerando el mismo ejemplo:


Venta (xi) ni Ni Xi
(en miles de euros) (frecuencia (frecuencia (marca de
absoluta) absoluta clase
acumulada)
10 – 12 40 40 11
12 – 13 60 100 12,5
13 – 14 110 210 13,5
14 – 15 50 260 14,5
15 – 16 30 290 15,5
16 – 18 10 300 17
Total 300 - -

De acuerdo a la fórmula de cálculo presentada:

Mo = 13 + 50 * 1 = 13,45
60 + 50

OTRAS MEDIDAS DE POSICIÓN: PERCENTILES

La media, moda y mediana son las medidas de ubicación más ampliamente utilizadas, sin embargo,
existen otros medios para describir la posición de una variable en un diseminado conjunto de
datos. Un método es determinar la ubicación de los valores que dividen un conjunto de
observaciones en partes iguales:

Por ejemplo, los cuartiles dividen un conjunto de observaciones en cuatro partes iguales. Esto se
trata de ordenar los datos de menor a mayor y luego segmentarlos en cuatro partes iguales. Así
el primer cuartil (Q1) corresponderá al valor bajo el cual se encuentra el 25% de las
observaciones, el segundo cuartil (Q2) el 50% y el tercer quintil (Q3), por ejemplo, denotará
el valor que concentra el 75% de las observaciones. Lógicamente Q2 equivale a la mediana.

De manera similar, los quintiles corresponden a la segmentación en 5 partes, los deciles


dividen el conjunto de datos en 10 partes y los centiles en 100.

8
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

 Por ejemplo, si su profesor le indica que su puntaje en la prueba se encuentra en el


cuarto decil, puede llegar a la conclusión de que un 60% de sus compañeros tiene una nota
superior a la suya. Además deberá preocuparse porque definitivamente logró un puntaje
bajo y menor al punto medio.

1 2 3 4 5 6 7 8 9 10

Nótese que para referirse a esta medida en general, se utilizará el término centil (independiente
de las partes en que lo divida)

Para calcular la ubicación del centil, sea Lp, utilizaremos:

Ubicación de un Centil Lp = (n + 1) * P
100

Donde:
Lp = centil que desea encontrarse (por ejemplo centil 27: L 27)
n = número de observaciones
P = porcentil deseado (% que corresponde al centil que se desea ubicar)

 Suponga el siguiente ejemplo, que le permitirá entender mejor esta medida de


dispersión.

A continuación se presentan las rentas del último mes de 15 vendedores comisionistas para
una empresa de arriendo de vehículos (en miles de pesos). Ubique los valores del primer y tercer
cuartil.

2038 1758 1721 1637 2097 2047 2205 1787


1940 2311 2054 2406 1471 1460 2287

Lo primero será ordenar los 15 datos de menor a mayor

1460 1471 1637 1721 1758 1787 1940 2038


2047 2054 2097 2205 2287 2311 2406

Luego, si sabemos que los cuartiles dividen los datos en 4 partes y cada una concentra el 25% de
las observaciones:

Primer cuartil Lp = (15 + 1)* 25 = 4


100

9
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Tercer cuartil Lp = (15 + 1)* 75 = 12


100

Así sabemos que los valores del primer y tercer cuartil se encuentran en la posición 4 y 12
respectivamente: $1721 y $2205

¿Qué sucede finalmente si el resultado no es un número entero?

Suponga por ejemplo, que el resultado de Lp = (n + 1) * P/100 es 5.25, en este caso deberá
considerar primero el quinto valor y luego moverse un 0.25 de la distancia entre el quinto y
sexto valor.

 Suponga que tiene los siguientes seis datos 61, 101, 91, 75, 43 y 104, desea obtener el
primer cuartil.

Los datos ordenados serán: 43 61 75 91 101 104

Lp = (6+1) * 25 = 1.75
100

De acuerdo a la fórmula el primer cuartil se encuentra entre el primer y segundo valor. El


primer valor es 43 y el segundo es 61, siendo la distancia entre ellos 18.

Por lo tanto, primer valor 43 + (0.75 * 18 = 13,5) = 56,5, el primer cuartil se encontrará en 56,5.

PERCENTILES PARA DISTRIBUCIÓN DE FRECUENCIA

La identificación de que datos pertenecen al percentil definido, para una distribución de


frecuencia, será igual si ésta presenta datos agrupados o no agrupados, y utilizando la misma
fórmula y procedimiento que conocemos.

Venta (xi) ni Ni
(en miles de euros) (frecuencia absoluta)
10 – 12 40 40
12 – 13 60 100
13 – 14 110 210
14 – 15 50 260
15 – 16 30 290
16 – 18 10 300
Total 300 -

10
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Lp = (n + 1) * P
100

Para el caso de n=25, el tercer quintil será:

Lp = 25+1 * 0,6 = 15,6  valor que está contenido en Ni 20, por lo tanto, el tercer quintil
considerará hasta el dato 14,8 mil euros.

Para el caso de n=30, el tercer quintil será:

Lp = 300+1 * 0,6 = 180,6  valor que está contenido en Ni 210, por lo tanto, el tercer quintil
considerará hasta el tercer intervalo.

MEDIDAS DESCRIPTIVAS DE DISPERSIÓN

¿QUÉ ES LA DISPERSIÓN?

Un promedio como la media, la mediana o el valor más frecuente como la moda, sólo localizan un
dato dentro del conjunto de información, efectivamente válido para algunos análisis pero que
deja fuera la diseminación o dispersión del total de datos (lo que permitirá conocer por
ejemplo, que tan “repartidos” o “concentrados” están).

Veamos el siguiente ejemplo: ¿Qué sucede si está de excursión y debe cruzar un río?

Imagine que la información de la guía turística dice: “longitud o extensión del río: 96 kilómetros”
y “Promedio de profundidad: 80 centímetros” ¿Lo cruzaría teniendo esa información?
Sabemos que esos 80 centímetros son el promedio de la profundidad mínima y máxima, pero ojo
que esta podría ser simplemente la media entre 70 y 90 centímetros (pudiese pasar sin
problemas), pero también podría ser el promedio entre 10 centímetros y 1.50 metros (y con
ésta sería más complejo pasar)

Dado lo anterior, es importante conocer que tan dispersos en el conjunto de información de una
situación especial, se encuentran los datos.

Anteriormente dijimos que las medidas de posición permiten sintetizar y representar mejor
los datos. La mayor o menor representatividad de esas medidas de síntesis o promedios
dependerá fundamentalmente, del grado de concentración de todos los valores de la distribución
en torno a ese promedio, cuya representatividad estamos estudiando.

En general es más común que los datos estén mayormente dispersos que concentrados, por ello
se habla de dispersión, variación o desviación.

11
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Para medir la dispersión de un promedio nos basaremos en el concepto de distancia o desviaciones


existentes entre los valores de la distribución y el promedio que estamos utilizando. Cuanto
mayores sean estas distancias o desviaciones mayor será la dispersión y menor será ésta si las
distancias son pequeñas.

Diagrama de dispersión
Las medidas de dispersión describen la variabilidad de las observaciones de un conjunto de datos
con respecto a un valor promedio.

 Por ejemplo, considere el número de pólizas vendidas durante una semana por dos
sucursales de una compañía de seguros.

Lunes Martes Miércoles Jueves Viernes


Sucursal A 5 12 8 14 11
Sucursal B 9 8 10 12 11

La media (o promedio) de ventas de ambas sucursales es de 10 pólizas, sin embargo, en la


primera los valores están más “dispersos” (en relación a la media) que en B.

12
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

MEDIDAS DE DISPERSIÓN

La dispersión corresponde al grado de distanciamiento de un conjunto de valores respecto a su


valor medio. Las principales medidas de dispersión son el Rango o Amplitud de Variación, la
Desviación Media, la Varianza y la Desviación Estándar.

RANGO O AMPLITUD DE VARIACIÓN

Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.

Amplitud de Variación R = xn - x1 Donde:


xn = valor máximo
x1 = valor mínimo

 Considerando el ejemplo de la compañía de seguros:

Lunes Martes Miércoles Jueves Viernes


Sucursal A 5 12 8 14 11
Sucursal B 9 8 10 12 11

La amplitud para cada una de ellas será RA = 14 - 5 = 9 RB = 12 - 8 = 4

Por lo tanto, existe menos dispersión de datos en la sucursal B. Las venta de pólizas de la planta
B están más cerca de la media y así el promedio de B es más representativo que el de A.

VARIANZA

Otra medida de desviación es la varianza, de acuerdo a la fórmula, es el promedio de los


cuadrados de las desviaciones de acuerdo a los valores de la variable con respecto a su media. En
otras palabras, se basa en la media de las desviaciones al cuadrado.

Cuanto mayor sea la variancia, mayor será la dispersión de la variable y menos representativa será
la media como promedio de todos los valores y viceversa. Cabe señalar que la variancia viene
expresada en las unidades de medida de la variable al cuadrado, lo que limita su interpretación.

Varianza (s2) = E (xi – X)2 * ni


N
Donde:
xi = valor de cada observación
X = media aritmética de la muestra o población
N = número de observaciones de la población o muestra

13
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

 La varianza para ambas aseguradoras será:

L M M J V
Sucursal A (Xi – X) 2 25 4 4 16 1 E = 50
Sucursal B (Xi – X) 2 1 4 0 4 1 E = 10

A = 50 = 10 B = 10 = 2
5 5

Por lo tanto, existe menos dispersión en las ventas de la sucursal B (varianza de A =10 >
varianza de B =2), así la media de B es más representativa que la de A (ya que presenta menor
varianza y por lo tanto, menor dispersión de los datos o mayor concentración de ellos)

DESVIACIÓN TÍPICA O ESTÁNDAR

Este último índice se utiliza en conjunto a la varianza, de hecho, algebraicamente es la raíz


cuadrada de la fórmula de la varianza.

¿Para qué?, básicamente porque aplicando la raíz, eliminamos los cuadrados y con ello el
resultado se expresa en la misma unidad de medida de los datos de la variable que usamos.

Desviación Estándar (s)

Donde:
Xi = valor de cada observación
X = media aritmética poblacional
N = número de observaciones de la población

 Siguiendo con el mismo ejemplo, las desviaciones estándar poblacional corresponden a:

A = 3,2 pólizas B = 1,4 pólizas

En este caso la variación de los datos promedio en relación a la media es de 3,2 para A y 1,4
pólizas para B. Dado lo anterior es menor la diferencia entre los datos de B, por lo tanto menor
dispersión y más representativa la muestra.

14
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

¿QUÉ PASA CON LOS DATOS ORDENADOS EN UNA DISTRIBUCIÓN DE FRECUENCIA


O DATOS AGRUPADOS?

En términos simples, son los mismos procedimientos, incorporando a las fórmulas presentadas,
el factor que incluya la existencia de datos repetidos en cada clase o agrupados en intervalos, es
decir, la frecuencia absoluta (ni).

Para calcular la amplitud de variación, de igual manera se considera el menor y mayor valor del
total de los datos.

 Consideremos los ejemplos anteriores:

xi ni
(miles de euros)
10,5 2
12,4 3
13,2 9
14,8 6
15,8 4
16,5 1
Total 25

En este caso el rango o amplitud es igual a 6 mil euros (16,5-10,5)

Para el caso de la varianza y la desviación estándar, la fórmula se presenta de la siguiente


forma:

Varianza (s2) = E (xi – x)2 * ni


N

Donde
ni = corresponde a la frecuencia absoluta
xi = valor de cada observación

 En el ejemplo: (recordemos que la media es de 13,82)

xi ni (xi-x)2*ni
(miles de euros)
10,5 2 22,04
12,4 3 6,04
13,2 9 3,45
14,8 6 5,76
15,8 4 15,68
16,5 1 7,18
Total 25 60,15
15
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Luego:
Varianza = 60,15/25 = 2,40 miles de euros

Desviación estándar (s)

Donde
ni = corresponde a la frecuencia absoluta
xi = valor de cada observación

Luego:
Desviación = 1,55 miles de euros

Si los datos se presentan en intervalos, el tratamiento es el mismo, considerando el punto


medio de cada uno de ellos (marca de clase).

Varianza (s2) = E ((Xi – X)2 * ni)


N

Donde
ni = corresponde a la frecuencia absoluta
Xi = marca de clase o punto medio del intervalo

Desviación estándar (s)

Donde
ni = corresponde a la frecuencia absoluta
Xi = marca de clase o punto medio del intervalo

 Del ejemplo: (recordemos que la media es 13,45)

Venta (xi) ni Ni Xi (Xi-X)2*ni


(en miles de (frecuencia (frecuencia (marca de
euros) absoluta) absoluta clase
acumulada)
10 – 12 40 40 11 240,1
12 – 13 60 100 12,5 54,15

16
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

13 – 14 110 210 13,5 0,27


14 – 15 50 260 14,5 55,12
15 – 16 30 290 15,5 126,07
16 – 18 10 300 17 126,02
Total 300 - - 601,73

Luego, la varianza y desviación estándar son 2,00 y 1,41 respectivamente.

DISPERSION RELATIVA

Suponga que ha evaluado a un grupo de personas, y algunas de las mediciones que obtiene, son
por ejemplo, que la desviación estándar de la distribución de sus ingresos es $287.300 y que
la desviación estándar de sus años de estudios es igual a 6 años. ¿Podría relacionarlas?,
evidentemente que no, ya que no se puede comparar directamente años con pesos. Sin embargo,
para lograr una comparación significativa entre ambas, podremos convertirlas cada una a un
valor relativo.

Karl Pearson desarrolló una medida relativa denominada Coeficiente de Variación (CV) (también
denominado coeficiente de Pearson)

Coeficiente de Variación CV = s *(100)


x
Donde:
s = desviación estándar
x = media aritmética
(100) = al multiplicar el resultado del cociente por 100, el decimal se transforma en porcentaje

 Para los ejemplos trabajados:

Datos no agrupados: Datos agrupados:


CV = 1,55 * 100 = 11,21% CV = 1,41 * 100 = 10,48%
13,82 13,45

De esta manera, el CV es la razón (cociente) de la desviación estándar a la media aritmética,


expresada como un porcentaje. Suele ser muy útil cuando los datos están en unidades diferentes
y bien cuando los aun estando en las mismas unidades, las medias son muy distantes (comparación
de ingresos muy superiores frente a otros muy bajos)

Por ejemplo:

 Suponga que un estudio determinó que de los puntajes obtenidos en un examen de cálculo,
la media fue de 200 puntos, con una desviación estándar de 40. A su vez se analizó los

17
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

años de experiencia que tenían los docentes que prepararon a los alumnos para el examen,
arrojando una media de 20 años y una desviación estándar de 2 años.

Para poder analizar en conjunto ambas variables necesitaremos convertirlas a una misma
unidad.

Puntaje CV = 40 (100) = 20% Años CV= 2 (100) = 10%


200 20

A partir de lo anterior se puede ver que existe mayor dispersión relativa con respecto a la media
en la distribución de los puntajes obtenidos en el examen que en la distribución de los años de
experiencia de los docentes.

 Sería interesante conocer la variación que existe en los ingresos mensuales de altos
ejecutivos con la variación en los ingresos de trabajadores no calificados. Para los
primeros de ellos, la media calculada es de $500.000 y la desviación de $50.000. Para el
segundo grupo en estudio, la media es de $22.000 y la desviación es de $2.000.

En este caso tenemos la misma unidad de medida ($), y aparentemente podríamos decir que la
mayor dispersión se encuentra en la muestra de los altos ejecutivos ($50.000 > $2.000), sin
embargo, las medias están tan distantes entre ellas que es recomendable convertir los valores
estadísticos a coeficientes de variación para efectuar una comparación significativa entre ellos.

Altos ejecutivos Trabajadores no calificados

CV = $50.000 (100) = 10% CV = $2.000 (100) = 10%


$500.000 $20.000

Así en este caso no existe diferencia en la dispersión relativa de ambos grupos en estudio.

MEDIDAS DESCRIPTIVAS DE FORMA

Además de identificar la ubicación y dispersión que tienen los datos, es importante determinar su
forma, como un complemento de su descripción. Las medidas descriptivas de forma, a través de la
asimetría y curtosis permiten comparar la la forma que tiene la representación gráfica, bien sea
el histograma o el diagrama de barras de la distribución.

ASIMETRIA

18
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Para un conjunto de datos, es posible evaluar la tendencia central (media, moda o mediana) de
sus observaciones, se puede también describir el nivel de diseminación o concentración que
poseen. Otra característica que puede medirse es el grado de asimetría de una distribución.

Recordemos que la simetría es un rasgo característico de formas geométricas, sistemas,


ecuaciones y otros objetos materiales, o entidades abstractas, relacionada con su invariancia bajo
ciertas transformaciones, movimientos o intercambios.

Así, si una distribución de frecuencias es simétrica, no tendrá sesgo (asimetría nula). Existirá
asimetría positiva o sesgo positivo si la media de la distribución es mayor que la mediana o la moda
(generalmente ocurre cuando una o más observaciones son sumamente grandes). Por el
contrario existirá sesgo negativo o asimetría negativa si la media es la menor de las tres medidas
de ubicación (ocurre cuando uno o más datos son muy pequeños).

Coeficiente de Asimetría CA = 3(media – mediana)


desviación estándar

Polígonos de frecuencia que ilustran la simetría

Sesgo negativo
Frecuencia
Frecuencia

Sesgo positivo
Frecuencia

Simétrica

Mediana
Mediana

Media

Moda
Media
Moda

Media
Mediana
Moda

 Suponga que de acuerdo a la distribución de los datos de los días de demora en la resolución
de reclamos en una compañía telefónica, la media de la demora fue de 28 días, la mediana
de 25 días y la moda de 23 días, se calculó además una desviación estándar de 4,2 días.
Calcule la simetría.

CA = 3 (28 – 25) = 2,14


4,2

El coeficiente de asimetría es 2,14. A su vez, la distribución es asimétrica positiva, ya que la


media es mayor que la moda y la mediana.

19
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Regla Empírica

Existe una regla llamada normal o empírica que facilita el análisis y la toma de decisiones,
basada en la recién estudiada simetría. Esta regla general se aplica solamente a las
distribuciones simétricas, e indica el comportamiento de las desviaciones. Se sabe entonces
que aproximadamente un 68% de las observaciones estará a más y menos una desviación
estándar desde la media; un 95% de tales observaciones se encontrará a más y menos dos
desviaciones de la misma y prácticamente todas las observaciones (99,7%) se hallarán a más y
menos tres desviaciones estándares respecto a la media.

 De acuerdo a la información que se tiene, se sabe que la Municipalidad gasta en aseo y


ornato una media de $15.000.000 mensuales, con una desviación estándar de $2.000.000.
Sabiendo que la distribución de frecuencia de las observaciones es simétrica, ¿entre que
cantidades está el 68% de los gastos mensuales?

Aplicando la regla empírica, diremos que:

Aproximadamente un 68% de los gastos está entre $13 y $17 millones. Lo anterior es posible
determinarlo, sumando y restando $2 millones (1 desviación estándar) a los $15 millones
promedio (x + 1s).

Calculándolo de la misma manera, aproximadamente un 95% de los gastos del municipio está
entre $11 y $19 millones ( + 2 desviaciones: $4 millones), mientras que el 99,7% está entre $9 y
$21 millones.

Gráficamente: Curva simétrica de campana

-3s -2s -1s x 1s 2s 3s


70 80 90 100 110 120 130

68%
95%
99.7%
20
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

MEDIDA DE CURTOSIS

La curtosis es una medida de la forma o apuntamiento de las distribuciones. Así las medidas de
curtosis (también llamadas de apuntamiento o de concentración central) tratan de estudiar la
mayor o menor concentración de frecuencias alrededor de la media y en la zona central de la
distribución.

Se definen 3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores


centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores


centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores


centrales de la variable.

Leptocúrtica Mesocúrtica Platicúrtica

1
Coeficiente de Curtosis g2 = n E (Xi – X)4 * ni - 3
1 E (Xi –X)2 * ni 2
n

Donde
g2 = coeficiente de curtosis
Xi = valores de la variable
X = media
ni = frecuencia de cada valor

21
ESTADÍSTICA EMPRESARIAL Andrea Pincheira Varas

Luego:

- Si g2 = 0 la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil 


encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores
cercanos (± 0.5 aprox.)
- Si g2 > 0 la distribución es Leptocúrtica
- Si g2 < 0 la distribución es Platicúrtica
 

Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y un
coeficiente de curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma
importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se
requiere que los datos se distribuyan normalmente.

22

También podría gustarte