Está en la página 1de 10

ESTADISTICA DESCRIPTIVA III

Medidas de Dispersión o Variabilidad

Hemos visto que cuando tenemos un grupo grande de números para ser
analizados alguna de las medidas de tendencia central nos dan alguna
idea de las características de estos números, por ejemplo veamos estos
cuatro grupos de números

a) 10, 10, 10, 10, 20,30, 30, 30,30.


b) 20, 22, 21, 20,20, 19, 18, 20,20.
c) 1, 4, 6, 8, 20, 32, 34, 36,39.
d) 10, 12, 14, 16, 20, 24, 26, 28,30.

Efectuando un análisis encontramos que para los cuatro grupos la


media es la misma 20, y la mediana también 20, pero aún así existen
diferencias entre ellos. ¿Qué nos podrá hacer que nos demos
cuenta de esas diferencias?
Una mirada más profunda, nos permitirá ver que ellos difieren en como es
que están dispersos, separados o distribuidos respecto a la media.
En el grupo (b) la mayoría de los números esta muy cerca a la media. En el
grupo (c) existe una mayor variación entre los números y la media.
Tener una información más completa de estos datos numéricos la
podremos obtener mediante la medición de estas Variaciones.

Rango o Recorrido

El Rango denotado por la letra R, no es más que la diferencia entre el


Mayor Valor y el Menor Valor de las variables existentes en el conjunto
de datos. Si lo colocamos en una formula será:

R = Vmáx. - Vmin.

Para el caso del grupo (a), la diferencia será entre 30 y 10, luego se tendrá
un rango de 20.
En el grupo (b) la diferencia será entre 22 y 18, y el rango será igual a 4.
Para el grupo (c), tendremos que el rango es 38, pues los valores son 39 y
1.
Y para el grupo (d), el rango lo obtenemos en la diferencia entre 30 y 10,
siendo esta igual a 20.

Otro ejemplo, durante el mes de enero, ocho vendedores de aparatos


electrodomésticos de la empresa XYZ vendieron el siguiente número de
ventiladores: 5, 11, 8, 14, 8, 11, 16,11. Luego el Rango de unidades
vendidas será:
R = 16 - 5 = 11.0 unidades

Normalmente al efectuar el reporte de la medida de variabilidad este se


efectúa con un dígito adicional al nivel original de medición.

Si deseáramos hallar el rango para datos agrupados tendremos que


emplear la siguiente formula:

R = Ls (A) - Li (B)

Li = Limite exacto o frontera inferior


Ls = Limite exacto o frontera superior

Desviación Media (DM)

Consiste en la media de los valores absolutos de las diferencias entre las


variables y la media aritmética. Su formula matemática es:

∑| |

∑| ̅|

Calculemos la desviación media para los datos empleados en el rango ,


primero hallaremos la media aritmética, que en este caso es 10.5, para
luego hallar los valores individuales de X - u , sus valores absolutos y la
sumatoria de estos, lo cual nos da un valor de 21.0, aplicando la formula
tendremos :

∑ | |

Con este resultado podemos concluir que, en promedio, las ventas por
vendedor difieren en 2.6 ventiladores de la media del grupo, sea más o
menos.
También podremos calcular la DM para un conjunto de datos Agrupados
mediante las siguientes formulas

∑ | |
∑ | ̅|

Varianza y Desviación Estándar

La varianza es semejante a la DM en vista de que también es una


diferencia de cada una de las variables y la media de ese grupo, la
diferencia se encuentra en que cada una de las diferencias es elevada al
cuadrado y luego se efectúa una sumatoria de estas, la formula para una
población es :

En esto caso la varianza de una muestra no es, en forma estrictamente


matemática; equivalente a la de la población, lo que cambia en la
formulación es el denominador, que en términos simples lo que se hace es
incluir un factor de corrección con la finalidad de que la varianza de una
muestra sea en forma efectiva un buen estimador (no sesgado) de la
varianza de la población, la formulación seria:

∑ ̅

Si queremos hallar la varianza en Datos Agrupados emplearemos:

∑( ̅ )

Generalmente nos resulta muy difícil efectuar una interpretación rápida


sobre el significado del valor de la varianza debido a que son valores al
cuadrado. Por esta razón es que se emplea la raíz cuadrada de la
varianza, a la que se le denomina Desviación Estándar.

La desviación estándar es la más importante de las medidas de dispersión,


mide la desviación promedio de cada una de las variables respecto a la
media aritmética. En otras palabras, la desviación estándar es la raíz
cuadrada del promedio de los cuadrados de las diferencias entre cada una
de las variables y la media aritmética. Su formula es:

Población:


Muestra:

∑ ̅

La Desviación Estándar es muy útil cuando se le emplea


conjuntamente con la Distribución Normal.

Usemos el ejemplo anterior y calculemos la desviación estándar


para esa población, primero tendremos que hallar la diferencia X - u para
cada variable luego elevarlas al cuadrado efectuar la sumatoria de estos
cuadrados y posteriormente a la suma total sacarle la raíz cuadrada, con lo
que obtendremos:


√ √

Como ya hemos dicho la DS es la medida de dispersión más importante/


debido a que la empleamos conjuntamente con varias técnicas de
inferencia estadística, si la empleamos con una distribución normal
(simétrica y mesocúrtica), se sabe que aproximadamente el 68.26% de las
mediciones (elementos) se encuentran a no más de una desviación
estándar de la media (hacia arriba y hacia abajo), aproximadamente el
95.5% de las mediciones se encuentran a no más de dos desviaciones
estándar de la media ,y el 99.7% se encuentran dentro de las tres DS,
dándonos una idea de probabilidad de ocurrencia de un evento.

En el caso de contar con una agrupación de Datos usaremos las siguientes


formulas:
Población


Muestra

∑ ̅

Con la finalidad de aliviar en alguna medida los cálculos de la varianza y


desviación estándar se cuenta con formulas abreviadas:

Datos No Agrupados

∑ ∑

∑ ̅ ∑ ̅

Datos Agrupados

∑ ∑

∑ ̅ ∑ ̅

Si empleamos nuestra formula abreviada de la DS en nuestro ejemplo


obtendremos el mismo resultado:
√ √

Número Estándar

Coeficiente de Variación

Este coeficiente nos indica la magnitud relativa de la desviación estándar


con respecto a la media aritmética de la distribución analizada, el
coeficiente de variación se emplea cuando se quiere comparar la
variabilidad de 2 conjuntos de datos con respecto al nivel general de los
valores de cada conjunto de datos sus formulas para población y muestra
son :

Por ejemplo, tenemos dos acciones comunes de una empresa, el precio


promedio al cierre en el mercado de valores durante el mes pasado fue,
para las acciones A $15000 con una DS de $500, para las B fue de $5000
con una DS de $300, si efectuamos una comparación absoluta diremos
que la acción A es más variable pues tiene una DS mayor, pero si
efectuamos una comparación basados en los niveles de precios debemos
efectuar una comparación de los CV, luego tendremos:

CV (A) = (500/ 15000) 100 = 3.3

CV (B) = (300 / 5000) 100 = 6.0

Con estos resultados podremos llegar a una mejor conclusión, en la cual


diremos que el precio de la acción B ha sido casi dos veces más variable
que el de A (precio promedio para C/U).

Sesgo y Curtosis
Con la finalidad de describir los datos o información recolectada, hemos
usado medidas de tendencia central y medidas de dispersión o variación.

Pero se nos puede presentar la siguiente situación, que dos grupos de


datos tengan medidas similares y aún así sean completamente distintos.

Si observamos los gráficos siguientes, el de la izquierda es simétrico y


unimodal, entonces podemos decir que la media, mediana y la moda
tienen un mismo valor.

El de la derecha, es asimétrico y presenta una cola más larga hacia el


lado izquierdo, podemos decir que esta sesgado hacia la izquierda. En
este caso los valores de la media, mediana y moda no son el mismo, sino
que el valor de la moda está ubicado en el punto pico de la distribución,
esto nos permite deducir que existe un número mayor de observaciones
hacia el lado izquierdo de la moda, que hacia el derecho. La razón es que
los valores extremos están concentrados hacia la mano izquierda, luego
la media que es influenciada por estos valores, se sitúa a la izquierda de
la mediana.

Si observábamos un cayo contrario, la concentración de vaporeo extremos es


hacia el lado derecho, entonces la media y la mediana estarán situadas a
la derecha de la moda, estando por supuesto la media más hacia la
derecha que la mediana. En este caso observamos que la media tiene un
valor mayor que la mediana, luego diremos que la distribución está
sesgada a la derecha.

Pero si observamos que la media tiene un menor valor que la mediana


diremos que la distribución está sesgada a la izquierda.

A una distribución sesgada a la derecha también se le conoce como


asimétrica positiva, mientras que a una sesgada a la izquierda como
asimétrica negativa.

El grado de asimetría de una distribución lo podemos determinar mediante


el llamado Coeficiente de asimetría de Pearson, cuyas formulas son:

Para una distribución simétrica este coeficiente será CERO, en distribución


sesgada a la derecha asumirá valores positivos y para una sesgada a la
izquierda asumirá valores negativos.
Como información general podemos verificar que una distribución de
Ingresos es sesgada hacia la derecha, y esto debido a que algunos
ingresos tienen valores extremadamente altos lo que hace que la media se
desplace hacia la derecha.

Tomemos el siguiente ejemplo, la cantidad de automóviles HYUNDAI


EXCEL de tres puertas vendidas por diez vendedores de la distribuidora de
Camino Real durante el mes pasado fue: 10, 2, 7, 10, 4, 12, 10, 12, 15 y
14. Este es un dato muestral que podría ser proyectado para determinar
ventas futuras. Determinemos el coeficiente de asimetría y qué tipo de
sesgo tiene la distribución.

X = (10+2+7+10+4+12+10+12+15+14) / 10 = 9.6

Med. = X(10/2+0.5) = 10

s = 4.1687

ASIMETRIA MUESTRAL = 3 ( X - Med.)


s

= 3 (9.6-10)/4.1687 - 0.2879

El coeficiente hallado de -0. 2 8 7 9 nos indica que la distribución de ventas de


automóviles es asimétrica negativa o lo que da lo mismo sesgada a la izquierda.

Veamos otro ejemplo, una muestra de trece empresas metal-mecánicas de Lima


indica que la cantidad de accidentes mensuales es: 0, 0, 3 , 2 , 1 2 , 3 , 0, 1 , 1 ,
8 , 5 , 0, 1 . Desearnos determinar que tipo de curva tiene esta muestra.

X = 36 /13 - 2.7692

Med. = X ( 1 3 / 2 + 0.5) =X7 = 1

S = 3.6321

ASIMETRIA MUESTRAL = 3 ( X - Med.)


s

= 1.4613

La muestra tomada a los accidentes ocurridos en empresas metal-mecánicas tiene


una curva de distribución asimétrica positiva o sesgada a la derecha.
Otra forma de describir una distribución es mediante la medición de su
achatamiento. Si observamos las siguientes curvas todas ellas son simétricas
pero a su vez son de diferente forma.

Por ej emplo, 1 a primera curva es una normal como vemos no es plana ni


puntiaguda, respecto de la distribución de los diferentes valores de las
observaciones, sino es una figura proporcional; a esta forma de curva se le
denomina mesocúrtica.

La segunda observamos que es algo puntiaguda en la región central, lo que


significa que las observaciones se encuentran concentradas asumiendo valores
con un estrecho rango de diferencia, a esta forma de curva se le denomina
leptocúrtica.

La última curva como observamos es completamente diferente a las otras dos,


esta presenta un achatamiento mucho mayor es decir es más plana, por lo que
podemos deducir que las observaciones se encuentran distribuidas de una
manera relativamente uniforme en todos los valores de la muestra, a esta
curva la denominaremos platicúrtica.

Ahora supongamos que somos un profesor y que confeccionado una curva


con la distribución de las notas, y que esta tiene una forma leptocúrtica, y
si además hemos normalizado las notas, tendremos dificultad para
distinguirlas debido a que todos los valores serían similares, estarían
concentrados.

Pero si la curva fuese una platicúrtica las notas estarían distribuidas en


todos los valores posibles, lo cual nos indica un alto grado de variabilidad.

PROBLEMA
Carlos Ruiz ha finalizado una discusión respecto a un control de
matemáticas, con algunos de sus desafortunados compañeros. Carlos
piensa que fue perjudicado por el profesor al emplear una distribución
normal en la asignación del calificativo en una prueba tan difícil como la
que tomó. Unos de sus amigos, Pepe, dijo que piensa que los calificativos
estuvieron bastante sesgados, por esta razón ambos hicieron una encuesta
a sus compañeros de clase para chequear la distribución, obteniendo los
siguientes datos:

Alumno Nota
1 53
2 63
3 77
4 68
5 75
Carlos 68
6 59
7 81
8 84
9 79
Pepe 75
10 82
11 76
12 52
13 76

a. Calcular la media, mediana y DS para las notas de la clase.

b. El profesor ha decidido que el intervalo de 1 DS hacia arriba y abajo


de la media es el rango del calificativo C. De 1 a 2 DS hacia arriba
será B, más de 2 DS una A. Una D le corresponderá a quienes
caigan entre 1 y 2DS por debajo de la media y F a más de 2 DS
por debajo. Para este control en que puntaje deben comenzar los
calificativos A, B, C, D y F.

¿Cuántos alumnos caen en cada grupo de calificativos? ¿Está


sesgada la distribución? ¿De qué forma?

c. ¿Está de acuerdo con Carlos? ¿Cómo calificaría a los alumnos?

También podría gustarte