Está en la página 1de 7

UNIVERSIDAD DE PAMPLONA

TUTOR:
KENNY ARTEVALO

ESTUDANTE:
JHONATAN PINTO

ADMINISTRACION DE EMPRESA
UNIPAMPLONA
SEMESTRE III
MEDIDAS DE DISPERSIÓN
También llamadas medidas de variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número si las diferentes puntuaciones de una variable están muy
alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto
menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos. Las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución.
Ejemplo

La Dispersión hace referencia a la forma en que se dispersan o alejan las puntuaciones


de una distribución o lista de puntajes.

TIPOS DE MEDIDAS DE DISPERSIÓN


 VARIANZA
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.

Donde
 X: Variable sobre la que se pretende calcular la varianza.
 x i: Observación número i de la variable Xi puede tomar valores entre 1 y n.
 n: Numero de observaciones.
 x̄: Es la media de la variable X
Características de la Varianza
 Es siempre un valor no negativo, que puede ser igual o distinta de 0.
 La varianza es la medida de dispersión cuadrática optima por ser la menor
de todas.
 Si a todos los valores de la variable se le suma una constante la varianza no
se modifica
 Si todos los valores de la variable se multiplican por una constante la
varianza queda multiplicada por el cuadrado de dicha constante.

Ejemplo
Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con
un salario diferente: Juan: 1.300 euros, Pepe: 1.500 euros, José: 1.700 euros, Miguel: 1.500
euros, Mateo: 2.000 euros
La media del salario, la cual necesitamos para nuestro cálculo, es de

(1300+1500+1700+1500+2000
5 )
=1600 euros.

Aplicando la formula en su forma desglosada se formula como sigue:

Reemplazamos

Var ( x ) =(1300−1600)2 +(1500−1600)2 +(1700−1600)2 +(1500−1600)2 +¿ ¿


2 2 2
Var ( x ) =(−300) +(−100) +(100) +¿ ¿
30000+10000+ 10000+ 10000+40000
Var ( x ) =
5

Var ( x ) =20000 Euros2


El resultado es de 2.0000 euros al cuadrado. Es importante recordar que siempre que
calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros,
en este caso tendríamos que realizar la desviación típica. El resultado aproximado sería de
141 euros. Esto quiere decir que, en media, la diferencia entre los salarios de las distintas
personas será de 141 euros.

 DESVIASIÓN ESTANDAR O TÍPICA


La Desviación Típica es la raíz cuadrada de la varianza; es decir, la raíz cuadrada de
la media de los cuadrados de las puntuaciones de desviación. La desviación típica se
representa por S o σ.

Donde:
 X: Variable sobre la que se pretende calcular la varianza.
 x i: Observación numero i de la variable Xi puede tomar valores entre 1 y n.
 N: Numero de observaciones.
 x̄: Es la media de la variable X.

Características de la Desviación Estándar o Típica


 Es afectada por el valor de cada observación.
 Como consecuencia de considerar desviaciones cuadráticas pone mayor
énfasis en las desviaciones extremas que en las demás desviaciones.
Ejemplo
Calcular la desviación estándar para los siguientes puntajes, 10-12-15-18-20. Teniendo en
cuenta que
R= 10
x̄= 15

D x̄=|10−15|+|12−15|+|15−15|+|18−15|+¿ 20−15∨ ¿ ¿
5
5+ 3+0+3+5
D x̄=
5
68
D x̄= =3.2
5

 COEFICIENTE DE VARIACION
También denominado como coeficiente de variación de Pearson, es una medida
estadística que nos informa acerca de la dispersión relativa de un conjunto de datos.

Donde:
 X: Variable sobre la que se pretende calcular la varianza.
 S x: Desviación típica de la variable x
 |x̄|: Es la media de la variable x en valor absoluto diferente a 0

Ejemplo
Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene
un peso medio de 6.000 kilogramos y una desviación típica de 800 kilogramos. La
población de ratones tiene un peso medio de 20 gramos y una desviación típica de 4
gramos.
Elefantes: 800/6000=0.13
Ratones: 4/200=0.2
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los
elefantes es de apenas un 13%, mientras que el de los ratones es de un 20%. Como
consecuencia de la diferencia entre las poblaciones y su peso medio, vemos que la
población con mayor dispersión, no es la que tiene una mayor desviación típica.

MEDIDAS DE UBICACIÓN no centrales


Las medidas de posición son indicadores estadísticos que permiten resumir los datos en uno
solo, o dividir su distribución en intervalos del mismo tamaño. Las medidas de posición,
por tanto, sirven para medir y para dividir.
 CUARTILES
Es uno de los más utilizados y divide la distribución en cuatro partes iguales. Así,
existen tres cuartiles. Los valores inferiores de la distribución se sitúan por debajo
del primero (Q1). La mitad o mediana son los valores menores iguales al cuartil dos
(Q2) y los superiores son representados por el cuartil tres (Q3).

 DECILES
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al
10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2,
D3, ..., D9. El quinto decil coincide con la mediana.

 PERCENTILES
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales,
denotados por P1, P2, ..., P98, P99. Tiene, a su vez, una equivalencia con los deciles
y cuartiles. Los percentiles 25, 50 y 75 coinciden con los cuartiles.

 DIAGRAMA DE CAJAS
Es un gráfico utilizado para representar una variable cuantitativa (variable
numérica). El gráfico es una herramienta que permite visualizar, a través de los
cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la
posición de la mediana, etc. Se compone de:

 Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3).


Dentro de la caja una línea indica dónde se encuentra la mediana (segundo
cuartil Q2)
 Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y
otro que empieza en el tercer cuartil y acaba en el máximo.
 Los datos atípicos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos.

Construcción del diagrama de caja


Para construir el diagrama de caja, debemos seguir los siguientes pasos:
1. Ordenar los datos.
2. Calcular los tres cuartiles (Q1, Q2 y Q3). Después, dibujamos el rectángulo (caja)
delimitado por el primer y tercer cuartil, dibujando entre los dos cuartiles una línea
para indicar donde está la mediana (segundo cuartil).
3. Calcular el rango intercuartílico, que es el tercer cuartil menos el primero.

4. Se calculan los límites admisibles inferior y superior (LI y LS) para identificar los
valores extremos.

Los límites marcarán los datos atípicos de la variable. Todos aquellos puntos que sean
menores que LI (x < LI) o mayores que LS (x > LS) son valores extremos. Es decir, son
todos aquellos valores que no están en el intervalo [LI,LS].
5. El mínimo es el menor valor del conjunto que sea mayor o igual que LI. El máximo
es el mayor valor del conjunto que es menor o igual que LS. Dibujamos los dos
brazos. El primero va desde el primer cuartil hasta el mínimo. El segundo, desde el
tercer cuartil hasta el máximo.
6. Se dibujan los valores extremos, representados por puntos o círculos pequeños.

También podría gustarte