Está en la página 1de 7

MEDIDAS DE DISPERSION

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central.Distinguimos entre medidas de dispersión
absolutas, que no son comparables entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras.

MEDIDAS DE DISPERSIÓN ABSOLUTAS

 VARIANZA(s2): es el promedio del cuadrado de las distancias entre cada observación


y la media aritmética del conjunto de observaciones.

   
Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la
varianza:

Si los datos están agrupados utilizamos las marcas de clase en lugar de X i.

 DESVIACIÓN TÍPICA(S):

La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para
evitar este problema podemos usar como medida de dispersión la desviación típica que
se define como la raíz cuadrada positiva de la varianza

 RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las


observaciones mayor y el menor.  Re = xmax- xmin

Si tengo el rango de varias muestras, la que tiene el rango mayor es la más dispersa.
MEDIDAS DE DISPERSIÓN RELATIVAS

 COEFICIENTE DE VARIACIÓN:

Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen


dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente
de variación que se define como el cociente entre la desviación típica y el valor absoluto
de la media aritmética

 El CV nos indica el porcentaje de observaciones que se aleja de la media mas o


menos un desvio.
 Si comparo varias muestras, la que tiene menor CV es la más homogénea.


Si tengo una sola muestra si el CV es menor a 40% lo considero homogéneo.
CVrepresenta el número de veces que la desviación típica contiene a la media
aritmética y por lo tanto cuanto mayor es CVmayor es la dispersión y menor la
representatividad de la media.

MEDIDAS DE ASIMETRIA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media


aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o


relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha
diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas


es:
 Coeficiente de Asimetría de Pearson: nos indica la dispersión de todo el lote.

 Coeficiente de Bowley: nos da la asimétrica del 50 % central del lote entre


Q1 y Q3

CB= (Q3-Me) - (Me-Q1)

(Q3-Me) + (Me-Q1)

Su valor es :

cero cuando la distribución es simétrica

positivo cuando existe asimetría a la derecha

negativo cuando existe asimetría a la izquierda


 
MEDIDAS DE POSICIÓN :Lote ordenado de menor a mayor

Cuartiles:DecilesPercentiles
-Dividen el lote en 4 partes - Dividen el lote en 10 partes -Dividen el lote en 100

Dato a dato

Posición: Q1=1x (n+1)/4 Di= i x (n+1)/10 Pi= i x(n+1)/100


Q2=2x (n+1)/4
Q3=3x (n+1)/4 i=1,2….9 i=1,2..99

Valor= Xmenor + 0,25 x ( Xmayor – Xmenor )


0,50
0,75

Ej: 4-5-8-9-11

Posición: Q3= 3x (5+1)/4= 4,5

Valor: 9+0,5 x (11 – 9)=10,5 (el 75 % de las observaciones son inferiores a 10,5 y el 25 %
restante superiores).

Agrupados sin intervalos

Saco la posición, luego la busco en la frecuencia absoluta acumulada que primero la


pasa y el valor en la primer columna.

Ejemplo:

Posición Q3: 3x (n+1/4)= (10+1)/4= 8,25 valor Q3= 2

xi fi Fi
0 3 3
1 4 7
2 2 9
3 1 10
n=10

Agrupados con intervalos


Saco la posición, luego la busco en la frecuencia absoluta acumulada que primero la
pasa y el valor interpolando.

Posición Q3= 3x (n)/4= 3x(9/4)= 6,75

Valor: interpolando

xi fi Fi
3;6 3 3
6;9 4 7
9;12 2 9
n=9

Diagrama de caja

Diagrama de caja (Box-Plot).

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se


visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos
brazos, los "bigotes".

Es un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la
simetría de la distribución.

Gráficamente

+-----+-+
* o |-------| | |---|
+-----+-+
+---+---+---+---+---+---+---+---+---+---+---+---+
0 5 10 12

 Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1,
Q2 y Q3 y el Rango Inter Cuartilico (RIC)

En el ejemplo:

 Valor 7: es el Q1 (25% de los datos)


 Valor 8.5: es el Q2 o mediana (el 50% de los datos)
 Valor 9: es el Q3 (25% de los datos)
 Rango Inter Cuartilico RIC (Q3-Q1)=2

 Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que
calcular los límites superior e inferior, Li y Ls, que identifiquen a los
valores atípicos.

Valores atipicos. Son aquellos inferiores a Q1-1.5x (RIC) o


Superiores a Q3+1.5x (RIC).
En el ejemplo:

 inferior: 7-1.5*2=4
 superior: 9+1.5*2=12
 Ahora se buscan los últimos valores que NO son atípicos, que serán
los extremos de los bigotes.

 En el ejemplo: 5 y 10

 Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

En el ejemplo: 0.5 y 3.5

 Además, se pueden considerar valores extremadamente atípicos aquellos


que exceden Q1-3*RIC o Q3+3*RIC.

De modo que, en el ejemplo:

 inferior: 7-3*2=1
 superior: 9+3*2=15

La regla Empírica: Datos Acampanados

En series de datos simétricos, donde la mediana y la media son iguales, las


observaciones tienden a distribuirse igualmente alrededor de estas mediciones de
tendencia central. Cuando el sesgado extremo no se presenta y tal agrupamiento se
observa en una serie de datos, podemos usar la denominada regla empírica para
examinar la propiedad de variabilidad de datos y obtener una mejor idea de lo que
la desviación estándar está midiendo.

La regla empírica establece que en la mayoría de las series de datos encontraremos


que aproximadamente dos de cada tres observaciones (es decir, el 67%), están
contenidas en una distancia de una desviación estándar alrededor de la media y
aproximadamente 90% a 95% de las observaciones están contenidas a una
distancia de 2 desviaciones estándar alrededor de la media.

La regla de BienayméChebyshev :

-Se utiliza cuando no seque forma tiene la distribución o es sesgada.

- El porcentaje de las distribuciones están contenidas dentro de las distancias de k


desviaciones estándar alrededor de la media debe ser al menos

1 – (1 / k2)=

 Al menos 75% de las observaciones deben estar contenidas dentro de


distancias de +/-2 desviaciones estándar alrededor de la media.
 Al menos 88,89% de las observaciones deben estar contenidas dentro de
una distancia de +/-3 desviaciones estándar alrededor de la media.
 Al menos 93.75% de las observaciones deben estar contenidas dentro de
distancias de +/-4 desviaciones estándar alrededor de la media.

También podría gustarte