Está en la página 1de 24

Medidas de dispersin

Clase dictada por Ana Vigna Aspirante a Estadstica Licenciatura en Relaciones Internacionales 8 de noviembre de 2010

Contenidos de la clase:
|

Medidas de dispersin:
z z

qu son? en qu q se diferencian y cmo se relacionan con las medidas de tendencia central? Rango o recorrido R id Rango o recorrido intercuartlico Varianza Desvo estndar o tpico Coeficiente de variacin
Frmulas Frmulas para datos originales y agrupados Ventajas y desventajas

Medidas:
z z z z z

Ejercicios de aplicacin

Medidas de dispersin
|

Indican si las p puntuaciones nt aciones son m muy parecidas o m muy distintas entre s. Las siguientes distribuciones tienen todas una media de 4. Qu las diferencia? 7, 6, 3, 3, 1 3, 4, 4, 5, 4 4, 4, 4, 4, 4 Existen dos procedimientos:
z z

Considerar C id el l recorrido id o amplitud lit d d de l la escala l en l la que se distribuyen las puntuaciones; Describir la variacin por medio de las diferencias que se producen entre todas las puntuaciones y un ndice de tendencia central.

Medidas de dispersin
|

qu En q se diferencian con las medidas de tendencia central?


|

Mientras las medidas de tendencia central nos indican dnde se concentra un grupo de puntuaciones puntuaciones, las medidas de dispersin refieren a la homogeneidad / heterogeneidad de una distribucin.

Cmo se relacionan con las medidas de tendencia central?


| |

Son complementarias Para calcular algunas medidas de dispersin es necesario conocer los valores de otras medidas Ambos tipos de medidas son necesarias para una descripcin acabada de una distribucin

Rango o recorrido
Se calcula S l l restndole t d l al l valor l ms alto lt d de una distribucin, el valor ms bajo | Se aplica tanto a distribuciones de datos originales, como a distribuciones de datos agrupados. d
|

Rango = Valor .mximo Valor .mnimo

Rango = Valor .mximo Valor .mnimo


Distribucin de datos originales g Distribucin de encuestados segn edad: z 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48 Entre el encuestado de mayor edad y z Rango = 63 18 = 45 aos el ms joven, hay una diferencia de 45 aos | Distribucin de datos agrupados
|
Distribucindepasessegnporcentajedelapoblacinde15yms aosdeedadanalfabeta,AmricaLatinayelCaribe.Ao2010

L.Inf. L.Sup 0a5 5a10 10a20 20a42 n(total)


z

Xc 2,5 7,5 15 31

fi 14 8 3 3 28

fr (%) 50 28 11 11 100

Fi 14 22 25 28

Fr(%) 50 78 89 100

Ai 5 5 10 22

Entre el pas con mayor porcentaje de analfabetismo y el pas con menor porcentaje, hay una diferencia de 42 puntos porcentuales

Fuente: Elaboracin propia en base a datos de CEPAL: Anuario estadstico de Amrica Latina y el Caribe, 2009

Rango = 42 0 = 42 puntos porcentuales

MEDIDA

VENTAJAS

DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia p es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin distribucin.

Rango o recorrido

Es fcil de calcular, y tiene una interpretacin intuitiva

Recorrido o rango intercuartlico


| | |

Es la diferencia entre el Q1 y el Q3 Nos indica la dispersin en el 50% central de la distribucin Es ms sensible a la concentracin de los datos que el recorrido ordinario Su clculo es indistinto para datos originales como para datos agrupados.

RI = Q3 Q1
Q3

Rangointercuartlico Q1 25% P25 25% P50 Q2 25% P75

25%

RI = Q3 Q1
| |

Datos originales g 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

Q1 = 1/ 4n = 0,25 * 12 = 3

Q3 = 3 / 4n = 0,75* 12 = 9

18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63
Q1 =(20+24)/2 =22 Q3 =(49+53)/2 =51

oA partir de los 22 aos hasta los 51 se ubica el 50% central de la distribucin

RI = 51 22 = 29.aos

o29 aos es la distancia existente en el 50% central de la distribucin

RI = Q3 Q1
|

L.Inf. L.Sup Xc fi fr (%) Fi Fr(%) Ai 0a5 2,5 14 50 14 50 5 Lmite inferior del 5a10 7,5 8 28 22 78 5 que contiene intervalo q 10a20 15 3 11 25 89 10 al primer cuartil (Fr% 20a42 31 3 11 28 100 22 supera al 25%) n(total) 28 100 Total de casos Frecuencia acumulada absoluta de la clase anterior a la que contiene al primer cuartil

Datos agrupados

Distribucindepasessegnporcentajedelapoblacinde15yms aos a osdeedada analfabeta, a abeta,Amrica caLatina at ayel e Caribe. Ca be.Ao o2010 0 0

(1/ 4N Fi 1) Q1 = L.Inf . + * Ai fi

(1/ 4 * 28 0) Q1 = 0 + * 5 = 2,5 14 Q3 = 5 + (3 / 4 * 28 14) * 5 = 9,4 8

frecuencia absoluta simple de la clase que contiene al Amplitud del intervalo que primer cuartil contiene al primer cuartil

RI = 9,4 2,5 = 6,9

MEDIDA

VENTAJAS

DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores i intermedios di d de l la di distribucin. ib i Solo mide la dispersin en el centro de la distribucin Solo mide la distancia entre el Q1 y Q3, y no la forma en que los datos estn distribuidos

Rango o recorrido

Es fcil de calcular, y tiene una interpretacin intuitiva

Rango g intercuartlico

Fcil de calcular No sufre la influencia de los valores extremos

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).
2 ( X X ) i i =1 N 2 X n X i 2 i =1 N

Datos originales:

S2 =

n 1

n 1

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).

Tabla de frecuencia de datos: S2 =

( X i X ) * fi
2 i =1

n 1

2 X fi n X i 2 i =1

n 1

Varianza
|

Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).

Tabla de frecuencia de clases:

S2 =

( Xci X ) * fi
2 i =1

n 1

2 Xc fi n X i 2 i =1

n 1

S2 =
| |

( X i X ) * fi
2 i =1

n 1

2 X fi n X i 2 i =1

n 1

Datos originales 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

x=

20 + 49 + 59 + 18 + 32 + 32 + 63 + 24 + 20 + 32 + 53 + 48 450 = = 37,5.aos 12 12

Edad 18 20 24 32 48 49 53 59 63 n(Total)

fi 1 2 1 3 1 1 1 1 1 12

Xi2 Xi2*fi 324 324 400 800 576 576 1024 3072 2304 2304 2401 2401 2809 2809 3481 3481 3969 3969 (Xi2 *fi)= 19736

X 2 = 1406,25
19736 12 * 1406,25 = 260,1 11

S2 =

S2 =

2 ( Xc X ) * fi i i =1

2 Xc fi n X i 2 i =1

Tabla de frecuencia de clases:


L.Inf. L. Sup 0a5 5a10 10a20 20a42 n(total)

x=

233 = 8,32.puntos.porcentuales 28

Xc 2,5 7,5 15 31

fi (Xc*fi) Xc2 Xc2*fi 14 35 6 87,5 8 60 56 450 3 45 225 675 3 93 961 2883 (Xc*fi) (Xc2*fi) 28 =233 =4095 4095,5 5

2 4095 , 5 28 * ( 8 , 32 ) 4095,5 28 * (69,2) 2 S = = = 77,1 28 28

MEDIDA

VENTAJAS

DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo mide la distancia entre el Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin.

Rango o recorrido

Es Es fcil de calcular, y tiene una interpretacin intuitiva

Rango intercuartlico

Fcil de calcular No sufre la influencia de los valores extremos Considera todos los valores d la de l di distribucin t ib i

Varianza

Desvo estndar o tpico

Es la medida ms frecuentemente usada de variabilidad, , y se calcula como la raz cuadrada de la varianza. Expresa la cantidad de variabilidad promedio en una di t ib i distribucin. Nos permite determinar cmo se distribuyen los valores en relacin con la media Su frmula es indistinta para distribuciones de datos originales o agrupados.
2 ( X X ) i i =1 N

S=

= S2

S= S
| |

Datos originales 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48

S = 260,1S = 260,1 = 16,1.aos


2

Tabla de frecuencia de clases:

S 2 = 77,1

S = 77,1 = 8,8.puntos.porcentual es

MEDIDA

VENTAJAS

DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo S l mide id l la di distancia i entre el l Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin. Es sensible a las unidades de medida

Rango o recorrido

Es fcil de calcular, y tiene una interpretacin intuitiva

Rango intercuartlico

Fcil de calcular No N sufre f l la i influencia fl i d de l los valores extremos Considera todos los valores de la distribucin Se expresa en las unidades originales de la variable

Varianza Desvo estndar o tpico

Coeficiente de variacin
|

Hace referencia a la variabilidad relativa, , relaciona la media con el desvo Nos indica el porcentaje de variacin que existe con respecto t al l valor l promedio di d de l la di distribucin. t ib i Su frmula es igual para datos originales que para datos agrupados.

S CV = * 100 X

S CV = * 100 X
|

Datos originales g

16,1 CV = * 100 = 43% 37,5


Tabla de frecuencia de clases:

8,8 CV = * 100 = 106% 8,32

MEDIDA

VENTAJAS

DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo S l mide id l la di distancia t i entre t el l Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin. Es E sensible ibl a l las unidades id d d de medida Arrastra las limitaciones que tiene la media como medida de tendencia central

Rango o recorrido

Es fcil de calcular, y tiene una interpretacin intuitiva

Rango intercuartlico

Fcil de calcular No N sufre f l la i influencia fl i d de l los valores extremos Considera todos los valores de la distribucin Se S expresa en las l unidades id d originales de la variable

Varianza Desvo estndar o tpico

Es til para comparar la Coeficiente de variabilidad entre conjuntos variacin de datos (de diferentes o iguales unidades de medida)

Bibliografa
z

Garca Ferrando, M. Socioestadstica Socioestadstica. . Introduccin a la estadstica en sociologa Lind, Marchal, Lind, Marchal, Mason: Estadstica para Administracin y Economa Repetto, D. Material de apoyo para el curso de Estadstica de Relaciones Internacionales