Está en la página 1de 7

Medidas de Tendencia Central y Dispersin

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN

Medidas de Tendencia Central

Son medidas de un conjunto de datos que proporcionan un valor simple y


representativo, que resume un gran volumen de informacin. Este valor tiende a
ubicarse en el centro del conjunto (exceptuando en la escala nominal). Las
medidas del centro ms conocidas son: La media aritmtica, la media geomtrica,
la media armnica, la moda, la mediana y el semirango.

Mediadas de Dispersin

Son medidas de la variabilidad de un conjunto de datos y nos miden la


dispersin del conjunto con respecto a alguna medida del centro.
Las medidas de dispersin ms conocidas son: La varianza, la desviacin
estndar, el rango, el rango cuartlico y el rango percentil.

Escala Nominal

Sea n tamao de la muestra y supongamos que la muestra est particionada


en k clases. La nica medida de tendencia central posible de utilizar en este nivel
es la moda o ms estrictamente la clase modal.

DEF: C M , se dice clase modal si f M f i i = 1,2,...,k

OBS:

1) Es posible encontrar variables bimodales, trimodales, etc.


2) La clase modal, es la clase mayoritaria dentro de la muestra.
3) La clase modal no es igualmente significativa en todos los casos (es distinto si
f M = 0.50 que si f M = 0.20 )

Para medir la importancia de la clase modal como medida central usaremos el


concepto de tasa de variacin. Se denota por V

nM n nM
V =1 fM =1 =
n n

Es decir, la tasa de variacin nos entrega la proporcin de la muestra que no


est contenida en la clase modal.

Es claro que si la moda es altamente significativa (V 0 ) .


En cambio si la moda es poco significativa (V 1) .

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

Escala Ordinal

En este nivel tiene sentido los conceptos de frecuencia acumulada, lo que da


origen a nuevas medidas del centro y dispersin basados en los llamados
cuantiles o clases cuantiles, de entre los que se destacan:

Cuartil: Llamaremos cuartil de orden i -simo (i = 1,2,3,4) al menor valor


de la variable cuya frecuencia relativa acumulada sea mayor o
igual a (i 4) .

Debemos recordar que para hablar de valor de la variable se requiere estar al


menos en la escala intervalar. Luego en el caso de escala ordinal solo podemos
definir: Clase cuartil de orden i -simo.

Clase Cuartil: Llamaremos clase cuartil de orden i -simo (i = 1,2,3,4) a la


primera clase (ya ordenada) cuya frecuencia relativa
acumulada es igual o superior a i 4 .

Otros cuantiles son los deciles y percentiles que se definen en forma equivalente a
los cuartiles solo que i 4 es sustituido por i 10 (i = 1,...,10 ) para deciles y i 100
(i = 1,2,...,100 ) para percentiles.
La medida del centro caracterstica en la escala ordinal es la mediana.

Clase Mediana: Corresponde a la clase cuartil de orden 2 o clase percentil de


orden 50.

Observaciones:

1) La clase mediana es aquella que divide la muestra aproximadamente en dos


mitades.

2) Una posible medida de dispersin de la muestra con respecto a la clase


mediana, en el nivel ordinal, es

D : ndice de Dispersin.

rango clase 3er. cuartil - rango de clase 1er. cuartil


D=
k 1

k : N total de clases.
Rango de una clase es su nmero de orden.

3) 0 D 1 D 0 (Muestra concentrada)
D 1 (Muestra aplanada)

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

Escala Intervalar

Notacin: Denotaremos por X i a cualquiera de los n valores, X 1 , X 2 ,..., X n , que


toma una variable X .

Medidas de tendencia central: En este nivel la medida central ms utilizable es la


media aritmtica o promedio

Media: Se denota por X . El promedio de un conjunto de observaciones, es le


centro de gravedad de ese conjunto de valores.

a) Datos no agrupados:

1 n
Se calcula como: X = Xi
n i =1

b) Datos agrupados:

1 k k
Se calcula como: X = i i
n i =1
n M =
i =1
fi Mi

Donde n i : frecuencia absoluta de la clase i -sima.


fi : frecuencia relativa de la clase i -sima.
Mi : marca de la clase i -sima.
k: nmero de clases o intervalos.
n: tamao de la muestra.

Mediana: Se denota por M e . La mediana de un conjunto de valores, es el valor


que divide a las observaciones en 50% menores y 50% mayores que
ese valor.

a) Datos no agrupados:

X (n 2 ) + X (n 2+1)
a1) Si n es par M e =
2

a2) Si n es impar M e = X n +1

2

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

b) Datos agrupados:

n
N e 1
2
Me = L + a , donde:
e
ne

L: Lmite inferior de la clase mediana.


N e 1 : Frecuencia absoluta acumulada hasta antes de la clase
mediana.
ae : Amplitud de la clase mediana.
ne : Frecuencia absoluta de la clase mediana.
n: Tamao de la muestra.

Moda: Se denota por M o . La moda es el valor del grupo de observaciones que


se repite en ms oportunidades (tiene mayor frecuencia), dentro del
conjunto de datos. Si el conjunto de datos tiene una sola moda se
denomina monomodal, de la misma manera puede ser bimodal o
multimodal, segn se aprecien dos o ms valores modales
respectivamente.

a) Para datos no agrupados:

Se revisan los datos y se selecciona aquel que se repite ms veces. En


caso de no existir un valor que se repite, entonces se dice que el grupo
de observaciones no tiene moda.

b) Para datos agrupados: Moda Interpolada.

1
M o = L + a M , donde:
1 + 2

L: Lmite inferior de la clase modal.


aM : Amplitud de la clase modal.
1 : n M n1
2 : nM n2
nM : Frecuencia absoluta de la clase modal.
n1 : Frecuencia absoluta de la clase anterior a la modal.
n2 : Frecuencia absoluta de la clase posterior a la modal.

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

Medidas de dispersin: La medida de dispersin ms usada con respecto a


la media X es la varianza muestral.

Varianza Muestral: Se denota por S 2 . La varianza es la mediada de


dispersin ms importante, principalmente porque
cumple muchas propiedades que la hacen ser preferida
entre otras medidas de dispersin

a) Para datos no agrupados:

S2 =
1 n
(X i X )2
n 1 i =1

b) Para datos agrupados:

n i (M i X )
1 k

2
S2 =
n 1 i =1

Donde n i : frecuencia absoluta de la clase i -sima.


Mi : marca de la clase i -sima.
k: nmero de clases o intervalos.
n: tamao de la muestra.

OBS: La raz cuadrada de la varianza, S , se conoce como Desviacin


Estndar o Desviacin Tpica.

En este nivel de informacin tambin es posible calcular otras medidas de


dispersin tales como: Desviacin media, Rango cuartlico, Rango percentil, etc.

Desviacin Media: Se denota por MD .

a) Para datos no agrupados:

1 n
MD = Xi X
n i =1

b) Para datos agrupados:

1 k k
MD = i i
n i =1
n M X =
i =1
fi Mi X

Donde n i : frecuencia absoluta de la clase i -sima.


fi : frecuencia relativa de la clase i -sima.
Mi : marca de la clase i -sima.
k: nmero de clases o intervalos.
n: tamao de la muestra.

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

Rango Intercuartil: Se denota por RIQ .

RIQ = (Q 3 Q1 )

a) Para datos no agrupados:

Q i = X i (n +1) , i = 1,2,3,4.

4

b) Para datos agrupados:

n i
N Qi 1
4
Qi = L + a , i = 1,2,3,4.
Qi
n Qi

L: Lmite inferior de la clase cuartil i -simo.


N Qi 1 : Frecuencia absoluta acumulada hasta antes de la clase cuartil
i -simo.
a Qi : Amplitud de la clase cuartil i -simo.
n Qi : Frecuencia absoluta de la clase cuartil i -simo .
n: Tamao de la muestra.

Rango Percentil: Se denota por RP .

RP = P90 P10

a) Para datos no agrupados:

Pi = X i (n +1) , i = 1,2,...,100

100

b) Para datos agrupados:

n i
N Pi 1
100
Pi = L + a , i = 1,2,...,100
Pi
n Pi

L: Lmite inferior de la clase percentil i -simo.


N Pi 1 : Frecuencia absoluta acumulada hasta antes de la clase
percentil i -simo.
a pi : Amplitud de la clase percentil i -simo.
n pi : Frecuencia absoluta de la clase percentil i -simo .
n: Tamao de la muestra.

Profesor: Patricio Videla Jimnez.


Medidas de Tendencia Central y Dispersin

Coeficiente de Variacin:

Finalmente se puede definir el coeficiente de variacin muestral, que nos da


un ndice de la proporcin que representa la desviacin estndar con respecto
a la media. Se denota por CV .

S
CV =
X

Este coeficiente es muy til, cuando se trata de compara poblaciones cuyas


variables en estudio tiene diferentes unidades.

Profesor: Patricio Videla Jimnez.

También podría gustarte