Está en la página 1de 7

Medidas de Tendencia Central y Dispersin

Profesor: Patricio Videla Jimnez.



MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN

Medidas de Tendencia Central

Son medidas de un conjunto de datos que proporcionan un valor simple y
representativo, que resume un gran volumen de informacin. Este valor tiende a
ubicarse en el centro del conjunto (exceptuando en la escala nominal). Las
medidas del centro ms conocidas son: La media aritmtica, la media geomtrica,
la media armnica, la moda, la mediana y el semirango.

Mediadas de Dispersin

Son medidas de la variabilidad de un conjunto de datos y nos miden la
dispersin del conjunto con respecto a alguna medida del centro.
Las medidas de dispersin ms conocidas son: La varianza, la desviacin
estndar, el rango, el rango cuartlico y el rango percentil.

Escala Nominal

Sea n tamao de la muestra y supongamos que la muestra est particionada
en k clases. La nica medida de tendencia central posible de utilizar en este nivel
es la moda o ms estrictamente la clase modal.

DEF:
M
C , se dice clase modal si
i M
f f k i ,..., 2 , 1 =

OBS:

1) Es posible encontrar variables bimodales, trimodales, etc.
2) La clase modal, es la clase mayoritaria dentro de la muestra.
3) La clase modal no es igualmente significativa en todos los casos (es distinto si
50 . 0 =
M
f que si 20 . 0 =
M
f )

Para medir la importancia de la clase modal como medida central usaremos el
concepto de tasa de variacin. Se denota por V

n
n n
n
n
f V
M M
M

= = = 1 1

Es decir, la tasa de variacin nos entrega la proporcin de la muestra que no
est contenida en la clase modal.

Es claro que si la moda es altamente significativa ( ) 0 V .
En cambio si la moda es poco significativa ( ) 1 V .






Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.

Escala Ordinal

En este nivel tiene sentido los conceptos de frecuencia acumulada, lo que da
origen a nuevas medidas del centro y dispersin basados en los llamados
cuantiles o clases cuantiles, de entre los que se destacan:

Cuartil: Llamaremos cuartil de orden i -simo ( ) 4 , 3 , 2 , 1 = i al menor valor
de la variable cuya frecuencia relativa acumulada sea mayor o
igual a ( ) 4 i .

Debemos recordar que para hablar de valor de la variable se requiere estar al
menos en la escala intervalar. Luego en el caso de escala ordinal solo podemos
definir: Clase cuartil de orden i -simo.

Clase Cuartil: Llamaremos clase cuartil de orden i -simo ( ) 4 , 3 , 2 , 1 = i a la
primera clase (ya ordenada) cuya frecuencia relativa
acumulada es igual o superior a 4 i .

Otros cuantiles son los deciles y percentiles que se definen en forma equivalente a
los cuartiles solo que 4 i es sustituido por 10 i ( ) 10 ,..., 1 = i para deciles y 100 i
( ) 100 ,..., 2 , 1 = i para percentiles.

La medida del centro caracterstica en la escala ordinal es la mediana.

Clase Mediana: Corresponde a la clase cuartil de orden 2 o clase percentil de
orden 50.

Observaciones:

1) La clase mediana es aquella que divide la muestra aproximadamente en dos
mitades.

2) Una posible medida de dispersin de la muestra con respecto a la clase
mediana, en el nivel ordinal, es

D: ndice de Dispersin.


1
1 3

=
k
l er. cuarti de clase l - rango er. cuarti e rango clas
D

k : N total de clases.
Rango de una clase es su nmero de orden.

3) 1 0 D 0 D (Muestra concentrada)
1 D (Muestra aplanada)




Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.
Escala Intervalar

Notacin: Denotaremos por
i
X a cualquiera de los n valores,
n
X X X ,..., ,
2 1
, que
toma una variable X .

Medidas de tendencia central: En este nivel la medida central ms utilizable es la
media aritmtica o promedio

Media: Se denota por X . El promedio de un conjunto de observaciones, es le
centro de gravedad de ese conjunto de valores.

a) Datos no agrupados:

Se calcula como:

=
=
n
i
i
X
n
X
1
1


b) Datos agrupados:

Se calcula como:

= =
= =
k
i
i i
k
i
i i
M f M n
n
X
1 1
1


Donde
i
n : frecuencia absoluta de la clase i -sima.

i
f : frecuencia relativa de la clase i -sima.

i
M : marca de la clase i -sima.
k : nmero de clases o intervalos.
n : tamao de la muestra.

Mediana: Se denota por
e
M . La mediana de un conjunto de valores, es el valor
que divide a las observaciones en 50% menores y 50% mayores que
ese valor.

a) Datos no agrupados:

a
1
) Si n es par
( ) ( )
2
1 2 2 +
+
=
n n
e
X X
M

a
2
) Si n es impar

+
=
2
1 n e
X M










Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.
b) Datos agrupados:


e
e
e
e
a
n
N
n
L M


+ =
1
2
, donde:

L : Lmite inferior de la clase mediana.

1 e
N : Frecuencia absoluta acumulada hasta antes de la clase
mediana.

e
a : Amplitud de la clase mediana.

e
n : Frecuencia absoluta de la clase mediana.
n : Tamao de la muestra.

Moda: Se denota por
o
M . La moda es el valor del grupo de observaciones que
se repite en ms oportunidades (tiene mayor frecuencia), dentro del
conjunto de datos. Si el conjunto de datos tiene una sola moda se
denomina monomodal, de la misma manera puede ser bimodal o
multimodal, segn se aprecien dos o ms valores modales
respectivamente.

a) Para datos no agrupados:

Se revisan los datos y se selecciona aquel que se repite ms veces. En
caso de no existir un valor que se repite, entonces se dice que el grupo
de observaciones no tiene moda.

b) Para datos agrupados: Moda Interpolada.


M o
a L M

+

+ =
2 1
1
, donde:

L : Lmite inferior de la clase modal.

M
a : Amplitud de la clase modal.

1
:
1
n n
M


2
:
2
n n
M


M
n : Frecuencia absoluta de la clase modal.

1
n : Frecuencia absoluta de la clase anterior a la modal.

2
n : Frecuencia absoluta de la clase posterior a la modal.









Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.
Medidas de dispersin: La medida de dispersin ms usada con respecto a
la media X es la varianza muestral.

Varianza Muestral: Se denota por
2
S . La varianza es la mediada de
dispersin ms importante, principalmente porque
cumple muchas propiedades que la hacen ser preferida
entre otras medidas de dispersin

a) Para datos no agrupados:

( )

=
n
i
i
X X
n
S
1
2
2
1
1


b) Para datos agrupados:

( )

=
k
i
i i
X M n
n
S
1
2
2
1
1


Donde
i
n : frecuencia absoluta de la clase i -sima.

i
M : marca de la clase i -sima.
k : nmero de clases o intervalos.
n : tamao de la muestra.

OBS: La raz cuadrada de la varianza, S , se conoce como Desviacin
Estndar o Desviacin Tpica.

En este nivel de informacin tambin es posible calcular otras medidas de
dispersin tales como: Desviacin media, Rango cuartlico, Rango percentil, etc.

Desviacin Media: Se denota por MD .

a) Para datos no agrupados:

=
=
n
i
i
X X
n
MD
1
1


b) Para datos agrupados:



= =
= =
k
i
i i
k
i
i i
X M f X M n
n
MD
1 1
1


Donde
i
n : frecuencia absoluta de la clase i -sima.

i
f : frecuencia relativa de la clase i -sima.

i
M : marca de la clase i -sima.
k : nmero de clases o intervalos.
n : tamao de la muestra.


Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.
Rango Intercuartil: Se denota por RIQ .

( )
1 3
Q Q RIQ =

a) Para datos no agrupados:


( )

+
=
4
1 n i i
X Q , . 4 , 3 , 2 , 1 = i

b) Para datos agrupados:


i
i
i
Q
Q
Q
i
a
n
N
i n
L Q

+ =
1
4
, . 4 , 3 , 2 , 1 = i

L : Lmite inferior de la clase cuartil i -simo.

1
i
Q
N : Frecuencia absoluta acumulada hasta antes de la clase cuartil
i -simo.

i
Q
a : Amplitud de la clase cuartil i -simo.

i
Q
n : Frecuencia absoluta de la clase cuartil i -simo .
n : Tamao de la muestra.

Rango Percentil: Se denota por RP .


10 90
P P RP =

a) Para datos no agrupados:


( )

+
=
100
1 n i i
X P , 100 ,..., 2 , 1 = i

b) Para datos agrupados:


i
i
i
P
P
P
i
a
n
N
i n
L P

+ =
1
100
, 100 ,..., 2 , 1 = i

L : Lmite inferior de la clase percentil i -simo.

1
i
P
N : Frecuencia absoluta acumulada hasta antes de la clase
percentil i -simo.

i
p
a : Amplitud de la clase percentil i -simo.

i
p
n : Frecuencia absoluta de la clase percentil i -simo .
n : Tamao de la muestra.



Medidas de Tendencia Central y Dispersin
Profesor: Patricio Videla Jimnez.
Coeficiente de Variacin:

Finalmente se puede definir el coeficiente de variacin muestral, que nos da
un ndice de la proporcin que representa la desviacin estndar con respecto
a la media. Se denota por CV .


X
S
CV =

Este coeficiente es muy til, cuando se trata de compara poblaciones cuyas
variables en estudio tiene diferentes unidades.

También podría gustarte