Está en la página 1de 9

Ctedra: Probabilidad y Estadstica

MEDIDAS DE POSICIN Y DE DISPERSIN


ANLISIS DESCRIPTIVO DE UN CONJUNTO DE DATOS
Cualquiera sea el conjunto de datos en los cuales se ha estudiado una o ms variables cuantitativas, resulta interesante tener informacin resumida de sus caractersticas, como pueden ser la localizacin
del conjunto de observaciones y la dispersin de stas. Definiremos entonces algunas medidas de posicin
y otras de dispersin utilizadas en el estudio de variables unidimensionales.
Las medidas de posicin proporcionan la localizacin de la distribucin sobre el eje de las abscisas (respecto al origen). Graficamente, en la comparacin de dos distribuciones, se observa por ejemplo:
Fig. 1 hay un desplazamiento de la distribucin A respecto a la B sobre el eje de las abscisas. Fig. 2 la
concentracin de las unidades estadsticas es distinta, en A se concentran en valores ms cercanos al origen y en B en valores mas alejados al origen. Las medidas de posicin ms utilizadas son las medidas de
tendencia central (promedios, mediana y modo) aunque tambin dan mucha informacin los cuartiles, los
deciles y los percentiles.

Fig. 1

Fig. 2

Las medidas de dispersin son las que indican la intensidad con que se dispersan o concentran las observaciones respecto de una medida de tendencia central. La ms utilizada es el desvo standart ( o desviacin standart
o desviacin tpica), aunque tambin dan bastante informacin el rango, el recorrido intercuartil, y la desviacin
cuartlica. En la Fig. 3 hay una clara concentracin de datos alrededor de una misma medida de tendencia central
para la lnea punteada respecto a las otras dos distribuciones

Fig. 3
Las medidas de asimetra son aquellas que tomando como eje de simetra la ordenada correspondiente a un valor central, clasificaremos las distribuciones en simtricas (B), asimtrica a la derecha
(A) y asimtrica a la izquierda (C) segn la Fig. 4.

Medidas de Posicin y de Dispersin

10

Ctedra: Probabilidad y Estadstica

Fig. 4
SERIE SIMPLE
Cuando la cantidad de observaciones (n) es pequea, entonces disponemos de una serie simple de datos,
no es necesario organizarlos en una tabla de frecuencias.
Supongamos una serie simple de observaciones unidimensionales : x1, x2, ......, xn,
En dicha serie podemos calcular todas las medidas de posicin (salvo el modo), y todas las medidas de
dispersin.

Medidas de posicin
Promedios :
Existen tres tipos de promedio : aritmtico, geomtrico y armnico. Segn la naturaleza de la variable
corresponde usar uno u otro promedio. Cualquiera sea el promedio utilizado, en su clculo intervienen
todos los valores observados.
n

xi

Promedio aritmtico:

x=

Promedio geomtrico:

x g = n i=1 xi

Promedio armnico:

xh =

i =1

n
n

n
n

x
i =1 i

Los tres promedios cumplen con las siguientes dos propiedades:


1. El promedio de una constante es la misma constante.
2. El promedio de una variable multiplicada por una constante es igual a la constante multiplicada por el
promedio de la variable.

Por ser el ms utilizado el ms importante es el promedio aritmtico x , que tambin lo simbolizaremos M(x):

Medidas de Posicin y de Dispersin

19

Ctedra: Probabilidad y Estadstica

xi

Promedio Aritmtico= x = i =1

x + x 2 + ....... + x n
= 1
= M( x)
n

Propiedades del M(x)


1. M(k) = k
Demostracion:

para k constante
n

nk
M ( k ) = i =1 =
=k
n
n
2. M(k.x) = k. M(x)

para k constante

Demostracion :
n

kx i

k xi

M(kx) = i = 1
n

= i =1
n

= kM( x)

cumple con las siguientes :

3. M( x k ) = M(x) k

para k constante

Demostracion :
n

(x i k )

M( x k ) = i = 1
4. M(a.x b) = a.M(x) b

xi k

xi

= i =1

i =1 = i =1

i = 1 = M( x ) k
n

para a, b constantes

5. M( xi - x ) = 0
Demostracin, basta demostrar:
n

i =1

i =1

i =1

( x i x) = 0 x i x = nx nx = 0

6.

7.

( x i x ) 2 = min

i =1

es decir :

M( x y ) = M(x) M(y)

i =1

i =1

( x i x ) 2 < ( x i C) 2 , para

cx

para x, y variables

xi pi

8.

M( X) = i =1

donde pi son las ponderaciones correspondientes a cada valor prome-

pi

i =1

dio
Medidas de Posicin y de Dispersin

20

Ctedra: Probabilidad y Estadstica

xg = n xi

Promedio geomtrico:

i =1

Se define y se calcula para un conjunto de n observaciones, como la raz n-sima del producto de las n
observaciones.
Sean x1,x2,.......xn, , los distintos valores observados de la variable X, entonces su promedio geomtrico
ser:
n

x g = n x 1 x 2 ....x n = n x i
i =1

Observacin : No puede utilizarse si la variable toma algn valor negativo o nulo.


Aplicacin:
Para promediar cocientes (razones o porcentajes)
Cuando se trata de interpolar datos en una serie que proviene de una poblacin sea del tipo de una
progresin geomtrica o de fenmenos cuya variacin sea del tipo exponencial.
Ejemplo:
Se quiere calcular la poblacin en una fecha comprendida entre dos censos. Una hiptesis razonable es que el porcentaje de aumento es el mismo ao a ao, es decir que la poblacin ao a ao
sigue una progresin geomtrica.

Sea

P0 , P1 , P2 ,............., Pn

P0 = P0
P1 = P0r
P2 = P0r 2
P3 = P0r ,3 ......................, Pn = P0r n

Pn
= rn
P0

P0 , P0r , P0r 2 ,................., P0r n


Para calcular la poblacion para una fecha intermedia
n

Pn = P0r 2 = P0 r n = P0
2

Pn
=
P0

P02 Pn
=
P0

P0 Pn

Promedio armnico:
Se define y se calcula como el conjunto de n observaciones como la inversa de la media aritmtica de las
inversas de las observaciones .Sean x1, x2 ,...,xn, luego la expresin del promedio armnico es la siguiente:

xh =

n
n

x
i =1 i

Aplicacin:
Se utiliza para promediar cocientes y proporciones en la cuales la relacin numerador denominador puede expresarse en forma recproca, por. ej.:

Medidas de Posicin y de Dispersin

21

Ctedra: Probabilidad y Estadstica

velocidad =

espacio
tiempo

productividad =

produccion
cant . de empleados

Ejemplo:
Un automvil recorre una distancia de 100 km a una velocidad de 20km/h , y vuelve al punto de
partida a una velocidad de 50 km/h.
La variable es velocidady asume los valores
x1: 20 km/h
x2: 50 km/h
La ponderacin est dada por la distancia recorrida expresada en kilmetros.
La velocidad media obtenida deber ser la distancia total recorrida (100 km + 100 km)
divida por el tiempo total empleado 5 hs+2 hs = 7 hs.

veloc. media =

2 100 km
2 100 km
2
=
= 28.57 km / h
=
100 100
1
1
1
1
+
(
) hs 100( + ) hs
+
20
50
20 20
20 20

Lo cual justifica el uso del promedio armnico


Si calculamos el promedio aritmtico de la velocidad, obtendremos

20 km / h + 50 km / h
2

= 35 km / h = x

Luego al calcular la distancia total recorrida , sabiendo que


= 35 km/h * 7 hs = 245 km

d = v. t

FALSO

Mediana :
Es el valor de la variable que supera a no ms de la mitad de las observaciones y a la vez es superada por
no ms de la mitad de las observaciones. Para su clculo es necesario ordenar la serie de datos.
Si n (cantidad de observaciones) es impar, entonces la mediana es el valor que ocupa el lugar central.

M na = x n +1
2

Si n es par, entonces existen dos valores centrales, y la mediana se calcula como un promedio de stos.

M na =

x n + x n +1
2

Otras medidas de posicin, ya no de tendencia central, son :

Cuartiles :
Medidas de Posicin y de Dispersin

22

Ctedra: Probabilidad y Estadstica

Se distinguen dos cuartiles, uno de ellos, el cuartil inferior (o primer cuartil) supera a no ms de la
cuarta parte de las observaciones y a su vez es superado por no ms de las tres cuartas partes de las observaciones, y el otro, el cuartil superior (o tercer cuartil ) supera a no ms de las tres cuartas partes de las
observaciones y a su vez es superado por no ms de la cuarta parte de las observaciones. El segundo cuartil coincide con la mediana.
Para el clculo de los cuartiles es necesario ordenar la serie de valores observados.

Si n es mltiplo de cuatro, entonces

Qi = Q1 =

x n + x n +1
4

Qs = Q3 =

x 3n + x 3n +1
4

Deciles :
Son valores de la variable que dividen (o clasifican) a las observaciones en 10 partes, cada una de ellas
conteniendo no ms del 10% de las observaciones

DISTRIBUCIONES DE FRECUENCIA

Si los datos (por ser grande la cantidad de observaciones) ya estn organizados en una tabla de frecuencias, existen frmulas (o mtodos) para calcular las medidas de posicin y de dispersin, segn sea la variable discreta o continua.
Para variables unidimensionales, segn como se originen, tendremos una distribucin de frecuencias para
datos sin agrupar (discreta) o una distribucin de frecuencias para datos agrupados (continua).

Datos sin agrupar

Promedios
Si los datos estn sin agrupar, entonces no existe prdida de informacin. En este caso, los promedios se definen de la siguiente manera :
m

x=

promedio aritmtico

xi . f i
i =1
m

x .f
i

i =1

= xi .
i =1

fi m
= xi hi
n i =1

i =1

promedio geomtrico

f
x g = n xi i = i xi i

promedio armnico

xh =

i =1

i =1

n
m

xfi

i =1 i

Medidas de Posicin y de Dispersin

23

Ctedra: Probabilidad y Estadstica

Mediana y Modo

El clculo de la mediana y el modo es muy sencillo, basta observar los grficos.

M na =

n
2

M na

Analticamente :
Mediana :

Se busca la mediana de orden M ona = n , luego se determina la frecuencia acumulada Fi tal que

Fi 1 < Mona < Fi . La mediana entonces es el valor de la variable al cual le corresponda dicha frecuencia
acumulada Fi .

Luego, M na = xi

tal que Fi 1 < M ona < Fi

Nota: si la mediana de orden coincide con una de las frecuencias acumuladas M ona =
tonces la mediana normalmente es calculada como M na =

n
= Fi , en2

xi + xi +1
, pues de esta manera supera exac2

tamente a la mitad de las observaciones y es superada por la otra mitad.


Modo :

Es el valor de la variable al cual le corresponde la mxima frecuencia. Por lo tanto, se busca la


mayor frecuencia simple f i , y el modo ser el valor xi de la variable al cual le corresponda dicha frecuencia simple f i .
Notas : - al valor modal M do = xi le corresponde una frecuencia que supera a la de los valores
inmediatamente superior xi+1 e inferior xi1 .
es decir f i > f i +1

f i > f i 1

- En una distribucin de frecuencias puede existir ms de un modo. Si existen dos modos,


la distribucin se denomina bimodal.

Medidas de Posicin y de Dispersin

24

Ctedra: Probabilidad y Estadstica

- No existe modo en una distribucin uniforme.

En la figura (b), si bien no es una distribucin uniforme, la misma carece de un valor modal
Cuartiles:

Se determinan grficamente.

Q3 =

Q1 =

3n
4

n
4

Analticamente : Se calculan los cuartiles de orden

o
o
Qi = Q1 =

n
4

o
o
Q s = Q3 =

3. n
4

y se los determina en forma similar a la utilizada para la mediana.

Relacin entre las medidas de posicin de tendencia central


Si la distribucin es simtrica, entonces la media aritmtica coincide con el modo y la
mediana

Medidas de Posicin y de Dispersin

25

Ctedra: Probabilidad y Estadstica

La media aritmtica se encuentra afectada por los valores de datos extremos, no as la


mediana.
Por lo tanto , en distribuciones asimtricas , resulta lo siguiente:

M do < M na < x

en distribuciones asimtricas a la derecha

x < M na < M do

en distribuciones asimtricas a la izquierda

Distribucion Asimetrica a la Derecha

Mna
Mdo

Distribucin Asimtrica a la Izquierda

Medidas de Posicin y de Dispersin

19

También podría gustarte