Está en la página 1de 7

E

P
R
I
S
A
I
D
E
M
D
S
N
Ó CAPÍTULO 3
LAS MEDIDAS DE POSICIÓN EN
DISTRIBUCIONES UNIDIMENSIONALES

INTRODUCCIÓN

LA MEDIA ARITMÉTICA
Se define la media aritmética simple como:

x̄=
x 1 + x2 +.. .+ x n

Si son muchos los valores, tenemos:

x̄=
N

n
∑ ni⋅x i
i=1
N
=
n
∑ xi
i=1
N

En el caso de datos agrupados se toman las marcas de clase. Si uno o más de los
intervalos son abiertos hacemos una hipótesis sobre la marca de clase con lo que el valor de la
media sería aproximado. Por ejemplo en una empresa el sueldo del último tramo: “más de
5000€”.

En ocasiones es conveniente introducir un coeficiente de ponderación que otorgue


mayor peso a algunos valores. Se define la media ponderada:

1
x̄=
n
∑ xi wi
i=1
n
∑ wi
i=1
Propiedades de la media aritmética

I) Cambio de escala y origen: Si y=ax+b , entonces ȳ=a x̄ +b .

II) La suma de las desviaciones de los valores o datos a su media aritmética es cero:

III) La suma de los cuadrados de las desviaciones de los valores observados unitarios
respecto a una constante arbitraria C es mínima cuando C coincide con la media aritmética:

es mínimo cuando .

IV) Si el total de datos u observaciones se estratifica en L grupos distintos, la media


aritmética del total es una media aritmética de las distintas medias de los estratos ponderadas
por el nº de observaciones que tienen los mismos:

Ventajas e inconvenientes de la media aritmética.

Ventajas:
 Es intuitivamente claro y resulta familiar.
 Es calculable en todas las variables cuantitativas
 Para su cálculo se utilizan todos los valores de la distribución
 Es única
 Tiene un claro significado ya que al ser el centro de gravedad de la
distribución representa todos los valores observados
 Es útil para llevar a cabo procedimientos estadísticos como la comparación de
medias de varios conjuntos de datos.

Inconvenientes

 El principal inconveniente es que es una medida muy sensible a los valores


extremos con lo que en distribuciones con gran dispersión puede llegar a
perder su significado. Anécdota del pollo: una persona come un pollo y la otra
ninguno; como media cada uno ha comido ½ pollo.
 No es calculable en variables cualitativas
 Puede haber dificultades de cálculo en distribuciones de tipo III con intervalos
abiertos.

2
MEDIA GEOMÉTRICA
Se define la media geométrica como:

√∏
p
N

G= x n ⋅x 2 ¿ .. .⋅x
N
1 1 2
n
p
n
p
=
i =1
x
i
n
i

Ventajas de la media geométrica:


 Es más representativa que la media aritmética cuando la variable evoluciona de
manera acumulativa con efectos multiplicativos.
 Cuando existe, su valor está definido de manera objetiva y es único.
 Para su cálculo se tienen en cuenta todos los valores de la distribución.
 Los valores extremos tienen menos influencia que en la aritmética.

Inconvenientes:
 Su significado estadístico es menos intuitivo que el de la media aritmética.
 Su cálculo es más complicado
 Si el nº de datos es par y hay datos negativos no existe.
 Si algún valor es nulo G=0.

LA MEDIA ARMÓNICA

Se llama media armónica a:

N
H=
n1 n2 np
+ +. . .+
x 1 x2 xp

Ventajas
 Es más representativa en el caso de promedios de velocidades, rendimientos,
productividades, etc.
 Está definida de manera objetiva y es única
 Su cálculo es sencillo y se tienen en cuenta todos los valores de la distribución
 Los valores extremos tienen menor influencia que en la aritmética.

Inconvenientes:
 Si algún valor es 0, no existe
ni
 Si algunos valores de la distribución son próximos a cero, los valores x i son
muy grandes eliminando la información que aportan los otros valores.

Ejemplo del ermitaño.

3
RELACIÓN ENTRE LAS MEDIAS ARMÓNICA
GEOMÉTRICA Y ARITMÉTICA.

Si existen las tres, se cumple:


H≤G≤ x̄

LA MEDIANA
Es el valor que divide la serie estadística ordenada en dos partes iguales dejando tantos
valores menores como mayores que ella.

En distribuciones del tipo I basta colocarlos de menor a mayor (o al revés) y si el nº de


observaciones es impar, la mediana es el término central mientras que si es par será la media
aritmética de los dos términos centrales:

Ejemplo:
En la serie 2,4,6,9,11 la mediana es el 6
En la serie 1,3,4,6,8,9 la mediana es el 5 que es la media entre 4 y 6. Si la variable no
admite decimales se toman como mediana los dos valores centrales.

En las distribuciones de tipo II se utiliza el siguiente criterio:


Ordenada la distribución utilizamos la columna de frecuencias acumuladas.
Calculamos N/2.
N
Ni>
Si 2 la mediana es el valor x i que corresponde a N i
N x i +x i +1
N i=
Si 2 la mediana es la media aritmética 2 , salvo que el resultado
no admita decimales, en cuyo caso se toman los dos valores como mediana.

En las distribuciones de tipo III se calcula:


N
−N i −1
2
Me=Li−1 + ⋅c i
ni
Se justifica la fórmula utilizando la semejanza de triángulos en el histograma de
frecuencias acumuladas

4
Ejemplos:
Nº DE
Nº DE SOBRINOS
HERMANOS
xi ni Ni
xi ni Ni
1 7 7
1 6 6
2 3 10
2 10 16
3 5 15
3 2 18
5 3 18
5 1 19
8 2 20
8 1 20

En las distribuciones de tipo III se calcula:

N
−N i −1
2
Me=Li−1 + ⋅c i
ni
[xi,xi+1) ni Ni
[0,800) 12 12
[800,1000) 6 18
[1000,1200
) 4 22
[1200,2000
) 12 34
[2000,5000
) 16 50

Ejemplo:

50

40

x 800

30 3 12
12

25
3

20 x x  200
800
M e  1200  200  1400

10

800 1000 1200 2000 5000

5
Ventajas de la mediana:

 Es la medida más representativa en el caso de variables que sólo admiten una


escala ordinal.
 Su cálculo es sencillo
 Tiene una fácil interpretación estadística.
 No es sensible a los valores extremos de la distribución

Inconvenientes:

El principal inconveniente es que en su determinación no se tienen en cuenta todos los


valores de la distribución. Este inconveniente puede convertirse en una ventaja ya que para
intervalos del tipo “menos de 600” o “más de 2000” basta conocer su frecuencia sin
necesidad de aventurar la longitud del intervalo.

LA MODA

Es el valor de máxima frecuencia, es decir, que más veces se repite. Si se trata de más de uno
la distribución se llama bimodal, trimodal,… y se designa por Mo.

Si en una distribución hay un valor que es mayor que los contiguos aunque no sea la
moda absoluta se le llama moda relativa.

En las distribuciones de tipo II basta observar el valor de máxima frecuencia.

En las distribuciones de tipo III distinguimos dos supuestos:


a) que los intervalos sean de igual amplitud en cuyo caso se hace un prorrateo
con los valores de los intervalos anterior y posterior al intervalo modal:
n i+1
Mo=Li−1 + ⋅c
ni−1 + ni+1 i
b) que los intervalos no sean de la misma amplitud, en cuyo caso es necesario
n
hi = i
calcular una densidad de frecuencia c i y será el intervalo modal el de
mayor densidad de frecuencia.

Ventajas de la moda:

 Es la única medida de posición central que puede obtenerse en distribuciones


de datos cualitativos.
 Su cálculo es sencillo
 Tiene una fácil interpretación estadística.

El principal inconveniente es que en su determinación no intervienen todos los


valores de la distribución.

6
MEDIDAS DE POSICIÓN NO CENTRALES: LOS
CUANTILES

Los cuartiles dividen la distribución en 4 partes iguales, los deciles en 10 partes


iguales, los percentiles en 100 partes iguales. Cálculo.

MEDIDAS DE POSICIÓN ROBUSTAS


La media k-recortada. Es la media en la que se eliminan para su cálculo el k% de los
datos extremos.

La media k-winsorizada. Se opera igual que en la media anterior pero sustituyendo


los valores eliminados anteriormente por el valor mayor/menor de los datos restantes.

La trimedia. Se calcula como:

MOMENTOS

Se definen los momentos respecto al origen como:


r r
1ni
ah =∑ x h⋅ = ∑ x ih⋅ni
i=1 i N N i=1

Obviamente a1 = x̄

Se definen los momentos centrales o respecto a la media como:

1
mh=
N
∑ ( x i− x̄ ) h⋅ni

Desde luego m 1=0 .

También podría gustarte