Está en la página 1de 19

Tema.4. Medidas de posicin. Medidas de posicin individual, centiles. Medidas de posicin grupal. Concepto de tendencia central.

Media, mediana y moda. Propiedades. Resistencia y robustez. Medidas robustas de la tendencia central.

Medidas de posicin individual: centiles


Los centiles dividen la distribucin (ordenada) de datos en 100 partes. Cada parte contiene 1/100 de las puntuaciones.

El Centil 60, por ejemplo, es aquella puntuacin que deja por debajo de s el 60% de los datos. El Centil 15 es aquella puntuacin que deja por debajo de s el 15% de los datos.

Los centiles son cuantiles que dividen la distribucin en 100 partes. Hay otros cuantiles. Uno de ellos es la mediana, que divide la distribucin en dos partes (Mediana=Centil 50)

Otros cuantiles son los deciles (Decil 1=Centil 10) y los cuartiles (Cuartil 1=Centil 25, Cuartil 2= Mediana, Cuartil 3=Centil 75)

Medidas de posicin individual: centiles


Clculo de centiles

Centil k:

Posicin de Orden = ( N 1)

k 100

Mediana (Centil 50):

Posicin de Orden = ( N 1)

50 100

NOTA: el clculo lo veremos con datos individuales, y no con datos agrupados

Medidas de posicin grupal. Concepto de tendencia central.


Nos indican un valor representativo del grueso de los datos, de la referencia de los mismos un valor central.

Ejemplo: con las calificaciones 4,7,5,6,5,4,5,5,5,6,5,4,4, es claro que (a ojo) estn en torno a cinco, que podra ser tomado como ndice de tendencia central.

Veremos primero los 3 ndices de tendencia central ms comunes (moda, media y mediana). Despus veremos otros ndices que han sido propuestos.

Media aritmtica
Frmula:
X

X
n

Simplemente se trata de sumar todos los valores y dicha cantidad se divide por el nmero de valores que tengamos.
Si tenemos los datos: 4,6,5,3,7

La media ser (4+6+5+3+7)/5=4

Nota: se pueden emplear medias aritmticas ponderadas. Pensemos que hay 2 datos, uno (5) pesa 06 y el otro (6) pesa 04. Entonces, la media ser (5*06+6*04)/(06+04)=54

Propiedades de la Media aritmtica


-La suma de diferencias (de todos los valores) respecto a la media es siempre 0

-Si sumamos una constante a cada uno de los valores, la nueva media aritmtica resultante ser la original ms la constante.

-Si multiplicamos cada uno de los valores por una constante, la nueva media aritmtica ser la original por la constante.
-Minimiza la suma de diferencias en trminos cuadrticos.

Mediana
La Mediana (Mdn o Md) se define como el valor que tiene la propiedad de que el nmero de observaciones menores que l es igual al nmero de observaciones mayores que l.

Por ejemplo, en la secuencia (ordenada) 3,4,5,6,7,8,9 la mediana ser 6

En la secuencia (ordenada) 2,3,4,6,7,9 la mediana ser 5 (la media aritmtica entre los dos valores centrales; observad que n es par; en el ejemplo de arriba era impar)

Propiedades de la mediana
-No utiliza todos los elementos

-Se puede calcular con datos ordinales


-Se ve menos afectada por datos atpicos que la media aritmtica.

-Minimiza la suma de diferencias en valor absoluto (recordad que la media aritmtica minimizaba la suma de diferencias en trminos cuadrticos)

Ejemplo uso de la mediana


Los 9 empleados de una nueva empresa viven al lado de la Nacional 340 en diferentes kilmetros:
Nm. Emp.

2
4

1
26

Km 1

5 6

Dado que todos viajan en coche, y sabiendo que quieres minimizar el coste en gasolina, en qu lugar pondras la empresa para minimizar tal coste?

La moda
Se define como Moda (Mo) aquel valor de la variable al que corresponde mayor frecuencia.

En el conjunto de datos: 4,5,6,6,3,6,4,5 la Mo=6

Propiedades:

-No es necesariamente nica (puede haber varias modas)


-Se puede calcular con datos en escala nominal -En su clculo no intervienen todos los elementos

Cul elegir?

Moda

Media Mediana

Resistencia y robustez
Estadsticos resistentes: Son aquellos que no se ven influidos (o solo ligeramente) por pequeos cambios en los datos.

Evidentemente, la media es un estadstico muy poco resistente a cambios en los datos, dado que se ve influida por todos y cada uno de ellos.

La mediana, en cambio, es un estadstico altamente resistente.

Estadsticos (Estimadores) robustos (ESTADSTICA INFERENCIAL): Son aquellos estadsticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones tericas, aunque pueden no ser el mejor estimador para ningn tipo concreto de distribucin. Es decir, son el mejor compromiso.

La media no es un estimador robusto.

La mediana es un estimador ms robusto que la media, si bien hay otros estimadores ms robustos que veremos en el punto siguiente del temario.

Medidas robustas de tendencia central


1. Medias Recortadas Consiste en calcular la media aritmtica sobre un subconjunto central del conjunto de datos, no considerndose una determinada proporcin p por cada extremo. (p se expresa normalmente como porcentaje).

Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores.

Observar que la media recortada al 0% es la media aritmtica.

A la media recortada al 25% se la denomina centrimedia.

Medidas robustas de tendencia central


1. Medias Recortadas (cont)

Calcula la media recortada al 5% de los siguientes datos: 3, 4, 4, 5, 5, 6, 7, 8, 9, 11

El valor debe ser 6.11

Calcula la media recortada al 10% de los datos anteriores (da 6)

Calcula la centrimedia (da 5.8)

Medidas robustas de tendencia central


2. Media Winsorizada

Es anlogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cmputo de la media winsorizada.
As, en la media recortada a nivel 2 implicara eliminar las dos puntuaciones mayores y las 2 menores:

3, 4, 4, 5, 5, 6, 7, 8, 9, 11
Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos

En la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que ser la media winsorizada a nivel 2 (debe de dar 5.9)

Medidas robustas de tendencia central


3. Otros tipos de media en la que se recortan datos En muchas ocasiones lo que se hace es emplear un valor mnimo y uno mximo ms all del cual se eliminan los datos que sobrepasen tales valores.

Por ejemplo, en experimentos de tiempo de reaccin para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rpido; ms de 1500 ms es demasiado lento.)

De esta manera, si todos los datos estn en el rango 200-1500 ms no se elimina ningn dato

Medidas robustas de tendencia central


4. Trimedia

Es un ndice de tendencia central que consiste en calcular una media aritmtica ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil.

Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es:

Medidas robustas de tendencia central


5. Otras medidas robustas El estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre s por el tipo de ponderacin aplicada sobre los datos. Por ejemplo, en el Estimador-M de Huber (Estimador M de posicin): Las puntuaciones tpicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto ms pequeos cuanto mayor es su distancia respecto a cero. La constante es 1.339.

Clculo: lo da el SPSS.