Está en la página 1de 14

D37 ESTADSTICA.

Tema 2

TEMA 2
MEDIDAS DE CENTRALIZACIN
2.1 2.2 2.3 2.4 Caractersticas de las medidas de posicin central. Medidas de centralizacin: media aritmtica, mediana y moda. Propiedades. Relacin entre media, mediana y moda. Cuantiles: cuartiles, deciles y percentiles. Medias geomtrica, armnica.

INTRODUCCIN En este tema y los dos siguientes vamos a obtener unos nmeros que cuantifiquen las propiedades fundamentales de la distribucin de frecuencias. Estos nmeros podemos clasificarlos en: Medidas de localizacin (posicin). Son coeficientes de tipo promedio que tratan de representar una determinada distribucin, pueden ser de dos tipos: 1.-CENTRALES: -Medias: Aritmtica Geomtrica Armnica -Medianas -Moda 2.-NO CENTRALES: -Cuantiles: Cuartiles Deciles Centiles o percentiles

Medidas de dispersin. Son complementarias de las de posicin en el sentido que sealan la dispersin en conjunto de todos los datos de la distribucin respecto de la medida o medidas de localizacin adoptadas. -Medidas de dispersin absoluta: Recorrido -Medidas de dispersin relativa: Recorrido intercuartlico, desviacin media, varianza, desviacin tpica. -Coeficiente de variacin PEARSON. -Diagrama de caja. Medidas de forma Estudian la asimetra- simetra y deformacin (apuntamiento, aplastamiento) respecto de una distribucin modelo denominada distribucin NORMAL Coeficiente de asimetra y coeficiente de Curtosis. Medidas de concentracin Estudian la concentracin de una distribucin frente a la uniformidad. INDICE DE GINI, CURVA DE LORENZ.

Apuntes de estadstica

pg 1 de 14

D37 ESTADSTICA. Tema 2

2.1

CARACTERSTICAS DE LAS MEDIDAS DE POSICIN CENTRAL. Las medidas de posicin son promedios y pueden ser de tendencia central o no, las ms importantes son las que hemos indicado en la introduccin, esto es: media, mediana, moda y los cuantiles. 2.2 MEDIDAS DE CENTRALIZACIN: MEDIA ARITMTICA, MEDIANA MODA. PROPIEDADES. RELACIN ENTRE MEDIA, MEDIANA Y MODA. Y

MEDIA ARITMTICA: Es la suma de todos los valores de la variable dividida entre el nmero total de elementos.
x + x + x3 + .... n1 + xn x X= 1 2 = n

xi
i=1

Si el valor xi de la variable X se repite de la media aritmtica de la forma:


X=

ni

veces, aparece en la expresin

x n
i

, que ser la expresin que consideraremos definitiva de la


n

media aritmtica. Como

n fi = i otra posible expresin ser N

X = xi fi
i= 1

Ejemplo: Si tenemos la siguiente distribucin, se pide hallar la media aritmtica, de los siguientes datos expresados en kg. xi ni xi n i 54 2 108 59 3 177 63 4 252 64 1 64 10 601

X=

xi ni
n

NOTA: A la media aritmtica se la denomina tambin CENTRO DE GRAVEDAD de la distribucin. Si la variable esta agrupada en intervalos (variable continua), se asignan las frecuencias a las marcas de clase y se procede como si la variable fuera discreta. En el futuro consideraremos indistintamente ci = xi Ejemplo: [Li-1,Li) [30 , 40) [40 , 50) [50 , 60) xi = c i 35 45 55 ni 3 2 5 10 ci ni 105 90 275 470 Aadimos las columnas segn las necesidad

601 = 60 kg , 1 10

X=

xi ni
n

470 = 47 10

Apuntes de estadstica

pg 2 de 14

D37 ESTADSTICA. Tema 2

MEDIA ARITMTICA PONDERADA: En ocasiones no todos los valores de la variable tienen el mismo peso. Esta importancia que asignamos a cada variable, es independiente de la frecuencia absoluta que tenga. Ser como un aumento del valor de esa variable, en tantas veces como consideremos su peso. Es la media aritmtica que se utiliza cuando a cada valor de la variable (x i) se le otorga una ponderacin o peso distinto de la frecuencia o repeticin. Para poder calcularla se tendr que tener en cuenta las ponderaciones de cada uno de los valores que tenga la variable Se la suele representar como:
Xw = x wn w n
i i i i i

Siendo wi la ponderacin de la variable xi y ponderaciones.

la suma de todas las

Ejemplo: Un estudiante realiza 3 exmenes de complejidad creciente, obteniendo los siguientes resultados: 5, 8 y 7. El primer examen lo hizo en hora, el segundo en 1 hora y el tercero en hora y media, por lo que se les atribuye una ponderacin de 1, 2 y 3 respectivamente. Se pide calcular la nota media. Xi 5 8 7 ni 1 1 1 3 Wi 1 2 3 N=6 xi wi 5 16 21 42

Si calculamos la media aritmtica tendremos que :

X=
xw =

xi ni
n

Ahora bien, si calculamos la media ponderada, obtendremos:

5+ 8+ 7 = 667. , 3

( 5x1) + ( 8x2) + ( 7x3) = 5+ 16+ 21= 42= 7 (1+ 2+ 3) 6 6

Propiedades de la media aritmtica PROPIEDAD 1: La suma de las desviaciones de los valores de la variable con respecto a la media aritmtica es 0. Veamos que resulta al operar la siguiente expresin: que
n

(x
i= 1

X) . Tendremos

n 1 1 1 1 (x X) n = (x n Xn ) n = (x n Xn ) n = (x n Xn ) n = (x n Xn) n =
i i i i i i i =1 i i i i i i i i i i i i

x n
i i

xi ni 1 1 . n =0 =0 n ni ni

PROPIEDAD 2: La media aritmtica de los cuadrados de las desviaciones de los valores de la variable con respecto a una constante cualquiera se hace mnima cuando dicha constante coincide con la media aritmtica (Teorema de KRING).

D( k) =

2 n ( xi k) ni ( xi x) ni = = prop = 0 i = 0 1 n n n 2

Para k = x (media aritmtica) el valor de las desviaciones ser mnima.


Apuntes de estadstica pg 3 de 14

D37 ESTADSTICA. Tema 2

PROPIEDAD 3: Si a todos los valores de la variable se le suma una misma cantidad, la media aritmtica queda aumentada en dicha cantidad: Supongamos que tenemos una variable x de la que conocemos su media. Supongamos ahora que tenemos otra variable, que se calcula a partir de la anterior de la siguiente forma: yi = xi + k . Si ahora queremos calcular la media de esta segunda variable:

yi ni ( xi + k)ni ( xi ni + kni ) xi ni + kni xi ni kni y = i=1 = = = = +


= n xi ni n + kn = n n xi ni n n n n n +k

como

xi ni
n

=X

si sustituimos tendremos

Y = X +k

que es lo

que pretendamos demostrar. PROPIEDAD 4: Si todos los valores de la variable se multiplican por una misma constante la media aritmtica queda multiplicada por dicha constante . La demostracin se realizara de manera anloga a la anterior. NOTA: De las dos propiedades anteriores se deduce que la resta y la divisin se realizaran de igual manera para la propiedad 3 y 4 respectivamente. Corolario: Si una variable es transformacin lineal de otra variable (suma de un nmero y multiplicacin por otro), la media aritmtica de la 1 variable sigue la misma transformacin lineal con respecto a la media aritmtica de la 2 variable, siendo yi = a xi + b , donde a y b son nmeros reales:

y=

yi ni = (axi + b)ni = (axi ni + bni ) = a xi ni + b ni


n n n n n

= ax + b

Podemos utilizar esta metodologa para calcular la media de la siguiente distribucin. Xi 38432 38432 38436 38438 38440 ni 4 8 4 3 8

Si efectuamos un cambio de variable variable el valor ms centrado, tendremos:: xi 3843 2 3843 2 3843 6 3843
Apuntes de estadstica

yi =

xi 38436 tomando como nueva 2


yi ni -8 -8 0 3

ni 4 = -2 8 = -1 4 = 0 3

yi (38432 - 38436)/2 (38432 - 38436)/2 (38436 - 38436)/2 (38438 - 38436)/2


pg 4 de 14

D37 ESTADSTICA. Tema 2

8 3844 0 n 27 = 8

= 1 (38440 - 38436)/2 = 2 3 16

y=
Como

yi ni 3 1 = = n 27 9
x 3 4 6 8 3 , 2

y=

entonces

1 x = 2y + 38436 2 + 38436 0222 38436 38436 = = , + = ,222 9

PROPIEADAD 5: - Si en un conjunto de valores se pueden obtener 2 ms subconjuntos disjuntos, la media aritmtica del conjunto se relaciona con la media aritmtica de cada uno de los subconjuntos disjuntos de la siguiente forma:

X=

xi Ni
I =1

Siendo xi la media de cada subconjunto y Ni el nm. de elementos de cada subconjunto. Veamos la demostracin de la propiedad: Sea la distribucin x1, x2, x3, x4, xn, xn+1, xn+2 .xk, observando que habran como dos subconjuntos de n y k-n elementos cada uno. Si consideramos la media aritmtica de la distribucin:

X=

xi ni
n

y calculamos los sumatorios para los dos subconjuntos, la expresin


n k n

de la media quedara:

X=

xj nj +
j =1

r =n+1

xr nr

Si multiplicamos numerador y denominador de cada una de las fracciones por una misma cantidad el resultado no vara, por tanto, multiplicaremos la primera por N1 que es su nmero de elementos del primer subconjunto y la segunda por N2 que es el correspondiente, la expresin quedar:
n j nj x j= 1 N1 n k N1 N1 j nj x N2 r nr x j= 1 r= + n 1 X= + = N1n N2n n n j nj x j= 1 N2 N2 + n

xj nj
j =1

+ r=n+1 n

xr nr

como

xj nj
j =1

N1

= x1
la

r=n+1

xrjnjr
N2

kn

= x2

son la

media del primer y segundo de la siguiente manera:

subconjunto,

expresin

la podemos

expresar

N N X N +X2N2 X = X1 1 +X2 2 = 1 1 que es lo que queramos demostrar ya que si n n n

las frecuencias se multiplican o dividen por un mismo nmero, la media no vara


Apuntes de estadstica pg 5 de 14

D37 ESTADSTICA. Tema 2

IMPORTANTE: Hay que tener en cuenta que la media aritmtica es muy sensible a los valores extremos, es decir, a valores numricos muy diferentes, (tanto por lo grandes, o pequeos que sean), al resto de la muestra. Esto puede resultar un problema. Hay formas de resolverlo, que veremos ms adelante. Media geomtrica y armnica. a) Media geomtrica: Responde a la siguiente expresin
G=
n n n n n x11 x22 x32 ......xkk

y se la puede define, como la raz n-sima del producto de todos los valores de la variable. Tambin la podemos representar como:
n n n 1 G =(xn x22 x33 .......xkk )n 1 1

NOTA: En muchas ocasiones, los valores de la distribucin nos impiden poder efectuar los clculos al exceder la capacidad de la calculadora. Utilizaremos las propiedades de los logaritmos: lg (a.b) = lg a + lg b lg an = n lg a
n n n n lgG = lg(x11 x22 x33 .......xkk ) n = 1

1 n n n n lg(x11 x22 x33 .......xkk ) = n

1 n n n (lgx11 +lgx2n2 +lgx33 +.... +lgxkk ) 2 n

sabiendo que lo podemos expresar en notacin compacta:

podemos decir que

n lgxi 1 (n1 lgx1 + n2 lgx2 + n3 lgx3 + ...... nk lgxk ) = i + = lg , por lo que G n n


G = anti lg

El logaritmo de la media geomtrica es la media aritmtica de los logaritmos de los valores de la variable. El problema se presenta cuando algn valor es 0 negativo y exponente de la raz par ya que no exista raz par de un nmero negativo. Suele utilizarse cuando los valores de la variable siguen una progresin geomtrica. Tambin para promediar porcentajes, tasas, n ndices, etc. siempre que nos vengan dados en porcentajes. Ejemplo: Hallar la media geomtrica de la siguiente distribucin: xi 100 120 125 140 ni 10 5 4 3 n = 22

ni lgxi n

lgG =

ni lgxi
n
lg xi lg 100 = 2 ni lg xi 20

por lo tanto ser conveniente ampliar la tabla con lo que nos quedar xi 100
Apuntes de estadstica

ni 10

pg 6 de 14

D37 ESTADSTICA. Tema 2

120 125 140 22

5 4 3 n =

lg 2.079 lg 2.097 lg 2.146

120 125 140

= = =

10,396 8,387 6,438 45.221

lg = G

ni lgxi
n

G = anti lg. 2,0555 = 113,632 NOTA: En la calculadora el antilogaritmo se halla apretando la tecla SHIFT log x b) Media armnica. La representaremos como H: Es la inversa de la media aritmtica de las inversas de los valores de la variable, responde a la siguiente expresin:
H= n n = ni n n1 n2 x x + x + x3 + .... i 1 21 3

45221 , = 2056 , 22

Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeos). Su problema: cuando algn valor de la variable es 0 o prximo a cero no se puede calcular. Ejemplo: calcular la media armnica de la siguiente distribucin: xi 100 120 125 140 ni 10 5 4 3

Para poder hallarla, es necesario que calculemos el inverso de x y el inverso de la frecuencia por lo que ampliaremos la tabla con 2 columnas adicionales : xi 100 120 125 140 ni 10 5 4 3 N= 22 5 1/xi 1/100 1/120 2 1/125 2 1/140 1 0.19 2520 0.02 420 0.03 500 ni/xi 0.1 0.04 xi n i 1000 600

H=

n 22 = = 112 ,82 ni 0195 , x i

X=

xi ni
n

2520 = 114 ,545 22

Apuntes de estadstica

pg 7 de 14

D37 ESTADSTICA. Tema 2

Entre la media aritmtica la media geomtrica y siempre la siguiente relacin:


H G X

media armnica se da

Apuntes de estadstica

pg 8 de 14

D37 ESTADSTICA. Tema 2

MEDIANA: Me
La mediana o valor mediano ser el valor de la variable que separa en dos grupos los valores de las variables, ordenadas de menor a mayor. Por tanto es una cantidad que nos indica orden dentro de la ordenacin. El lugar que ocupa se determina dividiendo el n de valores entre 2:

Cuando hay un nmero impar de valores de la variable, la mediana ser justo el valor de orden central, aquel cuya frecuencia absoluta acumulada coincida con

n 2

de la variable. El problema est cuando haya un nmero par de valores de la variable. Si al calcular

n n . Es decir: Ni1 < Ni Me= xi . Por tanto la mediana coincide con un valor 2 2

el valor de la mediana ser aquel valor de la variable cuya frecuencia absoluta cumpla la misma condicin anterior: coincide que

n resulta que es un valor menor que una frecuencia absoluta acumulada, 2 Ni1 <

n Ni Me= xi . Por el contrario si 2

N = Ni , para obtener la mediana realizaremos el siguiente clculo: 2

Me=

xi + xi+1 2
Ejemplo: Sea la distribucin xi 1 2 5 7 10 13 lugar que ocupa ni 3 4 9 10 7 2 n = 35 Ni 3 7 16 26 33 35

n 35 = = 175 , 2 2 Ni1 < n < Ni 16< 177< 26 Me= xi ,por lo tanto , 2

como se produce que

Me = 7 El otro caso lo podemos ver en la siguiente distribucin: xi 1 2 5 7 10 ni 3 4 9 10 6 n= 32

Ni 3 7 16 26 32

Lugar que ocupa = 32/2 = 16 ==>

Me=

Notar que en este caso se podra haber producido que hubiera una frecuencia absoluta acumulada superior a 16. En este caso se calculara como en el ejemplo anterior.
Apuntes de estadstica pg 9 de 14

x1 + xi+1 5+ 7 = =6 2 2

D37 ESTADSTICA. Tema 2

[Li ,Li ) , la forma de hacerlo ser calcular el valor de la mitad de n, y observar 1


que intervalo tiene una frecuencia absoluta acumulada que cumpla Ni1 < Despus de saberlo haremos el siguiente clculo:
N Ni1 M = Li1 + 2 e ai ni

En distribuciones agrupadas, hay que determinar el intervalo mediano

n < Ni . 2

Siendo:

[ Li-1, Li) el intervalo que contiene a la frecuencia acumulada N/2 ai = amplitud de dicho intervalo.

Ejemplo: [ Li-1, Li) [20 , 25) [25 , 30) [30 , 35) [35 , 40) [40 , 45) ni 100 150 200 180 41 N = 671 Ni 100 250 450 630 671

671/2 = 335.5 ; Me estar en el intervalo [30 - 35 ). Por tanto realizamos el clculo:

n Ni1 335 250 , Me = Li1 + 2 ai = 30+ *5 = 32138 , ni 200

Apuntes de estadstica

pg 10 de 14

D37 ESTADSTICA. Tema 2

MODA: Mo
Ser el valor de la variable que ms veces se repite, es decir, el valor que tenga mayor frecuencia absoluta. Pueden existir distribuciones con ms de una moda: bimodales, trimodales, etc. En las distribuciones sin agrupar, la obtencin de la moda es inmediata. Ejemplo: xi 1 2 3 4 5 ni 2 7 5 7 4

Moda {2, 4}, en este caso tenemos una distribucin bimodal. En los supuestos que la distribucin venga dada en intervalos, es decir, sea agrupada, se pueden producir dos casos: que tengan la misma amplitud, o que esta sea distinta. Si tienen la misma amplitud, en primer lugar tendremos que encontrar el intervalo modal, ser aquel que tendr mayor frecuencia absoluta [Li ,Li ) . 1 Posteriormente realizaremos el siguiente clculo:
M =Li + o 1 ni+ 1 ai ni +ni+ 1 1

Siendo: Li-1 = extremo inferior del intervalo modal ai amplitud de dicho intervalo ni-1 + ni+1 = densidades de frecuencia de los intervalos anterior y posterior respectivamente al que contiene la moda. Cuando los intervalos sean de distinta amplitud, el intervalo modal ser el de mayor densidad de frecuencia , es decir di =

ni ,ya que consideraremos la ai di+1 ai di1 + di+1

calidad del intervalo en funcin de la frecuencia y de la amplitud. Para realizar el clculo, tendremos en cuenta la siguiente expresin: Mo = Li1 +

Nota: 1.- Cuando hay una nica moda, la mediana suele estar comprendida entre x y Mo. 2.- Cuando la distribucin es simtrica (con 1 moda) se cumple que: x= Me=Mo Ejemplo: Hallar la moda de la siguiente distribucin [Li-1,Li) [0 , 25) [25 , 50) [50 , 100) [100 , 150)
Apuntes de estadstica

ni 20 140 180 40
pg 11 de 14

di = ni/ai 0.8 5.6 3.6 0.8

D37 ESTADSTICA. Tema 2

[150 , 200)

20

0.4

Calculamos el intervalo modal [25 50). Operamos:

Mo = Li1 +

di+1 36 , ai = 25+ 25= 455 , di1 + di+1 08+ 36 , ,

Apuntes de estadstica

pg 12 de 14

D37 ESTADSTICA. Tema 2

2.3 CUANTILES: CUARTILES, DECILES Y PERCENTILES Son medidas de localizacin similares a las anteriores. Se las denomina CUANTILES (Q). Su funcin es informar del valor de la variable que ocupar la posicin (en tanto por cien) que nos interese respecto de todo el conjunto de variables. Podemos decir que los Cuantiles son unas medidas de posicin que dividen a la distribucin en un cierto nmero de partes de manera que en cada una de ellas hay el mismo de valores de la variable. Las ms importantes son: CUARTILES, dividen a la distribucin en cuatro partes iguales (tres divisiones). C1,C2,C3, correspondientes a 25%, 50%,75%. DECILES, dividen a la distribucin en 10 partes iguales (9 divisiones).D1,...,D9, correspondientes a 10%,...,90% PERCENTILES, cuando dividen a la distribucin en 100 partes (99 divisiones).P1,...,P99, correspondientes a 1%,...,99%. Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando son iguales a la Mediana y as veremos

Distinguiremos entre distribuciones agrupadas, y las que no lo estn: En las distribuciones sin agrupar, primero hallaremos el lugar que ocupa: Entonces tendremos que : Ni=1 < (%) . n < Ni Q = xi en el supuesto que (%).n = Ni Q =

2 5 50 = = 4 10 100

Primero encontraremos el intervalo donde estar el cuantil: lugar Ni=1 < (%) n< Ni Intervalo [Li-1, Li) , en este caso:

xi + xi+1 2

Q = Li1 +

( %)N Ni1
ni

ai

Ejemplo: DISTRIBUCIONES NO AGRUPADAS: En la siguiente distribucin xi 5 10 15 20 25 ni 3 7 5 3 2 n = 20 Ni 3 10 15 18 20

Calcular la mediana (Me); el primer y tercer cuartil (C1,C3); el 4 decil (D4) y el 90 percentil (P90) Mediana (Me) Lugar que ocupa la mediana lugar 20/2 = 10 Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos es clculo: Me=

xi + xi+1 10+ 15 = = 125 , 2 2


(C1)
pg 13 de 14

Primer cuartil
Apuntes de estadstica

D37 ESTADSTICA. Tema 2

Lugar que ocupa en la distribucin ( ). 20 = 20/4 = 5 Como N i-1 < (25%).n 0 < Ni , es decir 3 < 5 < 10 esto implicara que C1 = xi = 1 Tercer cuartil (C3) Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta acumulada, por tanto realizaremos el clculo:

C3 =

xi + xi1 15+ 20 = = 175 , 2 2

Cuarto decil (D4) Lugar que ocupa en la distribucin (4/10) . 20 = 80/10 = 8. Como N i-1 < (%).n < Ni ya que 3 < 8 < 10 por tanto D4 =10. Nonagsimo percentil (P90) Lugar que ocupa en la distribucin (90/100). 20 = 1800/100 = 18. que coincide con un valor de la frecuencia absoluta acumulada, por tanto realizaremos el clculo: P90 =

xi + xi1 20+ 25 = = 225 , 2 2

Ejemplo: DISTRIBUCIONES AGRUPADAS: Hallar el primer cuartil, el cuarto decil y el 90 percentil de la siguiente distribucin: [Li-1 , Li) [0 , 100) [100 , 200) [[200 , 300) [300 , 800) ni 90 140 150 120 n = 500 Ni 90 230 380 500

Primer cuartil (C4) Lugar ocupa el intervalo del primer cuartil: (1/4). 500 = 500/4 = 125. Por tanto C4 estar situado en el intervalo [100 200).Aplicando la expresin

+ directamente, tendremos: C4 = 100

125 90 100= 125 140

Cuarto decil (D4) Lugar que ocupa: (4/10) . 500 = 200 . Por tanto D4 estar situado en el intervalo [100 200). Aplicando la expresin tendremos:

D4 = 100 +

200 90 100= 17857 , 140

Nonagsimo percentil (P 90) Lugar que ocupa: (90/100) . 500 = 450, por tanto P90 estar situado en el intervalo [300 800). Aplicando la expresin tendremos:

P90 = 300 +

450 380 70 500= 300 + 500= 591 ,67 120 120

Apuntes de estadstica

pg 14 de 14