Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2
TEMA 2
MEDIDAS DE CENTRALIZACIN
INTRODUCCIN
En este tema y los dos siguientes vamos a obtener unos nmeros que cuantifiquen las propiedades
fundamentales de la distribucin de frecuencias. Estos nmeros podemos clasificarlos en:
Medidas de localizacin (posicin). Son coeficientes de tipo promedio que tratan de representar
una determinada distribucin, pueden ser de dos tipos:
1.-CENTRALES:
-Medias:
Aritmtica
Geomtrica
Armnica
-Medianas
-Moda
2.-NO CENTRALES:
-Cuantiles:
Cuartiles
Deciles
Centiles o percentiles
Medidas de dispersin.
Son complementarias de las de posicin en el sentido que sealan la dispersin en conjunto de todos los
datos de la distribucin respecto de la medida o medidas de localizacin adoptadas.
-Medidas de dispersin absoluta: Recorrido
-Medidas de dispersin relativa: Recorrido intercuartlico, desviacin media, varianza, desviacin tpica.
-Coeficiente de variacin PEARSON.
-Diagrama de caja.
Medidas de forma
Estudian la asimetra- simetra y deformacin (apuntamiento, aplastamiento) respecto de una distribucin
modelo denominada distribucin NORMAL
Medidas de concentracin
Estudian la concentracin de una distribucin frente a la uniformidad.
INDICE DE GINI, CURVA DE LORENZ.
Apuntes de estadstica pg 1 de 12
D37 ESTADSTICA. Tema 2
MEDIA ARITMTICA: Es la suma de todos los valores de la variable dividida entre el nmero total
de elementos.
n
x 1 x 2 x 3 ....x n 1 x n
xi
i 1
X
n n
Si el valor xi de la variable X se repite n i veces, aparece en la expresin de la media aritmtica de la
forma:
X
x n i i
, que ser la expresin que consideraremos definitiva de la media aritmtica.
n
n
ni
Como fi otra posible expresin ser X x i fi
N i 1
Ejemplo: Si tenemos la siguiente distribucin, se pide hallar la media aritmtica, de los siguientes
datos expresados en kg.
xi ni x i ni
54 2 108
59 3 177
63 4 252
64 1 64
10 601
X
x i ni
601
60,1 kg
n 10
NOTA: A la media aritmtica se la denomina tambin CENTRO DE GRAVEDAD de la distribucin.
Si la variable esta agrupada en intervalos (variable continua), se asignan las frecuencias a las marcas de
clase y se procede como si la variable fuera discreta. En el futuro consideraremos indistintamente ci = xi
Ejemplo:
[Li-1,Li) xi = ci ni c i ni
Aadimos las
[30 , 40) 35 3 105 columnas
[40 , 50) 45 2 90 segn las
[50 , 60) 55 5 275 necesidades
10 470
X
x i ni
470
47
n 10
Apuntes de estadstica pg 2 de 12
D37 ESTADSTICA. Tema 2
MEDIA ARITMTICA PONDERADA: En ocasiones no todos los valores de la variable tienen el mismo
peso. Esta importancia que asignamos a cada variable, es independiente de la frecuencia absoluta que tenga. Ser
como un aumento del valor de esa variable, en tantas veces como consideremos su peso.
Es la media aritmtica que se utiliza cuando a cada valor de la variable (x i) se le otorga una ponderacin o
peso distinto de la frecuencia o repeticin. Para poder calcularla se tendr que tener en cuenta las ponderaciones
de cada uno de los valores que tenga la variable
w n i i
Ejemplo: Un estudiante realiza 3 exmenes de complejidad creciente, obteniendo los siguientes resultados:
5, 8 y 7.
El primer examen lo hizo en hora, el segundo en 1 hora y el tercero en hora y media, por lo que se les
atribuye una ponderacin de 1, 2 y 3 respectivamente. Se pide calcular la nota media.
Xi ni Wi xi wi
5 1 1 5
8 1 2 16
7 1 3 21
3 N=6 42
X
x i ni
587
6,67 .
n 3
Ahora bien, si calculamos la media ponderada, obtendremos:
xw
5x1 8x 2 7x 3 5 16 21 42 7
1 2 3 6 6
n
Veamos que resulta al operar la siguiente expresin: (x
i 1
i X) . Tendremos que
x n Xn n1 x n n n x n n1
n
ni 1 1
(x
i 1
i X)
ni
(x n i i Xni )
ni
i i i
i
i i X i
i
i i Xn
i
x i ni 1 1
x n i i n
. n
ni
0
ni
0
PROPIEDAD 2: La media aritmtica de los cuadrados de las desviaciones de los valores de la variable con
respecto a una constante cualquiera se hace mnima cuando dicha constante coincide con la media aritmtica
(Teorema de KRING).
x i k ni x i x ni
2 2
n
D k prop 1 0 i 0
n n n
Para k x (media aritmtica) el valor de las desviaciones ser mnima.
PROPIEDAD 3: Si a todos los valores de la variable se le suma una misma cantidad, la media aritmtica
queda aumentada en dicha cantidad:
Apuntes de estadstica pg 3 de 12
D37 ESTADSTICA. Tema 2
Supongamos ahora que tenemos otra variable, que se calcula a partir de la anterior de la siguiente forma:
y i x i k . Si ahora queremos calcular la media de esta segunda variable:
n
y i n i x i k n i x i n i kn i x i n i kn i x i n i kn i
y i 1
n n n n n n
x i ni
kn
x i ni k
n n n
PROPIEDAD 4: Si todos los valores de la variable se multiplican por una misma constante la media
aritmtica queda multiplicada por dicha constante . La demostracin se realizara de manera anloga a la
anterior.
NOTA: De las dos propiedades anteriores se deduce que la resta y la divisin se realizaran de igual
manera para la propiedad 3 y 4 respectivamente.
y
y i n i (ax i b)n i (ax i n i bn i ) a x i n i
b n i
ax b
n n n n n
Podemos utilizar esta metodologa para calcular la media de la siguiente distribucin.
Xi ni
38432 4
38432 8
38436 4
38438 3
38440 8
x i 38436
Si efectuamos un cambio de variable yi tomando como nueva variable el valor ms
2
centrado, tendremos::
xi ni yi yi ni
38432 4 (38432 - 38436)/2 = -2 -8
38432 8 (38432 - 38436)/2 = -1 -8
38436 4 (38436 - 38436)/2 = 0 0
38438 3 (38438 - 38436)/2 = 1 3
38440 8 (38440 - 38436)/2 = 2 16
n = 27 3
y i ni 3 1
y
n 27 9
x 38436
Como y , entonces
2
1
x 2 y 38436 2 38436 0,222 38436 38436,222
9
Apuntes de estadstica pg 4 de 12
D37 ESTADSTICA. Tema 2
Veamos la demostracin de la propiedad: Sea la distribucin x 1, x2, x3, x4, xn, xn+1, xn+2 .xk,
observando que habran como dos subconjuntos de n y k-n elementos cada uno. Si consideramos la media
aritmtica de la distribucin: X x i ni y calculamos los sumatorios para los dos subconjuntos, la expresin
n
de la media quedara:
n k n k
x j n j x r nr x jnj x r nr
j 1 r n 1 j 1 r n 1
X
n n n
Si multiplicamos numerador y denominador de cada una de las fracciones por una misma cantidad el
resultado no vara, por tanto, multiplicaremos la primera por N 1 que es su nmero de elementos del primer
subconjunto y la segunda por N2 que es el correspondiente, la expresin quedar:
n n
x jnj
x jnj
j 1 j 1
N1 N2
n k
N1 N2 como
N1 x j n j N2 x r nr
j 1 r n 1
X
N 1n N 2n n n
n kn
x jnj y
x rj n jr son la media del primer y segundo subconjunto, la expresin la
j 1 r n 1
x1 x2
N1 N2
N1 N X N X 2N2
podemos expresar de la siguiente manera: X X1 X2 2 1 1 que es lo que
n n n
queramos demostrar ya que si las frecuencias se multiplican o dividen por un mismo nmero, la media no vara
IMPORTANTE: Hay que tener en cuenta que la media aritmtica es muy sensible a los valores extremos,
es decir, a valores numricos muy diferentes, (tanto por lo grandes, o pequeos que sean), al resto de la muestra.
Esto puede resultar un problema. Hay formas de resolverlo, que veremos ms adelante.
Apuntes de estadstica pg 5 de 12
D37 ESTADSTICA. Tema 2
1
1
lg G lg( x 1n1 x 2n2 x 3n3 ....... x knk ) n lg( x 1n1 x 2n2 x 3n3 ....... x knk )
n
1
(lg x 1n1 lg x 2 n22 lg x 3n3 .... lg x knk )
n
sabiendo que lo podemos expresar en notacin compacta:
1 n lg x i
(n1 lg x 1 n 2 lg x 2 n 3 lg x 3 ...... n k lg x k ) i lg G , por lo que podemos
n n
decir que
n i lg x i
G = anti lg n
El logaritmo de la media geomtrica es la media aritmtica de los logaritmos de los valores de la variable.
El problema se presenta cuando algn valor es 0 negativo y exponente de la raz par ya que no exista raz par de
un nmero negativo.
Suele utilizarse cuando los valores de la variable siguen una progresin geomtrica. Tambin para
promediar porcentajes, tasas, n ndices, etc. siempre que nos vengan dados en porcentajes.
xi ni
100 10
120 5
125 4
140 3
n = 22
lg G
n i lg x i
n
por lo tanto ser conveniente ampliar la tabla con lo que nos quedar
xi ni lg xi ni lg xi
100 10 lg 100 = 2 20
120 5 lg 120 = 2.079 10,396
125 4 lg 125 = 2.097 8,387
140 3 lg 140 = 2.146 6,438
n = 22 45.221
lg G
n i lg x i
45,221
2,056
n 22
G = anti lg. 2,0555 = 113,632
NOTA: En la calculadora el antilogaritmo se halla apretando la tecla SHIFT log x
n n
H
n n n n
x i x 1 x 2 x 3 ....
i 1 21 3
Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeos).
Su problema: cuando algn valor de la variable es 0 o prximo a cero no se puede calcular.
xi ni
Apuntes de estadstica pg 6 de 12
D37 ESTADSTICA. Tema 2
100 10
120 5
125 4
140 3
Para poder hallarla, es necesario que calculemos el inverso de x y el inverso de la frecuencia por lo que
ampliaremos la tabla con 2 columnas adicionales :
n 22
H
ni
0,195
112 ,82
X
x i ni
2520
114 ,545
x n 22
i
Entre la media aritmtica la media geomtrica y media armnica se da siempre la siguiente relacin:
H G X
Apuntes de estadstica pg 7 de 12
D37 ESTADSTICA. Tema 2
MEDIANA: Me
La mediana o valor mediano ser el valor de la variable que separa en dos grupos los valores de las
variables, ordenadas de menor a mayor. Por tanto es una cantidad que nos indica orden dentro de la ordenacin.
n
El lugar que ocupa se determina dividiendo el n de valores entre 2:
2
Cuando hay un nmero impar de valores de la variable, la mediana ser justo el valor de orden central,
n n
aquel cuya frecuencia absoluta acumulada coincida con . Es decir: N i 1 N i Me x i . Por tanto
2 2
la mediana coincide con un valor de la variable.
n
El problema est cuando haya un nmero par de valores de la variable. Si al calcular resulta que es un
2
valor menor que una frecuencia absoluta acumulada, el valor de la mediana ser aquel valor de la variable cuya
n
frecuencia absoluta cumpla la misma condicin anterior: N i 1 N i Me x i . Por el contrario si
2
N x x i 1
coincide que N i , para obtener la mediana realizaremos el siguiente clculo: Me i
2 2
xi ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 7 33
13 2 35
n = 35
n 35
lugar que ocupa 17,5
2 2
n
como se produce que N i 1 N i 16 17,7 26 Me x i ,por lo tanto Me = 7
2
El otro caso lo podemos ver en la siguiente distribucin:
xi ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 6 32
n= 32
x 1 x i 1 5 7
Lugar que ocupa = 32/2 = 16 ==> Me 6
2 2
Notar que en este caso se podra haber producido que hubiera una frecuencia absoluta acumulada superior
a 16. En este caso se calculara como en el ejemplo anterior.
Apuntes de estadstica pg 8 de 12
D37 ESTADSTICA. Tema 2
N
N i 1
Me L i 1 2 ai
ni
Ejemplo:
[ Li-1, Li) ni Ni
[20 , 25) 100 100
[25 , 30) 150 250
[30 , 35) 200 450
[35 , 40) 180 630
[40 , 45) 41 671
N = 671
Apuntes de estadstica pg 9 de 12
D37 ESTADSTICA. Tema 2
MODA: Mo
Ser el valor de la variable que ms veces se repite, es decir, el valor que tenga mayor frecuencia absoluta.
Pueden existir distribuciones con ms de una moda: bimodales, trimodales, etc.
En las distribuciones sin agrupar, la obtencin de la moda es inmediata.
Ejemplo:
xi ni
1 2
2 7
3 5
4 7
5 4
En los supuestos que la distribucin venga dada en intervalos, es decir, sea agrupada, se pueden producir
dos casos: que tengan la misma amplitud, o que esta sea distinta.
Si tienen la misma amplitud, en primer lugar tendremos que encontrar el intervalo modal, ser aquel que
tendr mayor frecuencia absoluta [ L i 1 , L i ) . Posteriormente realizaremos el siguiente clculo:
n i 1
Mo L i 1 ai
n i 1 n i 1
Siendo:
Li-1 = extremo inferior del intervalo modal
ai amplitud de dicho intervalo
ni-1 + ni+1 = densidades de frecuencia de los intervalos anterior y posterior respectivamente al
que contiene la moda.
Cuando los intervalos sean de distinta amplitud, el intervalo modal ser el de mayor densidad de
ni
frecuencia , es decir d i ,ya que consideraremos la calidad del intervalo en funcin de la frecuencia y de la
ai
d i 1
amplitud. Para realizar el clculo, tendremos en cuenta la siguiente expresin: Mo L i 1 ai
d i 1 d i 1
Nota:
1.- Cuando hay una nica moda, la mediana suele estar comprendida entre x y Mo.
2.- Cuando la distribucin es simtrica (con 1 moda) se cumple que: x = Me=Mo
[Li-1,Li) ni di = ni/ai
[0 , 25) 20 0.8
[25 , 50) 140 5.6
[50 , 100) 180 3.6
[100 , 150) 40 0.8
[150 , 200) 20 0.4
Apuntes de estadstica pg 10 de 12
D37 ESTADSTICA. Tema 2
Son medidas de localizacin similares a las anteriores. Se las denomina CUANTILES (Q). Su funcin es
informar del valor de la variable que ocupar la posicin (en tanto por cien) que nos interese respecto de todo el
conjunto de variables.
Podemos decir que los Cuantiles son unas medidas de posicin que dividen a la distribucin en un cierto
nmero de partes de manera que en cada una de ellas hay el mismo de valores de la variable.
Existe un valor en cual coinciden los cuartiles, los deciles y percentiles es cuando son iguales a la
Mediana y as veremos
2 5 50
4 10 100
Distinguiremos entre distribuciones agrupadas, y las que no lo estn:
En las distribuciones sin agrupar, primero hallaremos el lugar que ocupa:
Entonces tendremos que :
xi ni Ni
5 3 3
10 7 10
15 5 15
20 3 18
25 2 20
n = 20
Calcular la mediana (Me); el primer y tercer cuartil (C 1,C3); el 4 decil (D4) y el 90 percentil (P90)
Mediana (Me)
Lugar que ocupa la mediana lugar 20/2 = 10
Como es igual a un valor de la frecuencia absoluta acumulada, realizaremos es clculo:
x i x i 1 10 15
Me 12,5
2 2
Apuntes de estadstica pg 11 de 12
D37 ESTADSTICA. Tema 2
Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta
x i x i 1 15 20
acumulada, por tanto realizaremos el clculo: C 3 17,5
2 2
[Li-1 , Li) ni Ni
[0 , 100) 90 90
[100 , 200) 140 230
[[200 , 300) 150 380
[300 , 800) 120 500
n = 500
Apuntes de estadstica pg 12 de 12