Está en la página 1de 40

Estadística

PLH 406
Medidas de tendencia
central

Francisco Henríquez
Henriquez.fco@gmail.com
www.freewebs.com/fcohenriquez/estadistica.htm
Notación de Sumatoria
El símbolo del lado
N

 i
indica la suma de todos
los Xi desde i=1 hasta
i=N. X
i 1
Notación de Sumatoria
 Es decir:
N

X
i 1
i  X 1  X 2  ...  X N
 Propiedades:
N

X Y
i 1
i i  X 1Y1  X 2Y2  ...  X nYn
N N

 aXi 1
i  aX 1  aX 2  ...  aX n a  X i
i 1
Notación de Sumatoria
 Propiedades:
n n n n

  aX
i 1
i  bYi  cZ i   a  X i  b Yi  c  Z i
i 1 i 1 i 1
Medidas de tendencia central para
datos no agrupados: La Media
 La Media Aritmética: la media de un conjunto N de
números X1, X2,X3,…,XN se denota X (o “X barra”) y
se define por:
N

X 1  X 2  X 3  ...  X N X i
 X
X  i 1

N N N
Medidas de tendencia central para
datos no agrupados: La Media
 Ejemplo:
 Tenemos los siguientes números:
 19, 80, 21, 74, 66
 La media se calcula:

19  80  21  74  66 260
x   52
5 5
Medidas de tendencia central para
datos no agrupados: La Media
 Calcular la media para los siguientes números:
 70, 98, 54, 97, 26
 El resultado es
70  98  54  97  26 345
x   69
5 5
Medidas de tendencia central para
datos no agrupados: La Media
 La Media Aritmética Ponderada: A veces se asocia
a los números X1, X2,…, XN ciertos factores de peso
(o pesos) w1, w2,…, wN, dependiendo de la influencia
asignada a cada número. En tal caso,

w1 X 1  w2 X 2  ...  wN X N w X i i
X  i 1
w1  w2  ...  wN N

w
i 1
i
Medidas de tendencia central para
datos no agrupados: La Media
 Ejemplo:
 Calcule el promedio de las siguientes notas:
 5,6 coef. 2; 3,5 coef. 1; 6,4 coef. 1 y 5,2 coef.2

5.6 * 2  3.5 *1  6.4 *1  5.2 * 2 31.5


x   5.25
2 11 2 6
 Otra manera de resolver este problema es
calculando un ponderador, que se define:
wi
ponderadori  N

w
i 1
i
Medidas de tendencia central para
datos no agrupados: La Media
 En este caso, los ponderadores son:
 2/6=0.333
 1/6=0.167
 entonces, se calcula
n
x   ponderadori * X i
i 1

x  5.6 * 0.333  3.5 * 0.167  6.4 * .167  5.2 * 0.333  5.25


Medidas de tendencia central para
datos no agrupados:
Proporciones
 Cuando se trabaja con datos de carácter
cualitativo, no se puede obtener media, sino que
proporciones, lo cual indica la frecuencia relativa
que posee un atributo en un conjunto de datos.
Se obtiene así:
fi
proporción p 
N
f i  Cantidad de individuos que presentan el atributo
N  Cantidad total de individuos
Medidas de tendencia central para
datos no agrupados:
Proporciones
 El valor p está entre 0 y 1. Para una
interpretación más sencilla se suele
multiplicar por 100 y se obtiene el porcentaje
de ocurrencia del fenómeno.
Medidas de tendencia central para
datos no agrupados:
Proporciones
 Por ejemplo, se puede calcular la proporción de
respuestas buenas que los alumnos tienen en un
ítem. De hecho, esta es una medida de dificultad
del ítem. Mientras más cercano a 1, más fácil es el
item.
 Se calcula:
 Total de alumnos : 560
 Alumnos que respondieron bien el ítem: 375
375
p  0.67
560
Medidas de tendencia central para
datos no agrupados:
Proporciones
 Ejercicio:
 Calcular el porcentaje que Sector frecuencia
representa cada uno de estos Alianza 278
grupos:
Concertación de partidos
 ¿Con cuál de las tendencias
por la democracia 468
políticas Ud. se identifica o
simpatiza más?... Pacto juntos podemos
(Partidos Comunista,
 (Encuesta CEP dic. 2006)
Humanista y otros) 110
Otros 7
Ninguna de ellas 594
No sabe 24
No contesta 24
Medidas de tendencia central para
datos no agrupados:
Proporciones
Sector frecuencia %
Alianza 278 18.5%
Concertación de partidos por la
democracia 468 31.1%
Pacto juntos podemos (Partidos
Comunista, Humanista y
otros) 110 7.3%
Otros 7 0.5%
Ninguna de ellas 594 39.5%
No sabe 24 1.6%
No contesta 24 1.6%
Total 1505  
Medidas de tendencia central para
datos no agrupados: La Mediana
 La Mediana: la mediana de un conjunto de números
ordenados en magnitud es el valor central o la
media de los dos valores centrales.

 Cuando hay un número impar de observaciones, es


la observación (N+1)/2:

Mediana : X N 1
2
Medidas de tendencia central para
datos no agrupados: La Mediana
 Ejemplo:
 Si tenemos el siguiente conjunto de datos:
 344, 190, 399, 473, 170, 363, 43, 671, 75, 421, 702,
846, 74, 652, 216, 304, 390, 457, 652, 700, 636,
934, 77, 444, 238, 78, 429,65, 927
 para obtener la mediana, primero debemos
ordenarlos:
 43, 65, 74, 75, 77, 78, 170, 190, 216, 238, 304, 344,
363, 390, 399, 421, 429, 444, 457, 473, 636, 652,
652, 671, 700, 702, 846, 927, 934.
Medidas de tendencia central para
datos no agrupados: La Mediana
 una vez ordenados, se deben contar:
 43, 65, 74, 75, 77, 78, 170, 190, 216, 238,
304, 344, 363, 390, 399, 421, 429, 444, 457,
473, 636, 652, 652, 671, 700, 702, 846, 927,
934.
 Son 29 observaciones.
 Entonces, la observación del medio es la
número 15 (ya que (29+1)/2=15).
 Y esa observación es 399.
Medidas de tendencia central para
datos no agrupados: La Mediana
 Obtener la mediana para los siguientes
datos:
 0, 7, 15, 18, 24, 44, 45, 49, 50, 68, 70, 75,
86, 88, 93, 97, 99.
 el número de observaciones es 17, por lo
que el valor mediano va a ser el noveno, es
decir:
 Me=50.
Medidas de tendencia central para
datos no agrupados: La Mediana
 Cuando N es impar se calcula el promedio entre los
dos valores del medio:

XN  XN
1
Mediana  2 2
2
Medidas de tendencia central para
datos no agrupados: La Mediana
 Ejemplo:
 2, 4, 9, 16, 29, 45, 60, 65, 67, 68
 Aquí hay 10 observaciones, luego, se debe
obtener el promedio de las que están “en el
medio”.
 Es decir las obs. 5 y la 6.
29  45 74
Me    37
2 2
Medidas de tendencia central para
datos no agrupados: La Mediana
 Ejercicio: Obtener la mediana de:
 3, 19, 33, 38, 40, 40, 45, 50, 55, 58, 74, 98
 hay 12 obs., por lo que a mediana está entre los
datos 6 y 7, es decir

40  45 85
Me    42.5
2 2
Medidas de tendencia central para
datos no agrupados: La Moda
 La Moda: la moda de un conjunto de
números es el valor que ocurre con mayor
frecuencia; es decir, el valor más frecuente.
La moda puede no existir e incluso no ser
única.
 La distribución con una sola moda se llama
unimodal y con dos es bimodal.
Medidas de tendencia central para
datos no agrupados: La Moda
 Ejemplo: determinar la moda de los
siguientes datos:
 10, 19, 21, 21, 32, 47, 47, 47, 71, 71, 73, 84,
89, 98
 Dado que el valor que más se repite es el 47,
 Moda = 47
Medidas de tendencia central para
datos no agrupados: La Moda
 Ejercicio, determinar la moda de los
siguientes datos:
 15, 23, 25, 30, 30, 41, 67, 78, 78, 79, 81, 84,
87, 89, 99.
 Moda = 30 y 78.
 11, 14, 21, 36, 38, 39, 41, 42, 43, 48, 51, 65,
72, 95
 En este caso, la moda no existe.
Medidas de tendencia central para
datos agrupados: La Media
 Media aritmética para datos agrupados:
Cuando se cuenta con datos agrupados en
una distribución de frecuencia, todos los
valores que caen dentro de un intervalo de
clase dado se consideran igual a la marca de
clase, o punto medio del intervalo.
Medidas de tendencia central para
datos agrupados: La Media
 Con Xj como marca de la clase j y fj como
frecuencia de la misma, se tiene que:
M

f
j 1
j Xj
X
N
 Nótese que se asume que hay M clases
Medidas de tendencia central para
datos agrupados: La Media
 Ejemplo:
 A partir de la LI LS Marca fi fr
siguiente tabla de 0 150 75 285 0.012
distribución de
150 300 225 5850 0.244
frecuencia, encuentre
la media. 300 450 375 4655 0.194
450 600 525 7382 0.308
600 750 675 856 0.036
750 900 825 4948 0.206
N 23976
Medidas de tendencia central para
datos agrupados: La Media
 Se puede hacer de dos maneras. Ambas
provienen de la definición de promedio
ponderado.
 La primera suma las frecuencias
multiplicadas por su marca y se divide por N.
 La segunda simplemente suma la
multiplicación de las marcas por las
frecuencias relativas.
Medidas de tendencia central para
datos agrupados: La Media

LI LS Marca fi fr M*fi
0 150 75 285 0.012 21375
150 300 225 5850 0.244 1316250
300 450 375 4655 0.194 1745625
450 600 525 7382 0.308 3875550
600 750 675 856 0.036 577800
750 900 825 4948 0.206 4082100

N 23976 11618700
Medidas de tendencia central para
datos agrupados: La Media

11618700
x  484.60
23976
Medidas de tendencia central para
datos agrupados: La Media

LI LS Marca fi fr marca*fr
0 150 75 285 0.012 0.892
150 300 225 5850 0.244 54.899
300 450 375 4655 0.194 72.807
450 600 525 7382 0.308 161.643
600 750 675 856 0.036 24.099
750 900 825 4948 0.206 170.258

N 23976 484.60
Medidas de tendencia central para
datos agrupados: La Mediana
 La mediana se obtiene por interpolación y está
dada por:
N

2
   1 
f a  
Mediana  L1   A
 f mediana 
 
L1  Frontera inferior de la clase mediana (la que contiene a la mediana)
N  Número de datos (frecuencia total)
  fa  1
 Suma de las frecuencias de las clases inferiores a la mediana
f mediana  Frecuencia de la clase mediana
A  Ancho de la clase mediana
Medidas de tendencia central para
datos agrupados: La Mediana
 Es una interpolación debido a que en esta
fórmula está implícito el supuesto de que los
datos se distribuyen de manera lineal en el
intervalo.
Medidas de tendencia central para
datos agrupados: La Mediana
 Ejemplo

LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976

N 23976
Medidas de tendencia central para
datos agrupados: La Mediana
 Lo primero que se debe hacer es determinar la
clase donde está la mediana.
 Lo anterior se realiza dividiendo N por 2, es
decir:
 23976/2=11988
 A continuación se debe encontrar la clase
mediana, la cual es la que tiene la frecuencia
acumulada mayor a la observación mediana.
 En este caso:
Medidas de tendencia central para
datos agrupados: La Mediana
 Ejemplo

LI LS Marca fi fa
0 150 75 285 285
150 300 225 5850 6135
300 450 375 4655 10790
450 600 525 7382 18172
600 750 675 856 19028
750 900 825 4948 23976

N 23976
Medidas de tendencia central para
datos agrupados: La Mediana
 Luego se debe aplicar la fórmula: Frecuencia
acumulada
N
 23976  anterior a la
  10790  frec. mediana
Mediana  450   2 *150 
 7382 
 
Ancho del Intervalo

Frecuencia Mediana
Límite Inferior de
la frecuencia
mediana
Medidas de tendencia central para
datos agrupados: La Mediana
 23976 
  10790 
Mediana  450   2 *150 
 7382 
 
 11988  10790 
Mediana  450   *150 
 7382 
 1198 
Mediana  450   *150 
 7382 
Mediana  450   0.162 *150 
Mediana  450  24.323
Mediana  474.323
Medidas de tendencia central para
datos agrupados: La Moda
 La moda, para datos agrupados es simplemente la
marca de la clase con mayor frecuencia.

LI LS Marca fi En este caso,


0 150 75 285 la moda es:
Moda = 525
150 300 225 5850
300 450 375 4655
450 600 525 7382
600 750 675 856
750 900 825 4948

También podría gustarte