Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(281728099u) Tendencia - Central - 14
(281728099u) Tendencia - Central - 14
A veces, de los datos recolectados ya organizados en alguna de las formas vistas en captulos
anteriores, se desea encontrar una especie de punto central en funcin de sus frecuencias. En
Estadstica se conocen tres diferentes, llamadas medidas de tendencia central, cuya utilizacin
vara de acuerdo con lo que se desee del conjunto de datos recolectados. Esas tres medidas de
tendencia central son la media, la mediana y la moda.
Cada una de ellas se estudiar en dos partes: primero, cuando los datos estn organizados en
tablas de distribucin de frecuencias simples y, segundas, cuando estn organizados en intervalos.
Adems, a veces difieren las frmulas para calcular alguna de ellas si se trata de poblaciones o de
muestras. En caso de que no se diga nada, deber entenderse que la frmula es la misma para
ambas.
14.1 LA MEDIA
La media, llamada tambin media aritmtica, es la medida de tendencia central conocida
popular- mente como promedio.
x =
fx
en donde:
x
fx
= media o promedio.
= suma de las frecuencias por
su correspondiente dato nominal.
n = suma de todas las frecuencias (nmero de datos recolectados).
calificaciones
x
0
1
2
3
4
5
6
7
8
9
10
total:
f
2
3
3
6
8
9
17
22
10
6
5
91
fx = 2 0 = 0
x =
544
91
x = 5.97
calificaciones
x
0
1
2
3
4
5
6
7
8
9
10
total:
fx = 5 250.00 = 1250.00
y as con las dems.
precios
x
$ 250.00
$ 305.50
$ 330.00
$ 395.75
$ 400.00
$ 465.80
$ 500.00
$ 512.35
$525.00
$ 530.00
$ 540.40
$ 550.00
fx
2
3
3
6
8
9
17
22
10
6
5
91
0
3
6
18
32
45
102
154
80
54
50
544
f
5
3
4
6
8
8
18
20
13
9
2
1
97
x =
45260.2
97
x = 466.6
precios
x
fx
$ 250.00
1250.00
$ 305.50
916.5
$ 330.00
1320.00
$ 395.75
2374.5
$ 400.00
3200.00
$ 465.80
3726.40
$ 500.00
18
9000
$ 512.35
20
10247.00
$525.00
13
6825.00
$ 530.00
4770.00
$ 540.40
1080.80
$ 550.00
550.00
97
45260.2
x =
x
n
en donde:
x = media
Obsrvese que es la misma frmula que la correspondiente a los datos organizados en tablas
de distribucin de frecuencias simples, en donde la nica diferencia es la interpretacin de la x.
En una representa el valor nominal, en sta el punto medio del intervalo. De hecho, esta situacin
se va a repetir en las otras dos medidas de tendencia central que faltan de estudiar an, la
mediana y la moda, ya que tambin se estudiarn en dos casos: cuando los datos estn
organizados en tablas con frecuencias simples o cuando estn por intervalos.
Para calcular la media de datos organizados por intervalos,
deben aadirse ahora dos columnas a la tabla original: la
primera columna aadida es para anotar el valor del punto
medio del intervalo (x) y la otra en la que se registren los
resultados correspondientes al producto de la frecuencia
por el correspondiente valor del punto medio del intervalo
(fx).
Ejemplo 1: Calcular la media de los valores agrupados en
Intervalos de la tabla de la derecha.
intervalos
0-2
12
3-5
13
6-8
23
9 - 11
16
12 - 14
18
82
Solucin: Deben aadirse a la tabla original dos columnas encabezadas por x y por fx, en donde
se anotarn los resultados correspondientes a los puntos medios de cada intervalo y al
producto de la frecuencia por ese punto medio.
La tabla completa con las cuatro columnas queda como se muestra abajo a continuacin:
La suma de los valores de la columna fx es 619, de manera que utilizando la frmula
para el promedio, donde hay que recordar que n =
x =
x =
nf x
619 = 7.548
82
f , se obtiene:
intervalos
punto medio
x
fx
0-2
12
12
3-5
13
52
6-8
23
161
9 - 11
16
10
160
12 - 14
18
82
13
234
619
14.2 LA MODA
La moda es la medida de tendencia central que se define como aquel valor nominal que tiene
la frecuencia mayor. Por lo tanto, una distribucin de frecuencias puede tener ms de una moda o,
inclusive, no tener moda cuando todos los datos tienen frecuencia 1.
Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, la
moda se obtiene buscando en la columna de frecuencias el o los valores que tengan mayor
frecuencia. Es exactamente lo mismo cuando estn organizados por intervalos.
La moda se simboliza con sus dos primeras iniciales: Mo
Ejemplos: De las dos tablas siguientes, localizar la moda de cada una de ellas.
TABLA A
x
35
40
45
50
55
60
65
70
75
80
TABLA B
f
12
8
13
11
16
10
11
15
14
5
x
100
200
300
400
500
600
700
800
900
1000
f
25
29
27
29
22
24
28
25
28
19
Solucin: Para la tabla A basta recorrer la columna de las frecuencias y localizar que la mayor
frecuencia es f = 16 correspondiente al dato nominal 55. Por lo tanto la moda es
Mo = 55 .
Para la tabla B igualmente basta localizar que la mayor frecuencia es f = 29, que
corres- ponde a los datos nominales 200 y 400. Por lo tanto la moda es Mo = 200 y
tambin
Mo = 400 , es decir, la tabla B tiene dos modas. Se dice que es bimodal.
14.3 LA MEDIANA
La mediana es la medida de tendencia central que se define como aquel valor nominal que
tiene, dentro de un conjunto de datos ordenados, arriba y abajo de l, el mismo nmero de datos
nomina- les. En otras palabras, es el dato que est a la mitad, es el dato que divide en dos partes
iguales a un conjunto de datos.
Por ejemplo, del conjunto 3, 3, 3, 4, 5, 5, 5, 5, 5, 6, 6, 7, 8, 9, 9 el cinco remarcado en negrita
y subrayado es el que est a la mitad del conjunto ordenado, ya que antes de l existen 7 datos y
despus de l tambin.
Para facilitar la localizacin de la mediana en una tabla, conviene agregarle una columna en la
que se anoten las frecuencias acumuladas fa. Entonces, el nmero total de datos recolectados ms
uno, dividido entre dos da el dato central dc:
dc =
n +1
2
Ese resultado se busca en la columna de las frecuencias acumuladas y al dato nominal que le
corresponda, es la mediana.
La mediana se simboliza con las letras: Mdn
ste NO
fa
10
16
23
11
34
15
49
25
74
20
94
10
23
117
dc =
117 + 1 = 59
2
que significa que el dato ordinal 59, el quincuagsimo noveno, es el que est situado
a la mitad de todos. Observando la columna de las frecuencias acumuladas se ve que
hasta la calificacin 7, contadas desde el principio, van apenas 49 alumnos, mientras
que hasta la calificacin 8 ya van 74. Esto significa que dentro de la calificacin 8
est el alumno nmero 59, que es el central. Por lo tanto, la mediana es Mdn = 8.
Dicho de otra forma: cuando se fueron ordenando una por una las calificaciones, al
contar el ltimo 7 se llevaban en ese momento 49 calificaciones ordenadas (ver
tabla). Al continuar, el 50 (quincuagsimo) dato o calificacin fue de valor 8; el 51
(quincua- gsimo primer) dato fue tambin de valor 8; el 52 (quincuagsimo
segundo) dato o calificacin fue tambin de valor 8, y as sucesivamente hasta el 74
(septuagsimo cuarto). Eso significa que el 59 dato correspondi al valor nominal x
= 8.
El error ms comn que se comete a la hora de intentar localizar la mediana es buscar
el dato nominal x central en vez del
dato ordinal, o sea, el error consiste
x
f
fa
en buscar en la columna de los da500
10
10
tos nominales x el que est a la mitad y eso no es.
525
10
20
550
13
33
600
12
45
700
11
56
750
63
800
70
900
75
950
80
1000
83
1200
85
1250
87
1350
88
1400
89
89
tabla, son los valores nominales 800 y 900 (ver tabla de la derecha). Esos no son la
moda.
El valor central respecto de las frecuencias, no de los datos nominales x, se obtiene
sumando 1 al 89 y dividindolo entre dos, es decir,
dc =
1 + 89 = 45
2
que significa que el dato ordinal 45 (el que ocupa el lugar 45) es el que est situado a
la mitad de todos, o sea, hay 44 antes y 44 despus de l. Observando la columna de
las
frecuencias acumuladas se ve que hasta el dato nominal x = 600 , contados desde el
principio, van 45 datos recolectados. Esto significa que de los 12 datos nominales
x = 600 , justamente el ltimo de ellos ocupa el orden 45, que es el central. Por lo
tanto, la mediana es Mdn = 600.
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos nominales, al
contar el ltimo correspondiente al valor x = 550, se llevaban hasta all 33 datos recolectados (ver tabla). Al continuar, el 34 (trigsimo cuarto) dato fue de valor x = 600,
el 35 (trigsimo quinto) dato fue de valor x = 600, el 36 (trigsimo sexto) dato fue
de
valor x = 600 , y as sucesivamente hasta el 45 (cuadragsimo quinto), o sea 12 ms
(que es la frecuencia del dato nominal x = 600 ) Eso significa que el 45
(cuadragsimo quinto) dato correspondi al valor nominal x = 600.
Obsrvese que la mediana Mdn = 600 no es el que est situado a la mitad de la
columna de los datos nominales x.
dc =
fa
45
100
100
46
106
206
47
63
269
48
112
381
49
81
462
50
70
532
51
27
559
52
564
53
10
574
574
1 + 574 = 287.5
2
que significa que tanto el dato ordinal 287 como el 288 (el que ocupa en orden el lugar
287 y el 288) son los que estn situados a la mitad de todos. Observando la columna
de las frecuencias acumuladas se ve que dentro del conjunto de 112 datos
recolectados con
valor nominal x = 48 , estn los que ocupan el orden 287 y 288, de manera que en
este
caso no hay conflicto para determinar la mediana y sta es Mdn = 48.
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos recolectados,
al contar el ltimo dato nominal con valor x = 47,se llevaban en ese momento 269
datos recolectados ordenados (ver tabla). Al continuar, el 270 (bicentsimo
septuagsimo) dato fue de valor 48; el 271 (bicentsimo septuagsimo primer) dato
fue tambin de valor 48; el 272 (bicentsimo septuagsimo segundo) dato fue
tambin de valor 48, y
edad
x
fa
45
46
47
48
49
14
50
20
51
22
52
26
53
28
28
fc =
28 + 1 = 14.5
2
que significa que tanto el dato ordinal 14 (dcimo cuarto) como el 15 (dcimo quinto)
son los que estn situados a la mitad de todos, ya que debe comprenderse que no
existen datos ordinales fraccionarios, sino solamente enteros, o sea, existe el 1er dato,
el 2 dato, el 3er dato, el 8 dato, el 19 dato, etc, pero no puede existir el 14.5 (el
dcimo cuarto punto cinco) dato, si acaso el 14 (dcimo cuarto) exactamente.
Observando la columna de las frecuencias acumuladas se ve que el 14 dato fue el
ltimo correspondiente al dato nominal x = 49 , mientras que el 15 dato es el
primero que corresponde al dato nominal x = 50, por lo que se entra en el conflicto
de cul de los dos ha de ser la mediana. En casos as, la media de ambos se toma
como la mediana, es decir, la mediana es. Mdn = 49.5.
C U E S T I O NAR I O
1)
2)
3)
4)
5)
6)
Qu es la mediana ?
Cmo se simboliza la mediana ?
Cuntas y cules columnas deben agregarse a la tabla original para localizar la mediana en
una distribucin de datos sin agrupar?
Cul es la confusin o error ms frecuente que se tiene al intentar localizar una mediana ?
Puede haber ms de una mediana en una distribucin de frecuencias, as como puede
tener dos o ms modas ?. Explicar por qu.
Localizar la mediana de los datos organizados en las tablas obtenidas en el cuestionario 2.
M
dn
2 fa
=L+
i
en donde:
Mdn
L
n
fa
=
=
=
=
mediana
lmite inferior de la clase (o intervalo) de la mediana.
nmero total de datos.
frecuencia acumulada en la clase (intervalo) inmediata anterior a la clase
(intervalo) de la mediana.
f = frecuencia de la clase de la mediana.
i = diferencia entre los lmites de la clase (intervalo) de la mediana.
Para localizar el intervalo de la mediana se procede igual que para datos no agrupados.
49 + 1 = 25
dc =
2
que significa que el dato
ordi- nal 25 (vigsimo
quinto) es el que est situado
a la mitad de todos.
Observando la colum-
intervalo
fa
1 - 30
31 - 60
61 - 90
91 - 120
10
121 - 150
16
151 - 180
23
181 - 210
11
34
211 - 240
15
49
dos (ver tabla). Al continuar, el 24 (vigsimo cuarto ) dato fue ya del intervalo 181 210; el 25 (vigsimo quinto) dato fue tambin de la clase 181 - 210, y as
sucesivamen- te hasta el 34 (trigsimo cuarto), o sea 11 ms (que es la frecuencia del
intervalo) Eso significa que el 25 (vigsimo quinto) dato correspondi al intervalo
181 - 210.
As que se tienen los siguientes datos para ser sustituidos en la frmula:
L
n
fa
f
i
=
=
=
=
=
181
49
23
11
210 - 181 = 29
de modo que
49
2 23
Mdn = 181 +
29
11
intervalo
fa
5 - 13
16
16
14 - 22
11
27
23 - 31
30
57
32 - 40
62
41 - 49
64
50 - 58
71
59 - 67
72
68 - 76
75
75
dc =
75 + 1 = 38
2
que significa que el dato ordinal 38 (trigsimo octavo) es el que est situado a la
mitad de todos. Observando la columna de las frecuencias acumuladas se ve que
hasta el intervalo 14 - 22, contadas desde el principio, van apenas 27 datos ordenados,
mientras que hasta el intervalo 23 - 31 ya van 57. Esto significa que dentro del
intervalo 23 - 31 est el dato ordinal nmero 38, que es el central. Por lo tanto, la
clase de la mediana es
23 - 31.
Dicho de otra forma: cuando se fueron ordenando uno por uno los datos recolectados,
al contar el ltimo del intervalo 14 - 22 se llevaban en ese momento 27 datos
ordenados
(ver tabla). Al continuar, el 28 (vigsimo octavo ) dato fue ya del intervalo 23 - 31;
el
29 (vigsimo noveno) dato fue tambin del mismo intervalo 23 - 31, y as sucesivamente hasta el 57 (quincuagsimo sptimo), o sea 30 ms (que es la frecuencia del
intervalo) Eso significa que el 38 (trigsimo octavo) dato correspondi al intervalo
23 31.
As que para calcular la mediana, se tienen los siguientes datos para ser sustituidos en
la frmula:
L
n
fa
f
i
=
=
=
=
=
23
75
27
30
31 - 23 = 8
de modo que
75
2 27
Mdn = 23 +
8
30
Mdn = 23 + (0.35) 8
Mdn = 25.8
Obsrvese que, como se dijo antes, el valor de la mediana est adentro del intervalo
de la clase de la mediana, es decir, adentro de 23 - 31. Lo contrario sera una
contradic- cin, pues si se afirma que el intervalo (la clase) de la mediana es 23 - 31,
precisamente dentro de ese intervalo debe estar la mediana.
En el caso de que la clase de la mediana sea el primer intervalo, como antes de l no hay
ninguno dato, tampoco hay ninguna frecuencia acumulada. As que en la frmula el valor de fa
ser igual a cero.
intervalo
fa
1-9
35
35
10 - 18
40
19 - 27
42
28 - 36
45
45
dc =
45 + 1 = 23
2
que significa que el dato ordinal 23 (vigsimo tercero) es el que est situado a la
mitad de todos. Observando la columna de las frecuencias acumuladas se ve que el
primer intervalo acaba en el dato 35 (trigsimo quinto), por lo tanto all est el 23
(vigsimo tercero). El primer intervalo es el de la clase de la mediana.
As que para calcular la mediana, se tienen los siguientes datos para ser sustituidos en
la frmula:
L = 1
n = 45
fa = 0
f = 35
i = 9-1 = 8
de modo que
45
2 0
Md n = 1 +
8
35
Mdn = 6.14
C U E S T I O N A R I O 10
1)