Está en la página 1de 24

CAPITULO III 69 MEDIDAS DEPOSICIN Y DISPERSIN

MEDIDAS DE POSICION

INTRODUCCION

Hasta ahora para describir un conjunto de datos, se han empleado las tablas y los
grficos. Estos son tiles para dar rpidamente una visin general del comportamiento de
los valores que asume una variable, as, en el caso de variables categricas, los diagramas
son suficientes para dar una descripcin completa de las mismas..
Sin embargo, para describir el comportamiento de variables cuantitativas, en general se
requiere una mayor precisin que la que puede proporcionar un grfico, es importante que
esa descripcin trascienda los lmites de lo visual y lo subjetivo en cuanto sea posible.
Como solucin a la situacin planteada, surgen las medidas de posicin y de dispersin,
para describir las caractersticas de las distribuciones en forma cuantitativa. Ms
exactamente, la precisin que es deseable obtener al describir el conjunto de datos
numricos se refiere a dos aspectos, cada uno de los cules se puede traducir en una
pregunta:
Existe algn valor de la variable que represente a la mayora de los valores del conjunto
de datos?.
Qu tan separados estn entre si, los diferentes valores que asume la variable respecto al
valor de la variable que representa a los datos?.
La primera pregunta se refiere a las medidas de posicin y la segunda, a las llamadas
medidas de dispersin.
As tambin, un investigador del campo educativo puede realizar una investigacin para
determinar si las aptitudes matemticas son diferentes segn el sexo de los estudiantes. Este
investigador tendr dos conjuntos de calificaciones, luego obtendr la calificacin
promedio de cada grupo y har la comparacin de los promedios. La variabilidad de los
datos es otro aspecto importante que el investigador debe de considerar, as, necesita saber
si las calificaciones son uniformes o vara entre los estudiantes del sexo femenino y del
sexo masculino.

MEDIDAS DE POSICION
En el campo social y educativo las medidas de tendencia central que se usan ms
frecuentemente son la media aritmtica, la mediana, los percentiles y la moda. A
continuacin desarrollaremos dichos temas.

MEDIA ARITMETICA

Definicin
Si x1 ,...., xn son los valores observados de una variable, la media aritmtica o
simplemente media o promedio de estos datos se define como el cociente de la suma de
todos los. valores observados entre el nmero de datos o tamao de la muestra. Su
expresin matemtica es:

69
CAPITULO III 70 MEDIDAS DEPOSICIN Y DISPERSIN

x1 x 2 ... x n 1 n
X xi , (3.1)
n n i 1
donde n es el nmero total de observaciones .

As si los siguientes datos corresponden a las notas de 5 estudiantes en el curso de


estadstica: 12 15 11 09 13; entonces, la nota promedio del curso es
x x ... xn 1
X 1 2 12 15 11 09 13 12 puntos
n 5

Media aritmtica ponderada

Nos permite calcular un promedio tomando en cuenta la importancia o peso de cada valor
observado de la variable con respecto al total. Su expresin matemtica es:
k

x w i i
Xw i 1
k (3.2)
w
i 1
i

donde, wi , es la importancia o peso que se asigna a cada valor de la variable.

Ejemplo 3.1
Supongamos que un profesor decide utilizar un promedio ponderado para obtener los
promedios finales de cada uno de los estudiantes que asisten al curso de estadstica. El
promedio de trabajos tendr un valor de 20% de la calificacin del estudiante, el examen
parcial 25%; el examen final 35%, promedio de prcticas 20%. A partir de los datos
siguientes calcularemos el promedio final para dos estudiantes cualesquiera.

Estudiante Nota de trabajos Examen parcial Examen final Promedio prcticas


1 15 12 18 13
2 17 10 14 17

Solucin:
a) Obtengamos el promedio ponderado del primer estudiante. Aplicando la frmula (3.2) se
tiene:
k

x w i i
15(0.2) 12(0.25) 18(0.35) 13(0.20)
Xw i 1
= Xw 14.9 puntos.
k
0.20 0.25 0.35 0.20
w
i 1
i

Si calculamos la media aritmtica de las notas del primer estudiante, obtendramos 14.5
puntos.

70
CAPITULO III 71 MEDIDAS DEPOSICIN Y DISPERSIN

b) Obtengamos el promedio ponderado del segundo estudiante. En este caso el promedio


ponderado es:

17(0.2) 10(0.25) 14(0.35) 17(0.20)


Xw 14.2 puntos.
0.20 0.25 0.35 0.20

Observe que la media aritmtica del segundo estudiante tambin es 14.5.

El primer estudiante tiene mayor promedio ponderado que el segundo estudiante debido a
que el examen final tiene mayor peso a pesar de que el segundo estudiante supera al
primero en las notas de trabajo y prctica.

Si los datos se presentan en una distribucin de frecuencias donde, los valores xi de la


variable se repiten f i veces, la frmula (3.1) quedar expresada en la siguiente forma:

1 k
X xi f i
n i 1
(3.3)

Ejemplo 3.2
En la tabla 2.1 se tiene la distribucin de frecuencias del nmero de hijos de los estudiantes
de maestra. Encontraremos el nmero promedio de hijos.

Tabla 2.1 Nmero de hijos de los estudiantes de maestra


En la distribucin de frecuencias del nmero de hijos de los estudiantes de maestra,
ncontraremos el nmero promedio de hijos.

xi fi
x1 =0 2
x2 =1 11
x3 =2 11
x4 =4 3
x5 =5 3
Total 30
Solucin:
Como los datos se encuentran tabulados usaremos la expresin (3.3) para obtener la media
aritmtica. Los clculos auxiliares se presentan en la siguiente tabla.

xi fi xi f i
x1 =0 2 0
x2 =1 11 11
x3 =2 11 22
x4 =4 3 12
x5 =5 3 15

71
CAPITULO III 72 MEDIDAS DEPOSICIN Y DISPERSIN

Total 30 60

Reemplazando en la frmula (3. 3) se tiene:


1 k 0(2) 1(11) 2(11) 4(3) 5(3) 60
X xi f i = X 2 hijos. En promedio los
n i 1 30 30
estudiantes de la maestra tienen 2 hijos.

Si los datos se presentan en una distribucin de frecuencias agrupados en intervalos de


clase, los valores xi de la expresin (3.3) sern reemplazados por la marca de clase de
cada intervalo y el valor de la media aritmtica se obtiene de la siguiente manera:

1 k '
X
n i 1
xi f i , xi' es la i - sima marca de clase (3.4)

Ejemplo 3.3
En la Tabla 3.1 se tiene las edades de un grupo de estudiantes de maestra de la Facultad de
Educacin matriculados en el semestre 2003-I. Obtengamos la media aritmtica.
.Tabla 3.1 Edad de los estudiantes de la maestra en
educacin matriculados en el 2003-I.
Edades Marca de Frecuencia
Li 1 , Li clase Absoluta
x i' fi
23 - 32 27.5 6
32 - 41 36.5 12
41 - 50 45.5 8
50 - 59 54.5 2
59 - 68 63.5 2

Solucin:
Como los datos se presentan agrupados en intervalos de clase usaremos la expresin (3.4).
Los clculos auxiliares se presentan en la siguiente tabla.

Edades Marca de Frecuencia xi' f i


Li 1 , Li clase Absoluta
x i' fi
23 - 32 27.5 6 165.0
32 - 41 36.5 12 438.0
41 - 50 45.5 8 364.0
50 - 59 54.5 2 109.0
59 - 68 63.5 2 127.0
Total 30 1203.0

y reemplazando en la frmula se encuentra:

72
CAPITULO III 73 MEDIDAS DEPOSICIN Y DISPERSIN

1 n '
X xi f i
n i 1
27.5(6) 36.5(12) 45.5(8) 54.5(2) 63.5(2) 1203
40.1 aos .La edad
30 30
promedio de los estudiantes es 40.1 aos.

Propiedades de la media aritmtica

1. La suma de las desviaciones de los valores de la variable respecto a la media aritmtica


es igual a cero. Expresado matemticamente tendremos:
k

x
i 1
i X fi 0

Demostracin
k

x
k
X fi k k x i fi
i 1
i
xi 1
i fi X f
i 1
i n X n X 0 , puesto que X i 1

Ejemplo:
Las siguientes observaciones corresponden a la variable nmero de inasistencias a clases
durante un ao escolar, en un grupo de 20 estudiantes.

xi 1 3 6 7 8
fi 3 4 8 3 2

Solucin.-
xi fi xi f i
1 3 1 *3=3
3 4 3 *4=12
6 8 6 *8=48
7 3 7 *3=21
8 2 8 *2=16
Total 100
k
1 100
X xi f i 5 inasistencias en promedio durante el ao escolar.
n i 1 20

x
i 1
i X f i 1 5 3 3 5 4 6 5 8 (7 5)3 (8 5)2 12 8 8 6 6 0

2. La suma de los cuadrados de las desviaciones de todos los valores con respecto a la
media es mnima. Cuya expresin matemtica es:

73
CAPITULO III 74 MEDIDAS DEPOSICIN Y DISPERSIN

x X f i es mnima
2
i
i 1

Ejemplo
Aplicaremos la propiedad a la distribucin de frecuencias del nmero de inasistencia a
clases:

xi 1 3 6 7 8
fi 3 4 8 3 2
Solucin:
Calculando los cuadrados de las desviaciones con respecto a la media y tambin con
respecto a cada uno de los valores de la variable se tiene:

xi f i ( xi X ) 2 f i ( xi 1) 2 f i ( xi 3) 2 f i ( xi 6) 2 f i ( xi 7) 2 f i ( x i 8) 2 f i
1 3 (1-5)2 *3=48 0 12 75 108 147
3 4 (3-5)2 *4=16 16 0 36 64 100
6 8 (6-5)2 *8=8 200 72 0 8 32
7 3 (7-5)2 *3=12 108 48 3 0 3
8 2 (8-5)2 *2=18 98 50 8 2 0
Total 102 422 182 122 182 282

Observe que la suma de los cuadrados de las desviaciones respecto a la media de la


distribucin es menor que cualquier otra suma de las desviaciones con respecto a cada uno
de los valores de la muestra.

3. Dados k conjuntos de datos con sus medias X 1 , X 2, ... , X k y formados por


n1 , n 2 , ..., n k observaciones, respectivamente, la media global de todos los datos se
obtiene mediante la media ponderada, cuya expresin matemtica es:

n1 X 1 n2 X 2 ... nk X k
ni X i
X global k
i 1

n1 n2 ... nk
ni i 1

donde el numerador representa la suma de todas las observaciones y el denominador el


nmero total de observaciones.

Por ejemplo se tiene la distribucin del nmero de inasistencias a clases de una muestra de
20 alumnos, cuyo promedio de inasistencia es 5. Si particionamos la muestra en dos,
tendremos las siguientes submuestras, las que usaremos para verificar la propiedad 3.
Muestra 1:
xi fi xi f i

74
CAPITULO III 75 MEDIDAS DEPOSICIN Y DISPERSIN

1 3 1 *3=3
3 4 3 *4=12
6 8 6 *8= 48
Total 15 63
63
X1 =4.2 n1=15
15
Muestra 2:
xi fi xi f i
7 3 7 *3=21
8 2 8 *2=16
Total 5 37

37
X2 7 .4 n2 =5
5

n1 X 1 n2 X 2 15( 4.2) 5(7.4) 63 37 100


Luego la media global es X global 5
n1 n2 15 5 20 20
Hemos encontrado el mismo valor de la media de la muestra original, verificando as la
propiedad 3.

4. La media aritmtica de una constante por una variable, es igual al producto de la


constante por la media aritmtica de la variable. Esto es, si
y i Cxi i 1,..., n, entonces , Y C X

Ejemplo
La siguiente distribucin corresponde a las calificaciones en el curso de ingls de un grupo
de 25 estudiantes.
Calificaciones Nmero xi f i
xi de
estudiantes
fi
10 3 30
20 5 100
30 8 240
40 6 240
50 3 150
Total 25 760
La media de las calificaciones del curso de ingls es X 30.4 puntos.

Si el profesor opta por duplicar la calificacin a cada estudiante, cul ser la nueva media?
La forma ms rpida de obtener la nueva media ser aplicando la presente propiedad. Como
el profesor a cada estudiante le duplica la calificacin la constante es C=2., luego esta
constante ser multiplicada por la media de las calificaciones, es decir:
Y C X =2(30.4)=60.8. La nueva media de las calificaciones es Y =60.8.

75
CAPITULO III 76 MEDIDAS DEPOSICIN Y DISPERSIN

5. La media aritmtica de una constante ms una variable, es igual a la constante ms la


media aritmtica de la variable. Esto es, si yi xi C i 1,..., n, entonces ,Y X C

Ejemplo
Como parte de una tarea de laboratorio de nutricin, 15 estudiantes del tercer ao de la
Escuela Acadmico Profesional de Nutricin de la UNMSM matriculados el ao acadmico
2004, encontraron el nmero de caloras (X) de una porcin de lasaga. y obtuvieron los
siguientes valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
a) Encontraremos la media aritmtica del nmero de caloras.
b) Al acabar el trabajo, los estudiantes se informaron que el instrumento de medicin que
usaron estaba mal calibrado y marc en cada caso 300 caloras por debajo de su valor.
Encontraremos la media aritmtica de los nuevos valores de caloras.
Solucin:

a) La media aritmtica del nmero de caloras es:


526
X 35.06 caloras.
15

b) Sumamos a todas las observaciones de la variable X la constante C = 300, y los nuevos


valores de caloras (Y) es como sigue:
329 335 347 318 322 330 351 362 315 342 346 353 316 327 333
El clculo de la media aritmtica de los nuevos valores de caloras se podr simplificar
aplicando la propiedad 5, esto es:
Y X C =35.06+300 =335.06 caloras.

MEDIANA

Definicin
Dado x1 ,...., xn observaciones de la variable X, la mediana es el valor o punto medio que
supera al 50 por ciento de los valores observados de la variable y es superado por el
restante 50 por ciento. La forma de obtener el valor de la mediana depende del nmero de
observaciones. As si el nmero de observaciones es impar, la mediana es el valor de la
variable que ocupa la posicin central de los datos ordenados y si el nmero de
observaciones es par, la mediana es la media aritmtica de los dos valores que ocupan la
posicin central de los datos ordenados. Esta definicin se puede plasmar mediante la
siguiente expresin matemtica.

76
CAPITULO III 77 MEDIDAS DEPOSICIN Y DISPERSIN

Si n es impar :
Me x n 1

2

Si n es par : (3.5)
x n x n
1
2 2
Me

2
donde el subndice indica la posicin o lugar que ocupa el valor de la variable ordenada .
Si la muestra es de tamao impar, como por ejemplo: 13 11 19 20 18 21 23, donde
n 1
n = 7, entonces 4 , por lo que la mediana es el valor de la variable que ocupa la
2
posicin 4 de las observaciones ordenadas: 11 13 18 19 20 21 23 . Me x 4 = 19.
Si el tamao de la muestra es par, como por ejemplo 10 16 4 9 13 17, donde n = 6 y
ordenados son:4 9 10 13 16 17, entonces,
n n
3 , 1 4 por lo que x (3) 10 , x ( 4 ) 13 ocupan la posicin central. Luego el
2 2
10 13
valor de la mediana es la media aritmtica de 10 y 13, es decir Me 11 .5 .
2

Datos sin agrupar en intervalos de clase y presentados en tabla de frecuencias

Si los datos estn en una distribucin de frecuencias, para calcular la mediana se seguirn
los siguientes pasos:
1) Encontrar las frecuencias absolutas acumuladas
n
2) Encontrar
2
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
n
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente inferior o
2
n
igual que y Fi es la frecuencia absoluta acumulada inmediatamente superior que
2
n
.
2
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor de la mediana de acuerdo a la frmula siguiente:

n
Me xi si Fi 1 Fi (a)
2
o (3.6)
x xi n
Me i 1 si Fi-1 Fi (b)
2 2

Ejemplo 3.4
Con la distribucin del nmero de hijos de los estudiantes de maestra presentados de la
Tabla 2.1 vamos a ilustrar la obtencin de la mediana.

77
CAPITULO III 78 MEDIDAS DEPOSICIN Y DISPERSIN

Solucin:

Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a


continuacin:

Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13 F2
x3 =2 11 24 F3
x4 =4 3 27
x5 =5 3 30
Total 30

n n 30
y luego calcular , es decir, = 15 .
2 2 2
En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal forma
n
que, Fi 1 13 15 Fi 24 . Usando (3.6(a)), el valor de la variable asociada a la
2
frecuencia absoluta acumulada Fi F3 24, es x3 2 ; o sea, el valor de la mediana es
2. Me 2 . El 50% de los estudiantes de maestra tienen menos de 2 hijos.

Ejemplo 3.5
Considerando el ejemplo anterior, supongamos que la distribucin de frecuencias sea de la
siguiente forma:

Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 13 15 F2
x3 =2 9 24 F3
x4 =4 3 27
x5 =5 3 30
Total 30
n 30 n
Al calcular = 15 ,se cumple que coincide con Fi 1 esto es,
2 2 2
n
Fi 1 15 15 Fi 24 . Usando (3.6(b)), ubiquemos los valores de la variable
2
asociados a Fi y Fi 1 . El valor de la variable asociada a la frecuencia absoluta
acumulada Fi = F3 =24 es x3 =2, y el valor de la variable que corresponde a Fi 1 13
x 2 x3 1 2
es x 2 =1, entonces la mediana es Me =1.5. El 50% de los estudiantes de
2 2
maestra tienen menos de 1.5 hijos.

78
CAPITULO III 79 MEDIDAS DEPOSICIN Y DISPERSIN

Datos agrupados en intervalos de clase y presentados en una tabla de frecuencia

Seguir los pasos 1), 2), 3) del caso anterior de datos sin agrupar en intervalos de clase y
como paso 4) ubicar el intervalo de clase asociado a la frecuencia absoluta acumulada Fi
y encontrar el valor de la mediana de acuerdo a la siguiente expresin:

n
Fi 1 n
Me Li 1 2 ai Si Fi 1 Fi
Fi Fi 1 2
(3.7)

n
Me Li 1 Si Fi 1 Fi
2
donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi

Ejemplo 3.6
Obtengamos la mediana a partir de la distribucin de edad de los estudiantes de maestra
presentados en la Tabla 3.1

Solucin:
Para obtener la mediana previamente se calcula las frecuencias absolutas acumuladas como
se muestra a continuacin:

Edades Frecuencia Frecuencia absoluta


Li 1 , Li absoluta acumulada
fi Fi
23 - 32 6 6 F1
32 - 41 12 18 F2
41 - 50 8 26
50 - 59 2 28
59 - 68 2 30
Total 30

n 30 n
Al calcular 15 , se cumple Fi 1 = 6 < 15 < Fi = 18, en este caso el
2 2 2
intervalo asociado a Fi F2 18 es 32 , 41 , este contiene el valor de la variable que
n 30
ocupa la posicin 15 . La amplitud del intervalo es 9 y el lmite inferior 32.
2 2

79
CAPITULO III 80 MEDIDAS DEPOSICIN Y DISPERSIN

Entonces, usando (3.7), el valor de la mediana es


15 6
Me 32
18 6
9 32 6.75 38.75 . El 50% de los estudiantes tienen edades

inferiores a 38.75 aos.

Ejemplo 3.7
Supongamos que la distribucin de frecuencias para la edad de los estudiantes de maestra
sea de la siguiente forma:

Edades Frecuencia Frecuencia absoluta


Li 1 , Li absoluta acumulada
fi Fi
23 - 32 6 6
32 - 41 9 15 F2
41 - 50 11 26 F3
50 - 59 2 28
59 - 68 2 30
Total 30

n 30 n
Al calcular 15 , se cumple que coincide con Fi 1 esto es, Fi 1 =15=
2 2 2
n
15 < Fi = 26. El intervalo de clase asociado a la frecuencia absoluta acumulada Fi =
2
F3 =26 es 41, 50 , luego usando (3.7) la mediana es Me Li 1 L2 41 . El 50% de
los estudiantes tienen edades inferiores a 41 aos.

MODA

Definicin: La moda es el valor de la variable que se repite con mayor frecuencia. Se


expresa como:

Mo x i si x i es el valor de la variable que ms se repite


(3.8)

Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, ste
no tiene moda. Tambin existen situaciones donde se tiene ms de una moda, en tal caso
diremos que la distribucin de frecuencias es bimodal, trimodal, multimodal.

As, para el conjunto de datos 10 11 11 12 13 09 15 la moda es Mo 11 (unimodal);


mientras que en el conjunto de valores observados 10 11 12 13 09 y 15 no existe moda.
Si el conjunto de datos es 11 11 11 12 12 12 05 04 , las modas son Mo 11 y
Mo 12 (bimodal).
A continuacin se presentan los mtodos de obtencin de la moda cuando se tiene un
mayor nmero de datos, razn por la cual previamente han sido tabulados.

80
CAPITULO III 81 MEDIDAS DEPOSICIN Y DISPERSIN

Datos sin agrupar en intervalos de clase y presentados en tablas de frecuencias

Para identificar el valor de la moda debe observarse la columna de las frecuencias


absolutas y seleccionar la mayor de ellas. Supongamos que esa frecuencia sea f i ,
entonces el valor de la moda es:

Mo xi si f i f i 1 y f i f i 1 (3.9)

donde:
f i 1 : frecuencia absoluta inmediatamente anterior a f i
.
f i 1 : frecuencia absoluta inmediatamente posterior a f i

Ejemplo 3.8
Con los datos presentados en el ejemplo 3.5 vamos a ilustrar la obtencin de la moda.

Nmero se hijos fi
x1 =0 2
x2 =1 13
x3 =2 9
x4 =4 3
x5 =5 3

Solucin

Para calcular la moda, observamos la columna de frecuencias absolutas y vemos que la


mayor frecuencia corresponde a f 2 = 13. Por lo tanto el valor de la moda es x2 =1, es
decir Mo 1 .

Ejemplo 3.9
Con los datos de la siguiente tabla ilustraremos nuevamente la obtencin de la moda.

Nmero se hijos fi
x1 =0 2
x2 =1 11
x3 =2 11
x4 =4 3
x5 =5 3

Solucin:

81
CAPITULO III 82 MEDIDAS DEPOSICIN Y DISPERSIN

Esta distribucin posee dos modas: Mo 1 y Mo 2 ; pues a la segunda frecuencia f 2


=11 le corresponde el valor x 2 1 y a la tercera frecuencia absoluta f 3 =11 le corresponde
el valor x3 2 . En esta caso la mayora de estudiantes tiene 1 o 2 hijos.

Datos agrupados en intervalos de clase, presentados en tablas de frecuencias

Debe observarse la columna de las frecuencias absolutas y detectar la mayor de ellas.


Supongamos que esa frecuencia sea f i , asociado a l se encuentra el intervalo de clase
Li 1 Li que contiene a la moda y se denomina intervalo modal. La moda se obtendr
mediante la siguiente expresin matemtica:

d1
M o Li 1 ai (3.10)
d1 d 2
donde:
Li 1 es el lmite inferior del intervalo modal
fi es la mayor frecuencia
f i 1 es la frecuencia inmediatamente anterior a la mayor frecuencia
f i 1 es la frecuencia inmediatamente posterior a la mayor frecuencia
d1 f i f i 1
d 2 f i f i 1
ai es la amplitud del intervalo modal

Lo que se puede resumir en la siguiente metodologa:


1) En la tabla de frecuencia detectar la mayor frecuencia absoluta, la frecuencia absoluta
inmediatamente anterior e inmediatamente posterior a la mayor frecuencia absoluta.
2) Ubicar el intervalo correspondiente a la mayor frecuencia absoluta
3) Reemplazamos en la frmula correspondiente a la moda (3.10) los valores de las
frecuencias detectadas en el paso 1), el lmite inferior y la amplitud del intervalo que
contiene a la moda, ubicado en el paso 2).

Ejemplo 3.9
En el siguiente ejemplo correspondiente a la Tabla 3.1 se tiene las edades de un grupo de
estudiantes de maestra de la Facultad de Educacin matriculados en el semestre 2003-I.
Obtengamos la moda.

Edades Frecuencia
Li 1 , Li Absoluta
fi
23 - 32 6
32 - 41 12

82
CAPITULO III 83 MEDIDAS DEPOSICIN Y DISPERSIN

41 - 50 8
50 - 59 2
59 - 68 2

Solucin:
Para obtener la moda se procede de la siguiente manera:
Se encuentra el valor de la mayor frecuencia absoluta, f 2 12 . El intervalo con mayor
frecuencia es 32 , 41 , su amplitud igual a 9 y su lmite inferior es 32,
f i 1 6 , f i 1 8 entonces: d1= 12-6=6, d2= 12-8=4 .
Luego el valor de la moda es:

d1 6
M o Li 1 ai = 32 9 32 5.4 37.4 aos. La edad ms
d1 d 2 6 4
frecuente es 37.4 aos, es decir 37 aos.

Ejemplo 3.10
En una muestra de 30 estudiantes, la variable disposicin para el estudio permiti establecer
la siguiente distribucin de frecuencias.

Disposicin para el estudio Nmero de estudiantes Porcentajes


1 Ninguna 2 0.067
2 Regular 7 0.233
3 Buena 5 0.167
4 Muy buena 9 0.300
5 Excelente 7 0.233

Podemos afirmar que con mayor frecuencia, 9 estudiantes respondieron tener muy buena
disposicin para el estudio. Luego la moda es muy buena disposicin para el estudio.
Cabe indicar que en este ejemplo, tenemos la distribucin de una variable cualitativa, luego
la moda es la nica estadstica de posicin que podemos calcular cuando se tiene una
variable cualitativa.

CUARTILES
Son nmeros que dividen la distribucin de frecuencia de un conjunto de datos en cuatro
partes iguales. Ellos son:

El cuartil uno, Q1, es el punto por debajo del cul se ubica el 25% de los datos.

El cuartil dos, Q2 , es el punto por debajo del cul se ubica el 50% de los datos.

El cuartil tres, Q3, es el punto por debajo del cul se ubica el 75% de los datos.

83
CAPITULO III 84 MEDIDAS DEPOSICIN Y DISPERSIN

Clculo de cuartiles en conjuntos de datos pequeos

Primero ordenamos los datos en orden de magnitud creciente. Los datos ordenados se
representan con x (1) , x ( 2) ,..., x ( n )
Luego encontramos la posicin para cada uno de los cuartiles, segn como sigue:
1
Para el cuartil uno calcular n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil uno. Si la posicin se encuentra a
mitad entre dos enteros el cuartil uno es el promedio de los dos valores correspondientes.

Para el cuartil dos (mediana) usar (3.5)

3
Para el cuartil tres calcular n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil tres. Si la posicin se encuentra a
mitad entre dos enteros el cuartil tres es el promedio de los dos valores correspondientes.

Ejemplo 3.11
Para los siguientes conjuntos de datos
a) 13 11 19 20 18 21 23
b) 11 13 18 19 20 21 23.
Obtendremos el cuartil uno, el cuartil tres y la mediana.
Solucin.
a) Si tenemos la siguiente muestra de datos:13 11 19 20 18 21 23, donde n=7, entonces,
n 1 7 1
para encontrar el cuartil uno calculamos 2 , por lo que el cuartil uno es el
4 4
valor de la variable que ocupa la posicin 2 de las observaciones ordenadas: 11 13 18 19
20 21 23. Luego Q1 x 2 13 .
Para encontrar el cuartil dos usamos la formula (3.5) y como n es impar

Me x n 1 x 7 1 x 4 19

2 2

Para encontrar el cuartil tres calculamos


3
n 1 = 3 7 1 6 luego el cuartil tres es
4 4
Q3 x 6 21 .

b) Si tenemos otra muestra de datos, por ejemplo 10 16 4 9 13 17, donde n=6 y


ordenados son: 4 9 10 13 16 17, entonces, para encontrar el cuartil uno calculamos
n 1 6 1
1.75 , luego el entero ms cercano es 2 por lo que el cuartil uno es el valor
4 4
de la variable que ocupa la posicin 2 de las observaciones ordenadas, luego Q1 x 2 9

84
CAPITULO III 85 MEDIDAS DEPOSICIN Y DISPERSIN

Para encontrar el cuartil tres calculamos


3
n 1 = 3 6 1 5.25 luego el entero ms
4 4
cercano es 5 por lo que el cuartil tres es Q3 x 5 16
Para encontrar el cuartil dos o mediana usamos (3.5) y como n es par.

x n x n
x 6 x 6

2
1
2

2
1
2
x 3 x 4 10 13
Me 11 .5
2 2 2 2

Para obtener los cuartiles a partir de una distribucin de frecuencias, se procede

como en el caso del calculo de la mediana teniendo en cuenta que la fraccin n/2 ser
n 2n 3n
cambiada por las fracciones , , segn se requiera calcular el cuartil uno,
4 4 4
cuartil dos(mediana) o cuartil tres respectivamente.

Datos sin agrupar en intervalos de clase y presentados en tabla de frecuencias

I. Para encontrar el cuartil uno, proceder de la siguiente manera:

1) Encontrar las frecuencias absolutas acumuladas


n
2) Encontrar
4
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
n
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente inferior o
4
n
igual que y Fi es la frecuencia absoluta acumulada inmediatamente superior que
4
n
.
4
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor del cuartil uno de acuerdo a la frmula siguiente:

n
Q1 xi si Fi 1 Fi
4
o
xi 1 xi n
Q1 si Fi-1 Fi
2 4
(3.11)

II. Para encontrar el cuartil tres:

1) Encontrar las frecuencias absolutas acumuladas

85
CAPITULO III 86 MEDIDAS DEPOSICIN Y DISPERSIN

3n
2) Encontrar
4
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
3n
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente anterior
4
3n
o igual que y Fi es la frecuencia absoluta acumulada inmediatamente superior
4
3n
que .
4
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor del cuartil tres de acuerdo a la frmula siguiente:

3n
Q3 xi si Fi 1 Fi
4
o
xi 1 xi 3n
Q3 si Fi-1 Fi
2 4
(3.12)

Ejemplo 3.12
Con la distribucin del nmero de hijos de los estudiantes de maestra vamos a ilustrar la
obtencin del cuartil uno y el cuartil tres.
Solucin:

a) Cuartil uno.
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:

Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13
x3 =2 11 24
x4 =4 3 27
x5 =5 3 30
Total 30

n n 30
y luego calcular , es decir, = 7.5 .
4 4 4
En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal
n
forma que, Fi 1 2 7.5 Fi 13 .Usando (3.11), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F2 13, es x 2 1 ; luego, el

86
CAPITULO III 87 MEDIDAS DEPOSICIN Y DISPERSIN

valor del cuartil uno es 1. Q1 x 2 1 . El 25% de los estudiantes tiene como


mximo un hijo.

b) Cuartil tres.
Despus de encontrar la frecuencia absoluta acumulada como se muestra en la tabla
siguiente:
Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13
x3 =2 11 24
x4 =4 3 27
x5 =5 3 30
Total 30

3n 3n 3 30
Calculamos es decir = =22.5.
4 4 4
En la columna de la frecuencia absoluta acumulada ubicamos Fi y Fi 1 de tal
3n
forma que, Fi 1 13 22.5 Fi 24 .Usando (3.12), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F3 24, es x3 2 ; luego, el
valor del cuartil tres es 2. Q3 x3 2 . El 75% de los estudiantes tiene dos o menos
hijos.

Clculo de los cuartiles a partir de una distribucin de frecuencias para datos


agrupados en intervalos de clase
Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n n 2n 3n
incluida en la frmula (3.7) ser cambiada por las fracciones , , segn se
2 4 4 4
requiera obtener el cuartil uno, cuartil dos(mediana) o cuartil tres respectivamente.

PERCENTILES

Son nmeros que dividen la distribucin en 100 partes iguales. De manera semejante a la
mediana, en que la distribucin de un conjunto de datos se dividi en dos partes, un 50%
inferior y otro 50% superior, o en cuartiles en donde la distribucin se dividi en cuatro
partes, cada una conteniendo un 25% de los datos.
As por ejemplo el percentil 10, P10, es el valor de la variable debajo del cual se encuentran
el 10% de los datos. Es importante calcularlos en distribuciones con un gran nmero de
datos.

Datos sin agrupar en intervalos de clase y presentados en una tabla de frecuencias.

87
CAPITULO III 88 MEDIDAS DEPOSICIN Y DISPERSIN

Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n n
ser cambiada por la fraccin k de acuerdo al percentil que sea de nuestro inters
2 100
encontrar (k =1,2,,99), y luego continuar con los pasos ya conocidos:
1) Encontrar las frecuencias absolutas acumuladas
n
2) Obtener la fraccin k donde k puede tomar los valores k = 1, 2,. . . ,99
100
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
kn
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente
100
kn
inferior o igual que y Fi es la frecuencia absoluta acumulada inmediatamente
100
kn
superior que .
100
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor del percentil k de acuerdo a la frmula siguiente:

kn
Pk xi si Fi 1 Fi
100
o (3.13)
x xi kn
Pk i 1 si Fi-1 Fi
2 100

Datos agrupados en intervalos de clase y presentados en una tabla de frecuencia

Para obtener el percentil k en el caso de una distribucin de frecuencias para datos


agrupados en intervalos de clase seguir los pasos 1), 2), 3) del caso anterior de datos sin
agrupar en intervalos de clase y como paso 4) ubicar el intervalo de clase asociado a la
frecuencia absoluta acumulada Fi y encontrar el valor del percentil k de acuerdo a la
frmula siguiente:

n
k Fi 1
100 kn
Pk Li 1 a Si Fi 1 Fi
Fi Fi 1 i 100
(3.14)

kn
Pk Li 1 Si Fi 1 Fi
100

donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi

Ejemplo 3.13
Considerando los datos de la edad de los estudiantes de maestra vamos a obtener el
percentil 75 P75.

88
CAPITULO III 89 MEDIDAS DEPOSICIN Y DISPERSIN

Previamente se calculan las frecuencias absolutas acumuladas como se muestra a


continuacin,
Edades Frecuencias Frecuencia absoluta
Li 1 , Li absoluta acumulada
fi Fi
23 - 32 6 6
32 - 41 12 18
41 - 50 8 26
50 - 59 2 28
59 - 68 2 30
Total 30

n 30 n
y al calcular k 75 22.5 , se cumple Fi 1 = 18 < k 22.5 < Fi = 26,
100 100 100
en este caso el intervalo asociado a Fi F3 26 es 41, 50 , que contiene el valor de la
30
variable que ocupa la posicin 75 22.5 . La amplitud del intervalo es 9 y el lmite
100
inferior 41. Entonces, usando (3.14), el valor del percentil 75 P 75, es
n
k Fi 1
100 22.5 18 4.5
a
i = 41 26 18 9 41 8 9 46.1 .
Pk Li 1 El 75% de
Fi Fi 1


los estudiantes tienen edades inferiores a 46.1 aos.

Comentarios
Dependiendo de lo que se quiera representar o explicar y del tipo de variable con la que
estemos trabajando, se elegir a la estadstica de posicin ms apropiada segn el caso,
por ello hacemos la siguientes observaciones.
La media aritmtica es afectada por valores extremos de la variable.
La mediana no es afectada por valores extremos (valores inferiores o superiores
muy distantes del valor central) de la variable.
La media, mediana y moda se pueden calcular para datos cuantitativos.
La moda es la nica medida que sirve tanto para el caso de variables categricas
como para variables cuantitativas, puesto que su definicin no exige ordenar los
valores de la variable, ni hacer operaciones matemticas con ellos. Por ejemplo, si
se est trabajando la distribucin de la variable nacionalidad para un determinado
conjunto de personas, no tiene ningn sentido hablar del promedio o de la mediana
de esa distribucin; en cambio si tiene sentido hablar de la moda.
Si se trabaja la distribucin de una variable cuantitativa, en principio tiene sentido
calcular la media, la moda y la mediana; pero para efectos prcticos, puede no
tenerlo. Entonces, hace falta desarrollar un cierto criterio para decidir en casos
particulares, cul es la mejor medida de tendencia central.
La media aritmtica es muy sensible a valores extremos. Entonces, si en una
distribucin hubiera presencia de dichos valores, la media no es la mejor de las
medidas de tendencia central. Por ejemplo en lo que sigue tenemos dos conjuntos de

89
CAPITULO III 90 MEDIDAS DEPOSICIN Y DISPERSIN

datos, al triplicar el ltimo valor del conjunto2, el nico valor que se altera es la
media:
Media Mediana Moda
Conjunto1: 9,9,9,10,11,12,13,14,19 11.77 11 9
Conjunto2: 9,9,9,10,11,12,13,14,57 16 11 9

Relacin entre la media mediana y moda

Puesto que las tres medidas de posicin tienen debilidades y fortalezas vale la pena
observarlos e interpretarlos en forma conjunta. Un forma de entender la relacin entre estos
tres es localizando los valores de cada uno de ellos en una distribucin de frecuencias.
La siguiente figura muestra las tres formas muy comunes de distribucin de frecuencias

Moda<Mediana< Media Media=Mediana=Moda Media<Mediana< Moda


(a) (b) (c)
En la distribucin de frecuencias (a) la posicin relativa de la media, mediana y moda
indica asimetra positiva
La distribucin de frecuencias (b) nos muestra que la media, mediana y moda de una
variable son iguales. Esta distribucin tiene forma de campana y se la conoce como
distribucin normal.(o campana de Gauss).
En la distribucin de frecuencias (c) la posicin relativa de la media, mediana y moda
indica asimetra negativa

Ejemplo 3.14
Con la base de DATOS1-maestra vamos a obtener la media aritmtica, la mediana, la
moda y el percentil 75 de la variable coeficiente de inteligencia usando el SPSS.

Solucin:
Al abrir la base de DATOS1-maestra y usar los comandos del SPSS de la pgina , la
salida del SPSS para la variable coeficiente de inteligencia es:
Statistics

inteligencia
N Valid 70
Missing 0
Mean 101.79
Median 100.00
Mode 100
Sum 7125
Percentiles 75 104.31

90
CAPITULO III 91 MEDIDAS DEPOSICIN Y DISPERSIN

Al interpretar algunos resultados tenemos que:


Media:El coeficiente de inteligencia promedio de los estudiantes es 101.79 puntos.
Mediana: El 50% inferior de los estudiantes de maestra tienen un coeficiente de
inteligencia menor a 100 puntos.
Moda: La mayora de los estudiantes tiene coeficiente de inteligencia igual a 100 puntos.
Percentil 75:El 75% de los estudiantes de maestra tienen un coeficiente de inteligencia
menor a104.3 puntos.
Ejemplo 3.15
Con la base de DATOS4- ciudadana obtendremos la media aritmtica, la mediana, la
moda, percentil 25 y el percentil 75 de la variable nmero de elecciones que asisti, usando
los comandos del SPSS.

Solucin:
Se abre la base de DATOS4-ciudadana y usando los comandos de la pgina , la salida
que proporciona el SPSS para la variable nmero de elecciones a las que asisti es la
iguiente:
Statistics

NMERO ELECCIONES QUE ASISTI


N Valid 100
Missing 0
Mean 3.00
Median 3.00
Mode 3
Minimum 1
Maximum 5
Percentiles 25 2.00
75 4.00

Media:El nmero promedio de elecciones a la que asistieron representantes vecinales fue 3.


Mediana. El 50% de los representantes vecinales asistieron a menos de 3 elecciones.
Moda: La mayora de ciudadanos asisti a 3 elecciones
Percentil 25: El 25 % de los representantes vecinales asistieron a menos de 2 elecciones.
Percentil75:El 75 % de los representantes vecinales asistieron a menos de 4 elecciones.
Ejemplo 3.16
Con la base de DATOS3-educacin se obtendr la media aritmtica, la mediana, la moda y
los percentiles 10 y 90 para las variables edad, tiempo de servicio en la docencia y nota
promedio de los participantes, usando los comandos del SPSS.

Solucin:
Se abre la base de DATOS3-educacin y usamos los comandos de la pgina . En este
caso se selecciona las variables edad, tiempo de servicio en la docencia y nota promedio de
los participantes en el programa de capacitacin.
En el siguiente cuadro se presenta los resultados que proporciona el SPSS para las tres
variables .

91
CAPITULO III 92 MEDIDAS DEPOSICIN Y DISPERSIN

TIEMPO
EDAD DE LOS DE NOTAS
PARTICIPANTES SERVICIO PROMEDIO
N Valid 47 47 47
Mean 34.78 13.97 11.536788
Median 34.84 14.00 11.540694
Mode 30(a) 13(a) 8.8495(a)
Sum 1635 656 542.2290
Percentiles 10 31.07 11.00 9.556556
90 37.49 17.09 13.417391
a Multiple modes exist. The smallest value is shown

Media: La edad promedio de los participantes en el programa de capacitacin fue 34,78


aos, es decir 35 aos.
Mediana El 50% de los participantes en el programa de capacitacin tienen menos de 34.84
aos, es decir, 35 aos.
Moda: La mayora de los de los participantes tena 30 aos, pero la distribucin no es
unimodal, existen otras modas.
Percentil 10: El 10% de los participantes en el programa de de capacitacin tienen menos
de 31,07 aos, es decir 31 aos.

92

También podría gustarte