Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MEDIDAS DE POSICION
INTRODUCCION
Hasta ahora para describir un conjunto de datos, se han empleado las tablas y los
grficos. Estos son tiles para dar rpidamente una visin general del comportamiento de
los valores que asume una variable, as, en el caso de variables categricas, los diagramas
son suficientes para dar una descripcin completa de las mismas..
Sin embargo, para describir el comportamiento de variables cuantitativas, en general se
requiere una mayor precisin que la que puede proporcionar un grfico, es importante que
esa descripcin trascienda los lmites de lo visual y lo subjetivo en cuanto sea posible.
Como solucin a la situacin planteada, surgen las medidas de posicin y de dispersin,
para describir las caractersticas de las distribuciones en forma cuantitativa. Ms
exactamente, la precisin que es deseable obtener al describir el conjunto de datos
numricos se refiere a dos aspectos, cada uno de los cules se puede traducir en una
pregunta:
Existe algn valor de la variable que represente a la mayora de los valores del conjunto
de datos?.
Qu tan separados estn entre si, los diferentes valores que asume la variable respecto al
valor de la variable que representa a los datos?.
La primera pregunta se refiere a las medidas de posicin y la segunda, a las llamadas
medidas de dispersin.
As tambin, un investigador del campo educativo puede realizar una investigacin para
determinar si las aptitudes matemticas son diferentes segn el sexo de los estudiantes. Este
investigador tendr dos conjuntos de calificaciones, luego obtendr la calificacin
promedio de cada grupo y har la comparacin de los promedios. La variabilidad de los
datos es otro aspecto importante que el investigador debe de considerar, as, necesita saber
si las calificaciones son uniformes o vara entre los estudiantes del sexo femenino y del
sexo masculino.
MEDIDAS DE POSICION
En el campo social y educativo las medidas de tendencia central que se usan ms
frecuentemente son la media aritmtica, la mediana, los percentiles y la moda. A
continuacin desarrollaremos dichos temas.
MEDIA ARITMETICA
Definicin
Si x1 ,...., xn son los valores observados de una variable, la media aritmtica o
simplemente media o promedio de estos datos se define como el cociente de la suma de
todos los. valores observados entre el nmero de datos o tamao de la muestra. Su
expresin matemtica es:
69
CAPITULO III 70 MEDIDAS DEPOSICIN Y DISPERSIN
x1 x 2 ... x n 1 n
X xi , (3.1)
n n i 1
donde n es el nmero total de observaciones .
Nos permite calcular un promedio tomando en cuenta la importancia o peso de cada valor
observado de la variable con respecto al total. Su expresin matemtica es:
k
x w i i
Xw i 1
k (3.2)
w
i 1
i
Ejemplo 3.1
Supongamos que un profesor decide utilizar un promedio ponderado para obtener los
promedios finales de cada uno de los estudiantes que asisten al curso de estadstica. El
promedio de trabajos tendr un valor de 20% de la calificacin del estudiante, el examen
parcial 25%; el examen final 35%, promedio de prcticas 20%. A partir de los datos
siguientes calcularemos el promedio final para dos estudiantes cualesquiera.
Solucin:
a) Obtengamos el promedio ponderado del primer estudiante. Aplicando la frmula (3.2) se
tiene:
k
x w i i
15(0.2) 12(0.25) 18(0.35) 13(0.20)
Xw i 1
= Xw 14.9 puntos.
k
0.20 0.25 0.35 0.20
w
i 1
i
Si calculamos la media aritmtica de las notas del primer estudiante, obtendramos 14.5
puntos.
70
CAPITULO III 71 MEDIDAS DEPOSICIN Y DISPERSIN
El primer estudiante tiene mayor promedio ponderado que el segundo estudiante debido a
que el examen final tiene mayor peso a pesar de que el segundo estudiante supera al
primero en las notas de trabajo y prctica.
1 k
X xi f i
n i 1
(3.3)
Ejemplo 3.2
En la tabla 2.1 se tiene la distribucin de frecuencias del nmero de hijos de los estudiantes
de maestra. Encontraremos el nmero promedio de hijos.
xi fi
x1 =0 2
x2 =1 11
x3 =2 11
x4 =4 3
x5 =5 3
Total 30
Solucin:
Como los datos se encuentran tabulados usaremos la expresin (3.3) para obtener la media
aritmtica. Los clculos auxiliares se presentan en la siguiente tabla.
xi fi xi f i
x1 =0 2 0
x2 =1 11 11
x3 =2 11 22
x4 =4 3 12
x5 =5 3 15
71
CAPITULO III 72 MEDIDAS DEPOSICIN Y DISPERSIN
Total 30 60
1 k '
X
n i 1
xi f i , xi' es la i - sima marca de clase (3.4)
Ejemplo 3.3
En la Tabla 3.1 se tiene las edades de un grupo de estudiantes de maestra de la Facultad de
Educacin matriculados en el semestre 2003-I. Obtengamos la media aritmtica.
.Tabla 3.1 Edad de los estudiantes de la maestra en
educacin matriculados en el 2003-I.
Edades Marca de Frecuencia
Li 1 , Li clase Absoluta
x i' fi
23 - 32 27.5 6
32 - 41 36.5 12
41 - 50 45.5 8
50 - 59 54.5 2
59 - 68 63.5 2
Solucin:
Como los datos se presentan agrupados en intervalos de clase usaremos la expresin (3.4).
Los clculos auxiliares se presentan en la siguiente tabla.
72
CAPITULO III 73 MEDIDAS DEPOSICIN Y DISPERSIN
1 n '
X xi f i
n i 1
27.5(6) 36.5(12) 45.5(8) 54.5(2) 63.5(2) 1203
40.1 aos .La edad
30 30
promedio de los estudiantes es 40.1 aos.
x
i 1
i X fi 0
Demostracin
k
x
k
X fi k k x i fi
i 1
i
xi 1
i fi X f
i 1
i n X n X 0 , puesto que X i 1
Ejemplo:
Las siguientes observaciones corresponden a la variable nmero de inasistencias a clases
durante un ao escolar, en un grupo de 20 estudiantes.
xi 1 3 6 7 8
fi 3 4 8 3 2
Solucin.-
xi fi xi f i
1 3 1 *3=3
3 4 3 *4=12
6 8 6 *8=48
7 3 7 *3=21
8 2 8 *2=16
Total 100
k
1 100
X xi f i 5 inasistencias en promedio durante el ao escolar.
n i 1 20
x
i 1
i X f i 1 5 3 3 5 4 6 5 8 (7 5)3 (8 5)2 12 8 8 6 6 0
2. La suma de los cuadrados de las desviaciones de todos los valores con respecto a la
media es mnima. Cuya expresin matemtica es:
73
CAPITULO III 74 MEDIDAS DEPOSICIN Y DISPERSIN
x X f i es mnima
2
i
i 1
Ejemplo
Aplicaremos la propiedad a la distribucin de frecuencias del nmero de inasistencia a
clases:
xi 1 3 6 7 8
fi 3 4 8 3 2
Solucin:
Calculando los cuadrados de las desviaciones con respecto a la media y tambin con
respecto a cada uno de los valores de la variable se tiene:
xi f i ( xi X ) 2 f i ( xi 1) 2 f i ( xi 3) 2 f i ( xi 6) 2 f i ( xi 7) 2 f i ( x i 8) 2 f i
1 3 (1-5)2 *3=48 0 12 75 108 147
3 4 (3-5)2 *4=16 16 0 36 64 100
6 8 (6-5)2 *8=8 200 72 0 8 32
7 3 (7-5)2 *3=12 108 48 3 0 3
8 2 (8-5)2 *2=18 98 50 8 2 0
Total 102 422 182 122 182 282
n1 X 1 n2 X 2 ... nk X k
ni X i
X global k
i 1
n1 n2 ... nk
ni i 1
Por ejemplo se tiene la distribucin del nmero de inasistencias a clases de una muestra de
20 alumnos, cuyo promedio de inasistencia es 5. Si particionamos la muestra en dos,
tendremos las siguientes submuestras, las que usaremos para verificar la propiedad 3.
Muestra 1:
xi fi xi f i
74
CAPITULO III 75 MEDIDAS DEPOSICIN Y DISPERSIN
1 3 1 *3=3
3 4 3 *4=12
6 8 6 *8= 48
Total 15 63
63
X1 =4.2 n1=15
15
Muestra 2:
xi fi xi f i
7 3 7 *3=21
8 2 8 *2=16
Total 5 37
37
X2 7 .4 n2 =5
5
Ejemplo
La siguiente distribucin corresponde a las calificaciones en el curso de ingls de un grupo
de 25 estudiantes.
Calificaciones Nmero xi f i
xi de
estudiantes
fi
10 3 30
20 5 100
30 8 240
40 6 240
50 3 150
Total 25 760
La media de las calificaciones del curso de ingls es X 30.4 puntos.
Si el profesor opta por duplicar la calificacin a cada estudiante, cul ser la nueva media?
La forma ms rpida de obtener la nueva media ser aplicando la presente propiedad. Como
el profesor a cada estudiante le duplica la calificacin la constante es C=2., luego esta
constante ser multiplicada por la media de las calificaciones, es decir:
Y C X =2(30.4)=60.8. La nueva media de las calificaciones es Y =60.8.
75
CAPITULO III 76 MEDIDAS DEPOSICIN Y DISPERSIN
Ejemplo
Como parte de una tarea de laboratorio de nutricin, 15 estudiantes del tercer ao de la
Escuela Acadmico Profesional de Nutricin de la UNMSM matriculados el ao acadmico
2004, encontraron el nmero de caloras (X) de una porcin de lasaga. y obtuvieron los
siguientes valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
a) Encontraremos la media aritmtica del nmero de caloras.
b) Al acabar el trabajo, los estudiantes se informaron que el instrumento de medicin que
usaron estaba mal calibrado y marc en cada caso 300 caloras por debajo de su valor.
Encontraremos la media aritmtica de los nuevos valores de caloras.
Solucin:
MEDIANA
Definicin
Dado x1 ,...., xn observaciones de la variable X, la mediana es el valor o punto medio que
supera al 50 por ciento de los valores observados de la variable y es superado por el
restante 50 por ciento. La forma de obtener el valor de la mediana depende del nmero de
observaciones. As si el nmero de observaciones es impar, la mediana es el valor de la
variable que ocupa la posicin central de los datos ordenados y si el nmero de
observaciones es par, la mediana es la media aritmtica de los dos valores que ocupan la
posicin central de los datos ordenados. Esta definicin se puede plasmar mediante la
siguiente expresin matemtica.
76
CAPITULO III 77 MEDIDAS DEPOSICIN Y DISPERSIN
Si n es impar :
Me x n 1
2
Si n es par : (3.5)
x n x n
1
2 2
Me
2
donde el subndice indica la posicin o lugar que ocupa el valor de la variable ordenada .
Si la muestra es de tamao impar, como por ejemplo: 13 11 19 20 18 21 23, donde
n 1
n = 7, entonces 4 , por lo que la mediana es el valor de la variable que ocupa la
2
posicin 4 de las observaciones ordenadas: 11 13 18 19 20 21 23 . Me x 4 = 19.
Si el tamao de la muestra es par, como por ejemplo 10 16 4 9 13 17, donde n = 6 y
ordenados son:4 9 10 13 16 17, entonces,
n n
3 , 1 4 por lo que x (3) 10 , x ( 4 ) 13 ocupan la posicin central. Luego el
2 2
10 13
valor de la mediana es la media aritmtica de 10 y 13, es decir Me 11 .5 .
2
Si los datos estn en una distribucin de frecuencias, para calcular la mediana se seguirn
los siguientes pasos:
1) Encontrar las frecuencias absolutas acumuladas
n
2) Encontrar
2
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
n
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente inferior o
2
n
igual que y Fi es la frecuencia absoluta acumulada inmediatamente superior que
2
n
.
2
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor de la mediana de acuerdo a la frmula siguiente:
n
Me xi si Fi 1 Fi (a)
2
o (3.6)
x xi n
Me i 1 si Fi-1 Fi (b)
2 2
Ejemplo 3.4
Con la distribucin del nmero de hijos de los estudiantes de maestra presentados de la
Tabla 2.1 vamos a ilustrar la obtencin de la mediana.
77
CAPITULO III 78 MEDIDAS DEPOSICIN Y DISPERSIN
Solucin:
Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13 F2
x3 =2 11 24 F3
x4 =4 3 27
x5 =5 3 30
Total 30
n n 30
y luego calcular , es decir, = 15 .
2 2 2
En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal forma
n
que, Fi 1 13 15 Fi 24 . Usando (3.6(a)), el valor de la variable asociada a la
2
frecuencia absoluta acumulada Fi F3 24, es x3 2 ; o sea, el valor de la mediana es
2. Me 2 . El 50% de los estudiantes de maestra tienen menos de 2 hijos.
Ejemplo 3.5
Considerando el ejemplo anterior, supongamos que la distribucin de frecuencias sea de la
siguiente forma:
Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 13 15 F2
x3 =2 9 24 F3
x4 =4 3 27
x5 =5 3 30
Total 30
n 30 n
Al calcular = 15 ,se cumple que coincide con Fi 1 esto es,
2 2 2
n
Fi 1 15 15 Fi 24 . Usando (3.6(b)), ubiquemos los valores de la variable
2
asociados a Fi y Fi 1 . El valor de la variable asociada a la frecuencia absoluta
acumulada Fi = F3 =24 es x3 =2, y el valor de la variable que corresponde a Fi 1 13
x 2 x3 1 2
es x 2 =1, entonces la mediana es Me =1.5. El 50% de los estudiantes de
2 2
maestra tienen menos de 1.5 hijos.
78
CAPITULO III 79 MEDIDAS DEPOSICIN Y DISPERSIN
Seguir los pasos 1), 2), 3) del caso anterior de datos sin agrupar en intervalos de clase y
como paso 4) ubicar el intervalo de clase asociado a la frecuencia absoluta acumulada Fi
y encontrar el valor de la mediana de acuerdo a la siguiente expresin:
n
Fi 1 n
Me Li 1 2 ai Si Fi 1 Fi
Fi Fi 1 2
(3.7)
n
Me Li 1 Si Fi 1 Fi
2
donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi
Ejemplo 3.6
Obtengamos la mediana a partir de la distribucin de edad de los estudiantes de maestra
presentados en la Tabla 3.1
Solucin:
Para obtener la mediana previamente se calcula las frecuencias absolutas acumuladas como
se muestra a continuacin:
n 30 n
Al calcular 15 , se cumple Fi 1 = 6 < 15 < Fi = 18, en este caso el
2 2 2
intervalo asociado a Fi F2 18 es 32 , 41 , este contiene el valor de la variable que
n 30
ocupa la posicin 15 . La amplitud del intervalo es 9 y el lmite inferior 32.
2 2
79
CAPITULO III 80 MEDIDAS DEPOSICIN Y DISPERSIN
Ejemplo 3.7
Supongamos que la distribucin de frecuencias para la edad de los estudiantes de maestra
sea de la siguiente forma:
n 30 n
Al calcular 15 , se cumple que coincide con Fi 1 esto es, Fi 1 =15=
2 2 2
n
15 < Fi = 26. El intervalo de clase asociado a la frecuencia absoluta acumulada Fi =
2
F3 =26 es 41, 50 , luego usando (3.7) la mediana es Me Li 1 L2 41 . El 50% de
los estudiantes tienen edades inferiores a 41 aos.
MODA
Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, ste
no tiene moda. Tambin existen situaciones donde se tiene ms de una moda, en tal caso
diremos que la distribucin de frecuencias es bimodal, trimodal, multimodal.
80
CAPITULO III 81 MEDIDAS DEPOSICIN Y DISPERSIN
Mo xi si f i f i 1 y f i f i 1 (3.9)
donde:
f i 1 : frecuencia absoluta inmediatamente anterior a f i
.
f i 1 : frecuencia absoluta inmediatamente posterior a f i
Ejemplo 3.8
Con los datos presentados en el ejemplo 3.5 vamos a ilustrar la obtencin de la moda.
Nmero se hijos fi
x1 =0 2
x2 =1 13
x3 =2 9
x4 =4 3
x5 =5 3
Solucin
Ejemplo 3.9
Con los datos de la siguiente tabla ilustraremos nuevamente la obtencin de la moda.
Nmero se hijos fi
x1 =0 2
x2 =1 11
x3 =2 11
x4 =4 3
x5 =5 3
Solucin:
81
CAPITULO III 82 MEDIDAS DEPOSICIN Y DISPERSIN
d1
M o Li 1 ai (3.10)
d1 d 2
donde:
Li 1 es el lmite inferior del intervalo modal
fi es la mayor frecuencia
f i 1 es la frecuencia inmediatamente anterior a la mayor frecuencia
f i 1 es la frecuencia inmediatamente posterior a la mayor frecuencia
d1 f i f i 1
d 2 f i f i 1
ai es la amplitud del intervalo modal
Ejemplo 3.9
En el siguiente ejemplo correspondiente a la Tabla 3.1 se tiene las edades de un grupo de
estudiantes de maestra de la Facultad de Educacin matriculados en el semestre 2003-I.
Obtengamos la moda.
Edades Frecuencia
Li 1 , Li Absoluta
fi
23 - 32 6
32 - 41 12
82
CAPITULO III 83 MEDIDAS DEPOSICIN Y DISPERSIN
41 - 50 8
50 - 59 2
59 - 68 2
Solucin:
Para obtener la moda se procede de la siguiente manera:
Se encuentra el valor de la mayor frecuencia absoluta, f 2 12 . El intervalo con mayor
frecuencia es 32 , 41 , su amplitud igual a 9 y su lmite inferior es 32,
f i 1 6 , f i 1 8 entonces: d1= 12-6=6, d2= 12-8=4 .
Luego el valor de la moda es:
d1 6
M o Li 1 ai = 32 9 32 5.4 37.4 aos. La edad ms
d1 d 2 6 4
frecuente es 37.4 aos, es decir 37 aos.
Ejemplo 3.10
En una muestra de 30 estudiantes, la variable disposicin para el estudio permiti establecer
la siguiente distribucin de frecuencias.
Podemos afirmar que con mayor frecuencia, 9 estudiantes respondieron tener muy buena
disposicin para el estudio. Luego la moda es muy buena disposicin para el estudio.
Cabe indicar que en este ejemplo, tenemos la distribucin de una variable cualitativa, luego
la moda es la nica estadstica de posicin que podemos calcular cuando se tiene una
variable cualitativa.
CUARTILES
Son nmeros que dividen la distribucin de frecuencia de un conjunto de datos en cuatro
partes iguales. Ellos son:
El cuartil uno, Q1, es el punto por debajo del cul se ubica el 25% de los datos.
El cuartil dos, Q2 , es el punto por debajo del cul se ubica el 50% de los datos.
El cuartil tres, Q3, es el punto por debajo del cul se ubica el 75% de los datos.
83
CAPITULO III 84 MEDIDAS DEPOSICIN Y DISPERSIN
Primero ordenamos los datos en orden de magnitud creciente. Los datos ordenados se
representan con x (1) , x ( 2) ,..., x ( n )
Luego encontramos la posicin para cada uno de los cuartiles, segn como sigue:
1
Para el cuartil uno calcular n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil uno. Si la posicin se encuentra a
mitad entre dos enteros el cuartil uno es el promedio de los dos valores correspondientes.
3
Para el cuartil tres calcular n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil tres. Si la posicin se encuentra a
mitad entre dos enteros el cuartil tres es el promedio de los dos valores correspondientes.
Ejemplo 3.11
Para los siguientes conjuntos de datos
a) 13 11 19 20 18 21 23
b) 11 13 18 19 20 21 23.
Obtendremos el cuartil uno, el cuartil tres y la mediana.
Solucin.
a) Si tenemos la siguiente muestra de datos:13 11 19 20 18 21 23, donde n=7, entonces,
n 1 7 1
para encontrar el cuartil uno calculamos 2 , por lo que el cuartil uno es el
4 4
valor de la variable que ocupa la posicin 2 de las observaciones ordenadas: 11 13 18 19
20 21 23. Luego Q1 x 2 13 .
Para encontrar el cuartil dos usamos la formula (3.5) y como n es impar
Me x n 1 x 7 1 x 4 19
2 2
84
CAPITULO III 85 MEDIDAS DEPOSICIN Y DISPERSIN
x n x n
x 6 x 6
2
1
2
2
1
2
x 3 x 4 10 13
Me 11 .5
2 2 2 2
como en el caso del calculo de la mediana teniendo en cuenta que la fraccin n/2 ser
n 2n 3n
cambiada por las fracciones , , segn se requiera calcular el cuartil uno,
4 4 4
cuartil dos(mediana) o cuartil tres respectivamente.
n
Q1 xi si Fi 1 Fi
4
o
xi 1 xi n
Q1 si Fi-1 Fi
2 4
(3.11)
85
CAPITULO III 86 MEDIDAS DEPOSICIN Y DISPERSIN
3n
2) Encontrar
4
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
3n
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente anterior
4
3n
o igual que y Fi es la frecuencia absoluta acumulada inmediatamente superior
4
3n
que .
4
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor del cuartil tres de acuerdo a la frmula siguiente:
3n
Q3 xi si Fi 1 Fi
4
o
xi 1 xi 3n
Q3 si Fi-1 Fi
2 4
(3.12)
Ejemplo 3.12
Con la distribucin del nmero de hijos de los estudiantes de maestra vamos a ilustrar la
obtencin del cuartil uno y el cuartil tres.
Solucin:
a) Cuartil uno.
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:
Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13
x3 =2 11 24
x4 =4 3 27
x5 =5 3 30
Total 30
n n 30
y luego calcular , es decir, = 7.5 .
4 4 4
En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal
n
forma que, Fi 1 2 7.5 Fi 13 .Usando (3.11), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F2 13, es x 2 1 ; luego, el
86
CAPITULO III 87 MEDIDAS DEPOSICIN Y DISPERSIN
b) Cuartil tres.
Despus de encontrar la frecuencia absoluta acumulada como se muestra en la tabla
siguiente:
Nmero se hijos fi Fi
x1 =0 2 2
x2 =1 11 13
x3 =2 11 24
x4 =4 3 27
x5 =5 3 30
Total 30
3n 3n 3 30
Calculamos es decir = =22.5.
4 4 4
En la columna de la frecuencia absoluta acumulada ubicamos Fi y Fi 1 de tal
3n
forma que, Fi 1 13 22.5 Fi 24 .Usando (3.12), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F3 24, es x3 2 ; luego, el
valor del cuartil tres es 2. Q3 x3 2 . El 75% de los estudiantes tiene dos o menos
hijos.
PERCENTILES
Son nmeros que dividen la distribucin en 100 partes iguales. De manera semejante a la
mediana, en que la distribucin de un conjunto de datos se dividi en dos partes, un 50%
inferior y otro 50% superior, o en cuartiles en donde la distribucin se dividi en cuatro
partes, cada una conteniendo un 25% de los datos.
As por ejemplo el percentil 10, P10, es el valor de la variable debajo del cual se encuentran
el 10% de los datos. Es importante calcularlos en distribuciones con un gran nmero de
datos.
87
CAPITULO III 88 MEDIDAS DEPOSICIN Y DISPERSIN
Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n n
ser cambiada por la fraccin k de acuerdo al percentil que sea de nuestro inters
2 100
encontrar (k =1,2,,99), y luego continuar con los pasos ya conocidos:
1) Encontrar las frecuencias absolutas acumuladas
n
2) Obtener la fraccin k donde k puede tomar los valores k = 1, 2,. . . ,99
100
3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo
kn
Fi 1 Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente
100
kn
inferior o igual que y Fi es la frecuencia absoluta acumulada inmediatamente
100
kn
superior que .
100
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi y
encontrar el valor del percentil k de acuerdo a la frmula siguiente:
kn
Pk xi si Fi 1 Fi
100
o (3.13)
x xi kn
Pk i 1 si Fi-1 Fi
2 100
n
k Fi 1
100 kn
Pk Li 1 a Si Fi 1 Fi
Fi Fi 1 i 100
(3.14)
kn
Pk Li 1 Si Fi 1 Fi
100
donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi
Ejemplo 3.13
Considerando los datos de la edad de los estudiantes de maestra vamos a obtener el
percentil 75 P75.
88
CAPITULO III 89 MEDIDAS DEPOSICIN Y DISPERSIN
n 30 n
y al calcular k 75 22.5 , se cumple Fi 1 = 18 < k 22.5 < Fi = 26,
100 100 100
en este caso el intervalo asociado a Fi F3 26 es 41, 50 , que contiene el valor de la
30
variable que ocupa la posicin 75 22.5 . La amplitud del intervalo es 9 y el lmite
100
inferior 41. Entonces, usando (3.14), el valor del percentil 75 P 75, es
n
k Fi 1
100 22.5 18 4.5
a
i = 41 26 18 9 41 8 9 46.1 .
Pk Li 1 El 75% de
Fi Fi 1
los estudiantes tienen edades inferiores a 46.1 aos.
Comentarios
Dependiendo de lo que se quiera representar o explicar y del tipo de variable con la que
estemos trabajando, se elegir a la estadstica de posicin ms apropiada segn el caso,
por ello hacemos la siguientes observaciones.
La media aritmtica es afectada por valores extremos de la variable.
La mediana no es afectada por valores extremos (valores inferiores o superiores
muy distantes del valor central) de la variable.
La media, mediana y moda se pueden calcular para datos cuantitativos.
La moda es la nica medida que sirve tanto para el caso de variables categricas
como para variables cuantitativas, puesto que su definicin no exige ordenar los
valores de la variable, ni hacer operaciones matemticas con ellos. Por ejemplo, si
se est trabajando la distribucin de la variable nacionalidad para un determinado
conjunto de personas, no tiene ningn sentido hablar del promedio o de la mediana
de esa distribucin; en cambio si tiene sentido hablar de la moda.
Si se trabaja la distribucin de una variable cuantitativa, en principio tiene sentido
calcular la media, la moda y la mediana; pero para efectos prcticos, puede no
tenerlo. Entonces, hace falta desarrollar un cierto criterio para decidir en casos
particulares, cul es la mejor medida de tendencia central.
La media aritmtica es muy sensible a valores extremos. Entonces, si en una
distribucin hubiera presencia de dichos valores, la media no es la mejor de las
medidas de tendencia central. Por ejemplo en lo que sigue tenemos dos conjuntos de
89
CAPITULO III 90 MEDIDAS DEPOSICIN Y DISPERSIN
datos, al triplicar el ltimo valor del conjunto2, el nico valor que se altera es la
media:
Media Mediana Moda
Conjunto1: 9,9,9,10,11,12,13,14,19 11.77 11 9
Conjunto2: 9,9,9,10,11,12,13,14,57 16 11 9
Puesto que las tres medidas de posicin tienen debilidades y fortalezas vale la pena
observarlos e interpretarlos en forma conjunta. Un forma de entender la relacin entre estos
tres es localizando los valores de cada uno de ellos en una distribucin de frecuencias.
La siguiente figura muestra las tres formas muy comunes de distribucin de frecuencias
Ejemplo 3.14
Con la base de DATOS1-maestra vamos a obtener la media aritmtica, la mediana, la
moda y el percentil 75 de la variable coeficiente de inteligencia usando el SPSS.
Solucin:
Al abrir la base de DATOS1-maestra y usar los comandos del SPSS de la pgina , la
salida del SPSS para la variable coeficiente de inteligencia es:
Statistics
inteligencia
N Valid 70
Missing 0
Mean 101.79
Median 100.00
Mode 100
Sum 7125
Percentiles 75 104.31
90
CAPITULO III 91 MEDIDAS DEPOSICIN Y DISPERSIN
Solucin:
Se abre la base de DATOS4-ciudadana y usando los comandos de la pgina , la salida
que proporciona el SPSS para la variable nmero de elecciones a las que asisti es la
iguiente:
Statistics
Solucin:
Se abre la base de DATOS3-educacin y usamos los comandos de la pgina . En este
caso se selecciona las variables edad, tiempo de servicio en la docencia y nota promedio de
los participantes en el programa de capacitacin.
En el siguiente cuadro se presenta los resultados que proporciona el SPSS para las tres
variables .
91
CAPITULO III 92 MEDIDAS DEPOSICIN Y DISPERSIN
TIEMPO
EDAD DE LOS DE NOTAS
PARTICIPANTES SERVICIO PROMEDIO
N Valid 47 47 47
Mean 34.78 13.97 11.536788
Median 34.84 14.00 11.540694
Mode 30(a) 13(a) 8.8495(a)
Sum 1635 656 542.2290
Percentiles 10 31.07 11.00 9.556556
90 37.49 17.09 13.417391
a Multiple modes exist. The smallest value is shown
92