Está en la página 1de 86

Captulo III

Medidas de posicin y de dispersin

Introduccin
Hasta ahora, para describir un conjunto de datos, se han empleado tablas y grficos. Estos son tiles para dar rpidamente una
visin general del comportamiento de los valores que asume una
variable; as, en el caso de variables categricas, los diagramas son
suficientes para dar una descripcin completa de las mismas.
Sin embargo, para describir el comportamiento de variables
cuantitativas se requiere de una mayor precisin que la que puede
proporcionar un grfico. Es importante que esa descripcin trascienda los lmites de lo visual y lo subjetivo en cuanto sea posible.
Como solucin a la situacin planteada, surgen las medidas de
posicin y de dispersin, para describir las caractersticas de las
distribuciones en forma cuantitativa. Ms exactamente, la precisin que es deseable obtener al describir el conjunto de datos numricos se refiere a dos aspectos, cada uno de los cuales se puede
traducir en una pregunta: Existe algn valor de la variable que
represente a la mayora de los valores del conjunto de datos? Qu
tan separados estn entre s los diferentes valores que asume la
variable respecto al valor de la variable que representa a los datos?
La primera pregunta se refiere a las medidas de posicin y la segunda, a las llamadas medidas de dispersin.
As tambin, un investigador del campo educativo puede realizar una investigacin para determinar si las aptitudes matemticas son diferentes segn el sexo de los estudiantes. Este investiga-

[107]

03_cap3.p65

107

107

31/03/2006, 02:34 p.m.

dor tendr dos conjuntos de calificaciones, luego obtendr la calificacin promedio de cada grupo y har la comparacin de los
promedios. La variabilidad de los datos es otro aspecto importante
que el investigador debe de considerar. As, necesita saber si las
calificaciones son uniformes o varan entre los estudiantes del sexo
femenino y del sexo masculino.

Medidas de posicin
En el campo social y educativo las medidas de tendencia central
que se usan ms frecuentemente son la media aritmtica, la mediana, los percentiles y la moda. A continuacin desarrollaremos dichos temas.

Media aritmtica
Definicin
Si x1 ,...., xn son los valores observados de una variable X , la
media aritmtica o simplemente media o promedio de estos datos
se define como el cociente de la suma de todos los valores observados entre el nmero de datos o tamao de la muestra. Su expresin
matemtica es:

X =

x1 + x2 + ... + xn 1 n
= xi ,
n
n i =1

(3.1)

donde n es el nmero total de observaciones.

Ejemplo 1
Los siguientes datos corresponden a las notas de 5 estudiantes en
el curso de Estadstica: 12, 15, 11, 09, 13. Encontraremos el valor de
la media aritmtica.
Solucin
La nota promedio del curso es

X =

x1 + x2 + ... + xn 1
= (12 + 15 + 11 + 09 + 13) =12 puntos.
5
n

108

03_cap3.p65

108

31/03/2006, 02:34 p.m.

Media aritmtica ponderada


Nos permite calcular un promedio tomando en cuenta la importancia o peso de cada valor observado de la variable con respecto
al total. Su expresin matemtica es:
k

Xw =

xw
i =1
k

w
i =1

(3.2)

donde wi , es la importancia o peso que se asigna a cada valor


de la variable.

Ejemplo 2
Supongamos que un profesor decide utilizar un promedio ponderado para obtener los promedios finales de cada uno de los estudiantes que asisten al curso de Estadstica. El promedio de trabajos
tendr un valor de 20% de la calificacin del estudiante; el examen
parcial, 25%; el examen final, 35%; y el promedio de prcticas,
20%. A partir de los datos siguientes calcularemos el promedio
final para dos estudiantes cualesquiera.
Estudiante

Nota de trabajos Examen parcial Examen final

1
2

15
17

12
10

18
14

Promedio
prcticas
13
17

Solucin
a) Obtengamos el promedio ponderado del primer estudiante. Aplicando la frmula (3.2) se tiene:
k

Xw =

x w
i =1
k

w
i =1

15(0, 2) + 12(0, 25) + 18(0, 35) + 13(0, 20)


= 14,9 puntos.
0, 20 + 0, 25 + 0, 35 + 0, 20

Por otro lado, calculamos la media aritmtica de las notas del


primer estudiante, obtenemos 14,5 puntos.
b) Obtengamos el promedio ponderado del segundo estudiante. En este caso el promedio ponderado es:

109

03_cap3.p65

109

31/03/2006, 02:34 p.m.

Xw =

17(0, 2) + 10(0, 25) + 14(0, 35) + 17(0, 20)


= 14, 2 puntos.
0, 20 + 0, 25 + 0, 35 + 0, 20

Observe que la media aritmtica del segundo estudiante tambin es 14,5.


El primer estudiante tiene mayor promedio ponderado que el
segundo estudiante debido a que el examen final tiene mayor peso,
a pesar de que el segundo estudiante supera al primero en las
notas de trabajo y prcticas.
Si los datos se presentan en una distribucin de frecuencias,
donde los valores xi de la variable se repiten fi veces, la frmula
(3.1) quedar expresada en la siguiente forma:

X =

1 k
xi fi
n i =1

(3.3)

Ejemplo 3
Los alumnos del Doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM matriculados en el semestre acadmico 2000-I y que ingresaron a la universidad entre los aos 1997 y 1999. El estudio se llev a cabo entre
abril y junio del ao 2000. Como el nmero total de estudiantes que
cursaban las diversas maestras era alrededor de 2 500, despus de
grandes debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la maestra en
Gestin Educativa. A continuacin se presentan los datos para la
variable nmero de hijos de los 30 maestristas. Encontraremos el
nmero promedio de hijos.
Nmero de hijos

X
0
1
2
4
5
Total

fi
2
11
11
3
3
30

110

03_cap3.p65

110

31/03/2006, 02:34 p.m.

Solucin
Como los datos se encuentran tabulados usaremos la expresin
(3.3) para obtener la media aritmtica. Los clculos auxiliares se
presentan en la siguiente tabla.

xi

0
1
2
4
5
Total

fi

2
11
11
3
3
30

xi fi
0
11
22
12
15
60

Reemplazando en la frmula (3. 3) se tiene:

X =

1 k
0(2) + 1(11) + 2(11) + 4(3) + 5(3) 60
=
= 2 hijos.
xi fi = X =
n i =1
30
30
En promedio, los estudiantes de la maestra tienen 2 hijos.

Si los datos se presentan en una tabla de distribucin de frecuencias agrupados en intervalos de clase, los valores xi de la
expresin (3.3) sern reemplazados por la marca de clase de cada
intervalo y el valor de la media aritmtica se obtiene de la siguiente
manera:

X=

1 k '
xi fi ,
n i =1

xi' es la i-sima marca de clase

(3.4)

Ejemplo 4
Los alumnos del doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM, matriculados en el semestre acadmico 2000-I y que ingresaron a la universidad entre los aos 1997 y 1999. El estudio se llev a cabo entre
abril y junio del ao 2000. Como el nmero total de estudiantes que
cursaban las diversas maestras era alrededor de 2 500, despus de
grandes debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la maestra en

111

03_cap3.p65

111

31/03/2006, 02:34 p.m.

Gestin Educativa. A continuacin se presentan los datos para la


variable edad de los estudiantes. Obtengamos la media aritmtica.
Edades

[ Li 1
[23
[32
[41
[50
[59

Marca de clase

Frecuencia Absoluta

, Li )

'
i

fi

27,5
36,5
45,5
54,5
63,5

6
12
8
2
2

32)
41)
50)
59)
68]

Solucin
Como los datos se presentan agrupados en intervalos de clase usaremos la expresin (3.4) para obtener el valor de la media aritmtica. Los clculos auxiliares se presentan en la siguiente tabla:
Edades

[ Li 1

Marca de clase

Frecuencia Absoluta

xi

'

fi

xi f i

27,5
36,5
45,5
54,5
63,5

6
12
8
2
2
30

165,0
438,0
364,0
109,0
127,0
1203,0

, Li )

[23 - 32)
[32 - 41)
[41 - 50)
[50 - 59)
[59 - 68]
Total

'

y reemplazando en la frmula (3.4) se encuentra:


X=

1 n '
x f
n i =1 i i

27, 5(6) + 36,5(12) + 45,5(8) + 54, 5(2) + 63, 5(2)


1203
=
= 40,1 aos.
30
30

La edad promedio de los estudiantes es 40,1 aos.

Propiedades de la media aritmtica


Propiedad 1. La suma de las desviaciones de los valores de la
variable respecto a la media aritmtica es igual a cero. Expresado
matemticamente, tendremos:

(x X ) f
k

i =1

= 0.

112

03_cap3.p65

112

31/03/2006, 02:34 p.m.

Demostracin
k

(x X ) f
k

i =1

x f
i =1

f
i =1

= n X n X = 0, puesto que X =

x f
i

i =1

Ejemplo 5
El Director del colegio Guadalupe est preocupado porque durante el ao acadmico 2004, algunos alumnos han faltado frecuentemente a clases. Con la finalidad de verificar su percepcin, solicita
al Director Acadmico que tome una muestra de 20 estudiantes
que en el ao 2004 cursaron el cuarto ao de secundaria. Obtenga
para dichos estudiantes: a) el promedio de inasistencias del mes
de noviembre y b) compruebe la propiedad 1 de la media aritmtica.
El informe del Director Acadmico consigna los siguientes datos.
Nmero de Inasistencias
en Noviembre

fi

Solucin
a) Primero encontramos la media aritmtica general usando la frmula (3.3):

xi
1
3
6
7
8
Total

X =

fi
3
4
8
3
2
100

xi fi
1
3
6
7
8

x
x
x
x
x

3= 3
4=12
8=48
3=21
2=16

1 k
100
xi f i =
= 5 inasistencias en promedio en el mes

n i =1
20

de noviembre.
b) Luego, comprobamos la propiedad 1:

(x X ) f
k

i =1

= (1 5) 3 + (3 5) 4 + ( 6 5 ) 8 + (7 5)3 + (8 5)2 = 12 8 + 8 + 6 + 6 = 0

113

03_cap3.p65

113

31/03/2006, 02:34 p.m.

Propiedad 2. La suma de los cuadrados de las desviaciones de


todos los valores con respecto a la media es mnima. Cuya expresin matemtica es:

( x X )
k

i =1

es mnima

fi

Ejemplo 6
Aplicaremos la propiedad 2 a la distribucin de frecuencias descrita en el ejemplo 5.
Nmero de Inasistencias
en Noviembre

fi

Solucin
Calculando los cuadrados de las desviaciones con respecto a la
media y tambin con respecto a cada uno de los valores de la variable se tiene:
2

xi

fi

( xi X ) f i

(1-5) x 3=48

(3-5) x 4=16

2
2

(6-5) x 8= 8

(7-5) x 3=12

(8-5) x 2=18

Total

2
2

102

( xi 1) 2 f i ( xi 3) 2 f i ( xi 6) 2 f i ( xi 7) 2 f i ( xi 8) 2 f i
0

12

75

108

147

16

36

64

100

200

72

32

108

48

98

50

422

182

122

182

282

Observe que la suma de los cuadrados de las desviaciones


respecto a la media de la distribucin es menor que cualquier otra
suma de las desviaciones con respecto a cada uno de los valores de
la muestra.
Propiedad 3. Dados k conjuntos de datos con sus medias
X 1 , X 2, . . . , X k y con n1 , n 2 , . . ., n k observaciones, respectivamente, la media global de todos los datos se obtiene mediante
la media ponderada, cuya expresin matemtica es:

114

03_cap3.p65

114

31/03/2006, 02:34 p.m.

X global

n X 1 + n2 X 2 + ... + nk X k
= 1
=
n1 + n2 + ... + nk

n X
i

i =1

n
i =1

donde el numerador representa la suma de todas las observaciones y el denominador el nmero total de observaciones.

Ejemplo 7
Para la distribucin del nmero de inasistencias a clases presentado en el ejemplo 5, se encontr que el promedio de inasistencias es
5. Particionaremos la muestra en dos submuestras, con las que se
verificar la propiedad 3.
Solucin
a) En la muestra 1:

xi
1
3
6
Total

X1 =

fi

xi fi

3
4
8
15

63
=4,2
15

1 x 3= 3
3 x 4= 12
6 x 8= 48
63
n1=15

b) En la muestra 2:

xi
7
8
Total

X2 =

fi
3
2
5

37
= 7, 4
5

xi fi
7 x 3=21
8 x 2=16
37
n2 =5

c) Luego, la media global es:

X global =

n1 X 1 + n2 X 2 15(4, 2) + 5(7, 4) 63 + 37 100


=
=
=
=5
n1 + n2
15 + 5
20
20

inasistencias en promedio en el mes de noviembre.


Hemos encontrado el mismo valor de la media de la muestra
original, verificando as la propiedad 3.

115

03_cap3.p65

115

31/03/2006, 02:34 p.m.

Propiedad 4. La media aritmtica de una constante por una variable, es igual al producto de la constante por la media aritmtica de
la variable. Esto es, si yi = Cxi i = 1,..., n, entonces Y = C X

Ejemplo 8
Los alumnos del doctorado en Educacin matriculados en el semestre 2003, en el marco del curso de Estadstica Aplicada a la Investigacin, realizaron una investigacin con el objetivo de establecer el
perfil de los estudiantes de maestra de la UNMSM matriculados en
el semestre acadmico 2002-I y que ingresaron a la universidad entre los aos 2000 y 2002. El estudio se llev a cabo entre abril y junio
de 2003. Como el nmero total de estudiantes que cursaban las diversas maestras era alrededor de 3 000, despus de grandes debates, los alumnos del doctorado en Educacin decidieron seleccionar
una muestra de 25 estudiantes de la maestra en Idiomas. A continuacin, se presentan los datos para la variable calificaciones en el
primer examen del curso de ingls para los 25 estudiantes seleccionados. Encontraremos la media aritmtica si el profesor decide duplicar la nota de cada estudiante, sabiendo que la media es 30,4.
Calificaciones

Nmero de estudiantes

xi

fi

10
20
30
40
50
Total

3
5
8
6
3
25

Solucin
1.- Para las notas originales verificaremos el valor de la media
aritmtica.
Calificaciones

Nmero de estudiantes

xi

fi

10
20
30
40
50
Total

3
5
8
6
3
25

X=

xi fi
30
100
240
240
150
760

760
= 30, 4
25

116

03_cap3.p65

116

31/03/2006, 02:34 p.m.

El valor de la media de las calificaciones del curso de ingls s


es 30,4 puntos.
2. La forma ms rpida de obtener el promedio de las notas duplicadas ser aplicando la presente propiedad. Como el profesor le
duplica la calificacin a cada estudiante, la constante es C=2; luego, esta constante ser multiplicada por la media de las calificaciones, es decir:
Y = C X =2(30,4)=60,8. La nueva media de las calificaciones
es Y =60,8.
Propiedad 5. La media aritmtica una variable mas una constante,
es igual a la media de la variable ms la constante. Esto es, si
yi = xi + C i = 1,..., n, entonces Y = X + C .

Ejemplo 9
Como parte de una tarea de laboratorio de nutricin, 15 estudiantes de tercer ao de la Escuela Acadmico Profesional de Nutricin
de la UNMSM matriculados el ao acadmico 2004, encontraron
el nmero de caloras (X ) de una porcin de lasaga y obtuvieron
los siguientes valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
a) Encontraremos la media aritmtica del nmero de caloras.
b) Al acabar el trabajo, los estudiantes se informaron que el
instrumento de medicin que usaron estaba mal calibrado
y marc en cada caso 300 caloras por debajo de su valor.
Encontraremos la media aritmtica de los nuevos valores de
caloras.

Solucin:
a) La media aritmtica del nmero de caloras es:

X=

526
= 35, 06 caloras
15

b) Sumamos a todas las observaciones de la variable X la


constante C = 300 caloras, y los nuevos valores de caloras ( Y ) es
como sigue:
335 347 318 322 330 351 362 315 342 346 353 316 327 333

117

03_cap3.p65

117

31/03/2006, 02:34 p.m.

El clculo de la media aritmtica de los nuevos valores de


caloras se podr simplificar aplicando la propiedad 5, esto es:

Y = X + C =35,06+300=335,06 caloras.
Mediana
Definicin
Dado x1 ,...., xn observaciones de la variable X, una vez ordenadas
las observaciones en forma creciente, la mediana es el valor o punto medio que supera al 50 por ciento de los valores observados de
la variable y es superado por el restante 50 por ciento. La forma de
obtener el valor de la mediana depende del nmero de observaciones. As, si el nmero de observaciones es impar, la mediana es el
valor de la variable que ocupa la posicin central de los datos
ordenados y, si el nmero de observaciones es par, la mediana es la
media aritmtica de los dos valores que ocupan la posicin central
de los datos ordenados. Esta definicin se puede plasmar mediante la siguiente expresin matemtica:

Si n es impar:
Me = x n +1

(a)

Si n es par:

(3.5)

x n + x n
Me =

+1
2

(b)

donde el subndice indica la posicin o lugar que ocupa el


valor de la variable ordenada.
Si la muestra es de tamao impar, como por ejemplo: 13 11 19 20
18 21 23, usar (3.5 (a)), donde n=7 y

n +1
= 4 , por lo que la mediana
2

es el valor de la variable que ocupa la posicin 4 de las observaciones


ordenadas: 11 13 18 19 20 21 23, es decir

Me = x(4) = 19.

Si el tamao de la muestra es par, como por ejemplo: 10 16 4 9


13 17, usar (3.5(b)) donde n=6 y ordenados son: 4 9 10 13 16 17,
entonces,

n
n
=3 ,
+ 1 = 4 por lo que x (3) = 10 y x(4) = 13
2
2

118

03_cap3.p65

118

31/03/2006, 02:34 p.m.

ocupan la posicin central. Luego, el valor de la mediana es la


media aritmtica de 10 y 13, es decir, Me =

10 + 13
= 11, 5
2

Para obtener la mediana a partir de una distribucin de frecuencias se consideran los siguientes casos:

Datos sin agrupar en intervalos de clase y presentados en


tabla de frecuencias
Si los datos estn en una distribucin de frecuencias, para calcular
la mediana se seguirn los siguientes pasos:
1) Encontrar las frecuencias absolutas acumuladas
2) Encontrar

n
2

3) En la columna de las frecuencias absolutas acumuladas, ubicar el intervalo

Fi 1

n
< Fi donde Fi 1 es la frecuen2

cia absoluta acumulada inmediatamente inferior o igual que

n
y Fi es la frecuencia absoluta acumulada inmediata2
n
mente superior que .
2

4) Ubicar en la columna del recorrido de la variable el valor

xi asociado a Fi y encontrar el valor de la mediana de


acuerdo con la frmula siguiente:

Me = xi

si

Fi 1 <

n
< Fi
2

(a )

o
Me =

xi 1 + xi
2

si

Fi-1 =

n
< Fi
2

(3.6)

(b )

Ejemplo 10
Para la distribucin de frecuencias del nmero de hijos de los estudiantes de maestra presentados en el ejemplo 3, vamos a ilustrar
la obtencin de la mediana.

119

03_cap3.p65

119

31/03/2006, 02:34 p.m.

Solucin
Primero debemos encontrar las frecuencias absolutas acumuladas,
como se muestra a continuacin:

fi

Fi

11

13

11

24

27

30

Total

30

Nmero de hijos

y luego calcular

F2
F3

n
n 30
= 15 .
, es decir,
=
2
2
2

En la columna de frecuencias absolutas acumuladas ubica-

n
2
(3.6(a)), el valor de la variable asociada a la frecuencia absoluta
mos

Fi y Fi 1 de tal forma que, Fi 1 = 13 < = 15 < Fi = 24 . Usando

acumulada
na es 2.

Fi = F3 = 24, es x3 = 2 ; o sea, el valor de la media-

Me = 2 . El 50% de los estudiantes de maestra tiene 2 o

menos de 2 hijos.

Ejemplo 11
Los alumnos del doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM matriculados en el semestre acadmico 2000-I y que ingresaron a la
universidad entre 1997 y 1999. El estudio se llev a cabo entre abril
y junio de 2000. Como el nmero total de estudiantes que cursaban
las diversas maestras era alrededor de 2 500, despus de grandes
debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la maestra en Gestin
Educativa. A continuacin, se presentan los datos para la variable
nmero de hijos de los 30 maestristas. Encontraremos la mediana.

120

03_cap3.p65

120

31/03/2006, 02:34 p.m.

fi

Fi

13

15

24

27

3
30

30

Nmero de hijos

5
Total

El valor de

de con

F2
F3

n 30
n
= 15 , por lo que se cumple que coinci=
2 2
2

Fi 1 = F2 , esto es, Fi 1 = 15 =

n
= 15 < Fi = 24 . El valor
2

de la variable asociada a la frecuencia absoluta acumulada

Fi = F3 =24 es x3 =2, y el valor de la variable que corresponde


a

Fi 1 =15 es x2 =1. Usando (3,6(b)) la mediana es

Me =

1+ 2
x2 + x3
=
=1,5. El 50% de los estudiantes de
2
2

maestra tienen menos de 1,5 hijos.

Datos agrupados en intervalos de clase y presentados en


una tabla de frecuencia
Seguir los pasos 1), 2), 3) del caso anterior de datos sin agrupar en
intervalos de clase y, como paso 4), ubicar el intervalo de clase
asociado a la frecuencia absoluta acumulada Fi y encontrar el
valor de la mediana de acuerdo a la siguiente expresin:

Me = Li 1

n F
i 1
+ 2
ai
Fi Fi 1

Me = Li 1

Si

Fi 1 <

Si Fi 1

n
< Fi
2

n
= < Fi
2

(a)

(3.7)
(b)

121

03_cap3.p65

121

31/03/2006, 02:34 p.m.

donde:

Li 1 es el lmite inferior del intervalo asociado a la frecuencia


absoluta acumulada

Fi y ai es la amplitud del intervalo asociado

a la frecuencia absoluta acumulada

Fi .

Ejemplo 12
Obtengamos la mediana a partir de la distribucin de edad de los
estudiantes de maestra presentados en el ejemplo 4 del presente
captulo.
Solucin
Para obtener la mediana, previamente se calculan las frecuencias
absolutas acumuladas como se muestra a continuacin:
Edades

[ Li1

Frecuencia absoluta

, Li )

Frecuencia absoluta acumulada

fi

Fi
6 F1

[23 - 32)

[32 - 41)

12

[41 - 50)

26

[50 - 59)

28

[59 - 68]

30

Total

30

El valor de

18

F2

n 30
n
=
= 15 , se cumple Fi 1 = 6 < = 15 < F i =
2
2
2

18, en este caso el intervalo de clase asociado a Fi = F2 = 18 es

[32 41) ; ste intervalo contiene el valor de la variable que ocupa la posicin
es

n
30
=
= 15 . Para dicho intervalo, la amplitud
2
2

ai =9 y, el lmite inferior es Li 1 = 32. Entonces, usando

(3.7(a)),

el

valor

de

la

mediana

es

15 6
Me = 32 +
9 = 32 +6, 75 = 38, 75 . El 50% de los
18 6
estudiantes tiene edades inferiores a 38,75 aos.

122

03_cap3.p65

122

31/03/2006, 02:34 p.m.

Ejemplo 13
Supongamos que en el ejemplo 4 la distribucin de frecuencias de
la edad de los estudiantes de maestra sea de la siguiente forma:
Edades

[ Li 1

Frecuencia absoluta

, Li )

Frecuencia absoluta acumulada

fi

Fi

[23 - 32)

[32 - 41)

15

[41 - 50)

11

26

[50 - 59)

28

[59 - 68)

30

Total

F2
F3

30

Obtendremos la mediana.

Solucin
El valor de

es,

n
n 30
=
= 15 , se cumple que coincide con Fi 1 , esto
2
2
2

Fi 1 =15=

n
= 15 < F i = 26. El intervalo de clase asociado a
2

la frecuencia absoluta acumulada

Fi = F3 =26 es [41 50 ) ; luego,

usando (3.7(b)), la mediana es Me = Li 1 = L2 = 41 . El 50% de los


estudiantes tiene edades inferiores a 41 aos.

Moda
Definicin
La moda es el valor de la variable que se repite con mayor frecuencia. Se expresa como:

Mo = xi , si xi es el valor de la variable que ms se repite (3.8)

123

03_cap3.p65

123

31/03/2006, 02:34 p.m.

Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, ste no tiene moda. Tambin existen situaciones donde se tiene ms de una moda, en tal caso diremos que
la distribucin de frecuencias es bimodal, trimodal, o multimodal.

Ejemplo 14
Obtendremos la moda para los siguientes conjuntos da datos:
a) 10 11 11 12 13 09 15
b) 10 11 12 13 09 15
c) 11 11 11 12 12 12 05 04
Solucin
Para el conjunto de datos (a): 10 11 11 12 13 09 15 la moda es

Mo = 11 (unimodal); mientras que en el conjunto (b): 10 11 12 13


09 15, no existe moda. Si el conjunto de datos es (c): 11 11 11 12 12
12 05 04, las modas son

Mo = 11 y Mo = 12 (bimodal).

A continuacin, se presentan los mtodos de obtencin de la


moda cuando se tiene un mayor nmero de datos, razn por la
cual previamente han sido tabulados.

Datos sin agrupar en intervalos de clase y presentados en


tablas de frecuencias
Para identificar el valor de la moda debe observarse la columna de
las frecuencias absolutas y seleccionar la mayor de ellas. Supongamos que esa frecuencia sea fi ; entonces, el valor de la moda es:

Mo = xi si fi > fi 1

f i > f i +1

(3.9)

donde:
f i 1

frecuencia absoluta inmediatamente anterior a f i

f i +1

frecuencia absoluta inmediatamente posterior a f i

Ejemplo 15
Con los datos presentados en el ejemplo 11 vamos a ilustrar la
obtencin de la moda.

124

03_cap3.p65

124

31/03/2006, 02:34 p.m.

Nmero de hijos
0
1
2
4
5

fi
2
13
9
3
3

Solucin
Para calcular la moda, observamos la columna de frecuencias absolutas y vemos que la mayor frecuencia corresponde a f 2 = 13.
Por lo tanto el valor de la moda es

x2 =1, es decir, Mo = 1 , indica

que la mayora de estudiantes de maestra tienen un hijo.

Ejemplo 16
Con los datos presentados en el ejemplo 3 ilustraremos nuevamente la obtencin de la moda.
Nmero de hijos
0
1
2
4
5

fi
2
11
11
3
3

Solucin
Esta distribucin posee dos modas: Mo = 1 y Mo = 2 ; pues a la
segunda frecuencia f 2 =11, le corresponde el valor x2 = 1 y a la
tercera frecuencia absoluta, f3 = 11, le corresponde el valor x3 = 2 .
En este caso la mayora de los estudiantes tienen 1 2 hijos.
Datos agrupados en intervalos de clase, presentados en
tablas de frecuencias
Debe observarse la columna de las frecuencias absolutas y detectar
la mayor de ellas. Supongamos que esa frecuencia sea fi , asociado a l se encuentra el intervalo de clase [ Li1 Li ) que contiene a la
moda y se denomina intervalo modal. La moda se obtendr mediante la siguiente expresin matemtica:

125

03_cap3.p65

125

31/03/2006, 02:34 p.m.

d1
Mo = Li 1 +
ai
d1 + d 2

(3.10)

donde:
Li 1

es el lmite inferior del intervalo modal,

fi

es la mayor frecuencia,

f i 1

es la frecuencia inmediatamente anterior a la mayor frecuencia,

f i +1

es la frecuencia inmediatamente posterior a la mayor frecuencia,

d1 = f i f i 1 ,
d 2 = f i f i +1 ,
ai
es la amplitud del intervalo modal.

Ejemplo 17
En el ejemplo 4 se tienen las edades de un grupo de estudiantes de
maestra de la Facultad de Educacin. Con dichos datos obtengamos la moda.
Edades

[ Li 1

, Li )

[23
[32
[41
[50
[59

Frecuencia Absoluta

32)
41)
50)
59)
68)

fi
6
12
8
2
2

Solucin
Se encuentra que el valor de la mayor frecuencia absoluta, f 2 = 12 .
El intervalo con mayor frecuencia es [32 41) , su amplitud es
igual a

ai =9 y su lmite inferior es Li 1 =32, fi 1 = 6 , fi +1 = 8

entonces: d1= 12-6=6, d2= 12-8=4.


Luego, el valor de la moda es:
6
= 32 +
9 = 32 + 5, 4 = 37,4aos
6+ 4
La edad ms frecuente es 37,4 aos, es decir, 37 aos.
d1
Mo = Li 1 +
ai
d1 + d2

126

03_cap3.p65

126

31/03/2006, 02:34 p.m.

Ejemplo 18
Los alumnos del doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM matriculados en el semestre acadmico 2000-I y que ingresaron a la universidad entre los aos 1997 y 1999. El estudio se llev a cabo entre
abril y junio de 2000. Como el nmero total de estudiantes que
cursaban las diversas maestras era alrededor de 2 500, despus de
grandes debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la maestra en
Gestin Educativa. A continuacin se presentan los datos para la
variable disposicin para el estudio. Obtengamos la moda.
Disposicin para el estudio
Ninguna
Regular
Buena
Muy buena
Excelente

Total

Nmero de estudiantes
2
7
5
9
7

30

Solucin
Al observar la tabla de frecuencias, podemos afirmar que, con mayor frecuencia, 9 estudiantes respondieron tener muy buena disposicin para el estudio. Luego, la moda es muy buena disposicin para el estudio.
Cabe indicar que, en este ejemplo, tenemos la distribucin de
una variable cualitativa; luego, la moda es la nica estadstica de
posicin que podemos calcular cuando se tiene una variable cualitativa.
Cuartiles
Son nmeros que dividen un conjunto de datos en cuatro partes
iguales. Ellos son:
El cuartil uno, Q1, es el punto por debajo del cual se ubica
el 25% de los datos.
El cuartil dos, Q2, es el punto por debajo del cual se ubica el
50% de los datos.

127

03_cap3.p65

127

31/03/2006, 02:34 p.m.

El cuartil tres, Q3, es el punto por debajo del cual se ubica el


75% de los datos.

Clculo de cuartiles en conjuntos de datos pequeos


Primero, ordenamos los datos en orden de magnitud creciente.
Luego, encontramos la posicin para cada uno de los cuartiles,
segn como sigue:
1
( n + 1) y redondear al entero
4
ms cercano. La observacin ordenada que ocupa esta posicin,
representa el cuartil uno. Si la posicin es la mitad entre dos enteros consecutivos, el cuartil uno es el promedio de los dos valores
correspondientes.
Para encontrar el valor del cuartil dos (mediana), usar la expresin (3.5).
Para el cuartil uno, calcular

3
(n + 1) y redondear al entero
4
ms cercano. La observacin ordenada que ocupa esta posicin,
representa el cuartil tres. Si la posicin se encuentra a mitad entre
dos enteros, el cuartil tres es el promedio de los dos valores correspondientes.
Para el cuartil tres, calcular

Ejemplo 19
Para los siguientes conjuntos de datos
a) 13 11 19 20 18 21 23
b) 10 16 4 9 13 17
Obtendremos el cuartil uno, el cuartil tres y la mediana.

Solucin
a) Si tenemos la siguiente muestra de datos: 13 11 19 20 18 21 23,
donde n=7; entonces, para encontrar el cuartil uno calculamos

n +1 7 +1
=
= 2 , por lo que el cuartil uno es el valor de la variable
4
4

128

03_cap3.p65

128

31/03/2006, 02:34 p.m.

que ocupa la posicin 2 de las observaciones ordenadas: 11 13 18


19 20 21 23. Luego,

Q1 = x(2 ) = 13 .

Para encontrar el cuartil dos por ser n impar usamos la frmula (3.5(a)):

Me = x n +1 = x 7 +1 = x(4 ) = 19.

3
4

Para encontrar el cuartil tres, calculamos ( n + 1) =


luego el cuartil tres es

3
(7 + 1) = 6
4

Q3 = x(6) = 21 .

b) Si tenemos otra muestra de datos, por ejemplo 10 16 4 9 13 17,


donde n=6 y ordenados son: 4 9 10 13 16 17. Entonces, para encontrar el cuartil uno, calculamos

n +1 6 +1
=
= 1, 75, luego, el entero
4
4

ms cercano es 2, por lo que el cuartil uno es el valor de la variable


que ocupa la posicin 2 de las observaciones ordenadas. Luego,

Q1 = x(2) = 9 .
Para encontrar el cuartil dos o mediana, por ser n par, usamos
(3.5 (b)).

x n + x n
Me =

+1
2

x 6 + x 6
=

+1
2

x(3) + x(4)
2

10+ 13
= 11, 5.
2

Para encontrar el cuartil tres, calculamos

3
(n + 1) =
4

3
(6 + 1) = 5, 25 luego, el entero ms cercano es 5, por lo que el
4
cuartil tres es .

Q3 = x(5) = 16 .

129

03_cap3.p65

129

31/03/2006, 02:34 p.m.

Para obtener los cuartiles a partir de una tabla de distribucin


de frecuencias, se procede como en el caso del clculo de la mediana, teniendo en cuenta que la fraccin n/2 ser cambiada por las
n 2 n 3n
,
,
segn se requiera calcular el cuartil uno,
4 4
4
cuartil dos (mediana) o cuartil tres respectivamente. As tenemos
los casos siguientes.

fracciones

Datos sin agrupar en intervalos de clase y presentados en


tabla de frecuencias
I. Para encontrar el cuartil uno, proceder de la siguiente manera:
1) Encontrar las frecuencias absolutas acumuladas,
2) Encontrar

n
,
4

3) En la columna de las frecuencias absolutas acumuladas, ubicar el intervalo

Fi 1

n
< Fi , donde Fi 1 es la frecuen4

cia absoluta acumulada inmediatamente inferior o igual que

n
y Fi es la frecuencia absoluta acumulada inmediata4
mente superior que

n
,
4

4) Ubicar en la columna del recorrido de la variable el valor

xi asociado a Fi y encontrar el valor del cuartil uno de


acuerdo con la frmula siguiente:

130

03_cap3.p65

130

31/03/2006, 02:35 p.m.

Q1 = xi

si Fi1 <

n
< Fi
4

(a)

si Fi-1 =

n
< Fi
4

(b)

o
Q1 =

xi 1 + xi
2

(3.11)

II. Para encontrar el cuartil tres:


1) Encontrar las frecuencias absolutas acumuladas,
2) Encontrar

3n
,
4

3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo

Fi 1

3n
< Fi donde Fi 1 es la frecuen4

cia absoluta acumulada inmediatamente anterior o igual que

3n
y Fi es la frecuencia absoluta acumulada inmediata4
mente superior que

3n
,
4

4) Ubicar en la columna del recorrido de la variable el valor

xi asociado a Fi y encontrar el valor del cuartil tres de


acuerdo con la frmula siguiente:

Q3 = xi

si Fi 1 <

3n
< Fi
4

(a)

si Fi-1 =

3n
< Fi
4

(b)

o
Q3 =

xi 1 + xi
2

(3.12)

Ejemplo 20
Con la distribucin del nmero de hijos de los estudiantes de maestra del ejemplo 3, vamos a ilustrar la obtencin del cuartil uno y el
cuartil tres.

131

03_cap3.p65

131

31/03/2006, 02:35 p.m.

Solucin
a) Cuartil uno.
Primero debemos encontrar las frecuencias absolutas acumuladas,
como se muestra a continuacin:
Nmero de hijos

fi

Fi

11

13

11

24

27

30

Total

30

y luego calcular

n
n 30
= 7,5
, es decir,
=
4
4 4

En la columna de frecuencias absolutas acumuladas ubicamos

Fi y Fi 1 de tal forma que, Fi 1 = 2 <

n
= 7, 5 < Fi = 13 . Ubi4

camos el valor de la variable asociada a la frecuencia absoluta


acumulada Fi = F2 = 13, es
valor del cuartil uno es 1.

x2 = 1 ; luego, usando (3.11(a)) el

Q1 = x2 = 1 . El 25% de los estudiantes

tiene como mximo un hijo.


b) Cuartil tres.
Despus de encontrar la frecuencia absoluta acumulada como se
muestra en la tabla siguiente:
Nmero de hijos

fi

Fi

11

13

11

24

27

30

Total

30

132

03_cap3.p65

132

31/03/2006, 02:35 p.m.

Calculamos

3n
3n 3 (30 )
, es decir,
=
=22,5
4
4
4

En la columna de la frecuencia absoluta acumulada ubicamos

Fi y Fi 1 de tal forma que Fi 1 = 13 <

3n
= 22,5 < Fi = 24 . Ubi4

camos el valor de la variable asociada a la frecuencia absoluta


acumulada Fi = F3 = 24, es
valor del cuartil tres es 2.

x3 = 2 ; luego, usando (3.12(a)) el

Q3 = x3 = 2 . El 75% de los estudiantes

tiene dos o menos hijos.

Cuartiles a partir de una distribucin de frecuencias para


datos agrupados en intervalos de clase
Para obtener los cuartiles para datos agrupados en intervalos de
clase, se procede como en el caso del clculo de la mediana, teniendo en cuenta que la fraccin

n
incluida en la frmula (3.7) ser
2

cambiada por las fracciones

n 2n 3n
,
,
segn se requiera obte4 4 4

ner el cuartil uno, cuartil dos (mediana) o cuartil tres, respectivamente.

Percentiles
Son nmeros que dividen el conjunto de datos en 100 partes iguales. De manera semejante a la mediana, en que la distribucin de
un conjunto de datos se dividi en dos partes, un 50% inferior y
otro 50% superior, o en cuartiles, en donde la distribucin se dividi en cuatro partes, cada una conteniendo un 25% de los datos.
As, por ejemplo, el percentil 10, P10, es el valor de la variable
debajo del cual se encuentra el 10% de los datos. Es importante
calcularlos en distribuciones con un gran nmero de datos.
A continuacin se presentan los mtodos de obtencin de los
percentiles para datos tabulados.

133

03_cap3.p65

133

31/03/2006, 02:35 p.m.

Datos sin agrupar en intervalos de clase y presentados en


una tabla de frecuencias
Se procede como en el caso del clculo de la mediana, teniendo en

n
n
ser cambiada por la fraccin k
de
2
100

cuenta que la fraccin

acuerdo al percentil que sea de nuestro inters encontrar (k =1,2,,99),


para luego continuar con los pasos ya conocidos:
1) Encontrar las frecuencias absolutas acumuladas,
2) Obtener la fraccin

n
, donde k puede tomar los valo100

res k = 1, 2,. . . ,99,


3) En la columna de las frecuencias absolutas acumuladas, ubicar el intervalo

Fi 1

kn
< Fi , donde Fi 1 es la fre100

cuencia absoluta acumulada inmediatamente inferior o


igual que

kn
y Fi es la frecuencia absoluta acumulada
100

inmediatamente superior que

kn
,
100

4) Ubicar en la columna del recorrido de la variable el valor

xi asociado a Fi y encontrar el valor del percentil k de


acuerdo a la frmula siguiente:

Pk = xi

si Fi1 <

kn
< Fi
100

(a)

o
Pk =

xi1 + xi
2

si Fi-1 =

kn
< Fi
100

(3.13)

(b)

134

03_cap3.p65

134

31/03/2006, 02:35 p.m.

Datos agrupados en intervalos de clase y presentados en


una tabla de frecuencias
Para obtener el percentil k , en el caso de una distribucin de frecuencias para datos agrupados en intervalos de clase, seguir los
pasos 1), 2), 3) del caso anterior de datos sin agrupar en intervalos
de clase y, como paso 4), ubicar el intervalo de clase asociado a la
frecuencia absoluta acumulada

Fi y encontrar el valor del percentil

k de acuerdo a la frmula siguiente:

Pk = Li 1

k 100 Fi 1

ai
+
Fi Fi 1

Pk = Li 1

si

Fi 1 <

kn
< Fi
100

(a)

(3.14)
si Fi 1

kn
=
< Fi
100

(b)

donde:
L i 1 , es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi y ai es la amplitud del intervalo asociado a Fi .

Ejemplo 21
Considerando los datos de la edad de los estudiantes de maestra
del ejemplo 4, vamos a obtener el percentil 75, P75.
Solucin
Previamente se calculan las frecuencias absolutas acumuladas
como se muestra a continuacin:
Edades

[ Li 1

Frecuencia absoluta

, Li )

[23 - 32)
[32 - 41)
[41 - 50)
[50 - 59)
[59 - 68]
Total

Frecuencia absoluta acumulada

fi

Fi

6
12
8
2
2
30

6
18
26
28
30

135

03_cap3.p65

135

31/03/2006, 02:35 p.m.

y al calcular

Fi 1 = 18 < k

n
30
= 75
= 22,5, se cumple
100
100

n
= 22,5 < Fi = 26, en este caso el intervalo
100

asociado a Fi = F3 = 26 es

[41 50 ) , que contiene el valor de

la variable que ocupa la posicin


de dicho intervalo es

75

30
= 22, 5 . La amplitud
100

ai =9 y el lmite inferior L i 1 =41. Entonces,

usando (3.14(a)), el valor del percentil 75, P75, es


n
k 100 Fi 1

Pk = Li 1 +
Fi Fi 1

ai

22, 5 18

4, 5

= 41 +
9 = 41 + 8 9 = 4 6,1 .
26 18

El 75% de los estudiantes tiene edades inferiores a 46,1 aos.

Comentarios
Dependiendo de lo que se quiera representar o explicar y del tipo
de variable con la que estemos trabajando, se elegir a la estadstica de posicin ms apropiada segn el caso. Por ello, hacemos las
siguientes observaciones.
La media aritmtica es afectada por valores extremos de la
variable.
La mediana no es afectada por valores extremos (valores inferiores o superiores muy distantes del valor central) de la
variable.
La media, mediana y moda se pueden calcular para datos
cuantitativos.
La moda es la nica medida que sirve tanto para el caso de
variables categricas como para variables cuantitativas, puesto que su definicin no exige ordenar los valores de la variable, ni hacer operaciones matemticas con ellos. Por ejemplo,
si se est trabajando la distribucin de la variable nacionalidad para un determinado conjunto de personas, no tiene ningn sentido hablar del promedio o de la mediana de esa distribucin; en cambio, s tiene sentido hablar de la moda.

136

03_cap3.p65

136

31/03/2006, 02:35 p.m.

Si se trabaja la distribucin de una variable cuantitativa, en


principio tiene sentido calcular la media, la moda y la mediana; pero para efectos prcticos, puede no tenerlo. Entonces,
hace falta desarrollar un cierto criterio para decidir, en casos
particulares, cul es la mejor medida de tendencia central.
La media aritmtica es muy sensible a valores extremos. Entonces, si en una distribucin hubiera presencia de dichos
valores, la media no es la mejor de las medidas de tendencia central. Por ejemplo, tenemos dos conjuntos de datos, al
triplicar el ltimo valor del conjunto 2, el nico valor que se
altera es el de la media.
Conjunto 1: 9,9,9,10,11,12,13,14,19
Conjunto 2: 9,9,9,10,11,12,13,14,57

Media
11.77
16

Mediana
11
11

Moda
9
9

Puesto que las tres medidas de posicin tienen debilidades


y fortalezas, vale la pena observarlas e interpretarlas en forma conjunta. Una forma de entender la relacin entre estas
tres es localizando los valores de cada una de ellos en una
distribucin de frecuencias.
La siguiente figura muestra las tres formas ms comunes de
distribucin de frecuencias

Moda<Mediana< Media
(a)

Media=Mediana=Moda
(b)

Media<Mediana< Moda
(c)

En la distribucin de frecuencias (a), la posicin relativa de la


media, mediana y moda indica asimetra positiva.
La distribucin de frecuencias (b) nos muestra que la media,
mediana y moda de una variable son iguales. Esta distribucin
tiene forma de campana y se la conoce como distribucin normal (o
campana de Gauss).

137

03_cap3.p65

137

31/03/2006, 02:35 p.m.

En la distribucin de frecuencias (c), la posicin relativa de la


media, mediana y moda indica asimetra negativa

Ejemplo 22
Con la base de DATOS1-maestra vamos a obtener la media aritmtica, la mediana, la moda y el percentil 75 de la variable coeficiente
de inteligencia usando el SPSS.
Solucin
Al usar la base de DATOS1-maestra y los comandos del SPSS para
estadsticas de posicin, la salida del SPSS para la variable coeficiente de inteligencia es:
Statistics
coe ficiente de inteligencia

Va lid
M iss in g

Mean
M e d ia n

1 0 1 ,7 9
1 0 0 ,0 0
1 0 0 ,0 0

Mode
Sum
P e rc e n tile s

70
0

7 1 2 5,0 0
75

1 0 4 ,3 1

Media: El coeficiente de inteligencia promedio de los estudiantes de maestra es 101,79 puntos.


Mediana: El 50% de los estudiantes de maestra tienen un coeficiente de inteligencia menor a 100 puntos.
Moda: La mayora de los estudiantes de maestra tienen un
coeficiente de inteligencia igual a 100 puntos.
P75: El el 75% de los estudiantes de maestra tienen un coeficiente de inteligencia menor a 104,3 puntos.

Ejemplo 23
Con la base de DATOS4-ciudadana obtendremos la media aritmtica, la mediana, la moda, percentil 25 y el percentil 75 de la variable nmero de elecciones a las que asisti, usando los comandos
del SPSS del captulo VII (procedimientos estadsticos).

138

03_cap3.p65

138

31/03/2006, 02:35 p.m.

Solucin
Se abre la base de DATOS4-ciudadana y usando los comandos
del SPSS para estadsticas de posicin para la variable nmero de
elecciones a las que asisti se obtiene lo siguiente:
Statistics
N
M e an
M e dian
M o de
M in im u m
M a xim u m
P e rce ntiles

Valid
M is sin g

25
75

1 00
0
3 ,00
3 ,00
3
1
5
2 ,00
4 ,00

Media: El nmero promedio de elecciones a la que asistieron


representantes vecinales fue 3.
Mediana: El 50% de los representantes vecinales asistieron a
menos de 3 elecciones.
Moda: La mayora de los ciudadanos asisti a 3 elecciones.
P25: El 25% de los representantes vecinales asistieron a menos
de 2 elecciones.
P75: El 75 % de los representantes vecinales asistieron a menos
de 4 elecciones.

Ejemplo 24
Con la base de DATOS3-educacin se obtendr la media aritmtica, la mediana, la moda y los percentiles 10 y 90 para las variables
edad, tiempo de servicio en la docencia y nota promedio de los
participantes, usando el software SPSS.
Solucin
Se abre la base de DATOS3-educacin y usamos los comandos del
SPSS del captulo VII (procedimientos estadsticos). En este caso, se
seleccionan las variables edad, tiempo de servicio en la docencia y
nota promedio de los participantes en el programa de capacitacin.

139

03_cap3.p65

139

31/03/2006, 02:35 p.m.

En el siguiente cuadro se presentan los resultados que proporciona el SPSS para las tres variables.
Edad de los
participantes

N
Valid
Mean
Median
Mode
Sum
Percentiles 1 0
90
a Multiple modes exist.

Tiempo de
servicio

47
47
34,78
13,97
34,84
14,00
30(a)
13(a)
1635
656
31,07
11,00
37,49
17,09
The smallest value is shown

Notas
promedio

47
11,536788
11,540694
8,8495(a)
542,2290
9,556556
13,417391

Media: La edad promedio de los participantes en el programa


de capacitacin fue 34,78 aos, es decir, 35 aos.
Mediana: El 50% de los participantes en el programa de capacitacin tienen menos de 34,84 aos, es decir, 35 aos.
Moda: La mayora de los participantes tena 30 aos, pero la
distribucin no es unimodal, existen otras modas.
P10: El 10% de los participantes en el programa de capacitacin tienen menos de 31,07 aos, es decir 31 aos.
P90: El 90% de los participantes en el programa de capacitacin tienen menos de 37,49 aos, es decir menos de 37 aos.
Queda para el lector hacer las interpretaciones de manera similar
de las estadsticas de posicin para las variables, tiempo de servicio en la docencia y la nota promedio final de los participantes.

Medidas de dispersin
En la seccin anterior se definieron medidas que permiten encontrar la ubicacin del centro de una distribucin y que, por tanto,
contribuyen a la descripcin del correspondiente conjunto de datos
mediante un valor representativo; pero para lograr una imagen completa de cmo es la distribucin es necesario saber cmo se distribuyen los datos alrededor de ese valor representativo. Retomemos,
entonces, la segunda pregunta formulada en la introduccin del
presente captulo: Qu tan separados estn entre s los diferentes
valores que asume la variable? El objetivo del presente captulo es
encontrar una manera adecuada de responder la pregunta plantea-

140

03_cap3.p65

140

31/03/2006, 02:35 p.m.

da, es decir, encontrar una forma de medir la dispersin de los


datos. Entre las medidas de dispersin ms usadas estn: el rango,
la varianza, la desviacin estndar y el coeficiente de variacin.

Rango
Es la diferencia entre los valores mximo y mnimo de un conjunto
de datos.

Rango = xmx xmn

(3.15)

Ejemplo 25
Los dos conjuntos de valores que siguen corresponden a los aos
de servicio en la docencia de 14 profesionales en Estadstica. Obtendremos el rango para cada conjunto de valores.
Conjunto 1: 15 15 30 30 30 30 30 30 30 30 30 30 45 45
Conjunto 2: 15 15 20 30 30 30 30 30 40 40 40 40 40 45

Solucin
En el conjunto 1, cuyos valores ya ordenados en forma ascendente
son:
15 15 30 30 30 30 30 30 30 30 30 30 45 45
el mximo valor es 45 y el mnimo valor es 15; entonces, el
rango es: Rango =45-15=30 y, en el conjunto 2, tambin el mximo
valor es 45 y el mnimo valor es 15, e igualmente tiene Rango = 4515 = 30. Pero tenemos que aceptar que la primera distribucin es
menos dispersa que la segunda; sin embargo, el rango es el mismo
para las dos distribuciones. Por tanto, en este caso el rango es una
medida que no refleja las diferencias que segn la intuicin y la
observacin son evidentes entre las dos distribuciones. Este hecho
nos exige seguir buscando otras medidas de dispersin que superen la limitacin anterior.
Rango intercuartlico
Es la diferencia entre el cuartil uno y el cuartil tres y se expresa
como:

141

03_cap3.p65

141

31/03/2006, 02:35 p.m.

Rango intercuartlico =

Q3 Q1

(3.16)

Esta medida de dispersin nos permite saber en cunto se


diferencian el mayor valor del menor valor del 50% de los valores
que se ubican en la parte central de la muestra ordenada y, desde
luego, no se ve influenciada por la presencia de valores extremos.

Ejemplo 26
Con los datos presentados en el ejemplo 25, encontraremos el rango intercuartlico para cada conjunto de valores.
Solucin
a) Para el conjunto 1 cuyos valores son: 15 15 30 30 30 30 30 30 30
30 30 30 45 45, encontraremos primero los cuartiles.
1
4

1
4

Cuartil uno: se tiene que n=14, la posicin es ( n + 1) = (14 + 1) = 3,75


y el entero ms cercano a 3,75 es 4; luego, el valor que ocupa la
posicin 4 es

Q1 = x(4) =30.

3
( n + 1) = 3 (14 + 1) = 11, 25
4
4
y el entero ms cercano a 11,25 es 11; luego, el valor que ocupa la

Cuartil tres: tambin n = 14, la posicin es

posicin 11 es

Q3 = x(11) =30.

Luego,
Rango intercuartlico = Q3

Q1 = 30-30 =0.

b) Para el conjunto 2, cuyos valores son: 15 15 20 30 30 30 30 30 40


40 40 40 40 45, tambin primero encontraremos los cuartiles.
Cuartil uno: n=14, la posicin es

1
1
( n + 1) = (14 + 1) = 3, 75 , el
4
4

entero ms cercano a 3, 75 es 4; luego, el valor que ocupa la posicin 4 es

Q1 = x(4) =30.

142

03_cap3.p65

142

31/03/2006, 02:35 p.m.

Cuartil tres: n=14, la posicin es

3
3
(n + 1) = (14 + 1) = 11, 25 y
4
4

el entero ms cercano a 11,25 es 11; luego, el valor que ocupa la


posicin 11 es

Q3 = x(11) =40.

Luego,
Rango intercuartlico = Q3

Q1 = 40-30 =10.

En el conjunto 1, el rango intercuartlico es igual a 0, es decir,


no existe variabilidad en el 50% de los datos que se encuentran
ubicados en la parte central. Mientras que en el conjunto 2, el rango
intercuartlico es igual a 10, indicando que el menor valor y el
mayor valor del 50% de los datos que se encuentran ubicados en la
parte central, tienen una diferencia de 10 unidades.

Rango semi-intercuartlico
Es la diferencia promedio desde la mediana hacia los dos cuartiles;
es decir, evala, en promedio, qu tan lejos se hallan los valores de
los cuartiles Q1 y Q3 con respecto a la mediana, y se expresa
mediante la frmula:
Rango semi-intercuartlico =

Q3 Q1
2

(3.17)

Ejemplo 27
Con los dos conjuntos de datos presentados en el ejemplo 25, correspondientes a los aos de servicio en la docencia, con rangos ambos
iguales a 30, rangos intercuartlicos iguales a cero y diez respectivamente, encontraremos el rango semi-intercuartlico en cada caso.
Solucin
Para el conjunto 1: Rango semi-intercuartlico =
Para el conjunto 2: Rango semi-intercuartlico =

Q3 Q1 30 30
=0
=
2
2

Q3 Q1 40 30 10
=
=5
=
2
2
2

143

03_cap3.p65

143

31/03/2006, 02:35 p.m.

Para el conjunto 1, esta medida de dispersin nos dice que no hay


dispersin en el 50% central de los datos respecto a la mediana.
Para el conjunto 2, esta medida de dispersin nos dice que tanto el
valor del cuartil uno como el valor del cuartil tres distan de la
mediana en promedio en 5 unidades.

Ejemplo 28
En la Escuela de Educacin Primaria Juana de Arco, los estudiantes fueron sometidos a un examen odontolgico. Los siguientes
datos corresponden al nmero de dientes con caries en una muestra de 7 alumnos de primer ao de primaria: 6, 0, 10, 8, 2, 3, 1.
Encontraremos:
a) El rango, b) rango intercuartlico, c) rango semiintercuartlico.
Solucin
a) El rango es:

Rango = xmx xmn =10 - 0 =10.

b) Para encontrar el rango intercuartlico:


Ordenamos las observaciones en orden creciente: 0, 1, 2, 3, 6, 8, 10
y previamente encontramos los cuartiles uno y tres:
Cuartil uno: calculamos la posicin

n +1 7 +1
=
= 2 entonces,
4
4

en la muestra ordenada, la observacin que ocupa la posicin 2 es

Q1 = x(2 ) = 1 .
Cuartil tres: calculamos la posicin

3(n + 1) 3(7 + 1)
=
= 6 en4
4

tonces, en la muestra ordenada, la observacin que ocupa la posicin 6 es

Q3 = x(6) = 8 .

Luego,
Rango intercuartlico = Q3

Q1 = 8 1 = 7 .

Es decir, 7 es la diferencia entre el mayor y el menor nmero de


dientes con caries del 50% de la parte central de la muestra, a dife-

144

03_cap3.p65

144

31/03/2006, 02:35 p.m.

rencia del rango que nos indica que 1 es la diferencia entre el mayor
y el menor nmero de dientes con caries del 100% de la muestra.
c) Rango semiintercuartlico =

Q3 Q1 8 1 7
= =3,5. Esta
=
2
2
2

medida de dispersin nos indica que tanto el valor del cuartil uno
como el valor del cuartil tres de la variable nmero de dientes con
caries en el grupo de 7 alumnos, distan de la mediana en promedio
en 3,5 dientes con caries.
Cada una de las medidas que se han presentado hasta el momento proporcionan informacin parcial de la dispersin de la
muestra. Una medida que describe la dispersin de todos los valores que conforman la muestra, es la varianza.

Varianza
Es una medida de dispersin y se define como la media o promedio
de los cuadrados de las diferencias de cada valor de la variable con
respecto a la media aritmtica, cuya expresin matemtica es:

(x
n

S =
2

i =1

donde

n 1

X =

x
i =1

(3.18)

Una frmula alternativa es la siguiente:


n

S2 =

x
i =1

2
i

nX

(3.19)

n 1

Cabe indicar que la varianza tambin se puede expresar como:

(x
n

S2 =

i =1

(3.20)

145

03_cap3.p65

145

31/03/2006, 02:35 p.m.

Cuando el tamao de muestra es grande, las frmulas (3.18) y


(3.20) proporcionan resultados similares.
La varianza es una buena medida de la dispersin absoluta
de un conjunto de datos. Sin embargo, tiene un problema, puesto
que se consideran los cuadrados de las diferencias, y no las diferencias mismas, el resultado no se encuentra en la misma escala
que los datos originales. Por ejemplo, si los datos se refieren a estaturas de un grupo de estudiantes, en centmetros, entonces tenemos la medida de dispersin varianza, en centmetros cuadrados,
y la media aritmtica en centmetros. Este problema se resuelve
definiendo la desviacin estndar.

Desviacin estndar
Es la raz cuadrada de la varianza, y se expresa mediante la frmula:

(
n

S=

i =1

xi X

donde

n 1

X =

x
i =1

(3.21)

Tanto la varianza como la desviacin estndar miden la dispersin de todos los valores de la muestra con respecto a la media
de la misma. Para efectos de interpretacin, la desviacin estndar
es la ms apropiada.

Ejemplo 29
Los siguientes datos representan las edades de seis nios en aos
cumplidos:
1, 3, 3, 0, 4, 1. La media aritmtica es X = 2 aos. Obtendremos la varianza.

Solucin
Los clculos auxiliares para el clculo de la varianza se muestran
en la siguiente tabla:

146

03_cap3.p65

146

31/03/2006, 02:35 p.m.

Edades
0
1
1
3
3
4

Edad - Media
0-2=-2
1-2=-1
1-2=-1
3-2=1
3-2=1
4-2=2

(Edad- Media)
4
1
1
1
1
4

(x
n

Total

i =1

=12

Luego, el valor de la varianza es:

S2 =

1 n
xi X
n 1 i =1

12
= 2, 4 aos 2 .
5

Desviacin estndar

S=

2, 4 aos 2 = 1, 5 aos .

La variabilidad media de las edades de los nios respecto a la


media aritmtica es de 1,5 aos.
Si resolvemos el mismo problema usando el SPSS, se tienen los
siguientes resultados:
N
Mean
Std. Deviation
Variante

Valid

6
2,00
1,549
2,400

Para obtener la varianza a partir de una distribucin de frecuencias, se consideran los siguientes casos:

Datos sin agrupar en intervalos de clase y presentados en


tablas de frecuencias
Para datos sin agrupar en intervalos de clase, la frmula de la
varianza (3.18) se expresa como:

147

03_cap3.p65

147

31/03/2006, 02:35 p.m.

(x
k

S =
2

i =1

fi
(3.22)

n 1

donde
k

X =

i =1

fi
,

k es el nmero de valores diferentes que toma la variable,


fi es la frecuencia absoluta asociada al i-simo valor diferente que
toma la variable y la desviacin estndar (3.21) es:

(x X )
k

S=

i =1

fi
donde

n 1

X =

x f

i i

i =1

(3.23)

Otra expresin de la varianza es la siguiente:


k

S2 =

x
i =1

f n

2
i i

n 1

donde X =

x f

i i

i =1

(3.24)

Ejemplo 30
Los alumnos del doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM matriculados en el semestre acadmico 2000-I y que ingresaron a la universidad entre 1997 y 1999. El estudio se llev a cabo entre abril y
junio de 2000. Como el nmero total de estudiantes que cursaban
las diversas maestras era alrededor de 2 500, despus de grandes
debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la Maestra en Gestin
Educativa. A continuacin se presentan los datos para la variable
nmero de hijos de los 30 maestristas. Encontraremos la varianza
y desviacin estndar del nmero de hijos.

148

03_cap3.p65

148

31/03/2006, 02:35 p.m.

Solucin
Usaremos la expresin (3.24). Los datos y los clculos auxiliares se
presentan en la siguiente tabla:

xi

fi

xi

xi fi

11

11

11

44

16

48

25

75

Total

30

178

Reemplazando en la expresin (3.24) se encuentra:


k

S2 =

x
i =1

f nX 2 178 30 ( 2 )2
2
=
=2 hijos

30
1
n 1

2
i i

S = 2 hijos 2

= 1, 41 hijos

La variabilidad media del nmero de hijos respecto a la media


aritmtica es de 1,4 hijos.

Datos agrupados en intervalos de clase y presentados en


una tabla de frecuencias
Para datos agrupados en intervalos de clase, la frmula de la
varianza (3.18) se expresa como sigue:

(x X )
k

S2 =

'
i

fi

(3.25)

i =1

n 1
donde,
k es el nmero de intervalos de clase
xi' es la marca de clase del i-simo intervalo
fi es la frecuencia absoluta asociada al i-simo intervalo
Otra expresin de la varianza para datos agrupados con
intervalos de clase es la siguiente:

149

03_cap3.p65

149

31/03/2006, 02:35 p.m.

S =
2

x
i =1

f nX

'2
i
i

X =

donde

n 1

'2
i

i =1

fi
(3.26)

y la desviacin estndar es:

S = S 2 en cualquiera de los dos casos.

Ejemplo 31
Los alumnos del doctorado en Educacin matriculados en el semestre 2000, en el marco del curso de Estadstica Aplicada a la
Investigacin, realizaron una investigacin con el objetivo de establecer el perfil de los estudiantes de maestra de la UNMSM matriculados en el semestre acadmico 2000-I y que ingresaron a la universidad entre los aos 1997 y 1999. El estudio se llev a cabo entre
abril y junio de 2000. Como el nmero total de estudiantes que cursaban las diversas maestras era alrededor de 2 500, despus de
grandes debates, los alumnos del doctorado en Educacin decidieron seleccionar una muestra de 30 estudiantes de la maestra en
Gestin Educativa. A continuacin se presentan los datos para la
variable edad de los estudiantes. Obtengamos la varianza y la desviacin estndar.
Solucin
Se resumen los pasos para la obtencin de la varianza y los clculos
se presentan en el siguiente cuadro:
'

Se calculan las marcas de clase xi ,


se genera una columna con los productos de cada marca
'

de clase por su correspondiente frecuencia xi f i ,


la columna anterior (los resultados obtenidos en cada caso)
se vuelve a multiplicar por la correspondiente marca de cla2

se, resultando xi' f i ,

150

03_cap3.p65

150

31/03/2006, 02:35 p.m.

[Li 1i

'

fi

xi fi

xi f i

27,5
36,5
45,5
54,5
63,5

6
12
8
2
2
30

165,0
438,0
364,0
109,0
127,0
1203,0

4537,5
15987,0
16562,0
5940,5
8064,5
51091,5

, Li )

[23 - 32)
[32 - 41)
[41 - 50)
[50 - 59)
[59 - 68]
Total

'2

xi

Edades

'

Se encuentra que:
k

x 'i2 fi = 51091,5
i =1

X =

x f

'
i i

i =1

= 1203 n = 30

1 n '
1203
= 40,1 aos
xi f i =

30
n i =1

y reemplazando en (3.26) el valor de la varianza es:

51091,5 30 (40,1)
2
= 98,31 aos
S =
29
2

y el valor de la desviacin estndar es:

S = 98,31 = 9,92 aos.


La dispersin media de las edades de los estudiantes respecto
a la media es de 10 aos.

Propiedades de la varianza
Propiedad 1. La varianza debe ser siempre un valor no negativo

S2 0 .
En

la

(x X )

S =
2

i =1

n 1

0 y fi 0, entonces xi X

(x
k

i =1

expresin

que

(x X )
k

fi
,

como

fi 0, de ah

0 , por tanto S 2 siempre es no negativo.

151

03_cap3.p65

151

31/03/2006, 02:35 p.m.

Propiedad 2. La varianza de una constante es igual a cero. Esto es,

V (C ) = 0 , donde C es cualquier constante (Convenimos que


S 2 = V (.) ).
Supongamos que las observaciones xi = C para i , entonces

X = C y xi X

= 0 , pues las observaciones toman un nico valor,

por lo tanto V( C )=0 .


Propiedad 3. La varianza de una variable mas una constante es
igual a la varianza de la variable. Esto es, si yi = xi + C , i =1,,n
entonces V (Y ) = V ( X + C ) = V ( X ) .

Ejemplo 32
El director del colegio Guadalupe esta preocupado porque durante el ao acadmico 2004, algunos alumnos han faltado frecuentemente a clases. Con la finalidad de verificar su percepcin solicita
al director acadmico que tome una muestra de 20 estudiantes que
en el ao 2004 cursaron el cuarto ao de secundaria y obtenga
para dichos estudiantes:
a) La varianza de la variable X , nmero de inasistencias de
los alumnos del cuarto ao en el mes de noviembre.
b) Si en el mes de diciembre cada uno de los 20 estudiantes
faltaron a clases 2 das ms que en noviembre, cunto ser
la varianza de la variable Y , nmero de insistencias de
los estudiantes de cuarto ao durante el mes de diciembre?
Los datos de la muestra son:
Nmero de inasistencias 1
en el mes de noviembre

fi

Solucin
a) Usando la expresin (3.24), el valor de la varianza para la variable X , nmero de inasistencias de los alumnos del cuarto ao en
el mes de noviembre es:

S2 =

602-20(5)2
= 5, 37 , sabiendo que
19

X = 5, 2 .

152

03_cap3.p65

152

31/03/2006, 02:35 p.m.

b) Si a cada observacin del mes de noviembre le sumamos la


constante C = 2 inasistencias del mes de diciembre, obtendremos

yi = 2 + xi , i = 1,,5. Para calcular la varianza de la variable Y ,


nmero de inasistencias durante el mes de diciembre, aplicamos
la propiedad V

(Y ) = V ( X + C ) = V ( X ) y se tiene:

V ( Y )= V ( X

+ 2 ) = V ( X ) = 5,37 . Vemos que la varianza

de la variable Y , es igual a la varianza de la variable X .


Propiedad 4. La varianza de una constante por una variable, es
igual al producto de la constante al cuadrado por la varianza de la
variable. Esto es, si yi = Cxi , i =1,,n entonces
V (Y ) = V (CX ) = C 2V ( X ) .

Ejemplo 33
Con los mismos datos del problema anterior aplicaremos la propiedad 4.
Solucin
Ya se encontr que el valor de la media aritmtica es

X = 5 y el

valor de la varianza es S = 5 , 3 7 .
Supongamos que el nmero de inasistencias de cada alumno
2

se duplica, esto es,

yi = 2 xi .

Entonces la constante es C=2 y, aplicando la propiedad, se


tiene que, V (Y ) = C

V ( X ) = 2 2 (5, 37) = 21, 48. Vemos en este

caso que la varianza s sufri un cambio al haber multiplicado por


una constante a todas las observaciones.
Propiedad 5. Dados dos conjuntos de datos de tamaos, medias y
varianzas respectivas:

n1 , n2 ; X 1 , X 2 ; S12 , S 22 y si se desea cal-

cular la varianza global de las dos muestras se aplica la siguiente


frmula:

153

03_cap3.p65

153

31/03/2006, 02:35 p.m.

X1 X
S 2 ( n ) + S 22 ( n 2 )
S = 1 1
+
n1 + n 2
2

( n1 ) + X

(n2 )

n1 + n 2

donde:

S 12 ( n 1 ) + S 22 ( n 2 )
el primer trmino:
representa la varian1 + n 2
bilidad dentro de cada muestra y se le denomina intravarianza;
el segundo trmino:

donde X =

(X

( n1 ) + X

(n2 )

n1 + n 2

X 1n1 + X 2 n2
, representa la variabilidad entre las
n1 + n2

dos muestras y se le denomina intervarianza. Por tanto la varianza


global de las dos muestras es,

S 2 = intravarianza + intervarianza
Esta propiedad se puede generalizar para ms de dos muestras.

Ejemplo 34
En el colegio San Carlos, en un concurso de lgebra, tres alumnos
por cada seccin de quinto ao de secundaria obtuvieron las calificaciones siguientes:
Seccin A: 7, 9,11

X1 = 9

Seccin B: 11,14,17

X 2 = 14

S12 = 2,7
S22 = 6,0

Encontraremos la varianza global de las calificaciones de los


6 alumnos, aplicando la propiedad 5.

Solucin
Sea la muestra 1 la seccin A y la muestra 2 la seccin B, entonces
se tiene:

154

03_cap3.p65

154

31/03/2006, 02:35 p.m.

Muestra 1:

n1 =

Muestra 2:

n2 =

X1 = 9

S12 = 2,7

X 2 = 14

S22 = 6,0

El valor de la intravarianza es:

2, 7(3) + 6(3) 8,1 + 18


S12 (n 1 ) + S 22 (n 2 )
=
=
= 4,35
3+3
6
n1 + n2
El valor de la media global es:

X global =

n1 X 1 + n2 X 2 3(9) + 3(14) 27 + 42 69
=
=
=
= 11,5
3+3
6
6
n1 + n2

El valor de la intervarianza es:

(X

) (n ) + ( X
2

) (n )
2

n1 + n2

(9 11,5)2 3 + (14 11,5) 2 3


= 6, 25
3+3
Finalmente, el valor de la varianza global es:

S 2 = intravarianza + intervarianza = 4,35 +6,25 = 10,6


Ejemplo 35
Con los datos presentados en el ejemplo 32 aplicaremos la propiedad 5.
Solucin
Al dividir la muestra total en las siguientes dos submuestras, se
obtiene:
Muestra 1:

xi
1
3
6
Total

fi
3
4
8
15

xi fi
1 x 3= 3
3 x 4= 12
6 x 8= 48
63

155

03_cap3.p65

155

31/03/2006, 02:35 p.m.

Muestra 2:

xi

fi

7
8
Total

xi fi

3
2
5

7 x 3=21
8 x 2=16
37

Para la muestra 1 se tiene:


63
=4,2
15

X1 =

n1=15

(x X )
3

fi

(1 4, 2)2 3 + (3 4, 2)2 4 + (6 4, 2)2 8


= 4,16
15
n
Para la muestra 2 se tiene:

S12 =

i =1

X2 =

n2 =5

37
= 7, 4
5

(x X )
2

S =
2
2

i =1

fi

(7 7, 4) 2 3 + (8 7, 4) 2 2
= 0, 24
5

El valor de la intravarianza es:

4,16(15) + 0, 24(5)
S12 ( n 1 ) + S22 ( n 2 )
=
= 3,18
15 + 5
n1 + n2
El valor de la media global es:

X global =

n1 X 1 + n2 X 2 15(4, 2) + 5(7, 4) 63 + 37 100


=
=
=
=5
15 + 5
20
20
n1 + n2

El valor de la intervarianza es:

(X

(n1 ) + X 2 X
n1 + n2

) (n )
2

(4, 2 5) 215 + (7, 4 5) 2 5


= 1,92
15 + 5

Finalmente, el valor de la varianza global es:

S 2 = intravarianza + intervarianza = 3,18 +1,92 = 5,1. Este


resultado coincide con el valor de la varianza encontrado en el
ejemplo 32.

156

03_cap3.p65

156

31/03/2006, 02:35 p.m.

Relacin entre la desviacin estndar y la proporcin de las


observaciones en una distribucin de frecuencia
Teorema de Chebyshev
Para cualquier conjunto de observaciones (poblacin o muestra) y
cualquier constante k mayor o igual que 1, la proporcin de las
observaciones que se encuentran dentro de k desviaciones estndar
de ambos lados de la media es de por lo menos

1
k2

(3.27)

En otras palabras, el teorema nos dice que en el intervalo se


encuentra al menos 1

1
k2

1
(1 2 )% del total de las observak

ciones.
As, si k = 2, como mnimo 1

1 3
= = 0, 75 , o 75% de los
22 4

valores de cualquier conjunto de datos se encuentra dentro de las


dos desviaciones estndar de ambos lados de la media.
Si k = 3, por lo menos 1

1 8
= = 0,889 , 88,9% de los valo32 9

res de cualquier conjunto de datos se encuentra dentro de las tres


desviaciones estndar de ambos lados de la media.

Ejemplo 36
Si la media y varianza de un conjunto de n=30 observaciones son

X = 50 y

S 2 = 4 . Describiremos la distribucin usando el

Teorema de Chebyshev.

Solucin
La distribucin del conjunto de observaciones est centrada alrededor de X = 50 con una desviacin estndar
El teorema establece que:

S = 2.

157

03_cap3.p65

157

31/03/2006, 02:35 p.m.

Al menos 3/4 o el 75% central de las observaciones se encuentran en el intervalo ( X 2 S ) = (50 2(2), 50 + 2(2)) = (46,54) .
Al menos 8/9 88,9% central de las observaciones se encuentran en el intervalo ( X 3S ) = (50 3(2), 50 + 3(2)) = (44,56) .
El teorema se aplica a cualquier distribucin. En muchos casos, la proporcin de las observaciones que caen en el intervalo
especificado excede a 1

1
, no olvidemos la expresin al mek2

nos en el enunciado del teorema.

Ejemplo 37
Si todos los solicitantes interesados en trabajar para un programa
de asistencia social, en un examen de aptitud obtienen una calificacin media de 75 puntos con una desviacin estndar de 6 puntos qu porcentaje de los solicitantes, como mnimo, debe tener un
promedio en el examen de aptitud entre 57 y 93 puntos?
Solucin:
Como datos tenemos que X = 75 y S = 6 . Puesto que k desviaciones estndar, k(6) es equivalente a la magnitud 93-75 = 7557=18, entonces k

18
= 3 . De acuerdo con el teorema de
6

Chebyshev, la fraccin mnima de solicitantes que cumplen con


tener un promedio entre 57 y 93 es 1

1
1 8
1 2 = 88,9%.
2 =
3
9
k

Si la distribucin de frecuencias se asemeja grficamente a


una forma de campana, como en la siguiente figura:

-3s -2s -1s 0 +1s +2s +3s

158

03_cap3.p65

158

31/03/2006, 02:35 p.m.

en este caso, se le suele llamar curva normal y la relacin entre


la desviacin estndar ( S ) y la proporcin de observaciones es:
Lmites dentro de los cules
se ubican las observaciones

Entre
Entre
Entre
Entre
Entre
Entre
Entre
Entre
Entre

1S
2S
3S
X
X
X
X
X
X

Porcentaje
de observaciones

y + 1S
y + 2S
y + 3S
y + 1S
y 1S
y + 2S
y 2S
y + 3S
y 3S

68,2
95,4
99,8
34,1
34,1
47,7
47,7
49,9
49,9

a esta relacin se conoce como la regla emprica, porque supuestamente los porcentajes de observaciones establecidos se observan en la prctica.

Ejemplo 38
Un club deportivo tiene como propsito planear las actividades recreativas. La distribucin de frecuencias de las edades tiene forma
acampanada (normal), con media y desviacin estndar iguales a
27 aos y 8 aos respectivamente, como se muestran en la tabla y el
grfico que se presentan. Se desea conocer cual es el porcentaje de
socios cuyas edades oscilan entre 11 y 43 aos.

Li 1 Li

xi

[5-9)
[9-13)
[13-17)
[17-21)
[21-25)
[25-29)
[29-33)
[33-37)
[37-41)
[41-45)
[45-49]

7
11
15
19
23
27
31
35
39
43
47

'

Frecuencia
2
3
7
12
15
23
16
12
7
2
1

159

03_cap3.p65

159

31/03/2006, 02:35 p.m.

Solucin
La distribucin de la variable edad tiene forma normal, como tambin se puede observar en el grfico de la figura anterior,
con X = 27 aos y S = 8 aos . El problema consiste en encontrar el valor de k.
Si k S

= k(8) y la proporcin de edades debe oscilar

entre 11 y 43, entonces X + k (8) =43 y X k (8) = 11, luego

k (8) = 4327=2711=16 y por tanto k = 2 y el porcentaje de


personas cuyas edades oscilan entre 11 y 43 es el 95,4% como
establece la relacin.
Para compronbar que la relacin terica se cumple en la
prctca, observamos la tabla de distribucin de frecuencias, y contamos las observaciones comprendidas desde la edad 11 hasta 43
aos se tiene:
En el intervalo [9-13) la amplitud es igual 4 y tiene 3 observaciones. Pero necesitamos contar las frecuencias exactamente desde
11; entonces, tenemos que entre 11 y 13 hay una amplitud de 2 y le
corresponde una frecuencia de

2(3)
= 1,5 que se aproxima a 2.
4

Asimismo, en el intervalo [41-45) la amplitud es igual a 4 y su


frecuencia es 2, entonces desde 41 hasta 43 la amplitud es 2 y su
frecuencia igual a

2(2)
=1.
4

Ahora ya tenemos las frecuencias que estn comprendidas en


el intervalo 11 y 43 aos y sumando tenemos: 2+7+12+15+23+
16+12+7+1=95. La proporcin, entonces, es

95
= 0, 95 o, en por100

160

03_cap3.p65

160

31/03/2006, 02:35 p.m.

centaje, 95%. Note que el porcentaje observado es una aproximacin


aceptable del porcentaje especificado por la regla emprica.

Puntajes Estandarizados
Los valores originales xi de un conjunto de datos tambin se pueden expresar en puntajes estandarizados zi , donde el puntaje estandarizado es la distancia a la que se encuentra el valor xi , por
arriba o por debajo de la media, medida en unidades de la desviacin estndar, es decir:

zi =

xi X
S

(3.28)

Este puntaje estandarizado determina la posicin de una observacin dada, en relacin a la media y en unidades de la desviacin estndar.
Si el valor de zi es negativo, indica que la observacin queda
debajo (a la izquierda) de la media; un valor de zi positivo indica
que la observacin queda arriba (a la derecha) de la media.

Ejemplo 39
Tenemos los siguientes datos, correspondientes al peso y altura de
tres estudiantes universitarias:
Estudiante
Mara
Ana
Rosa
Media aritmtica
Desviacin Estndar

Peso (Kg)
X
80
65
60

Altura (cm)
Y
175
160
172

X = 70 Kg
S x =10 Kg

Y = 164 cm
S y = 6 cm

Para el caso de las tres estudiantes, encontramos los puntajes


estandarizados zi .

Solucin
Encontramos los respectivos valores estandarizados z para la
variable X, as tenemos:

161

03_cap3.p65

161

31/03/2006, 02:35 p.m.

Mara:

z1 =

x1 X 80 70
=
= +1 desviaciones estndar
10
S

Ana:

z2 =

x2 X 65 70
=
= 0,5 desviaciones estndar
S
10

Rosa:

z3 =

x3 X 60 70
=
= 1 desviaciones estndar.
S
10

Los resultados se resumen en la siguiente tabla:


Estudiante

Peso (Kg)
X
80
65
60

Mara
Ana
Rosa

Puntaje estandarizado
+1 desviacin estndar
-0,5 desviaciones estndar
-1 desviaciones estndar

De igual manera se obtienen los valores

zi para los valores

observados de la variable Y
Estudiante

Altura (cm)
Y
175
160
172

Mara
Ana
Rosa

Puntaje estandarizado
+1,83 desviacin estndar
0,67 desviacin estndar
+1,33 desviacin estndar

Como se puede distinguir en las tablas anteriores, la unidad


de medida que tenga cada variable no importa, sus valores z se
miden en desviaciones estndar, luego pueden ser comparables.
As podemos decir, respecto a la variable peso, que Mara se encuentra a una desviacin estndar por arriba de la media, mientras que Rosa se encuentra a una desviacin estndar por debajo
de la media. Respecto a la variable altura, Mara se encuentra a
1,83 desviaciones estndar por arriba de la media, mientras que
Rosa se encuentra a 1,33 desviaciones estndar, tambin arriba de
la media.

Ejemplo 40
Los siguientes datos corresponden a las calificaciones de un grupo de estudiantes en el curso de Estadstica. La media es 34,6 y la
desviacin estndar 9,6. Supngase que Pedro tiene una califica-

162

03_cap3.p65

162

31/03/2006, 02:35 p.m.

cin de 48. Cul ser la ubicacin de Pedro en el grupo respecto a


su nota?

Solucin
Encontraremos la nota estandarizada de Pedro, reemplazando su
calificacin en la frmula (3.28):

z =

48 34, 6
= 1, 4 . Luego, la nota de Pedro se ubica a 1,4
9, 6

desviaciones estndar por arriba de la media aritmtica.

Ejemplo 41
Dos alumnos rindieron exmenes en los cursos de razonamiento
matemtico y razonamiento verbal, y sus calificaciones y medidas
importantes se presentan a continuacin.
Individuo

Calificaciones originales
Razonamiento Razonamiento
matemtico, X verbal, Y

Manuel

x1

=25

y1

=75

Juan

x2

=32

y2

=70

Medidas

Cursos
Razonamiento Razonamiento
matemtico
verbal

Media

=20,9

= 61,3

Sy

= 15,2

Aritmtica

Sx = 8

Desviacin
estndar

a) En cul de los dos cursos Manuel obtuvo un mejor rendimiento?


b) En cul de los dos cursos Juan obtuvo un mejor rendimiento?
c) Quin de los dos alumnos y en cul de los dos cursos obtuvo
una mejor ubicacin?

Solucin
Para responder las preguntas planteadas debemos estandarizar
las calificaciones originales, las mismas que se presentan a continuacin.

163

03_cap3.p65

163

31/03/2006, 02:35 p.m.

Individuo

Calificaciones originales
Razonamiento
Razonamiento
matemtico,X
verbal,Y

Manuel

x1

=25

Juan

x2

=32

y1
y2

Puntajes estandarizados
Razonamiento
Razonamiento
matemtico
verbal

=75

z1 =

75 61,3
25 20, 9
= 0, 90
= 0, 51 w1 =
15, 2
8

=70

z2 =

70 61,3
32 20,9
= 0, 57
= 1,39 w2 =
15, 2
8

a) Manuel obtuvo mejor rendimiento en el curso de razonamiento


verbal, puesto que el valor w1 = 0,90 es mayor que z1 = 0,51.
b) Juan obtuvo mejor rendimiento en el curso de razonamiento matemtico, puesto que el valor z2 = 1,39 es mayor que w2 = 0,57.
c) Juan obtuvo la mejor ubicacin en el curso de razonamiento matemtico, puesto que el valor z2 = 1,39 es el mayor de todos los
puntajes estandarizados, esto es, la nota de Juan est a 1,39 desviaciones estndar por arriba de la media.

Coeficiente de variacin
El coeficiente de variacin CV se define como:

CV =

S
X

(3.28)

donde: X es la media aritmtica y

S , la desviacin estndar

Tambin se expresa en porcentajes:

CV =

S
(100%)
X

(3.29)

Mide la dispersin de los datos con respecto a la media. Frecuentemente se usa para comparar la variabilidad de dos o ms
conjuntos de datos que estn expresados en diferentes unidades.
El grupo de datos con mayor coeficiente de variacin, es el que
tiene mayor dispersin. Si las medias aritmticas de los dos grupos
son iguales y expresados en las mismas unidades, entonces el grupo que tenga mayor desviacin estndar ser el de mayor dispersin o variacin.

164

03_cap3.p65

164

31/03/2006, 02:35 p.m.

Ejemplo 42
El curso de Estadstica se dict a dos grupos de estudiantes. El
grupo 2 realiz el curso con el auxilio del software SPSS y las calificaciones fueron de 0 a 200; mientras que el grupo 1 lo realiz con
la metodologa tradicional y las calificaciones fueron de 0 a 100.
Grupo 1: 10 20 30 40 50
Grupo 2: 60 85 110 135 160
En cul de los dos grupos la dispersin es mayor?
Solucin
En el siguiente cuadro se muestra que las desviaciones estndar
son 15,81 y 39,53 respectivamente; sin embargo, no se puede decir
que en el segundo grupo existe mayor dispersin que en el primero, puesto que las calificaciones estn en diferentes escalas, por lo
que usaremos el coeficiente de variacin.
Media
Desviacin estndar
Coeficiente de variacin

Datos 1
30,0000
15,81139
0,527

Datos 2
110,0000
39,52847
0,359

El coeficiente de variacin para el primer grupo es CV1=0,527


(52,7%) y, para el segundo grupo, CV2=0,359(35,9%), indicando
que en el primer grupo existe mayor dispersin relativa que en el
segundo.

Ejemplo 43
Obtendremos los coeficientes de variacin para la variable nmero
de hijos del ejemplo 30 y para la variable edad del ejemplo 31.
Variable
Edad
Nmero de hijos

Media aritmtica
40,1
2

Desviacin estndar
9,91
1,41

Solucin
a) Para el nmero de hijos de los estudiantes, el coeficiente de variacin toma el valor:

CV =

1, 41
= 0, 705 (70,5%) .
2

165

03_cap3.p65

165

31/03/2006, 02:35 p.m.

b) Para la edad de los estudiantes, el coeficiente de variacin toma


el valor: CV =

9,91
= 0, 2471 (24, 71%) por lo que la variable
40,1

nmero de hijos es relativamente ms dispersa que la variable


edad.

Ejemplo 44
En un colegio de educacin especial fue de inters del Director
evaluar la conducta de sus estudiantes a travs de las siguientes
variables: conducta de aislamiento ( X ), cuantificada mediante el
tiempo que el estudiante permanece aislado en un periodo de 2
horas; nmero de participacin en clase ( Y ); realizacin de tarea
(Z), medida mediante el porcentaje del tiempo que los nios permanecan haciendo las tareas.
Observ una muestra de 20 estudiantes, de quienes se presenta la media y la desviacin estndar de las variables evaluadas. Es
nuestro inters usar dichos resultados para evaluar la variabilidad de las mismas.
Medidas de
posicin y
dispersin

Variables

Conducta de
aislamiento
Media

=56 minutos

Participacin en
clase

=7,58

Realizacin de
tareas

=78,35%

Sz

=19,35%

participaciones
Desviacin

Sx

=4,76 minutos

estndar

S y =2,66
participaciones

Solucin
Observamos que las tres variables estn expresadas en diferentes
unidades de medida; por tanto, es pertinente hacer uso del coeficiente de variacin como medida de dispersin para analizar la
variabilidad de las tres variables.

166

03_cap3.p65

166

31/03/2006, 02:35 p.m.

Medidas de
dispersin

Conducta de
aislamiento

Participacin en
clase

Realizacin de
tareas

Coeficiente de

CVx

CV y

CVz

=8,5%

=35,09%

=24,7%

variacin

La variable con menor dispersin relativa o menor coeficiente


de variacin es la conducta de aislamiento, indicando una menor
heterogeneidad que las variables nmero de participaciones en
clase y realizacin de tareas.

Ejemplo 45
Con la base de DATOS1-maestra obtenemos la varianza y la desviacin estndar para los coeficientes de inteligencia usando los
comandos del SPSS.
Solucin
Se abre la base de DATOS1-maestra y usamos los comandos del
captulo VII (procedimientos estadsticos).
Los resultados que proporciona el SPSS para la variable coeficiente de inteligencia son:
Coeficiente de
Inteligencia

N
70

Range
27

Mean
101,79

Std. Deviation
6,282

Variante
39,464
2

Media aritmtica, 101,79 puntos, varianza, 39,46 puntos , desviacin estndar, 6,28 puntos y el valor del coeficiente de variacin
es:

CV =

6, 282
(100%) = 6,17%.
101, 79

Ejemplo 46
Con la base de DATOS3-educacin y para las variables: tiempo de
servicio de los docentes, edad de los docentes y rendimiento promedio de los docentes en el programa de capacitacin, encontramos el rango, la varianza, la desviacin estndar y el coeficiente de
variacin, usando los comandos del SPSS.

167

03_cap3.p65

167

31/03/2006, 02:35 p.m.

Solucin:
Se abre la base de DATOS3-educacin y se usan los comandos del captulo VII (procedimientos estadsticos) y se obtiene la siguiente salida:

N
Mean (media aritmtica)
Std. Deviation (desviacin
estndar)
Variance (varianza)
Range (rango)
5,2505

Edad de los
Participantes
47
34,78
2,264
5,126
9

Tiempo de
servicio
47
13,97
2,080
4,326

Notas
promedio
47
11,536788
1,3462899
1,812
8

Podemos decir que la media aritmtica del tiempo de servicio


es de 13,97 aos; la varianza es 4,326 aos2; la desviacin estndar,
2,08 aos y el valor del coeficiente de variacin es :

CV =

2, 08
(100%) = 14,89% .
13,97

Si calculamos el coeficiente de variacin para las otras variables, se tiene que el CV para la variable edad de los participantes es
igual a 6,5%; y el CV para la variable notas promedio es igual al
11,67%. Luego, la variable edad de los participantes tiene los valores ms homogneos respecto a la media, por tener menor CV que
las otras variables, a pesar de tener la mayor desviacin estndar.

Medidas de forma: Asimetra o sesgo y curtosis o


apuntamiento
Asimetra
Adems de las medidas de posicin y dispersin, es posible obtener otras medidas respecto al grado de asimetra de la distribucin
de frecuencias, porque estas medidas constituyen una de las caractersticas de importancia de los datos. En la prctica casi nunca
se encuentran polgonos o histogramas perfectamente simtricos,
por lo que el grado en el cual la distribucin no es simtrica constituye su sesgo.
La asimetra de las distribuciones unimodales se mide con el
sesgo de Pearson y se define como la diferencia entre la media y la
moda. Si la diferencia es positiva, decimos que la asimetra es posi-

168

03_cap3.p65

168

31/03/2006, 02:35 p.m.

tiva y grficamente la curva presenta la cola ms larga a la derecha; si la diferencia es cero la curva es simtrica; si la diferencia es
negativa decimos que la asimetra es negativa y grficamente la
curva presenta la cola ms larga a la izquierda, como se muestra en
las siguientes figuras:

Mo < Me < X

Mo = Me = X

X < Me < Mo

Asimetra positiva

Simtrica

Asimetra negativa

La medida obtenida depende de las unidades que en cada


caso se usen, por lo que, para comparar la asimetra de dos o ms
curvas, es necesario estandarizar los sesgos, obtenindose la siguiente frmula:
Primer coeficiente de asimetra

a1 =

X Mo
S

(3.30)

Este coeficiente de asimetra se compara con el valor cero, que


corresponde a la distribucin normal

(a1 = 0) . As, si tenemos:

a1 > 0 la asimetra de la distribucin de frecuencias es positiva,


a1 < 0 la asimetra de la distribucin de frecuencias es negativa,
a1 = 0 la distribucin de frecuencias es simtrica.
En distribuciones que no son muy asimtricas se cumple la
siguiente relacin emprica

moda = X 3 ( media-mediana ) .

(3.31)

Usando esta relacin, el sesgo de Pearson se aproxima con la


siguiente frmula:
Segundo coeficiente de asimetra = a2 =

3 ( X Me )

(3.32)
S
Este coeficiente de asimetra se compara con el valor cero, que
corresponde a la distribucin normal (a2 = 0) . As, si tenemos:
169

03_cap3.p65

169

31/03/2006, 02:35 p.m.

a2 > 0 la asimetra de la distribucin de frecuencias es positiva,


a2 < 0 la asimetra de la distribucin de frecuencias es negativa,
a2 = 0 la distribucin de frecuencias es simtrica.

(x X )
=

Coeficiente de asimetra de tercer orden = a3

/n

S
Este coeficiente de asimetra se compara con el valor cero, que
corresponde a la distribucin normal ( a3 = 0) . As, si tenemos:

a3 > 0 la asimetra de la distribucin de frecuencias es positiva,


a3 < 0 la asimetra de la distribucin de frecuencias es negativa,
a3 = 0 la distribucin de frecuencias es simtrica.
Ejemplo 47
Para la variable edad de los estudiantes de maestra del ejemplo 4,
se obtuvieron los valores de las siguientes medidas: media=40,1;
mediana=38,75; moda=37,4 y desviacin estndar=9,915. Obtendremos el coeficiente de asimetra.
Solucin
3 ( X Me )
Segundo Coeficiente de Asimetra= a2 =
=
S

3 ( 40,1 38, 75 )
= 0, 4085 , por lo tanto la distribucin de las edades
9,915

es moderadamente asimtrica positiva.

Curtosis
El coeficiente de curtosis de un conjunto de datos unimodal, es una
medida de apuntamiento o aplastamiento de un polgono de frecuencias.
Si la curva de frecuencias es muy en punta, las observaciones
estn concentradas al centro y se denomina leptocrtica y, si es
muy plana, recibe el nombre de platicrtica. Curvas con apuntamiento medio reciben el nombre de mesocrticas.
Pearson tuvo el mrito de formalizar el concepto de curtosis,
proponiendo el coeficiente de curtosis de cuarto orden, a4 :
n

a4 =

(x

X)

i =1

3,

(3.33)

170

03_cap3.p65

170

31/03/2006, 02:35 p.m.

donde S es la desviacin estndar de los datos.


ste es un coeficiente sin dimensin. En distribuciones norn

males,

(x

X)

i =1

vale aproximadamente 3, resultando

a4 =0. Por ello, si

a4 > 0 la distribucin de frecuencias es leptocrtica,


a4 < 0 la distribucin de frecuencias es platicrtica,
a4 = 0 la distribucin de frecuencias es mesocrtica.
Otro coeficiente para medir curtosis, en funcin de los
percentiles, es el coeficiente de curtosis percentlico k:

1
(Q3 Q1 )
2
0, 263
k=
P90 P10
donde

(Q3

(3.34)

Q1 ) es el rango intercuartlico y P90 P10

es el rango interpercentlico. En distribuciones normales,

1
(Q3 Q1 )
2
vale aproximadamente 0,263, resultando k = 0 .
P90 P10
Por ello, si:

k > 0 la distribucin de frecuencias es leptocrtica,


k < 0 la distribucin de frecuencias es platicrtica,
k = 0 la distribucin de frecuencias es mesocrtica.

171

03_cap3.p65

171

31/03/2006, 02:35 p.m.

En la siguiente figura, obtenida usando comandos del


MATLAB, podemos apreciar las tres formas de distribucin de
acuerdo al coeficiente de curtosis:

Ejemplo 48
Las siguientes medidas corresponden a las edades de un grupo de
100 estudiantes universitarios.
Medidas
Media=26,7
Mediana=27
Moda=27
Desviacin estndar=8,11
Cuartil uno=23
Cuartil tres=31
Percentil diez=15
Percentil noventa=38,6

Para saber qu forma tiene la distribucin, calcularemos los


coeficientes de asimetra y curtosis.

172

03_cap3.p65

172

31/03/2006, 02:35 p.m.

Solucin

a2 =

3 ( X Me )
S

3 ( 26, 68 27 )
8,11

= 0,118

La distribucin tiene una ligera asimetra negativa, pero se


podra decir que es casi simtrica.
1
1
(31 23)
( P75 P25 )
2
k=
0, 263 = 2
0, 263 = 0, 2 0, 263 = 0, 063
P90 P10
38, 6 15

Los valores obtenidos nos indican que la distribucin tiene


una forma casi mesocrtica, es decir, el montculo de la distribucin no es muy achatado ni muy apuntado.

Ejemplo 49
Con la base de DATOS1-maestra y usando los comandos del SPSS
obtenemos los coeficientes de sesgo y curtosis.
Solucin
Se abre la base de DATOS1-maestra y usando los comandos del
SPSS del captulo VII (procedimientos estadsticos) se tiene:
Coeficiente de
inteligencia
N

Valid
Missing
1,301
1,558

Skewness
Kurtosis

70
0

El coeficiente de asimetra (sesgo) toma el valor 1,3, indicando


que los datos tienen sesgo positivo, mientras que el valor 1,56 para
la curtosis, nos indica que estamos frente a una distribucin
leptocrtica.

173

03_cap3.p65

173

31/03/2006, 02:35 p.m.

Medidas de posicin y dispersin resistentes


Generalmente, la informacin contenida en un conjunto de datos
segn el enfoque clsico se sintetiza en forma de medidas de posicin, dispersin y de forma. De manera similar, en el anlisis
exploratorio de datos (AED) existen medidas de posicin y dispersin basados en estadsticas de orden. La eleccin de estas medidas
obedece principalmente al efecto de resistencia que adquieren con la
aplicacin de tales procedimientos y a la facilidad de clculo.

Estadsticas de orden
Dado los valores de una variable, x1 ,..., xn el procedimiento de
ordenamiento consiste en organizar los datos de acuerdo con su
valor. El resultado es un conjunto de datos ordenados y denotado
por x(1) ,..., x( n ) donde:

x(1) = el ms pequeo de ( x1 ,..., xn )


x(2) = el segundo ms pequeo de ( x1 ,..., xn )
x( n ) = el ms grande de ( x1 ,..., xn )
El conjunto x(1) ,..., x( n ) se denomina estadsticas de orden de
los valores de la variable x1 ,..., xn .
Uno de los usos de las estadsticas de orden es el clculo de la
profundidad del dato y profundidad de lnea en el diagrama de

174

03_cap3.p65

174

31/03/2006, 02:35 p.m.

tallo y hojas estudiados en el captulo II. Las profundidades se


usan en el clculo de las medidas de posicin.

Medidas de posicin resistentes


Se basan en las estadsticas de orden. Podemos citar: mediana,
cuartos, octavos, etc., y reciben el nombre de valores literales por
representarse mediante letras del alfabeto. Otra medida de posicin es la trimedia.
La mediana
Es una medida de posicin resistente, la encontramos usando la
siguiente expresin:

si n es impar

Mediana =

x n +1

o
Mediana =
Mediana =

x n + x n

+1
2

y tiene profundidad

si n es par

n +1
.
2

Ejemplo 50
Dos investigadores realizaron una prueba que mide la ansiedad
en estudiantes antes de aplicarse un examen de conocimientos
generales, obtenindose los siguientes resultados: 26,7 17,8 22,4
30,1 21,0 22,6 29,3 24,2 20,6 24,3.
Solucin
Para encontrar la mediana, primero ordenamos los datos en forma
ascendente, esto es:

x(1) =17,8 x(2) =20,6 x(3) =21,0 x(4) =22,4 x(5) =22,6 x(6) =24,2
x(7 ) =24,3 x(8 ) =26,7 x(9) =29,3 x(10) =30,1. El nmero de observa-

175

03_cap3.p65

175

31/03/2006, 02:35 p.m.

ciones es par, n=10 y la profundidad de la mediana es

x n + x n
luego, Mediana =

2 +1

10 + 1
= 5, 5
2

x(5) + x(6) 22, 6 + 24, 2


=23,4.
2
2

Este resultado indica que, de los 10 estudiantes, un 50% tiene menos de 23,4 puntuaciones de ansiedad y otro 50% tiene mas de
23,4 puntuaciones de ansiedad.
En el caso de ser n un nmero impar, por ejemplo que la muestra anterior tenga solamente 9 observaciones: x(1) =17,8

x(2) =20,6

x(3) =21,0 x(4) =22,4 x(5) =22,6 x(6 ) =24,2 x(7 ) =24,3 x(8) =26,7

x(9) =29,3, la profundidad de la mediana es

9 +1
= 5 ; entonces
2

Mediana = x(5) =22,6. Este resultado nos dice que un 50% de los
estudiantes tiene menos de 22,6 puntuaciones de ansiedad y el
otro 50% tiene ms de 22,6 puntuaciones de ansiedad.

Los extremos
Son el valor ms pequeo y el ms grande del conjunto de observaciones. Cada uno de ellos tiene profundidad 1.
As, en el ejemplo anterior sobre los estudios de ansiedad, los
extremos son: 17,8 y 30,1.
Los cuartos
Son dos estadsticas de posicin, el cuarto inferior y el cuarto
superior.
Se definen como los valores que tienen, como profundidad, el
entero de la profundidad de la mediana, mas uno, dividido entre
dos.
Profundidad del cuarto =

[Profundidad de la mediana ] + 1
2

176

03_cap3.p65

176

31/03/2006, 02:35 p.m.

Ejemplo 51
Para los datos del ejemplo anterior, ordenados en forma ascendente se tiene: 17,8 20,6 21,0 22,4 22,6 24,2 24,3 26,7 29,3 30,1.
Encontraremos los cuartos.
Solucin
Encontramos la profundidad del cuarto,
Profundidad del cuarto =

[Profundidad de la mediana ] + 1 [5,5 ] + 1


2

5 +1
=3; entonces, en los datos ordenados observamos la profundi2

dad de izquierda a derecha y la observacin con profundidad tres


es el cuarto inferior y es x(3) = 21,0, y al mismo tiempo vemos la
profundidad de derecha a izquierda, as la observacin con profundidad tres es el cuarto superior y es x(3) = 26,7.
A estos cinco nmeros resumen: Mediana, Extremos y Cuartos se denominan Valores Literales y son las medidas resumen
fundamentales del AED.

Ejemplo 52
Los siguientes datos corresponden al nmero de llamadas de emergencia realizadas en 19 das consecutivos a una compaa de servicio de ambulancia. Encontrar las medidas de posicin resistentes.
38 37 44 28 34 30 56 44 49 36 38 40 41 39 40 29 43 31

Solucin:
Ordenando las observaciones de menor a mayor, tenemos:

(i )
x( i )

1 2

3 4

7 8

9 10 11 12 13 14 15 16 17 18 19

28 29 30 31 31 34 36 37 38 38 39 40 40 41 43 44 44 49 56

Profundidad 1 2 3 4 5 6 7 8 9 10 9 8 7 6 5 4 3 2 1

Para encontrar la mediana, como n=19 la profundidad es,


Profundidad de Mediana=

19 +1
= 10 y Mediana= x(10) = 38
2

177

03_cap3.p65

177

31/03/2006, 02:35 p.m.

Para encontrar los cuartos calculamos su profundidad,


Profundidad

del

[10] + 1 = 10 + 1 = 5,5
2

Cuarto inferior =

cuarto

[Profundidad de la mediana ] + 1
2

luego los cuartos son:

x(5) + x(6) 31 + 34
= 32,5
2
2

Cuarto superior =

x(5) + x(6)
2

Los Extremos: x(1) = 28

41 + 43
= 42
2

x( n ) = 56

Este resultado nos indica que un 50% de los das, el nmero de


llamadas de emergencia fue igual o menos de 38, y en el otro 50%
fue ms de 38 llamadas, siendo el menor nmero de llamadas 28, y
el mayor, 56. Adems, un 25% de los das el nmero de llamadas
fue de menos de 32,5, un 50% fue ms de 32,5 y menos de 42 y otro
25% de los das el nmero de llamadas fue ms de 42.

Los octavos
Se utilizan cuando el conjunto de datos es grande.
Se determina por:
Profundidad del Octavo =

[Pr ofundidad del cuarto] + 1

2
Cada octavo est ubicado a la mitad entre los cuartos y los
extremos correspondientes.
Para el ejemplo anterior se tiene:
Profundidad del Octavo =

[Pr ofundidad del cuarto ] + 1 [5,5] + 1 = 3


2

Luego el octavo inferior es x(3) = 30 y el octavo superior

x(3) = 44 .

178

03_cap3.p65

178

31/03/2006, 02:35 p.m.

Podemos generalizar la obtencin de un valor literal


mediante la siguiente frmula:

Profundidad del valor literal =

[Pr ofundidad del valor literal anterior ] + 1


2

Medidas de dispersin resistente


El anlisis exploratorio considera las siguientes medidas de dispersin:
Desviacin absoluta de la mediana
Se define como:
DAM = Mediana

xi Mediana

Ejemplo 53
Para los siguientes datos hipotticos, 105, 98, 80, 90, 95, encontraremos la DAM.
Solucin
Los datos propuestos, los ordenamos de forma creciente, obtenemos las desviaciones con respecto a la mediana y luego ordenamos estas desviaciones, como se muestra en la siguiente tabla:

xi

x(i )

105
98
95
80
90

80
90
95
98
105

Desviacin =
15
5
0
3
10

xi 95

Desviacin (i )
0
3
5
10
15

En la segunda columna de la tabla anterior, se encuentra el


valor de la mediana igual a 95 y, en la cuarta columna la desviacin mediana, DAM=5.
Queda para el lector encontrar el DAM para la variable nmero de llamadas de emergencia del ejemplo 52.

179

03_cap3.p65

179

31/03/2006, 02:35 p.m.

Dispersin Cuarta
Esta medida resistente se define como la diferencia entre el cuarto
superior y el cuarto inferior; esto es:
Dispersin cuarta = (cuarto superior) (cuarto inferior)
Este ndice proporciona la dispersin del 50% central de los
datos y se la denota por
superior y

dC = Cs Ci donde Cs denota al cuarto

Ci denota al cuarto inferior.

Ejemplo 54
Para los datos del nmero de llamadas de emergencia para servicio de ambulancia, presentados en el ejemplo 52, calculamos la
dispersin cuarta.
Solucin
Tenemos calculado:

Ci = 32,5 y Cs = 42 y reemplazando tenemos:


dC = Cs Ci = 42 - 32,5 = 9,5.
Notacin y representacin de las medidas resumen
Las medidas resumen se representan en una tabla denominada
diagrama de valores literales o como cuadro resumen de 5, 7, 9
valores literales.
Las letras que se utilizan en el cuadro resumen son:
n = tamao de la muestra, Me = Mediana C = Cuartos O =Octavos y, para los extremos, E .
El formato del cuadro resumen es como sigue:
n
Me profundidad de la mediana
C
profundidad del cuarto
O profundidad del octavo
E
1

Mediana
Cuarto inferior
Cuarto superior
Octavo inferior
Octavo superior
Extremo inferior Extremo superior

180

03_cap3.p65

180

31/03/2006, 02:35 p.m.

A continuacin, se presentan el cuadro resumen de 7 valores


literales respecto al nmero de llamadas de emergencia a una
compaa de servicio de ambulancia, obtenidas en los ejemplos
anteriores.
n
Me
C
O
E

19
10
5,5
3
1

38
32,5
30
28

42
44
56

Datos discordantes en una muestra (outliers)


Un dato discordante es una observacin o algunas observaciones
que se desvan de manera notoria respecto a las dems observaciones del conjunto de datos.
Por ejemplo, si tenemos el siguiente conjunto de datos: 0, 2, 4,
3, 1, 5, 2, 6, 20,15, se puede sospechar que los datos discordantes
son 15 y 20.
La identificacin o sospecha de datos discordantes es un paso
fundamental en el anlisis de datos.
Una regla para identificar datos discordantes en un conjunto
de datos es la siguiente: Cualquier valor del conjunto de datos que
sea mayor que Cs + 1,5 dC o menor que Ci - 1,5 dC se considera
un dato discordante.
Donde Cs + 1,5 dC es denominado corte superior y
Ci - 1,5 dC denominado corte inferior.
Grfico de caja
Son grficos muy tiles en la comparacin de varios conjuntos de
datos porque representan resmenes sobre las medidas de posicin, dispersin, simetra y datos discordantes.
Para hacer este grfico se traza una recta numrica donde se
ubican los valores del cuarto inferior, mediana y cuarto superior
sobre los cuales se trazan segmentos perpendicualres de la misma
longitud. Uniendo los extremos de estos segmentos mediante lneas paralelas a la recta numrica se obtiene la caja que representa
al 50% central de los datos. La dispersin cuarta es el ancho de la
caja. Los segmentos fuera de la caja se llaman bigotes y llega en el
extremo superior hasta el valor inmediatamente inferior al corte

181

03_cap3.p65

181

31/03/2006, 02:35 p.m.

superior y en el extremo inferior hasta el valor inmediatamente


superior al corte inferior del conjunto de datos.
Cuando se presentan casos discordantes (outlier) en el grfico, se sealan con crculos pequeos o asteriscos.
Respecto al 50% central de los datos si la mediana se ubica al
centro de la caja decimos que la distribucin de frecuencias es simtrica. Si la mediana est prxima al lmite inferior de la caja
podemos decir que la distribucin tiene asimetra positiva y si est
prxima al lmite superior tiene asimetra negativa.
La longitud de la caja nos da una idea de la variabilidad de las
observaciones.
En la siguiente figura se muestra el grfico de caja:

Co rte
In ferior

Co rte
Superior

Bigote

* disco rda nte


D ato

Bigote
Ci

Me

Cs

Ejemplo 55
Los siguientes datos corresponden al nmero de libros revisados
por 22 estudiantes de ltimo ao de Filosofa, durante el ao acadmico 2003. Encontraremos los valores literales representndolos luego en el grfico de caja haciendo uso del SPSS
62 88 75 66 52 73 35 65 147 76 40 51 69 68 72 48 82 54 79 42 50 38

Solucin
Mediana y los cuartos:
a) Ordenando la muestra, se tiene:
35 38 40 42 48 50 51 52 54 62 65 66 68 69 72 73 75 76 79 82 88 147

b) Profundidad de la mediana:

n + 1 22 + 1
65 + 66
=
= 11,5; entonces Mediana =
= 65,5
2
2
2

182

03_cap3.p65

182

31/03/2006, 02:35 p.m.

c) Profundidad del Cuarto =

[11,5]

+1

= 6 ; entonces

Cuarto inferior = x(6) = 50 y Cuarto superior = x(6) = 75


d) Cortes:

Ci 1, 5 d C = 50-1,5 (75-50)= 12,5


Cs + 1,5 d C =75+1,5 (75-50) = 112,5
e) Usando los comandos del SPSS encontramos el siguiente
diagrama de caja:

22

25

50

75

10 0

12 5

15 0

N m ero de libr os r ev isad os

Segn el grfico el 50% central de los datos correspondientes a


la variable nmero de libros revisados por los estudiantes se distribuye de forma asimtrica positiva. Asimismo, el 100% de las observaciones se distribuye de forma asimtrica positiva.
Podemos observar que el corte inferior es 12,5 y el menor valor
observado de la variable es 38, por tanto 38 es el extremo inferior
del bigote. As tambin, el corte superior es 112,5 y el mayor valor
observado ms cercano a l, es 88, por tanto 88 es el extremo superior del bigote. Se observa la existencia de un dato discordante y es
la observacin 22 con el valor 147.

183

03_cap3.p65

183

31/03/2006, 02:35 p.m.

Ejemplo 56
El director del colegio mixto Juan Bautista, en el ao 2003, solicit
al tutor del quinto ao de secundaria, presentar un informe acadmico del primer bimestre del ao. Le sugiri que incluya un grfico
comparativo como el grfico de caja para las calificaciones en ingls, de los estudiantes que se encuentran bajo su tutora, segn
sexo. Las calificaciones son como sigue:
Femenino
Masculino

6
3

7
4

12
5

16
7

17
6

20
11

15
10

13
9

12
12

Solucin
Usando los comandos del SPPS del captulo VII (procedimientos
estadsticos) obtenemos el siguiente grfico de caja para las calificaciones en ingls de los estudiantes segn sexo.

M asc ulino

Fe m enin o

10
califica ci n en in gl s

15

20

184

03_cap3.p65

184

31/03/2006, 02:35 p.m.

El tutor informar que la mediana de las calificaciones en ingls de las alumnas es superior a la mediana de las calificaciones
en ingls de los alumnos y que la forma de la distribucin de frecuencias de las calificaciones en ingls del 100% de los estudiantes varones es aproximadamente asimtrica positiva, mientras que
la forma de la distribucin de frecuencias de las calificaciones en
ingls en las mujeres es aproximadamente simtrica. Adems en
ambas distribuciones no hay presencia de datos discordantes.

Ejercicios
1. En un examen de seleccin se aplic una prueba con 50 preguntas a 52 estudiantes. Se obtuvieron las puntuaciones siguientes:
49 48 46 46 45 44 43 43 41 41 39 39 38 37 37 36 35 35
34 33 33 31 31 31 31 31 30 30 30 29 29 28 27 27 27 27
26 26 26 24 24 23 23 22 21 20 20 20 15 18 16 19

a) Obtenga la media aritmtica, la mediana y la moda. Interprete los resultados.


b) Cul de las tres medidas de tendencia central obtenidas en
el paso previo representa mejor al conjunto de datos?
c) Obtenga el percentil 25 y el percentil 75. Interprete los resultados.
2. Una importadora de libros se dedica a la venta de libros de cuatro
editoriales. Durante el ao 2000 el total de ventas y el margen de
utilidad por editorial fueron los siguientes:
Editoriales Ventas(miles unidades)
Aguilar
214
Pirmide
90
Trbol
183
Santa Cruz
75

Margen de utilidad %
12,6
5,8
9,3
4,6

Calcular:
a) La media aritmtica del margen de utilidad obtenida en el
2000.
b) La media ponderada del margen de utilidad para ese mismo ao.
c) Cul de las dos medias es la ms representativa? Por qu?

185

03_cap3.p65

185

31/03/2006, 02:35 p.m.

3. Los datos de la siguiente tabla son las puntuaciones de una prueba de relaciones espaciales a dos grupos de adolescentes.
Intervalos de
puntuaciones
[ 4- 8)
[ 8-12)
[12-16)
[16-20)
[20-24)
[24-28)
[28-32)
[32-36)

Grupo A Grupo B
1
0
0
2
4
6
8
10

1
2
2
3
3
4
4
6

Intervalos de Grupo A
puntuaciones
[36-40)
18
[40-44)
20
[44-48)
38
[48-52)
36
[52-56)
18
[56-60)
12
[60-64]
2

Grupo B
10
8
5
4
2
0
1

a) Calcular media aritmtica, mediana y moda para cada grupo


de adolescentes.
b) Cul es la medida de tendencia central que mejor representa a cada una de las distribuciones? Por qu?
c) Calcular el percentil 10 y percentil 90. Interpretar en cada
caso.
d) Calcular el coeficiente de asimetra y curtosis.
4. Una profesora tiene dos secciones del mismo grado en diferentes
colegios, en los cuales imparte las mismas materias, les aplica el
mismo examen y obtiene las siguientes calificaciones:
Seccin A:

50 50 50 50 50 50 65 65 65 70 70 75
80 85 85 85 100 100 100 100 100 100 80

Seccin B: 100 85 85 80 80 80 76 76 76 76 75 75 75
75 75 75 74 74 74 74 70 70 70 65 65 50

Repetir las preguntas a), b), c) del ejercicio 1.


5. Los datos siguientes corresponden al estudio de 20 casos de estudiantes del quinto ao de secundaria, que presentaban lesin
de tipo vesicular, la cual generalmente tiene repercusin al nivel
de la cavidad bucal.
Se presentan los datos de: edad, sexo, raza, lugar de la lesin en
la cavidad bucal (lengua, paladar, piso de boca, mucosa yugal,
labios, encas), lesin extraoral (lugar de la lesin fuera de la
cavidad bucal), duracin de la lesin.

186

03_cap3.p65

186

31/03/2006, 02:35 p.m.

Individuo Edad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

20
25
40
38
27
22
20
26
34
35
39
40
38
36
28
25
22
20
24
35

Sexo Raza
0
1
0
0
1
1
0
0
0
0
1
1
1
1
0
1
0
0
1
0

cauc.
cauc.
cauc.
cauc.
cauc.
negro
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.
cauc.

Lesin cav.
bucal
0
0
3
1
2
1
1
3
3
4
5
5
2
1
0
2
2
3
1
4

Lesin
extraoral
1
1
1
1
0
0
1
1
0
1
1
0
0
0
1
1
0
0
1
1

Duracin de
lesin en das
4
2
2
0
1
3
4
0
0
1
2
1
2
4
3
2
0
1
4
3

Claves: Sexo: 0 M=0. F=1 Lesin en la cavidad bucal: lengua=0, paladar=1,


piso de la boca=2, mucosa yugal=3, labios=4, encas =5. Lesin extraoral:
zonas cutneas=0, mucosas=1.

a) Para cada una de las variables, calcular la medida de posicin que corresponda: media aritmtica, mediana, moda. Interpretar en cada caso.
b) Hallar las medidas de dispersin: Rango, Varianza, Desviacin estndar, Coeficiente de variacin, Interpretar los resultados.
6. En el centro educativo Virgen de Ftima informan que Pedro ocupa el lugar 9 en su clase; no sabemos mucho de su posicin
relativa en la clase, ya que esta depender del nmero de alumnos. Si los alumnos son 250, cul es su percentil?
7. Los demgrafos estudian las poblaciones de varios estados, comunidades y pases. Un asunto de inters es el crecimiento o
disminucin en el tamao de una poblacin, la cual es afectada
por la rapidez de los nacimientos, cunto tiempo viven (longevidad) y a qu edades comnmente mueren. Una variable es la
edad de muerte. Suponga que en la nacin A, la edad modal de

187

03_cap3.p65

187

31/03/2006, 02:35 p.m.

muerte es 55, la mediana 60 y la media 65. En la nacin B, la


media tambin es 65, la moda es 75 y la mediana 70.
a) A partir de esta informacin, construya las curvas de frecuencia para cada nacin.
b) Qu nacin parece mejor en trminos de longevidad?
8. Las siguientes son las edades medias de pacientes con adiccin a
sustancias en un centro de tratamiento local, clasificados de
acuerdo con el tipo de adiccin primaria. Calcule la edad media
de todos los pacientes con adiccin a sustancias en el centro
Adicin primaria
Cocana
Edad media (aos)

Herona

Alcohol

(n=44)

(n=24)

(n=69)

29,8

34,6

42,9

9. El peso medio de los 45 jugadores de un equipo de ftbol americano es de 215 libras. Si ninguno de los jugadores pesa menos de
170 libras, cuntos de ellos como mximo pueden pesar 250
libras o ms?
10. De 10 familias con Internet, cable y auto se obtuvo la siguiente
informacin relativa al mes de marzo:
Distribucin de costos de servicio de Internet
Costo (soles)
N de Familias
[120 - 130)
1
[130 - 140)
2
[140 - 150)
3
[150 - 160)
3
[160 - 170]
1
Costo promedio de mantenimiento del auto es S/.300,00
Costo de cable (soles): 65, 130, 65, 65, 65, 65, 130,130, 65,130

Calcular el costo total promedio por familia, de los tres servicios considerados.
11. a) Para los ejercicios 3 y 4, calcular la varianza, desviacin estndar
y el coeficiente de variacin para cada grupo. En cada caso compare las respuestas y comente los resultados. b) Para el ejercicio 3
calcular la media y varianza global de las puntuaciones de los
dos grupos de estudiantes.

188

03_cap3.p65

188

31/03/2006, 02:35 p.m.

12. Un trabajador social obtuvo las siguientes caractersticas demogrficas y de servicio social de 15 miembros de un asilo:
Edad

74
81
83
77
76
79
79

Visitas al
mdico en el
ltimo ao
8
7
11
4
5
13
7

Gastos de mantenimiento
en el asilo (soles)
2
2
1
1
2
1
2

347
434
636
963
358
968
683

Sexo

M
M
F
M
F
F
M

a) Comparando las tres variables cuantitativas cul de ellas


presenta menor variabilidad?
b) Teniendo en cuenta el sexo, en cul de los grupos el nmero de visitas es relativamente menos variable?
13. En el centro educativo Santa Rosa, la talla media de 300 alumnas es 1,72 m, con una desviacin estndar de 0,8 y, en el centro
educativo Santa Teresa, las 300 alumnas tienen una talla media
de 1,69 m y desviacin estndar 0,07. Calcular la media y la
desviacin estndar de la muestra formada por el conjunto de
los dos centros educativos.
14. En una muestra de 50 alumnos universitarios se obtuvo el tiempo transcurrido (en meses) desde la aparicin de una enfermedad hasta recurrir al especialista, y los datos se muestran en la
siguiente tabla:
2
4
3
32
9

9
2
6
4
2

1 4 19 4 7
9 7 18 1
16 4 0 8
7 3 6 3
8 2 13 1

14
8
1 24
0
4
4
8
18
5

1
5
11
18
26

0
12
23
6
1

a) Examine los datos y cuente el nmero de observaciones que


caen en los intervalos X S , X 2 S , X 3S .
b) Coinciden las proporciones de las observaciones que caen
en estos intervalos con el teorema de Chebyshev? Con la
relacin suponiendo que la distribucin es normal?

189

03_cap3.p65

189

31/03/2006, 02:35 p.m.

c) Cul de los criterios anteriores ser el indicado para describir estos datos?
15. El cociente de inteligencia expresa la inteligencia como la razn
de la edad mental a la edad cronolgica multiplicada por 100.
As, el coeficiente de inteligencia es 100, cuando la edad mental
es igual a la edad cronolgica. Para los siguientes coeficientes de
inteligencia:
100 103 99 101 100 120 109 82
101 112 95 118 118 89 114 113
92 137 130 94 87 93 111 96
93 98 101 96 84 86 89 90

a) Construya un histograma de frecuencias relativas.


b) Encuentre el nmero de observaciones en los intervalos
X S , X 2 S , X 3S .
c) Compare las proporciones de observaciones en estos intervalos indicados en (b), con las que se obtendran por el teorema de Chebyshev.
16. Un maestro aplic la misma prueba de Estadstica a dos secciones de un mismo grado. Los resultados fueron los siguientes:
Mediana
Media
Percentil 25
Percentil 75
Desviacin Estndar

Seccin A
64,6
65,0
61,0
69,0
6,0

Seccin B
64,3
63,2
54,0
70,0
10,5

a) Calcular el rango semiintercuartlico. Interprete el resultado.


b) En cul de las dos secciones los resultados fueron ms homogneos?
c) Calcular el coeficiente de asimetra y curtosis. Indicar la forma de la distribucin.
d) Qu puede concluir usted acerca del desempeo de las dos
secciones?
e) Calcular la media y varianza global para las dos secciones.
17. En un concurso de matemticas se aplic una prueba a 2 500
estudiantes de sexto grado, resultando una calificacin media

190

03_cap3.p65

190

31/03/2006, 02:35 p.m.

de 11 puntos y una desviacin estndar de 2,0 puntos. Teniendo


en cuenta estos resultados, a cuntas desviaciones estndar
por arriba o por debajo de la media se coloca a los alumnos siguientes de acuerdo con su puntaje?
Pedro 09, Enrique 12, Jorge 07, Alberto 11, Juan 06, scar 17.
18. Si la distribucin en el ejercicio anterior es normal, a qu porcentaje del grupo sobrepas cada uno de los alumnos arriba
mencionados?
19. En la clase de ingls impartida a los estudiantes de la escuela de
Literatura se aplic una prueba de comprensin de lectura y los
puntajes obtenidos por los estudiantes fueron los siguientes:
46 48 64 76 78 54 39 80 48 60 64 59 62 57 57 61 63 68 72 64 57 59 65 68
67 71 72 75 94 86 41 68 67 61 69 76 65 66 27 68 67 61

a) Encontrar los extremos, la mediana, los cuartos e interpretarlos.


b) Encontrar la dispersin cuarta e interpretarla.
c) Determinar los cortes y estudiar si existen datos
discordantes.
d) Construir un grfico de caja, describir sus elementos e interpretar.
20. A un grupo de estudiantes universitarios se les aplic una prueba de habilidad mental y se obtuvieron las puntuaciones siguientes:
71 64 58 54 50 34 70 63 57 54 50 30 69 61 56 53 49 69 60
55 52 47 69 59 54 52 40 64 58 54 52 40 64 58 54 51 39

a) Encontrar los extremos, la mediana, los cuartos e interpretarlos.


b) Encontrar la dispersin cuarta e interpretarla.
c) Determinar los cortes y estudiar si existen datos
discordantes.
d) Construir un grfico de caja, describir sus elementos e interpretar.

191

03_cap3.p65

191

31/03/2006, 02:35 p.m.

21. El gerente de una tienda de ropa realiza un estudio de mercadotecnia y, como primera etapa, desea conocer la distribucin de
edades de sus clientes. Durante una semana se toma una muestra
de 30 mujeres y 30 hombres, resultando las siguientes edades:
Mujeres
31 39 37 24 32 27 27 26 33
26 29 38 44 35 37 26 32 37
35 19 55 36 40 23 27 27 22
28 25 29

Hombres
24 28 33 30 29 31 27 29 31
31 26 34 24 32 39 40 33 30
32 31 34 28 35 27 30 35 38
37 45 36

a) Calcular los extremos, mediana, cuartos, octavos. Interprete.


b) Trazar grficas de caja para la edad de los hombres y las
mujeres. Describir sus componentes e interpretar.
c) Verifique si existen datos discordantes.
22. Con los datos del ejercicio 3:
a) Calcular los extremos, mediana, cuartos, octavos. Interprete.
b) Trazar grficas de caja para las puntuaciones de los grupos de adolescentes A y B respectivamente. Describir sus
componentes e interpretar.
c) Verifique si existen datos discordantes.

192

03_cap3.p65

192

31/03/2006, 02:35 p.m.

También podría gustarte