Está en la página 1de 23

Docente:Ms.

Selene Yengle Del Castillo


Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
1

CAPITULO III
MEDIDAS DE RESUMEN

INTRODUCCIN. Son valores numricos que sirven para caracterizar un conjunto de datos; es decir, que nos
permiten describir el comportamiento de los datos. Se clasifican en medidas de Tendencia Central, medidas de
posicin, medidas de Dispersin y medidas de Forma.

3.1. MEDIDAS DE TENDENCIA CENTRAL. Son medidas de resumen que nos indican alrededor de qu valor se
agrupan o concentran los datos. Son medidas de Tendencia Central o Centralidad: la Media Aritmtica,
la Mediana, la Moda, la Media Geomtrica.

3.1.1. Media Aritmtica. Conocida tambin como promedio o simplemente media, se define como el
cociente de la suma de los datos y el tamao de la muestra. Sean los datos
n
X X X X ,..., , ,
3 2 1
la
media aritmtica se denota con X y se define como:

n
X X X X
X
n
+ + + +
=
...
3 2 1

o, utilizando el signo de suma:
Media muestral:
n
X
X
n
i
i
=
=
1
, Frmula para datos no agrupados o sin tabular (1)
Donde: n= Numero total de datos o tamao de la muestra.
Media poblacional:
N
X
N
i
i
=
=
1


, donde N=tamao de la poblacin

Calcule la media de los siguientes conjuntos de datos:

A: 13, 17, 20, 10, 12, 18

B : 11.8, 13.6, 14.2, 16.5, 12.5, 18.5, 14.6, 15.4

Dados los siguientes datos: 20, 24, 22, 25, 28, 20, 20, 20, 22, 22, 20, 24, 25, 28, 20, 24, su media
aritmtica es:


16
24 20 28 25 24 20 22 22 20 20 20 28 25 22 24 20 + + + + + + + + + + + + + + +
= X
16
28 28 25 25 24 24 24 22 22 22 20 20 20 20 20 20 + + + + + + + + + + + + + + +
= X
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
2

16
) 2 ( 28 ) 2 ( 25 ) 3 ( 24 ) 3 ( 22 ) 6 ( 20 + + + +
= X (2)
75 . 22
16
364
16
56 50 72 66 120
= =
+ + + +
= X
El numerador de (2) se puede disponer en una tabla como:
X
i
f
i
Xifi

20 6 120
22 3 66
24 3 72
25 2 50
28 2 56
Total 16 364
Puede utilizarse cuando los datos se repiten la frmula:

n
f X
X
k
i
i i
=
=
1
Frmula para Datos Agrupados o tambin llamados tabulados (3)
La frmula (3) tambin puede utilizarse cuando los datos estn agrupados en una distribucin de
frecuencias, siendo los X
i
los puntos medios de los intervalos.

Dada la distribucin de frecuencias:
Intervalos f
i
X
i
f
i
Xifi
10-16 7 13 7 91
16-22 13 19 13 247
22-28 15 25 15 375
28-34 10 31 10 310
34-40 5 37 5 185
50 50 1208
Aplicando la frmula (3)
16 . 24
50
1208
= = X
Calcule la media aritmtica de:
(a) X
i
f
i
(b) Intervalos f
i

12 4 7-13 7
13 6 13-19 13
14 7 19-25 15
15 13 25-31 10
16 10 31-37 5
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
3

Casos Prcticos:
1) Se tiene la informacin correspondiente a un grupo de 45 anuncios publicitarios luminosos
respecto al peso en Kg de stos, la suma de los 45 datos no tabulados es 147776 Kg. Entonces el
peso promedio de los anuncios publicitarios luminosos es de:
. 91 . 3283
45
147776
Kg X = =
Interpretacin: El peso promedio de los anuncios publicitarios luminosos es de 3283.91 Kg.

2) Los pesos de sei s ami gos son: 84, 91, 72, 68, 87 y 78 kg. Hal l ar el peso
medi o.

Interpretacin: El peso medio de los amigos en estudio es de 80 Kg.
3) El profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10
alumnos de la clase. Las notas de los alumnos son:
3,2 3,1 2,4 4,0 3,5
3,0 3,5 3,8 4,2 4,0
Cul es el promedio de notas de los alumnos de la clase?
SOLUCIN
Aplicando la frmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los
alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este
caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es
sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica
comparada con las dems, que estn ubicadas entre 3,0 y 4,2.
PROPIEDADES:
1. La media aritmtica es el centro de gravedad o punto de equilibrio de un conjunto de
observaciones.
2. Para un conjunto de observaciones la media es nica.
3. Si un valor se modifica entonces la media cambia de valor.
4. Si la media sustituye a cada observacin, la suma total no cambia.
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero.
( ) 0
1 1
= = =

= =
X n X n X n X X X
n
i
i
n
i
i

Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
4

6. La suma de los cuadros de las desviaciones de las observaciones con respecto a la media es mnima:
( ) ( ) R c ,
1
2
2
1
e s

= =
donde c X X X
n
i
i
n
i
i

7. Si a cada observacin se le suma algebraicamente una constante, la media queda sumada
algebraicamente en esa constante. (ver tabla)
c X Y + =

8. Si a cada observacin se le multiplica por una constante, la media queda multiplicada por la
constante. (ver tabla)
9. Si W
i
= aX
i
+b; entonces ) (Ver tabla . b X a W + =
Tabla (propiedades 7,8 y 9)
Propiedad 7 Propiedad 8 Propiedad 9
X Y = X + c Z = d X W = a X +b
X
1
Y
1
= x
1
+ c z
1
= d

x
1
W
1
= a X
1
+b
X
2
Y
2
= x
2
+ c Z
2
= d

x
2
W
2
= a X
2
+b
.
.
.
.
.
.
.
.
.
.
.
.
X
n
Y
n
= x
n
+ c Z
n
= d

x
n
W
n
= a X
n
+b
X y=x+c z=d x w=ax+b
Ejemplo
Los siguientes datos corresponden a los ingresos mensuales de 4 personas: 520, 525, 518 y 523. De
ellos se obtiene X = 521.5. Suponga que a partir del siguiente mes estas personas recibirn un
aumento del 20% pero se les descontara, por el aporte a su gremio, una suma de 8 unidades
monetarias (um), Cul es el nuevo ingreso promedio de estas 4 personas?
Solucin
Sean: X = Ingreso anterior, Y = Nuevo ingreso
Y= (X + 0.2 X) 8
Y = 1.2 X 8
Entonces utilizando la propiedad 9 : Y = 1.2 X - 8 = 617.8 um
Desventaja de la media aritmtica queda fuertemente afectada por valores extremos.
Ejemplo: Los siguientes datos corresponden a los ingresos mensuales de dos grupos de personas:
Grupo Ingreso
X
A 520 525 518 523 521.5
B 520 525 518 8000 2390.75
Ntese que en el grupo A el promedio similar a los 4 valores por lo tanto los datos representan
apropiadamente mientras que en el grupo B eso no ocurre.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
5

3.1.2. Mediana

Mediana para datos no agrupados o tambin para datos agrupados sin intervalos de clase.
Calcule la mediana de los siguientes datos:
A: 5, 7, 9, 11, 13 n=5 Me=9
B: 8, 10, 11, 13, 15, 16 n=6 Me=(11+13)/2=12
C: 12, 7, 8, 10, 3, 5, 9, 15 c: 3,5,7,8,9,10,12,15 n=8 Me=(8+9)/2=8.5
La mediana es el valor que se encuentra en el centro de un conjunto ordenado de datos. As, para
obtener la mediana de un conjunto de datos, previamente debe ordenarse los datos de menor a
mayor. Luego debe determinarse el lugar que ocupa la mediana calculando
2
1 + n
. Si el nmero de
datos es impar la mediana es el dato que se encuentra en el centro y, si el nmero de datos es par,
la mediana es el promedio de los dos valores que estn en el centro.
- Calcule la mediana para los siguientes datos:
A: 8, 5, 2, 9, 12, 7, 16, 4, 10
B: 12, 10, 8, 5, 9, 11, 14, 7,15, 13
C: X
i
4 6 8 10 12 14
f
i
3 5 8 6 4 2

Mediana para datos agrupados en intervalos.
Para el clculo de la mediana se procede de la siguiente manera:
a) Se obtienen las frecuencias absolutas acumuladas (Fi)
b) Se identifica el intervalo que contiene a la mediana.
2
1 + n

El intervalo de la mediana es el intervalo que tiene como frecuencia acumulada a F
i
, la frecuencia
acumulada menor tal que F
i
>
2
1 + n

c) Se utiliza la frmula: Me =
i
i
f
F
n
A LRI
)
2
1
(
1

+
+
Donde LRI: es el lmite real inferior del intervalo mediano.
A: la amplitud del intervalo mediano.
F
i-1
: frecuencia acumulada del intervalo que antecede al intervalo mediano.
f
i :
es la frecuencia simple del intervalo mediano.


Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
6

Ejemplo:
Intervalos f
i
F
i
7-13 7 7
13-19 13 20 F
i-1

19-25 15 35 = Fi
25-31 10 45
31-37 5 50
5 . 25
2
1 50
2
1
=
+
=
+ n
busca en las frecuencias absolutas acumuladas

Como 35 es la frecuencia absoluta acumulada menor tal que 35 > 25.5, el intervalo que
contiene a la mediana es el intervalo 19-< 25. As:
LRI = 19, A = 6, F
i-1
= 20 y f
i
= 15.
La mediana es:
Me = 19 + 6
15
) 20 5 . 25 (
= 19 + 2.2
Me = 21.2 Significa que el 50% de los datos son menores que 21.2 y el otro 50% de los datos
son mayores que 21.2
Ejercicio. Calcule la mediana de los datos de la distribucin:
Intervalos f
i
3-11 5
11-19 7
19-27 8
27-35 13
35-43 17
43-51 10

3.1.3. Moda
Moda para datos no agrupados o tambin para datos agrupados sin intervalos.
Cul es la moda en los siguientes conjuntos de datos:
A : 3, 5, 7, 5, 8, 5, 2, 5 Mo=5 Distribucin unimodal
B: 5, 5, 3, 4, 7, 7, 7, 8, 5 Mo=5 y 7 Distribucin bimodal
C: 5, 3, 7, 9, 8, 1, 12, 11 No existe moda
Qu es moda?
La moda es el dato que ms se repite. Es el dato que tiene mayor frecuencia.


Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
7

Cul es la moda en la distribucin:
X
i
4 6 8 10 12 14
f
i
3 5 12 6 4 2
Mo=8 porque tiene la mayor frecuencia absoluta simple.
Moda en datos agrupados en intervalos:
Intervalos f
i
3-11 5
11-19 7
19-27 8
27-35 13=
fi-1

35-43 17=fi
43-51 10=f
i+1

Para hallar la moda se procede as:
a) Se determina el intervalo que contiene a la moda( intervalo de mayor frecuencia)
b) Se aplica la frmula:
M
o
= LRI + A ( )
2 1
1
A + A
A
donde

1 1
= A
i i
f f y
1 2 +
= A
i i
f f

siendo
i
f

la frecuencia simple del intervalo modal,
1 i
f la frecuencia simple del intervalo que
precede al modal, y
1 + i
f la frecuencia simple del intervalo que sigue al modal.
Para el ejemplo, el intervalo modal es 35 -< 43, por lo tanto la moda es :
M
o
= 35 + 8 (
7 4
4
+
) = 35 + 2.9 = 37.9

Ejercicio. Halle la moda de:
Intervalos f
i
12- 17 5
17- 22 8
22- 27 15
27- 32 22
32- 37 17
37- 42 13


Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
8

3.1.4. Media aritmtica ponderada
La media ponderada de un conjunto de observaciones X
1
. X
2
. X
3
. ... X
k
con pesos o
ponderaciones w
1
. w
2
. w
3
. ... w
k
esta dada por:
k
k k
k
i
i
k
i
i i
p
w w w
w x w x w x
w
w x
x
+ + +
+ + +
= =

=
=
...
...
2 1
2 2 1 1
1
1

La media ponderada se usa en aquellos casos en donde las observaciones no tienen la misma
importancia dentro de una poblacin o muestra.
Ejemplo
En una firma se tiene la siguiente informacin en u.m.

Cargo
Nmero de
trabajadores
(wi)
Remuneracin
diaria de c/u (xi)
Asesores 15 25
Jefes 5 45

Especialista
1 70
La remuneracin promedio por da ser:
905 . 31
21
670
1 5 15
) 1 ( 70 ) 5 ( 45 ) 15 ( 25
1
1
= =
+ +
+ +
= =

=
=
k
i
i
k
i
i i
p
w
w x
x
Ejemplo
Los siguientes datos corresponden a las observaciones de la variable nmero de focos de luz
amarilla por vivienda en una determinada urbanizacin.
Tabla de frecuencias
N de focos (xi) Frecuencia absoluta
N de viviendas (wi)
Frecuencia
relativa simple
Frecuencia
porcentual simple
1 12 0.27 27
2 16 0.35 35
3 11 0.24 24
4 3 0.07 7
5 3 0.07 7
Total 45 1.00 100

Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
9

El nmero de focos de luz amarilla promedio de las viviendas en estudio ser:
3111 . 2
45
104
3 3 11 16 12
) 3 ( 5 ) 3 ( 4 ) 11 ( 3 ) 16 ( 2 ) 12 ( 1
1
1
= =
+ + + +
+ + + +
= =

=
=
k
i
i
k
i
i i
p
w
w x
x
En este ejemplo, las frecuencias absolutas (f
1
) hacen las veces de las ponderaciones (w
1
)
Caso particular
Si
k
x x x ,..., ,
2 1
son las medias de K grupos de valores y cada grupo tiene tamao n
1,
n
2
., nk

respectivamente, entonces la media de los n = n
1,
+

n
2
+.+ n
k
, datos es:

=
=
=
k
i
i
k
i
i i
p
n
x n
x
1
1

1.2. MEDIDAS DE POSICIN
Estas medidas, llamadas tambin Cuantiles, dividen a un conjunto de datos ordenados en grupos
iguales. Entre estas medidas tenemos a los cuartiles, a los deciles y a los percentiles.

CUANTILES PARA DATOS SIN AGRUPAR:

1.2.1. CUARTILES
Son tres valores Q
1
, Q
2
y Q
3
que dividen al conjunto de datos ordenados en cuatro grupos
iguales:
_______ !_______!_______!______
25% Q
1
25% Q
2
25% Q
3
25%
El cuartil 1, Q
1
, es el valor que supera al 25% de los datos y es superado por el 75% de los datos.

Qu es el cuartil 2, Q
2
?

El cuartil 3, Q
3
, es el valor que supera al 75% de los datos y es superado por el 25% de los datos.

Calculo del cuartil Q
i
Se ordenan los datos.
Se ubica el lugar que ocupa el cuartil, calculando

i = 1, 2, 3.
El cuartil Q
i
, es el valor que ocupa el lugar

donde i = 1, 2, 3. En todo caso, realizamos una


interpolacin, para obtener el cuartil.

Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
10

Ejemplo
Datos: 13, 8, 5, 20, 25, 22, 16, 2, 10, 15, 7, 11
Q
3
=?
Datos ordenados: 2, 5, 7, 8, 10, 11, 13, 15, 16, 20, 22, 25 n=12
Lugar que ocupa el Q
3
:

= 9.75
Es un valor que est entre el dato que se encuentra en el lugar 9 y el dato que se encuentra en el
lugar 10.

= 16 + 0.75 ( 20- 16)


= 16 + 3 = 19
Significa que el 75% de los datos son menores que 19 y el 25% de los datos son mayores que 19.
1.2.2. DECILES
Son nueve valores D
1
, D
2
, , D
9
que dividen a un conjunto ordenado de datos en diez grupos
iguales. Qu significa D
2
? Qu significa D
6
?
1.2.3. PERCENTILES
Son 99 valores P
1
, P
2
, , P
99
que dividen a un conjunto ordenado de datos en 100 grupos iguales.
Qu significa P
30
? Qu significa el P
80
?
Podemos notar que el Q
2
= Me, Q
3
= P
75
, Q
1
= P
25
, P
50
= D
5
= Me

CUANTILES PARA DATOS AGRUPADOS EN INTERVALOS.
Hallando percentiles, hallamos tambin los deciles y cuartiles. Para hallar los percentiles seguimos
el procedimiento siguiente:

Para hallar el percentil P
i
1) Obtenemos las frecuencias absolutas acumuladas.
2) Identificamos el intervalo del percentil. Calculamos:


3) Aplicamos la frmula:
|
|
|
|
.
|

\
|

+ =

i
i
i
f
F
in
A LRI P
1
100

Donde LRI es el lmite inferior verdadero del intervalo del percentil
F
i-1
es la frecuencia acumulada inmediata menor que


f
i
: es frecuencia simple del intervalo del percentil
A: la amplitud del intervalo.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
11

Ejemplo: Dada la distribucin de frecuencias obtener el Percentil 40.
Intervalos f
i
F
i

20-27 8 8
28-35 12 20
36-43 15 35
44-51 20 55
52-59 17 72
60-67 9 81
68-75 3 84
Identificamos intervalo de P
40

=33.6
El intervalo del percentil 40 es 36-43
P
40
= 35.5 + 8(


P
40
= 35.5 + 7.25
P
40
= 42.75
El 40% de los datos son menores que 42.75 y el 60% de los datos son mayores que 42.75.
Calcule el decil 4.

Para el caso de encontrar los cuartiles y deciles en datos agrupados utilizamos las siguientes
formulas:
CUARTILES:
|
|
|
|
.
|

\
|

+ =

i
i
i
f
F
in
A LRI Q
1
4

DECILES:
|
|
|
|
.
|

\
|

+ =

i
i
i
f
F
in
A LRI D
1
10

1.3. MEDIDAS DE DISPERSIN

A y B son dos conjuntos de datos:
A: 121 119 122 118 118.5 121.5
B: 90.5 149.5 100 140 95.5 144.5

Calcule la media para los dos conjuntos.
En un solo segmento construya el diagrama de puntos para ambos conjuntos.

Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
12

Las medidas de dispersin miden la diseminacin, el grado de esparcimiento de los puntos. Tambin se
llaman medidas de variabilidad.. Los puntos del conjunto B tienen mayor diseminacin que los puntos
del conjunto A.

Entre las medidas de dispersin tenemos a las siguientes:
1.3.1. Rango. Llamado tambin recorrido o alcance, es la diferencia entre el dato mayor y el dato
menor:
Rango = X
mayor
- X
menor

Calcule los rangos de los conjuntos A y B.

1.3.2. Varianza.
Varianza para datos no agrupados:
Si a cada uno de los datos del conjunto A le restamos la media obtenemos las desviaciones de los
datos con respecto a su media. Estas desviaciones son:
1 -1 2 -2 -1.5 1.5

Cul es la suma de estas desviaciones?
Cules son los cuadrados de estas desviaciones?
Sume los cuadrados de las desviaciones y divida la suma por el nmero de datos menos uno.

El resultado obtenido se llama varianza de la muestra y se denota con S
2
.

5
25 . 2 25 . 2 4 4 1 1
2
+ + + + +
= S = 2.9

Calcule la varianza de los datos del conjunto B.

Las desviaciones se denotan: X X
i
. Cuntas son estas?

La frmula para la varianza de la muestra es:

1
) (
2
2

=

n
X X
S
i

Al elevar al cuadrado las diferencias y distribuyendo la sumatoria, se obtiene una frmula de
mayor uso en la prctica:

1
) (
2
2
2

=


n
n
X
X
S
i
i

Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
13

Para obtener la varianza de los datos del conjunto A:
X
i

2
i
X
121 14641
119 14161
122 14884
118 13924
118.5 14042.25
121.5 14762.25
720.0 86414.5
La varianza es:

5
6
) 720 (
5 . 86414
2
2

= S =
5
86400 5 . 86414

S
2
= 2.9
Calcule la varianza para los datos del conjunto B.
Cmo se calcula la varianza para datos agrupados en una distribucin de frecuencias?

Varianza para datos agrupados en una distribucin de frecuencias
La frmula que se utiliza es:

1
) (
2
2
2

n
n
f X
f X
S
i i
i i

donde X
i
son puntos medios de los intervalos.

Ejemplo. Dada la distribucin de frecuencias:
Intervalos f
i
X
i
f
i
Xifi
i i
f X
2

3-<11 5 7 5 35 245
11-<19 7 15 7 105 1575
19-<27 8 23 8 184 4232
27-<35 13 31 13 403 12493
35-<43 17 39 17 663 25857
43-<51 10 47 10 470 22090
60 60 1860 66492

59
57660 66492
59
60
) 1860 (
66492
2
2
=

= S = 149.69
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
14

La desventaja de la varianza es que est expresada en el cuadrado de las unidades; es decir, si los
datos estn dados en metros la varianza est dada en m
2
o si los datos estn dados en segundos la
varianza est dada en segundos
2
.

1.3.3. La desviacin estndar. Llamada tambin desviacin tpica, es la raz cuadrada de la varianza. Se
la denota con S. La desviacin estndar, a diferencia de la varianza, se expresa en las unidades de
los datos.
Para los datos agrupados, del ejemplo, su desviacin estndar es:
S = 69 . 149 = 12.23

3.3.4. El coeficiente de variacin. Es una medida relativa de dispersin y se define como:
C.V. = % 100 x
X
S

Expresa qu porcentaje de la media es la desviacin estndar.

Ejemplos, el coeficiente de variacin para el conjunto A es:

C.V. = % 42 . 1 % 100
120
70 . 1
= x
La desviacin estndar es el 1.42% de la media.

Calcule el coeficiente de variacin para los datos de la distribucin de frecuencias.

El coeficiente de variacin sirve para comparar la dispersin dos o ms conjuntos de datos que
tienen diferentes unidades de medidas.

Tambin sirve para comparar la dispersin de dos o ms conjuntos de datos que difieren en
media aritmtica.
Ejemplo:
Dados los conjuntos de datos:
A : 65, 68, 70, 64, 60
B: 7, 9, 5, 3, 10

que son los pesos, en kilogramos, de un conjunto de personas adultas y de un conjunto de nios,
respectivamente. En qu conjunto hay mayor dispersin?.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
15

Las medias de los conjuntos son kg X
A
4 . 65 = y kg X
B
8 . 6 = y las desviaciones estndar
kg S
A
85 . 3 = y kg S
B
86 . 2 = , respectivamente. De acuerdo a las desviaciones estndar
podemos estar tentados a afirmar que en el conjunto A hay mayor dispersin que en el conjunto
B, Sin embargo, los coeficientes de variacin nos permiten dar una respuesta correcta a la
pregunta.
C.V.
A
= % 89 . 5 % 100
4 . 65
85 . 3
= x y C.V.
B
= % 06 . 42 % 100
8 . 6
86 . 2
= x

1.4. MEDIDAS DE FORMA
Sirven para describir las deformaciones horizontales o verticales de una distribucin de los datos.
Tenemos a las medidas de asimetra y de apuntamiento.
1.4.1. MEDIDAS DE ASIMETRIA
Estas medidas describen las deformaciones horizontales. Para este propsito se utiliza el
coeficiente de asimetra.


Si

> 0, la distribucin tiene asimetra positiva;


Si

= 0, la distribucin es simtrica;
Si

< 0, la distribucin tiene asimetra negativa




1.4.2. MEDIDAS DE APUNTAMIENT0
Describen las deformaciones verticales. Con este propsito se utiliza el coeficiente de
apuntamiento.


Si

, la distribucin es platicrtica;
Si

= 0 , la distribucin es mesocrtica;
Si

> 0, la distribucin es leptocrtica






Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
16

DIAGRAMA DE TALLO Y HOJAS
A continuacin mostramos un diagrama de tallo y hojas para la variable Talla.
3 1.3 | 468
6 1.4 | 467
13 1.5 | 1223489
23 1.6 | 3455678899
(9) 1.7 | 024445688
18 1.8 | 000349
12 1.9 | 0034566889
2 2.0 | 02
El recorrido de la variable se ha dividido en 8 partes (los tallos), que vienen representados por los valores 1.3,
1.4, 1.5, etc. Los valores que le siguen, tras la lnea vertical, son las hojas que corresponden a cada tallo. As en
el primer tallo tenemos las hojas 4, 6, 8. Esta rama corresponde a los datos ms pequeos de la variable talla
1.34, 1.36, 1.38. La frecuencia acumulada de cada rama esta especificada a su izquierda. As la frecuencia de la
primera rama es 3, la de la segunda tambin es 3, pero la acumulada es 6. En este caso la acumulacin de las
frecuencias se hace por ambos lados de la tabla hasta llegar al tallo que contiene a la mediana. Este tallo
contiene 9 elementos como est indicado entre parntesis.
Esta representacin tiene la ventaja de que superpone una tabla de frecuencias y una representacin
grfica dada por la forma que toman los nmeros, y que es similar al histograma de frecuencias. Adems
no hay prdida de informacin, ya que se puede reconstruir todos los datos de la variable primitiva contenida
en la muestra a partir de esta representacin.















Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
17

GRFICA DE CAJA Y BIGOTES (BOX AND WHISKER)
En est grfica los datos se dividen en cuatro intervalos de igual frecuencia. La parte ancha, llamada Caja,
contiene el 50% central de los datos de la variable. Comienza en el primer cuartil y termina en el tercer cuartil.
La muestra de la caja marca la mediana (la definicin de mediana y de cuartil se ver ms adelante en el
apartado de medidas de posicin). En el grfico de Box-Whisker correspondiente a la variable Talla, que
aparece a continuacin, se ha marcado adems un punto, que corresponde a la media aritmtica de los
valores muestrales.

Las dos lneas horizontales se llaman Bigotes y se extienden a derecha e izquierda de la Caja. El bigote de la
izquierda comienza por el dato ms pequeo que dista del primer cuartil menos que 1.5 veces el rango
intercuartlico (distancia entre el primer y tercer cuartil). En este caso corresponde al valor 1.34 El bigote de la
derecha acaba en el mayor valor de la variable talla que diste del tercer cuartil menos que 1.5 veces el rango
intercuartlico. Corresponde en este caso al valor mayor de la variable talla que es 2.02. A veces hay valores de
la variable que sobresalen de los bigotes. Estos valores se clasifican como valores atpicos (Outliers).
Las tablas y las grficas pretenden ordenar y clarificar la informacin contenida en la muestra. En los casos
tratados, excepto en el caso del diagrama de tallo y hojas, siempre se hace perdiendo parte de informacin. En
el siguiente apartado se darn algunos definiciones que pretenden reducir la informacin contenida en la
muestra de una forma an ms drstica: a slo unos cuantos valores, los parmetros estadsticos de la
muestra. Entre ellos destacamos las medidas de posicin y las de dispersin.










Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
18

EJERCICIOS PROPUESTOS
1. Los datos que se muestran a continuacin representan el costo de la energa elctrica durante el mes de
julio del 2011 para una muestra aleatoria de 50 departamentos con dos habitaciones en una ciudad grande.
Los costos de energa elctrica en dlares son:

a) Determine una tabla de frecuencias, para K = 7
b) Elabore un histograma de frecuencias y polgono de frecuencias con los datos.
c) Alrededor de que cantidad parece concentrarse el costo mensual de energa elctrica.
d) Calcule e interprete las principales medidas de resumen.
2. Se identific una muestra de estudiantes que posea automviles producidos por la General Motors y se
registr la marca de cada automvil. A continuacin se presenta la muestra que se obtuvo (Ch = Chevrolet, P =
Pontiac, O = Oldsmobile, B = Buick, Ca = Cadillac):

a) Encuentre el nmero de automviles de cada marca que hay en la muestra.
b) Qu porcentaje de estos automviles son Chevrolet, Pontiac, Oldsmobile, Buick, Cadillac?
c) Trace una grfica de barras que muestre los porcentajes encontrados en el inciso b).
3. Un polica de una ciudad, usando radar, verific la velocidad de los automviles que circulaban por una calle
de la ciudad:
27 23 22 38 43 24
25 23 22 52 31 30
29 28 27 25 29 28
26 33 25 27 25
21 23 24 18 23
a) Organice los datos en una tabla y elabore una grfica adecuada para estos datos.
b) Calcule e interprete las principales medidas estadsticas.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
19

4. Los siguientes son los nmeros de torsiones que se requirieron para cortar 12 barras de aleacin forjada: 33,
24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 27. Determine e interprete:
a) La media
b) La mediana
c) El rango promedio
d) Varianza y desviacin estndar
5. Por un error, un profesor borr la calificacin obtenida por uno de diez alumnos. Si los otros nueve
estudiantes obtuvieron 43, 66, 74, 90, 40, 52, 70, 78 y 92 y la media de las diez calificaciones es 67, Qu
calificacin borr el profesor?
6. En los siguientes ejercicios, calcule el rango, el rango promedio, la varianza y la desviacin estndar para los
datos que se dan.
a) Los valores que se dan son pesos (en onzas) de carnes listadas en el men de un restaurante como cortes
Porterhouse de 20 onzas (basados en datos recolectados por un estudiante del autor).
17 20 21 18 20 20 20 18 19 19
20 19 21 20 18 20 20 19 18 19
b) Dgitos seleccionados en la lotera Maryland Pick Three:
0 7 3 6 2 7 6 6 6 3 8 1 7 8 7
1 6 8 6 9 5 2 1 5 0 3 9 9 0 7
c) Concentraciones de alcohol en la sangre de 15 conductores implicados en accidentes mortales y luego
condenados a prisin (basados en datos del departamento de Justicia de Estados Unidos).
0.27 0.17 0.17 0.16 0.13 0.24 0.29 0.24
0.14 0.16 0.12 0.16 0.21 0.17 0.18
7. La concentracin de slidos suspendidos en agua de un ro es una caracterstica ambiental importante. Un
artculo cientfico report sobre la concentracin (en partes por milln, o ppm) para varios ros diferentes.
Supongamos que se obtuvieron las siguientes 50 observaciones para un ro en particular:
55.8 60.9 37.0 91.3 65.8
42.3 33.8 60.6 76.0 69.0
45.9 39.1 35.5 56.0 44.6
71.7 61.2 61.5 47.2 74.5
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
20

83.2 40.0 31.7 36.7 62.3
47.3 94.6 56.3 30.0 68.2
75.3 71.4 65.2 52.6 58.2
48.0 61.8 78.8 39.8 65.0
60.7 77.1 59.1 49.5 69.3
69.8 64.9 27.1 87.1 66.3
a) Calcule la media
b) Calcule la media recortada al 25% y la media recortada al 10%
c) Calcule la varianza y la desviacin estndar
8. Use los datos del ejercicio 7 (50 observaciones de un ro) y calcule lo siguiente:
a) Q1, Q2 y Q3
b) Realice un diagrama de caja con estos datos
c) Calcule P15, P20, P25
d) Calcule e interprete las medidas de dispersin.
9. Use los datos del ejercicio 1 (costos de energa elctrica para una muestra de 50 departamentos) y calcule lo
siguiente:
a) Q1, Q2 y Q3
b) Calcule el percentil correspondiente a: 191, 70 y 175
c) Realice un diagrama de caja
d) Calcule e interprete las medidas de tendencia central, dispersin y forma.
10. Los siguientes son los nmeros de los minutos durante los cuales una persona debi esperar el autobs
hacia su trabajo en 15 das laborales: 10, 1, 13, 9, 5, 2, 10, 3, 8, 6, 17, 2, 10 y 15. Determine:
a) La media
b) La mediana
c) Trace un diagrama de caja.
d) Calcule e interprete las principales medidas de resumen.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
21

11) Los datos siguientes corresponden al tiempo en seg. necesario para procesar 25 trabajos en una CPU:
0.02 0.75 1.17 1.61 2.59 0.15 0.82 1.23 1.94 3.07 0.19 0.92 1.38
2.01 3.53 0.47 0.96 1.40 2.16 3.76 0.71 1.16 1.59 2.41 4.75
Vamos a calcular distintas medidas de centralizacin y a comentarlas.
12) En una Universidad que ofrece un programa de postgrado especializado en manejo de desechos
peligrosos. Para planificar futuros cambios, se hizo una encuesta para determinar los antecedentes y
objetivos de los 223 estudiantes que actualmente estn inscritos en el programa (Fuente: Journal of
Professional Issues in Engineering, abril de 1990). La grfica circular muestra un desglose de las
licenciaturas que cursaron los 223 estudiantes. Interprete la grfica. Transforme este grfico en un
grfico de barras donde se muestren las frecuencias absolutas.

13) Qu forma tiene las distribuciones descritas por las siguientes medidas de tendencia central?:
a. Media = 46, Mediana = 42, Moda = 39.
b. Media = 3,1, Mediana = 3,1, Moda = 3,1.
c. Media = 105, Mediana = 110, Moda = 115.
14) Determine si las siguientes aseveraciones son verdaderas falsas. Una aseveracin verdadera tiene
que ser siempre verdadera.
a. El rango entre cuartiles es la mitad del rango.
b. El promedio est siempre entre el primer y tercer cuartil.
c. La mediana est siempre entre el primer y tercer cuartil.
d. La desviacin estndar de una distribucin simtrica es siempre igual al rango entre cuartiles.
e. El promedio de una distribucin simtrica es siempre igual a la mediana.
15) Un Profesor le entrega las notas en el primer control y les dice que el promedio fue de 5,7. Si usted
obtuvo un 6,2:
a. Puede su nota ser la mxima?
b. Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted?
c. Si adems el Profesor da la desviacin estndar, Con cul se sentira mejor: con una desviacin
estndar de 0,6 con una de 1,1? Explique.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
22

16) Un estudio encontr que los estudiantes hombres de una Universidad pesaban en promedio 66
kilos con una desviacin estndar de 9 kilos. Las mujeres pesaban en promedio 55 kilos, con una
desviacin estndar de 9 kilos.
a. Puede decir si el estudiante de ms peso es Un hombre una mujer? Explique.
b. Encuentre el promedio y la desviacin estndar en libras (1 kg = 2,2 libras).
c. Si juntamos los hombres y las mujeres, la desviacin estndar ser: Menor que, mayor que
igual a 9?

17) Los estudiantes de Sociales siempre manifiestan que tienen mayor dificultad en los cursos que
involucre el tratamiento de clculos matemticos, es por ello que se realiz una medicin de la
memoria en estudiantes de primer ao de la carrera. La experiencia consisti en exponer 10
palabras y 10 nmeros ante los estudiantes durante 10 segundos. Despus de cuatro das de
clases, se pidi a los alumnos que recordaran las palabras y nmeros que se haban mostrados
previamente, registrndose los siguientes resultados:


a. En trmino medio, Qu cantidad de palabras y nmeros recuerdan los estudiantes?
b. Cul es la cantidad de palabras y de nmeros que recuerdan con mayor frecuencia?
c. Determine la mediana de ambos casos. Interprete sus resultados.
d. En cul de los dos grupos se recopil una informacin ms homognea?

18) Dos Profesores (A y B) estn interesados en estudiar los hbitos de sueo de los estudiantes en
sus clases. Ambos profesores registran el tiempo (en minutos) que demoran en quedarse
dormidos sus alumnos desde que empieza la clase. El grfico siguiente muestra los tiempos que
demoran en quedarse dormidos los alumnos del profesor A.


Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
23



a. Cul es el valor aproximado de las medidas de dispersin del tiempo del Profesor A?
b. Qu porcentaje de alumnos se queda dormido antes de los 14 minutos con el Profesor A?
Justifique.
c. Los datos del Profesor B son los siguientes:
10,5 11,3 11,9 12,0 12,3 12,3 12,5 12,7 13,4 13,7
13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8
Construya un diagrama de caja (junto al diagrama de caja del profesor A) correspondiente a los
tiempos en que se quedan dormidos los alumnos en la clase del Profesor B y compare ambos
grupos respecto de la variable en estudio.

También podría gustarte