Documentos de Académico
Documentos de Profesional
Documentos de Cultura
, donde N=tamao de la poblacin
Calcule la media de los siguientes conjuntos de datos:
A: 13, 17, 20, 10, 12, 18
B : 11.8, 13.6, 14.2, 16.5, 12.5, 18.5, 14.6, 15.4
Dados los siguientes datos: 20, 24, 22, 25, 28, 20, 20, 20, 22, 22, 20, 24, 25, 28, 20, 24, su media
aritmtica es:
16
24 20 28 25 24 20 22 22 20 20 20 28 25 22 24 20 + + + + + + + + + + + + + + +
= X
16
28 28 25 25 24 24 24 22 22 22 20 20 20 20 20 20 + + + + + + + + + + + + + + +
= X
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
2
16
) 2 ( 28 ) 2 ( 25 ) 3 ( 24 ) 3 ( 22 ) 6 ( 20 + + + +
= X (2)
75 . 22
16
364
16
56 50 72 66 120
= =
+ + + +
= X
El numerador de (2) se puede disponer en una tabla como:
X
i
f
i
Xifi
20 6 120
22 3 66
24 3 72
25 2 50
28 2 56
Total 16 364
Puede utilizarse cuando los datos se repiten la frmula:
n
f X
X
k
i
i i
=
=
1
Frmula para Datos Agrupados o tambin llamados tabulados (3)
La frmula (3) tambin puede utilizarse cuando los datos estn agrupados en una distribucin de
frecuencias, siendo los X
i
los puntos medios de los intervalos.
Dada la distribucin de frecuencias:
Intervalos f
i
X
i
f
i
Xifi
10-16 7 13 7 91
16-22 13 19 13 247
22-28 15 25 15 375
28-34 10 31 10 310
34-40 5 37 5 185
50 50 1208
Aplicando la frmula (3)
16 . 24
50
1208
= = X
Calcule la media aritmtica de:
(a) X
i
f
i
(b) Intervalos f
i
12 4 7-13 7
13 6 13-19 13
14 7 19-25 15
15 13 25-31 10
16 10 31-37 5
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
3
Casos Prcticos:
1) Se tiene la informacin correspondiente a un grupo de 45 anuncios publicitarios luminosos
respecto al peso en Kg de stos, la suma de los 45 datos no tabulados es 147776 Kg. Entonces el
peso promedio de los anuncios publicitarios luminosos es de:
. 91 . 3283
45
147776
Kg X = =
Interpretacin: El peso promedio de los anuncios publicitarios luminosos es de 3283.91 Kg.
2) Los pesos de sei s ami gos son: 84, 91, 72, 68, 87 y 78 kg. Hal l ar el peso
medi o.
Interpretacin: El peso medio de los amigos en estudio es de 80 Kg.
3) El profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10
alumnos de la clase. Las notas de los alumnos son:
3,2 3,1 2,4 4,0 3,5
3,0 3,5 3,8 4,2 4,0
Cul es el promedio de notas de los alumnos de la clase?
SOLUCIN
Aplicando la frmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los
alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este
caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es
sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica
comparada con las dems, que estn ubicadas entre 3,0 y 4,2.
PROPIEDADES:
1. La media aritmtica es el centro de gravedad o punto de equilibrio de un conjunto de
observaciones.
2. Para un conjunto de observaciones la media es nica.
3. Si un valor se modifica entonces la media cambia de valor.
4. Si la media sustituye a cada observacin, la suma total no cambia.
5. La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero.
( ) 0
1 1
= = =
= =
X n X n X n X X X
n
i
i
n
i
i
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
4
6. La suma de los cuadros de las desviaciones de las observaciones con respecto a la media es mnima:
( ) ( ) R c ,
1
2
2
1
e s
= =
donde c X X X
n
i
i
n
i
i
7. Si a cada observacin se le suma algebraicamente una constante, la media queda sumada
algebraicamente en esa constante. (ver tabla)
c X Y + =
8. Si a cada observacin se le multiplica por una constante, la media queda multiplicada por la
constante. (ver tabla)
9. Si W
i
= aX
i
+b; entonces ) (Ver tabla . b X a W + =
Tabla (propiedades 7,8 y 9)
Propiedad 7 Propiedad 8 Propiedad 9
X Y = X + c Z = d X W = a X +b
X
1
Y
1
= x
1
+ c z
1
= d
x
1
W
1
= a X
1
+b
X
2
Y
2
= x
2
+ c Z
2
= d
x
2
W
2
= a X
2
+b
.
.
.
.
.
.
.
.
.
.
.
.
X
n
Y
n
= x
n
+ c Z
n
= d
x
n
W
n
= a X
n
+b
X y=x+c z=d x w=ax+b
Ejemplo
Los siguientes datos corresponden a los ingresos mensuales de 4 personas: 520, 525, 518 y 523. De
ellos se obtiene X = 521.5. Suponga que a partir del siguiente mes estas personas recibirn un
aumento del 20% pero se les descontara, por el aporte a su gremio, una suma de 8 unidades
monetarias (um), Cul es el nuevo ingreso promedio de estas 4 personas?
Solucin
Sean: X = Ingreso anterior, Y = Nuevo ingreso
Y= (X + 0.2 X) 8
Y = 1.2 X 8
Entonces utilizando la propiedad 9 : Y = 1.2 X - 8 = 617.8 um
Desventaja de la media aritmtica queda fuertemente afectada por valores extremos.
Ejemplo: Los siguientes datos corresponden a los ingresos mensuales de dos grupos de personas:
Grupo Ingreso
X
A 520 525 518 523 521.5
B 520 525 518 8000 2390.75
Ntese que en el grupo A el promedio similar a los 4 valores por lo tanto los datos representan
apropiadamente mientras que en el grupo B eso no ocurre.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
5
3.1.2. Mediana
Mediana para datos no agrupados o tambin para datos agrupados sin intervalos de clase.
Calcule la mediana de los siguientes datos:
A: 5, 7, 9, 11, 13 n=5 Me=9
B: 8, 10, 11, 13, 15, 16 n=6 Me=(11+13)/2=12
C: 12, 7, 8, 10, 3, 5, 9, 15 c: 3,5,7,8,9,10,12,15 n=8 Me=(8+9)/2=8.5
La mediana es el valor que se encuentra en el centro de un conjunto ordenado de datos. As, para
obtener la mediana de un conjunto de datos, previamente debe ordenarse los datos de menor a
mayor. Luego debe determinarse el lugar que ocupa la mediana calculando
2
1 + n
. Si el nmero de
datos es impar la mediana es el dato que se encuentra en el centro y, si el nmero de datos es par,
la mediana es el promedio de los dos valores que estn en el centro.
- Calcule la mediana para los siguientes datos:
A: 8, 5, 2, 9, 12, 7, 16, 4, 10
B: 12, 10, 8, 5, 9, 11, 14, 7,15, 13
C: X
i
4 6 8 10 12 14
f
i
3 5 8 6 4 2
Mediana para datos agrupados en intervalos.
Para el clculo de la mediana se procede de la siguiente manera:
a) Se obtienen las frecuencias absolutas acumuladas (Fi)
b) Se identifica el intervalo que contiene a la mediana.
2
1 + n
El intervalo de la mediana es el intervalo que tiene como frecuencia acumulada a F
i
, la frecuencia
acumulada menor tal que F
i
>
2
1 + n
c) Se utiliza la frmula: Me =
i
i
f
F
n
A LRI
)
2
1
(
1
+
+
Donde LRI: es el lmite real inferior del intervalo mediano.
A: la amplitud del intervalo mediano.
F
i-1
: frecuencia acumulada del intervalo que antecede al intervalo mediano.
f
i :
es la frecuencia simple del intervalo mediano.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
6
Ejemplo:
Intervalos f
i
F
i
7-13 7 7
13-19 13 20 F
i-1
19-25 15 35 = Fi
25-31 10 45
31-37 5 50
5 . 25
2
1 50
2
1
=
+
=
+ n
busca en las frecuencias absolutas acumuladas
Como 35 es la frecuencia absoluta acumulada menor tal que 35 > 25.5, el intervalo que
contiene a la mediana es el intervalo 19-< 25. As:
LRI = 19, A = 6, F
i-1
= 20 y f
i
= 15.
La mediana es:
Me = 19 + 6
15
) 20 5 . 25 (
= 19 + 2.2
Me = 21.2 Significa que el 50% de los datos son menores que 21.2 y el otro 50% de los datos
son mayores que 21.2
Ejercicio. Calcule la mediana de los datos de la distribucin:
Intervalos f
i
3-11 5
11-19 7
19-27 8
27-35 13
35-43 17
43-51 10
3.1.3. Moda
Moda para datos no agrupados o tambin para datos agrupados sin intervalos.
Cul es la moda en los siguientes conjuntos de datos:
A : 3, 5, 7, 5, 8, 5, 2, 5 Mo=5 Distribucin unimodal
B: 5, 5, 3, 4, 7, 7, 7, 8, 5 Mo=5 y 7 Distribucin bimodal
C: 5, 3, 7, 9, 8, 1, 12, 11 No existe moda
Qu es moda?
La moda es el dato que ms se repite. Es el dato que tiene mayor frecuencia.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
7
Cul es la moda en la distribucin:
X
i
4 6 8 10 12 14
f
i
3 5 12 6 4 2
Mo=8 porque tiene la mayor frecuencia absoluta simple.
Moda en datos agrupados en intervalos:
Intervalos f
i
3-11 5
11-19 7
19-27 8
27-35 13=
fi-1
35-43 17=fi
43-51 10=f
i+1
Para hallar la moda se procede as:
a) Se determina el intervalo que contiene a la moda( intervalo de mayor frecuencia)
b) Se aplica la frmula:
M
o
= LRI + A ( )
2 1
1
A + A
A
donde
1 1
= A
i i
f f y
1 2 +
= A
i i
f f
siendo
i
f
la frecuencia simple del intervalo modal,
1 i
f la frecuencia simple del intervalo que
precede al modal, y
1 + i
f la frecuencia simple del intervalo que sigue al modal.
Para el ejemplo, el intervalo modal es 35 -< 43, por lo tanto la moda es :
M
o
= 35 + 8 (
7 4
4
+
) = 35 + 2.9 = 37.9
Ejercicio. Halle la moda de:
Intervalos f
i
12- 17 5
17- 22 8
22- 27 15
27- 32 22
32- 37 17
37- 42 13
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
8
3.1.4. Media aritmtica ponderada
La media ponderada de un conjunto de observaciones X
1
. X
2
. X
3
. ... X
k
con pesos o
ponderaciones w
1
. w
2
. w
3
. ... w
k
esta dada por:
k
k k
k
i
i
k
i
i i
p
w w w
w x w x w x
w
w x
x
+ + +
+ + +
= =
=
=
...
...
2 1
2 2 1 1
1
1
La media ponderada se usa en aquellos casos en donde las observaciones no tienen la misma
importancia dentro de una poblacin o muestra.
Ejemplo
En una firma se tiene la siguiente informacin en u.m.
Cargo
Nmero de
trabajadores
(wi)
Remuneracin
diaria de c/u (xi)
Asesores 15 25
Jefes 5 45
Especialista
1 70
La remuneracin promedio por da ser:
905 . 31
21
670
1 5 15
) 1 ( 70 ) 5 ( 45 ) 15 ( 25
1
1
= =
+ +
+ +
= =
=
=
k
i
i
k
i
i i
p
w
w x
x
Ejemplo
Los siguientes datos corresponden a las observaciones de la variable nmero de focos de luz
amarilla por vivienda en una determinada urbanizacin.
Tabla de frecuencias
N de focos (xi) Frecuencia absoluta
N de viviendas (wi)
Frecuencia
relativa simple
Frecuencia
porcentual simple
1 12 0.27 27
2 16 0.35 35
3 11 0.24 24
4 3 0.07 7
5 3 0.07 7
Total 45 1.00 100
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
9
El nmero de focos de luz amarilla promedio de las viviendas en estudio ser:
3111 . 2
45
104
3 3 11 16 12
) 3 ( 5 ) 3 ( 4 ) 11 ( 3 ) 16 ( 2 ) 12 ( 1
1
1
= =
+ + + +
+ + + +
= =
=
=
k
i
i
k
i
i i
p
w
w x
x
En este ejemplo, las frecuencias absolutas (f
1
) hacen las veces de las ponderaciones (w
1
)
Caso particular
Si
k
x x x ,..., ,
2 1
son las medias de K grupos de valores y cada grupo tiene tamao n
1,
n
2
., nk
respectivamente, entonces la media de los n = n
1,
+
n
2
+.+ n
k
, datos es:
=
=
=
k
i
i
k
i
i i
p
n
x n
x
1
1
1.2. MEDIDAS DE POSICIN
Estas medidas, llamadas tambin Cuantiles, dividen a un conjunto de datos ordenados en grupos
iguales. Entre estas medidas tenemos a los cuartiles, a los deciles y a los percentiles.
CUANTILES PARA DATOS SIN AGRUPAR:
1.2.1. CUARTILES
Son tres valores Q
1
, Q
2
y Q
3
que dividen al conjunto de datos ordenados en cuatro grupos
iguales:
_______ !_______!_______!______
25% Q
1
25% Q
2
25% Q
3
25%
El cuartil 1, Q
1
, es el valor que supera al 25% de los datos y es superado por el 75% de los datos.
Qu es el cuartil 2, Q
2
?
El cuartil 3, Q
3
, es el valor que supera al 75% de los datos y es superado por el 25% de los datos.
Calculo del cuartil Q
i
Se ordenan los datos.
Se ubica el lugar que ocupa el cuartil, calculando
i = 1, 2, 3.
El cuartil Q
i
, es el valor que ocupa el lugar
= 9.75
Es un valor que est entre el dato que se encuentra en el lugar 9 y el dato que se encuentra en el
lugar 10.
= 16 + 3 = 19
Significa que el 75% de los datos son menores que 19 y el 25% de los datos son mayores que 19.
1.2.2. DECILES
Son nueve valores D
1
, D
2
, , D
9
que dividen a un conjunto ordenado de datos en diez grupos
iguales. Qu significa D
2
? Qu significa D
6
?
1.2.3. PERCENTILES
Son 99 valores P
1
, P
2
, , P
99
que dividen a un conjunto ordenado de datos en 100 grupos iguales.
Qu significa P
30
? Qu significa el P
80
?
Podemos notar que el Q
2
= Me, Q
3
= P
75
, Q
1
= P
25
, P
50
= D
5
= Me
CUANTILES PARA DATOS AGRUPADOS EN INTERVALOS.
Hallando percentiles, hallamos tambin los deciles y cuartiles. Para hallar los percentiles seguimos
el procedimiento siguiente:
Para hallar el percentil P
i
1) Obtenemos las frecuencias absolutas acumuladas.
2) Identificamos el intervalo del percentil. Calculamos:
3) Aplicamos la frmula:
|
|
|
|
.
|
\
|
+ =
i
i
i
f
F
in
A LRI P
1
100
Donde LRI es el lmite inferior verdadero del intervalo del percentil
F
i-1
es la frecuencia acumulada inmediata menor que
f
i
: es frecuencia simple del intervalo del percentil
A: la amplitud del intervalo.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
11
Ejemplo: Dada la distribucin de frecuencias obtener el Percentil 40.
Intervalos f
i
F
i
20-27 8 8
28-35 12 20
36-43 15 35
44-51 20 55
52-59 17 72
60-67 9 81
68-75 3 84
Identificamos intervalo de P
40
=33.6
El intervalo del percentil 40 es 36-43
P
40
= 35.5 + 8(
P
40
= 35.5 + 7.25
P
40
= 42.75
El 40% de los datos son menores que 42.75 y el 60% de los datos son mayores que 42.75.
Calcule el decil 4.
Para el caso de encontrar los cuartiles y deciles en datos agrupados utilizamos las siguientes
formulas:
CUARTILES:
|
|
|
|
.
|
\
|
+ =
i
i
i
f
F
in
A LRI Q
1
4
DECILES:
|
|
|
|
.
|
\
|
+ =
i
i
i
f
F
in
A LRI D
1
10
1.3. MEDIDAS DE DISPERSIN
A y B son dos conjuntos de datos:
A: 121 119 122 118 118.5 121.5
B: 90.5 149.5 100 140 95.5 144.5
Calcule la media para los dos conjuntos.
En un solo segmento construya el diagrama de puntos para ambos conjuntos.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
12
Las medidas de dispersin miden la diseminacin, el grado de esparcimiento de los puntos. Tambin se
llaman medidas de variabilidad.. Los puntos del conjunto B tienen mayor diseminacin que los puntos
del conjunto A.
Entre las medidas de dispersin tenemos a las siguientes:
1.3.1. Rango. Llamado tambin recorrido o alcance, es la diferencia entre el dato mayor y el dato
menor:
Rango = X
mayor
- X
menor
Calcule los rangos de los conjuntos A y B.
1.3.2. Varianza.
Varianza para datos no agrupados:
Si a cada uno de los datos del conjunto A le restamos la media obtenemos las desviaciones de los
datos con respecto a su media. Estas desviaciones son:
1 -1 2 -2 -1.5 1.5
Cul es la suma de estas desviaciones?
Cules son los cuadrados de estas desviaciones?
Sume los cuadrados de las desviaciones y divida la suma por el nmero de datos menos uno.
El resultado obtenido se llama varianza de la muestra y se denota con S
2
.
5
25 . 2 25 . 2 4 4 1 1
2
+ + + + +
= S = 2.9
Calcule la varianza de los datos del conjunto B.
Las desviaciones se denotan: X X
i
. Cuntas son estas?
La frmula para la varianza de la muestra es:
1
) (
2
2
=
n
X X
S
i
Al elevar al cuadrado las diferencias y distribuyendo la sumatoria, se obtiene una frmula de
mayor uso en la prctica:
1
) (
2
2
2
=
n
n
X
X
S
i
i
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
13
Para obtener la varianza de los datos del conjunto A:
X
i
2
i
X
121 14641
119 14161
122 14884
118 13924
118.5 14042.25
121.5 14762.25
720.0 86414.5
La varianza es:
5
6
) 720 (
5 . 86414
2
2
= S =
5
86400 5 . 86414
S
2
= 2.9
Calcule la varianza para los datos del conjunto B.
Cmo se calcula la varianza para datos agrupados en una distribucin de frecuencias?
Varianza para datos agrupados en una distribucin de frecuencias
La frmula que se utiliza es:
1
) (
2
2
2
n
n
f X
f X
S
i i
i i
donde X
i
son puntos medios de los intervalos.
Ejemplo. Dada la distribucin de frecuencias:
Intervalos f
i
X
i
f
i
Xifi
i i
f X
2
3-<11 5 7 5 35 245
11-<19 7 15 7 105 1575
19-<27 8 23 8 184 4232
27-<35 13 31 13 403 12493
35-<43 17 39 17 663 25857
43-<51 10 47 10 470 22090
60 60 1860 66492
59
57660 66492
59
60
) 1860 (
66492
2
2
=
= S = 149.69
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
14
La desventaja de la varianza es que est expresada en el cuadrado de las unidades; es decir, si los
datos estn dados en metros la varianza est dada en m
2
o si los datos estn dados en segundos la
varianza est dada en segundos
2
.
1.3.3. La desviacin estndar. Llamada tambin desviacin tpica, es la raz cuadrada de la varianza. Se
la denota con S. La desviacin estndar, a diferencia de la varianza, se expresa en las unidades de
los datos.
Para los datos agrupados, del ejemplo, su desviacin estndar es:
S = 69 . 149 = 12.23
3.3.4. El coeficiente de variacin. Es una medida relativa de dispersin y se define como:
C.V. = % 100 x
X
S
Expresa qu porcentaje de la media es la desviacin estndar.
Ejemplos, el coeficiente de variacin para el conjunto A es:
C.V. = % 42 . 1 % 100
120
70 . 1
= x
La desviacin estndar es el 1.42% de la media.
Calcule el coeficiente de variacin para los datos de la distribucin de frecuencias.
El coeficiente de variacin sirve para comparar la dispersin dos o ms conjuntos de datos que
tienen diferentes unidades de medidas.
Tambin sirve para comparar la dispersin de dos o ms conjuntos de datos que difieren en
media aritmtica.
Ejemplo:
Dados los conjuntos de datos:
A : 65, 68, 70, 64, 60
B: 7, 9, 5, 3, 10
que son los pesos, en kilogramos, de un conjunto de personas adultas y de un conjunto de nios,
respectivamente. En qu conjunto hay mayor dispersin?.
Docente:Ms. Selene Yengle Del Castillo
Tema 03: Medidas de Resumen Universidad Privada Antenor Orrego
15
Las medias de los conjuntos son kg X
A
4 . 65 = y kg X
B
8 . 6 = y las desviaciones estndar
kg S
A
85 . 3 = y kg S
B
86 . 2 = , respectivamente. De acuerdo a las desviaciones estndar
podemos estar tentados a afirmar que en el conjunto A hay mayor dispersin que en el conjunto
B, Sin embargo, los coeficientes de variacin nos permiten dar una respuesta correcta a la
pregunta.
C.V.
A
= % 89 . 5 % 100
4 . 65
85 . 3
= x y C.V.
B
= % 06 . 42 % 100
8 . 6
86 . 2
= x
1.4. MEDIDAS DE FORMA
Sirven para describir las deformaciones horizontales o verticales de una distribucin de los datos.
Tenemos a las medidas de asimetra y de apuntamiento.
1.4.1. MEDIDAS DE ASIMETRIA
Estas medidas describen las deformaciones horizontales. Para este propsito se utiliza el
coeficiente de asimetra.
Si
= 0, la distribucin es simtrica;
Si
Si
, la distribucin es platicrtica;
Si
= 0 , la distribucin es mesocrtica;
Si