Está en la página 1de 49

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU

FACULTAD DE INGENIERIA DE MINAS


UNIDAD DE POST GRADO

ESTADISTICA APLICADA A LA
INVESTIGACION INGENIERIL (2)

Ing. Ms. Eli Teobaldo Caro Meza

HUANCAYO 2010 - I

LA MODA (Mo)

De una serie de datos es el valor Mo que se


define como el dato que ocurre con mayor
frecuencia.
La moda no siempre existe y si existe, no
siempre es nica. La moda es el promedio
menos importante debido a su ambigedad.
MODA EN DATOS NO AGRUPADOS:
Ejm: Determine la moda de los siguientes
datos:
a) 7, 9, 7, 8, 7, 4, 7, 13 , 7
b) 5, 3, 4, 5, 7, 3, 5, 6, 3
c) 31, 11, 12, 19

SOLUCION:
a) Mo = 7. Esta serie de datos es
unimodal
b) Tenemos: Mo1 = 3 y Mo2 = 5. Esta
serie de datos es bimodal.
c) Mo no existe. Tambin se dice que
cada uno de los datos es una moda.

MODA DE DATOS AGRUPADOS POR


INTERVALOS:

Para calcular la Mo de n datos organizados


por intervalos se hace:
1) Se determina el intervalo que contiene a la Mo.
Este intervalo modal [Li, Ui], debe ser el nico con
la mayor frecuencia, tiene amplitud A, frecuencia
absoluta fi y sus frecuencias vecinas antes y
despus son fi-1 y fi+1 respectivamente.
2) Luego se aplica la formula:

d1
x A
d1 d 2

Mo Li

Donde: Li = limite inferior del intervalo modal;


d 2 f i f i 1
d1 f1 f i 1
A Amplitud del intervalo modal

Ejm: En la siguiente distribucin de


frecuencias calcule la moda (Mo):
Ii

fi

Fi

[26, 34[

[34, 42[

[42, 50[

[50, 58[

10

17

[58, 66[

16

33

[66, 74[

41

[74, 82]

45

45

SOLUCION:
Se observa que la Mo [58, 66[
Adems:
Li = 8; d1 = 16 10 ; d2 = 16 8= 8;
A=8
Luego la Mo de la distribucin es:

Mo Li

d1
6

x A 58
x8
d1 d 2
68

Mo 61,429

LA MEDIA ARITMETICA( X)

Es el valor numrico que se obtiene dividiendo


la suma total de los valores observados de una
variable entre el numero de observaciones.
CALCULO DE LA MEDIA ARITMETICA
1) MEDIA
ARITMETICA
DE
DATOS
NO
AGRUPADOS: La Media aritmtica de n valores x1,
x2, x3, , xn de la variable cuantitativa X,
observados en una muestra es:
n

Suma total
x

# de datos

x
i 1

Ejemplo: Calcular la media aritmtica de los 20


datos siguientes:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 2, 4, 1

SOLUCION:
Aplicando la formula:
Suma total
x

# de datos

Tenemos:

20

44
x

20
20

i 1

x 2,2

x
i 1

2)

MEDIA ARITMETICA
AGRUPADOS:

DE

DATOS

a) DATOS AGRUPADOS DE VARIABLE


DISCRETA: Si n valores de una variable
discreta X se clasifican en k valores distintos
x1, x2, , xk con frecuencias absolutas
respectivas f1, f2, ,fk, entonces la media
aritmtica es:
k

Suma total
x

# de datos

f
i 1

* xi

Ejemplo:
Calcule la media aritmtica de
distribucin de frecuencias siguientes:
Numero de Hijos xi

F. Absolutas
fi

la

SOLUCION:
Tenemos:

Numero de Hijos
xi

F. Absolutas
fi

fi*xi

14

18

TOTAL

20

44

La media aritmtica ser:


5

Suma total

# de datos

f
i 1

* xi

20

x 2,2

44
20

b) DATOS AGRUPADOS POR INTERVALOS:


Si n valores de una variable cuantitativa X
estan organizados en una frecuencia de k
intervalos, donde:
m1, m2, , mk son las marcas de clase y
f1, f2, , fk son las frecuencias abs. resp.
Entonces la media aritmtica es:
k

Suma total

# de datos

f
i 1

* mi

Ejemplo:
Calcule la media aritmtica de la
distribucin de frecuencias por intervalos
siguientes:
Ii

fi

[26, 34[

[34, 42[

[42, 50[

[50, 58[

10

[58, 66[

16

[66, 74[

[74, 82]

4
45

SOLUCION:
Tenemos:
Ii

mi

fi

fi*mi

[26, 34[

30

30

[34, 42[

38

76

[42, 50[

46

184

[50, 58[

54

10

540

[58, 66[

62

16

992

[66, 74[

70

560

[74, 82]

78

312

45

2694

La media aritmtica ser:


7
f i * mi

Suma total i 1
2694
x

# de datos

45

45

x 59,867

3.

PROPIEDADES DE LA MEDIA ARITMETICA

a) La suma total de n valores cuya media es x es


igual a nx. En efecto, para n datos no
agrupados y agrupados respectivamente, se
tiene: n
k

x
i 1

n x;

fx
i 1

i i

nx

b) Si a la variable X se le hace la transformacin


lineal Y = aX + b, es decir si a cada uno de los
n valores xi de X es transformado en el valor:
yi = axi + b de Y, siendo a y b constantes,
entonces, a media de los n valores yi es:

y ax b

c) La suma algebraica de las desviaciones de n


datos xi con respecto a su media x es igual a
cero. Se tiene para datos no agrupados y
agrupados:

n
i 1

( xi x) 0 ;

f
i 1

* ( xi x) 0

d) La suma de los cuadrados de las desviaciones


de n datos con respecto a su media es
minima.
n

(x
i 1

c) minima,
2

si c x

MEDIA PONDERADA
La media ponderada se obtiene or la
siguiente relacin:
k

( w * x ) ( w2 * x 2 ) ... ( wk * x k )
x 1 1

w1 w2 ... wk

(w * x )
i

i 1

w
i 1

Ejemplo: Un alumno en el semestre


anterior ha obtenido 11 en el curso A de 5
crditos, 13 en el curso B de 4 crditos, y
16 en el curso C de 3 crditos, entonces
su promedio de notas (ponderado por los
crditos) es:

SOLUCION:

(11 * 5) (13 * 4) (16 * 3) 155

12,92
543
12

EJEMPLO:
Los sueldos del mes de Enero de 200
empleados de una empresa tienen una media
de 230 (nuevos soles por 10).
a) Si el 60% de los empleados son hombres (el resto
son mujeres) y tienen un sueldo promedio de 250,
Cunto es el sueldo medio de las mujeres en
enero?
b) Si para el mes de julio, se propone un aumento
general que consiste de un aumento variable del
30% a cada sueldo de enero mas una bonificacin
de 30, Cunto dinero adicional necesitara la
empresa para pagar los sueldos incrementados?

RELACION ENTRE MEDIA , MEDIANA Y MODA


1) Si la distribucin de los datos es simtrica,
entonces, la media, la mediana y la moda
tienen el mismo valor (fig 2.2 a). Esto es:

x Me Mo

2) Si la distribucin es asimtrica de cola a la


derecha, entonces, la moda es menor que la
mediana y esta a su vez es menor que la
media (fig. 2.2 b). Es decir:

Mo Me x

3) Si la distribucin es asimtrica e cola a la


izquierda, entonces, la relacin es (fig. 2.2 c):

x Me Mo

4. Para distribuciones unimodales y de marcada


asimetra, se tiene la siguientes relacin
emprica:

X Mo 3 * ( X Me)
5. Los tres promedios pueden calcularse tambin
para distribuciones de frecuencias con
intervalos de diferente longitud, siempre que
puedan determinarse o las marcas de clase
(para la media) o de limite inferior Li del
intervalo (para la mediana y la moda).

LA MEDIA GEOMETRICA
La media geomtrica de n valores positivos x 1,
x2, , xn es:

x n x1 * x2 * ... * xn
Por ejemplo, la media geomtrica de los valores
3, 9, 27 es igual a:

xG 3 3 * 9 * 27 9
La media geomtrica se aplica para promediar:
razones (a/b), ndices (a/b en %), proporciones
[a/(a+b)], tasa de cambio [(a-b)/b], que varan
con el tiempo, etc.

Ejemplo 1:
Si la produccin de un bien ha
experimentado un crecimiento del 30%
del primero al segundo ao y un
incremento del 35% del segundo al
tercer ao y un decrecimiento del 15%
del tercer al cuarto ao.
a) Calcule la tasa promedio de cambio y el
porcentaje promedio de crecimiento de la
produccin de los tres ltimos aos.
b) Calcule la produccin del quinto ao, si la
del primer ao fue 100.

Ejemplo 2:
Supongamos que la poblacin de una ciudad
aumento de 10000 a 12600 en el periodo
comprendido del ao 2000 al ao 2004 como se
indica en el cuadro. Calcule la tasa promedio y
el porcentaje promedio del crecimiento de la
poblacin.

LA MEDIA ARMONICA
La media armnica de n valores no nulos x 1, x2,
, xn es un numero
real, dado por:

xH

i 1 x i

Por ejemplo la media armnica de 6, 4, y 3 es 4.


La media armnica se aplica para promediar
datos cuyas unidades de medicin son
cocientes de unidades de medicin de dos
variables, por ejm. Datos expresados en
km/hora. Siendo
una formula practica la sgte:

Total de mediciones de variable 1


xH

Total de mediciones de variable 2

NOTA: La media armnica es siempre menor que la


media geomtrica, esta a su vez es menor que la media
aritmtica.

x H xG x
Ejemplo 1:
Una persona manejando su automvil recorre los
primeros 10 km a 60 km por hora y los siguientes 10 km
a 70 km por hora, calcule la velocidad promedio.
Ejemplo 2:
Una empresa de transporte gasta S/.400 en latas de
aceite que cuestan S/. 10 la docena; S/. 500 en latas
que cuestan S/.12,50 la docena; S/. 600 mas en latas
que cuestan S/. 20 la docena y S/. 300 en otras que
cuestan S/. 25 la docena. Calcule el costo promedio por
docena de las latas de aceite.

MEDIDAS DE DISPERSION

INTRODUCCION
Los promedios determinan el centro, pero no
indican acerca de cmo estn situados los datos
respecto al centro.
En primer lugar se necesita una medida del nival
de la dispersin o la variabilidad de los datos
con respecto a su centro con la finalidad de
ampliar la descripcin de los datos o de comparar
dos o mas series de datos.
En segundo lugar se necesita una medida del
grado o nivel de la asimetra o la deformacin en
ambos lados del centro de una serie de datos,
con el fin de describir la forma de la distribucin
de datos. Esta medida se denomina ndice de
asimetra.

En tercer lugar se necesita una medida que nos


permita comparar el apuntamiento o curtosis de
distribuciones simtricas con respecto a la
distribucin simtrica normal. Esta medida se
llama ndice de apuntamiento o curtosis.
Por otro lado, la forma de la distribucin queda
descrita por la ubicacin de los promedios en la
distribucin de frecuencias o por la ubicacin de
los cuartiles en una grafica de caja.
Finalmente las medidas de curtosis son
validas solo para distribuciones simtricas.

MEDIDAS DE DISPERSION O DE
VARIACION
Estas medidas son nmeros reales que miden
el grado o nivel de separacin de los datos
con respecto a un valor central, que
generalmente es la media aritmtica.
Las principales medidas de dispersin son:

El rango
El rango intercuartil
La varianza
La desviacin estndar, y
El coeficiente de variacin.

1.

EL RANGO O RECORRIDO DE UNA


VARIABLE (R)

Denotado por R es el numero que resulta de la


diferencia del valor mximo (xmax) menos el valor mnimo
(xmin) de una serie de datos observados de variable X:
R = xmax - xmin
El rango es una medida muy fcilmente calculable, pero
es muy inestable, como depende de dos valores
extremos, su valor puede cambiar grandemente si se
aade o elimina un solo dato.
Ejemplo: sean las dos series de datos
a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9
b) 1, 2, 3, 4, 5, 6, 7, 8, 9
Ambas tienen la misma media = 5, y el mismo rango 8,
pero no tienen la misma dispersin, ya que la segunda
tiene mayor variabilidad.

2.

EL RANGO INTERCUARTIL (RI)

Es el numero que resulta de la diferencia del


cuartil 3 menos el cuartil 1 de los datos. Esto es:
RI = Q3 - Q1
El rango intercuartil es una medida que
excluye el 25% superior (cuarto superior) y el
25% inferior (cuarto inferior), dando un rango
dentro del cual se encuentra el 50% central de
los datos observados y a diferencia del rango no
se encuentra afectada por los valores
extremos.
Si el rango intercuartil es muy pequeo entonces
describe alta uniformidad o pequea variabilidad
de los valores centrales.

Ejm: En la siguiente distribucin de


frecuencias calcule el rango intercuartil:
Ii

fi

Fi

[26, 34[

[34, 42[

[42, 50[

[50, 58[

10

17

[58, 66[

16

33

[66, 74[

41

[74, 82]

45

45

SOLUCION:
Como: RI = Q3 Q1
Calculamos primero Q1:
El 25% inferior de los n = 45, es 11,25 (0,25xn).
Este 25% inferior esta entre las frecuencias
acumuladas 7 y 17 que se corresponden con el
intervalo [50, 58[
En este intervalo, Li=50, fi=10, A=8, Fi-1=7
fi = 0,25xn Fi-1 = 11,25 7 = 4,25
Luego:

f i
4,25
Q1 Li (
xA) 50
x8 53,4
fi
10

A continuacin calculamos Q3:


El 75% inferior de los n = 45, es 33,75 (0,75xn).
Este 75% inferior esta entre las frecuencias
acumuladas 33 y 41 que se corresponden con el
intervalo [66, 74[
En este intervalo, Li=66, fi=8, A=8, Fi-1= 33
fi = 0,75xn Fi-1 = 33,75 33 = 0,75
Luego:
Q3 Li (

f i
0,75
xA) 66
x8 66,75
fi
8

Finalmente calculamos el RI:


RI = Q3 Q1 = 66,75 53,4 = 13,35
Por lo que podemos concluir que el 50% de los 45
datos varia en el rango de 13,35.

3.

LA VARIANZA Y LA DESVIACION
ESTANDAR

LA VARIANZA: Es la media aritmtica de los


cuadrados de las diferencias de los datos con
respecto a su media aritmtica.
La varianza se denota por s n2 , y si es calculada
2

para una poblacin se denota .


La varianza es una medida de dispersin que
genera unidades de medicin al cuadrado ($ 2,
m2, etc.)
DESVIACION ESTANDAR: Es la raz cuadrada
positiva de la varianza.
Se denota por sn.

CALCULO DE LA VARIANZA
a) VARIANZA DE DATOS NO AGRUPADOS:
La varianza de n mediciones: x1, x2, , xn de
alguna variable cuantitativa X, cuya media es
n
x, es el numero real:

2
s n2

Suma total de cuadrados de diferencias

# de datos

Se comprueba que:
n

2
2
(
x

x
)

x
i
i n* x
i 1

i 1

Por lo tanto:

s n2

2
x
i
i 1

(x
i 1

x)

Ejemplo:
Los salarios quincenales, en dlares,
recopilados en una muestra de 45
empleados son:
63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
Calcule la varianza y la desviacin
estndar.

SOLUCION:
Tenemos:
n

2670
n 45; xi 2670; x
59,333;
45
i 1

2
x
i 164530
i 1

Luego la varianza de los 45 salarios sin


agruparn es:
xi2 2

164530
2
2
2
sn

i 1

45

(59,333) 135,778 ($ )

Luego la desviacin estndar es:


s n s n2 135,778 11,652 ($)

CALCULO DE LA VARIANZA
b) VARIANZA DE DATOS AGRUPADOS:
1. Varianza de datos agrupados de variable
discreta:
Si n valores de una variable discreta X se clasifican en
k valores distintos x1, x2, , xk con frecuencias
respectivas f1, f2, , fk, entonces su varianza es el
k

numero:
2
Suma total de cuadrados de diferencias
s

# de datos
2
n

Se compruebak que:

f ( x x ) f * x
i 1

Por lo tanto:

i 1

s
2
n

f *x
i 1

2
i

2
i

n* x

f ( x x)
i 1

Ejemplo:
Calcule la varianza y desviacin estndar
de la distribucin de frecuencias
siguientes:
Numero de Hijos xi

F. Absolutas
fi

SOLUCION:
Tenemos:

Numero de Hijos
xi

F. Absolutas
fi

fi*xi

fi(xi)2

14

28

18

54

32

TOTAL

20

44

118

Tenemos: n = 20, k = 5, x = 44/20 = 2,2


La varianza ser:
k

s
2
n

f *x
i 1

118
(2,2) 2 1,06
20

La desviacin estndar es:


sn sn2 1,06 1,0296

2. Varianza de datos agrupados por intervalos:


Si n valores de una variable cuantitativa X, son
agrupados en k intervalos, con marcas de clases m1,
m2, , mk con frecuencias respectivas f1, f2, , fk,

entonces su varianza es el numero: k


2
Suma total de cuadrados de diferencias
sn2

# de datos

Se comprueba que:
k

f (m x) f * m
i 1

Por lo tanto:

i 1

sn2

f *m
i 1

2
i

2
i

n* x

f (m x)
i 1

Ejemplo:
Calcule la varianza y desviacin estndar de la
distribucin de frecuencias por intervalos
siguientes:
Ii

fi

[26, 34[

[34, 42[

[42, 50[

[50, 58[

10

[58, 66[

16

[66, 74[

[74, 82]

4
45

SOLUCION:
Tenemos:
Ii

mi

fi

fi*mi

fi(mi)2

[26, 34[

30

30

900

[34, 42[

38

76

2888

[42, 50[

46

184

8464

[50, 58[

54

10

540

29160

[58, 66[

62

16

992

61504

[66, 74[

70

560

39200

[74, 82]

78

312

24336

TOTAL:

45

2694

166452

La VARIANZA ser:
k
sn2

f *m
i 1

166452 2694
x

45
45

La DESVIACION ESTANDAR es:


sn sn2 114,916 10,7199

114,916

4.

COEFICIENTE DE VARIACION (CV)

Es una medida de dispersin relativa (libre de


unidades de medicin), se define como el
cociente de la desviacin estndar entre la
media aritmtica. Esto es:
s
CV (o en %)
x
El coeficiente o ndice de variacin se utiliza
para comparar la variabilidad de dos o mas
series de datos que tengan medidas iguales o
diferentes o que tengan unidades de medidas
iguales o diferentes (por ejem., comparar la
variabilidad de una serie de datos, medidos en
kilogramos con la de otra serie de datos medidos
en metros).

Ejemplo:
Si las calificaciones en matemticas I de
dos secciones H1 y H2 tienen la misma
desviacin estndar igual a 14, no
podemos concluir que las dos secciones
tienen la misma variabilidad (salvo que
tengan medias iguales).
Del mismo modo, si la desviacin estndar
de H1 es 2 y la de H2 es 4 no podemos
concluir que las notas de H2 son mas
dispersas que las de H1. La variabilidad de
estos dos grupos depende, adems, de sus
medias.

En el primer caso, si se indica que la


media de la seccin H1 es 16 y la media
de la seccin H2 es 11, los coeficientes de
variacin respectivo son:
s1

14
CV1
0,875, o 87,5%
x1 16
s2

14
CV2
1,27, o 127%
x2 11

Es decir, las calificaciones obtenidas en


H1 son mas homogneas o tienen menor
variabilidad que las calificaciones de H 2.

USO DE LAS MEDIDAS DE DISPERCION O DE


VARIACION
1. Si dos o mas grupos de datos (observados en
el mismo tipo de medicin) tienen medias
aritmticas iguales, entonces, es mas dispersa
o de mayor variabilidad la serie que tiene
mayor valor, una cualquiera de sus medidas
de variacin: Rango (R), o RI, o s 2, o s, o CV.
(Si hay marcada asimetra, es preferible
comparar la variabilidad con el RI)
2. Si dos o mas series de datos, no tienen
medias iguales (o casi iguales) o no tienen las
mismas unidades de medicin (variables
diferentes), entonces, es mas homognea o
de menor variabilidad la serie que tenga
menor coeficiente de variacin CV, sin
importar su forma de asimetra.