Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APUNTES N 2
ASIGNATURA: ESTADISTICA
MATERIA: Estadgrafos de Tendencia Central, Variabilidad y Posicin.
PROFESOR: Carlos Flores Carvajal.
MEDIDAS DE DESCRIPTIVAS.
INTRODUCCIN.
Los datos organizados en una distribucin de frecuencias destacan sus caractersticas
ms esenciales, como marcas de clases, centro, forma de distribucin (asimtrica,
simtrica) etc. Sin embargo, los indicadores que describen mejor los datos en forma
ms precisa, deben calcularse. Estos indicadores resumen los datos en medidas
descriptivas que se refieren a la centralizacin o posicin, a la dispersin o
variacin, a la asimetra etc.
Las medidas de tendencia central, denominados promedios, ubican el centro de los
datos, como la media aritmtica la mediana etc.
MEDIA ARITMETICA.
Definicin. La media aritmtica, denominada simplemente media, es la suma de los
valores observados de la variable, dividido por el nmero de observaciones.
Para valores de una variable x observados en una muestra, la media aritmtica se
_
denota por x , para una poblacin se denota .
CALCULO DE LA MEDIA ARITMETICA PARA DATOS NO AGRUPADOS.
Formulas.
n
xi
i 1
( Muestra )
xi
( Poblacin )
i 1
20
23
26
25
33
26
34
xi
i 1
30 20 23 26 25 33 26 34 36 19
27.2
10
36
19
N2
CALCULO DE LA MEDIA ARITMETICA PARA DATOS AGRUPADOS
DE VARIABLE DISCRETA.
FORMULA.
n
xini
( Muestra )
i 1
xini
i 1
( Poblacin )
Xi
0
1
2
3
4
Total
Frecuencias
ni
1
4
7
6
2
20
Productos
Xi*ni
0
4
14
18
8
44
Resultado:
n
xini
i 1
44
2 .2
20
yini
i 1
( Muestra )
n
Donde yi = La marca de clase
yini
i 1
( Poblacin )
N 3
Ejemplo:
Calcular la media de la distribucin de frecuencias de los 45 ingresos semanales de la
tabla.
Calculo de la media de los ingresos de una
Muestra de 45 personas.
Intervalos
26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total
N Personas
ni
1
2
4
10
16
8
3
1
45
Marca clase
Yi
30
38
46
54
62
70
78
86
Productos
Yi*ni
30
76
184
540
992
560
234
86
2702
Resultando.
n
yini
i 1
2702
60.1
45
w1x1 w2 x 2 ......wkxk
w1 w2 .....wk
Wi = Ponderacin o Pesos
Ejemplo.
Un estudiante de la carrera de Medicina Veterinaria en la asignatura de Biologa,
obtuvo las siguientes calificaciones, con sus correspondientes ponderaciones.
Determine su nota promedio.
Prueba
1
2
3
4
Nota
5.2
4.8
6.2
3.2
Ponderacin
25%
35%
15%
25%
Solucin.
w1x1 w2 x 2 ......wkxk
w1 w2 .....wk
471
4.71
100
N4
LA MEDIANA.
Definicin. La mediana o valor mediano de una serie de valores observados es el
nmero Me que separa a la serie de datos ordenados en forma creciente (o
decreciente) en dos partes de igual nmeros de datos.
La mediana es la medida promedio que depende del nmero de datos ordenados y no
de los valores de estos datos.
CALCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS.
Para calcular la mediana de n valores no agrupados de alguna variable cuantitativa x,
se sigue el siguiente proceso.
1) Se ordenan los datos en forma creciente.
2) Luego, se ubica el valor central Me. Si n es impar la mediana es un dato
observado. Si n es par la mediana es la semisuma de los dos valores centrales.
Ejemplo.
Calcular la mediana para las siguientes series de datos.
a) 120 - 3 - 14 - 1 - 99 - 7 - 30 - 2000 - 16
b) 30 - 77 - 3 - 300 - 36 - 11 - 10000 - 29
Solucin.
a) La serie ordenada de los 9 datos es: 1 - 3 - 7 - 14 - 16 - 30 - 99 - 120 2000
La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos
cada uno, Me = 16.
b) La serie ordenada de los 8 datos es: 3 - 11 - 29 - 30 - 36 - 77 - 300 10000
La mediana en este caso, puede ser cualquier nmero situado entre 30 y 36, ya que,
dividir a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la infinidad
de valores, la mediana se elige como la semisuma de los valores centrales. Esto es:
Me = (30 + 36) / 2 = 33.
Nota: La mediana no depende de la magnitud de los datos. Depende slo del
nmero de ellos.
CALCULO DE LA MEDIANA PARA DATOS AGRUPADOS PARA
VARIABLE CUANTITATIVA DISCRETA.
Si los valores de una variable discreta se tabulan en una distribucin de frecuencias,
el clculo de la mediana se hace siguiendo el procedimiento anterior. Debido a que
los datos estn ordenados. Por ejemplo, la mediana para la distribucin del nmero de
hijos por familias es 2.
CALCULO DE LA MEDIANA DATOS AGRUPADOS EN INTERVALOS
DE CLASE.
Formula.
Me = L.I.M +
2 Ni 1
*A
ni
N 5
Donde: n = Nmero de observaciones
ni = Frecuencia del intervalo
Ejemplo.
Calcular la mediana para la muestra de los 45 ingresos semanales.
Ingresos
26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total
Calculo de la Mediana
Nmero de
Frec
personas
5cum...
ni
Ni
1
1
2
3
4
7
10
17
16
33
8
41
3
44
1
45
45
Solucin
Me = L.I.M +
2 Ni 1
*A
ni
n 45
22.5
2
2
22.5 17
5.5
* 8 58
16
Me = 58
LA MODA.
Definicin. La moda de una serie de datos es el valor Mo, que se define como el dato
que ms veces se repite.
La moda no siempre existe y si existe, no siempre es nica.
La moda es una medida promedio que se usa cuando se quiere sealar el valor que
ms se repite en una serie de datos.
La moda es el promedio menos importante debido a su ambigedad.
Ejemplo.
La moda de los datos:
a) 7 9 7 8 7 4 7 13 7 es igual a 7. Esta serie de datos es
unimodal.
b) 5 3 4 5 7 3 5 6 3 es igual tanto a 3, como a 5. Esta serie de
datos bimodal.
c) 31 11 19 12 no existe (Tambin vale decir que cada uno de los datos es
una moda)
LA MODA DE DATOS AGRUPADOS POR INTERVALOS.
Para calcular la moda n datos tabulados por intervalos, primero se determina el
intervalo que contiene a la moda esto es, el intervalo que tiene la mayor frecuencia
(intervalo modal). Luego se utiliza la frmula.
N 6
d1
Mo = L.I.M +
*A
d1 d 2
Donde:
Li.M = al lmite inferior del intervalo modal.
A = amplitud del intervalo modal
d1 = ni ni-1, esto es, d1 es igual a la frecuencia del intervalo modal menos la
frecuencia del intervalo inmediatamente anterior.
d2 = ni - ni+1, esto es, d2 es igual a la frecuencia del intervalo modal menos la
frecuencia del intervalo inmediatamente posterior.
Ejemplo.
Calcular la moda de los 45 ingresos semanales tabulados en intervalos de clase.
Ingresos
26 - 34
34 - 42
42 - 50
50 - 58
58 - 66
66 - 74
74 - 82
82 - 90
Total
Calculo de la Moda
Nmero de
personas
ni
1
2
4
10
16
8
3
1
45
Frec 6Acum...
Ni
1
3
7
17
33
41
44
45
Solucin
d1
Mo = L.I.M +
*A
d1 d 2
d1 = 16 10 = 6
d2 = 16 8 = 8
Mo = 58 +
* 8 58 0.428 * 8 58 3.48 61.43
6 8
MEDIDAS DE DISPERSION
Introduccin.
Las medidas de tendencia central no son suficientes para describir un conjunto de
valores de alguna variable estadstica. Los promedios determinan el centro, pero nada
indican acerca de cmo estn situados los datos respecto al centro.
En primer lugar se necesita una medida del grado de dispersin o variabilidad con
respecto al centro al centro con la finalidad de ampliar la descripcin de los datos o de
comparar dos o ms series de datos.
En segundo lugar se necesita una medida del grado de asimetra o deformacin en
ambos lados del centro de una serie de datos, con el fin de describir la forma de la
distribucin de los datos. Esta medida se denomina ndice de asimetra.
MEDIDAS DE DISPERSIN.
y referida a
N 8
S =
( xi x)
2 =
(Muestra)
( xi )
n 1
Donde :
(Poblacin)
N1
Xi = valores de la Variable
x = La media aritmtica de
la muestra.
= La media aritmtica de la poblacin.
Ejemplo.
Calcular la varianza y la desviacin estndar del siguiente conjunto de nmeros
57 51 58 60 63 54 64 52.
Solucin.
(Varianza )
1) x
51 52 54 57 58 60 63 64 459
57,375
8
8
2 y 3)
Xi
51
52
54
57
58
60
63
64
(2)
(Xi X)
- 6,37
- 5,37
- 3,37
- 0,37
0,62
2,62
5,62
6,62
(3)
(Xi X)
40,64
28,89
11,39
0,140
0,390
6,890
31,64
43,89
163,87
S =
( xi x)
n 1
Solucin
( La desviacin estndar )
S=
( xi x)
i 1
163,87 163,87
23.41
8 1
7
n 1
23.41 4.84
N 9
S =
( xi x)
ni
( Muestra )
n 1
= ( xi )
ni
( Poblacin )
x La media aritmtica
xi = Valores de la variable
Desviacin Estndar
S=
( xi x)
i 1
ni
( Muestra )
n 1
( xi )
i 1
ni
( Poblacin )
Ejemplo.
Calcular la varianza y la desviacin estndar del nmero de hijos en una muestra de
20 familias.
Nmero de hijos en una muestra de 20 familias
Xi
0
1
2
3
4
ni
1
4
7
6
2
20
Solucin.
Calculo de la varianza para variable discreta
(1)
(2)
(3)
(4)
Xi
0
1
2
3
4
ni
1
4
7
6
2
20
Xi * ni
0
4
14
18
8
44
(Xi X)
- 2.2
- 1.2
- 0.2
0.8
1.8
N 10
(Xi X)
4.84
1.44
0.04
0.64
3.24
(Xi X)ni
4.84
5.76
0.28
3.84
7.68
22.4
xini
i 1
4.4
2.2
20
ni
n 1
22.4
1.18
19
( xi x) 2 ni
S=
S =
( xi x)
i 1
1.18 1.08
n 1
CALCULO DE LA VARIANZA PARA DATOS AGRUPADOS
PARA VARIABLE CUANTITATIVA CONTINUA.
Formulas.
Varianza.
S =
( yi x)
ni
( Muestra )
( yi )
ni
i 1
n 1
( Poblacin )
DESVIACIN ESTNDAR
S=
( yi x)
i 1
ni
( Muestra )
n 1
( yi )
ni
( Poblacin )
i 1
Marca
Clase
Yi
2499.50
2699.50
2899.50
3099.50
3299.50
3499.50
N de
Trabajadores
ni
7
20
33
25
11
4
100
N 11
Entonces
Yi - x
- 450
- 250
- 50
150
350
550
yi x
202500
62500
2500
22500
122500
302500
yi x
ni
1417500
1250000
82500
562500
1347500
1210000
5870000
S =
( yi x)
ni
n 1
( yi x)
S=
i 1
ni
5870000
59293
99
58293 244
n 1
COEFICIENTE DE VARIACIN.
Definicin. El coeficiente de variacin, C:V. es una medida de dispersin relativa
(libre de unidades de medidas), que se define como la desviacin estndar dividido
por la media aritmtica: Esto es.
Formula.
CV =
x 100
s1
x1
14
0.875 87.5 %
16
CV2 =
s2
x2
14
0.93 93 %
15
N 12
2.- Si dos o mas series de datos , no tienen medidas iguales ( o casi iguales ), o no
tienen las mismas unidades de medicin, entonces , es ms dispersa la serie que
tenga mayor coeficiente de variacin
MEDIDAS DE POSICIN
Cada una de las medidas descriptivas que resumen un conjunto de datos es un
nmero que representa cierta caracterstica de una poblacin o muestra. Sin
embargo, en algunas circunstancias puede ser til usar nmeros para mostrar la
posicin de la distribucin, ms all del promedio, la mediana o la moda.
Por ejemplo, las personas encargadas de reclutar personal para una clnica, quien
est de visita en cierta universidad, puede tener inters en algo ms que la nota
media o mediana de los alumnos de ltimo ao. Quiz, quiera saber los valores que
determinan 10 o 20% superior de una generacin. En estos casos los cuantiles son
muy tiles.
Cuantiles
Deciles
Cuartiles
Valores de la variable
que
dividen
la
distribucin en 10
partes iguales de 10%
cada una
Valores de la variable
que
dividen
la
distribucin en cuatro
partes iguales de 25%
cada una
Percentiles
Valores de la variable
que
dividen la
distribuci
n en 100
partes
Qk = L.I. +
nk
4 Ni 1
*A
ni
k = 1,2,3
Dk = L.I +
nk
10 Ni 1
*A
ni
k = 1,2,3.,9
DECILES
Pk = L.I +
nk
100 Ni 1
*A
ni
CUARTILES
k = 1,2,3,99
PERCENTILES
k = Cuantil en estudio
N 13
EJEMPLO.
Los datos siguientes representan los siguientes ingresos en miles de pesos de una
muestra de 200 familias de una cierta comuna.
Ingresos
0.8
1.5
2.2
2.9
3.6
4.3
1.4
2.1
2.8
3.5
4.2
4.9
Frecuencia
( ni )
35
65
50
25
15
10
Frecuencia
Acumulada ( Ni)
35
100
150
175
190
200
Qk = L.I. +
Solucin
nk
4 Ni 1
*A
ni
Tercer cuartel
Qk = L.I. +
nk
4 Ni 1
*A
ni
Solucin
Percentil 90
50 35
* 0.6 1.6
65
Qk = 1.5 +
nk 200 x3
150
4
4
150 100
* 0.6 2.8
50
Q3 = 2.2 +
nk
200 x90
180
100
100
Pk = L.I +
nk
100 Ni 1
*A
ni
nk 200
50
4
4
180 175
* 0.6 3.8
15
P90 = 3.6 +