Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teoria de Estadistica Descriptiva
Teoria de Estadistica Descriptiva
Son estadgrafos de posicin que son interpretados como valores que permiten resumir a un
conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro de
gravedad que adoptan un valor representativo para todo un conjunto de datos predeterminados.
Estas medidas son:
1. Promedio Aritmtico (Media o simplemente promedio)
2. Mediana
3. Moda
4. Promedio Geomtrico
5. Promedio Ponderado
6. Promedio Total
7. Media Armnica
Otras medidas de posicin son: Cuartiles, Deciles y Percentiles
B.
MEDIDAS DE VARIABILIADAD
MEDIDAS DE FORMA
Arturo Rubio
x=
i=1
xi
x1 + x 2 + x 3 + .... + x n
n
Ejemplo: Durante los ltimos 32 das el valor de las compras en peridicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.2, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
El promedio aritmtico del valor de las compras de peridicos es:
n
x=
i=1
xi
=
250.2
= 7.82
32
x=
Donde:
fi X i
i=1
Ejemplo: Para los gastos diarios en peridicos del hotel agrupados en una tabla de frecuencia:
Intervalo
Xi
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
fi
3
5
9
7
5
3
32
hi
0.094
0.156
0.281
0.219
0.156
0.094
1.000
Fi
3
8
17
24
29
32
Hi
0.094
0.250
0.531
0.750
0.906
1.000
10
8
6
4
2
0
5.65
6.55
7.45
8.35
9.25 10.15
7.87
x=
fi X i
i=1
Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.87 soles
Arturo Rubio
2. LA MEDIANA
Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50%
de las observaciones son mayores que este valor y el otro 50% son menores.
(n + 1)
. Ejemplos:
2
c
Me = Li +
Donde:
Li
Fi-1
fi
Hi-1
hi
c
n
Fi-1
c(0.50 H i-1 )
2
= Li +
fi
hi
Ejemplo: Para los gastos diarios en peridicos del hotel en una tabla de frecuencia:
Intervalo
Xi
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
fi
3
5
9
7
5
3
32
hi
0.094
0.156
0.281
0.219
0.156
0.094
1.000
Fi
3
8
17
24
29
32
10
Hi
0.094
0.250
0.531
0.750
0.906
1.000
6
4
2
0
5.65
6.55
7.45
8.35
9.25 10.15
Me=7.8
0 .9
La Mediana es:
Me = 7.0 +
32
8
0.9(0.5 0.25)
2
= 7.0+
= 7 .8
9
0.281
El 50% de los das el hotel gast menos de 7.8 soles en la compra de peridicos
0.50
0.50
7.8
Arturo Rubio
3. LA MODA
Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son:
- Puede no existir o existir ms de una moda
- Su valor no se ve afectado por los valores extremos en los datos
- Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa
- Es una medida inestable cuando en nmero de datos es reducido.
Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
Moda = Mo = 7.1;
M o = Li + c
Donde:
d1=(fi - fi-1)
d1
d1 + d 2
d1=(fi - fi+1)
Ejemplo: El gasto diario en peridicos del hotel AAA agrupados en una tabla de frecuencia:
Intervalo
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
Xi
5.65
6.55
7.45
8.35
9.25
10.15
fi
3
5
9
7
5
3
32
hi
0.094
0.156
0.281
0.219
0.156
0.094
1.000
Fi
3
8
17
24
29
32
Hi
0.094
0.250
0.531
0.750
0.906
1.000
10
8
6
4
2
0
5.65
6.55
7.45
8.35
9.25 10.15
Mo=7.6
d1= 9-5 = 4
d2= 9-7 = 2
c= 0.9 = Tamao de Intervalo de Clase
La moda estimada utilizando estos datos agrupados es:
M o = 7.0 + (0.9)
4
= 7.0+0.6= 7.6
4+2
M o = 7.0 + (0.9)
0.125
= 7.0+ 0.6 =7.6
0.125 + 0.062
7.6
El gasto diario en peridicos ms frecuente es 7.6 soles
Arturo Rubio
4. MEDIA GEOMTRICA
Corresponde al valor representativo central de observaciones secuenciales y estrechamente
relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento,
disminucin. El promedio geomtrico de los valores: (Xi X2 .... Xf ) es:
XG = t
Xf
Xi
Ejemplo:
La tasa de inters mensual que se pag por un prstamo recibido por 3 meses
fue cambiando mes a mes; en el primer mes se pag un inters de 15%, en el segundo mes
10% y en el tercer mes 16%.La tasa de inters promedio mensual que se pag es:
Mes
Tasa
Factor
1
0.15
1.15
2
0.10
1.10
3
0.16
1.16
(13.6% mensual)
Ejemplo: El Producto Bruto Interno de un pas durante los ltimos cinco aos tuvo la evolucin
siguiente: Ao1: +5%. Ao 2: 0% Ao3: - 1% Ao 4: +2% y Ao5: + 4%.
La tasa de crecimiento anual promedio del PBI sera:
X G = 5 (1.05)(1.00)(0.99)(1.02)(1.04) = 1.0197
(1.97% anual)
Ejemplo: Se recibi un prstamo de 1000 soles por 3 meses y al final del perodo se pag un
total 1467.40 soles; Cul fue la tasa promedio de inters mensual que se pag?
Mes
Saldo
0
1000
Mes 1
Mes 2
XG = 3
Mes 3
1467.40
1467.40
= 1.136
1000
(13.6%)mensual
5. PROMEDIO PONDERADO
Cuando se desea encontrar el promedio de valores (X1 X2 ... Xk ) que ocurren con frecuencias (f1
f2 ... fk ) diferentes se debern ponderar los valores observados con pesos diferentes:
x=
Wi X i
i =1
Arturo Rubio
6. PROMEDIO TOTAL
Corresponde al valor promedio representativo de grupos de observaciones separadas o
diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por tanto:
XT =
ni:
n1 X 1 + n 2 X 2 + ...n k X k
n1 + n 2 + .... + n k
Grupo A
Xi
7.5
12.5
17.5
Grupo B
Nota
Xi
0-5
2.5
5-10
7.5
10-15
12.5
15-20
17.5
Total
Promedio del grupo B:
Fi
4
16
5
25
xA =
Promedio
Total
xB =
Grupo
Xi
fi
A
B
Totla
12.7
10.0
25
40
65
fi
8
10
16
6
40
xT =
7. MEDIA ARMNICA
El promedio armnico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor cero es:
X H=
n
1
1
1
1
+
+
+ ........
x1 x 2 x 3
xn
Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los
valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.
Ejemplo: Calcular el rendimiento promedio para el caso de tres automviles que recorrieron 500
kilmetros y cada auto tuvo el rendimiento siguiente:
Auto
Rendimiento (Km/galn)
XH =
A
50
B
62.4
C
77.6
3
3
Kilmetros(CONSTANTE)
=
= 61.334
1
1
1
0.0489121
galn
+
+
50 62.4 77.6
Verificacin:
Auto
A
B
C
Total
Arturo Rubio
Km
500
500
500
1500
Rendimiento
50
62.4
77.6
Total galones
10
8.0128
6.4433
24.4561
XH =
1500
= 61.334
24.4561
Percentiles:
c
Pk = Li +
Li
Fi-1
fi
c
k
kn
Fi-1
100
fi
Intervalo
De Clase
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
Frecuencia
Absoluta
fi
3
5
9
7
5
3
32
Marca de
Clase
Xi
5.65
6.55
7.45
8.35
9.25
10.15
Frecuencia
Relativa
hi
0.094
0.156
0.281
0.219
0.156
0.094
1.000
Frec.Acum.
Absoluta
Fi
3
8
17
24
29
32
Frec. Acum.
Relativa
Hi
0.094
0.250
0.531
0.750
0.906
1.000
P80% = Li +
c(80n/ 100 Fi 1 )
= 8.8 +
fi
0.9( 25.6-24 )
= 9.088
5
El 80% de los datos analizados sern menores a 9.088 y el 20% restante sern superiores
Cuartiles:
P75% = Li +
c(75n/ 100 Fi 1 )
= 7 .9 +
fi
0.9( 24 17 )
= 8.8
7
75% de los datos sern menores a 8.8 y el 25% de los datos restantes sern superiores
Deciles:
Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de
datos en 10 partes iguales.
El Decil 7(Percentil 70%) se ubicar en el cuarto intervalo
P70% = Li +
c(70n/ 100 Fi 1 )
= 7 .9 +
fi
0.9( 22.4-17 )
= 8.594
7
70% de los datos sern menores a 8.594 y el 30% restante sern superiores a 8.594.
0.70
8.594
Arturo Rubio
El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:
Cuartel
Posicin
Q1 =P25%
25(n + 1)
100
Q2 =P50%
50(n + 1)
100
Q3 =P75%
75(n + 1)
100
11
11
12
Percentil
Q1=P25
Q2=P50
Q3=P75
D8=P80
12
13
13
Posicin
0.25(13+1)=3.5
0.50(13+1)=7
0.75(13+1)=10.5
0.80(13+1)=11.2
13
14
15
17
18
20
Ejemplo: Para la representacin tallo hoja de los gastos en peridicos del hotel:
3
8
(9)
15
8
3
Tallo Hojas
237
5
24568
6
001125788
7
2233456
8
01246
9
10 1 2 2
Posicin
25(32 + 1)
= 8.25
100
50(32 + 1)
= 16.5
100
75(32 + 1)
= 24.75
100
Valor
Q1=6.8+(7.0-6.8)0.25= 6.85
Q2=7.8+(7.8-7.8)0.50= 7.80
Q3=8.6+(9.0-8.6)0.75= 8.90
Posicin
10(32 + 1)
= 3.3
100
90(32 + 1)
= 29.7
100
Valor
P10%=5.7+(6.2-5.7)0.3=5.85
P90%=9.6+(10.1-9.6)0.7=9.95
El 80% de los gastos diarios en peridicos est definido entre los 5.85 y 9.95 soles
0.10
0.80
5.85
Arturo Rubio
0.10
9.95
B. MEDIDAS DE VARIABILIDAD
1. AMPLITUD O RANGO
Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin)
2. VARIANCIA
S2 =
X i2 nX 2
i =1
n 1
x=
i =1
Xi
n
n
S2 =
3 + 4 + 6 + 7 20
=
=5
4
4
X i2 nX 2
i =1
n 1
3 2 + 4 2 + 6 2 + 7 2 4(5) 2 10
=
= 3.333
4 1
3
La variancia de los valores: (x1 x2 ... xk ) que ocurren con las frecuencias (f1 f2 ... fk ) es:
n
S2 =
f i X i2 nX 2
i =1
n 1
Ejemplo: Los gastos diarios en peridicos del hotel agrupados en la tabla de frecuencia:
Los clculos necesarios para determinar la variancia de los gastos diarios son:
Intervalo
Xi
fi
fiXi
fiXi
3
16.95
95.7675
5.2 - 6.1
5.65
n
5
32.75
214.5125
6.1 - 7.0
6.55
f i X i2 n X 2
2034 .74 32 ( 7.8719 ) 2
2
i =1
9
67.05
499.5225
7.0 - 7.9
7.45
S =
=
= 1.671
n
1
32 1
7
58.45
488.0575
7.9 - 8.8
8.35
5
46.25
427.8125
8.8 - 9.7
9.25
3
30.45
309.0675
9.7 - 10.6 10.15
TOTAL
32 251.9
2034.74
3. DESVIACIN ESTNDAR
Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este
indicador tiene la misma unidad de medida en la que se expresa el promedio.
Arturo Rubio
4. COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara
la desviacin estndar con el respectivo valor del promedio de los datos:
S
x100
x
Grado de variabilidad de los datos
Coeficiente de variabilidad
Con variabilidad baja
Menos de 10%
Con variabilidad moderada
De 10% a 30%
Con alta variabilidad
Ms de 30%
C.V . =
C.V . =
1.293
x100 = 16.4%
7.87
AK =
Grado de Asimetra
Simetra Perfecta
Sesgo Positivo
Sesgo Negativo
Asimetra Positiva
(Promedio>Mediana)
3( X M e )
S
Simtrica
Promedio=Mediana
Asimetra Negativa
Promedio<Mediana
En el ejemplo sobre los gastos diarios en peridicos el Promedio es 7.87 le Mediana es 7.80 y
la desviacin estndar 1.293, por tanto el sesgo es ligeramente positivo +0.16
D. MEDIDA DE FORMA: CURTOSIS
Evala el grado de apuntamiento de la distribucin, el coeficiente es: K U =
Grado de Apuntamiento
Mesocurtica (Distribucin normal)
Leptocrtica (Elevada)
Platicrtica (Aplanada)
Ku=0.263
P75 P25
2( P90 P10 )
Valor de la Curtosis
0.263
Mayor a 0.263 se aproxima a 0.5
Menor a 0.263 se aproxima a 0
Ku>0.263
Ku<0.263
Mesocrtica
Leptocrtica
Platicrtica
En el ejemplo de los gastos diarios en peridicos como Q3=8.8; Q2=7.0; P90=9.7 y P10=6.1 la
curtosis de la distribucin es 0.25; por tanto, la distribucin es ligeramente platicrtica.
Arturo Rubio
10
GRFICOS DE CAJAS
Tercer Cuartil:
Segundo Cuartil:
Primer Cuartil:
Rango Intercuatlico:
Lmite inferior:
Lmite Superior:
4.3
Q3= 8.8
Q2= 7.8
Q1= 7.0
IQR= Q3-Q1=8.8 -7.0=1.8
Q1-1.5(IQR)= 7.0-1.5(1.8)=4.3
Q3+1.5(IQR)= 8.8+1.5(1.8)=11.5
7.0
7.8
8.8
11.5
REGLA EMPRICA
Cuando la distribucin de frecuencia es simtrica:
( 68% )
7.87
6.577
5.284
3.991
9.163
( 95% )
( 99.7% )
10.456
11.749
Arturo Rubio
11
El promedio de la variables Yi es :
Y = aX i + b
S Y=a S
SY=a SX
Yi=aXi+b
2 2
X
Xi
2
6
10
14
18
fi
3
10
39
38
7
97
Fi
3
13
52
90
97
f i Xi
6
60
390
532
126
1114
fiX i
12
360
3900
7448
2268
13988
Promedio = 11.4845
Mediana = 11.641
Moda = 11.867
Variancia = 12.44
Desviacin estndar = 3.53
Si el profesor decide transformar las calificaciones en la forma: Yi=0.8Xi+2
Y = 0.8(11.4845) + 2 = 11.1876
Me =0.8(11.641)+2=11.313
Mo =0.8(11.867)+2=11.493
S Y=0.8 (12.44)=7.96
SY=0.8 (3.53)=2.82
Yi
3.6
6.8
10.0
13.2
16.4
fi
3
10
39
38
7
97
Fi
3
13
52
90
97
fiYi
10.8
68.0
390.0
501.6
114.8
1085.2
fiY i
38.88
462.40
3900.00
6621.12
1882.72
12905.12
Promedio = 11.1876
Mediana = 11.313
Moda = 11.493
Variancia = 7.96
Desviacin estndar = 2.82
Arturo Rubio
12