Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica
Estadistica
Son estadgrafos de posicin que son interpretados como valores que permiten resumir a un
conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro de
gravedad que adoptan un valor representativo para todo un conjunto de datos predeterminados.
Estas medidas son:
1. Promedio Aritmtico (Media o simplemente promedio)
2. Mediana
3. Moda
4. Promedio Geomtrico
5. Promedio Ponderado
6. Promedio Total
7. Media Armnica
Otras medidas de posicin son: Cuartiles, Deciles y Percentiles
B.
MEDIDAS DE VARIABILIADAD
MEDIDAS DE FORMA
Arturo Rubio
x=
xi
i=1
x 1+ x2 + x3 + .... + xn
n
Ejemplo: Durante los ltimos 32 das el valor de las compras en peridicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.2, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
El promedio aritmtico del valor de las compras de peridicos es:
n
x=
xi
i=1
250.2
32
= 7.82
fi Xi
x=
Donde:
i=1
Ejemplo: Para los gastos diarios en peridicos del hotel agrupados en una tabla de frecuencia:
Intervalo
Xi
fi
hi
Fi
Hi
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
3
5
9
7
5
3
32
0.094
0.156
0.281
0.219
0.156
0.094
1.000
3
8
17
24
29
32
0.094
0.250
0.531
0.750
0.906
1.000
10
8
6
4
2
0
5.65
6.55
7.45
8.35
9.25 10.15
7.87
fi Xi
x=
i=1
=
n
7.87
32
251.9
32
Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.87 soles
Arturo Rubio
2. LA MEDIANA
Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50%
de las observaciones son mayores que este valor y el otro 50% son menores.
(n +
. Ejemplos:
2
En los 7datos ordenados:
{4, 5, 5, 6, 7, 8, 9 }
(7 + 1)
La ubicacin de la mediana es:
= 4 Luego el valor de la mediana es:
Me=6
2
En los 8 datos ordenados:
{3, 4, 5, 5, 6, 7, 8, 9}
(8 + 1)
5+6
La mediana se ubica en el lugar
= 5.5
= 4.5 Luego el valor de la mediana es Me =
2
2
n
F
2 i-1
c
Me = Li +
fi
= Li +
c(0.50 H i-1 )
hi
Donde:
Li
= Lmite Inferior del intervalo que contiene a la Mediana
Fi-1
= Frecuencia Acumulada en la clase anterior i-sima
fi
= Frecuencia en la clase que contiene a la mediana
Hi-1
= Frecuencia Relativa Acumulada en la clase anterior i-sima
hi
= Frecuencia Relativa en la clase que contiene a la mediana
c
=Tamao del intervalo de clase.
Ejemplo: Para los gastos diarios en peridicos del hotel en una tabla de frecuencia:
Intervalo
Xi
fi
hi
Fi
Hi
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
3
5
9
7
5
3
32
0.094
0.156
0.281
0.219
0.156
0.094
1.000
3
8
17
24
29
32
0.094
0.250
0.531
0.750
0.906
1.000
10
6
4
2
0
5.65
6.55
7.45
8.35
9.25 10.15
Me=7.8
0.9
La Mediana es:
Me = 7.0 +
32
9
8
2
0.9(0.5 0.25)
= 7.0+
= 7.8
0.281
El 50% de los das el hotel gast menos de 7.8 soles en la compra de peridicos
0.50
0.50
7.8
3. LA MODA
Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son:
- Puede no existir o existir ms de una moda
- Su valor no se ve afectado por los valores extremos en los datos
- Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa
- Es una medida inestable cuando en nmero de datos es reducido.
Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
Moda = Mo = 7.1;
M o = Li + c
Donde:
d1=(fi - fi-1)
d1
d1 + d 2
d1=(fi - fi+1)
Ejemplo: El gasto diario en peridicos del hotel AAA agrupados en una tabla de frecuencia:
Intervalo
Xi
fi
hi
Fi
Hi
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
3
5
9
7
5
3
32
0.094
0.156
0.281
0.219
0.156
0.094
1.000
3
8
17
24
29
32
0.094
0.250
0.531
0.750
0.906
1.000
10
8
6
4
2
0
5.65
6.55
7.45
8.35
Mo=7.6
d1= 9-5 = 4
d2= 9-7 = 2
c= 0.9 = Tamao de Intervalo de Clase
La moda estimada utilizando estos datos agrupados es:
M o = 7.0 + (0.9)
4
= 7.0+0.6= 7.6
4+2
M o = 7.0 + (0.9)
0.125
= 7.0+ 0.6 =7.6
0.125 + 0.062
7.6
El gasto diario en peridicos ms frecuente es 7.6 soles
9.25 10.15
4. MEDIA GEOMTRICA
Corresponde al valor representativo central de observaciones secuenciales y estrechamente
relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento,
disminucin. El promedio geomtrico de los valores: (Xi X2 .... Xf ) es:
XG =t
Xf
Xi
Ejemplo:
La tasa de inters mensual que se pag por un prstamo recibido por 3 meses
fue cambiando mes a mes; en el primer mes se pag un inters de 15%, en el segundo mes
10% y en el tercer mes 16%.La tasa de inters promedio mensual que se pag es:
Mes
Tasa
Factor
1
0.15
1.15
2
0.10
1.10
3
0.16
1.16
(13.6% mensual)
Ejemplo: El Producto Bruto Interno de un pas durante los ltimos cinco aos tuvo la evolucin
siguiente: Ao1: +5%. Ao 2: 0% Ao3: - 1% Ao 4: +2% y Ao5: + 4%.
La tasa de crecimiento anual promedio del PBI sera:
X G = 5 (1.05)(1.00)(0.99)(1.02)(1.04) =
1.0197
(1.97% anual)
Ejemplo: Se recibi un prstamo de 1000 soles por 3 meses y al final del perodo se pag
un total 1467.40 soles; Cul fue la tasa promedio de inters mensual que se pag?
Mes
Saldo
0
1000
Mes 1
Mes 2
XG = 3
Mes 3
1467.40
1467.40
= 1.136
1000
(13.6%)mensual
5. PROMEDIO PONDERADO
Cuando se desea encontrar el promedio de valores (X1 X2 ... Xk ) que ocurren con frecuencias (f1
f2 ... fk ) diferentes se debern ponderar los valores observados con pesos diferentes:
K
x=
Wi X i
i =1
6. PROMEDIO TOTAL
Corresponde al valor promedio representativo de grupos de observaciones separadas o
diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por tanto:
XT =
ni:
n 1 X 1 + n 2 X 2 + ...nk X k
n1 + n 2 + .... + n k
Grupo A
Xi
7.5
12.5
17.5
Grupo B
Nota
Xi
0-5
2.5
5-10
7.5
10-15
12.5
15-20
17.5
Total
Promedio del grupo B:
Fi
4
16
5
25
x =
12.7
A
xB =
fi
8
10
16
6
40
25
Promedio
Total
Grupo
Xi
fi
A
B
Totla
12.7
10.0
25
40
65
xT =
= 11.04
7. MEDIA ARMNICA
El promedio armnico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor cero es:
XH=
n
1
1
1
1
+
+ ........
+
x1 x 2 x 3
xn
Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los
valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.
Ejemplo: Calcular el rendimiento promedio para el caso de tres automviles que recorrieron 500
kilmetros y cada auto tuvo el rendimiento siguiente:
Auto
Rendimiento (Km/galn)
XH =
A
50
B
62.4
C
77.6
3
3
Kilmetros(CONSTANTE)
= 61.334
=
1
1
1
0.0489121
galn
+
+
50 62.4 77.6
Verificacin:
Auto
A
B
C
Total
Km
500
500
500
1500
Rendimiento
50
62.4
77.6
Total galones
10
8.0128
6.4433
24.4561
H=
1500
= 61.334
24.4561
Percentiles:
c
Pk = Li +
Li
Fi-1
fi
c
k
kn
Fi-1
100
fi
Intervalo
De Clase
5.2 - 6.1
6.1 - 7.0
7.0 - 7.9
7.9 - 8.8
8.8 - 9.7
9.7 - 10.6
TOTAL
Marca de
Clase
Xi
5.65
6.55
7.45
8.35
9.25
10.15
Frecuencia
Absoluta
fi
3
5
9
7
5
3
32
Frecuencia
Relativa
hi
0.094
0.156
0.281
0.219
0.156
0.094
1.000
Frec.Acum.
Absoluta Fi
3
8
17
24
29
32
Frec. Acum.
Relativa
Hi
0.094
0.250
0.531
0.750
0.906
1.000
c(80n/100 Fi 1 )
0.9( 25.6-24
P80% = Li +
= 8.8 +
= 9.088
)
fi
5
El 80% de los datos analizados sern menores a 9.088 y el 20% restante sern superiores
Cuartiles:
c(75n/100 Fi 1 )
P75% = Li +
= 7.9 +
fi
0.9( 24 17
= 8.8
)
7
75% de los datos sern menores a 8.8 y el 25% de los datos restantes sern superiores
Deciles:
Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de
datos en 10 partes iguales.
El Decil 7(Percentil 70%) se ubicar en el cuarto intervalo
c(70n/100 Fi 1 )
0.9( 22.4-17 )
P70% = Li +
= 7.9 +
= 8.594
fi
7
70% de los datos sern menores a 8.594 y el 30% restante sern superiores a 8.594.
0.70
8.594
El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:
Cuartel
Posicin
Q1 =P25%
25(n + 1)
100
Q2 =P50%
50(n + 1)
100
Q3 =P75%
75(n + 1)
100
11
11
12
Percentil
Q1=P25
Q2=P50
Q3=P75
D8=P80
12
13
Posicin
0.25(13+1)=3.5
0.50(13+1)=7
0.75(13+1)=10.5
0.80(13+1)=11.2
13
13
14
15
17
18
20
Ejemplo: Para la representacin tallo hoja de los gastos en peridicos del hotel:
3
8
(9)
15
8
3
Tallo Hojas
5 237
6 24568
7 001125788
8 2233456
9 01246
10 1 2 2
Posicin
25(32 + 1)
= 8.25
100
50(32 + 1)
= 16.5
100
75(32 + 1)
= 24.75
100
Valor
Q1=6.8+(7.0-6.8)0.25= 6.85
Q2=7.8+(7.8-7.8)0.50= 7.80
Q3=8.6+(9.0-8.6)0.75= 8.90
Posicin
10(32 + 1)
= 3.3
100
90(32 + 1)
= 29.7
100
Valor
P10%=5.7+(6.2-5.7)0.3=5.85
P90%=9.6+(10.1-9.6)0.7=9.95
El 80% de los gastos diarios en peridicos est definido entre los 5.85 y 9.95 soles
0.10
5.85
0.80
0.10
9.95
B. MEDIDAS DE VARIABILIDAD
1. AMPLITUD O RANGO
Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin)
2. VARIANCIA
Xi nX
2
i =1
S =
n1
x=
Xi
3 + 4 + 6 + 7 20
=
=
=5
n
4
4
i =1
n
i
S =
2
2
X nX
i =1
n1
4(5)2
3 +4 +6 +7
=
41
10
= 3.333
La variancia de los valores: (x1 x2 ... xk ) que ocurren con las frecuencias (f1 f2 ... fk ) es:
n
f i X i nX
2
S =
i =1
n1
= 1.671
3. DESVIACIN ESTNDAR
Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este
indicador tiene la misma unidad de medida en la que se expresa el promedio.
S= S
4. COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara
la desviacin estndar con el respectivo valor del promedio de los datos:
S
C.V . =
x100
x
Grado de variabilidad de los datos
Con variabilidad baja
Con variabilidad moderada
Con alta variabilidad
Coeficiente de variabilidad
Menos de 10%
De 10% a 30%
Ms de 30%
CV =
. .
x
1.293
7.87
100 = 16.4%
Evala el grado de distorsin o inclinacin que adopta la distribucin de los datos respecto a su
valor promedio tomado como centro de gravedad. El coeficiente de asimetra de Pearson es:
3( X M )
AK =
Grado de Asimetra
Simetra Perfecta
Sesgo Positivo
Sesgo Negativo
Asimetra Positiva
(Promedio>Mediana)
Simtrica
Promedio=Mediana
Asimetra Negativa
Promedio<Mediana
En el ejemplo sobre los gastos diarios en peridicos el Promedio es 7.87 le Mediana es 7.80 y
la desviacin estndar 1.293, por tanto el sesgo es ligeramente positivo +0.16
D. MEDIDA DE FORMA: CURTOSIS
Evala el grado de apuntamiento de la distribucin, el coeficiente es:
KU
Grado de Apuntamiento
Mesocurtica (Distribucin normal)
Leptocrtica (Elevada)
Platicrtica (Aplanada)
Ku=0.263
Ku>0.263
P75 P25
2(P90 P10 )
Valor de la Curtosis
0.263
Mayor a 0.263 se aproxima a 0.5
Menor a 0.263 se aproxima a 0
Ku<0.263
Mesocrtica
Leptocrtica
Platicrtica
En el ejemplo de los gastos diarios en peridicos como Q3=8.8; Q2=7.0; P90=9.7 y P10=6.1 la
curtosis de la distribucin es 0.25; por tanto, la distribucin es ligeramente platicrtica.
10
Arturo Rubio
Apuntes Estadstica General
GRFICOS DE CAJAS
Tercer Cuartil:
Segundo Cuartil:
Primer Cuartil:
Rango Intercuatlico:
Lmite inferior:
Lmite Superior:
4.3
Q3= 8.8
Q2= 7.8
Q1= 7.0
IQR= Q3-Q1=8.8 -7.0=1.8
Q1-1.5(IQR)= 7.0-1.5(1.8)=4.3
Q3+1.5(IQR)= 8.8+1.5(1.8)=11.5
7.0
7.8
8.8
11.5
REGLA EMPRICA
Cuando la distribucin de frecuencia es simtrica:
( 68% )
7.87
6.577
5.284
3.991
9.163
( 95% )
( 99.7% )
10.456
11.749
Yi =aXi +b
Y = aX i + b
El promedio de la variables Yi es :
S 2Y=a 2S 2X
SY=a SX
Xi
2
6
10
14
18
fi
3
10
39
38
7
97
Fi
3
13
52
90
97
f iX i
6
60
390
532
126
1114
fi X i
12
360
3900
7448
2268
13988
Promedio = 11.4845
Mediana = 11.641
Moda = 11.867
Variancia = 12.44
Desviacin estndar = 3.53
Si el profesor decide transformar las calificaciones en la forma: Yi=0.8Xi+2
Y = 0.8(11.4845) + 2 = 11.1876
Me =0.8(11.641)+2=11.313
Mo =0.8(11.867)+2=11.493
S 2Y=0.82(12.44)=7.96
SY=0.8 (3.53)=2.82
Yi
3.6
6.8
10.0
13.2
16.4
fi
3
10
39
38
7
97
Promedio = 11.1876
Mediana = 11.313
Moda = 11.493
Variancia = 7.96
Desviacin estndar = 2.82
Fi
3
13
52
90
97
f i Yi
10.8
68.0
390.0
501.6
114.8
1085.2
f iY i
38.88
462.40
3900.00
6621.12
1882.72
12905.12