Documentos de Académico
Documentos de Profesional
Documentos de Cultura
\
|
A + A
A
+ =
1
A
2
A
La Moda
DATOS AGRUPADOS EN INTERVALOS:
Ejemplo 17:
Datos agrupados en intervalos de Clase Cerrados
98
Limite inferior del Intervalo modal = 64, por que es de mayor
Frecuencia
C = 4
4 30 34
1
= = A 23 11 34
2
= = A
Intevalos Cerrados MC
i
f
i
60 64 62 30
64 68 66 34
68 72 70 11
72 76 74 13
76 80 78 3
80 84 82 7
Intervalo de mayor frecuencia
La Moda
Ejemplo 18:
Datos agrupados en intervalos de Clase Cerrados
98
Intervalos Cerrados MC
i
f
i
60 64 62 30
64 68 66 34
68 72 70 11
72 76 74 13
76 80 78 3
80 84 82 7
Intervalo de mayor frecuencia
( ) 65 59 , 64 59 , 0 64 4 0,148 64 4
27
4
64 4
23 4
4
64 = = + = + =
|
.
|
\
|
+ =
|
.
|
\
|
+
+ = Moda
La Moda
Ejemplo 19:
47
Moda para datos agrupados en intervalos de Clase
Cerrados / Abiertos
Cuando se trabaja con intervalos cerrados abiertos
debemos considerar ahora El limite Real Inferior y
el tamao del Intervalo Vara en un dgito. Los
dems valores Participan de la misma forma
c Moda -
|
|
.
|
\
|
A + A
A
+ =
2 1
1
Infef. Real Limt.
La Moda
48
98
Intervalos Cerr. Abierto
MC
i
f
i
60 64 62 37
65 69 67 37
70 74 72 10
75 79 77 7
80 84 82 7
64.5 0 64.5 5
27 0
0
64,5 = + =
|
.
|
\
|
+
+ = Moda
La Moda
Ejemplo 20:
49
UNIMODAL
50
BIMODAL
51
0,0000
0,0500
0,1000
0,1500
0,2000
0,2500
0,3000
0,3500
0,4000
0,4500
0,5000
4 5 6 7 0 1 2 3
Q1 Q2 Q3 Q4
Moda
Media
Aritmtica
Mediana
Rango
Medidas de Tendencia
Recordando las Medidas de Tendencia
53
MEDIDAS DE DISPERSION
54
Se llaman medidas de dispersin aquellas que
permiten retratar la distancia de los valores de la
variable a un cierto valor central, o que permiten
identificar la concentracin de los datos en un
cierto sector del recorrido de la variable. Se trata
de coeficiente para variables cuantitativas.
Rango
Rango Intercuartlico
Varianza Muestral
Desviacin Media
Rango Percentil
Grafico de Cajas
Medidas de Dispersin
55
Dispersin: Amplitud Cuartlica
Amplitud Total = Valor Mayor Valor Menor
Amplitud Total =Q
3
Q
1
i
f
n
4
a
L
i
Q
1
+
=
i-1
F ) (
-
i
f
3n
2
a
L
i
Q
3
+
=
i-1
F ) (
-
56
Dispersin: Amplitud Cuartlica
Amplitud Total = Valor Mayor Valor Menor
Amplitud Total =Q
3
Q
1
i
f
n
4
a
L
i
Q
1
+
=
i-1
F ) (
-
i
f
3n
2
a
L
i
Q
3
+
=
i-1
F ) (
-
57
Dispersin: Varianza Poblacional
2
: Variancia Poblacional
: Media Poblacional
X
i
: i-simo valor observado
N
: Tamao de la poblacin
(X
i
- )
2
2
=
N
1
) (
2
1
2
=
n
x x
S
n
i
i
Qu unidades tiene la varianza?
Dispersin: Varianza Muestral
59
Dispersin: Desviacin Estndar Poblacional
: Desviacin Estndar Poblacional
: Media Poblacional
X
i
: i-simo valor observado
N
: Tamao de la poblacin
(X
i
- )
2
=
N
1
) (
2
1
=
n
x x
S
n
i
i
Dispersin: Desviacin Estndar Muestral
61
Datos Agrupados:
f
i
: Frecuencia absoluta Clase i
MC
i
: Marca Clase i
X : Media Aritmtica
n
: Tamao Muestra
k : N de clases
S
2
: Varianza muestral
_
=
k
i
X MC
i
i
f
1
2
) (
S
2
=
_
a
e
n
e
MC
i
x
i-1
MC
k
_
x
f
i
f
k
Datos NO Agrupados:
Dispersin: Varianza Muestral
=
n
i
X X
i
1
2
) (
S
2
=
_
s
2
: Variancia Muestral
X : Media Aritmtica
X
i
: i-simo valor observado
n
: Tamao Muestra
n - 1
n - 1
INTERVALOS MC
i
f
i
[
1266,45 - 1269,05
)
1266,75 6
744,60
[
1269,05 - 1271,65
)
1269,35 7
510,52
[
1271,65 - 1274,25
)
1271,95 12
423,40
[
1274,25 - 1276,85
)
1274,55 15
167,33
[
1276,85 - 1279,45
)
1277,15 18
9,86
[
1279,45 - 1282,05
)
1279,75 29
100,33
[
1282,05 - 1284,65
)
1282,35 15
298,37
[
1284,65 - 1287,25
)
1284,95 13
647,97
[
1287,25 - 1289,85
]
1287,55 5
466,58
120
28,07
f
i
2
X) *(MC
i
Ejemplo 21:
CALCULO DE LA VARIANZA
EN DATOS AGRUPADOS
63
Datos Agrupados:
f
i
: Frecuencia absoluta Clase i
MC
i
: Marca Clase i
X : Media Aritmtica
n
: Tamao Muestra
k : N de clases
S : Desviacion muestral
=
k
i
X MC
i
i
f
1
2
) (
S
=
_
a
e
n
e
MC
i
x
i-1
MC
k
_
x
f
i
f
k
Datos NO Agrupados:
Dispersin: Desviacion Muestral
=
n
i
X X
i
1
2
) (
S
=
_
s : Desviacion Muestral
X : Media Aritmtica
X
i
: i-simo valor observado
n
: Tamao Muestra
n - 1
n - 1
64
Datos Agrupados: Datos Agrupados: Datos NO Agrupados:
MD : Desviacin Media
X : Media Aritmtica
X
i
: i-simo valor observado
n
: Tamao Muestra
MD
=
=
n
i
X X
i
1
_
n
Dispersin: Desviacin Media
f
i
: Frecuencia absoluta Clase i
MC
i
: Marca Clase i
X : Media Aritmtica
n
: Tamao Muestra
k : N de clases
| | : valor absoluto
a
e
n
e
MC
i
MC
i-1
MC
k
_
x
f
i
f
k
=
1 i
i
f
MD =
X
MC
i
k
n
| | : valor absoluto
INTERVALOS MC
i
f
i
[
1266,45 - 1269,05
)
1266,75 6
66,84
[
1269,05 - 1271,65
)
1269,35 7
59,78
[
1271,65 - 1274,25
)
1271,95 12
71,28
[
1274,25 - 1276,85
)
1274,55 15
50,10
[
1276,85 - 1279,45
)
1277,15 18
13,32
[
1279,45 - 1282,05
)
1279,75 29
53,94
[
1282,05 - 1284,65
)
1282,35 15
66,90
[
1284,65 - 1287,25
)
1284,95 13
91,78
[
1287,25 - 1289,85
]
1287,55 5
48,30
120
4,35
f
i
X * MC
i
Ejemplo 22:
DESVIACION MEDIA DE
DATOS AGRUPADOS
Dispersin: Amplitud Centlica
i-1
F
) (
-
i
f
10n
100
a
L
i
10 Centil
+
=
i-1
F
) (
-
i
f
90n
100
a
L
i
90 Centil
+
=
67
MEDIDAS DE VARIACION
68
Coeficiente
de Variacin
100 * %
x
s
CV =
El coeficiente de variacin es la relacin entre la
desviacin tpica de una muestra y su media.
El coeficiente de variacin se suele expresar en
porcentajes.
El coeficiente de variacin permite comparar las
dispersiones de dos distribuciones distintas, siempre
que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los
valores que se obtienen se comparan entre s.
La mayor dispersin corresponder al valor del
coeficiente de variacin mayo.
Coeficiente
de Variacin
100 * %
x
s
CV =
Una distribucin tiene X = 140 y = 28.28 y otra
x = 150 y = 24. Cul de las dos presenta mayor
dispersin?
La primera distribucin presenta mayor dispersin.
70
Representacin visual para describir, simultneamente, varias
caractersticas importantes tales como
Centro
Dispersin
Desviacin de la asimetra
Identificacin de las observaciones (valores atpicos)
Q
1
Q
2
Q
3
Mediana
Min. Max.
D = ndice de Dispersin =
(rangQ
3
- rangQ
1
) / (K-1)
Diagramas de Cajas y Bigotes
Los diagramas de caja y bigotes son una presentacin visual
que describe varias caractersticas importantes, al mismo
tiempo, tales como la simetra y la dispersin.
Para su realizacin se representan los 3 cuartiles y los
valores mnimo y mximo de los datos, sobre un rectngulo,
alineado horizontalmente o verticalmente.
Una grfica de este tipo consiste en una caja rectangular,
donde los lados ms largos muestran el recorrido
intercuartlico ( Q Q). Este rectngulo esta dividido por un
segmento vertical que indica donde se posiciona la mediana.
Los valores extremos se unen por segmentos con los
extremos de la caja, y se denominan bigotes. Veamos un
ejemplo
Diagramas de Cajas y Bigotes
Ejemplo: Se tiene la edad de 20 personas y se desea saber la
distribucin de ellas: 36, 25, 37, 24, 39, 20, 36, 45,31, 31, 39,
24, 29 ,23, 41, 40, 33, 24, 34 y 40. Construya un diagrama de
caja y bigotes.
1. En primer lugar se deben ordenar los datos para poder
calcular los 3 cuartiles: 20, 23, 24, 24, 24, 25, 29, 31, 31, 33,
34, 36, 36, 37, 39, 39, 40, 40, 41 y 45.
2. Q
1
, el Primer Cuartl es el valor mayor que el 25% de los
valores de la distribucin. Como N = 20 resulta que (N+1)/4 =
5.25; el Primer Cuartil viene determinado por el redondeo a
la quinta posicin:
Diagramas de Cajas y Bigotes
3. Q
1
= 24
4. Q
2
, el Segundo Cuartil es la mediana de la distribucin, es el
valor de la variable que ocupa el lugar central en un conjunto
de datos ordenados. Como (N+1)/2 = 10.5; la mediana es la
media aritmtica de la posicin 10 y 11:
5. Q
2
= (33 + 34)/ 2 =33,5
6. Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de los
valores de la distribucin. En nuestro caso, como 3(N+1)/ 4 =
15.75, eso se traduce a posicin 16 por el redondeo:
7. Q
3
= 39
Diagramas de Cajas y Bigotes
Se dibuja el diagrama:
Puede obtenerse informacin de una distribucin a partir de
estas representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la
poblacin est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (X
mn
, Q
1
) es ms corto que el de la derecha;
por ello el 25% de los ms jvenes estn ms concentrados que el
25% de los mayores.
El rango intercuartlico = Q
3
- Q
1
= 14,5; es decir, el 50% de la
poblacin est comprendido en 14,5 aos.
Diagramas de Cajas y Bigotes
[El diagrama de cajas: caja desde Q
1
a Q
3
(50% de los datos), bigotes
el recorrido
Diagramas de Cajas y Bigotes
76
Comparaciones grficas entre conjuntos de datos
1
2
3
70 80 90 100 110 120
Diagramas de Cajas y Bigotes
78
Si k
> 0.263 , entonces la distribucin es leptocrtica
Si k < 0.263 , entonces la distribucin es platicrtica
Si k = 0.263 , entonces la distribucin es mesocrtica
Medidas de Apuntamiento
(Curtosis o Kurtosis)
Q
K =
Indica que tan apuntada o achatada se encuentra una
distribucin respecto a un comportamiento normal
(distribucin normal). Y se calcula por medio de la
siguiente ecuacin:
P
90
- P
10
Q=(Q
3
-Q
1
)/2
CUARTILAS Q
1
Y Q
3
i-1
F
) (
-
i
f
n
4
a
L
i
Q
1
+
=
i-1
F
) (
-
i
f
3n
4
a
L
i
Q
3
+
=
Q
1
< Me=Q
2
< Q
3
INTERVALOS MC
i
f
i
F
i
[
1266,45 - 1269,05 ) 1266,75 6 6
[
1269,05 - 1271,65 ) 1269,35 7 13
[
1271,65 - 1274,25 ) 1271,95 12 25
[
1274,25 - 1276,85 ) 1274,55 15 40
[
1276,85 - 1279,45 ) 1277,15 18 58
[
1279,45 - 1282,05 ) 1279,75 29 87
[
1282,05 - 1284,65 ) 1282,35 15 102
[
1284,65 - 1287,25 ) 1284,95 13 115
[
1287,25 - 1289,85 ] 1287,55 5 120
120
Ejemplo 23:
CALCULO DE LA CUARTILA Q
1
81
Datos Agrupados:
L
i
: 1274.25
F
i-1
: 25
f
i
: 15
a : 2.6
n : 120
Q
1
: 1275.12
a
e
L
CUARTILA Q
1
15
120
4
2.6
1274.25
M
e
+
=
25
)
(
-
INTERVALOS MC
i
f
i
F
i
[
1266,45 - 1269,05 ) 1266,75 6 6
[
1269,05 - 1271,65 ) 1269,35 7 13
[
1271,65 - 1274,25 ) 1271,95 12 25
[
1274,25 - 1276,85 ) 1274,55 15 40
[
1276,85 - 1279,45 ) 1277,15 18 58
[
1279,45 - 1282,05 ) 1279,75 29 87
[
1282,05 - 1284,65 ) 1282,35 15 102
[
1284,65 - 1287,25 ) 1284,95 13 115
[
1287,25 - 1289,85 ] 1287,55 5 120
120
Ejemplo 24:
CALCULO DE LA CUARTILA Q
3
83
Datos Agrupados:
L
i
: 1282.05
F
i-1
: 87
f
i
: 15
a : 2.6
n : 120
Q
3
: 1282.57
a
e
L
CUARTILA Q
3
15
3*120
4
2.6
1282.05
M
e
+
=
87
)
(
-
INTERVALOS MC
i
f
i
F
i
[
1266,45 - 1269,05 ) 1266,75 6 6
[
1269,05 - 1271,65 ) 1269,35 7 13
[
1271,65 - 1274,25 ) 1271,95 12 25
[
1274,25 - 1276,85 ) 1274,55 15 40
[
1276,85 - 1279,45 ) 1277,15 18 58
[
1279,45 - 1282,05 ) 1279,75 29 87
[
1282,05 - 1284,65 ) 1282,35 15 102
[
1284,65 - 1287,25 ) 1284,95 13 115
[
1287,25 - 1289,85 ] 1287,55 5 120
120
CALCULO DEL PERCENTIL P
10
Ejemplo 25:
85
Datos Agrupados:
L
i
: 1269.05
F
i-1
: 6
f
i
: 7
a : 2.6
n : 120
P
10
: 1270.54
a
e
L
PERCENTIL P
10
7
10*120
100
2.6
1269.05
P
10
+
=
6
)
(
-
INTERVALOS MC
i
f
i
F
i
[
1266,45 - 1269,05 ) 1266,75 6 6
[
1269,05 - 1271,65 ) 1269,35 7 13
[
1271,65 - 1274,25 ) 1271,95 12 25
[
1274,25 - 1276,85 ) 1274,55 15 40
[
1276,85 - 1279,45 ) 1277,15 18 58
[
1279,45 - 1282,05 ) 1279,75 29 87
[
1282,05 - 1284,65 ) 1282,35 15 102
[
1284,65 - 1287,25 ) 1284,95 13 115
[
1287,25 - 1289,85 ] 1287,55 5 120
120
CALCULO DEL PERCENTIL P
90
Ejemplo 26:
87
Datos Agrupados:
L
i
: 1284.65
F
i-1
: 102
f
i
: 13
a : 2.6
n : 120
P
90
: 1285.85
a
e
L
PERCENTIL P
90
13
90*120
100
2.6
1284.65
P
90
+
=
102
)
(
-
88
Si k < 0.263 , entonces la distribucin es platicrtica
Medidas de Apuntamiento
(Curtosis o Kurtosis)
Q
K =
Reemplazamos:
P
90
- P
10
Q=(Q
3
-Q
1
)/2
Q=3.725
3.725
K =
15.31
0.2433050
=
Evala el grado de distorsin o inclinacin que adopta la
distribucin de los datos respecto a su valor promedio
tomado como centro de gravedad. El coeficiente de
asimetra de Pearson es:
ASIMETRIA O SESGO
Coeficiente de
Asimetra:
Desviacin Estndar
3(Media Mediana)
A
=
Ejemplo: Sobre los gastos diarios en peridicos la
media es 7.87 y la mediana es 7.80 y la desviacin
estndar 1.293, por tanto el sesgo es ligeramente
positivo + 0.16
ASIMETRIA O SESGO
Coeficiente de
Asimetra:
Desviacin Estndar
3(Media Mediana)
A
=
Ejemplo: Sobre los datos mencionados el sesgo es
0.486, y se puede decir que positivo.
Coeficiente de
Asimetra:
5.298
3(1277.89 1277.03)
A
=
ASIMETRIA O SESGO
Si oigo algo lo olvido.
Si lo veo lo entiendo.
Si lo hago lo aprendo.
Confucio (551-478 A.C.)