Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2.
1
Construccin de
tabla de
frecuencias para
datos agrupados
k 1 3.3 Log N
Donde:
K=Nmero de intervalos
El cual siempre debe ser un nmero entero. Razn por la
cual se deber redondear el resultado al entero ms
cercano.
N = Nmero de datos.
Log = logaritmo en base 10.
k N
Recomendable para tamaos de muestra pequeos (n< 50).
El nmero de intervalos determinado mediante cualquier regla se
aproxima al valor entero ms cercano pero deber ser
responsabilidad de quien realiza el estudio, pudiendo utilizar ste en
ocasiones uno menor o mayor al obtenido por cualquier regla, si esto
le permite tener intervalos con la misma amplitud. Sin embargo, la
mayora de las reglas subestiman el nmero de intervalos.
2. Calcular el rango de los datos
En estadstica, el rango representa la diferencia entre el valor
mximo y el valor mnimo de un conjunto de datos. El rango nos
muestra la distribucin de los valores en una serie. Si el rango es un
nmero muy alto, entonces los valores de la serie estn bastante
distribuidos. En cambio, si se trata de un nmero pequeo, quiere
decir que los valores de la serie estn muy cerca entre s. Se
representa con la letra R.
Ac
R
k
Tambin ser muy til conocer y calcular la Marca de Clase (MC) de cada
intervalo: Se refiere al Punto Medio del intervalo y a travs de l representaremos
a todo el intervalo y una de las maneras de calcularla es promediando los valores
lmite de cada intervalo, su frmula es:
Mc
Li Ls
2
Ejemplo 3
k 1 3.3logN
1 3.3log(30)
=1 3.3(1.4771)
=1 4.87
k 5.87 6
2. calcular el rango de variacin
R 30
k
6
Ac 5
Ac
xi
[9095)
[95100)
[100105)
[105110)
[110115
[115120)
total
fa
fr
f ra
Mc
0.07
0.07
92.5
10
0.27
0.34
97.5
15
0.17
0.51
102.5
19
0.13
0.64
107.5
25
0.2
0.84
112.5
30
0.16
117.5
30
Histograma
Se utiliza para la representacin de variables cuantitativas continuas, es
una grfica en forma de barras que consta de dos ejes, uno horizontal, llamado eje
de la variable en observacin, en donde situamos la base de una serie de
rectngulos o barras contiguas; es decir, que no van separadas, y que se rotula
con los lmites inferiores de cada clase o intervalo excepto el ltimo que deber
llevar tambin el lmite superior, centradas en la marca de clase. Y un eje vertical
llamado eje de las frecuencias, en donde se miden las alturas que vienen dadas
por la frecuencia del intervalo que representa.
Todos los intervalos deben tener la misma longitud. Si se utilizarn
rectngulos de amplitud diferente, el rea del rectngulo es la que tendra que ser
proporcional a la frecuencia absoluta correspondiente a ese intervalo. Histograma
acumulativo, si se utiliza la frecuencia absoluta acumulativa.
Utilizando los datos del ejemplo 3 obtenemos la siguiente grfica:
Polgono de frecuencia
Es una grfica del tipo de las grficas de lneas trazadas sobre las marcas
de clase, (de ah el nombre de polgono), y se traza uniendo con segmentos de
recta, de izquierda a derecha, las parejas ordenadas que se forman, al considerar
como abscisa la marca de clase (eje horizontal) y como ordenada la frecuencia del
intervalo representado (eje vertical); la primera y ltima parejas ordenadas se unen
mediante un segmento de recta al eje horizontal, con las que seran la marca de
clase anterior y posterior respectivamente si estas existieran.
Este tipo de grfico adquiere mayor importancia cuando se quiere mostrar
en un mismo grfico ms de una distribucin o una clasificacin cruzada de una
variable contina con una discreta, situacin que no se puede observar en uno de
los grficos presentados anteriormente por la forma de construccin del mismo
grfico.
2.
2
Medidas de
tendencia central
Media aritmtica
X
Mediana
X
moda
10
Datos no agrupados
Media Aritmtica. La medida ms evidente que podemos calcular para
describir un conjunto de observaciones numricas es su valor medio. La media no
es ms que la suma de todos los valores de una variable dividida entre el nmero
total de datos de los que se dispone. Siendo su frmula la siguiente:
X
N
21 32 15 59 60 61 64 60 71 80
10
X 52.3 aos
X
11
5, 21, 32, 59
60, 60
X 60 60
2
X 60 aos
12
X 60 aos (unimodal)
Ejemplo:
a) Determinar la moda del siguiente conjunto de datos: 1, 2, 3, 4, 4, 5,
2, 1, 3, 4, 2, 3, 4, 6, 3
1, 1, 2, 2, 2,
3, 3, 3, 3, 4, 4, 4, 4,
5, 6
X 3 y 4 (bimodal)
13
Datos agrupados
Media aritmtica: Para calcular esta medida de centralizacin o tendencia
central se tomaran en cuenta las frecuencias absolutas y la marca de clase de
cada clase; mediante la siguiente frmula:
Mc * f
Donde:
=media aritmtica
=sumatoria
Mc= marca de clase
f= frecuencia absoluta
N= nmero total de datos
Ejemplo:
DISTRIBUCIN DE FRECUENCIA PARA LAS VELOCIDADES
xi
[4953)
[5357)
[5761)
[6165)
[6569)
[6973]
total
fa
fr
f ra
Mc
10
10
0.25
0.25
51
17
0.17
0.42
55
22
0.13
0.55
59
25
0.07
0.62
63
32
0.18
0.8
67
40
0.2
71
40
14
X
X
10 51 7 55 5 59 3 63 7 67 8 71
40
2416
X 60.4
40
15
f
anterior
a
X L
2
* Ac
i
f
mediana
Donde:
L
i
f a anterior
la mediana
f mediana
Ejemplo:
De la tabla anterior calcularemos la mediana para esta distribucin.
Lo primero que debemos hacer para poder calcular la mediana es identificar
la clase mediana. Para esto tenemos que buscar el intervalo en el que se
encuentre. N / 2.
N 40
20
2
2
16
17
fa
fr
f ra
Mc
10
10
0.25
0.25
51
17
0.17
0.42
55
22
0.13
0.55
59
25
0.07
0.62
63
32
0.18
0.8
67
40
0.2
71
xi
[4953)
[5357)
[5761)
[6165)
[6569)
[6973]
total
40
N 40
20
2
2
40
f
anterior
17
a
2
2
X L
* Ac 57
*4
i
f
5
mediana
X 57.4
f f anterior
X L
)
* Ac
)
i
f f anterior f f posterior
Donde:
18
L
i
)
f
= frecuencia absoluta del intervalo modal
f anterior
f posterior
= frecuencia absoluta posterior al intervalo modal
Ac= amplitud de clase.
xi
[4953)
[5357)
[5761)
[6165)
[6569)
[6973]
total
fa
fr
f ra
Mc
10
10
0.25
0.25
51
17
0.17
0.42
55
22
0.13
0.55
59
25
0.07
0.62
63
32
0.18
0.8
67
40
0.2
71
40
Intervalo modal:
Mayor frecuencia
absoluta
19
0
f f anterior
10
X L
)
*4
* Ac 49
)
i
10 0 10 7
f f anterior f f posterior
X 52
20
2.
3
Medidas de
variabilidad
DATOS NO AGRUPADOS
Rango (R)
Es una medida razonable de Variabilidad llamada tambin en algunas
ocasiones amplitud y que se obtiene restando el valor ms bajo de un conjunto de
observaciones del valor ms alto. Es fcil de calcular y sus unidades son las
mismas que las de la variable. El rango es la diferencia entre el valor mayor y el
menor de los datos. Esta sencilla medida permite identificar la variacin mxima
entre dos datos del conjunto que se analiza.
21
Desviacin media
Se define como la media de las diferencias en valor absoluto de los valores
de la variable a la media (D.M); es decir, que se define como desvi que es la
diferencia que se observa entre la variable y la media aritmtica.
D.M
x1 X x2 X ... xi X
N
Donde:
D.M
xi
X
= Desviacin media
= cada valor
= Media aritmtica
Ejemplo:
Calcular la desviacin media de la distribucin:
22
9, 3, 8, 8, 9, 8, 9, 18
Primero calculamos la media aritmtica
x 9 3 8 8 9 8 9 18
9
N
D.M
D.M
x1 X x2 X ... xi X
N
9 9 3 9 8 9 8 9 9 9 8 9 9 9 18 9
N
D.M 2.25
Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones
respecto a la media de una distribucin estadstica.
La varianza se representa por signo
x X x X
2
2
xi
X
... xi X
= varianza
= cada valor
= Media aritmtica
23
Ejemplo:
Calcular la varianza del ejemplo anterior
x X x X
9 9
... xi X
3 9 8 9 8 9 9 9 8 9 9 9 18 9
2
15
2
Desviacin estndar
Esta medida nos permite determinar el promedio aritmtico de fluctuacin
de los datos respecto a su punto central o media. La desviacin estndar nos da
como resultado un valor numrico que representa el promedio de diferencia que
hay entre los datos y la media. Para calcular la desviacin estndar basta con
hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:
2
Ejemplo:
Continuando con el ejemplo anterior calcular la desviacin estndar:
2 15
3.87
DATOS AGRUPADOS
Rango
Para los datos agrupados se emplea la misma frmula que en los datos no
agrupados
24
25
Desviacin media
Como su nombre indica, la desviacin respecto a la media da informacin
de lo alejado o cerca que est un dato de los dems datos del conjunto.
Intuitivamente, ya se ve que se puede calcular como la diferencia entre un dato y
la media de los datos, multiplicada por la frecuencia absoluta de cada intervalo.
D.M
Donde:
D.M
= Desviacin media
Mci
X
fi
= Media aritmtica
Ejemplo:
Dada la siguiente tabla de distribucin de frecuencias, calcular la desviacin
media:
xi
[4953)
[5357)
[5761)
[6165)
fa
fr
f ra
Mc
10
10
0.25
0.25
51
17
0.17
0.42
55
22
0.13
0.55
59
25
0.07
0.62
63
26
32
0.18
0.8
67
40
0.2
71
40
X
X
10 51 7 55 5 59 3 63 7 67 8 71
40
2416
X 60.4
40
D.M
Varianza
La frmula para calcular la varianza de datos agrupados es la siguiente:
2
Donde:
Mc X
f1 Mc2 X
f 2 ... Mci X
fi
27
= varianza
Mci
fi
= Media aritmtica
Ejemplo:
En base a los datos de la tabla anterior calcular la varianza:
f1 Mc2 X
f 2 ... Mci X
fi
Mc X
40
40
40
2
58.04
Desviacin estndar:
La frmula para calcular la desviacin estndar para datos agrupados es la
siguiente:
28
Ejemplo:
Continuando con el ejemplo anterior calcular la desviacin estndar:
2 58.04
7.62
29