Está en la página 1de 5

TABLAS DE FRECUENCIA

Cuando se han recogido los datos correspondientes a una variable estadstica, hay que
tabularlos; es decir, hay que confeccionar con ellos una tabla en la que aparezcan
ordenadamente:
- Los valores de la variable que se est estudiando.
- El nmero de individuos de cada valor; es decir, su frecuencia.

Tabla de frecuencia:
Es un arreglo tabular de resumen en la que los datos se disponen en agrupamientos o
categoras convenientemente establecidas de clases ordenadas numricamente.

Frecuencia absoluta
Es el nmero de veces que aparece un determinado valor en un estudio estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por
N.
N fn f f f ... 3 2 1

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se
lee suma o sumatoria.
N fi f f f
n i
i

1
... 3 2 1

Frecuencia relativa
Es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por n
i
.
N
f i
n
i


La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada y Frecuencia relativa acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores
o iguales al valor considerado.
Se representa por Fi.
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.

Ejemplo 1
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
Construir la tabla de frecuencias.

xi fi Fi ni Ni
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1

Ejemplo 2
Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:
Peso (50,60) (60,70) (70,80) (80,90) (90,100) (100,110) (110,120)
fi 8 10 16 14 10 5 2


Construir la tabla de frecuencias.
PESO Xi fi Fi ni Ni
(50,60) 55 8 8 0.12 0.12
(60,70) 65 10 18 0.15 0.27
(70,80) 75 16 34 0.24 0.51
(80,90) 85 14 48 0.22 0.73
(90,100) 95 10 58 0.15 0.88
(100,110) 105 5 63 0.08 0.96
(110,120) 115 2 65 0.03 0.99



VALORES DIVERGENTES
Son datos experimentales en los que parece haber una observacin que no pertenece al
grupo, esto es, que es discordante o no coherente con resto por aumento o defecto.

Suelen llamarse tambin valores atpicos, aberrantes, inconsistentes o anmalos.

Causas para que se den valores divergentes
Pueden ser causados por un error de medicin, un error de anotacin, al dao del aparato de
medicin, a la prdida de una porcin de las muestras en un experimento analtico, etc.
Tambin puede ser debido al azar

Ante esta situacin, el analista debe investigar la procedencia de ese dato, y como
consecuencia de ello, eliminarlo de la muestra si se confirma que ha sido un error o modificar
sus hiptesis sobre la poblacin en caso de verificarse su exactitud

Mtodos para determinar valores atpicos
Existen varios mtodos como:
El mtodo de Q-Dixon
El mtodo de Pearson y Hartley
El mtodo de Nalimov

MTODO DE Q-DIXON
Este mtodo nos dir si el valor es un outlier, es decir, una observacin anmala que debe
ser eliminada, ya que no pertenece a la poblacin.
Esta prueba supone que la poblacin est normalmente distribuida

Mtodo para un valor sospechoso
rango
a divergenci
Q
Donde:
Rango = Mximo menos el mnimo de las observaciones
Divergencia es la diferencia en valor absoluto entre el valor sospechoso y el valor
inmediatamente ms cercano a l}
Si Q>valor crtico entonces se confirma que el valor es atpico

Tabla de valores crticos para el test de Q de Dixon para un valor atpico

n
) (
95 , 0
n Q ) (
99 , 0
n Q
3 0.941 0.988
4 0.765 0.889
5 0.642 0.780
6 0.560 0.698
7 0.507 0.637
8 0.468 0.590
9 0.437 0.555
10 0.412 0.527
12 0.376 0.482
14 0.349 0.450
16 0.329 0.426
18 0.313 0.407
20 0.300 0.391
25 0.277 0.362
30 0.260 0.341


Ejemplo
En un experimento exigen las siguientes 5 observaciones:
12.47, 12.49, 12.52, 12.56, 12.67

Podemos decir que 12.67 es un outlier?

Mtodo para dos valores sospechosos (en el mismo lado)
Se aplica el mtodo modificado, se calcula Q, que es el cociente en cuyo numerador se coloca,
en valor absoluto, la diferencia entre el valor sospechoso ms extremo y el segundo
siguiente (no el siguiente valor sospechoso). En el denominador se contina poniendo el
rango.

rango
a divergenci
Q
47 . 12 67 . 12
56 . 12 67 . 12

Q

55 . 0 Q

65 . 0 Q
Entonces no es una valor atpico es un valor que est dentro de la poblacin.

Tabla de valores crticos para pareja de valores atpicos

n
) ( 95 , 0
'
n Q ) ( 99 , 0
'
n Q
4 0.967 0.992
5 0.845 0.929
6 0.736 0.836
7 0.661 0.778
8 0.607 0.710
9 0.565 0.667
10 0.531 0.632
12 0.481 0.579
14 0.445 0.538
16 0.418 0.508
18 0.397 0.484
20 0.372 0.464
25 0.343 0.428
30 0.322 0.402

Mtodo para dos valores sospechosos (en el mismo lado)
Si el valor no es outlier, el segundo valor sospechoso tampoco lo es.
Si el valor es outlier, se elimina de la muestra y continuamos con el anlisis del segundo valor
usando el mtodo Q de Dixon original con el tamao de la muestra reducido en 1.

Ejemplo
En un experimento exigen las siguientes 10 observaciones:
2.1, 2.0, 2.1, 2.3, 2.9, 2.3, 3.1, 2.2, 2.0, 2.3

Primero ordenamos los valores de menor a mayor
2.0, 2.0, 2.1, 2.1, 2.2, 2.3, 2.3, 2.3, 2.3, 2.9, 3.1

Podemos decir que 2.9 y 3.1 son outliers?
rango
a divergenci
Q
'

2 1 . 3
3 . 2 1 . 3
'

Q

72 . 0
'
Q

53 . 0
'
Q y 0.632
Entonces no es un valor atpico.


Referencias
Quesada. M. (). Estadstica bsica con aplicaciones en Ms Excel.

Berenson. L. (). Estadstica bsica en administracin: conceptos y aplicaciones.

Link: http://www.vitutor.com/estadistica/descriptiva/a_3.html