Está en la página 1de 5

Otra forma de hacer el histograma, pero poniendo a nuestro criterio las

clases es usando la Regla de Sturges:

Regla de Sturges
Nos dice en cuántas clases se deben dividir los datos de acuerdo al
tamaño de la muestra. Sea k la cantidad de clases en las que vamos a
dividir los n datos, entonces:
k =1+3.32∗log(n)

(el valor de k se aproxima al entero más cercano)


Para el ejemplo anterior de la edad, k =1+3.32∗log ( 14 )=4.8. Luego, tomamos
k =5.

El rango de los datos se va a dividir en esas clases. La longitud de cada


clase (o cada subintervalo) sería:
R X máx −X mín 38.2−19.8 18.4
l= = = = =3.68 años
k k 5 5

Hacemos la tabla de distribución de frecuencias:


Intervalo o clase Frecuencia absoluta Frecuencia relativa
[19.8, 23.48)
[23.48, 27.16)
[27.16, 30.84)
[30.84, 34.52)
[34.52, 38.2) No contamos el
último dato

Aumentamos un “poquito” la longitud de cada clase para al final poder


contar el último dato, tomamos l=3.7 años, estamos sumando 0.02 a cada
clase, como son 5 clases estamos 5*0.02 = 0.1 años (excedente), esto lo
repartimos mitad y mitad al principio y al final, es decir, empezamos 19.8
– 0.05, y terminamos 38.2+0.05
Clase Frecuencia absoluta Frecuencia relativa
[19.75, 23.45) 9 9/14 = 64.29%
[23.45, 27.15) 2 2/14 = 14.29%
[27.15, 30.85) 2 2/14 = 14.29%
[30.85, 34.55) 0 0 = 0%
[34.55, 38.25) 1 1/14 = 7.13%
Total 14 = n 100%

Gráfico:

En R:
# construcción de la tabla de distribución de dist. de
# frecuencia (t.d.f) = f.d.t [inglés]
# instalar un paquete : fdth
library("fdth")

# Hallamos la cantidad de clases


k <- 1 + 3.32*log10(length(edad))
round(k)

# longitud de clase
l <- (max(edad) - min(edad))/round(k)

# Tomamos l como 3.7; con esto hay exc


exced <- round(k)*(3.7 - l)
exced

# Contruimos la tabla de dist. de frec.


tabla <- fdt(edad, start = min(edad) - exced/2,
end = max(edad) + exced/2, h = 3.7)
tabla

La columna “cf” significa frecuencia acumulada, lo que hace es que


cuenta los datos acumulados hasta esa clase; la columna “cf(%)” es la
frecuencia acumulada en %.
# El histograma de acuerdo con la regla de Sturges
# es la gráfica de la tabla de dist. de frec.
plot(tabla, main = "Histograma de Edad", xlab = "Edad",
ylab = "Frecuencia", col = 5)

Cuando hacemos la curva que aproxima el histograma:

la obtenemos con una cola derecha larga, por lo que decimos o creemos
que el histograma es asimétrico de cola derecha (asimetría positiva).
Respecto al grado de concentración alrededor de la clase de mayor
frecuencia, notamos que este es alto: aquí se dice la kurtosis es alta.

Las anteriores son medidas de forma (la forma del histograma).

También podría gustarte