Está en la página 1de 5

Tratamiento de variables agrupadas por intervalos o

distribución de frecuencias agrupadas


Primero calculamos la amplitud o Rango La distribución de frecuencias agrupadas o tabla
con datos agrupados se emplea si las variables toman un número grande de valores o
la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados


clases. A cada clase se le asigna su frecuencia correspondiente. Es conveniente
agruparlos en intervalos consecutivos de manera que cada dato pertenezca a un solo
intervalo (intervalos de clases).

Reglas empíricas para la construcción de intervalos de clases

1. Las clases han de ser excluyentes


2. Obtener el rango o amplitud de los datos, que se lo define como la diferencia
entre el valor máximo y el valor mínimo.
3. Determinar el numero aproximado de intervalos (k) y la amplitud intervalos de
clase (c), empleamos la fórmula de Stuger:

k =1+3 , 3. log N
debe tenerse presente que k es un número natural. Luego se busca la amplitud c, que
es mayor que el cociente entre rango y el número de intervalos.
4. Aunque no tiene que ser necesariamente así, es conveniente que la amplitud
de los intervalos sea constante.
5. Determinar el limite superior del ultimo intervalo y el limite inferior del primero
6. Calcular la marca de clase de cada intervalo que se lo define como el punto
medio del mismo
7. Todos los datos de una clase quedan representados por la marca de clase. De
esta manera, todos los cálculos se realizan como si en lugar de tener n valores
distintos en una clase, tuviéramos n veces la marca de clase.
8. Promediando el limite superior de una clase con el inferior de la siguiente se
obtiene la frontera de clase o verdadero límite de la clase.
Ejemplo
Los siguientes valores corresponden a una característica biométrica de los individuos:
la estatura de un grupo de 24 alumnos de una EGB. (medidas en centímetros)
125 – 128 – 138 – 126 – 130 – 132 – 132 – 133 – 147 – 132 – 139 – 142 – 138 – 140 –
133 – 136 – 134 – 128 – 142 – 145 – 128 – 130 – 124 – 132.
N=24 alumnos (población o muestra)

Am= XMax. – Xmin. = 147 – 124 =23 amplitud de la muestra


a<x<b (a,b) intervalo abierto
intervalo cerrado a ≤ x ≤ b [a ,b ]
k =1+3 , 3. log N = k =1+3 , 3. log 24=5 , 55 ≅ 6=k (cantidad de intervalos)

Ahora debo obtener la amplitud de cada intervalo (cuantos valores tiene cada
intervalo)
Dato mayor−Dato menor 147−124
Amplitud del intervalo(c )= = =3,833 ≅ 4
numero de intervalos 6
Am 23
c= = =3 , 83 ≅ 4
k 6

Intervalos: el primer intervalo se toma a partir del valor mínimo (124), para evitar que
los extremos del intervalo coincidan con un valor de la variable se lo define restando
media unidad decimal (0,5).
Así para el primer intervalo tomo 124 – 0,5= 123,5 como extremo inferior del intervalo
y como extremo superior a 123,5 le sumo la amplitud que obtuve del intervalo (4)
quedando,
123,5 + 4 = 127,5 entonces:
Para el 1° intervalo [123,5 – 127,5) o sea que los intervalos son considerados abiertos
a la derecha para evitar que un mismo valor figure en dos clases. Así por ejemplo 127,5
se excluye del primer intervalo y se incluye en el segundo.
La expresión general de un intervalo es: a ≤ x < b ó [a, b)
Donde a= extremo inferior de la clase o límite inferior (dato incluido en el intervalo)
b = extremo superior de la clase o limite superior (dato no incluido en el
intervalo)
Entonces el cuadro de distribución de frecuencias queda de la siguiente manera
2° intervalo = [127,5 – 131,5)
Estaturas Xi (marca de clase) fi Fac fi f%=fr.100%
fr =
N
[123,5 – 127,5) 123.5+127 , 5 3 3 3/24=0,125 12,5 %
=¿1
2
25,5
[127,5 – 131,5) 129,5 5 8 0,209

[131,5 – 135,5) 133,5 7 15 0,292

[135,5 – 139,5) 137,5 4 19 0,166

[139, 5 – 143,5) 141,5 3 22 0,125

[143,5 – 147,5] 145,5 2 24 0,083

24 1

Marca de clase (Xi): se llama marca de clase al punto medio del intervalo. En el primer
intervalo la marca de clase es:

123 ,5+127 ,5
=125 , 5
2
Frecuencia de cada intervalo: al primer intervalo de clase que corresponde las alturas entre
123,5 y 127,5 le corresponde una frecuencia absoluta de 3, ya que hay tres alumnos que
tienen una altura correspondiente a esta clase (124, 125, 126) y así sucesivamente con los
siguientes intervalos.

Observación:

 Las series estadísticas agrupadas se refieren fundamentalmente a las variables


continuas o discretas con gran número de valores.
 El conjunto de las frecuencias de todas las categorías se denomina distribución de
frecuencias de la variable
 Aspectos que deben considerarse para presentar la información disponible en la tabla
son: colocar título, el titulo debe responder a las preguntas “que se presentan”, como
se clasifican las unidades de observación donde y cuando fueron obtenidos los datos,
fuente de datos.

Para representar gráficamente este tipo de cuadro de distribución de frecuencias se


suelen usar gráficos llamados histogramas de áreas y polígono de frecuencia

Gráficos estadísticos para variables agrupadas por intervalos


Histogramas de áreas: el histograma es particularmente adecuado para representar
distribución de frecuencias de una variable cuantitativa continua. El grafico consiste en
un conjunto de rectángulos adyacentes cuya base representa un intervalo de clase
cuya altura representa la frecuencia del intervalo.
La escala vertical muestra la frecuencia absoluta o relativa, es decir el número de
observaciones en cada intervalo.

Polígono de frecuencia: el polígono de frecuencia se obtiene a partir del histograma


uniendo los puntos medios de los lados opuestos a las bases de cada rectángulo
incluyendo el anterior al primero y el posterior a la última.
De esta manera se consigue que el área de la superficie encerrada por el polígono de
frecuencia y el eje de las abscisas sea igual a la suma de las áreas de los rectángulos
que integran el histograma correspondiente de modo que ambas representaciones
resulten equivalentes.
Diagrama de frecuencias acumuladas: se construye de manera similar al histograma,
pero en el eje de las ordenadas (eje y) se disponen las frecuencias acumuladas de cada
intervalo. Estas facilitan el cálculo de la mediana.
Adicionalmente, se unen en forma consecutivas los verdaderos limites los puntos
medios para obtener una línea poligonal, llamada “ojiva creciente”

También podría gustarte