Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Colegio El Carpinelo
“Formando Integralmente para la Vida con los Valores del Evangelio”
SISTEMAS DE DATOS
Agrupación de Datos
Ya sabemos que las variables estadísticas pueden ser de dos clases: cualitativas o cuantitativas.
También se consideran continuas las variables que pueden tener muchos valores distintos,
aunque sean todos enteros como, por ejemplo, los salarios de un grupo de personas.
En las variables continuas, donde el número de datos seguramente es muy grande, estos se agrupan en
intervalos o clases. La siguiente experiencia nos ayudará a comprender en qué consiste este proceso:
EXPERIENCIA
El médico de un colegio anotó la estatura, en centímetros, de los 40
alumnos del grupo 7°A. Estos fueron los resultados:
Como el número de datos es grande, los agrupa en intervalos o clases de la siguiente manera:
- Cada intervalo o clase tiene un extremo inferior y un extremo superior. El extremo inferior de la
primera clase es, en general, el menor dato de la muestra y el extremo superior de la última clase es
el mayor valor de la muestra. A veces conviene tomar como extremo inferior un número menor que
el de la muestra redondeado a un múltiplo de 5 o de 10 y como extremo superior un número mayor
que el de la muestra redondeado igualmente a un múltiplo de 5 o de 10. Por ejemplo, si el menor
valor de una muestra es 1,43m, puede tomarse como extremo inferior 1,4 y si el mayor valor es 1,74
m, puede tomarse como extremo superior 1,8.
- Es recomendable que todas las clases o intervalos tengan la misma amplitud.
- Los puntos medios de cada clase se llaman marcas de clase.
1
- No existe una regla única para fijar el número k de intervalos o clases en que se va a agrupar la
muestra, pero generalmente varía entre 5 y 15, dependiendo del tamaño de la muestra. Una buena
guía para tomar la decisión acerca del valor de k es la propuesta de Herbert A. Sturges (1926),
quien diseñó la siguiente tabla:
Números de Elementos de la Muestra Números de Intervalos
n k
De 6 a 11 4
De 12 a 22 5
De 23 a 45 6
De 45 a 90 7
De 91 a 181 8
De 182 a 362 9
De 363 a 724 10
De 725 a 1.448 11
De 1.449 a 2.896 12
Hallamos la diferencia entre el mayor valor y el menor valor de la muestra. Esta diferencia se
denomina RANGO o RECORRIDO de la muestra y lo representamos por R. Por lo tanto:
R = xmax - xmin
El número de intervalos de acuerdo con la tabla de Sturges es k=6 y la amplitud cada intervalo será:
23
A= = 3,8333...
6
Como los datos de la muestra son números enteros, entonces aproximamos este número al entero
mayor más próximo; es decir, a 4. Esto hace que debamos ampliar nuestro rango de 23 a 6x4=24;
es decir, 1 unidad más que el rango de datos. Esta unidad podemos agregarla por debajo
(adicionando el dato 147) o por encima (adicionando el dato 172)
2
A continuación, elaboramos la tabla de frecuencias absolutas para esta distribución de datos:
Marca de Frecuencia
Talla (cm) Recuento
Clase Absoluta
[148-152) 150 6
[152-156) 154 8
[156-160) 158 9
[160-164) 162 8
[164-168) 166 8
(168-172) 170 1
40
Por ejemplo, en el intervalo (152-156) hemos agrupado todas las tallas desde 152 cm (incluido este valor)
hasta las tallas por debajo de los 156 cm, ya que 156 cm se contabiliza en el tercer intervalo.
APRENDAMOS
• Cuando el número de datos de una muestra es grande, mayor que 20, conviene agruparlos en
intervalos o clases.
• El número de intervalos es variable; sin embargo la tabla de Sturges es una buena guía para
determinar el número de estos intervalos.
• Todos los intervalos deben tener la misma amplitud.
• El RANGO de la distribución es la diferencia entre el mayor valor y el menor valor de la muestra.
R Rango
• Para saber la amplitud A de cada intervalo calculamos: A = = N º de int ervalo
K
• El resultado de A nos indicará si es necesario ampliar el rango original, agregando algunos datos
por debajo o por encima de los que ya tenemos.
PRIMERA EXPERIENCIA
Vamos a representar gráficamente la situación que nos muestra la
tabla de la experiencia anterior con relación a la estatura de los 40
estudiantes de 7° grado. Veamos:
TALLAS FRECUENCIA
(en cm) ABSOLUTA
[ 148-152) 6
[152-156) 8
[156-160) 9
[160-164) 8
[164-168) 8
[168-172) 1
Este tipo de gráfico se llama histograma de frecuencias
absolutas.
3
APRENDAMOS
Para construir un histograma representamos sobre el eje horizontal los extremos de los intervalos o
clases. A continuación, construimos unos rectángulos cuya base es la amplitud del intervalo y cuya
altura es la frecuencia absoluta.
SEGUNDA EXPERIENCIA
Cuando los datos se encuentren agrupados en intervalos, el
polígono de frecuencia se obtiene al unir los puntos medios de los
lados superiores de cada rectángulo (Figura 1).
TERCERA EXPERIENCIA
• ¿Cuántos estudiantes de 7°A tienen una estatura
inferior a 160 cm? Si miramos la tabla de frecuencias
absolutas podemos contestar que 6+8+9 = 23.
• Acabamos de obtener una nueva frecuencia que se llama frecuencia absoluta acumulada.
4
APRENDAMOS
La Frecuencia Absoluta Acumulada de un valor x¡ es la suma de las frecuencias absolutas de los
valores menores o iguales a xi. La frecuencia absoluta acumulada se representa por F¡.
ESTATURAS
fi Fi
(en cm)
1148-152) 6 6
1152-156) 8 14
1156-160) 9 23
[160-164) 8 31
[164-168) 8 39
(168-172) 1 40
¡ATENCIÓN!
5
Ciertos tipos de poblaciones suficientemente estudiadas exhiben formas más o menos estables y
conocidas. Por ejemplo, el peso de las personas y de los animales, la vida útil de las cosas y el coeficiente
de inteligencia de las personas presentan curvas de forma SIMÉTRICA, como la figura (a). Otras, como los
salarios, tienen una distribución asimétrica ya que un porcentaje alto de los trabajadores reciben bajos
salarios; por lo cual, éstos tienden a agruparse en el extremo izquierdo de la distribución. Estas curvas se
llaman ASIMÉTRICAS A LA DERECHA como la figura (b) o ASIMÉTRICAS A LA IZQUIERDA como la
figura (c).
PREGUNTAS: ¿Qué clase de curva es la curva de frecuencias absolutas correspondiente a las estaturas
de los 40 alumnos del grado 7º?
EJERCICIO
En los ejercicios 1 a 15 marca la letra correspondiente a la ÚNICA respuesta correcta.
1. Al lanzar un dado 100 veces, se obtuvieron los siguientes resultados:
xi 1 2 3 4 5 6
fi 16 14 24 20 16 10
Los ejercicios 3, 4 y 5 se resuelven con base en el siguiente enunciado: "El Instituto Tecnológico tiene
1.200 estudiantes matriculados. Para evaluar la gestión del Rector se escoge al azar el 10% de los
estudiantes. Los criterios de evaluación son Excelente, Buena Regular y Mala"
6. En las siguientes tablas aparecen los intervalos con las frecuencias absolutas acumuladas.
Intervalo [10-10) [10-20) [120-30) [130-40)
Frecuencia Absoluta Acumulada 1 3 6 10
7. Con la tabla del ejercicio anterior, el tanto por ciento correspondiente al intervalo [10-20) es:
a) 0,3 b) 30% c) 20% d) 2
10. Con los datos del problema anterior, ¿qué porcentaje de alumnos pesa entre 65 y 70 kg?
a) 0,2 b) 20% c) 60% d) 94%
7
13. La suma de todos los porcentajes en cualquier tabla es:
a) 1 b) 100 c) 1% d) El número total de observaciones
16. Una de las preguntas de un cuestionario está diseñada para ser contestada de la siguiente forma: Si su
vivienda:
Es propia sin deuda contesta ……………..1
Es propia hipotecada contesta ……………2
La está pagando contesta …………………3
Es arrendada contesta …………………….4
Es prestada contesta ………………………5
18. Estas fueron las calificaciones definitivas obtenidas por un grupo de estudiantes universitarios en el
curso de Matemáticas I.
8
2,0 3,5 3,0 2,5 2,4 1,6 3,6 3,2 3.7 3.7
3,4 3,3 3,2 1,7 2,3 3,4 2,6 3,4 3,2 3,1
1,3 3,0 3,3 4,5 3,1 3,2 3,7 2,4 3,3 2,8
3,0 3,4 3,7 3,4 2,3 3,1 1,8 3,6 2,5 3,4
2,0 2,8 3,1 3,0 1,0 2,5 4,3 1,4 3,7 3,3
3,8 3,1 3,3 4,3 3,0 3,9 3,9 3,0 2,2 3,0
3,1 4,2 3,5 3,6 3,2 2,6 2,6 3,2 1,5 2,8
a) Si el curso se aprueba con nota mayor o igual a 3,0, ¿qué porcentaje de estudiantes perdió
el curso?
b) ¿Cuál fue la calificación más frecuente?
c) ¿Qué porcentaje de estudiantes obtuvo calificación entre 2,5 y 3,5?
d) Construye el histograma, el polígono de frecuencias absoluta y relativas, la curva de
frecuencias absolutas y relativas.
e) ¿Es la curva de frecuencias absolutas simétrica o asimétrica?
19. Los jugadores de dos equipos de baloncesto se clasifican por su estatura, según siguiente tabla:
ESTATURA No. de Jugadores Equipo A No. de Jugadores Equipo B
[1.70-1,80) 3 2
[1,80-1,90) 4 5
[1,90-2,00) 5 6
[2,00-2,10) 9 5