Está en la página 1de 8

Institución Educativa Santa Sofía

Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

Objetivo: Repasar como se construyen tablas de frecuencia y gráficas estadísticas.

Tiempo programado: tres sesiones.

ORGANIZACIÓN Y REPRESENTACIÓN DE DATOS

¿Qué hace la estadística?


Recordemos que la Estadística es la parte de las matemáticas que se encarga de la recolección, organización,
representación y análisis de datos. Desde luego, todo este proceso sólo tiene sentido si los resultados se usan
para orientar la toma de decisiones. Es por eso que la estadística es fundamental en la administración del
Estado (de ahí su nombre) o en el manejo de cualquier institución u organización.

En las unidades anteriores hemos trabajado elementos relacionados con la recolección de datos; en esta
hablaremos directamente de la organización y recolección de datos.

Organización de Datos Cuantitativos


Primero que todo, recordemos cuales son los datos construidos con variables cuantitativas.

1
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

La herramienta por excelencia para organizar datos es la tabla de frecuencia. Del mapa conceptual anterior se
puede inferir que existen dos tipos de tablas: una para datos agrupados y otra para datos no agrupados (se
recomienda que la variable cualitativa continua siempre se trabaja como datos agrupados).

Organización y Representación de Datos NO agrupados


Este tipo de datos se organizan en tablas con cinco columnas: datos, frecuencia absoluta (f), frecuencia
relativa (fr), frecuencia porcentual (%) y frecuencia acumulada (F)

Frecuencia Absoluta (f): es el número de veces que se repite casa uno de los datos que se ubican en la
primera columna.

El total de la frecuencia absoluta es el total de datos

Frecuencia Relativa (fr): representa cuanto del total de datos ocupa ese dato en particular. Para esto se tiene
en cuenta que 1 sería el total de datos, entonces una fr de 0,5 significa que las repeticiones de ese dato
equivalen a la mitad del total de datos y una fr de 0,25 significa que las repeticiones de ese dato equivalen a un
cuarto del total de datos.

Para calcular la frecuencia relativa (fr) se divide la frecuencia absoluta (f) entre el total de datos (n) así:
𝒇
𝒇𝒓 =
𝒏
El total de la frecuencia relativa debe ser 1 (tenga en cuenta las aproximaciones hechas en el proceso).

Frecuencia Porcentual (%): indica cuál es el porcentaje de ese dato en particular con respecto al total de
datos. Para calcular la frecuencia porcentual (%) se puede hacer todo el cálculo por proporcionalidad o
simplemente se puede multiplicar la frecuencia relativa por 100% así:

% = 𝑓𝑟 ∗ 100%

El total de la frecuencia porcentual debe ser 100% (tenga en cuenta las aproximaciones hechas en el proceso).

Frecuencia Acumulada (F): Es la sumatoria parcial de las frecuencias absolutas hasta el dato para el cual se
calculan. Matemáticamente se puede decir que
𝑛

𝐹 = ∑𝑓
1

De tal manera que la frecuencia acumulada del último dato debe ser igual al total (n). Esta frecuencia no tiene
total.

Miremos un ejemplo:

Se toman las edades de 20 estudiantes de 10° de la institución y se obtienen estos resultados:

16 16 15 14 16 17 14 15 13 16
16 15 17 16 14 15 14 16 16 15

Si se organiza esta información en una tabla de datos no agrupados se tiene que el dato 16 se repite 8 veces,
entonces su frecuencia absoluta f es 8.

Como el total de datos es 20 (n = 20), entonces su frecuencia relativa es

2
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

𝒇 𝟖
𝒇𝒓 = = = 𝟎, 𝟒
𝒏 𝟐𝟎
Con esto se calcula su frecuencia porcentual

% = 𝑓𝑟 ∗ 100% = 0,4 ∗ 100 = 40

Finalmente la frecuencia acumulada (F) del dato 16 años será la suma de las frecuencias absolutas (f) de todos
los datos hasta llegar a la suya, es decir, la suma de los f de 13, 14, 15 y 16.

Se repite lo mismo con cada dato y se tiene la siguiente tabla:

Edad (años) f fr % F
13 1 0,05 5 1
14 4 0,2 20 5
15 5 0,25 25 10
16 8 0,4 40 18
17 2 0,1 10 20
Total 20 1 100

Por favor corrobore en casa todos los valores de la tabla y que las sumas de las columnas si den sus
respectivos totales. Esta corroboración es muy importante en su proceso de aprendizaje para confirmar que
si sabe cómo hacer los cálculos.

Para representar este tipo de datos se usan tanto diagramas de barras como diagramas circulares. Ojo, los
diagramas de barras de datos no agrupados llevan las barras separadas y en el diagrama circular no
aparecen los valores de los ángulos de las porciones, pero si deben aparecer los porcentajes

Edades estudiantes 10°

Edades de los estudiantes de 10°


Número de estudiantes

8
7
6 10% 5%
20%
5
4
3 40%
2
25%
1
0
13 14 15 16 17
Edades (en años) 13 14 15 16 17

Organización y Representación de Datos agrupados


Este tipo de datos se organizan en tablas con seis columnas: intervalos de datos, marca de clase (mi),
frecuencia absoluta (f), frecuencia relativa (fr), frecuencia porcentual (%) y frecuencia acumulada (F). Los datos
con variable continua siempre suelen organizarse de esta manera.

Las cuatro últimas columnas se tratan igual que en los datos no agrupados; las dos primeras, las nuevas, las
explicaremos a continuación:

3
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

Intervalos de datos: son conjuntos de datos que se crean para darle orden a la distribución. Suelen ser útiles
cuando se tiene una gran cantidad de datos, cuando los datos están muy dispersos o cuando los satos
individuales tienen muy baja o ninguna repetición. Existen diferentes fórmulas para calcular el número de
intervalos que requiere una distribución, pero ese tema no lo trataremos en esta unidad. Para calcular el tamaño
de cada intervalo (Ti) se divide la diferencia entre los datos mayor y menor de la distribución entre el número de
intervalos a usar así:
𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
𝑇𝑖 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑎 𝑢𝑠𝑎𝑟
Cada intervalo inicia en el valor exactamente superior al que termina el dato anterior.

Marca de clase (mi): es el valor central (o mediana) de cada intervalo, que sirve como valor representativo del
intervalo. La marca de clase se usa en algunos cálculos de análisis de la distribución y en ocaciones, por
cuestión de espacio, se usa en las gráficas. Para calcularlo se suman los valores extremos del intervalo y en
resultado se divide entre dos así:
𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 + 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑚𝑖 =
2

Es importante tener en cuenta que la columna de las marcas de clase no tiene total.

Ejemplifiquemos todo esto:

Al mismo grupo de estudiantes del ejemplo anterior se les midieron las estaturas. Los resultados en metros
fueron:

1,52 1,65 1,46 1,48 1,75 1,70 1,58 1,64 1,68 1,72
1,49 1,53 1,63 1,60 1,54 1,78 1,59 1,69 1,55 1,61

Cómo se puede ver, ningún dato se repite, por lo tanto es útil organizar estos como datos agrupados.
Construyamos una tabla de 4 intervalos.

Procedemos a calcul y ar el tamaño del intervalo (Ti). Para eso identificamos los datos mayor y menor de la
distribución que son 1,46 y 1,78. Haciendo el cálculo visto anteriormente:
𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 1,78 − 1,46
𝑇𝑖 = = =8
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑎 𝑢𝑠𝑎𝑟 4
Nuestros intervalos serán de 8cm, es decir el primer intervalo contiene los siguientes ocho datos 1,46 – 1,47 –
1,48 – 1,49 – 1,50 – 1,51 – 1,52 y 1,53. Entonces es primer intervalo es [1,46-1,53]. Por su parte el segundo
intervalo contiene los siguientes ocho datos 1,54 – 1,55 – 1,56 – 1,57 – 1,58 – 1,59 – 1,60 y 1,61; por lo que el
segundo intervalo es [1,54-1,61]. Se continúa de esta manera hasta que el último intervalo, el cuarto en este
caso, contenga el último dato.

Una vez se han obtenidos los intervalos se calcula la marca de clase (mi) de cada intervalo. En el caso de los
dos intervalos que ya están calculados tenemos:
𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 + 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑚𝑖 =
2
Para el primer intervalo
1,46 + 1,53
𝑚1 = ≈ 1,50 (𝑝𝑜𝑟 𝑎𝑝𝑟ó𝑥𝑖𝑚𝑎𝑐𝑖ó𝑛)
2
4
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

Para el segundo intervalo


1,54 + 1,61
𝑚2 = ≈ 1,58 (𝑝𝑜𝑟 𝑎𝑝𝑟ó𝑥𝑖𝑚𝑎𝑐𝑖ó𝑛)
2
Una vez hallados todos lo intervalos y calculadas todas las marcas de clase se procede a realizar la tabla
teniendo en cuenta que la frecuencia absoluta (fi) de cada intervalo es el número de datos que se encuentren
entre sus límites. La tabla que se obtiene es la siguiente:

Estatura (cm) mi fi fr % F
[1,46-1,53] 1,50 5 0,25 25 5
[1,54-1,61] 1,58 6 0,3 30 11
[1,62-1,69] 1,66 5 0,25 25 16
[1,70-1,78] 1,74 4 0,2 20 20
Total 20 1 100

Por favor corrobore en casa todos los valores de la tabla y que las sumas de las columnas si den sus
respectivos totales. Esta corroboración es muy importante en su proceso de aprendizaje para confirmar que
si sabe cómo hacer los cálculos.

En cuento a las gráficas, aquí el diagrama de barras se llama histograma y lleva las barras pegadas y el
diagrama circular funciona exactamente igual que con los datos no agrupados.

Histograma estaturas 10°


Número de estusiantes

0 [1,46-1,53] [1,54-1,61] [1,62-1,69] [1,70-1,78]

Estatura en metros

Diagrama circular estatura estudiantes


10°

20% 25% [1,46-1,53]


1
[1,54-1,61]
2
[1,62-1,69]
3[1,46-1,53]
25% 4
][1,70-1,78]
30%

5
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

Además de estas dos gráficas, en datos agrupados suelen usarse otras dos.

El polígono de frecuencias en un diagrama de línea en el que se relacionan las marcas de clase y las
frecuencias. Suele ser común que el polígono de frecuencias se ubique sobre el histograma, para hacer esto
sólo hay que unir los puntos centrales de cada barra con una línea.

Polígono de frecuencias Estatura de los


estudiantes de 10°
7
Número de estudiantes

6 6
5 5 5
4 4
3
2
1
0
1,5 1,58 1,66 1,74
Estatura en metros

La ojiva es un polígono de frecuencias construido con la frecuencia acumulada; por esto, esta gráfica permite
ver la rapidez de crecimiento de la variable.

Ojiva estaturas 10°


25
Frecuencia acumulada

20 20

15 16

10 11

5 5

0
1,5 1,58 1,66 1,74
Estaturas en metros

Cómo ya ha interiorizado los conceptos y los ha puesto en práctica, verifique lo aprendido desarrollando los
siguientes ejercicios. Desarrolle la actividad en su cuaderno bajo el título Organización y representación de
datos.

6
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

3
1

7
Institución Educativa Santa Sofía
Área de Matemáticas
Estadística 10°
Unidades de Aprendizaje Autónomo en Casa
Organización y Representación de Datos

Finalmente, para demostrar todo lo aprendido invéntese una situación de aplicación y expóngala. El
planteamiento de la situación debe tener al menos dos preguntas.

Tome una foto, con la mayor nitidez posible, de cada una de las actividades desarrolladas, organícelas en un
documento y suba ese documento a la plataforma Classroom como respuesta a la tarea. Fotos que no se
puedan leer, actividades que no serán calificadas.

Pendientes del próximo tema, Medidas de Tendencia Central.

También podría gustarte