Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA
INSTITUCION EDUCATIVA MANUELA BELTRAN
2021
INSTITUCION EDUCATIVA MANUELA BELTRAN
Guía No. 3:
CARACTERIZACION DE VARIABLES CUANTITATIVAS
Objetivo de aprendizaje:
• Describir el proceso para presentar los datos en forma agrupada
• Calcular la media aritmética o promedio, la moda y la mediana cuando los datos se
encuentran en forma agrupada
• Interpretar los resultados de la media o promedio, la moda y la mediana en una situación
problema
• Conocer las medidas de dispersión y su utilización en un estudio estadístico
INTRODUCCIÓN
Actualmente, son varios los estudios estadísticos que se realizan a un determinado grupo de
personas o población de individuos, la finalidad de estos es poder caracterizar las variables de
estudio y con base en los resultados tomar decisiones o, en ciertos casos, predecir acciones. Al
momento de realizar un estudio se desea que os individuos
sean preferiblemente homogéneos, esto hace referencia a que
las respuestas no sean volátiles y de esta manera al momento
de caracterizar la variable, los parámetros sean significativos.
Para esto, se suelen clasificar los datos de acuerdo a un
parámetro establecido. En una población de individuos, una
clasificación particular es la que se basa en las edades de las personas, lo que nos permite obtener
las categorías de infancia, niñez, adolescencia, juventud, adultez y ancianidad. En este caso se toma
como hecho que el pensamiento y forma de actuar de los individuos de cada clase es similar.
Para caracterizar una variable se debe saber primero si los datos que se utilizaran están agrupados o
no, de pendiendo de estos existen diferentes herramientas que nos facilitan el estudio. Entre estas
encontramos:
Tablas de distribución de frecuencias – estudiada en la guía anterior
Medidas de tendencia central
Medidas de dispersión
Moda:
La moda de un conjunto de datos es aquel que tiene mayor frecuencia, se representa con 𝑥̂. En el caso
de variables continuas cuyos datos están agrupados se define un intervalo modal, el cual es el que
tiene mayor frecuencia.
Mediana:
La mediana es el valor intermedio cuando los valores de los datos han sido ordenados de forma
ascendente. La mediana se representa como 𝑥̂. En el caso de variables continuas cuyos datos están
agrupados se determina primero el intervalo medio, el cuales el intervalo donde la frecuencia
acumulada (𝐹) contiene el dato . Luego, se utiliza la siguiente expresión para determinar el valor de la
mediana.
Media o promedio:
Estudiada en la guía anterior
EJEMPLO 1 Edades 𝑓 𝐹 𝑥̂𝑖
En la siguiente tabla de distribución de frecuencias se clasifican los datos de
las edades de las personas que trabajan en una empresa. Determinar las [18 – 27) 9 9 22,5
medidas de tendencia central e interpretarlas. [27 – 36) 16 25 31,5
Primero, se calcula la media. Para esto, se usa la expresión correspondiente. [36 – 45) 5 30 40,5
Luego, se remplazan los datos y se realizan las respectivas operaciones:
[45 – 54) 10 40 49,5
Total 40 - -
Luego, el intervalo [27 - 36) es el intervalo modal, ya que su frecuencia es mayor a los demás
intervalos, lo que significa que la mayoría de los empleados tienen edades que oscilan entre los 27 y
los 36 años.
Finalmente, como , se tiene que el dato 20 se ubica en el intervalo [27 - 36), por tanto, este
es denominado el intervalo medio. De esta manera:
Se concluye que el 50% de los empleados tienen una edad inferior a 33 años.
MEDIDAS DE DISPERSION
Las medidas de dispersión permiten conocer el grado de agrupamiento o de variabilidad de los datos
con respecto a las medidas de centralización, usualmente se miden respecto a la media. Como en la
distribución de frecuencias no se conocen específicamente los datos, entonces, para calcular la
varianza (s2) y la desviación estándar (s) de datos agrupados se usa la marca de clase 𝑥̂𝑖 de la tabla
de distribución de frecuencias, como el dato representante y con él se calculan dichas medidas. De
esta manera, las fórmulas para la varianza y la desviación estándar para una muestra son:
Σ𝑓𝑖 (𝑥̂𝑖 − 𝑥̂ )2
𝑠=√
𝑛−1
Σ𝑓(𝑥̂ −𝑥̂)2
𝑠2 = 𝑖𝑖
𝑛−1
EJEMPLO 2
Una empresa desea realizar un estudio demográfico acerca del número de hijos por
familia de una comunidad indígena. Para esto, seleccionan dos
Comunidades indígenas distintas y escogerán la que tenga menor variabilidad en
los resultados. Los datos se presentan a continuación:
Comunidad indígena A Comunidad indígena B
N° de hijos 𝑓 𝑥̂𝑖 N° de hijos 𝑓 𝑥̂𝑖
[1 - 2) 6 1,5 [1 - 2) 5 1,5
[2 - 3) 2 2,5 [2 - 3) 3 2,5
[3 – 4) 5 3,5 [3 – 4) 6 3,5
[4 – 5) 5 4,5 [4 – 5) 4 4,5
Primero, se debe determinar y compara el número promedio de hijos en cada comunidad
Comunidad indígena A
Comunidad indígena B
Como se puede observar, el número promedio de hijos en cada comunidad es el mismo, lo que indica
que en cada familia de la comunidad hay tres hijos.
Finalmente, se observa que aunque ambas comunidades tienen el mismo promedio de hijos por
familia, se evidencia que la comunidad B tiene sus datos menos dispersos, por esta razón la empresa
realizará el estudio demográfico con esta comunidad.
Práctico lo que aprendí
1. Identifica y relaciona cada conjunto de datos con su respectiva media.
9 8 9 9 5
7,2
6 3 3 4 8
8 5 6 9 3 5,6
9 3 2 2 9
9 2 8 4 5
6,4
7 3 3 5 2
9 8 5 8 7
4,8
3 7 9 8 8
N° de 𝑓 𝑓𝑟 % 𝐹 𝐹𝑟 𝑥̂𝑖
nacimientos
[20 – 25) 16 16/64 25% 16 16/64 22,5
𝑥̂ = 155,55
A
VALORA TU APRENDIZAJE SI NO
VECES