Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3. DISTRIBUCIONES DE FRECUENCIAS
Cualquiera que sea el procedimiento para obtener datos estadísticos éstos deberán ser
confiable, para su posterior aplicación en la toma decisiones y la investigación.
Las fuentes primarias de datos estadísticos son aquellas instituciones que se ocupan
de obtener datos en forma permanente. Por ejemplo, en nuestro país se constituye en
fuente primaria el INE (instituto nacional de estadística). Los datos que obtiene un
investigador sobre la base de encuestas se constituyen en fuente primaria.
Las fuentes secundarias son aquellas que procesan información a partir de las fuentes
primarias. Se dice también que son fuentes de segunda mano. Por ejemplo, las revistas
que muestran información estadística tomando datos del INE Los datos estadísticos que
se obtiene mediante Internet deben ser cuidadosamente analizados si corresponden a
fuentes primarias o secundarias.
Base de datos
Una vez que se obtienen los datos, se construye una BASE DE DATOS, conformada
por todas las variables de estudio para luego clasificar para realizar un análisis que
permita alcanzar los objetivos propuestos.
Para el efecto se obtiene una muestra de docentes, se definen las variables y se tiene
la Base de Datos:
Cuadros estadísticos
Por ejemplo, las tablas estadísticas del Banco Central de Bolivia Las publicaciones del
Instituto Nacional de Estadística. (INE)
En las tablas estadísticas, se agrupan los valores que corresponden a una variable y se
registra el número de valores observados.
Los datos que todavía no han sido organizados se denominan datos brutos, porque no
se los clasificados utilizando frecuencias.
BASE DE DATOS
22 23 26 24 25 23 24 25 21 23 20
24 22 23 24 26 24 26 22 21 25 20
25 23 25 23 25 25 24 22 22 26 27
24 23 25 24 22 23 21 25 22 25 27
25 26 23 21 23 25 26 24 21 22
𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 % 𝑯𝒊 %
20 2 2 0.0370 0.0370 3.7 3.7
hi=fi/n 21 5 7 0.0926 0.1296 9.26 12.96
22 8 15 0.1481 0.2777 17.81 27.77
23 10 25 0.1853 0.4630 18.53 46.30
24 9 34 0.1667 0.6297 16.67 62.97
25 12 46 0.2222 0.8519 22.22 85.19
26 6 52 0.1111 0.9630 11.11 96.30
27 2 54 0.0370 1 3.7 100
54 100
Estadística Descriptiva Mario Luque Bernabé
Frecuencia absoluta: fi
Frecuencia relativa: h,
Esta frecuencia permite calcular el porcentaje que corresponde a cada valor que toma
la variable. Se designa mediante el símbolo: h,
𝑓𝑖
Población ℎ𝑖
𝑛
𝑓𝑖
Muestra ℎ𝑖
𝑁
𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + ⋯ 𝑓𝑘 = 𝑁
𝑘
∑ 𝑓1 = 𝑁
𝑖=1
ℎ1 + ℎ2 + ℎ3 + ℎ4 + ⋯ + ℎ𝑘 = 1
Los intervalos que se utilizan en una tabla estadística que corresponde al segundo caso,
se construye con la ayuda de ciertas fórmulas.
PASOS:
Primer paso: Rango Específico: (Re) o también (R).
𝑹 = 𝑽𝑺 − 𝑽𝒊
𝐾 = √𝑁
𝑹𝒆
𝒄=
𝑲
Tercer paso: Amplitud de un Intervalo
Por otra parte, si se conocen los limites inferior y superior de cada intervalo entonces se
puede utilizar la fórmula:
𝐶 = 𝐿𝑖 , 𝐿𝑖−1
Ejemplo: Los siguientes son los salarios (en $us.) que reciben un grupo de trabajadores
en Salud en forma mensual, y que constituye una muestra del total de trabajadores de
Sector Salud.
Estadística Descriptiva Mario Luque Bernabé
BASE DE DATOS
198 234 300 175 199 238 288
183 200 240 205 251 206 253
210 258 211 259 218 260 261
263 268 269 261 240 110 115
320 270 230 190 150 120 160
158 197 231 279 350
Primer paso:
Rango específico: Re = VS - Vi
Segundo paso:
𝑲 = √𝑵 = √𝟒𝟎 = 6.32 = 6
Tercer paso:
C = Re / k
C = 240/6
C = 40
Limites nominales:
Con el propósito de establecer límites de tal manera que un mismo valor no se repita en
dos intervalos sucesivos, se puede transformar los límites exactos en límites nominales.
Pero es posible sustituir a los decimales por valores enteros considerando que en la
construcción de intervalos o clases se considere que cada intervalo es cerrado por
izquierda y abierto por la derecha:
𝐿𝑦−1 , 𝐿𝑖
Estadística Descriptiva Mario Luque Bernabé
𝑳𝒊−𝟏 𝑳𝒊 𝑿𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝒉𝒊 % 𝑯𝒊 %
110 150 130 3 3 0.075 0.075 7.5 7.5
150 190 170 5 8 0.125 0.200 12.5 20
190 230 210 10 18 0.250 0.450 25 45
230 270 250 16 34 0.400 0.850 40 85
270 310 290 4 38 0.100 0.950 10 95
310 350 330 2 40 0.050 1.000 5 100
40 1.000 100
Marca de clase:
𝐿𝑖−1 + 𝐿𝑖
𝑋𝑖 =
2
C) tercer caso:
En este caso los valores (en millones de dólares) que toman la variable son únicos
(sin repetición). Por lo general están asociados a otra variable que es el tiempo
Ejemplo:
Años Exportaciones
2018 9.110,4
2019 8.933,3
2020 7.092,6
2021 11.079,8
2022 13.603,7
Fuente: INE
Representaciones gráficas
Las gráficas o diagramas se utilizan para representar los datos en forma de figuras y
trazos, ya sean bidimensionales, tridimensionales: Sirven para efectuar comparaciones
entre conjuntos de datos
Tipos de gráficas
a) Diagrama de Barras
En este tipo de presentación, cada barra rectangular corresponde a una modalidad. Todas las
barras tienen base de igual longitud y altura proporcional a la frecuencia (fi) o frecuencia relativa
(hi) que presen modalidad. Tomemos la distribución de frecuencias de la variable grado de
instrucción, obtenida de una muestra de 178 estudiantes. Se considerará que cada estudiante
pertenece al mayor grado de instrucción que ha concluido.
Modalidad fi fi%
Primer año 73 41%
Segundo año 51 29%
Tercer año 54 30%
178
Gráfico de Barras
80
NÚMERO DE ESTUDIANTES
60 73
40 51 54
20
0
Primer año Segundo año Tercer año
GRADO DE INSTRUCCIÓN
Se aplica para mostrar la variable en función de los tipos toma la variable. Es decir, se
aplica para representar una variable que está en función de otra.
Ejemplo: Se tienen los datos que corresponden a las exportaciones de ARROZ de tres
tipos diferentes I, II y III. Las exportaciones son en Toneladas métricas
Gráfico de componentes
100% 20 15 10
80% 20
20 10
60% 35
40% 15
35 20
20% 20 10
0%
2018 2019 2020 2021
d) Histograma
Gastos Xi Nº De Familias
0 - 500 500 10
500 - 1000 750 26
1000 - 1500 1250 24
1500 - 2000 1750 17
2000 - 2500 2250 13
2500 - 3000 2750 8
3000 – 3500 3250 2
TOTAL 100
Gráfico de Histograma
30
Número de familias
25
20
15
10
5
0
500 750 1250 1750 2250 2750 3250
Gastos
e) Polígono de frecuencias
Uniendo los puntos medios de los lados superiores de cada barra rectangular del
histograma se obtiene un gráfico llamado polígono de frecuencias. El conocimiento del
polígono de frecuencias ayudará más adelante en la búsqueda del modelo teórico que
mejor describa a los elementos de la población de acuerdo con la variable que se
estudia.
Estadística Descriptiva Mario Luque Bernabé
Gráfico de Poligono
30
Número de familias
25
20
15
10
5
0
500 750 1250 1750 2250 2750 3250
Gastos
f) Gráfico de área
Antigüedad en Años Xi fi
2—4 3 6
4—6 5 5
6—8 7 7
8 —10 9 4
10 —12 11 2
12 —14 13 9
14 -16 15 10
Gráfico de área
12
10
Frecuencia
8
6
4
2
0
3 5 7 9 11 13 15
Años de antiguedad
g) Gráfico de línea
Gráfico de Línea
100
80
Producción
60
40
20
Meses
EJEMPLO:
Se debe construir la columna que contiene a las frecuencias absolutas acumuladas (Fi)
Puntaje obtenido
Puntaje Obtenido Xi fi Fi
10-12 11 22 22
12-14 13 15 37
14-16 15 8 45
16-18 17 15 60
18-20 19 3 63
20-22 21 9 72
22-24 23 18 90
Gráfico de Ojiva
100
N° de estudiantes
80
60
40
20
0
11 13 15 17 19 21 23
Edad
Estadística Descriptiva Mario Luque Bernabé
Se utiliza para mostrar los elementos de una variable, cuando el número de valores es
reducido.
33% A
B
C
56%
Se utiliza para mostrar dos o más momentos de una variable. Por ejemplo, cuando se
quiere observar el comportamiento de 5 estudiantes en su evolución del primer al
segundo parcial
CCI JRR