Está en la página 1de 10

Distribuciones de Frecuencias y Elaboración de Gráficas

1. Distribución de Frecuencias

Decíamos en la clase anterior que la estadística descriptiva es el conjunto de métodos para


organizar y presentar los datos de manera informativa. Un conjunto de datos no organizados no
tiene mucho valor, los datos se pueden organizar en tablas de distribución de frecuencias.

Cuando se tienen pocos datos, se pueden presentar sin agrupar, es decir tal cual los
observamos en el estudio que se esté realizando. Cuando son muchos datos se recomienda
agruparlos con el fin de observar el comportamiento de la información.

En las tablas de distribución de frecuencia los datos se clasifican y ordenan de acuerdo a


ciertas características cualitativas o cuantitativas, indicándose el número de veces que se
repite, en tal forma que permitan al lector tener una visión del conjunto, aclarando el texto del
informe o completándolo.

Símbolos Utilizados en las Tablas de Frecuencia

N = Tamaño poblacional.
n = Tamaño de la muestra.
Identificación para valores observados sin ordenar.
= representa los valores que toma la variable ya ordenada si ésta es discreta ó la marca
de clase en la variable continúa.
= Frecuencia absoluta, número de veces que se repite cada valor de la variable.
ni
hi = Frecuencia relativa, n es un valor porcentual obtenido al dividir la frecuencia absoluta
entre el tamaño de la muestra (n).
Ni = Frecuencia absoluta acumulada.
Hi = Frecuencia relativa acumulada.
m = Número de intervalos ó número de marcas de clase.
C = Amplitud o tamaño de cada intervalo
Yi ' 1  Yi '  Los intervalos en que se divide la variable continua. Siendo Yi ' 1 el límite inferior y
Yi ' el límite superior del intervalo.

1.1 Distribución de Frecuencia con Variable Cualitativa

Ejemplo:

Se realiza un estudio en el barrio Ciudad Montes de la ciudad de Bogotá a 150 hogares de


clase media, para conocer la clase de suplemento alimenticio usado con sus hijos, los
resultados son los siguientes: Kola Granulada, 65 hogares; Centrum, 14 hogares; Choco listo,
17 hogares; Nutricol, 21 hogares; compran sin especificación de marca, 13 hogares; Ensure, 6
hogares; Sustagen, 21 hogares.

a) ¿Cuál es la población?
b) ¿Cuál es el tamaño de la muestra?
c) ¿Cuál es la variable?
d) ¿De qué tipo es la variable?
e) ¿Cuantas clases tiene la distribución?
f) ¿Construir una distribución de frecuencias
g) ¿Cómo se explica que la suma de las frecuencias sea superior al número de hogares?

Solución:

Mg. Idialy Montoya Aguilar


a) Población: Habitantes del barrio Ciudad Montes de la ciudad de Bogotá.
b) El tamaño de la muestra es 150 hogares de clase media.
c) La variable en estudio es el tipo de suplemento que usan los hogares de clase media
en el barrio Ciudad Montes de la ciudad de Bogotá.
d) Variable cualitativa
e) Tiene siete clases la distribución.
f) Tabla de Distribución de Frecuencias

Tabla 1. Distribución de Tipo de Suplemento Alimenticio Usado Familias de Clase Media.


Yi
ni
Tipo de
Frecuencia
Suplemento
Centrum 14
Choco Listo 17
Endure 6
Kola Granulada 65
Nutricol 21
Sin Marca 13
Sustagen 21
Total 157

g) La suma de frecuencias es superior al número de hogares, debido a que algunos


hogares usan más de un tipo de aceite o grasa.

3.2 Distribución de Frecuencia con Variable Discreta

Ejemplo:

Supongamos que se tienen 300 cajas en la bodega de un hospital y cada una de ellas contiene
medicamentos. Se desea examinar las cajas con el fin de saber el número de medicamentos
que han sufrido imperfectos en el transporte del laboratorio hasta la bodega. Por motivos de
tiempo, espacio físico y personal disponible se toma la decisión de revisar un 10% de las cajas.

N = 300 cajas (tamaño de la población)


n = 30 cajas (tamaño de la muestra)
Variable: Numero de medicamentos imperfectos de cada caja.

El primer paso de cualquier estudio estadístico es recoger los datos. Cada caja seleccionada
se simboliza por x i donde el subíndice i toma los valores desde 1 hasta n. Cada x i tendrá
como valor el correspondiente a la característica observada.

x1  2 x6  3 x11  0 x16  2 x 21  2 x 26  2
x 2  1 x7  2 x12  2 x17  3 x 22  2 x 27  3
x3  1 x8  1 x13  3 x18  0 x 23  1 x 28  2
x 4  0 x9  2 x14  1 x19  3 x 24  4 x 29  1
x5  3 x10  4 x15  2 x 20  2 x 25  3 x30  2

La anterior información la denominaremos datos sin agrupar ó datos originales.

Una vez que tenemos los datos recogidos, pasamos a hacer el recuento ó tabulación:
determinando los valores que toma la variable ( y i ) y contando el número de veces que
aparece cada una ( ni ). Por lo tanto, los valores que toma la variable son, 0, 1, 2, 3, y 4

Mg. Idialy Montoya Aguilar


Tabla 2. Distribución de Frecuencias de medicamentos imperfectos
yi ni hi Ni Hi
0 3 0,10 3 0,10
1 6 0,20 9 0,30
2 12 0,40 21 0,70
3 7 0,23 28 0,93
4 2 0,7 30 1
 30 1

y i = Valores que toma la variable


ni = Número de caja con imperfectos. La sumatoria de los datos de esta columna debe
coincidir con el tamaño de la muestra.
hi = Frecuencia relativa, la sumatoria de los datos debe dar 1 ó el 100%
ni
En el cálculo de las frecuencias relativas se efectúa de la siguiente forma: hi 
n
Entonces:

n1 3
h1    0,10 ó 10%
n 30

n2 6
h2    0,20 ó 20%
n 30

n3 12
h3    0,40 ó 40%
n 30

n4 7
h4    0,23 ó 23%
n 30

n5 2
h5    0,07 ó 7%
n 30

N i = La obtención de las frecuencias absolutas acumuladas se hace por medio de sumas


sucesivas. Los datos de esta columna se suman y la ultima frecuencia absoluta acumulada
será igual al tamaño de la muestra (n.)

N1  n1  3
N 2  N1  n2  3 6  9
N 3  N 2  n3  9  12  21
N 4  N 3  n4  21  7  28
N 5  N 4  n5  28  2  30

H i = Al igual que en las frecuencias absolutas acumuladas, se procede para obtención de las
frecuencias relativas acumuladas. Los datos de esta columna no se suman y la última
frecuencia relativa acumulada será igual a 1 ó 100%

H1  h1  0,10 ó 10%
H 2  H1  h2  0,10  0,20  0,30 ó 30%

Mg. Idialy Montoya Aguilar


H 3  H 2  h3  0,30  0,40  0,70 ó 70%
H 4  H 3  h4  0,70  0,23  0,93 ó 93%
H 5  H 4  h5  0,93  0,7  1 ó 100%

Se podrá observar en la tabla 2, que la frecuencia absoluta nos indica, que, de las 30 cajas
examinadas, 3 de ellas no presentaron medicamentos defectuosos, 6 cajas presentaron 1
medicamento defectuoso, y así sucesivamente. La frecuencia relativa indica lo mismo, pero
términos de porcentaje así: un 10% de las cajas examinadas no presentaron medicamentos
defectuosos, el 20% de las cajas tienen 1 medicamento defectuoso, etc. La frecuencia absoluta
acumulada nos indica que de las 30 cajas hay 21 de ellas que contienen hasta 2 medicamentos
defectuosos que corresponden al 70% (frecuencia relativa acumulada), etc.

3.3 Distribución de Frecuencia con Variable Continua:

Para este tipo de variable se debe aumentar la cantidad de elementos a analizar y no se


analizan los datos individualmente, sino que se agrupan por medio de intervalos que
proporcionan un análisis general por grupo de datos. Además, Se emplea si
las variables toman un número grande de valores.

1. Se determina el Rango ó Recorrido: Valor máximo – valor mínimo que toma Xi


R  X max  X min

2. Se determina el número de intervalos ó marcas de clase m el cual no debe ser menor


de 5 ni mayor de 16; una de las formas de obtener m es aplicando la regla de Sturges,
con la cual se obtiene una aproximación aceptable, m=1+3.3 Log n, ó mediante
m n

3. Una vez determinado el número de intervalos, se determina su amplitud mediante la


formula:

X max  X min R
C 
m m
Ejemplo:
Supongamos que el jefe de ventas investiga los precios (en miles $) de cierto artículo en 40
almacenes diferentes y encuentra los siguientes datos:

76 85 80 88 74 65 91 89
76 83 71 70 86 67 68 73
77 71 75 75 68 74 72 75
84 75 75 73 87 68 79 70
72 63 77 89 60 72 83 88

Elaborar la distribución de frecuencias.

Solución
1. Se determina el Rango ó Recorrido:

R  X max  X min
R  91  60
R  31
2. Se determina el número de intervalos:

Mg. Idialy Montoya Aguilar


m  1  3.3 Log n
m  1  3.3 Log 40
m  6,28
m6
3. Se determina el tamaño de cada intervalo o su amplitud:
X max  X min R
C 
m m
31
C  5,1666
6
C6
Para facilitar los cálculos se aproxima C a 6, siempre al número inmediatamente superior por
pequeña que sea la fracción, por lo tanto, se altera el valor del rango.

anteriormene ahora
31 36
C  5,16 C 6
6 6
El rango se incrementa en 5 unidades, de 31 pasó a 36. El incremento debe ser distribuido
ojalá proporcionalmente, sumando unas unidades al límite superior (91+3=94) y restándole
otras al límite inferior (60-2=58).

Para la elaboración de los intervalos, se inicia con la determinación del valor de X min en el
nuevo rango, siendo en nuestro caso 58, el cual se toma como límite inferior del primer
intervalo, luego se procede a agregarle el valor de la amplitud para así obtener el limite
superior, que será a su vez el limite inferior del segundo intervalo, al cual se le agrega
nuevamente el valor de C para obtener el límite superior del segundo intervalo, y así
sucesivamente hasta conformar la columna de la variable continua.

Tabla 3. Tabla de frecuencias del precio de cierto artículo


Y '
i 1  Yi '
yi ni hi (%) Ni H i (%)
58 – 64 61 2 5 2 5
64 – 70 67 7 17,5 9 22,5
70 – 76 73 16 40 25 62,5
76 – 82 79 4 10 29 72,5
82 – 88 85 8 20 37 92,5
88 - 94 91 3 7,5 40 100
Total 40 100

Se observa también que a cada uno de los limites inferiores de los intervalos se les agregó 0,1
con el fin de facilitar la clasificación de cada observación, así por ejemplo X 1  70 estaría
considerada en el intervalo 64,1 – 70 y no en el intervalo 70,1 – 76.

Debe quedar claro que la amplitud del intervalo sigue siendo 6 y que el 0,1 es usado
únicamente como ayuda para la clasificación.

La columna simbolizada por y i se denomina marca de clase y se puede obtener de las


siguientes formas:

1. Como promedio de los límites de cada intervalo:


y 0'  y1' 58  64
y1    61
2 2

Mg. Idialy Montoya Aguilar


y1'  y 2' 64  70
y2    67
2 2
y 2'  y3' 70  76
y3    73
2 2

y5'  y 6' 88  94
… y6    91
2 2
2. Si la amplitud del intervalo es constante, basta con determinar la primera marca de clase, de
acuerdo con el método anterior, luego se le va sumando el valor de la amplitud:

y 0'  y1' 58  64
y1    61
2 2
y 2  y1  C  61  6  67
y 3  y 2  C  67  6  73
y 4  y 3  C  73  6  79

Y así sucesivamente.

4. Elaboración de Gráficas
Las tablas estadísticas muestran la información de forma esquemática y están preparadas para
cálculos posteriores. La misma información estadística puede mostrarse de forma global y más
expresiva, utilizando los gráficos estadísticos. Los gráficos poseen un fuerte poder de
comunicación de los resultados de un estudio estadístico.

4.1 Diagrama de Barras ó Histograma


Un diagrama de barras se utiliza para representar datos cualitativos o datos cuantitativos de
tipo discreto y continuo.
Se representan sobre unos ejes de coordenadas, en el eje de abscisas (X) se colocan
los valores de la variable ó la amplitud del intervalo, y sobre el eje de ordenadas
(Y) las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo
sanguíneo ha dado el siguiente resultado:

Tabla 4. Distribución de frecuencias del grupo sanguíneo


Grupo Sanguíneo Frecuencia
A 6
B 4
AB 1
O 9
Total 20

Mg. Idialy Montoya Aguilar


Grupo Sanguineo Más Representativo

9
8
7
6
Número de 5
Alumnos 4
3
2
1
0
A B AB O
Grupo Sanguineo

Grafica 1. Grupo sanguíneo más representativo

4.2 Polígono de Frecuencia

Un polígono de frecuencia se forma uniendo los extremos de las barras mediante segmentos.
También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos
mediante segmentos.
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto
medio de cada rectángulo.

Ejemplo
1. Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Tabla 5. Tabla de frecuencias de la temperatura en un día de otoño

Hora Temperatura
(Grados C)
6 7
9 12
12 14
15 11
18 12
21 10
24 8

Mg. Idialy Montoya Aguilar


Tem peratura en un día de Otoño

16
14
12
Temperatura (C) 10
8
6
4
2
0
6 9 12 15 18 21 24
Hora

Grafica 2. Temperaturas en un día de otoño

4.3 Diagramas Acumulativos (ojivas)

En ocasiones se desea mostrar la distribución de datos, en forma acumulada. Las frecuencias


acumuladas se pueden formar sobre una base “menor que” ó “mayor que” y se obtienen
sumando en orden ascendente o descendente las frecuencias.

Tabla 6. Distribución de frecuencias del peso de un grupo de personas


Peso kg. Yi ni Ni hi Hi
50-60 55 8 8 0,12 0,12
60-70 65 10 18 0,15 0,28
70-80 75 16 34 0,25 0,52
80-90 85 14 48 0,22 0,74
90-100 95 10 58 0,15 0,89
100-110 105 5 63 0,08 0,97
110-120 115 2 65 0,03 1,00
Total 65 1,00

Mg. Idialy Montoya Aguilar


Peso Representativo en Porcentaje

1,20

1,00
Porcentaje Hi
0,80

0,60

0,40

0,20

0,00
50-60 60-70 70-80 80-90 90-100 100- 110-
110 120
Peso

Grafica 3. Peso representativo en porcentaje de un grupo de personas

4.4 Diagrama de Sectores

Se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables
cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente.

El diagrama circular se construye con la ayuda de un transportador de ángulos.

Ejemplo

En una clase de 30 alumnos, 12 juegan baloncesto, 3 practican la natación, 9 juegan al fútbol y


el resto no practica ningún deporte.

Tabla 7. Distribución de frecuencia del tipo de deporte


Deporte Alumnos Angulo
Baloncesto 12 144
Natación 3 36
Fútbol 9 108
Sin Deporte 6 72
Total 30 360

Mg. Idialy Montoya Aguilar


No. De Alum nos Por Deporte

Sin Deporte; 6;
20%
Baloncesto; 12;
40%

Fútbol; 9; 30%
Natación; 3; 10%

Grafica 4. Cantidad de Alumnos por deporte

Mg. Idialy Montoya Aguilar

También podría gustarte