Está en la página 1de 42

DISTRIBUCIONES DE

FRECUENCIAS

XS-1110
I 2019
Prof. Andrés E. Arguedas Leiva
NECESIDAD DE RESUMIR LA
INFORMACIÓN

• Los datos estadísticos provienen de la acción de contar o medir


y pueden haberse obtenido anotando el número de elementos
que corresponden a cada una de las categorías definidas o
también ser el fruto de una operación más compleja.
• Lo anterior da origen a variables cualitativas (o atributos) y
cuantitativas (continuas y discretas).
NECESIDAD DE RESUMIR LA
INFORMACIÓN

• Una vez que recolecto los datos, no puedo presentar los casos
individualmente:
a. Es poco ético
b. No son interpretables
c. No permiten observar relaciones ni tendencias.  
• ¿Qué se puede hacer? Una opción podría ser contar y agrupar
las personas que respondieron de forma similar.
ANÁLISIS DE LOS DATOS
CUANTITATIVOS

• Para analizar e interpretar los datos estadísticos


correspondientes a variables cuantitativas se debe tener
información de los siguientes aspectos:
1. La forma o patrón de distribución de los datos.
2. La posición de la distribución, es decir, alrededor de qué valor se
tienden a concentrar (tendencia central).
3. La dispersión (variabilidad) de los datos alrededor de los valores
centrales.
ANÁLISIS DE LOS DATOS
CUANTITATIVOS

• Cuando los datos son pocos, con solo ordenarlos se puede tener una
idea de estos aspectos. Sin embargo, cuando son muchos datos estos
se pueden agrupar en una distribución de frecuencias.
• En estas se suele presentar frecuencias simples y acumuladas, tanto
absolutas como relativas.
• Una distribución de frecuencias es una ordenación o arreglo de datos
en clases o categorías que muestran, para cada una de ellas, el
número de elementos que contiene o frecuencia.
E J E M P LO
DISTRIBUCIÓN DE FRECUENCIAS DE
VARIABLES DISCRETAS

• En este caso, al ser las opciones de respuesta discretas, se pueden utilizar para
determinar cada casilla.
• Primero, se debe listar y ordenar todas las opciones de respuesta. Si son muchas
se pueden agrupar.
• Segundo, se hace un recuento (por medio de palitos) de la cantidad de casos
para cada opción de respuesta. Este recuento luego pasa a ser la frecuencia simple
absoluta (fi).
• Tercero, se pueden obtener el resto de las frecuencias:
• Frecuencia simple relativa (fr): se divide cada fi entre n (el número total de observaciones).
• Frecuencias acumuladas hacia abajo (F↓): se suman las fi (o fr en caso de ser relativa) de todas
las casillas con opciones de respuesta menor o igual.
• Frecuencias acumuladas hacia arriba (F↑): se suman las fi (o fr en caso de ser relativa) de todas
las casillas con opciones de respuesta mayor o igual.
E J E M P LO
EJEMPLO

• ¿Cual es el valor más


frecuente?
• ¿En que parte se
concentra la mayoría
de las observaciones?
EJEMPLO

• Las distribuciones de variables


discretas pueden presentase por
medio de gráficos de bastones o
de barras verticales, con
frecuencias absolutas o relativas.
EJEMPLO

• ¿Como se interpreta la
frecuencia acumulada
“menos de” 22?
• ¿Cómo se interprereta
la frecuencia
acumulada “más de”
10?
EJEMPLO

• Las frecuencias
acumuladas también
se pueden graficar, en
este caso, “a menos
de”
EJERCICIO

• Tome los siguientes 20 datos correspondientes al número de


hijos de un grupo de mujeres entre 20 y 40 años:
6, 4, 2, 2, 5, 3, 1, 2, 1, 3, 0, 0, 6, 1, 2, 3, 2, 4, 2, 0.
• Construya una distribución de frecuencia utilizando frecuencias
simples y acumuladas, tanto absolutas como
relativas/porcentuales.
• ¿Cómo se interpretarían los distintos tipos de frecuencias?
MEDICIÓN DE VARIABLES
CONTINUAS Y EL REDONDEO

• Teóricamente una variable continua puede medirse con la


exactitud que se quiera sin embargo, en la práctica la precisión
del instrumento va a determinar la exactitud.
• Por ello, las variables continuas usualmente se presentan
redondeadas, ya sea por el instrumento utilizado o por que no se
requiere registrarlos con tanta exactitud.
• Hay tres tipos de redondeo que se acostumbra emplear:
• Redondeo a la unidad más próxima (el de uso más común)
• Redondeo hacia abajo
• Redondeo hacia arriba
1) REDONDEO A LA UNIDAD MÁS
PRÓXIMA

• Es el método más utilizado.


• Reglas para este tipo de redondeo (pag.115):
• Si el primer dígito de la parte del número que se eliminará en el
redondeo es menor que 5, el dígito precedente permanece sin
cambio.
• Si la parte del número que será eliminada en el redondeo es mayor
que 5, el dígito precedente se incrementa en una unidad.
• Si el primer dígito de la parte por eliminar en el redondeo es
exactamente 5, es decir un 5 seguido únicamente de ceros, el dígito
precedente se aumenta en una unidad si es impar y se deja sin
cambio si es par.
EJEMPLOS

1. 13.549 a cientos – 13.549 (menor a 5) – 135 cientos


2. 48,501 a unidades - 48,501(mayor a 5) – 49 unidades
3. 475 y 485 a decenas - 475 y 485 (iguales a 5 ¿par o
impar?) – ambos 48 decenas
4. 20.500.000 a millones – 20.500.000 (iguales a 5, cero es
par) – 20 millones
EJERCICIO

• Utilice redondeo a la unidad más próxima para los siguientes


casos:
1. Redondear 75,501 a unidades
2. Redondear 167.495 a cientos.
3. Redondear 521 a decenas.
4. Redondear 55.500.000 a millones.
2) REDONDEO HACIA ABAJO

• Se conserva el último dígito que interesa y el resto del número


se elimina.
• Un ejemplo real de este tipo de redondeo es indicar la edad
mediante “años cumplidos” en donde la edad verdadera
siempre se va a redondear para abajo (ejemplo: 20 años con
10 meses y 3 días equivale a 20 años cumplidos).

• Ejemplo:
• Redondear hacia abajo 576 a decenas ⇢ 57 decenas
• Redondear hacia abajo 45,32 a unidades ⇢ 45
3) REDONDEO HACIA ARRIBA

• El último dígito que se desea conservar siempre se incrementa


en una unidad, excepto si va seguido únicamente de ceros.

• Ejemplo:
• Redondear hacia arriba 576 a decenas ⇢ 58 decenas.
• Redondear hacia arriba 45,32 a unidades ⇢ 46 unidades.
• Redondear hacia arriba 1.100 a cientos ⇢ 11 centenas.
EJEMPLO
DISTRIBUCIÓN DE FRECUENCIAS DE
VARIABLES CONTINUAS

• En este caso, el proceso de construir una distribución de frecuencias puede complicarse


más que en el caso discreto. Los procedimientos para este tipo de variable continua
también son validas para variables discretas con una amplitud muy grande.
• Primer paso: ordenar los datos de menor a mayor.
• Segundo paso: calcular la amplitud (o recorrido) R. Amplitud = Máximo –
Mínimo
• Tercer paso: obtener el ancho de cada clase (c) y el número de clases (k).
Esto se hace dividiendo la amplitud entre distintos números de clases y
eligiendo el más cómodo (múltiplo de 5 o de 10 redondeando).
• Por lo general, se utilizan entre 6 y 15 clases
• Cuarto paso: Delimitar bien los límites de cada intervalo y proceder a
obtener las frecuencias.
EJEMPLO

PASO 1: ORDENAR LAS


OBSERVACIONES
EJEMPLO

• Paso 2: Calcular la amplitud


• R = Max-Min = 88-45 = 43
• Paso 3: Obtener ancho de
clase
• ¿Dónde empezar?
• ¿Qué intervalo o amplitud usar
para las clases?
• Por lo general, se usan entre 6 y 15
clases
EJEMPLO

• Paso 4: Construir intervalos donde cada clase tiene un


intervalo de 5 kg
• 45 a 50, 50 a 55, 55 a 60, etc.
• 45 a 49, 50 a 54, 55 a 59, etc.

• Las clases deben ser exhaustivas y excluyentes


E J E M P LO
LÍMITES REALES E INDICADOS

• Los límites son los valores que definen a una clase haciendo la
separación la anterior y la siguiente. Los límites deben ser tales
que definan clases exhaustivas y mutuamente excluyentes.
• Todas las clases tienen dos tipos de límites:
• Límites indicados: son los que aparecen en la distribución
• Límites reales: son los que señalan la verdadera extensión de la clase,
es decir, los valores de la característica de interés que abarca realmente.
• En el ejemplo anterior, por redondeo, hay discontinuidades entre
los límites de cada clase. Aun así, los verdaderos valores y límites
pueden tener más decimales
LÍMITES REALES E INDICADOS

• Para ajustar por el efecto del redondeo sobre los límites


indicados, se le agrega media unidad al límite superior y media
unidad al límite inferior, lo que genera una continuidad entre
las clases.
E J E M P LO
LÍMITES REALES E INDICADOS

• Se podría pensar que al poner el mismo, por ejemplo 49,5


como límite superior de una clase y como inferior de la
siguiente, se plantea una ambigüedad, ya que no se sabe en
qué clase debe situarse el 49,5.
• Esto, en rigor, es correcto, pero como los datos que se
clasifican – los pesos- vienen redondeados en kg enteros en la
práctica no se presenta esa ambigüedad, ya que todos los
pesos en kg entero pueden clasificarse inequívocamente.
• Si los datos estuvieran redondeados a decimas de kg, entonces
lo que debe hacerse en fijar los límites reales en centésimas de
kg siguiendo el mismo procedimiento antes indicado.
REDONDEO HACIA
Límites reales ABAJO Y HACIA ARRIBA
Límites
Indicado Más Hacia
s Hacia abajo
cercano arriba
• Se pueden aplicar las diversas técnicas
44.5 – 45 a menos Más de de redondeo en la generación de los
45 - 49 límites reales.
49.5 de 50 44 a 49
49.5 – 50 a menos Más de 1. El redondeo hacia abajo
50 - 54 siempre va a ir desde el límite
54.5 de 55 49 a 54
indicado inferior a menos del
54.5 – 55 a menos Más de límite indicado inferior de la
55 - 59
59.5 de 60 54 a 59 siguiente clase.
59.5 – 60 a menos Más de 2. El redondeo hacia arriba va a
60 - 64 ir desde más del límite indicado
64.5 de 65 59 a 64
superior de la clase anterior al
límite indicado superior de la
clase correspondiente.
EJERCICIO

• Imagine que tiene una distribución con lo siguientes límites indicados:


• 20 a 24
• 25 a 29
• 30 a 34

• Determine los límites reales con el tipo de redondeo


• Más cercano
• Hacia abajo
• Hacia arriba
INTERVALOS DE CLASE Y PUNTO
MEDIO

• Intervalo de clase
• Es la amplitud de la clase. Se calcula restando el límite real
superior y el limite real inferior de la clase
• Las clases usualmente tienen intervalos del mismo tamaño, pero a
veces se pueden encontrar distribuciones con tamaños distintos
• Punto medio
• Es el valor central de la clase, que se calcula mediante el promedio
de los límites reales, es decir, se suman ambos límites reales y se
divide entre dos
• Este punto medio se utilizará para calcular ciertas medidas en datos
agrupados
CLASES ABIERTAS

• En ocasiones se tienen valores extremos (datos que se


apartan mucho de la mayoría, ya sea hacia abajo o hacia
arriba) y si intentamos agregar esto a las clases puede
ocasionar clases intermedias que no tengan datos
• Para solucionar esto se pueden construir clases abiertas al
principio o al final de la distribución. Estas son del tipo “menos
de 400” o “2500 y más”.
• Estas clases no permiten calcular el punto medio y la amplitud
de la clase, por lo que deberían de evitarse siempre que sea
posible, especialmente si se busca obtener otros cálculos.
REGLAS BÁSICAS PARA LA
CONSTRUCCIÓN DE
DISTRIBUCIONES

1. Si son pocas observaciones, se pueden ordenar los datos y


no es necesario construir una distribución de frecuencias
2. Las clases deben ser exhaustivas y mutuamente
excluyentes
3. Debe procurarse que el número de clases esté entre 6 y 15
4. Siempre que sea posible, evitar las clases de diferente
amplitud y las abiertas
5. Si hay valores alrededor de los cuales existen
concentraciones de los datos, es recomendable que esos
valores se tomen como puntos medios
GRÁFICOS DE DISTRIBUCIONES DE
FRECUENCIAS

• Los patrones de variación de los datos se pueden apreciar de


mejor forma se las distribuciones de frecuencia se grafican
• Esto no solo contribuye a un mejor análisis de los datos,
también facilita la comprensión por un mayor número de
personas
GRÁFICOS DE DISTRIBUCIONES DE
FRECUENCIAS

• Las clases que se construyen en una distribución de frecuencia se pueden


graficar de distintas maneras:
• Histograma
• Utiliza los límites reales en su eje horizontal para delimitar el tamaño de las barras
• Polígono de frecuencia
• Utiliza el punto medio en el eje horizontal para graficar cada punto
• Ojivas (grafica las frecuencias acumuladas)
• A menos de (F↓)
• A más de (F↑)

• Estos gráficos deben incluir nombres en los ejes y título


HISTOGRAMA

• Es un gráfico de barras
verticales, donde no hay
distancia entre ellas (a
diferencia del gráfico de
barras)
• Utiliza los límites
reales en su eje
horizontal para
delimitar el tamaño de
las barras.
POLÍGONO DE
FRECUENCIAS

• Forma alternativa de presentar una distribución de


frecuencias
• Consiste en marcar sobre cada clase el punto medio
de la misma
• El área bajo el polígono debe ser igual al área
comprendida bajo el histograma; para ellos se
procede como si existiera una clase adicional al
principio y otra al final, ambas con frecuencia cero
G RÁ F I CO D E O JI VA S O PO L ÍG O NO
DE F R E CU E NCI A S ACU MU L A DA S

• Gráfico para representar frecuencias


acumuladas.
• Es similar al polígono anterior, la única
diferencia es que en este caso no se levanta
sobre el punto medio de la clase, sino sobre el
límite superior o sobre el inferior, según se
tenga una frecuencia acumulada “menos de”
o “más de”.
GRÁ F I CO D E O J I VA S O
POLÍ GONO D E
F R E C UEN C I A S AC U M U L A DA S

• En la ojiva “menos de” los puntos se


trazan sobre el límite real superior
y debe crearse una clase adicional
al principio con frecuencia cero,
para que inicie en 0
• En la ojiva “más de” los puntos se
trazan sobre el límite real inferior
y debe crearse una clase adicional
al final con frecuencia cero, para
que la ojiva termine en 0
EJERCICIO

• Construya una distribución de frecuencia para las siguientes 50


edades (k = 8):

18, 19, 20, 21, 21, 22, 22, 23, 23, 24,
24, 24, 26, 26, 26, 26, 26, 26, 27, 27,
27, 27, 28, 28, 28, 28, 28, 29, 29, 29,
29, 30, 30, 30, 31, 31, 31, 32, 32, 33,
33, 34, 34, 35, 35, 36, 37, 37, 40, 41
EJERCICIO

• Una muestra de 74 familias de un


cantón rural de San José fue
investigada para conocer el
consumo mensual de energía
eléctrica. Seguidamente se dan las
cifras de kWh, correspondientes al
mes de diciembre del 2008.
• Construya la distribución de
frecuencias con una cantidad de
clases apropiadas

También podría gustarte