Está en la página 1de 5

UNIDAD NRO 2: Organización y presentación de datos

Cuando una serie de datos reunidos contiene aproximadamente 20 o más observaciones, la mejor forma
de examinar tales datos masivos es presentarlos en forma de resúmenes, construyendo tablas y diagramas
apropiados, con el fin de intensificar el análisis e interpretación de datos para el proceso de toma de
decisiones.
Las observaciones independientes pueden organizarse en una clasificación ordenada o diagrama de tallo y
hojas y luego presentarse en forma tabular como una distribución de frecuencia o en forma gráfica como
un histograma, polígono u ojiva.

Organización de datos numéricos: Clasificación ordenada y el diagrama de tallo y hojas.


Al crecer el número de observaciones, se hace más difícil centrarse en las principales características de un
conjunto de datos y se necesitan métodos para ayudarnos a organizar las observaciones de manera que
entendamos mejor la información que transmite la serie de datos. Existen dos métodos para lograr esto:
● Clasificación ordenada. Consiste en ordenar los datos sin procesar de la observación más pequeña
a la más grande. Mientras mayor sea el número de observaciones en una serie de datos, más
pesado es formar la clasificación ordenada. En tales situaciones se hace útil organizar la serie de
datos en un diagrama de tallo y hojas con el fin de estudiar sus características.
● Diagrama de tallo y hojas. Separa las entradas de datos en “tallos” y “hojas”. La columna de
números a la izquierda de la línea vertical se denomina “tallo” y corresponden a los dígitos guía de
los datos. En cada fila las “hojas” se bifurcan a la derecha de la línea vertical, y estas entradas
corresponden a dígitos rastreros.
Se utiliza para datos numéricos de 2 a 3 cifras. Si tiene más, se descarta la última.
1. Se coloca la 1 (y 2da) cifra del número del lado izquierdo de la línea vertical
2. Se colocan la 2da y 3er cifra que acompaña al tallo
3. Se ordenan las hojas de menor a mayor.

Tabulación de datos numéricos: la distribución de frecuencia


Al crecer el número de observaciones se hace necesario condensar aún más los datos en tablas de
resumen apropiadas. Tal acomodo de los datos en forma tabular se denomina una distribución de
frecuencia,
Distribución de frecuencia: Es una tabla de resumen en la que los datos se disponen en agrupamientos o
categorías convenientemente establecidas de clases ordenadas numéricamente.
Es una tabla en la cual se agrupan en clases los valores posibles para una variable y se registra el número
de valores observados que corresponde a cada clase. Los datos organizados en una distribución de
frecuencia se denominan datos agrupados.

● Selección del número de clases. El número de agrupamientos de clase depende del número de
observaciones en los datos. Un número mayor de observaciones, requiere un mayor número de
grupos de clases. La distribución de frecuencia debe tener al menos 5 agrupamientos pero no más
de 15. Una tabla con demasiada concentración de datos no es significativa. En general:

Si n < 30 5 clases

30 < n < 60 6 clases

n > 60 7 clases
● Obtención de los intervalos de clase. Es deseable que el ancho de cada agrupamiento de clase sea
igual. Para determinar el ancho de cada clase:
𝑅𝑎𝑛𝑔𝑜
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑔𝑟𝑢𝑝𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
Rango: Diferencia entre el límite superior (nro más grande) e inferior(número más chico) de
observaciones.
𝑅𝑎𝑛𝑔𝑜 = 𝑁𝑟𝑜 𝑚á𝑥𝑖𝑚𝑜 − 𝑁𝑟𝑜 𝑚í𝑛𝑖𝑚𝑜
Para cada una de las clases de una distribución de frecuencia, los límites nominales de clase superior e
inferior indican los valores incluídos dentro de la clase. Las fronteras o límites exactos, son los puntos
específicos de la escala de medición que sirven para separar clases adyacentes cuando se trata de
variables continuas. Los límites exactos pueden determinarse identificando los puntos que están a la mitad
entre los límites superior e inferior de las clases adyacentes.
El Intervalo de clase indica el rango de los valores incluidos dentro de una clase y puede ser determinado
restando el límite exacto inferior de clase de su límite exacto superior.

Marca de clase: Punto medio de los límites de cada clase y es representativa de los datos de esa clase.

Ventajas de la tabla de resumen: las principales características de los datos se hacen evidentes
inmediatamente para el lector
Desventajas: no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de
clase particular sin tener acceso a los datos originales.
Procedimiento:
1. Determinar rango de la muestra
2. Definir clases o subgrupos
3. Determinar el ancho de clase
4. Determinar marca de clase, frecuencias absolutas, relativas y porcentuales. (simples y acumuladas)
- Frecuencia absoluta: cantidad de observaciones en cada intervalo
- Frecuencia relativa:
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝑁𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
- Frecuencia absoluta: 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 . 100
5. Realizar gráficos
Se emplean técnicas gráficas para describir de manera más vívida series de datos. Los histogramas y
polígonos se usan para describir datos numéricos que han sido agrupados en distribuciones de frecuencia,
de frecuencia relativa o de porcentaje.
- Histograma: Gráfica de barras de una distribución de frecuencias. Son diagramas de barra
verticales en los que se construyen barras rectangulares en los límites de cada clase. Se colocan
sobre el eje horizontal los límites de clase, en el eje vertical se coloca el número de observaciones.

Eje vertical Tipo de diagrama

Número de observaciones Histograma de frecuencia


(F.Absoluta)

Porción de observaciones Histograma de frecuencia


relativa

Porcentaje de observaciones Histograma de porcentajes


- Polígonos: Es la gráfica lineal de una distribución de frecuencias. Son similares a los histogramas
excepto que se coloca el punto medio de clase sobre el eje horizontal. Se forma permitiendo que
el punto medio de cada clase represente los datos de desa clase y luego conectando la sucesión
de puntos medios con sus respectivos porcentajes de clase. Debido a que los puntos medios
consecutivos son conectados por una serie de rectas, el polígono es dentado en apariencia.

Al tratar con una serie de datos muy grandes, si tuviéramos que crear los límites de las clases en su
distribución de frecuencia más juntos, las líneas dentadas del polígono, se suavizarían.
-Curva de frecuencia: Es un polígono de frecuencias suavizado. En términos de asimetría, una
curva de frecuencias puede ser:
● Asimétrica negativa: con la cola hacia la izquierda.
● Asimétrica positiva: con la cola hacia la derecha
● Simétrica
En términos de kurtosis puede ser:
● Platikurtica: plana, con observaciones distribuidas de manera relativamente uniforme en
todas las clases
● Leptokúrtica: puntiaguda, con observaciones concentradas en un estrecho rango de
valores.
● Mesokúrtica: ni plana ni puntiaguda, en términos de la distribución de los valores
observados.
DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS
Una distribución de frecuencias acumuladas identifica el número de observaciones acumuladas incluidas
bajo el límite exacto superior de cada clase de la distribución. Puede determinarse la frecuencia acumulada
para una clase agregando la frecuencia observada para dicha clase a la frecuencia acumulada de la clase
precedente. La gráfica de una distribución de frecuencias acumuladas se denomina ojiva.
Una ojiva indica la frecuencia acumulada debajo de cada límite exacto de clase de la distribución de
frecuencias. El fenómeno de interés se grafica en el eje horizontal y la frecuencia porcentual acumulada se
grafica en el eje vertical. Se conectan los puntos con una serie de segmentos de líneas rectas.

DISTRIBUCIONES DE FRECUENCIAS RELATIVAS


Una distribución de frecuencias relativas es aquella en la que el número de observaciones de cada clase se
convierte en una frecuencia relativa dividiéndolo entre el número total de observaciones en la distribución.
Cada frecuencia relativa es una proporción y se puede convertir en un porcentaje multiplicándola por 100.
Una de las ventajas que presenta la construcción de la distribución de frecuencias relativas reside en que
la distribución acumulada y la ojiva correspondiente indican el porcentaje acumulado de observaciones
presentes hasta los diversos valores posibles de una variable. Un valor percentil es el porcentaje de
observaciones acumulado hasta un valor designado de una variable.

GRÁFICAS DE BARRA Y GRÁFICAS DE LÍNEA


Una gráfica o diagrama de barras ilustra, mediante barras, cantidades de frecuencias para diferentes
categorías de datos.
La diferencia entre una gráfica de barras y un histograma es que éste se refiere siempre a datos de una
distribución de frecuencias, en tanto que la gráfica de barras ilustra cantidades para cualquier tipo de
categorías.
Cuando las categorías que se utilizan representan un segmento de tiempo, se las puede representar
mediante una gráfica de línea, la cual ilustra mediante segmentos de línea los cambios en cantidades
respecto al tiempo.
GRÁFICAS DE PASTEL
Son apropiadas para ilustrar divisiones de una cantidad total, como la distribución de egresos de una
compañía.
Una gráfica de pastel en porcentajes es aquella en la que los valores se convierten en porcentajes para
que resulte más fácil compararlos.

Para graficar datos no agrupados, se diseña un gráfico de líneas que no aporta mucha información.

También podría gustarte