Está en la página 1de 41

Organización de Datos

Describiendo los datos


• Si tenemos un conjunto de n datos de una variable
a los cuales representaremos por:

• ¿ Cómo podemos representar o resumir esta


información ?
• ¿Qué información útil nos dan estos datos sobre la
variable y población que estamos estudiando ?
Organización y Representación Gráfica de Datos

Datos Recolectados ¿Qué información


Masa de datos
contienen?

¿Qué herramientas ayudan en su descripción?

Los cuadros de frecuencias


y los gráficos
Organización y representación gráfica de los
datos
• Dado un conjunto de datos x1, x2, … , xn nos
interesará ahora organizarlos y representarlos
gráficamente a fin de obtener una más clara y mejor
interpretación de ellos.
• El primer paso consiste en obtener su distribución de
frecuencias; es decir, en ordenar los datos de menor a
mayor, ubicarlos en K clases excluyentes y
exhaustivas para luego realizar un conteo de cuantos
de ellos caen (frecuencia absoluta) o que proporción
de ellos caen (frecuencia relativa) en cada clase.
Organización de Datos
Se realiza mediante los cuadros o
tablas de frecuencias
Cuadro o Tabla de frecuencias

Es una forma de organización de la información


que comprende las siguientes columnas básicas:

 Valores de la variable.
 Frecuencias absolutas.
 Frecuencias Relativas.
 Porcentajes.
Frecuencias Simples

La frecuencia absoluta ni de una clase es la cantidad de datos


que pertenecen a esa clase.
La frecuencia relativa fi de una clase es la proporción de datos
que pertenecen a esa clase.
frecuencia absolutadelaclasei ni
frecuencia relativa ( fi ) = =
númerototal dedatos n

La frecuencia porcentual pi de una clase es el porcentaje de


datos que pertenecen a esa clase. Se obtiene multiplicando la
frecuencia relativa por 100 y se expresa en %.
Frecuencias Acumuladas
La frecuencia acumulada absoluta Ni de una clase es la
cantidad de datos que
i
pertenecen hasta esa clase.
Se tiene que Ni = å nj , i = 1, 2,..., k
j=1

Luego N1 = n1 y Ni = Ni-1 + ni , i = 2, 3,..., k (regla del serrucho)


La frecuencia relativa acumulada Fi de una clase es la
proporción de datos que pertenecen hasta esa clase.
Frecuencia absoluta acumuladai Ni
Frecuencia relativa acumulada ( Fi ) = =
Númerototal dedatos n
La frecuencia relativa acumulada porcentual Pi de una clase
es el porcentaje de datos que pertenecen hasta esa clase y se
obtiene multiplicándo Fi por 100.
Gráficos Estadísticos
Organización de datos cualitativos
Nominales Jerárquicos

Formar categorías
1
Formar categorías
Ordenar según
jerarquía u orden

2 Frecuencias Absolutas Frecuencias Absolutas

3 Frecuencias Relativas Frecuencias Relativas

4 Porcentajes Porcentajes
Ejemplo 1

Durante un mes se monitoreo el estado de la calidad del aire en


una ciudad, estos fueron los resultados:
Ejemplo: Cuadro de frecuencias para datos
cualitativos
Cuadro Nº 1: Estado de la Calidad del Aire
Datos cualitativos
• Gráfico de barras:
– En el eje horizontal se especifican los indicadores o
nombres de cada categoría de la variable en estudio y
en el eje vertical una escala de frecuencia relativas o
absolutas
– A cada categoría se la representa por una barra cuya
altura es proporciona a la frecuencia con que ocurre.
En este tipo de gráficos se suele dejar un espacio entre
las barras para indicar que se esta presentando
información de una variable cualitativa.
• Gráfico de sectores circulares:
– Para dibujarlo se traza un círculo y se divide este en
sectores circulares según las frecuencias.
Angulo de la clase = 360º  Frecuencia relativa o porcentual
Ejemplo: Gráfico de barras
Ejemplo: Gráfico de sectores circulares
Organización de datos cuantitativos discretos

Establecer cuáles son los valores diferentes que se presentan en el conjunto de datos
(muestra o población), para la variable de interés, y ordenarlos según su magnitud.

Si la cantidad de valores diferentes es no es mayor a 12 ó 15, se colocan


dichos valores en la primera columna del cuadro de frecuencias. No se pierde
la identidad de cada uno de dichos valores.

Establecer las frecuencias absolutas, frecuencias relativas y porcentajes


Ejemplo 2

En un cierto distrito durante un mes se registró el número de


accidentes de tránsito por día, estos fueron los resultados:
Ejemplo: Cuadro de frecuencias para datos
discretos
Cuadro Nº 2: Número de accidentes de tránsito por día
Ejemplo: Gráfico de bastones para datos cuantitativos
discretos
Organización y representación de datos continuos
Consideraciones a tener en cuenta:

• Cuando se realiza mediciones de una variable continua, por lo


general, los datos observados tienen muchos valores diferentes,
por ello, para presentarlos en una tabla de forma tal que se
facilite su análisis, estos datos deben agruparse primero en clases
o intervalos.
• Tres pasos previos para la construcción de una distribución de
frecuencias por intervalos son los siguientes:
– Determinar la cantidad de intervalos o clases.
– Determinar el ancho o amplitud de cada intervalo o clase.
– Determinar los límites de cada intervalo o clase.
Organización y representación de datos continuos
Cantidad de Clases: k

• Se recomienda usar entre 5 y 20 intervalos o clases.


• La idea es emplear suficientes clases para mostrar la variación de
los datos, pero no tantas ya que varias contendrían muy pocos o
ningún elemento.
• Hay algunas reglas que sugieren el número de clases o intervalos
que se deben usar que dependen del número de datos
disponibles, sin embargo en la práctica la decisión generalmente
se toma atendiendo a una necesidad específica o por experiencia.
• Una de las reglas comentadas es la de Sturges y viene dada por el
número entero más próximo a:
k = 1+ 3.3log10 (n)
Organización y representación de datos continuos
Amplitud de cada clase: c

• Por lo general, se usa la misma amplitud o ancho para todas


las clases.
• Se calcula de la siguiente manera:
Dato máximo- Dato mínimo xmáx - xmín Rango
c= = =
k k k
• La amplitud se aproxima por exceso de acuerdo con la
cantidad de decimales que tienen los datos o según la
precisión con que se desea trabajar.
• Se usa la aproximación por exceso para asegurar que el
mayor de los datos pertenezca a alguna de las clases.
Organización y representación de datos continuos
Límites de cada intervalo: c

• Los intervalos deben ser disjuntos y deben cubrir todo el


rango de variación de los datos.
• Los límites de cada clase se escogen de tal manera que cada
dato pertenezca a una clase y sólo a una.
• Por lo general, el límite inferior de la primera clase es el
mínimo valor observado.
• Los intervalos se considerarán cerrados por la derecha y
abiertos por la izquierda, excepto el primero que sería
cerrado por ambos extremos.
Organización y representación de datos continuos
Marca de Clase

• La marca de clase es el punto medio de cada intervalo. Se


obtiene calculando la semi suma de los límites de cada
intervalo o clase.
• La marca de clase se considera un valor que representa a
cada uno de los datos que pertenecen al intervalo o clase
correspondiente. Por eso es importante que los intervalos
no sean demasiado grandes porque la marca de clase no
sería un buen representante, ni demasiado pequeños como
para complicar la construcción de la tabla o para que hayan
varias clases sin datos.
• La marca de clase de la clase i se denota mi
Ejemplo 3

Se registro el consumo de electricidad en kWh de 50 hogares en


un cierto distrito estos fueron los resultados:
Organización y representación de datos continuos
Procedimiento: Considerando la regla de Sturges

1. Rango = 650 - 300 = 350

2. K = 1 + 3.3 Log10 50  6.60660  7

3. c = 350 / 7 = 50
Ejemplo: Cuadro de frecuencias para datos
continuos
Cuadro Nº 3: Consumo de electricidad (kWh) de los hogares
Organización y representación de datos continuos
Gráficos

• Histograma: a cada clase se la representa por una barra


cuya altura es proporcional a la frecuencia con que ocurre.
En este tipo de gráficos no se debe dejar espacios entre las
barras para indicar que se esta presentando información de
una variable cuantitativa continua.
• Polígono de frecuencias: Se unen los puntos medios de
cada barra del histograma.
• Gráfico de frecuencias acumuladas: Se utiliza las
frecuencias acumuladas y los limites superiores de cada
intervalo de clase para la construcción este gráfico.
Ejemplo: Histograma con políıgono de frecuencias
y gráfico de frecuencias acumuladas
Gráfico de líneas

Se utilizan para representar y analizar series de tiempo. En especial para


estudiar los cambios que ocurren en el comportamiento de una variable a
través del tiempo.

Por ejemplo, en el estudio de las ventas de un establecimiento a través de


cada uno de los meses del año.
Gráfico de líneas
Tendencia de Ventas Anuales
Periodo: 1991 - 2000

Millones de Soles
35

30

25

20

15

10

0
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Años

Fuente: Dpto de Ventas


Gráfico de líneas

Tendencia de Ventas Trimestrales


Periodo: 1995 - 1997
Número
600

500

400

300

200

100

0
1 2 3 4 1 2 3 4 1 2 3 4
95 96 97
Trimestre
Fuente: Dpto de Ventas
El Gráfico de Pareto

Representación gráfica que se utiliza usualmente en


control de calidad, y que permite tomar acciones
correctivas necesarias.
EL objetivo es identificar los hechos de mayor
frecuencia en el comportamiento de una variable.
El Gráfico de Pareto. Procedimiento
1. Obtener las frecuencias absolutas y las frecuencias
relativas asociadas a cada una de las respuestas.

Datos Iniciales
X1, X2, X3, ..., Xn

Frecuencias: Cuadro de frecuencias


El Gráfico de Pareto. Procedimiento
2. Ordenar a las respuestas según la magnitud de las
frecuencias de manera descendente.

Frecuencias: Cuadro de frecuencias

Cuadro con respuestas ordenadas


descendentemente, según la magnitud
de las frecuencias
El Gráfico de Pareto. Procedimiento
3. Adicionar al cuadro una columna en la se obtenga los
frecuencias acumuladas.

Cuadro de frecuencias ordenadas


descendentemente.

Adicionar al cuadro una columna de


frecuencias acumuladas.
El Gráfico de Pareto. Procedimiento
4. Elaborar un gráfico de barras verticales (sin espacios
intermedios) utilizando las frecuencias porcentuales
no acumuladas.
100%

Variable en estudio
El Gráfico de Pareto. Procedimiento
5. Graficar los puntos (Xi, Pi). Donde Pi es el porcentaje
acumulado de la categoría “i”, y Xi es la referencia
horizontal que corresponde al extremo derecho de
cada barra vertical.
100%

Pi

Xi
El Gráfico de Pareto. Procedimiento
6. Unir los puntos (Xi, Pi) obtenidos mediante segmentos
de recta..
100% 100%

Pi

Objetivo
Ejercicio
La nueva administración de la biblioteca central de una universidad, ha
encargado realizar un estudio sobre las deficiencias del servicio prestado
actualmente, con la finalidad de implementar medidas que mejoren la
calidad de su servicio; pero, para ello debe detectar y corregir el 75% de
los principales problemas observados por los usuarios de esta biblioteca.
Con una muestra aleatoria de estudiantes, que acudieron a esta
biblioteca el mes pasado, se obtuvo la siguiente información.
Principales problemas en el Número de
servicio estudiantes
Demora en la atención 17
Servicio de búsqueda obsoleta 75
Pocos ejemplares de c/libro 94
Otros 14
Total 200

¿Qué acciones recomendaría adoptar a la nueva administración de esta


biblioteca?

También podría gustarte