Está en la página 1de 25

Universidad Nacional Jorge Basadre Grohmann

Escuela Profesional de Ingeniería Química

Temas: Organización de datos

Ing. Carlos Alayo Ninaquispe


Organización de datos cualitativos
La organización se presenta a través de una tabla y de gráficos.
Tabla de distribución de frecuencias

Distribución de < elementos> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi

𝐟𝟏
Categoría 1 𝐟𝟏 𝐡𝟏 = 𝐩𝟏 = 𝐡𝟏 × 𝟏𝟎𝟎%
𝐧
𝐟𝟐
Categoría 2 𝐟𝟐 𝐡𝟐 = 𝐩𝟐 = 𝐡𝟐 × 𝟏𝟎𝟎%
𝐧

⋮ ⋮ ⋮ ⋮

𝐟𝐤
Categoría k 𝐟𝐤 𝐡𝐤 = 𝐩𝐤 = 𝐡𝐤 × 𝟏𝟎𝟎%
𝐧
Fuente: ……………………………………..
Los elementos de la tabla de frecuencias se describen a continuación:
Frecuencia absoluta (fi)
La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las observaciones que
presenta esta categoría.
Frecuencia relativa (hi)
La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de observaciones que caen en
esa categoría.
Frecuencia relativa acumulada (Hi)
La frecuencia relativa acumulada de una categoría está dada por la proporción del número total de observaciones que
caen hasta esa categoría.

Elementos de la tabla de frecuencias


Título
El título de la tabla debe tener la siguiente estructura:

Distribución de <elementos> según <variable en estudio>

Fuente
Se refiere de dónde se recolectaron los datos para posteriormente ser organizados. Se ubica siempre en la parte
inferior de la tabla.
EJERCICIO
Los siguientes datos corresponden a los lenguajes de programación más usados por los practicantes de la empresa Sonic
S.A. en la creación de páginas web.

JS J P P JS JS J JS PHP PHP

J PHP p JS P P J J JS JS

JS: JavaScript J: Java P: Python PHP


a. Completa los datos faltantes en la tabla de frecuencia

Distribución de los practicantes según su lenguaje de programación


Lenguaje de fi hi pi
programación
JavaScript 7 0.35 35
Java 5 0.25 25
Python 5 0.25 25
PHP 3 0.15 15
Total 20 1 100

Fuente: Sonic S.A


b. Interpreta la segunda frecuencia absoluta y la tercera frecuencia porcentual

Frecuencia Valor Interpretación

f2 5 De un total de 20 practicantes, 5 usan como lenguaje de programación JAVA

25% El 25% de los practicantes usan como lenguaje de programación PYTHON


p3

Gráficos de una variable cualitativa

Barras y sector circular

• Para organizar gráficamente la variable cualitativa se utiliza el gráfico de barras o el gráfico de sector circular.
• En caso la variable cualitativa sea de escala ordinal, se recomienda usar el gráfico de barras, donde en el eje X se
muestre la jerarquía de las categorías. Si trabajamos con variables cualitativas de escala nominal, las categorías
pueden ser colocadas en cualquier orden.
• En el gráfico de barras es posible usar las frecuencias absolutas o porcentuales, pero se prefieren las frecuencias
porcentuales.
• Para el caso del gráfico circular sólo es posible usar las frecuencias porcentuales.
• El título del gráfico es el mismo que se ha colocado a la tabla de frecuencias.
• En ambos tipos de gráfico, barras o sector circular, colocar la fuente y las etiquetas.
GRÁFICO DE BARRAS

GRÁFICO DE SECTOR CIRCULAR


EJERCICIO

La universidad X realizó una encuesta a 30 estudiantes que están terminando el colegio con la finalidad de conocer
sus preferencias profesionales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de estudiantes según su preferencia profesional


Preferencia profesional 𝐟𝐢 𝐡𝐢 𝐩𝐢
Administración 5 0,1667 16,67%
Derecho 4 0,1333 13,33%
Enfermería 6 0,2000 20,00%
Ingeniería 8 0,2667 26,67%
Matemática 3 0,1000 10,00%
Pesquería 4 0,1333 13,33%
Total 30 1 100%

Fuente: Universidad X
a. Presente el gráfico de barras de frecuencias porcentuales

b. Presente el gráfico circular de frecuencias porcentuales


Organización de datos cuantitativos discretos
Si los datos son discretos y no hay mucha variabilidad se presentarán directamente cada valor de la variable y sus
respectivas frecuencias. El procedimiento más simple es listar los 𝒏 datos en forma ascendente y luego elaborar la tabla
de distribución de frecuencias indicando para cada valor de la variable su respectiva frecuencia con la que aparece en la
serie.

Distribución de <unidades elementales> según <variable>


Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
Variable discreta
absoluta 𝐟𝐢 relativa 𝐡𝐢 acumulada 𝐅𝐢 acumulada 𝐇𝐢
𝐟𝟏
𝐱𝟏 𝐟𝟏 𝐡𝟏 = 𝐅𝟏 = 𝐟𝟏 𝐇𝟏 = 𝐡𝟏
𝐧
𝐟𝟐
𝐱𝟐 𝐟𝟐 𝐡𝟐 = 𝐅𝟐 = 𝐟𝟐 + 𝐅𝟏 𝐇𝟐 = 𝐡𝟐 + 𝐇𝟏
𝐧
⋮ ⋮ ⋮ ⋮ ⋮
𝐟𝐤
𝐱𝐤 𝐟𝐤 𝐡𝐤 = 𝐧 𝟏, 𝟎𝟎
𝐧
Total 𝐧 1
Fuente:
Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas


La representación gráfica de la variable cuantitativa discreta es similar al caso cualitativo, sólo que no se emplean columnas
sino líneas verticales para cada valor, denominados bastones o varas.
EJERCICIO
La empresa ABC ha registrado, durante 20 días, los reclamos de un producto defectuoso elaborado por una de sus
máquinas industriales. De los datos obtenidos se construyó la siguiente tabla:

Distribución de los días según número de reclamos

Número de reclamos 𝐟𝐢 𝐡𝐢 𝐅𝐢 𝐇𝐢
0 1 0,05 1 0,05
1 4 0,20 5 0,25
2 7 0,35 12 0,60
3 6 0,30 18 0,90
4 2 0,10 20 1,00
Total 20 1

Fuente: Empresa ABC

a. Presente el grafico de varas de frecuencias porcentuales


INTERVALOS
Un intervalo real es una porción de la recta entre dos valores dados. Existen dos notaciones principales: Se utilizan
corchetes [ ] y corchetes invertidos ] [ , también se utilizan corchetes y paréntesis [ ) ; ambas notaciones están descritas
en el estándar internacional ISO 31-11. En adelante , utilizaremos la segunda forma de notación.

Tipos de intervalos
NOTA: En estadística descriptiva se utilizan intervalos para agrupar datos de variables continuas y, en
algunos casos , de variables discretas de recorrido largo ( que asumen una gran cantidad de posibles
valores). El tipo de intervalo que suele utilizarse para agrupar estos datos es [ a ; b ), semiabierto por
derecha.

Ejemplos:
Los pesos de los estudiantes ( 65 , 71 , 82 , 73 , 90 , 82 , 70 , 77 , 74 , 78 ) ; agrupados en tres intervalos , se
expresarían como se observa en el siguiente cuadro

Intervalos Longitud Punto medio Datos comprendidos.

[ 65 ; 75 ) 10 70 65, 70, 71 , 73 , 74
[ 75 ; 85 ) 10 80 77 , 78 , 82 , 82
[ 85 ; 95 ) 10 90 90
Organización de datos cuantitativos continuos
Los datos se agruparán de intervalo (también llamados clases, categorías o grupos) cuando la variable
tiene gran variabilidad.

Tabla de distribución de frecuencias


Distribución de <unidades elementales> según <variable>

Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalos (clases) Marca de clase 𝐱 𝟏´ absoluta relativa
absoluta 𝐟𝐢 relativa 𝐡𝐢
acumulada 𝐅𝐢 acumulada 𝐇𝐢

𝐋𝐢𝟏 + 𝐋𝐬𝟏 𝐟𝟏
[𝑳𝐢𝟏 − 𝑳𝐢𝟏 ) 𝐱 𝟏´ = 𝐟𝟏 𝐡𝟏 = 𝐅𝟏 = 𝐟𝟏 𝐇𝟏 = 𝐡𝟏
𝟐 𝐧
𝐋𝐢𝟐 + 𝐋𝐬𝟐 𝐟𝟐
[𝑳𝐢𝟐 − 𝑳𝐢𝟐 ) 𝐱 𝟐´ = 𝐟𝟐 𝐡𝟐 = 𝐅𝟐 = 𝐟𝟐 + 𝐅𝟏 𝐇𝟐 = 𝐡𝟐 + 𝐇𝟏
𝟐 𝐧
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
[𝑳𝐢𝒌 − 𝑳𝐢𝒌 ] 𝐋𝐢𝐤 + 𝐋𝐬𝐤 𝐟𝐤
𝐱 𝐤´ = 𝐟𝐤 𝐡𝐤 = 𝐅𝐤 = 𝐟𝐤 + 𝐅𝐤−𝟏 𝐇𝐤 = 𝐡𝐤 + 𝐇𝐤−𝟏
𝟐 𝐧
Total 𝒏 1,00

Fuente:
Pasos para elaborar la tabla de distribución de frecuencias

• Obtener el rango (𝑹) o recorrido, usando la siguiente fórmula:

𝑹 = 𝒅𝒂𝒕𝒐 𝒎á𝒙𝒊𝒎𝒐 − 𝒅𝒂𝒕𝒐 𝒎í𝒏𝒊𝒎𝒐

• Calcular el número de intervalos, usando la regla de Sturges:

𝒌 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝒍𝒐𝒈𝟏𝟎 𝒏

El valor de 𝒌 debe ser un valor entero y se redondea por redondeo simple.

Ejemplo:

K = 7,265 = 7
K = 7,784 = 8
K = 7,5 = 8
• Calcular la amplitud del intervalo, usando la siguiente
fórmula:

𝑹
A=
𝒌
Ejemplo:
Una empresa desea evaluar la rapidez en el pago de facturas de sus clientes. De los registros de ventas a
crédito de los 6 último meses del año pasado , se escoge al azar a 50 clientes y se registra el tiempo ( en
días) entre la entrega del producto y su pago. Los datos recogidos son:

34 30 27 15 17 30 30 23 26 34
26 22 20 21 25 29 43 19 27 35
22 17 17 15 23 35 29 26 24 27
21 28 23 39 33 34 21 32 21 29
24 20 37 48 19 23 28 28 36 33

. Obtenga la tabla de distribución de frecuencias.


. Realizar sus gráficas correspondientes.

Tener en cuenta :
Título del cuadro: Distribución de clientes según el tiempo que demoran en pagar sus facturas
Interpretaciones
f3: Un total de 13 clientes demoró en pagar sus facturas entre 25 y menos de 30 días.

p5 : El 10% de los clientes demoró en pagar sus facturas entre 35 y menos de 40 días.

F2 : Un total de 21 clientes demoró en pagar sus facturas menos de 25 días.

P6: El 98 % de los clientes demoró en pagar sus facturas menos de 45 días.


Histograma

Es una gráfica de barras cuyos valores del eje X son los intervalos de clase. Además, la altura de las barras está
determinada por las frecuencias relativas de los intervalos de clase. Según el interés del estudio se pueden
considerar también, las frecuencias absolutas.
Polígono de frecuencia
Es una gráfica donde los valores del eje X son las marcas de clase.

Para cerrar el polígono se debe aplicar el siguiente artificio: restar a la primera marca de clase el valor de la
amplitud y sumar a la última marca de clase el valor de la amplitud.

Según sea el interés del estudio se pueden considerar las frecuencias absolutas o porcentuales.
Ojiva
Es una gráfica donde los valores del eje X son los límites superiores.

Es una gráfica creciente a la que debe aplicarse el siguiente artificio: El primer valor del eje X es el dato más
pequeño del conjunto de datos o valor mínimo o valor del primer límite inferior.

Según el interés del estudio se pueden considerar las frecuencias absolutas o relativas.
DESARROLLAR
E-01
E-03

También podría gustarte