Está en la página 1de 47

Unidad Académica de

Estudios Generales

Estadística Básica

Profesores: Equipo docente de Estadística


Unidad II
Semana 04

Organización y presentación de datos


CONOCIMIENTOS PREVIOS
CHOCOTEJAS TROPICALES Un grupo de estudiantes emprendedores deciden
empezar un negocio de chocotejas con sabores como
aguaymanto, arándonos y coco.
Para conocer la preferencia de sabores en los futuros
clientes deciden realizar una encuesta a 50 estudiantes de
la universidad, algunas características que desean medir
fueron:
1. ¿Cuál es el sabor de su preferencia?
a) Aguaymanto b) Arándano c) Coco
2. ¿Cuántas chocotejas compraría a la semana?...
3. Califica la calidad del producto
a) Mala calidad b) Mediana calidad c) Buena calidad
4. Gasto semanal para comprar chocotejas es ……

1. ¿Qué tipo de variable identifica en cada pregunta?


2. ¿Quiénes conforman la población de estudio?
3. ¿Cómo puede conocer el sabor preferido?
LOGRO DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta frecuencias de


las tablas y gráficos estadísticos obtenidos de los datos
recolectados en problemas reales haciendo uso de SPSS.
Sesión 4: Organización y presentación de datos
ASU: ECN 221 - Estadística para los Negocios. Módulo 1:
Cap. 2 – Estadística descriptiva: presentaciones tabulares y gráficas

1. Tablas de frecuencias y gráficos para variables


cualitativas.
2. Tabla de frecuencias y gráficas para variables
cuantitativa discreta.
3. Tablas de frecuencias y gráficos para variables
cuantitativas continuas.
4. Conclusiones
¿Cómo puedo
Base de datos de los empleados Credisa Philco S.A. resumir la
información
recolectada?
ID Edad Años Ed Género Ingresos Promoción Área Compañerismo

1 35 20 Masculino 783 1 Administración Regular


2 64 14 Femenino 257 5 Ventas Mala
3 33 15 Femenino 405 5 Producción Mala
: : : : : : : :
49 39 18 Masculino 756 5 Administración Mala
50 29 17 Femenino 501 1 Producción Buena

Debes presentar los datos en forma organizada en tablas de


frecuencias, quizás gráficas o estadísticos para describir las
variables del tema de estudio.
1. Tabla de frecuencias para variables cualitativas
Resume datos categóricos recolectados de una población o muestra y se presentan en una
tabla de distribución de frecuencias agrupada en categorías de la variable que son
mutuamente excluyentes.
Una tabla de frecuencias tiene las siguientes partes:

Título
Tabla 1. Número de tabla
Distribución de …….. Según…….
Variable Frecuencia Frecuencia Porcentaje Encabezados
(xi) absoluta (fi) relativa (hi) (hi%)
x1 f1 h1=f1/n h1%=(f1/n)*100
x2 f2 h2= f2/n h2%=(f2/n)*100
Cuerpo
… … … …
xk fk hk= fk/n hk%=(fk/n)*100
Total n 1.00 100%
Fuente: (persona o entidad que recolecta los datos) Fuente, pie de tabla
La tabla de frecuencias contiene:
Frecuencia absoluta simple (fi)
Número de veces que se repite cada valor de la variable (xi), propiedad:
k

i =1
f i = f 1 + f 2 + .... + f k = n

Frecuencia relativa simple (hi)


Representa la proporción de cada categoría o clase, se calcula:
fi
hi = ; i = 1,2,...., k
k

n Propiedad: h
i =1
i = h1 + h2 + .... + hk = 1

Frecuencia porcentual (hi%)


Es la frecuencia relativa multiplicada por 100 y se lee en porcentajes
fi
hi % = x100
n
1. Representación gráfica de variables cualitativas
Gráfico de Barras simples
Se construye distribuyendo en el eje
horizontal las categorías de la variable y en el
eje vertical las frecuencias absolutas, o
relativas o porcentual representado en barras
proporcionales a su frecuencia.

Gráfico circular
Las categorías de la variable se distribuyen en
sectores, proporcional a la frecuencia que
representan, también se denomina gráfico tipo
torta o gráfico de sectores.
Tabla de frecuencias para variables cualitativas
Tabla1. Pacientes hospitalizados según servicio de atención en el
hospital del Rímac en enero 2016
Servicios del hospital Frecuencia Frecuencia Frecuencia
(Xi) absoluta (fi) relativa (hi) porcentual (hi%)
Quemados 3 3/30 =0,10 10%
Oncología 5 5/30 = 0,17 17%
Cirugía 8 8/30 = 0,26 26%
Partos 6 6/30 = 0,20 20%
Nefrología 3 3/30 = 0,10 10%
Medicina interna 5 5/30 = 0,17 17%
Total 30 1,00 100%
Fuente: Hospital del Rímac

Interpretación:
f4=6 De 30 pacientes hospitalizados, 6 estuvieron en el servicio de partos
h3% = 26% El 26% de los 30 pacientes hospitalizados fueron de cirugía
Variables cualitativas: Gráfico de Barras
Gráfico 1.
Pacientes hospitalizados según servicio de atención en el hospital del Rímac en enero 2016
9
8
8

7
6
6
5 5
Frecuecia
5

4
3 3
3

0
Quemados Oncología Cirugía Partos Nefrología Medicina interna

Fuente: Hospital del Rímac

Preguntas:
¿Cuántos pacientes hospitalizados fueron de cirugía?
¿Qué porcentaje de pacientes estuvieron hospitalizados en oncología y nefrología?
VARIABLES CUALITATIVAS: GRÁFICO DE SECTORES
Gráfico 2.
Distribución de pagos de pacientes con alta según tipo tarjeta

Dinner
Mastercard
20% Angulo del sector:
26%
360° ----- > 1
Otros X ----- > 0.20
13%
Visa
41% X = 72°

Fuente: Clínica Vargas

En el gráfico 2, se observa el pago del alta médica en la clínica Vargas, el 41% de los
pacientes pagaron con tarjeta Visa, el 26% con Mastercard y un 20% con Dinner.
Ejemplo 1:
La clínica Vargas realizó un estudio a 54 pacientes que salieron de alta durante una semana con el
propósito de conocer la calidad de atención. Si más del 50% refiere que la atención es de regular a
mala se brindará capacitación al personal. Una pregunta de la encuesta fue ¿Cuál es la calificación
respecto a la atención recibida durante su hospitalización? a) Buena b) Regular c) Mala
Las respuestas fueron:
Buena Buena Regular Mala Regular Regular
Regular Buena Buena Regular Buena Mala
Buena Regular Mala Regular Buena Regular
Regular Regular Mala Mala Regular Buena
Buena Mala Regular Buena Mala Regular
Regular Mala Mala Regular Buena Mala
a) Construya una tabla de
Buena Regular Buena Buena Mala Regular
frecuencias e interpreta
Mala Buena Regular Mala Mala Mala b) ¿Se brindará capacitación?
Mala Regular Mala Mala Buena Mala
Variable: Calidad de atención en el área de hospitalización Tabla de frecuencias
Buena Buena Regular Mala Regular Regular
Calidad de Frecuencias Frecuencias Frecuencias
Regular Buena Buena Regular Buena Mala
atención absolutas relativas porcentual
Buena Regular Mala Regular Buena Regular
(fi ) (hi) ( hi%)
Regular Regular Mala Mala Regular Buena
Buena Mala Regular Buena Mala Regular Buena
Regular Mala Mala Regular Buena Mala
Regular
Buena Regular Buena Buena Mala Regular
Mala Buena Regular Mala Mala Mala
Mala
Mala Regular Mala Mala Buena Mala Total
Interpretación de frecuencias
Frecuencia absoluta
f1 =

Frecuencia Relativa
h3 =

Frecuencia Porcentual
h2% =

b) Si más del 50% refiere que la atención es de regular a mala se debe brindar capacitación.
¿Se brindará capacitación al personal del servicio?
Tabla de frecuencias para variable cualitativa
Tabla 2. Distribución de pacientes según calidad de atención en el servicio de hospitalización

Calidad de Frec. Absoluta Frec. Relativa Frec. Porcentual


atención fi hi hi%

Buena 16 0.296 29.6


Regular 19 0.352 35.2
Mala 19 0.352 35.2
Total 54 1.000 100.0
k
Fuente: Clínica Vargas
h
i =1
i =1

Interpretación:

f1 = 16 16 de 54 pacientes hospitalizados en la clínica Vargas opinan que la atención recibida fue de buena calidad

h3 = 0.352 La proporción de pacientes hospitalizados que opinaron que la atención fue de mala calidad es de 0.352

h2% = 35.2% El 35.2% de 54 pacientes hospitalizados opinaron que la atención fue regular.
Obtención de tablas de frecuencia y gráficos con SPSS
1. Analizar / Estadísticos descriptivos / Frecuencias
1 2. Selecciona variable y traslada a la casilla:
3. Luego el botón GRAFICOS: Gráficos de barras
4. Continuar y aceptar

4
Ejemplo 1 aplicativo de ASU

Con los datos del archivo S04 ASU Restaurant ES.xlsx elabora la tabla de frecuencias y gráfico
de barras con la variable puntuación de calidad. Responda las siguientes preguntas:

a) ¿Qué porcentaje de restaurantes tienen calificación de excelente


b) ¿Cuántos restaurantes tienen calificación de bueno a excelente?
c) Interpreta f2
d) Interpreta h3

Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 1:
Estadísticas Descriptivas: Pantallas Tabulares y Gráficas (Cap. 2).
https://canvas.asu.edu/courses/39153/pages/ch-2-descriptive-statistics-tabular-and-graphical-displays.
Sesión 4: Organización y presentación de datos
ASU: ECN 221 - Estadística para los Negocios. Módulo 1:
Cap. 2 – Estadística descriptiva: presentaciones tabulares y gráficas

1. Tablas de frecuencias y gráficos para variables


cualitativas.
2. Tabla de frecuencias y gráficas para variables
cuantitativa discreta.
3. Tablas de frecuencias y gráficos para variables
cuantitativas continuas.
4. Conclusiones
2. Distribución de frecuencias de variable cuantitativa discreta

Resume datos discretos por cada valor de la variable en una tabla de distribución de frecuencias
simples absolutas y relativas, frecuencias acumuladas absolutas y relativas.

Tabla 2. Distribución de ….… según ……


Variable Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
(Xi) absoluta (fi ) relativa (hi ) Porcentual (hi %) absoluta relativa Porcentual (hi %)
acumulada (Fi ) acumulada (Hi )

X1 f1 h1 F1=f1 H1=h1
X2 f2 h2 F2=f1+f2 H2=h1+h2
..... ... ... ... ...
Xk fk hk Fk=n Hk=1
Total n 1.00 100.0%

Fuente:………………….
Los valores de las variables que se miden en escala ordinal, escala de intervalo y
escala de razón se puede acompañar las frecuencias acumuladas

Frecuencias absolutas acumuladas (Fi); Es la suma de frecuencias, sólo para


variables numéricas u ordinales, se obtiene:

Frecuencia relativas acumulada (Hi); es la suma de proporciones o porcentajes,


sólo para variables cuantitativas u ordinales, se obtiene:
2. Representación gráfica de variables discreta
Gráfico de Bastones
Se construye distribuyendo en el eje horizontal los valores de la variable y en
el eje vertical las frecuencias absolutas o relativas representado en cada
bastón.

Gráfico 3. Distribución de…….. Según…………………

Fuente:………………….
Ejemplo 2:
Los siguientes datos corresponden a las inasistencias de los trabajadores a su centro laboral.
La empresa Milenium se ha registrado el número de ausencias por día durante los últimos 20
días laborales con el propósito de conocer el impacto económico, los datos son:

2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4

a. Construya la tabla de distribución de frecuencias.


b. Interpreta: f1, F2 , h3 y H2%
c. Elabora e interpreta el gráfico de bastones de frecuencias absolutas.
Variable: Número de trabajadores ausentes

Tabla 3. Distribución de trabajadores ausentes por día


Trabajadores Frecuencias Frecuencias Frecuencia Frecuencia Frecuencia Frecuencia
ausentes absolutas relativa porcentual absoluta relativa porcentual
(fi ) (hi ) (hi %) acumulada (Fi ) acumulada (Hi ) acumulada (Hi%)

TOTAL 20 1.00 100%


Fuente: Milenium.SAC
a. Tabla de frecuencias: variables cuantitativas discretas
Tabla 3. Distribución de trabajadores ausentes por día
Trabajadores Frecuencias Frecuencias Frecuencia Frecuencia Frecuencia Frecuencia
ausentes absolutas relativa porcentual absoluta relativa porcentual
(fi ) (hi ) (hi %) acumulada (Fi ) acumulada (H ) acumulada (Hi%)
i

0 1 0.05 5% 1 0.05 5%
1 4 0.20 20% 5 0.25 25%
2 7 0.35 35% 12 0.60 60%
3 6 0.30 30% 18 0.90 90%
4 2 0.10 10% 20 1.00 100%
TOTAL 20 1.00 100%

Fuente: Milenium.SAC

b. Interpretación de frecuencias
f1 = 1 Hubo un día en que ninguno de los trabajadores ha faltado
F2 = 5 Hubo 5 días que han faltado como máximo un trabajador

h3 = 0.35 La probabilidad que falten 2 trabajadores en un día cualquiera es de 0.35 (o también 35%)

H2% = 35% El 35% de 20 días laborables faltaron a lo más un trabajador


C. Gráfico de Bastones: Variables cuantitativa discreta
Gráfico 3. Distribución de trabajadores ausentes por día
8
7
6

Número de días
5
4
3
2
1
0
0 1 2 3 4 5 6

Trabajadores ausentes

Fuente: Milenium.SAC

En el gráfico 3, se observa que durante 20 laborables, hubo siete días que faltaron 2
trabajadores y un solo día que no faltó nadie en la empresa Milenium
Sesión 4: Organización y presentación de datos
ASU: ECN 221 - Estadística para los Negocios. Módulo 1:
Cap. 2 – Estadística descriptiva: presentaciones tabulares y gráficas

1. Tablas de frecuencias y gráficos para variables


cualitativas.
2. Tabla de frecuencias y gráficas para variables
cuantitativa discreta.
3. Tablas de frecuencias y gráficos para variables
cuantitativas continuas.
4. Conclusiones
3. Distribución de frecuencias de variable cuantitativa continua
Resume datos continuos agrupados en clases los valores de la variable en una tabla de
distribución de frecuencias absolutas y relativas, frecuencias acumuladas absolutas y relativas.

Clases de la Marca de fi hi Fi Hi
variable clase (Xi)
[Li - Ls >
[ - > X1 f1 h1 F1=f1 H1=h1
[ - > X2 f2 h2 F2=f1+f2 H2=h1+h2
..... … ... ... ... ...
Total n 1
Donde: [Li , Ls) : Intervalos o Clases Li : Límite Inferior
Yi : Marca de clase Ls : Límite Superior
fi : frecuencia absoluta
hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada
Tablas de frecuencias agrupadas para variables cuantitativas continuas

. Se debe agrupar en intervalos:


- Cerrados: [ 10 - 20 ]
- Semiabiertos: [ 10 - 20 > , < menos de 20 ]
- Abiertos : < 10 - 20 >
. Los métodos de agrupación:
1. Intervalos definidos por alguna regla (INEI, OMS)
2. Método de Sturges, consiste en agrupar intervalos de igual amplitud
mediante la fórmula:

K = 1 + 3.32 * log(n)
PROCEDIMIENTO PARA CONSTRUIR UNA TABLA DE FRECUENCIAS

1) Calcular la amplitud, rango o recorrido de datos( R )


R = Dato máximo - Dato mínimo

2. Calcula el número de intervalos : método de Sturges

K=1+3.32*log(n)
se recomienda entre 5 ≤ k ≤15 intervalos

R
3) Calcular la amplitud del Intervalo de Clase (C): C =
K

4) Verificar si hay exceso: NR = C*k

5) Calcular los intervalos de cada clase o intervalo


Ejemplo 3:
Los siguientes datos corresponden al tiempo de atención de los pacientes en un consultorio
de medicina general en 65 pacientes del hospital Santa Rosa.

19 15 10 20 25 15 16
a. Construya la tabla de distribución de
18 9 14 21 11 13 17 frecuencias agrupadas.
28 12 15 17 12 22 21 b. Interpreta: f3, F2 , h4 y H3%
24 28 27 10 35 32 30 c. Elabora un histograma de frecuencias.
26 33 23 17 25 18 17 d. ¿Qué tipo de distribución presenta
13 19 32 22 34 35 36
los datos del tiempo de atención médica?
34 26 25 12 14 27 28
32 30 20 22 24 23 37
23 21 24 16 15 22 15
28 25
Solución Variable: Tiempo de atención médica
1. Calcular el rango (R) o recorrido:
R = Dato máximo – Dato mínimo
R=
2. Determine el número de intervalos (k)
K = 1 + 3.3 log (n) (Fórmula de Sturges)
K = 1 + 3.3 log (65) = 7.018 = 7 (entero por redondeo simple)
R
3. Calcula la amplitud del intervalo: C =
K

4. Calcular primera ubicación de punto de corte:


Posición del primer corte = Dato mínimo + amplitud (c)
Obtención de tablas de frecuencia agrupada en intervalos con SPSS
1. Transformar / Agrupación visual
2. Selecciona variable y traslada a la casilla: Ingresos
1 Renombra variable: Ingresos_agrup
3. Crear puntos de corte:
R =783-105 = 678
K=1+3.32*log(50) = 7
C = 678/7= 97
Primer punto de corte: 105+97 = 202
3

2
Ingresos_agrup

4 Aplicar

5 Crear etiquetas

6 Aceptar
a. Construyendo la tabla de frecuencias
Tabla 4. Tiempo de atención en pacientes de medicina general
Marca de
Tiempo en min. clase (Xi ) fi hi hi % Fi Hi Hi%

[ - >

[ - >

[ - >

[ - >

[ - >

[ - >

[ - ]

Total 65 1.000
Fuente: Hospital Santa Rosa, Medicina general
b. Interpretación de frecuencias:

f3 =

F2 =

h4 =

H3% =
Ejemplo 2 aplicativo de ASU

Con los datos del archivo S04 ASU Restaurant ES.xlsx elabora la tabla de frecuencias
y el histograma con la variable precio de la comida. Luego responda las siguientes
preguntas:
a) Interpreta las siguientes frecuencias: f2, F3, H2%
b) ¿Qué tipo de distribución presenta el histograma?

Tomado de: Arizona State University (Enero, 2023). ECN221: Estadística para los negocios. Módulo 1:
Estadísticas Descriptivas: Pantallas Tabulares y Gráficas (Cap. 2).
https://canvas.asu.edu/courses/39153/pages/ch-2-descriptive-statistics-tabular-and-graphical-displays.
c. Histograma de Frecuencia

Gráfico 4.
Distribución de las determianciones
Tiempo de atención de Pacientes en consultorio de medicina general
diarias de óxido de azufre en la planta
de pacientes
15
de días

10
Número
Numero

9.0 9.9 10.8 11.7 12.6 13.5 14.4 15.3


Oxido de de
Tiempo azufre (Tn)
Atención
Fuente: Hospital Santa Rosa, Medicina general
d. ¿Qué tipo de distribución presentan los datos del tiempo?
Gráfico 5.
Tiempo de atención de Pacientes en consultorio de medicina general

Respuesta:
El tiempo de atención médica
al paciente es asimétrica
positiva

Fuente: Hospital Santa Rosa, Medicina general


Las gráficas de variables cuantitativas, nos permiten conocer la forma de
distribución de un conjunto de datos.

La distribución de datos de la variable es


SIMÉTRICA

La distribución de datos de la variable es


ASIMÉTRICA NEGATIVA

La distribución de datos de la variable es


ASIMÉTRICA POSITIVA
3. Representación gráfica de variables cuantitativas continuas
1. Histograma de frecuencias
2. Polígono de frecuencias
3. Ojivas
4. Líneas (series de tiempo)
5. Diagrama de cajas
Histograma
10

1. Histograma de frecuencias 10

8
8
7
Representación gráfica de

Frequency
6
una variable en forma de barras, donde 5

la superficie de cada barra es 4


3

proporcional a la frecuencia de los 2


2

valores representados. 0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto
2. Polígono de frecuencias

Es un gráfico de líneas que de las frecuencias


absolutas de los valores de una distribución
en el cual la altura del punto asociado a un
valor de las variables es proporcional a la
frecuencia de dicho valor.

3. Ojiva
La ojiva es un polígono de frecuencias
acumulado, que permite ver cuántas
observaciones se encuentran por
encima o debajo de ciertos valores, o
que porcentajes se encuentran por
encima o por debajo de cierto valor.
4. Serie de tiempo
5. Diagrama de cajas (Box Plot)

En 1977, John Tukey publica un método para


representar gráficamente en forma conjunta los
estadísticos descriptivos.
Se utiliza para:
• Identificar la forma de distribución.
• Identificar la presencia de datos discordantes.
• Analizar el grado de dispersión.

• Ubica los límites mediante el rango intercuartílco (RIC)


• El límite superior está a 1,5(RIC) arriba de Q3
• El límite inferior está a 1,5(RIC) debajo (a la izquierda) de Q1
TRABAJO EN SALA

Resolver en equipos
colaborativos el ejercicio 1 y 2
de la semana 04.
Conclusiones

1. Los gráficos y tablas de frecuencias describe la distribución de


datos de las variables.

2. Las frecuencias indican repeticiones de categorías o clases

3. La forma de organizar y presentar resultados depende del tipo


de dato sea categórico o numérico.
Bibliografía

1. Webster, A. (2006). Estadística aplicada a los Negocios y la Economía.


(3° ed.) Colombia: McGraw Hill.

2. Veliz, O. (2014). Estadística para administración y los negocios. (2ª ed.).


México D.F: Pearson

3. Devore, J. (2008). Probabilidad y Estadística para ingeniería y ciencias.


Séptima edición. Cengage Learning.

También podría gustarte