ESTADÍSTICA DESCRIPTIVA
Y PROBABILIDADES
TEMA: Organización de datos y elaboración de
gráficos en Excel
Semana 02
INTRODUCCIÓN
Los gráficos permiten
acceder a la
información de manera
simple y resumida.
¿QUÉ APRENDIMOS EN LA CLASE
ANTERIOR? ¿Qué es una variable?
¿Qué tipos de variables conoces?
¿Cuál es la diferencia entre variables discreta y continuas?
LOGRO DE LA SESIÓN
Al finalizar la sesión de clase, el estudiante elabora tablas de frecuencias y gráficos
para resumir un conjunto de datos.
Tablas de frecuencias y gráficos para variables cualitativas
VARIABLES CUALITATIVAS Gráfico circular
categoria kcategoria 1
15% 10%
Título: Tabla de frecuencias categoria 2
20%
…
25%
Frecuencia Frecuencia Frecuencia categoria 3
Variable absoluta relativa porcentual 30%
𝒙𝒊 𝒇𝒊 𝒉𝒊 𝒑𝒊
categoría 1 𝑓1 ℎ1 𝑝1
categoría 2 𝑓2 ℎ2 𝑝2
Gráfico de barras
categoría 3 𝑓3 ℎ3 𝑝3
35%
⁞ ⁞ ⁞ ⁞ 30%
FRECUENCIAS
⁞ ⁞ ⁞ ⁞ 25%
20%
categoría k 𝑓𝑘 ℎ𝑘 𝑝𝑘 15%
10%
Total: 𝑛 1 100%
5%
0%
Fuente: Aquí debe indicar la fuente categoria 1 categoria 2 categoria 3 … categoria k
VARIABLE
Tablas de frecuencias y gráficos para variables cualitativas
EJEMPLO 1:
Se toma una muestra de 20 estudiantes de la UTP y se les pregunta, cuál es la marca de su celular.
Las respuestas fueron las siguientes:
Huawei Motorola Huawei Apple
Samsung Apple LG Samsung
Samsung BlackBerry Apple Samsung
Huawei Huawei Samsung Sony
Huawei Sony Huawei Apple
a) Organice estos datos en una tabla de frecuencias.
b) Elabore un gráfico circular.
c) Elabore un gráfico de barras.
d) A partir del gráfico de barras, responda: ¿Cuál es la marca de celular más común en los estudiantes
UTP?
Tablas de frecuencias y gráficos para variables cualitativas
SOLUCIÓN:
Tabla 01:Marcas de celulares de los estudiantes de la UTP
Marcas de Frecuencia Frecuencia Frecuencia
celular absoluta (𝑓𝑖 ) relativa (ℎ𝑖 ) porcentual (𝑝𝑖 )
Huawei Motorola Huawei Apple
Huawei 6 0.3 30%
Samsung Apple LG Samsung Motorola 1 0.05 5%
Samsung BlackBerry Apple Samsung Apple 4 0.2 20%
Samsung 5 0.25 25%
Huawei Huawei Samsung Sony
LG 1 0.05 5%
Huawei Sony Huawei Apple
BlackBerry 1 0.05 5%
Sony 2 0.1 10%
Total: 20 1 100%
Fuente: Elaboración propia
Tablas de frecuencias y gráficos para variables cualitativas
SOLUCIÓN:
Marcas de celulares de estudiantes UTP Marca de celulares de estudiantes
BlackBerry,
Sony, 10% UTP
5% Huawei, 30% 7
6
LG, 5% 6
5
N° DE ESTUDIANTES
5
4
4
3
Motorola, 5% 2
2
1 1 1
Samsung, 25% 1
0
Apple, 20% Huawei Motorola Apple Samsung LG BlackBerry Sony
MARCAS DE CELULARES
d) La marca de celular más frecuente en los estudiantes es el Huawei, seguido de Samsung, luego Apple.
Tabla de frecuencias y gráficos para variables cuantitativas discretas
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencia absoluta: Frecuencia absoluta acumulada:
𝑓𝑖 : Veces que se repite 𝑥𝑖 en la muestra. 𝐹𝑖 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖
Frecuencia relativa: Frecuencia relativa acumulada:
𝑓𝑖 𝐻𝑖 = ℎ1 + ℎ2 + ⋯ + ℎ𝑖
ℎ𝑖 =
𝑛
Frecuencia porcentual acumulada:
Frecuencia porcentual:
𝑃𝑖 = 𝑝1 + 𝑝2 + ⋯ + 𝑝𝑖
𝑝𝑖 = ℎ𝑖 × 100%
Tabla de frecuencias y gráficos para variables cuantitativas discretas
VARIABLES CUANTITATIVAS DISCRETAS
Título de la tabla de frecuencias
Variable Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
𝒙𝒊 absoluta relativa porcentual absoluta relativa porcentual
𝒇𝒊 𝒉𝒊 𝒑𝒊 acumulada acumulada acumulada
𝑭𝒊 𝑯 𝑷𝒊
𝑥1 𝑓1 ℎ1 𝑝1 𝐹1 𝐻1 𝑃1
𝑥2 𝑓2 ℎ2 𝑝2 𝐹2 𝐻2 𝑃2
𝑥3 𝑓3 ℎ3 𝑝3 𝐹3 𝐻3 𝑃3
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
𝑥𝑘 𝑓𝑘 ℎ𝑘 𝑝𝑘 𝐹𝑘 𝐻𝑘 𝑃𝑘
Total: 𝑛 1 100%
Tabla de frecuencias y gráficos para variables cuantitativas discretas
EJEMPLO 2
El semestre pasado, los 40 alumnos del curso de Estadística Descriptiva y Probabilidades obtuvieron
los siguientes promedios finales:
13 12 14 9 7 13 10 12
11 9 10 13 12 10 11 10
8 12 12 15 14 13 12 14
8 10 11 11 15 13 12 11
12 13 14 11 10 12 12 15
a) Elabore una tabla de frecuencias.
b) Elabore un gráfico de bastones.
c) A partir de la tabla de frecuencias, responda: ¿Qué porcentaje de los alumnos aprobaron el curso?
Tabla de frecuencias y gráficos para variables cuantitativas discretas
SOLUCIÓN:
Tabla 02: Promedio final de los estudiantes del curso de Estadística.
Frecuencia Frecuencia Frecuencia
Promedios Frecuencia Frecuencia Frecuencia absoluta relativa porcentual
finales absoluta relativa porcentual acumulada acumulada cumulada
𝑥𝑖 𝑓𝑖 ℎ𝑖 𝑝𝑖 𝐹𝑖 𝐻𝑖 𝑃𝑖
7 1 0.025 2.5% 1 0.025 2.5%
8 2 0.05 5.0% 3 0.075 7.5%
9 2 0.05 5.0% 5 0.125 12.5%
10 6 0.15 15.0% 11 0.275 27.5%
11 6 0.15 15.0% 17 0.425 42.5%
12 10 0.25 25.0% 27 0.675 67.5%
13 6 0.15 15.0% 33 0.825 82.5%
14 4 0.1 10.0% 37 0.925 92.5%
15 3 0.075 7.5% 40 1 100.0%
Total: 40 1 100.0%
Fuente: Elaboración propia
Tabla de frecuencias y gráficos para variables cuantitativas discretas
EJEMPLO 2:
¿Qué porcentaje de alumnos aprobaron el
curso?
Gráfico de bastones para los promedios finales
12
Primera forma:
Sumar los porcentajes 𝑝𝑖 correspondiente a
10 10 promedios aprobatorios
25% + 15% + 10% + 7.5% = 57.5%
8
N° de estudiantes
Segunda forma:
6 6 6 6
Restamos del 100% el porcentaje de
4 4
desaprobados:
3 100% − 𝑃5 = 100% − 42.5% = 57.5%
2 2 2
1 Rpta: El 57.5% de los alumnos aprobaron el
0
0 2 4 6 8 10 12 14 16 curso.
Promedios finales en estadística
Tabla de frecuencias y gráficos para variables cuantitativas continuas
Variables cuantitativas continuas
Título de la tabla de frecuencias
Intervalos Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Densidad
𝑰𝒊 de clase absoluta relativa porcentual absoluta relativa porcentual 𝒅𝒊
𝒙𝒊 𝒇𝒊 𝒉𝒊 𝒑𝒊 acumulada acumulada acumulada
𝑭𝒊 𝑯 𝑷𝒊
[ 𝒙𝒎𝒊𝒏, 𝒙𝒎𝒊𝒏 + 𝐂[ 𝑥1 𝑓1 ℎ1 𝑝1 𝐹1 𝐻1 𝑃1 𝑑1
[𝒙𝒎𝒊𝒏 + 𝐂, 𝒙𝒎𝒊𝒏 + 𝟐𝐂[ 𝑥2 𝑓2 ℎ2 𝑝2 𝐹2 𝐻2 𝑃2 𝑑2
[𝒙𝒎𝒊𝒏 + 𝟐𝐂, 𝒙𝒎𝒊𝒏 + 𝟑𝐂[ 𝑥3 𝑓3 ℎ3 𝑝3 𝐹3 𝐻3 𝑃3 𝑑3
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞ ⁞
[𝒙𝒎𝒊𝒏 + 𝑘 − 1 𝐂, 𝒙𝒎𝒊𝒏 + 𝐤𝐂[ 𝑥𝑘 𝑓𝑘 ℎ𝑘 𝑝𝑘 𝐹𝑘 𝐻𝑘 𝑃𝑘 𝑑𝑘
Total: Total: 𝑛 1 100%
Fuente: Aquí debe indicar la fuente
Tabla de frecuencias y gráficos para variables cuantitativas continuas
¿Cómo generar intervalos?
1. Encuentre el mínimo y el máximo valor en el conjunto de datos?
2. Encuentre el rango restando el máximo menos el mínimo:
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
3. Determine el número de intervalos por la regla de Sturges:
𝑘 = 1 + 3.3 log(𝑛)
redondee al entero más cercano.
4. Determine la amplitud de los intervalos:
𝐶 = 𝑅/𝑘
redondee si desea, pero hágalo siempre por exceso.
5. Escriba los intervalos:
𝐼1 = [𝑥𝑚𝑖𝑛, 𝑥𝑚𝑖𝑛 + 𝐶[
𝐼2 = [𝑥𝑚𝑖𝑛 + 𝐶, 𝑥𝑚𝑖𝑛 + 2𝐶[
Y así sucesivamente.
6. Encuentre las frecuencias 𝑓𝑖 por conteo.
7. Calcular las marcas de clase
𝐿𝑖𝑛𝑓 + 𝐿𝑠𝑢𝑝
𝑥𝑖 =
2
ℎ𝑖
8. Calcular las densidades: 𝑑𝑖 = 𝐴
Tabla de frecuencias y gráficos para variables cuantitativas continuas
EJEMPLO 3:
La prueba de hemoglobina 𝐴𝑙𝑐 , que es una prueba de sangre aplicada a los diabéticos durante sus chequeos
periódicos, indica el nivel de control de azúcar en la sangre durante los dos o tres meses pasados. Los datos
siguientes se obtuvieron de 40 diabéticos distintos en una clínica universitaria que atiende a pacientes diabéticos:
6.5 5 5.6 7.6 4.8 8 7.5 7.9 8 9.2
6.4 6 5.6 6 5.7 9.2 8.1 8 6.5 6.6
5 8 6.5 6.1 6.4 6.6 7.2 5.9 4 5.7
7.9 6 5.6 6 6.2 7.7 6.7 7.7 8.2 9
a) Elabore una tabla de frecuencias (para el número de intervalos use la regla de Sturges)
b) Elabore un histograma usando las frecuencias relativas y otro usando las densidades.
c) Elabore un polígono de frecuencias con las densidades.
d) Elabore una ojiva con las frecuencias relativas acumuladas.
e) A partir de la ojiva, responda: ¿Qué proporción de pacientes tienen niveles de azúcar menores a 7.6?
Tabla de frecuencias y gráficos para variables cuantitativas continuas
SOLUCIÓN:
Estadísticos:
Tamaño de muestra 𝑛 40
6.5 5 5.6 7.6 4.8 8 7.5 7.9 8 9.2 Mínimo 𝑥𝑚𝑖𝑛 4
6.4 6 5.6 6 5.7 9.2 8.1 8 6.5 6.6 Máximo 𝑥𝑚𝑎𝑥 9.2
Rango 𝑅 5.2
5 8 6.5 6.1 6.4 6.6 7.2 5.9 4 5.7
Número de intervalos 𝑘 6
7.9 6 5.6 6 6.2 7.7 6.7 7.7 8.2 9
Amplitud 𝐶 0.9
Tabla de frecuencias y gráficos para variables cuantitativas continuas
SOLUCIÓN:
Tabla de frecuencias para los niveles de azúcar de 40 pacientes diabéticos del hospital universitario.
Intervalos Marca de Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Densidad
𝑰𝒊 clase absoluta relativa porcentual absoluta relativa porcentual 𝒅𝒊
𝒙𝒊 𝒇𝒊 𝒉𝒊 𝒑𝒊 acumulada acumulada acumulada
𝑭𝒊 𝑯𝐢 𝑷𝒊
[4.0 , 4.9[ 4.45 2 0.050 5.0% 2 0.050 5.0% 0.0556
[4.9 , 5.8[ 5.35 7 0.175 17.5% 9 0.225 22.5% 0.1944
[5.8 , 6.7[ 6.25 14 0.350 35.0% 23 0.575 57.5% 0.3889
[6.7 , 7.6[ 7.15 3 0.075 7.5% 26 0.650 65.0% 0.0833
[7.6 , 8.5[ 8.05 11 0.275 27.5% 37 0.925 92.5% 0.3056
[8.5 , 9.4[ 8.95 3 0.075 7.5% 40 1.000 100.0% 0.0833
40 1.000 100.0%
Tabla de frecuencias y gráficos para variables cuantitativas continuas
SOLUCIÓN:
Histograma de los niveles de azúcar en 40 pacientes Histograma de los niveles de azúcar en 40 pacientes
diabéticos diabéticos
0.4 0.4500
Proporción de pacientes
0.35 0.4000
0.3 0.3500
0.3000
0.25
Densidad
0.2500
0.2
0.2000
0.15
0.1500
0.1 0.1000
0.05 0.0500
0 0.0000
[4.0 , 4.9[ [4.9 , 5.8[ [5.8 , 6.7[ [6.7 , 7.6[ [7.6 , 8.5[ [8.5 , 9.4[ [4.0 , 4.9[ [4.9 , 5.8[ [5.8 , 6.7[ [6.7 , 7.6[ [7.6 , 8.5[ [8.5 , 9.4[
Niveles de azúcar Niveles de azúcar
Hay una ligera diferencia entre estos dos histogramas, el primero es con proporciones y el segundo con densidades. La ventaja del primero
es que permite ver claramente la proporción de pacientes en algún intervalo. La ventaja del segundo es que la suma de las áre as de los
rectángulos vale 1, y las proporciones son encontradas a partir del área.
Tabla de frecuencias y gráficos para variables cuantitativas continuas
SOLUCIÓN:
Polígono de frecuencias para el nivel de azúcar de 40 Ojiva para el nivel de azúcar de 40 pacientes
pacientes diabéticos diabéticos
Proporción acumulada de pacientes
0.4500
1.200
0.4000 1.000
0.3500 1.000 0.925
0.3000
Densidad
0.800
0.2500 0.650
0.2000 0.600 0.575
0.1500
0.400
0.1000
0.225
0.0500 0.200
0.050
0.0000
3.55 4.45 5.35 6.25 7.15 8.05 8.95 9.85 0.000
4.0 4.9 5.8 6.7 7.6 8.5 9.4
Niveles de azúcar Niveles de azúcar
Como este polígono se realizó con densidades, entonces el Esta ojiva permite percibir las proporciones acumuladas
área debajo del polígono es igual a 1. hasta cualquier nivel de azúcar.
A partir de la ojiva vemos que la proporción de pacientes con niveles menores a 7.6 es igual a 0.650.
CIERRE DE SESIÓN
¿Qué hemos aprendido?
Variables cualitativas Variables cuantitativas discretas Variables cuantitativas continuas
Tabla de frecuencias Tabla de frecuencias con Tabla de frecuencias con todas
con frecuencias frecuencias acumuladas. las frecuencias incluida las
absolutas, relativas y acumuladas y las densidades,
porcentuales y los datos agrupados por
intervalos.
Histogramas
Gráfico de barras Gráfico de bastones Polígonos de frecuencias
Gráfico circulares Ojiva
EJERCICIO RETO
Una empresa de venta de máquinas de soldar, realiza una encuesta para determinar que marcas de
soldadoras profesionales compran sus clientes, obteniendo los siguientes datos:
Telwin Telwin Telwin Telwin Telwin Telwin Telwin Solter Telwin Telwin
Solter Solter Solter Solter Telwin Solter Solter Solter Solter Solter
Oerlikon Oerlikon Oerlikon Solter Telwin Oerlikon Miller Oerlikon Oerlikon Oerlikon
Lincoln Oerlikon Lincoln Solter Lincoln Lincoln Miller Oerlikon Lincoln Lincoln
Miller Oerlikon Lincoln Miller Miller Miller Miller Miller Lincoln Oerlikon
Elabore una tabla de frecuencias (para el número de intervalos use la regla de Sturges)
Elabore un gráfico de barras y diagrama circular.
¿Cuántas clientes prefieren la marca de soldadora profesional Miller?
¿Que porcentaje de clientes compran una máquina de soldar de la marca Telwin?
EJERCICIO RETO
Los siguientes datos representan el número de fallas que tiene 50 máquinas de soldar de la empresa
Miller, cuando pasa el control de calidad.
2 2 5 3 5 1 2 4 5 4
4 3 5 1 2 4 2 1 3 4
4 2 3 4 1 1 3 5 5 1
2 2 4 2 3 2 4 3 1 2
5 2 3 4 3 4 3 4 5 1
a) Elabore una tabla de frecuencias completa
b) Elabore un diagrama de bastones
c) ¿Cuántas máquinas de soldar tienen 4 fallas?
d) ¿Que porcentaje de máquinas de soldar tienen ?
EJERCICIO RETO
Los siguientes datos son las mediciones del diámetro de 36 cabezas de remache en centésimos de
una pulgada.
6.72 6.77 6.82 6.7 6.78 6.7
6.62 6.75 6.66 6.66 6.64 6.76
6.73 6.8 6.72 6.76 6.76 6.68
6.66 6.62 6.72 6.76 6.76 6.7
6.78 6.76 6.67 6.7 6.72 6.74
6.81 6.79 6.78 6.66 6.76 6.72
a) Elabore una tabla de frecuencias (para el número de intervalos use la regla de Sturges)
b) Elabore un histograma usando las frecuencias relativas y otro usando las densidades.
c) Elabore un polígono de frecuencias con las densidades.
d) Elabore una ojiva con las frecuencias relativas acumuladas.
TAREA DOMICILIARIA
La duración de fallas eléctricas, en minutos, se presenta en la siguiente tabla.
22 18 135 15 90 78 69 98 102
83 55 28 121 120 13 22 124 112
70 66 74 89 103 24 21 112 21
40 98 87 132 115 21 28 43 37
50 96 118 158 74 78 83 93 95
a) Realizar su tabla de frecuencias por intervalos.
b) Elabore un histograma usando las frecuencias absolutas.
c) Elabore un diagrama de ojivas para la frecuencia absoluta acumulada.
TAREA DOMICILIARIA
A continuación se presentan los tiempos de vida, en horas, de 50 lámparas incandescentes, con
esmerilado interno, de 40 watts y 110 voltios, los cuales se tomaron de pruebas forzadas de vida:
919 1196 785 1126 936 918 1156 920 948 1067
1092 1162 1170 929 950 905 972 1035 1045 855
1195 1195 1340 1122 938 970 1237 956 1102 1157
978 832 1009 1157 1151 1009 765 958 902 1022
1333 811 1217 1085 896 958 1311 1037 702 923
a) Elabore una tabla de frecuencias (para el número de intervalos use la regla de Sturges)
b) Elabore un histograma usando las frecuencias relativas y otro usando las densidades.
c) Elabore un polígono de frecuencias con las densidades.
d) Elabore una ojiva con las frecuencias relativas acumuladas.