Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA INFERENCIAL
Docente: Sergio Andrés Caro Acevedo
DOCUMENTO NOMBRE
Abril de 2018
CÓDIGO DE ÉTICA:
“Por medio de la presente hacemos constar que el reporte que estamos enviando es de nuestra completa
autoría y que no estamos haciendo plagio de ideas o escritos del trabajo de otras personas”
1
Contenido
1. Resumen ................................................................................................................ 2
4. Objetivo ................................................................................................................ 7
Resumen
Con este proyecto se tiene el propósito de analizar el número de pedidos en EPM,, tomando
como referencias dos muestras aleatorias de los 1583 pedidos que se realizaron en el mes de
febrero. Seleccionamos dos muestras de 30 pedidos, para llegar a analizar todo lo respectivo
con el proyecto.
Todo la información la sacamos del área de pedidos de EPM, la cual es una Empresa
prestadora de los servicios públicos de agua, energía y gas natural con un enfoque en RSE y
sostenibilidad.
Las dos variables que vamos a tomar son el número de días en gestión y el día del mes de
febrero en que se creó el pedido, con el propósito de ver cuánto es el tiempo que se requiere
para solucionar estos pedidos, y analizar cómo podría la empresa optimizar estos procesos;
conocer en qué días del mes de febrero del 2018 se realizaron más pedidos, analizar el nivel
de pedidos de este mes, para que a futuro se pueda comparar con otros meses.
3
Desde el área de servicio al cliente, los pedidos cuentan con el siguiente proceso:
El usuario debe llegar a la taquilla para diligenciar un formulario de solicitud y anexar los
documentos que sean necesarios según el servicio que desea legalizar. Luego, se ingresa el
La base de datos que tenemos es de los proyectos; es decir, son los servicios que se van a
legalizar por medio de un proyecto (edificaciones de las constructoras), como son tantas
casas, eso ingresa por un área que se llama constructores, y ya las encargadas del back office
deben ingresar todos los pedidos, para que ya cada área vaya y legalice. Son dos procesos
Energía
En el momento en que la Interventoría culmine y la obra eléctrica cumpla con todos los
● Reformas
● Provisional de la construcción y salas de ventas
Agua
● Construcciones existentes
Se debe tener en cuenta que EPM garantiza la prestación del servicio hasta los terceros pisos
considerando la altura de una vivienda típica, con una presión de 20 metros columna de
agua, medibles en la red pública.
Gas
Aburrá. Hoy está en plena expansión en los 10 municipios del Valle de Aburrá, incluyendo
Medellín, y en otras localidades de Antioquia, ofreciendo una alternativa energética segura,
económica y amigable con el medio ambiente.
Tomamos los pedidos del mes de febrero del 2018, y tomamos dos muestras aleatorias de las
ese día, y la tabla número 2, el día del mes de febrero en que se realizó el pedido.
6 Pedidos con 0 días de gestión, 18 Pedidos con 1 días de gestión, 3 Pedidos con 4 días de
1 4 0 1 1
4 1 0 1 1
1 1 4 0 6
1 6 1 1 1
6 0 1 1 1
1 0 1 0 1
Día #1: 4, Día#2: 6, Día#5: 4, Día#6: 2, Día #7: 4, Día #8: 4, Día #9: 3, Día #10: 3
1 2 5 7 9
1 2 5 7 9
1 2 6 8 9
1 2 6 8 10
2 5 7 8 10
2 5 7 8 10
7
Objetivo
El objetivo que se tiene con todo este análisis estadístico, es observar detalladamente el
rendimiento de esta área de pedidos, y así sacar conclusiones e ideas que puedan mejorar el
Durante el mes de febrero de 2018 se observó un número de 1583 pedidos, de esta población
sacamos una muestra de 30 pedidos que se realizaron del 1 al 10 de Febrero, con unos días de
gestión que van de 0 a 6 días. Se pudo observar que en los primeros días del mes, los pedidos
requieren menos días de gestión; se quiere observar por qué en los últimos días, se tardan
Procedimiento de Muestreo
Las muestras se sacaron de una base de datos que comprendía todos los pedidos realizados
durante el mes de febrero; la base de datos se descargó del CRM de EPM, que es una
información general, aunque claramente tuvimos que realizar una solicitud a la parte
Nivel de Confianza
Para el análisis de estas dos muestras se eligió un Nivel de Confianza (NC) de 95% = (1-α)
debido a que permite un bajo margen de error sin la necesidad de contar con un número muy
alto de datos. De esta consideración resulta un α= 0.05. Donde Z(α/2)= Z(0.025) y eso
Procedimiento del análisis estadístico (En este punto se hace mención a todas las mediciones
exploratorio (hacer conjeturas que luego se prueban con las hipótesis a plantear) análisis
Tamaño de la muestra 30 30
Mediana 1 6
Moda 1 2
Mínimo 0 1
Máximo 6 10
En la tabla podemos observar que tanto la varianza, como la desviación estándar es mayor en
la variable #2, o sea, que tiene datos más dispersos. Pero en en el coeficiente de variación,
Con el objetivo de analizar cómo se distribuyen los días en que se gestionan los pedidos, se
N MÍNIMO MÁXIMO
30 0 6
1
AMPLITUD
0 1 24 0,8% 24 0,8%
1 2 0 0% 24 0,8%
2 3 0 0% 24 0,8%
3 4 3 0,1% 27 0,9%
4 5 0 0% 27 0,9%
5 6 3 0,1% 30 1%
N MÍNIMO MÁXIMO
30 1 10
1,5
AMPLITUD
1 3 10 0,3% 10 0,3%
3 5 0 0,0% 10 0,3%
5 7 10 0,3% 20 0,6%
7 9 7 0,2% 27 0,8%
9 11 3 0,3% 30 1%
Basándonos en lo que hemos visto en clase, los histogramas anteriores no tienen una
distribución normal, porque son asimétricas, y por lo tanto no se tiene una relación estadística
normal con los días de gestión y creación de los pedidos. Se puede observar que en la
variable # 1 se tiene una mayor frecuencia en los pedidos que se realizan de 0 a 1 día; y en la
un nivel de confianza del 95%. Para la variable #1 el margen de error fue de 0,644 y para la
variable #2 de 1,108.
Prueba de Hipótesis
Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe
suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para
toda la población. Una prueba de hipótesis examina dos hipótesis opuestas sobre una
probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay
Partiendo del supuesto que los valores analizados provienen de muestras que siguen una
distribución normal, se llevaron a cabo pruebas de hipótesis para los valores medios de
Hipótesis de la variable #1
En el área de pedidos el promedio de los días de gestión es de 1,60. Se sabe que la desviación
estándar poblacional es 1,80. Se tomará una muestra de 30 datos, con una media muestral de
1, para saber si la gestión de pedidos puede ser menor al promedio de la población. Cuando
α = 0, 05
Ho= µ ≥ 1,60
Error estándar
1,80
σχ = √30
σ χ = 0, 329
Estadístico de prueba
χ−µ 1−1,60
Z= σχ Z= 0,329 = -1,82 Valor-p= 0,0344
Conclusión
Valor-p ≤ α 0, 0344 ≤ 0, 05 Se rechaza la Ho, pueden haber menos de 1 día de gestión
para el pedido.
Hipótesis de la variable #2
En el área de pedidos el promedio de los días en que se realizaron para el mes de febrero es
de 5,5. Se sabe que la desviación estándar poblacional es 3,096. Se tomará una muestra de 30
datos, con una media muestral de 6,5, para saber si puede ser superior la media poblacional.
con α = 0, 05 .
13
Ho= µ ≤ 5,5
Error estándar
3,096
σχ = √30
σ χ = 0, 565
Estadístico de prueba
χ−µ 6,5−5,5
Z= σχ Z= 0,565 = 1,76 Valor-p= 1- 0,9608 = 0,0392
Conclusión
Intervalos de Confianza
Se realiza la estimación del Intervalo de Confianza para la media del consumo de energía en
las variables #1 y #2 con un nivel de confianza del 95% y se obtienen los siguientes
resultados:
Se puede concluir que la media del número de pedidos para la variable #1 estará entre 0,956 y
2,244 con una confianza del 95%. Por otra parte, la media del número de pedidos para la
variable #2 estará entre 4,392 y 6,608 con una confianza del 95%. La variable #2 tiene una
mayor amplitud.
14
Intervalo de Confianza para la varianza del número de pedidos para las variables #1 y #2 con
La varianza del número de pedidos para la variable #1 está entre 2,055 y 5,855 con una
confianza del 95%. La varianza del número de pedidos para la variable #2 está entre 6,076 y
17,312 con una confianza del 95%. En este caso, también se tiene mayor amplitud en la
variable #2.
Variable #1: De una muestra de 100 datos de número de pedidos para la variable#1, 0,38
pedidos se tardaron más de 3 días en gestión. Se quiere construir un intervalo del 95% de
confianza para aproximar la proporción de todos los datos de días en gestión de los pedidos.
Se obtuvo un intervalo de confianza para la variable #1 tal que 0,285 < P ≤ 0,475, con un
Variable #2: De una muestra de 100 datos de número de pedidos para la variable#2, 0,60
pedidos se realizaron los primeros días del mes de febrero. Se quiere construir un intervalo
del 95% de confianza para aproximar la proporción de todos los datos de días de creación de
pedidos.
Se obtuvo un intervalo de confianza para la variable #2 tal que 0,504 < P ≤ 0,696, con un