Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidad y estadística
Autoría
Escrito y corregido por Jaime Espinosa, estudiante de Ing. Mecánica en la Escuela
Politécnica Nacional del Ecuador.
Jaime2920206@gmail.com
Jaime.espinosa02@epn.edu.ec
+593 995642011
______________________________________________________________________
Resumen
En este documento se mostrará el análisis de estadístico para una muestra de datos
correspondientes a la facturación mensual y el consumo eléctrico de una muestra de 1500
familias durante un año. Se utilizarán conocimientos de análisis estadístico, intervalos de
confianza, pruebas de hipótesis, pruebas de ajuste de bondad y la construcción de tablas
ANOVA. Todos estos conceptos serán explicados brevemente en la sección de metodología
para entender el tratamiento que se les dio a los datos brutos.
Este documento contara de 6 secciones con sus respectivas subdivisiones, en las cuales se
realizará una introducción más amplia a los objetivos y procedimientos a realizar, luego
contara de una sección de metodología para tener un acercamiento matemático y teórico de
los análisis a realizar, posteriormente se encontrará la sección de resultados donde se
podrán observar con facilidad los estadísticos, tablas e imágenes resultantes de los procesos
matemáticos utilizados en los datos brutos, las secciones serán analizadas en la sección de
análisis donde se explicara la significancia de los datos, tablas e imágenes, finalmente se
discutirá todos los resultados antes obtenidos en la sección de conclusión de este
documento. Todos los datos y tablas que el autor crea necesarios exponer se encontraran en
la sección de apéndices al final del documento.
A partir de estos análisis llegaremos a conclusiones directas sobre el manejo de los recursos
naturales y energéticos del país, además, se podrá observar el comportamiento del consumo
y la facturación del ecuador, de cada región e incluso de algunas provincias del Ecuador para
comprar si existen diferencias significativas entre ellas.
Esta actividad tiene la finalidad de analizar los conocimientos estadísticos del autor, ya que
se pondrá a prueba su criterio de análisis y su facilidad de trabajar con los conceptos de
probabilidad y estadística aprendidos en el curso homónimo de la Escuela Politécnica
Nacional.
______________________________________________________________________
Cuerpo del Informe
A. Introducción
Para poder tomar acciones directas sobre la distribución energética del país, se deben
realizar varios análisis estadísticos que permitan observar de manera adecuada como
se comporta el consumo del kilowatt-hora para cada región y en cada mes, de esta
manera se plantean acciones para distribuir adecuadamente los recursos eléctrico-
energéticos del país, así mismo, gracias a estos datos se puede observar el
comportamiento económico de las distintas regiones y de esta manera, plantear tasas
de pago y mejorar el manejo monetario asociado al servicio eléctrico de cada
provincia o región.
En este documento se detallará el análisis estadístico de una muestra de 1500 familias
con los datos del consumo de killowatts y las facturas del consumo eléctrico de cada
mes por un año.
Se utilizará los conocimientos obtenidos en la materia de “Probabilidad y estadística”
para realizar un estudio del comportamiento del consumo eléctrico mensual, anual, y
regional, especificando características de la muestra como los cuartiles o la curtosis
para realizar un análisis descriptivo de los datos. También se realizará un estudio de
los intervalos de confianza del valor anual pagado por familia de la muestra, de la
sierra, de la costa y la amazonía.
Luego se estudiará si existen diferencias significativas entre los meses de mayor y
menor consumo, se construirá una prueba de bondad de ajuste para tabla de
contingencia entre las variables: deciles del consumo anual de energía eléctrica y la
región de residencia y finalmente se realizará el análisis de las varianzas a partir de
tablas ANOVA.
B. Métodos
Para realizar el estudio descrito anteriormente, se utilizó un banco de datos de 1500
familias ecuatorianas en el cual se describe el consumo en kilowatts de cada mes y su
factura en un año.
Como se explicó anteriormente en la introducción, el análisis que se realizará se
dividirá en las siguientes secciones: Análisis descriptivo, intervalos de confianza,
prueba de hipótesis y bondad y finalmente tablas ANOVA de análisis de varianza. A
continuación, se presentarán los métodos utilizados para obtener los estudios
descritos.
I. Análisis descriptivo.
Para observar el comportamiento de la muestra se dividió el análisis por
meses de toda la población y por regiones de todo el año, tanto para describir
el consumo como la facturación.
Primero se estudió el grupo de datos mes por mes tanto de consumo en
kilowatts como en facturación, se retiró los datos atípicos de la muestra para
su análisis realizando una discriminación con la puntuación estándar, llamada
también Zscore, se calculó a partir de la normalización de los datos un
parámetro Z, que se puede observar en la ecuación (1), el puntaje estándar, y
se utilizó únicamente los datos que presentaban un número menor a 3. De esta
forma se utilizaron datos que no influyan equívocamente al comportamiento
del consumo por mes del ecuador.
|𝑥𝑖 − 𝑥̿ |
𝑍{𝑠𝑐} = (1)
𝑆
𝑛
1
𝑋̅ = ∑ 𝑥𝑖 (2)
𝑛
𝑖=1
𝑛
1
𝑆=√ ∑(𝑥𝑖 − 𝑥̅ )2 (3)
𝑛−1
𝑖=1
1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )4
𝑔= (4)
𝑛 64
Se determinó el intervalo de confianza al 95% del valor de pago anual por cada
familia en Ecuador, en la sierra, en la costa y en la amazonía. Para realizar esto
primero se obtuvo el valor anual a pagar de cada familia y se realizó una
discriminación de puntuación estándar para determinar y excluir los valores
atípicos. A partir de ese grupo de datos, su obtuvo la media con la ecuación (2),
y la desviación típica con la ecuación (3) para determinar el intervalo con la
ecuación (5).
𝑆 𝑆
(𝑥̅ − 𝑡𝛼 (𝑛 − 1) ; 𝑥̅ + 𝑡𝛼 (𝑛 − 1) ) (5)
2 √𝑛 2 √𝑛
Luego se dividieron los datos por regiones y se volvió a discriminar los datos
con el proceso antes mencionado, para obtener el intervalo correspondiente
con la ecuación (5).
𝐻0 : 𝜇2 − 𝜇1 = 0
𝐻1 : 𝜇2 − 𝜇1 ≠ 0
𝑥2 − 𝑥1
𝑍𝑠𝑡 = (6)
𝑠2 𝑠22
√ 1
𝑛1 + 𝑛2
𝑛𝑖 𝑛𝑗
𝑒𝑖𝑗 = (7)
𝑛
𝑚 𝑘 2
2
(𝑛𝑖𝑗 − 𝑒𝑖𝑗 )
𝑋𝑜𝑏𝑠 = ∑∑ (8)
𝑒𝑖𝑗
𝑖=1 𝑗=1
140
135
KWH
130
125
120
140
135
KWH
130
125
120
Con los datos presentados se realizó las gráficas de distribución mensual para
observar el comportamiento de la media mensual de la facturación a lo largo
del tiempo y de forma ascendente para distinguir los meses de mayor y menor
consumo.
Distribución de facturación por mes
16
14
12
10
Dolares
8
14
12
10
Dolares
Significancia t s X(media) n
0.05 1.9616 113.6363 159.5808 1479
Intervalo:
]153.78 ; 165.37[
Significancia t s x(media) n
0.05 1.9631 73.9392 132.7537 765
Intervalo:
]127.5057 ; 138.0016[
Significancia t s x(media) n
0.05 1.9636 153.104 196.6206 649
Intervalo:
]184.8195 ; 208.4218[
VI. Intervalo de confianza de facturación anual de cada familia de la
amazonía.
Para obtener el intervalo de confianza se utilizó el proceso descrito
anteriormente, obteniendo una muestra sin datos atípicos de la facturación
anual de cada familia de la amazonía. Considerando un estimador t-student de
648 grados de libertad con una significancia de 0.5, se obtuvo el intervalo de
confianza descrito a continuación:
Significancia t s x(media) n
0.05 2.001 71.78135 112.5087 60
Intervalo:
]93.96554 ; 131.0518[
VII. Prueba de hipótesis.
Para determinar si existen diferencias significativas entre los meses de mayor
y menor consumo promedio de energía se utilizaron las hipótesis nula y
alternativa siguientes:
Ho: 𝜇2 − 𝜇1 = 0
H1: 𝜇2 − 𝜇1 ≠ 0
Desviación Tamaño
Media
típica muestral
Menor
Diciembre 127.7981 95.70365 1471
promedio
Mayor
Mayo 141.6599 110.1568 1473
promedio
Con esta se calculó los valores esperados con la ecuación (7). Los resultados
se muestran en la tabla 6 a continuación:
2
𝑋𝑜𝑏𝑠 = 125.2433
Por lo que utilizando un valor crítico con 16 grados de libertad con una
2
significancia del 5%, tenemos que: 𝑋𝑐𝑟𝑖 = 26.3
IX. Tabla ANOVA con factor de tratamiento de las provincias de
Azuay, Guayas y Pichincha.
Se realizo el tratamiento de los datos y los resultados fueron los siguientes:
Tamaño
Grupos Promedio Varianza
muestral
Azuay 95 101.010526 4057.35095
Pichincha 360 136.341667 6911.59603
Guayas 364 218.217033 29100.9197
Tabla 7: Datos de cada muestra
ANOVA
Origen de
F P-value F crit
variaciones
Entre
51.8032979 6.606E-22 3.00675729
grupos
Tabla 8: Tabla ANOVA I
Se debe destacar que: F>Fcrit
D. Análisis
Intervalo de
confianza
Anual 153.7846 165.377
Sierra 127.5057 138.0016
Costa 184.8195 208.4218
Amazonía 93.96558 131.0518
2
𝑋𝑜𝑏𝑠 = 125.2433
2
𝑋𝑐𝑟𝑖 = 26.3
Por lo que:
2 2
𝑋𝑜𝑏𝑠 > 𝑋𝑐𝑟𝑖
Con estos datos se debe rechazar la hipótesis nula, por lo que la correcta
conclusión sería: No hay información suficiente para no rechazar que los
deciles y el consumo anual de cada provincia son independientes, es decir son
probablemente variables dependientes.
E. Conclusiones
Para finalizar es importante notar el gran número de análisis que se puede realizar a
un grupo de datos, y sobre todo el sin gran numero de interpretaciones que puede
tener un indicador o un estimador. Es importante observar que los datos tienen la
finalidad de ayudar a predecir el comportamiento del consumo energético del
Ecuador, y gracias a esto se puede tener un manejo efectivo de los recursos tanto
económicos como naturales del país.
________________________________________________________________
Apéndices
Para facilitar el manejo del espacio de este documento y poder brindar la información
necesaria al lector, se han subido a la nube online, las tablas utilizadas para realizar
todos los cálculos y descripciones mostradas en este documento. El archivo se puede
encontrar en formato xlsx en el siguiente vinculo de descarga:
https://docs.google.com/spreadsheets/d/14_EmGWz6pRiYwDd0BcU0UW8eyIB2f4
NRyzXhZmA3XGU/edit?usp=sharing
Bibliografía.
Estadística Básica para estudiantes de ciencias, Gorga ,J; Cardiel, N;Zamorano,J,
Departamento de Astrofísica y Ciencias de la Atmósfera,Facultad de Ciencias
Físicas, Universidad Complutense de Madrid,2011.
Estadística-Métodos y Aplicaciones; Galindo, E;prociencia Editores;2011.
Probabilidad y Estadística para ingeniería y ciencias, Walpole,R &Myers,S;
;Pearson;2007.