Está en la página 1de 28

CURSO:

Estadística Inferencial

Relación de la temperatura con diferentes gases emitidos en una

ciudad italiana, desde marzo de 2004 hasta febrero de 2005.

PROFESOR:

Joel Jesús Bastidas Valdivia

MIEMBROS:

Sánchez Janampa Deivy Raúl (0%)

Solano Macetas Piero Alessandro (100%)

Valdera Vidaurre Zhaul Alberto (100%)

Velásquez Soria Eddie Rolando (100%)

Villanueva Palomino Alexandra Jesusa (100%)

Zamudio García Jhoan Jhoel (0%)

LIMA- PERÚ

2022

Índice

Resumen.....................................................................................................................................3
Capítulo I...................................................................................................................................4

Introducción............................................................................................................................4

Objetivos Generales:..............................................................................................................5

Justificación............................................................................................................................5

Antecedentes Nacionales e Internaciones Calidad del Aire...................................................6

Parámetros Estadísticos..........................................................................................................8

Normalidad.........................................................................................................................8

Margen de Error.................................................................................................................8

Media..................................................................................................................................8

Proporción..........................................................................................................................9

Desviación Estándar...........................................................................................................9

Intervalos de Confianza para la Diferencia de Medias con Varianza Conocida y

Desconocida......................................................................................................................10

Hipótesis Nula e Hipótesis Alternativa.............................................................................10

Normalidad.......................................................................................................................10

Prueba de Aleatoriedad o Rachas....................................................................................10

Variables y Tipo de Variables (Media Cara por Variable)...................................................10

Tamaño de Muestra..............................................................................................................11

Cálculo del Tamaño de Muestra...........................................................................................12

Ejemplo 2. Tamaño de muestra:...........................................................................................13

Referencias...............................................................................................................................19
Resumen

La calidad del aire es una indicación de cuando el aire está exento de contaminantes

atmosférico y por lo tanto apto para ser respirado. No gozar de un ambiente con aire de

calidad es un problema que implica riesgo o daño para la seguridad y la salud de las personas,

el medio ambiente y bienes de cualquier naturaleza.

El análisis de estadística descriptiva es un método que se aplica en muchas áreas del

conocimiento. En este estudio, dicho análisis se aplicó a los datos de concentraciones de

contaminantes atmosféricos que afectan la calidad del aire, tomados de un dataset en Kaggle,

es una comunidad en línea de científicos de datos y profesionales del aprendizaje automático.

Palabras clave: Contaminación del aire, contaminantes atmosféricos, estadística, estadística

descriptiva.

Abstract

Air quality is an indication of when the air is free of atmospheric pollutants and

therefore suitable for breathing. Not enjoying an environment with quality air is a problem

that implies risk or damage to the safety and health of people, the environment and goods of

any nature.

Descriptive statistical analysis is a method that is applied in many areas of knowledge.

In this study, such analysis was applied to data on concentrations of air pollutants that affect

air quality, taken from a dataset on Kaggle, an online community of data scientists and

machine learning professionals.

Keywords: Air pollution, air pollutants, statistics, descriptive statistics.


Capítulo I

Introducción

La contaminación del aire es un problema de salud ambiental que emite grandes

cantidades de partículas y gases potencialmente dañinos a la atmosfera a escala global,

afectando la salud humana y el medio ambiente, a través de partículas en suspensión (niebla,

polvo), contaminantes del aire (vapores y gases) y olores, (OMS, 2005).

Existe en todas las sociedades, independientemente del nivel de desarrollo

socioeconómico, y es un fenómeno que afecta especialmente a la salud humana y al

ambiente. Parte de la población está expuesta a fuentes fijas de contaminación, falta de zonas

de protección sanitaria, industrias con chimeneas de baja altura que aumentan el efecto

contaminante de sus emisiones y en muchos casos no existen controles para reducir la

contaminación en la atmósfera.

Según la Organización Mundial de la Salud (OMS), la exposición a partículas

representa una grave amenaza para la salud de muchas ciudades del mundo. La nueva

información incluida en las pautas de calidad del aire actualizadas recientemente, los efectos

en la salud, cubre los contaminantes comunes del aire: Material Particulado (MP), Ozono

(O3), Monóxido de Carbono (CO), Dióxido de Nitrógeno (NO2) y Dióxido de Azufre (SO2).

(A.M & Guerrero).

Un importante desafío para el Estado peruano es garantizar el acceso de toda la

población, a servicios de agua potable y saneamiento, reconociendo la importancia que tienen

para el cuidado de la salud pública, la superación de la pobreza, el desarrollo económico y la

protección del medio. El agua no sólo es un elemento vital para el desarrollo de la población,

ésta cumple una función de preservación de los sistemas ecológicos además es indispensable

para todos los sistemas de producción lo cual condiciona los distintos aspectos del desarrollo

social, de allí que el agua se torne cada vez más en el centro del interés mercantil siendo un
punto de disputa y tensión creciente a nivel mundial. Respecto a las referidas fuentes de

contaminación, como la existencia de pasivos ambientales mineros y de hidrocarburos, la

minería ilegal, y el inadecuado manejo y disposición final de los residuos sólidos, la

Defensoría del Pueblo ha emitido con anterioridad diversas recomendaciones para su

atención, y a su vez, realiza un continuo seguimiento. Como soluciones se brinda erradicar la

minería ilegal, para que así contribuyan a plantear una pronta recuperación de las áreas

degradadas por los residuos sólidos.

Objetivos Generales:

 Conocer el comportamiento de la temperatura debido a los diferentes tipos de

composiciones químicas emanadas en cierta zona

 Evaluar los datos de la contaminación del aire, a través de una base de datos obtenidos

de un dispositivo multisensorial

 Analizar la influencia de las todas variables independientes frente a la variable

dependiente

Justificación

El mal manejo anterior de los desechos industriales está provocando un cambio en los

ecosistemas y su gente en todo el mundo, obliga a los gobiernos, universidades, centros de

investigación y público en general buscan soluciones a este problema.

La contaminación de los ecosistemas es a menudo el

resultado de una rápida expansión las áreas urbanas y los asentamientos a menudo no se

planifican con anticipación.

Muchas industrias descargan aguas residuales desde allí. Nuestro país no es aparte de

ese hecho, se ha trabajado mucho en el tema.

La contaminación ambiental puede definirse como cambiar las propiedades físicas,

químicas y biológicas del aire, el agua y el suelo, por la influencia de procesos naturales o
artificiales. problema de contaminación el agua y la tierra acercan a los

países latinoamericanos evaluar y gestionar los recursos degradados y desarrollar políticas

para ellos restaurar.

Ante esta problemática nuestro país ha iniciado una serie de cambios dentro de su

legislación tendiente a abatir o en su caso prevenir o controlar la contaminación producida

por la actividad industrial. En el 2003 fue aprobada la nueva ley general para la gestión

integral para los residuos peligrosos, la cual los define como “aquellos que posean alguna de

las características de corrosividad, reactividad, explosividad, toxicidad, inflamabilidad, o que

contengan agentes infecciosos que les confieran peligrosidad, así como los envases,

recipientes, embalajes o suelos que hayan sido contaminados cuando se transfieren a otro

sitio, de conformidad con lo que establece esta ley” (DGGIMAR, 2003).

Antecedentes Nacionales e Internaciones Calidad del Aire

La contaminación del aire es un peligro importante para la salud ambiental. Al reducir

los niveles de contaminación del aire, los países pueden reducir la carga de morbilidad de los

accidentes cerebrovasculares, el cáncer de pulmón y las enfermedades pulmonares crónicas y

agudas, incluido el asma. A corto y largo plazo, los niveles más bajos de contaminación del

aire se asocian con una mejor salud cardiovascular y respiratoria. Las pautas actualizadas de

calidad del aire de la OMS para 2021 evalúan el impacto de la contaminación del aire en la

salud, así como los niveles de contaminación perjudiciales para la salud. En 2019, el 99% de

la población mundial vivía en lugares que no cumplían con las pautas de calidad del aire de la

OMS. Según una estimación de 2016, la contaminación del aire urbano y rural causa 4,2

millones de muertes prematuras en todo el mundo cada año. Alrededor del 91% de estas

muertes prematuras ocurren en países de ingresos bajos y medianos, con la incidencia más

alta en las regiones de Asia Sudoriental y el Pacífico Occidental de la OMS. Las políticas e

inversiones que apoyen el uso de transporte menos contaminante, una mejor eficiencia
energética en los hogares, la generación de energía y la industria y una mejor gestión de los

desechos municipales tendrán el potencial de reducir algunas de las mayores fuentes de

contaminación del aire en las ciudades. Además de la contaminación del aire exterior, el

smog interior plantea un grave riesgo para la salud de aproximadamente 2600 millones de

personas que utilizan combustibles de biomasa y carbón para cocinar y calentarse.

El material particulado es un indicador común de la contaminación del aire. Afecta a

más personas que cualquier otro contaminante. Los principales componentes de las partículas

son sulfatos, nitratos, amoníaco, cloruro de sodio, negro de carbón, polvo mineral y agua.

Consiste en una mezcla compleja de partículas sólidas y líquidas de sustancias orgánicas e

inorgánicas suspendidas en el aire. Las partículas con un diámetro menor o igual a 10 micras

(≤PM10) pueden penetrar y asentarse profundamente en los pulmones, mientras que las

partículas con un diámetro menor o igual a 2,5 micras (≤PM2,5) son más nocivas para la

salud. PM2.5 puede cruzar la barrera pulmonar y entrar al sistema sanguíneo. La exposición

prolongada a partículas aumenta el riesgo de enfermedades cardiovasculares y respiratorias,

así como de cáncer de pulmón. Las mediciones de la calidad del aire generalmente informan

la concentración promedio diaria o anual de partículas PM10 por metro cúbico (m3) de aire.

La medición de la calidad del aire del sistema expresa la concentración de partículas en

microgramos (μ)/m3. Las concentraciones de partículas finas (PM2.5 o menos) también se

informan en presencia de instrumentos de medición suficientemente sensibles.

Según datos publicados por la Organización Mundial de la Salud, la concentración

anual de PM10 en Perú es de 63 µg/m3, que es superior al valor guía de un promedio anual

de 20 µg/m3. El Informe de calidad del aire del Clean Air Institute [150] muestra que Lima

ocupa el quinto lugar entre las ciudades de América Latina con el nivel más alto de PM10 en

el aire (62,2 µg/m3). La ciudad de Monterrey (México) encabeza la lista, Santiago de Chile

(Chile) ocupa el cuarto lugar y D. F. (México) en sexto lugar. Cabe mencionar que nuestro
Criterio de Calidad Ambiental (ECA) establece un nivel de concentración anual de PM10 de

50 µg/m3.

El informe de calidad del aire del Clean Air Institute sobre partículas contaminantes

PM2.5 enumera a la ciudad de Bogotá, Colombia, en primer lugar, seguida de Lima con 31,5

µg/m3. Le sigue la ciudad de Medellín (Colombia) y Montevideo (Uruguay). El valor

especificado en las directrices de la OMS corresponde a un valor medio anual de PM2,5 de

10 µg/m3. Cabe mencionar que nuestro ECA ha establecido un nivel de concentración de 25

µg/m3 para un período de monitoreo de 24 horas, y nuestra normativa actual no especifica un

valor de ECA anual para este parámetro. Entre otros parámetros considerados en nuestra

normativa, según el Informe de Calidad del Aire del Clean Air Institute, Lima tuvo la

concentración promedio anual más baja de dióxido de nitrógeno (NO2) de 12.8 µg/m3,

mientras que en América Latina, las otras 8 ciudades como D.F. México, Santiago de Chile,

La Paz (Bolivia), Montevideo encabezaron la lista con 70 µg/m3. El valor recomendado por

las guías de la OMS corresponde a un promedio de 40 µg/m3 por año. Cabe mencionar que

nuestro ECA fijó un nivel de concentración anual de NO2 de 100 µg/m3. En el caso de medir

la concentración promedio anual de dióxido de azufre (SO2), la ciudad con mayor

concentración de este contaminante es León, México, y Lima ocupa el noveno lugar con un

valor de 8 µg/m3, muy por debajo de Medellín. México DF. , Montevideo y Bogotá. Vale la

pena mencionar que nuestro ECA estableció un nivel de concentración de SO2 de 20 µg/m3

con un período de monitoreo de 24 horas, que es el mismo valor recomendado por las guías

de la OMS, pero no hay un ECA anual para el parámetro SO2.

Parámetros Estadísticos

Media

Representa un valor promedio de todas las observaciones, cada uno de los datos

influye de igual forma en su resultado. Existen dos medidas de medias:


 Media Poblacional: Se representa por el símbolo griego mu (µ)

 Media Muestral: Representado por la letra x con borde superior (X)

Cuando se tiene n datos y se quiere saber la tendencia media de esos datos se

prosigue de la siguiente manera:

x 1+¿ x + x +…+x ¿
2 3 n

x 1+¿ x + x +…+x
Media= 2 3 n
¿
n

Proporción

Es la medida estadística más simple que puede adscribirse a dos variables de

comparación. La proporción expresa la frecuencia con que se encuentra la variable de interés,

dentro del conjunto total de datos de una población. También hay dos tipos de proporción:

 Proporción poblacional: Representado por la letra mu (µp)

 Proporción muestral: Representado por pi (π)

Teniendo n datos y m del total de datos, se puede proseguir de la siguiente manera

para hallar la proporción:

n
P=
m

Desviación Estándar

Es la medida de dispersión, que indica qué tan dispersos están los datos alrededor de

la media. Tenemos dos tipos:

 Desviación estándar poblacional: σ

 Desviación estándar muestral: S


Capítulo II

Variables y Tipo de Variables (Media Cara por Variable)

En los reportes del estado de la calidad del aire a escala nacional, se considera la

información proveniente de las redes operativas, y en las zonas donde no se cuenta con estas.

Por lo tanto, se tomaron en cuenta estas variables para el análisis del trabajo: Temperatura,

monóxido de carbono, hidrocarburos no metano, óxido de estaño, dióxido de nitrógeno,

titanio, óxido de tungsteno.

Tabla 1.
Tabla de frecuencia para cada variable de estudio.

Variable Tipo

Temperatura Cuantitativa continua

Monóxido de Carbono Cuantitativa continua

Hidrocarburos no metano Cuantitativa Continua

Óxido de estaño Cuantitativa Continua

Dióxido de nitrógeno Cuantitativa Continua

Titanio Cuantitativa Continua

Óxido de Tungsteno Cuantitativa Continua


Figura 1.
Dataset de la calidad del aire

 Con respecto a los datos obtenidos en la variable de Monóxido de carbono (CO),

podemos apreciar que según los datos obtenidos son de tipo cuantitativa continua ya

que otorga un valor de cualquier intervalo o medición, es decir que puede haber otros

valores en medio de dos exactos.

 Con respecto a la temperatura podemos estimar de los datos obtenidos podemos ver

que es de variable Cuantitativa Continua ya que la información conseguida es de

datos con contables.

Tamaño de Muestra

Realizando la prueba piloto de (40 muestras) para hallar la desviación estándar.

Muestreo aleatorio simple (1;9357).


Cálculo del Tamaño de Muestra

370 lecturas de temperatura como mínimo se tendría que elegir para realizar este

estudio.
Ejemplo 2. Tamaño de muestra:

Realizando la prueba piloto de (40 muestras) para hallar la desviación estándar.

Muestreo aleatorio simple (1;9357).

Cálculo del Tamaño de Muestra


Tomando una segunda muestra aleatoria se obtiene nuevamente que 370 lecturas de

temperatura como mínimo se tendría que elegir para realizar este estudio.

A. Temperatura (Y)

B. Monóxido de carbono (X1)


C. Oxido de estaño (X2)
D. Óxido de tungsteno NOx (X7)

E. Concentración de NO2 (X8)


F. Óxido de tungsteno (X9)

G. Óxido de indio (X10)


H. Humedad Relativa (X11)

I. Humedad Absoluta (X12)


Capítulo III

Análisis inferencial

Las variables para revisar los siguientes:

Y: Temperatura

X1: Concentración por hora de CO en mg/m^3

X2: Óxido de estaño

X3: Concentración de hidrocarburo no metánico

X4: Concentración de benceno por hora en microg/m^3

X5: Titania

X6: Concentración de NOx

X7: Óxido de tungsteno NOx

X8: Concentración de NO2

X9: Óxido de tungsteno NO2

X10: Óxido de indio

X11: Humedad Relativa (%)

X12: Humedad Absoluta


Se paso a realizar el modelado de regresión múltiple, teniendo a la temperatura como

y y al resto de las variables con Xn.

Luego se procedió a eliminar las variables que sobrepasan el valor absoluto de 0.7,

conllevando a que solo quedaran las variables x8, x11 y x12

Para finalmente realizar la prueba de regresión con las variables sobrantes:


Por ende, el modelo muestral es: Y= 0.0006X8 – 0.34X11 + 20.83X12 + 15.44

A continuación, se pasa a comprobar si existe el modelo lineal poblacional:

PRUEBA DE LA EXISTENCIA DEL MODELO LINEAL POBLACIONAL

Formulación de Hipótesis

H0: No existe relación lineal entre la variable Y y el conjunto de X

H1: Si existe relación lineal entre las variables X y Y

Significancia

α = 0.05

Estadístico y P valor

F = 2115.8

P valor = 0.0000

Decisión

Rechazo H0

Conclusión

No todos los coeficientes del modelo son ceros, existe relación entre la temperatura y

el dióxido de nitrógeno y la humedad

PRUEBA DE HIPÓTESIS DE COEFICIENTES POBLACIONALES

Formulación de hipótesis para coeficiente B0

H0: B0=0

H1: B0≠0

Significancia
Intervalo de confianza (95%)
α=0.05 14.75 ≤ B0 ≤ 16.14
P valor

P valor (B0) = 0.00000

Decisión

Rechazo H0

Conclusión

B0≠0

Formulación de hipótesis para coeficiente B1

H0: B1=0

H1: B1≠0

Significancia Intervalo de confianza (95%)

α=0.05 0.003 ≤ B1 ≤ 0.004

P valor

P valor (B1) = 0.746

Decisión

NO Rechazo H0

Conclusión

B1=0

Formulación de hipótesis para coeficiente B2

H0: B2=0

H1: B2≠0

Significancia

α=0.05 Intervalo de confianza (95%)

P valor -0.35 ≤ B2 ≤ -0.33

P valor (B2) = 0.00000

Decisión
Rechazo H0

Conclusión

B2≠0

Formulación de hipótesis para coeficiente B3

H0: B3=0

H1: B3≠0

Significancia

α=0.05

P valor Intervalo de confianza (95%)

19.6 ≤ B3 ≤ 21.9
P valor (B3) = 0.00000

Decisión

Rechazo H0

Conclusión

B3≠0

 Interprete el error estándar o típico del modelo e Interprete la bondad de ajuste del

modelo (R^2 ajustado)

Interpretación del error típico: Los valores recopilados de la temperatura se encuentran

alejados del valor real en 1.0694 unidades.

Interpretación de r2 ajustado: La variación de la emisión de la temperatura es explicado


por las variables independientes del modelo en 94.50%.

Capítulo IV

Conclusiones

 Para concluir, a través de un análisis exhaustivo y estudio sobre lo más relevante,

pudimos concluir lo siguiente:

 En cuanto a los objetivos propuestos, este estudio identifica todos los conocimientos

adquiridos durante la estadística inferencial determinando tamaños de muestra,

pruebas estadísticas, paramétricas y no paramétricas entre otros.

 Los datos como muestras aleatorias son una cantidad significativa de los agentes

contaminantes, ya que nos permitieron crear hipótesis y generar soluciones con un

rango mínimo de error.

 Podemos estimar de los datos obtenidos, que es de variable Cuantitativa Continua ya

que la información conseguida es de datos contables.

 Por otro lado, según Galloza y Ponce (2022) en el trabajo “Contaminación por

partículas PM10 y su relación con la temperatura y la humedad relativa en la ciudad

de Trujillo, La Libertad 2021”, manifiesta que en la Av. Jesús de Nazareth las

variaciones de temperatura tienen una relación inversa con la humedad relativa puesto

que sus coeficientes de la humedad relativa y la temperatura fueron de -0.243 y el

nivel de correlación del presente trabajo de la temperatura con la humedad relativa

fueron de -0.348 con una significancia de 0.05

Recomendaciones

 En la recolección de datos, considerar únicamente datos estadísticos de fuentes

confiables para evitar informaciones erróneas.

 Evitar incluir datos muy antiguos para obtener análisis y resultados más actualizados

y relacionados a la situación actual; dentro del contexto Ambiental.


Referencias

A.M, H., & Guerrero, O. (s.f.). Informe del Estado de la Calidad del Aire en

Colombia 2011 - 2015. Obtenido de http://www.ideam.gov.co/web/contaminacion-y-

calidad-ambiental/informes-del-estado-de-la-calidad-del-aire-en-colombia?
p_p_id=110_INSTANCE_3uZc3mUViyRu&p_p_lifecycle=0&p_p_state=normal&p_

p_mode=view&p_p_col_id=column-

1&p_p_col_count=1&_110_INSTANCE_3uZc3mUV

Galloza, D. y Ponce L. (2022). Contaminación por partículas PM10 y su

relación con la temperatura y la humedad relativa en la ciudad de Trujillo, La

Libertad. 2021. Trujillo, Universidad Privada del Norte. Obtenido de

https://repositorio.upn.edu.pe/bitstream/handle/11537/30806/Galloza%20Romero%2c

%20Diego%20Alonso-Ponce%20Gamboa%2c%20Lizbeth%20Paola.pdf?

sequence=1&isAllowed=y

OMS. (2005). Guias de calidad de la OMS. Obtenido de

https://www.google.com/url?

sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwiRsLT

Lvaz6AhX5JrkGHa2rD44QFnoECA0QAQ&url=http%3A%2F

%2Fwhqlibdoc.who.int%2Fhq

%2F2006%2FWHO_SDE_PHE_OEH_06.02_spa.pdf&usg=AOvVaw2T_GK-

IUqs5exI_rMl4n5u

World Health Organization: WHO. (2018, May 2). Calidad del aire y salud.

Who.int; World Health Organization: WHO. https://www.who.int/es/news-room/fact-

sheets/detail/ambient-(outdoor)-air-quality-and-health

esdamim. (n.d.). 6.1.3 Evolución de la calidad del aire en las principales áreas

urbanas y cumplimiento de la normativa ECA. ESDA | Estudio de Desempeño

Ambiental. https://www.minam.gob.pe/esda/6-1-3-evolucion-de-la-calidad-del-aire-

en-las-principales-areas-urbanas-y-cumplimiento-de-la-normativa-eca/

También podría gustarte