Está en la página 1de 23

UNIVERSIDAD TÉCNICA DE MANABÍ

FACULTAD DE CIENCIAS MATEMÁTICAS


FISICAS Y QUÍMICAS

PROYECTO

TEMA:

CALIDAD DEL AIRE.CONCENTRACIÓN REAL DE BENCENO EN


PROMEDIO POR HORA EN MICROG / M ^ 3 NIVEL DE CARRETERA,
DENTRO DE UNA CIUDAD ITALIANASIGNIFICATIVAMENTE
CONTAMINADA Y SU IMPACTO AL MEDIO AMBIENTE

AUTOR:

MARLON ALEJANDRO SANTANA MACÍAS

PROFESOR GUÍA:

ING. JOSÉ VICENTE SALAZAR VÉLEZ Mg

PARALELO "D"

PERÍODO ACADÉMICO:

ABRIL 2019 – AGOSTO 2019

PORTOVIEJO – MANABÍ – ECUADOR

2019-2020
UTM

TEMA:

CALIDAD DEL AIRE.CONCENTRACIÓN REAL DE BENCENO EN


PROMEDIO POR HORA EN MICROG / M ^ 3 NIVEL DE CARRETERA,
DENTRO DE UNA CIUDAD ITALIANASIGNIFICATIVAMENTE
CONTAMINADA Y SU IMPACTO AL MEDIO AMBIENTE

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

PRESENTACIÓN

En el siguiente proyecto redactaremos sobre el tema de Calidad del Aire. Concentración


real de benceno en promedio por hora en microg / m ^ 3 nivel de carretera, dentro de una
ciudad italiana significativamente contaminada, utilizando los procesos aprendidos en la
clase de Estadística Aplicada en la cual ordenaremos los datos recolectados, ubicaremos
en tablas de frecuencia, y calcularemos ciertos parámetros la cual nos ayudaran a estudiar
el comportamiento de la variable de estudio para así poder llegar a unas conclusiones
claras y precisas.

La base de datos a utilizar, consta de 15 variables, debido a su amplitud me limito a


trabajar con 100 datos de la variable cantidad de benceno en promedio por hora en
microgramo/m^3.

Esperando satisfacer las necesidades del proyecto y cumplir con mis objetivos de estudio
de la variable, realizo una serie de procedimientos estadísticos para el análisis cuantitativo
de dicha variable y estudiar su comportamiento.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

ANTECEDENTES DEL TEMA

Desde ya hace un tiempo relativamente corto, hemos venido escuchando sobre la


contaminación ambiental, el tema se disparó al momento de incrementar las industrias
fabricantes de productos que mejoraban la calidad de vida humana, describiéndolo
sencillamente como globalización.

Este tema maneja una disyuntiva muy extensa pues, por un lado, la globalización ayuda
a mejorar el estilo de vida de las personas, objetivo que se ha buscado por muchos años.
Por el otro extremo está la parte donde salvar el planeta es más importante que nuestra
propia comodidad.

En las últimas décadas se han podido llegar a un punto medio aparentemente, donde se
fabrican productos que mejoran el estilo de vida a un nivel relativamente bajo de
contaminación ambiental, reduciendo en cierta parte el daño que se ha producido al
planeta.

Nosotros como seres humanos también formamos parte del medio ambiente lo que
significa que la contaminación ambiental también nos está perjudicando a nivel de la
salud.

Todos tenemos claro que por más formas de no contaminar al medio ambiente, ya le
hemos realizado un daño la cual será muy difícil de revertir a lo largo del tiempo, un sin
número de elementos químicos han sido tirados al medio ambiente, y es por esta razón la
cual realizamos esta investigación científica. Nos llamó bastante la atención el compuesto
del benceno y por ese motivo lo analizaremos a lo largo de este documento.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

INTRODUCCIÓN

En este proyecto investigativo, deseamos determinar la cantidad de benceno que se


encuentra en las carreteras de una ciudad italiana en el periodo de 10/03/2004 hasta
21/04/2004 la cual mediante procesos estadísticos analizaremos y deduciremos cuanto
daño puede esto causar al medio ambiente. La base de datos total describe un sin nuero
de variables con elementos químicos describiendo a continuación las variables con las
que cuenta dicha base de datos, sin antes resaltar que nuestra variable de estudio es la
concentración real de benceno promediada por hora en Microg/m^3.

1. Fecha (DD / MM / YYYY) 2. Tiempo (HH.MM.SS)

4. PT08.S1 (óxido de estaño) respuesta


3. Concentración de CO real promediada por
promediada por hora del sensor
hora en mg / m ^ 3 (analizador de referencia)
(nominalmente orientada a CO)

5. Concentraciones de hidrocarbonos no 6. Concentración real de benceno


metálicas promediadas verdaderas por hora promediada por hora en microg / m ^ 3
en microg / m ^ 3 (analizador de referencia) (analizador de referencia)

7. PT08.S2 (titanio) respuesta promedio del


8. Concentración real promedio de NOx por
sensor por hora (nominalmente NMHC
hora en ppb (analizador de referencia)
apuntada)

9. PT08.S3 (óxido de tungsteno) respuesta 10. Concentración real promediada de NO2


promedio del sensor por hora (nominalmente por hora en microg / m ^ 3 (analizador de
NOx apuntada) referencia)

11. PT08.S4 (óxido de tungsteno) respuesta 12. PT08.S5 (óxido de indio) respuesta
promediada por hora del sensor promediada por hora del sensor
(nominalmente NO2 apuntada) (nominalmente O3 objetivo)

13. Temperatura en ° C 14. Humedad Relativa (%)

15. AH Humedad absoluta

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

OBJETIVO GENERAL

Analizar la concentración real de benceno en promedio por hora en microgramo/m^3 a


nivel de carretera, dentro de una ciudad italiana significativamente contaminada.

OBJETIVOS ESPECÍFICOS

 Aplicas reglas para la construcción de tablas de distribución de frecuencias.


 Detallar procesos a través de cálculos estadísticas para el análisis de la
concentración real del benceno en promedio por hora en microgramo/m^3.
 Elaborar gráficas para la interpretación de la variable de estudio.
 Determinar efectos para la cual la variable de estudio pueda ser perjudicial para
la salud.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

MARCO TEÓRICO

LA ESTADÍSTICA APLICADA

LA ESTADÍSTICA COMO CIENCIA

La Estadística es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la


ciencia de los datos.

La Estadística es fundamental para muchas ramas de la ciencia desde la medicina a la


economía. Pero, sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos
que se obtienen de la investigación científica. Es necesario leer e interpretar datos, producirlos,
extraer conclusiones, en resumen, saber el significado de los datos. Es por lo tanto una
herramienta de trabajo profesional.

El objetivo fundamental de la estadística es obtener conclusiones de la investigación empírica


usando modelos matemáticos. A partir de los datos reales se construye un modelo que se confronta
con estos datos por medio de la Estadística. Esta proporciona los métodos de evaluación de las
discrepancias entre ambos. Por eso es necesaria para toda ciencia que requiere análisis de datos y
diseño de experimentos.

La estadística la podemos dividir en dos ramas. La estadística descriptiva la cual nos ayuda a
recolectar y tener una descripción de los datos. Por otro lado, está la estadística aplicada, donde
utilizamos los datos descritos en la estadística descriptiva y así analizarlos para tomar desiciones.

VARIABLES ESTADÍSTICAS

Se entiende por variable estadística al símbolo que representa al dato o carácter objeto de
nuestro estudio de los elementos de la muestra y que puede tomar un conjunto de valores.

De ahí que normalmente se clasifiquen en:

Caracteres cuantitativos: aquellos que toman valores numéricos. Por ejemplo, la altura o la
velocidad de un móvil.

Caracteres cualitativos: también llamados atributos, son aquellos que no podemos


representar numéricamente y describen cualidades. Por ejemplo, un color o el estado civil.

Aunque existen algunas diferencias, el tratamiento para ambos casos es similar, pudiéndose
asignar, en muchas ocasiones, valores numéricos a los diferentes caracteres cualitativos.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

DISTRIBUCIONES DE FRECUENCIAS

Una tabla de distribución de frecuencia, es un espacio donde se resumen los datos de manera
que se pueda ver de una vista general. Cuantas veces se repiten, su frecuencia absoluta, frecuencia
relativa y su porcentaje que más adelante es útil para realizar graficas de pastel, de barras, entre
otros tipos de gráficos que se pueden interpretar con aquellos datos obtenidos.

Cada variable tiene su propia tabla de distribución de frecuencias y dependiendo de cada tipo
de variable se puede realizar ciertos tipos de gráficas.

GRÁFICAS ESTADISTICAS

Toda gráfica estadística, sale de una tabla de frecuencia, es el punto clave para poder
interpretar correctamente la variable y lo que nos puede tranmitir los resultados para una toma de
decisiones. Adjuntado a la gráfica, se le añade un análisis, la cual interpreta verbalmente lo que
la gráfica quiere transmitir. Existen distintos tipos de gráfica estadísticas, sin embargo las mas
utilizadas son las siguientes:

GRÁFICO DE BARRAS

En el gráfico de barras, los datos se representan por medio de rectángulos de igual base sobre
el eje de conceptos; en tanto que la longitud del otro lado corresponde al valor del dato, según la
escala utilizada en el eje de valores. Cuando se grafica más de una categoría existen diferentes
modalidades de presentación.

Ilustración 1

GRÁFICA DE LINEAS

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

En este tipo de gráfico se presenta un solo indicador simbolizado por una curva que une a la serie
de valores que muestran las variaciones de un fenómeno a través de un determinado período.
Ejemplo:

Ilustración 2

GRÁFICO DE ÁREAS O FRANJAS

A este tipo de gráfico también se le llama gráfico de partes componentes, se le utiliza para
mostrar las diferentes partes que integran un total, al igual que las variables que se dan entre los
componentes y el total.

Al concluirse el diagrama, la última curva representa el gran total o sea los valores acumulados
en las partes componentes que lo integran. Finalmente, el área comprendida entre una curva y
otra se deben diferenciar mediante distintos colores o tonos.

Ilustración 3

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

GRÁFICO DE PYE O DE TORTA

Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho,
en forma de porcentajes sobre un total.

Ilustración 4

GRÁFICA DE OJIVAS POLIGONO DE FRECUENCIA E HISTOGRAMA

Estas tres gráficas son bien parecidas, la diferencia de cada una de ellas es la forma que se le
puede dar al final. El histograma es la base para desarrollar las siguientes dos gráficas. Una
característica es que histograma, el polígono y la ojiva son utilizados para representar la variable
continua; los diagramas de frecuencia, para la variable discreta.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

HISTOGRAMA

Ilustración 5

POLÍGONO DE FRECUNECIA

Ilustración 6

GÁRAFICO DE OJIVA

Ilustración 7

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

MEDIDAS DE CENTRALIZACIÓN

MEDIA ARITMÉTICA

La media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total
por el número de observaciones que hay en el grupo.

Ilustración 8

MEDIANA

Ordenando los datos, es el que ocupa el “lugar” central, quedando la mitad de los datos
a la derecha y la mitad a la izquierda. Cuando los datos son pares o impares se realiza un
pequeño cambio en formulas para calcular la posición de la mediana

Ilustración 9

Ilustración 10

MODA

La moda es el dato que mas se repite que no puede ser un único valor con una frecuencia
mayor.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

CUARTILES

Son valores de la variable que dividen los datos ordenados en cuartos; cada conjunto de
datos tiene tres cuartiles. El primer cuartil Q1, es un número tal que a lo sumo 25% de los datos.
El segundo cuartil es la mediana (50%). El tercer cuartil Q3 es un npumero tal que a lo sumo
75%de los datos

Ilustración 11

DECILES

Son valores de la variable que dividen los datos ordenados en diez partes iguales (9
divisiones)

Ilustración 12

PERCENTILES

Son los valores de la variable que dividen un conjunto de datos clasificados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil Pk y a lo
sumo (100 -k) % de los datos son mayores.

Ilustración 13

DESVIACIÓN MEDIA

Mide la desviación promedio de valores con respecto a la media del grupo, sin tomar en
cuenta el signo d ella desviación. Se obtiene al restar la media de cada valor del grupo,
eliminando el signo ( + o - ) de la desviación, hallando después el promedio

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

Ilustración 14

RANGO INTERCUARTÍLICO

El rango intercuartílico IQR (o rango intercuartil) es una estimación estadística de la dispersión


de una distribución de datos. Consiste en la diferencia entre el tercer y el primer cuartil. Mediante
esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es
altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que
este estadístico es insensible a posibles irregularidades en los extremos).

Ilustración 15

DESVIACION TÍPICA O ESTANDAR

La desviación estándar se basa en la media como punto de referencia y procede a tomar


en consideración la magnitud y la ubicación de cada puntuación. Cuán desviado o separado está
cada puntuación respecto a la media.

Ilustración 16

VARIANZA

La varianza de una muestra se calcula casi en la misma forma que la desviación media, con
dos pequeñas diferencias: 1) las desviaciones se elevan al cuadrado antes de ser sumadas y, 2) se
obtiene el promedio, utilizando n -1 en lugar de n.

Ilustración 17

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

PROCESO METODOLOGICO PARA LA RECOLECCIÓN DE DATOS

El conjunto de datos contiene 9358 instancias de respuestas promediadas por hora de


un conjunto de 5 sensores químicos de óxido metálico incrustados en un dispositivo
multisensor químico de calidad del aire. El dispositivo estaba ubicado en el campo en un
área significativamente contaminada, a nivel de carretera, dentro de una ciudad italiana.
Los datos se registraron desde marzo de 2004 hasta febrero de 2005 (un año), lo que
representa las grabaciones de mayor libertad disponibles en el campo de las respuestas de
los dispositivos sensores de calidad química del aire. Las concentraciones promediadas
por hora de Ground Truth para CO, hidrocarburos no metánicos, benceno, óxidos de
nitrógeno totales (NOx) y dióxido de nitrógeno (NO2) fueron proporcionados por un
analizador de referencia de ubicación conjunta. Las evidencias de sensibilidades
cruzadas, así como las desviaciones tanto del concepto como del sensor, están presentes
como se describe en De Vito et al., Sens. And Act. B, vol. 129,2, 2008 (cita requerida)
eventualmente afectando las capacidades de estimación de concentración de sensores.
Los valores que faltan se etiquetan con valor -200.

En esta investigación debido a la extensa cantidad de variables y de datos recolectados,


trabajaremos solamente 1000 datos de la variable “concentración real de benceno en
promedio por hora en microg / m ^ 3 “. Otro punto muy importante a considerar es que
no utilizaremos datos faltantes, estos seran omitidos y remplazados con valores de la base
de datos de la misma variable.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

ORDENAMIENTO DE LOS DATOS ESTADISTICOS

No C6H6(GT) 41 8,2
1 1 42 8,3
2 1,1 43 8,6
3 1,1 44 8,6
4 1,3 45 8,6
5 1,6 46 8,8
6 1,7 47 9
7 1,8 48 9,2
8 1,9 49 9,2
9 2,3 50 9,4
10 2,4 51 9,5
11 2,5 52 9,6
12 2,6 53 9,7
13 2,6 54 10,2
14 2,9 55 10,2
15 3,2
56 10,6
16 3,3
57 10,7
17 3,6
58 10,9
18 3,7
59 10,9
19 4,1
60 11
20 4,2 81 14,3
61 11
21 4,4 82 14,7
62 11,2
22 4,7 83 15,1
63 11,5
23 4,7 84 15,5
64 11,6
24 5 85 16,1
65 11,7
25 5,1 86 17,9
26 5,2 66 11,8
87 18,2
27 5,2 67 11,9
68 11,9 88 18,3
28 5,4 89 19,2
29 5,4 69 11,9
70 12 90 19,3
30 5,9
71 12,2 91 19,6
31 6,2
72 12,3 92 20,1
32 6,3
73 12,7 93 20,6
33 6,4
34 6,4 74 12,8 94 20,8
35 6,5 75 12,8 95 21,8
36 7,3 76 12,9 96 22,1
37 7,4 77 13,1 97 23,1
38 7,5 78 14 98 24
39 7,5 79 14 99 27,4
40 8 80 14,2 100 32,6

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

APLICACIÓN DE LAS REGLAS PARA LA GENERACIÓN DE LA TABLA


DE DISTRIBUCIÓN DE FRECUENCIA

fi hi % FI HI % AC
[0 - 4,95] 23 0,23 23 23 0,23 23
(4,95 - 8,90] 23 0,23 23 46 0,46 46
(8,90 - 12,85] 29 0,29 29 75 0,75 75
(12,85 - 16,80] 10 0,1 10 85 0,85 85
(16,80 - 20,75] 8 0,08 8 93 0,93 93
(20,75 - 24,70] 5 0,05 5 98 0,98 98
(24,70 - 28,65] 1 0,01 1 99 0,99 99
(28,65 - 32,60] 1 0,01 1 100 1 100
Total 100 1 100

 Al ser una variable continua primero determinamos el rango con el que se va a trabajar
que se encuentra restando su límite superior menos el límite inferior
 Calculamos la marca de clase con su fórmula K= 1+3.32*log10(n) dándonos como
resultado 7.64 y redondeando a 8.
 De ahí se obtiene la frecuencia absoluta que es la repetición de cada uno de los datos en
el ancho de clase y la suma de esta debe resultarnos el numero de datos que tenemos
recopilados
 La frecuencia relativa se la obtiene de dividir cada uno de los valores de la frecuencia
absoluta con el total de datos y la suma de esta debe ser igual a 1.
 Una vez habiendo obtenido la frecuencia relativa es multiplicada por 100 y así se obtiene
el porcentaje
 La frecuencia absoluta acumulada, es la suma consecutiva de la frecuencia absoluta y su
ultimo valor debe coincidir con el número de datos
 La frecuencia relativa acumulada se la obtiene de la suma consecutiva de su frecuencia
relativa y su ultimo valor debe coincidir con el total de frecuencia relativa.
 El porcentaje acumulado, al igual que las otras frecuencias acumuladas, se obtiene de la
suma de sus porcentajes relativamente, teniendo como ultimo valor el 100%.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

APLICACIÓN DE LAS FORMULAS PARA EL CALCULO DE LOS


ESTADÍSTICOS

Media 10,09
Mdiana 9,45
Moda 11
Cuartil 1 5,175
Cuartil 2 9,45
Cuartil 3 12,82
Rango 31,6
rango intercuartílico 7,645
desviacion media 4,97128
rango percentil 10 - 90 15,12
desviación estandar 6,38
varianza 40,82

Media: Es la suma de todos los datos dividida para el numero de datos

Media= 1008,8/ 100 esto es igual a 10.09


Mediana: Es el percentil 50, en la mitad de todos los datos
Moda: Es el valor que más se repite y toma el valor de 11
Cuartil 1: Es igual a la posición (n+1)/4, se obtuvo un valor de 5.175
Cuartil 2: Es igual a la mediana dividiendo una posición N/2 que da un resultado de 9.45
Cuartil 3: Es igual a la posición 3(n+1)/4 da un valor de 12.82

Rango: Es igual al límite superior menos el límite inferior, se obtuvo un valor de 7.65

Varianza: la podemos describir como

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

GRÁFICAS

HISTOGRAMA DE FRECUENCIA

POLIGONO DE FRECUENCIA

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

CONCLUSIONES

En esta investigación, pudimos aplicar las reglas para la construcción de tablas de


frecuencias, detallando a traves de los calculos estadístico como se comportaba la variable
de estudio.

Existe una gran concentración de benceno en el area, lo que sin duda alguna es
perjudicial para la salud. Al haber gran cantidad de benceno, se puede decir que el área
es bin traficada por los vehiculos, pudiendo ser alguna solución un mayor control al estado
mecanico de los mismos.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

RECOMENDACION

 Se debería buscar información con mayor detenimiento, puesto que es muy


complicado conseguir bases de datos que satisfagan con una investigación
 De pronto alguna capacitación hacia los alumnos sobre la búsqueda de bases de
datos en internet para evitar que pierdan tiempo buscando en sitios donde no
encontrarán la información adecuada.

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

BIBLIOGRAFÍA

Abad , P., & Huapaya, E. (2009). Gía para la presentación de gráficos estadísticos. Centro de
investigación y desarrollo. Obtenido de
https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf

Arteaga, B. (21 de Enero de 2009). Descripci´pon de una variable: Medidas de localización.


Obtenido de Descripci´pon de una variable: Medidas de localización:
http://halweb.uc3m.es/esp/Personal/personas/imolina/MiDocencia/Estadistica_INFD
OC/Tema3DescripUnaVar_MLocal.pdf

Castillo, O. (2009). Estadística Módulo 1. Obtenido de Estadística Módulo 1:


http://www.alejandrogonzalez.com.ar/archivos/librodecalidad-estadisticaaplicada.pdf

Gorgas García, J., Cardiel López, N., & Zamorano Calvo, J. (2011). Estadística básica para
estudiantes de ciencias. Obtenido de
http://webs.ucm.es/info/Astrof/users/jaz/ESTADISTICA/libro_GCZ2009.pdf

Molinero, L. (2012). Rango intercuartílixo. Obtenido de Rango intercuartílixo:


https://www.alceingenieria.net/bioestadistica/presdatos.pdf

Pascuzzo, A. (15 de Abril de 2019). Histogramas, Polígonos de Frecuencia y Ojivas. Obtenido de


Histogramas, Polígonos de Frecuencia y Ojivas:
http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-frecuencia-y.html

Universidad Militar nueva Granada. (2016). Ojivas o Polígono Porcentual Acumulado. Nueva
Granada. Obtenido de
http://virtual.umng.edu.co/distancia/ecosistema/ovas/administracion_empresas/esta
distica_i/unidad_1/medios/documentacion/p5h3.pdf

Universidad nacional de Callao. (12 de Abril de 2017). Medidas de centralización. Obtenido de


Medidas de centralización:
https://unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investiga
cion/IF_JUNIO_2012/IF_CALDERON%20OTOYA_FCA/capitulo%203.pdf

Vilchis, M. (Abril de 2014). Cuartiles, deciles y percentiles. Obtenido de Cuartiles, deciles y


percentiles:
http://cvonline.uaeh.edu.mx/Cursos/Lic_virt/Mercadotecnia/DMKT010/Unidad%203/
3.5_cuartiles.pdf

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.
UTM

ANEXOS

Lo mejor que se puede compartir es el conocimiento.


Alain Ducasse.

También podría gustarte