Está en la página 1de 40

Tema:

Estadística inferencial para el estudio


de la contaminación y control de la
calidad del aire
Tecnologías de
Tratamiento de la
Contaminación
Atmosférica
Semana N° 12
OBJETIVOS

• Conocer y aplicar los fundamentos de las herramientas estadísticas aplicadas al estudio


de la contaminación y control de la calidad del aire.
SITUACIÓN PROBLEMÁTICA

¿ Para qué sirve la estadística en el tema de


contaminación atmosférica?

 Para descubrir patrones -> Estadística descriptiva o deductiva

 Para confirmar una hipótesis -> Estadística inferencial o inductiva


INTERÉS – Veamos el siguiente video

https://www.youtube.com/watch?v=9ZdWcT7eiUs
Inferencia Estadística
Inferencia Estadística
Inferencia Estadística
Inferencia Estadística

Etapas de un estudio estadístico


Inferencia Estadística
Inferencia Estadística
Inferencia Estadística

Prueba de Hipótesis
Se denomina hipótesis estadística a cualquier afirmación, conjetura o
suposición que se hace acerca de la distribución de una o más poblaciones.
La hipótesis estadística consisten en suponer que los parámetros que
definen a la población, toman determinados valores numéricos.

Es el error que se comete al rechazar una hipótesis nula (H0),cuando ésta es


realmente verdadera. La probabilidad de cometer un error de tipo I se denota por α.

Es el error que se comete al aceptar una hipótesis nula (H0), cuando en realidad es
falsa. La probabilidad de cometer un error de tipo I se denota por β.
Inferencia Estadística

Pasos para realizar una Prueba de Hipótesis


Inferencia Estadística

Prueba de Hipótesis utilizando el “p-valor” con el programa SPSS

La prueba de hipótesis se puede realizar, utilizando el: (p-valor), obtenido


de un programa estadístico, por ejemplo el SPSS.

El p-valor (p) es el mínimo nivel de significancia de la Prueba para el cual


los datos indican que se tendría que rechazar la hipótesis nula.
Inferencia Estadística

Ejemplo: Los siguientes valores son los niveles de colesterol (mg/dl) de una muestra de 12 pobladores
que habitan en una localidad de la sierra.
184 150 178 157 194 163 144 114 178 152 118 160
¿Puede concluirse que la media de los niveles de colesterol en la población de la que se extrajo la
muestra es diferente de 165 mg/dl? Utilice un nivel de significación de 0.05. Suponga que los niveles de
colesterol siguen una distribución normal.
Solución:
Dato,
n=12
Sea μ: Media de los niveles de colesterol en la población.
Inferencia Estadística

Prueba de Hipótesis:
Ho: La media de los niveles de colesterol es igual a 165 → Ho: μ=165
Ha: La media de los niveles de colesterol es diferente a 165 → Ha: μ≠ 165

Decisión: El p-valor 0,323 > 0,05 por lo que se acepta la hipótesis nula.

Conclusión: Se concluye que la media de los niveles de colesterol es igual de a 165.


Inferencia Estadística

• Distribución Normal:
La distribución normal es una distribución con forma de campana
donde las desviaciones estándar sucesivas con respecto a la media
establecen valores de referencia para estimar el porcentaje de
observaciones de los datos. Estos valores de referencia son la base
de muchas pruebas de hipótesis, como las pruebas Z y t.
Inferencia Estadística
Inferencia Estadística

Ejemplo: Una surtidora automática Volumen



fue utilizada para llenar envases con envasado (ml)
16 ml de un medicamento y 1 16.00
mediante un muestreo aleatorio se 2 15.90
seleccionaron 8 frascos y se les midió 3 15.97
el volumen envasado, encontrándose 4 16.04
los resultados siguientes de la tabla 5 16.05
mostrada. 6 15.98
Se quiere saber si la variable volumen 7 15.96
envasado se distribuye normalmente. 8 16.02
Inferencia Estadística

Prueba de Hipótesis:
Ho: Los datos analizados siguen una distribución normal
Ha: Los datos analizados no siguen una distribución normal

Decisión: El p-valor 0,767 > 0,05 por lo que se acepta la hipótesis nula.

Conclusión: Se concluye que los datos analizados siguen una distribución normal.
Inferencia Estadística

• Pruebas de Significación Estadística:


Existen dos grandes grupos de pruebas de significación
estadística, el referido a las paramétricas y el relacionado con las
no paramétricas con rasgos distintivos que las caracterizan.

Las pruebas paramétricas están sometidas a determinadas


condiciones de aplicación, normalmente: normalidad,
homocedasticidad e independencia (Tejedor, 1999).

Las pruebas no paramétricas no están sometidas a determinadas


condiciones de aplicación y son, pues, adecuadas cuando se
incumple alguno de los criterios previstos para las pruebas de
significación de tipo paramétrico.
Inferencia Estadística
Análisis de Varianza (ANOVA)
Análisis de Varianza (ANOVA)
Análisis de Varianza (ANOVA)

TIPOS DE MODELO
Los modelos de diseños de experimentos según la selección de tratamientos y los efectos de los
factores, pueden ser:
Análisis de Varianza (ANOVA)

DISEÑOS BÁSICOS
Los diseños básicos y de uso común en trabajos de investigación son los siguientes:

1. Diseño Completamente al Azar: En este diseño solamente se estudia el efecto de un factor, el cual
se varía en diferentes tratamientos o niveles, por eso al diseño completamente aleatorio también se le
llama diseño unifactorial o de clasificación de un solo criterio.

2. Diseño de Bloque Completamente al Azar: Es aquel diseño en que las unidades experimentales
sobre las que se toman las medidas se asignan al azar a los diferentes niveles de tratamientos y bloques,
donde los bloques son subgrupos homogéneos con relación a la variable exógena cuyos efectos se desea
eliminar.

3. Diseño Cuadrado Latino: Es una ampliación del diseño bloque completamente al azar. Este diseño
se usa frecuentemente en experimentos agrícolas e industriales. Este diseño permite al investigador
delimitar, con toda seguridad, los efectos relativos de varios tratamientos, cuando se impone a las
unidades experimentales una restricción del tipo doble bloqueo.
Análisis de Varianza (ANOVA)

ANOVA unifactorial (un factor)


Análisis de Varianza (ANOVA)

ANOVA unifactorial (un factor)

El ANOVA de un factor se utiliza para contrastar la hipótesis de


que existen diferencias entre las medias para una variable
dependiente cuantitativa respecto a una única variable
independiente conocida como factor.

Cuando se requiere analizar un factor a más de dos niveles o


tratamientos, el método de Diseño Completamente al Azar
(DCA), es uno de los más sencillos que se pueden realizar, ya que
sólo se consideran dos fuentes de variabilidad: los tratamientos y
el error aleatorio. En este diseño solamente se estudia el efecto de
un factor, el cual se varía en diferentes tratamientos o niveles, por
eso al diseño completamente aleatorio también se le llama diseño
unifactorial o de clasificación de un solo criterio.
Análisis de Varianza (ANOVA)

Ejemplo: Se obtuvieron las concentraciones atmosféricas de SO2 (en ppm) provenientes de 5 muestreadores
localizados a diferentes distancias (aleatoriamente asignadas), de una fuente industrial emisora.

Factor (X): Número de muestreador. Niveles: 1, 2, 3, 4 y 5


Variable respuesta (Y): Concentración de SO2 (ppm)
Realice un análisis de varianza para este experimento.
Análisis de Varianza (ANOVA)

ANOVA multifactorial
Análisis de Varianza (ANOVA)

ANOVA multifactorial
Análisis de Varianza (ANOVA)

ANOVA multifactorial
Análisis de Varianza (ANOVA)

Diseños Factoriales
El objetivo de un diseño factorial es estudiar el efecto de varios
factores sobre una o varias respuestas, cuando se tiene el mismo
interés sobre los factores. Para estudiar la manera en la que
influye cada factor sobre la variable respuesta, es necesario elegir
al menos dos niveles de prueba para cada uno de ellos.

Cualitativos

Factores

Cuantitativos

Niveles
Análisis de Varianza (ANOVA)

Diseños Factoriales
Algunos casos particulares de uso frecuente son: el factorial 22, el
factorial 32 y el factorial 3x2. Los diseños factoriales que
involucran menos de cuatro factores por lo regular se corren
replicados para tener la potencia necesaria en las pruebas
estadísticas sobre los efectos de interés. Si se hacen n réplicas, el
número total de corridas experimentales es n(axb).

Ventajas de los diseños factoriales


Diseño de Experimentos (DOE)

El diseño de experimentos (DOE) es una técnica que


consiste en realizar una serie de experimentos en los que
se inducen cambios en las variables de un proceso, de
manera que es posible observar e identificar las causas de
los cambios en la respuesta de salida.

Variables de entrada
Variables de salida
Proceso Yi
Xi

Con esta técnica se puede conseguir, por ejemplo, mejorar


el rendimiento de un proceso.
Diseño de Experimentos (DOE)

PROCESO DE CRECIMIENTO FACTORES CONTROLABLES:


BACTERIANO  Velocidad de agitación
 Temperatura del medio
 pH del medio
 Flujo de alimentación
 Concentración de Oxigeno disuelto
 Concentración de sustratos
FACTORES NO CONTROLABLES:
 Temperatura ambiental
 Proveedor de sustrato (calidad)
 Día de producción
 Experiencia del operador
VARIABLE DE RESPUESTA:
 Rendimiento (Densidad Óptica)
 Peso seco
Diseño de Experimentos (DOE)

Ejemplo: Un fabricante de pintura de látex para interiores (marca A) quisiera demostrar que su pintura es más
robusta para el material donde se aplica, que la de sus 2 competidores más cercanos. La respuesta es el tiempo,
en años, hasta que comienza a picarse. El estudio incluye las 3 marcas de pintura y 3 materiales seleccionados al
azar. Para cada combinación se utilizan 2 piezas. Analice los datos usando el modelo apropiado. ¿Los datos apoyan
la afirmación del fabricante dela marca A?
APRENDIZAJE

1. ¿Qué ventajas nos proporcionan los diseños factoriales aplicados al estudio de la contaminación y
control de la calidad del aire?

2. ¿Cuáles son los controles que permiten evaluar resultados confiables?


Taller N°12
Un ingeniero está diseñando un batería que se usará en un dispositivo que se someterá a
variaciones de temperatura extremas. Se quiere estudiar los efectos que tiene el Tipo de material
y la Temperatura sobre la vida de la batería y ver si existe algún material que produzca una vida en
la batería más larga independientemente de la temperatura.

Factor A: Tipo de material: Niveles: 1,2 y 3


Factor B: Temperatura: Niveles (°F): 15, 70 y 125
Variable de Respuesta (horas): Tiempo de vida
CONCLUSIONES

• Es muy importante la confiabilidad de los resultados para el proceso de control


de calidad, debido a que esta información es vital para la toma de decisiones.

• Para asegurar la confiabilidad de los resultados debemos de demostrar


estadísticamente la veracidad y la precisión de los datos.
Gracias

También podría gustarte