Está en la página 1de 12

UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION

FACULTAD DE INGENIERIA AMBIENTAL


PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

UNIVERSIDAD NACIONAL DANIEL


ALCIDES CARRIÓN
Programa de estudios de Ingeniería Ambiental

NOMBRE: Bruce Luis Vega Hassinger


DOCENTE: Ing. Edson Ramos Peñaloza
MATERIA: Métodos estadísticos
SEMESTRE: IV

2021
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Ejercicios 11
1. En investigaciones de toxicología existen estudios que han demostrado que la
probabilidad de qué, un fumador de 40 años de edad, quien ha sido fumador los
últimos 10 años contraiga el cáncer pulmonar en los próximos 20 años es alta
(asumiendo que continúe fumando al mismo ritmo). Esta relación va en función del
número promedio de cigarrillos que fuma. Asumir un modelo de regresión lineal. La
tabla de abajo presenta los datos de esta investigación de toxicología.
Probabilidad
N° cigarrillos
de cáncer
fumados por día
pulmonar
5 0,1
10 0,113
20 0,225
30 0,3
40 0,45
50 0,54
60 0,7
80 0,86
(a) Identificar la variable dependiente y la variable independiente.
(b) Describir la ecuación de regresión que mejor encaje en los datos.
(c)Analizar e interpretar los componentes de la tabla de ANOVA como Fcalc., Fcrítica
y el valor de p (Realizar la prueba de hipótesis).

SOLUCIÓN

a) Identificar:

Variable independiente : probabilidad de cáncer.


Variable dependiente : N° cigarrillos fumados.

b) ecuación de regresión:

Y = b o + b1 X 1 + e

c) ANÁLISIS:
Identificar el parámetro de interés.
Identificar que si un fumador tenga la probabilidad de cáncer fumando a un ritmo
constante durante 20 años.
Establecer la Hipótesis Nula H0
H0: ρ=0
No existe correlación
Especificar una Hipótesis alternativa adecuada H1
H1: ρ≠0
Si existe correlación.

Seleccionar un nivel de significancia α


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

α= 0.05
Prueba estadística a utilizar
Prueba correlacional lineal múltiple.

Calculo usando SPSS

Como podemos ver R es 0,996 que indica que existe correlación muy alta. Además,
tenemos que p=0,000<< 0,05, por tanto, rechazamos la hipótesis nula e indicamos que si
existe correlación.

Además, tenemos que p=0,000<< 0,05, por tanto, rechazamos la hipótesis nula e indicamos
que, si existe correlación entre el número de cigarrillos fumados en los próximos 20 años.
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Por lo tanto, podemos construir la ecuación de regresión que buscamos:

Y=-1,242+92,743X1
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

2. Los metales pesados como el Hg, Cr, Pb, etc., pueden interferir con el tratamiento
biológico en las plantas municipales de aguas residuales domésticas. En este estudio se
hicieron mediciones mensuales en una planta modelo de tratamiento de las
concentraciones de cromo, Cr, en mg/L, tanto en el efluente como en la entrada. Los
resultados de las concentraciones de Cr se dan en la tabla de abajo.
Entrada (X) (ug/L) 250 290 270 100 300 410 110 130 1100
Efluente (Y) (ug/L) 19 10 17 11 70 60 18 30 180
Hacer los siguientes cálculos:
(a) Hacer un diagrama de dispersión.
(b) Identificar la prueba a utilizar.
(c) Realizar la prueba de hipótesis para identificar si existe correlación en interpretar
el valor de R.

SOLUCIÓN:
ANÁLISIS:
Identificar el parámetro de interés.
Las concentraciones de Cr
Establecer la Hipótesis Nula 𝑯𝟎
𝐻0: 𝑝 = 0
No existe correlación entre la entrada y el efluente
Especificar una Hipótesis alternativa adecuada 𝑯𝟏
𝐻1: 𝑝 ≠ 0
Existe correlación entre la entrada y el efluente.
Seleccionar un nivel de significancia α
α = 0.05
Hacer los siguientes cálculos:
(a) diagrama de dispersión.

(b) Identificar la prueba a utilizar.


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

e. prueba de normalidad

En este caso el efluente es 0,037 que es menor a 0,05, rechazamos la hipótesis nula f.
Cálculos en SPSS
Prueba no paramétrica correlacional Rho de Sperman

(c) Realizar la prueba de hipótesis para identificar si existe correlación en interpretar el


valor de R.

Se usa la prueba de correlacional Rho de Sperman

𝐻0: No existe correlación entre la entrada y el efluente


𝐻1: Existe correlación entre la entrada y el efluente.

En resultado es 0.617, lo que indica una correlación moderada


Se acepta la hipótesis nula, lo que indica que no existe correlación entre la entrada y el
efluente.
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

3. Se hace un estudio sobre la concentración de cadmio atmosférico, en ppm, yi y su


relación con Xi = la altura de los muestreadores y X2 = distancia de la fuente emisora.
y (Concentración de Cd) (ppm) 193 230 172 91 113 125
X1 (Altura del muestreador) (m) 1,6 15,5 22 43 33 40
X2 (Distancia) (m) 851 816 1058 1201 1357 1115

Hacer los siguientes cálculos:


(a) Ajustar el modelo de regresión que pueda ajustar a los datos del problema de la
concentración de Cd.
(b) Validar el modelo usando enfoques de diagnóstico de estadística de inferencia. (c)
Usar el modelo de regresión lineal múltiple para predecir la concentración de cadmio,
cuando la altura del muestreador es de X1 = 25 metros y la distancia de la fuente
emisora, es X2 = 851 metros.

SOLUCIÓN

(a) Ajustar el modelo de regresión que pueda ajustar a los datos del problema de la
concentración de Cd.
Análisis de Confiabilidad de regresión lineal

ANÁLISIS:

Identificar el parámetro de interés.


Comparación de índice de concentración de cadmio atmosférico conociendo la altura de los
muestreadores y la distancia de la fuente emisora.

Establecer la Hipótesis Nula H0


H0: ρ=0
No existe correlación entre el índice de concentración de cadmio atmosférico con la altura
de los muestreadores y la distancia de la fuente emisora.

Especificar una Hipótesis alternativa adecuada H1


H1: ρ≠0
Existe correlación entre el índice de concentración de cadmio atmosférico con la altura de
los muestreadores y la distancia de la fuente emisora.

Seleccionar un nivel de significancia α


α= 0.05

Prueba estadística a utilizar


Prueba correlacional lineal múltiple.

Calculo usando SPSS

(b) Validar el modelo usando enfoques de diagnóstico de estadística de inferencia.


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Observamos que R es 0,928 el cual indica que presenta una correlación muy alta. Asimismo,
vemos que p=0,051 > 0,05 por ello aceptamos la hipótesis nula e indicamos que: No existe
correlación entre el índice de concentración de cadmio atmosférico con la altura de los
muestreadores y la distancia de la fuente emisora.
.

De la misma manera, tenemos que p=0,051 > 0,05 por ello aceptamos la hipótesis nula e
indicamos que: No existe correlación entre el índice de concentración de cadmio atmosférico
con la altura de los muestreadores y la distancia de la fuente emisora.

Utilizando las fórmulas de las ecuaciones normales a los datos obtendremos los coeficientes de
regresión o utilizando Regresión de Análisis de datos, en SPSS podemos calcular también los
coeficientes de regresión:
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Teniendo los datos podemos construir la ecuación de regresión:

𝑌 = 350,994 − 1,272 𝑋1 − 0,154 𝑋2

(c) Usar el modelo de regresión lineal múltiple para predecir la concentración de


cadmio, cuando la altura del muestreador es de X1 = 25 metros y la distancia de la
fuente emisora, es X2 = 851 metros.

Utilizaremos la ecuación de regresión:

𝑌 = 350,994 − 1,272 𝑋1 − 0,154 𝑋2

Reemplazamos:
𝑌 = 350,994 − 1,272 (25) − 0,154 (851)
𝑌 = 350,994 − 31,8 − 131,054
𝑌 = 188,14
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

4. Se discute el diseño eficiente de ciertos incineradores de desperdicios municipales, los


cuales requieren de información acerca del contenido energético de los desperdicios.
Acordemente, a algunos estudios nos proporcionaron los siguientes datos acerca de Y
= contenido energético (Kcal/Kg.), en función de regresores % de plásticos en peso, %
de papel en peso, % de basura en peso y % de humedad de peso.
Contenido
% Plástico % Papel % Basura %Humedad
Observación energético
(X1) (X2) (X3) (X4)
(Kcal/Kg) (Y)
1 18,69 15,65 45,01 58,21 947
2 19,43 23,51 39,69 43,61 1407
3 19,24 24,23 43,16 46,63 1452
4 22,64 22,2 35,76 45,85 1553
5 16,54 23,56 41,2 55,14 989
6 21,44 23,65 35,56 42,24 1162
7 19,53 24,45 40,18 47,2 1466
8 23,97 19,39 44,11 43,82 1656
9 21,45 23,84 35,41 51,01 1254
10 20,34 26,5 34,21 49,06 1336
11 17,03 23,46 32,45 53,23 1097
12 21,03 26,99 38,19 51,78 1266
13 20,49 19,87 41,35 46,69 1401
14 20,45 23,01 43,59 53,57 1223
15 18,81 22,62 42,2 52,98 1216
16 18,28 21,87 41,5 47,44 1334
17 21,41 20,47 41,2 54,68 1155
18 25,11 22,59 37,02 48,74 1453
19 21,04 26,27 38,66 53,22 1278
20 17,99 28,22 44,18 53,17 1153
21 18,73 29,39 34,77 51,06 1225
22 18,49 26,58 37,55 50,66 1237
23 22,08 24,88 37,07 50,72 1327
24 14,28 26,27 35,8 48,24 1229
25 17,74 23,61 37,36 49,92 1205
26 20,54 26,58 35,4 53,58 1221
27 18,25 13,77 51,32 51,38 1138
28 19,01 25,62 39,54 50,13 1295
29 21,25 20,63 40,72 48,67 1392
30 21,62 22,71 36,22 48,19 1372
Obtener el modelo de regresión y validarlo

SOLUCIÓN

ANÁLISIS:
Identificar el parámetro de interés.
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Comparación de contenido energético conociendo el % de plásticos en peso, % de papel en peso, % de


basura en peso y % de humedad de peso.

Establecer la Hipótesis Nula 𝑯𝟎


𝑯𝟎: r = 0
No existe correlación entre el contenido energético con la cantidad en % de plásticos en peso, %
de papel en peso, % de basura en peso y % de humedad de peso.

Especificar una Hipótesis alternativa adecuada 𝑯𝟏


𝑯𝟏: r ≠ 0
Existe correlación entre el contenido energético con la cantidad en % de plásticos en peso, % de
papel en peso, % de basura en peso y % de humedad de peso.

Seleccionar un nivel de significancia α


α= 0.05

Prueba estadística a utilizar


Prueba correlacional lineal múltiple.

Cálculo usando SPSS

Como podemos ver R es 0,851 que indica que existe correlación alta. Además, tenemos que
p = 0,000 < 0,05, por tanto, rechazamos la hipótesis nula e indicamos que, si existe
correlación entre el contenido energético con la cantidad en % de plásticos en peso, % de
papel en peso, % de basura en peso y % de humedad de peso.
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRION
FACULTAD DE INGENIERIA AMBIENTAL
PROGRAMA DE ESTUDIOS DE INGENIERIA AMBIENTAL
OXAPAMPA

Además, tenemos que p = 0,000 < 0,05, por tanto rechazamos la hipótesis nula e indicamos
que si existe correlación entre el contenido energético con la cantidad en % de plásticos en
peso, % de papel en peso, % de basura en peso y % de humedad de peso.

• Utilizando las fórmulas de las ecuaciones normales a los datos obtendremos los
coeficientes de regresión o utilizando Regresión de Análisis de datos, en SPSS
podemos calcular también los coeficientes de regresión:

• Por lo tanto, podemos construir el modelo de regresión que buscamos:


𝑌 = 1469,703 + 30,968𝑋1% + 9,941𝑋2% + 7,416𝑋3% − 26,567𝑋4%

• Entonces podemos decir que manteniendo fijas X1, X2, X3 es decir si X4 aumenta en
una unidad, el contenido energético va disminuir debido al negativo en su valor de -
26,567X4.

También podría gustarte