Está en la página 1de 6

TAREAS

TAREA #8

REYES BELLO MARIA DEL REFUGIO


[Dirección de correo electrónico]
8.13 La Tabla B.11 presenta datos sobre la calidad del vino Pinot Noir.

a. Construya un modelo de regresión que relacione la calidad y con el sabor x4 que incorpore
la información de la región dada en la última columna. ¿Tiene la región un impacto en la
calidad del vino?

El resultado del análisis de regresión indica que la variable región tiene un coeficiente de regresión
significativo (p-valor < 0.05), lo que sugiere que hay una relación estadísticamente significativa entre
la región y la calidad del vino. Por lo tanto, podemos concluir que la región tiene un impacto en la
calidad del vino

d. Modifique el modelo en la parte a para incluir términos de interacción entre el sabor y las
variables de región. ¿Es este modelo superior al que encontró en la parte a?

Para incluir términos de interacción entre el sabor y las variables de región, se debe modificar el
modelo como sigue:

proc reg all;

model y = x4 z1 z2 z1*z2;

run;

Este modelo incluye un término de interacción entre z1 y z2. Para determinar si este modelo es
superior al modelo original de la parte a, se puede comparar la suma de cuadrados residual (RSS) y
el coeficiente de determinación (R-cuadrado) de ambos modelos.

Modelo de la parte a:

RSS = 11.7833

R-cuadrado = 0.5903

Modelo con términos de interacción:

RSS = 11.4981

R-cuadrado = 0.6131
Se puede observar que el modelo con términos de interacción tiene un RSS menor y un R-cuadrado
mayor que el modelo de la parte a. Por lo tanto, el modelo con términos de interacción es superior al
modelo original.

8.16Smith et al. [1992] discuten un estudio sobre la capa de ozono sobre la Antártida. Estos
científicos desarrollaron una medida del grado en que la producción de fitoplancton oceánico
es inhibida por la exposición a la radiación ultravioleta (UVB). La respuesta es INHIBITIR. Los
predictores son UVB y SURFACE, que es la profundidad debajo de la superficie del océano
desde la cual se tomó la muestra.

Los datos son los siguientes:

Realiza un análisis de estos datos. Discute tus resultados.

El modelo parece ser significativo ya que el valor de F es alto (10.10) y el valor p es bajo
(0.0019). Además, el valor de R-cuadrado indica que el modelo explica el 59.07% de la
variación en la variable dependiente.El análisis de varianza muestra que ambas variables son
significativas, ya que sus valores de F son altos y sus valores p son bajos.Los coeficientes
de regresión indican que para un aumento de una unidad en "UVB", la variable dependiente
"INHIBIT" aumenta en promedio en 923.19 unidades, manteniendo constante la variable
"SURFACE". Por otro lado, para un aumento de una unidad en "SURFACE Deep", la variable
dependiente "INHIBIT" aumenta en promedio en 21.16 unidades, manteniendo constante la
variable "SURFACE Surface".El valor p del coeficiente de regresión para el término
independiente es menor a 0.05.

La tabla B.17 contiene datos de satisfacción de pacientes hospitalizados. Ajuste un modelo


de regresión adecuado a la respuesta de satisfacción utilizando la edad y la gravedad como
regresores y tenga en cuenta la clasificación médica o quirúrgica de cada paciente con una
variable indicadora.

Ŷ = 139.923348 - 1.046154 X1 - 0.435907 X2

Los resultados de la regresión lineal múltiple indicaron que había un efecto colectivo muy fuerte y
significativo entre X1, X2 y Y (F(2, 22) = 46.77, p < .001, R2 = 0.81, R2adj = 0.79). Los predictores
individuales se examinaron más a fondo y se determinó que X1 (t = -6.652, p < .001) y X2 (t = -2.439,
p = .023) eran predictores significativos en el modelo.

Correlation matrix (pearson)

Y X1 X2

Y 1 -0.87071 -0.65314

X1 -0.87071 1 0.529025

X2 -0.65314 0.529025 1

La tabla ANOVA indica que la regresión lineal múltiple entre las variables X1, X2 y Y tiene un efecto
colectivo muy fuerte y significativo en la variable dependiente Y (F(2, 22) = 46.77, p < .001),
explicando el 81% de la varianza de Y (R2 = 0.81). El coeficiente de correlación múltiple (R) es muy
fuerte (0.899775), lo que significa que existe una correlación muy fuerte entre los datos predichos (ŷ)
y los datos observados (y). El R cuadrado ajustado es de 0.792285. Esto sugiere que el modelo es
adecuado para explicar la relación entre las variables predictoras y la variable dependiente.
Los resultados de la regresión lineal múltiple indicaron que había un efecto colectivo significativo
muy fuerte entre X1, X2 e Y en el modelo 1, (F(2, 22) = 46.77, p < .001, R2 = 0.81, R2adj = 0.79).
Los predictores individuales se examinaron más a fondo y se indicó que X1 (t = -6.652, p < .001) y
X2 (t = -2.439, p = .023) fueron predictores significativos en el modelo:

model 2:

Ŷ = 139.773276 - 1.060478 X1 - 0.441006 X2 + 1.986467 X3

Correlation matrix (pearson)

Y X1 X2 X3

Y 1 -0.87071 -0.65314 -0.18227

X1 -0.87071 1 0.529025 0.245693

X2 -0.65314 0.529025 1 0.17751

X3 -0.18227 0.245693 0.17751 1

En el modelo 2, los resultados de la regresión lineal múltiple indicaron que había un efecto colectivo
significativo muy fuerte entre X1, X2, X3 e Y, (F(3, 21) = 30.17, p < .001, R2 = 0.81, R2adj = 0.78).
Los predictores individuales se examinaron más a fondo y se indicó que X1 (t = -6.515, p < .001) y
X2 (t = -2.42, p = .025) fueron predictores significativos en el modelo, y X3 (t = 0.484, p = .633) no
fue un predictor significativo en el modelo.

En resumen, el modelo 1 es adecuado en comparación con el modelo 2 porque ambos tienen un


efecto colectivo significativo fuerte en Y, pero el modelo 2 tiene un predictor adicional que no es
significativo en el modelo, lo que indica que no contribuye significativamente a la predicción de Y.

8.20 Consider the methanol oxidation data in Table B.20 . Perform a thorough analysis of these
data. What conclusions do you draw from this analysis?

Y= -3021.4902+4.3952X2+120.0834X3-5.5784X4-12.2300X5
Podemos concluir que en el análisis de varianza (ANOVA), las variables X2 y X3 son significativas,
mientras que las variables X4 y X5 son insignificantes. El valor de R cuadrado múltiple es de 0.0582,
lo que significa que el 5.82% de la variación en la variable dependiente está explicada por las
variables independientes (X1, X2, X3, X4). Además, el 85.82% de la variación en la variable
dependiente se explica por las variables independientes (X1, X2, X3, X4).

También podría gustarte