Está en la página 1de 3

Taller final: Análisis Inferencial de Datos

Nombre: Anthony Pumarejo Racedo

1. Se han tomado datos físicos, químicos y biológicos recopilados a intervalos regulares de tiempo
y espacio para documentar los ciclos climáticos en la Corriente de California (en el océano pacífico)
y una variedad de respuestas biológicas a ellos. Estos datos documentaron la respuesta biológica al
dramático evento de calentamiento del Pacífico en 1957-58 e introdujo el término "El Niño" en la
literatura científica. Las variables medidas incluyen (pero no se limitan a): Conteo de Botellas
(Bottle.Count), Profundidad en metros (Depth.m), Temperatura en grados centígrados
(Temperature.C), y Salinidad en g/kg (salinity). Además, el datset contiene información relacionada
a la ID de la estación de medición que recopiló cada muestra. Los datos están contenidos en el
documento “Ocean Data.csv”.

- Construya un modelo lineal que prediga la temperatura, usando todas o algunas de las variables
que se encuentran en el dataset suministrado.

R=

Temperatura = 𝛽0 + 𝛽1 * Conteo de botellas + 𝛽2 * Profundidad + 𝛽3 * Salinidad + u.

Donde:

 𝛽0 representa la temperatura en grados centígrados cuando el resto de las variables son


iguales a cero.

 𝛽1, 𝛽2 y 𝛽3 son los coeficientes de regresión que indican cómo cada variable afecta el
aumento o disminución de la temperatura en centígrados.

 Conteo de botellas, profundidad y salinidad son las variables predictoras o independientes.

 u representa el término de error, que toma en cuenta las variaciones no explicadas por las
variables predictoras.

Este modelo lineal permitiría predecir la temperatura utilizando una combinación de las variables
predictoras presentes en el dataset suministrado. Los coeficientes 𝛽1, 𝛽2 y 𝛽3 indicarían la
magnitud y dirección de la influencia de cada variable en la temperatura, mientras que el término
de error u tendría en cuenta las variaciones no explicadas por las variables predictoras.

modelo lineal en RStudio utilizando el dataset "Ocean Data.csv" y predecir la temperatura:

# Carga los datos desde el archivo CSV

data <- read.csv("Ocean Data.csv")

# Ajusta un modelo de regresión lineal


model <- lm(Temperature.C ~ Bottle.Count + Depth.m + salinity, data = data)

# Imprime los coeficientes del modelo

coefficients <- coef(model)

print(coefficients)

# Realiza predicciones utilizando el modelo

new_data <- data.frame(Bottle.Count = 10, Depth.m = 100, salinity = 35) # Valores de ejemplo

predictions <- predict(model, newdata = new_data)

print(predictions)

2.Para la siguiente sección, utilizaremos la base de datos SMOKE disponible en la plataforma. Esta
base de datos contiene información sobre el consumo de cigarrillos de 807 individuos. A
continuación, se detalla un resumen de los datos:

a) ¿Cuál considera que es el valor esperado de β?

 β_cigpric: 2.002
 β_educ: -0.4948
 β_age: 0.7784
 β_white: -0.531
 β_restaurn: -2.644
 β_income: -4.619e-05
 β_agesq: -0.00915
 β_lincome: 1.404
 β_lcigpric: -115.273

Estos coeficientes en el modelo representan la relación entre las variables independientes y la


variable dependiente. Los coeficientes anteriores muestran cómo se espera que el consumo de
cigarrillos aumente o disminuya en respuesta a un cambio unitario en cada una de las variables
independientes, manteniendo constantes las demás.

b) Genere la ecuación e interprete los resultados. ¿Cuál es su opinión sobre el modelo? ¿Es un
buen predictor para el consumo?
La ecuación propuesta es la siguiente: CigS = B0 + B1 * Prec + u. En esta ecuación, el valor que
tome la variable β1 determinará si el precio tiene un impacto positivo o negativo en el consumo de
cigarrillos. Si β1 es negativo, un aumento en el precio llevará a una disminución en el consumo,
mientras que si β1 es positivo, una disminución en el precio resultará en una disminución del
consumo. Según la teoría económica, las sustancias adictivas, como el tabaco, son sensibles a
cambios en los precios y los ingresos, lo que significa que su elasticidad precio e ingreso es similar
a la de los bienes normales.

En mi opinión, este modelo es un buen predictor, ya que tiene en cuenta la variable principal en la
que se basa el consumo de cigarrillos, que es el precio. Además, el término de error (u) tiene en
cuenta otras variables no consideradas en la ecuación. Si β1 llega a ser cero, entonces β0
representará el consumo de cigarrillos.

c) Supongamos que usted está a cargo de un programa para disminuir el tabaquismo. Para ello,
debe explicar el consumo de cigarrillos. Proponga un modelo econométrico para el consumo y
estime a partir de sus datos. Sustente cada resultado desde la teoría.

Como modelo econométrico, propongo la siguiente ecuación: ConsumoCig = β0 + β1 * Precio + β2


* Publicidad + β3 * Influencia + u. El tabaquismo es el consumo excesivo y enfermizo de tabaco.
Estos factores son necesarios para disminuir o aumentar el consumo de tabaco, ya que son las
principales razones por las cuales las personas comienzan y continúan fumando. Algunos de estos
factores incluyen la edad, el sexo, la edad de primer contacto con el tabaco, el nivel de educación,
el hábito tabáquico de los padres, la disponibilidad de dinero y el gasto en tabaco, el consumo de
alcohol, la práctica deportiva habitual, y la exposición a la publicidad del tabaco.

Según la teoría, se espera que β1 tenga un valor positivo, lo que indica que un aumento en el
precio llevará a una disminución en el consumo de cigarrillos. Se espera que β2 sea negativo, lo
que implica que una disminución en la publicidad reducirá el consumo. Del mismo modo, se espera
que β3 sea negativo, lo que indica que una disminución en la influencia social disminuirá el
consumo de cigarrillos, ya que los jóvenes no se sentirán presionados para iniciar o mantenerse en
el tabaquismo.

También podría gustarte