Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea Analisis Cuantitativo
Tarea Analisis Cuantitativo
ARICA- CHILE
2023
La base de datos petroleo.xls contiene, para un periodo determinado de tiempo, las
siguientes variables:
consenerg: Consumo de energía en EEUU (millones de BTU por año)
generelect: Generación bruta de energía eléctrica EEUU (miles de kv-hr)
rendcombus: Rendimiento de combustible de automóviles hechos en EEUU (millas por
galón)
prodgas: producción total de gas natural en EEUU (millones de pies cúbicos)
prodcarbon: Producción de carbón en EEUU (millones de toneladas)
prodpetr: Producción mundial de petróleo.
Los tipos de variables que se encuentran en la base de datos son principalmente variables
numéricas. Esto se puede determinar a partir de la salida de str(data), que muestra que todas las
columnas (prodpetr, consenerg, generelect, prodcarbon, prodgas, rendcombus) son de tipo
numérico (num).
Con summary(data) se pudieron obtener las medidas de resumen para iniciar el análisis,
obteniendo lo siguiente:
Se generaron cuatro gráficos de histograma diferentes. Cada uno de estos histogramas se crea
para visualizar la distribución de una variable específica:
Este histograma representa la variable prodgas, que es la producción total de gas natural en
Estados Unidos en millones de pies cúbicos.
Este histograma representa la variable prodcarbon, que es la producción de carbón en Estados
Unidos en millones de toneladas.
Se observa una correlación débil entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera uniforme y no siguen una alineación clara.
Se observa una correlación débil entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera uniforme y no siguen una alineación clara.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
Se observa una correlación débil entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera uniforme y no siguen una alineación clara.
Se observa una correlación positiva entre las variables debido a que los puntos en el gráfico de
dispersión están alineados en una dirección ascendente desde la esquina inferior izquierda hacia la
esquina superior derecha. Esto significa que a medida que una variable aumenta, la otra también
tiende a aumentar.
Se observa una correlación negativa entre las variables hasta un punto del plano después se
observa una correlación positiva entre las variables.
Se observa una correlación positiva entre las variables debido a que los puntos en el gráfico de
dispersión están alineados en una dirección ascendente desde la esquina inferior izquierda hacia la
esquina superior derecha. Esto significa que a medida que una variable aumenta, la otra también
tiende a aumentar.
Se observa una correlación débil entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera uniforme y no siguen una alineación clara.
Se observa una correlación positiva entre las variables debido a que los puntos en el gráfico de
dispersión están alineados en una dirección ascendente desde la esquina inferior izquierda hacia la
esquina superior derecha. Esto significa que a medida que una variable aumenta, la otra también
tiende a aumentar.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
Se observa una correlación positiva entre las variables debido a que los puntos en el gráfico de
dispersión están alineados en una dirección ascendente desde la esquina inferior izquierda hacia la
esquina superior derecha. Esto significa que a medida que una variable aumenta, la otra también
tiende a aumentar.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
Se observa una correlación nula entre las variables debido a que los puntos en el gráfico de
dispersión están dispersos de manera no uniforme y no siguen una alineación clara.
4. Construya un modelo que explique la producción mundial de petróleo mediante las otras
variables.
Este código crea un modelo de regresión lineal múltiple que permite analizar cómo las variables
independientes mencionadas se relacionan con la variable dependiente, que es la producción
mundial de petróleo. El modelo se utiliza para estimar los coeficientes de regresión y evaluar la
significancia estadística de estas relaciones.
De los coeficientes proporcionados por el modelo de regresión lineal múltiple, el coeficiente que
indica la influencia más fuerte en la producción mundial de petróleo es el coeficiente asociado a la
variable "consenerg" (consumo de energía en EEUU), que es aproximadamente 0.836.
Por cada aumento de una unidad en el consumo de energía en EEUU (millones de BTU por año), se
espera que la producción mundial de petróleo aumente en aproximadamente 0.836 unidades,
manteniendo constantes las otras variables en el modelo.
El coeficiente de correlación (r) puede estimarse como la raíz cuadrada del valor de R-cuadrado,
pero hay que tener en cuenta que no se proporciona directamente en la salida. En este caso,
sqrt(0.921) ≈ 0.959, lo que indica una correlación fuerte entre la producción mundial de petróleo y
las variables independientes en el modelo. Esto significa que las variables independientes tienen
una influencia significativa en la producción mundial de petróleo y están correlacionadas
positivamente con ella.
Es importante tener en cuenta que esta predicción tiene un valor negativo, lo que podría no tener
un significado práctico en el contexto de producción de petróleo. La regresión lineal puede no ser
adecuada para realizar predicciones fuera del rango de datos observados en el conjunto de datos
original, y este valor negativo podría deberse a extrapolación más allá de los valores observados
en las variables independientes.