Está en la página 1de 3

Ingeniería Civil Industrial / Ingeniería Civil en Computación e Informática

Estadística
2do Semestre 2023

Proyecto de Estadística: Pruebas de hipótesis y Análisis de Regresión.

Informe : en formato pdf.


Integrantes : Grupos de 5 integrantes.

Objetivo General:
El alumno sea capaz de realizar pruebas de inferencia estadística para un conjunto de datos
y construir modelos lineales que relacionen el desarrollo de una variable de forma no
determinística, a través del proceso estadístico de análisis de regresión.

Objetivos Específicos:
• El alumno sea capaz de describir un fenómeno aleatorio a través de distintas
medidas de centralización, dispersión y métodos gráficos.
• Analizar el planteamiento y los resultados estadísticos en un contexto real, para
probas hipótesis sobre el conjunto de datos entregado.
• El alumno sea capaz de identificar variables independientes y variable de respuesta.
• Formular e interpretar correctamente un modelo lineal simple y múltiple de
regresión.
• Identificar parámetros del modelo que miden el efeto de las variables explicativas.
• Utilizar herramientas y software estadístico especializado.

Exigencias:
• El alumno deberá utilizar la base de datos otorgada.
• El alumno debe utilizar el entorno y lenguaje de programación R, escribiendo su
informe en formato R Markdown y entregando un archivo formato PDF. Se entregará
un template para el trabajo, y se hará una cápsula sobre Análisis de Regresión en R.
• Si alguno quiere profundizar en R Markdown, se le recomienda revisar el libro “R
Markdown Cookbook”: R Markdown Cookbook (bookdown.org)

Evaluación Informe:
En la portada deberán incluir el nombre de todos los integrantes del equipo, así como indicar
al paralelo del curso al que pertenecen. También deben indicar el nombre de la Universidad,
la Escuela, la asignatura, y la fecha de entrega. Un índice de contenidos es necesario para el
orden del informe.
Se solicita un índice de figuras y uno de tablas para ser más ordenado. Las tablas y figuras
deben estar etiquetadas en el informe.
Ingeniería Civil Industrial / Ingeniería Civil en Computación e Informática
Estadística
2do Semestre 2023

El desarrollo del informe será dividido en tres secciones:

• Introducción: En esta sección del informe se debe indicar en qué consiste el


problema a abordar y la metodología a utilizar.
• Desarrollo: En esta sección se deben presentar sus análisis y desarrollo, así como su
interpretación y análisis. Debe dar respuesta a todas las preguntas planteadas.
• Conclusión: En esta sección se debe concluir sobre lo realizado, destacando lo
aprendido, así como hallazgos más relevantes en los análisis efectuados.

Extensión: El informe no debe tener más de 20 páginas en su cuerpo principal (sin


considerar portada ni índices), y como máximo 5 páginas de anexos.
Enunciado.

Su equipo ha sido seleccionado para prestar servicios de consultoría a una empresa agrícola
que tiene como objetivo entender mejor los resultados de sus operaciones.
La empresa ha realizado un muestreo en sus diversas unidades productivas para contar con
los datos necesarios para caracterizar de forma detallada las siguientes variables de
seguimiento:

i. Producción agrícola (Y): medida en kilogramos por hectárea.


ii. Agua suministrada (Agua): medida en metros cúbicos por hectárea.
iii. Exposición a frio (Frio): medida en horas.
iv. Fertilizantes suministrados: medidos en kilogramos por hectárea o metros
cúbicos. Los datos contienen fertilizantes nitrogenados (nitrógeno y urea,
aplicados en polvo) y fertilizantes fosforados (ácido fosfórico, aplicados en
líquido).
v. Aplicación de materiales orgánicos: variable binaria donde 1 indica que se aplicó
y 0 que no se realizó aplicación. Hay dos tipos de materiales orgánicos:
fertilizantes o compost.
vi. Plaga: variable binaria que toma el valor 1 si hubo plaga en la hectárea analizada,
o 0 si no.
vii. Agricultor: Edad del agricultor a cargo de la hectárea, medida en año.
viii. Inspecciones SAG: número de visitas realizadas por la autoridad del Servicio
Agrícola Ganadero.
Ingeniería Civil Industrial / Ingeniería Civil en Computación e Informática
Estadística
2do Semestre 2023
1. En primer lugar, realice una inspección de los datos describiéndolos con sus
respectivas medidas de localización y dispersión. Presente gráficos que apoyen su
descripción.
2. La empresa le solicita que, de los datos entregados, usted tome una muestra
aleatoria de tamaño 100 y responda (considerando un nivel de significancia del 5%):

a) Con la muestra seleccionada, ¿podemos afirmar que la media de rendimientos


por hectárea es mayor a 7.000 kilogramos?
b) Con la muestra seleccionada, ¿podemos afirmar que la media de rendimientos
por hectárea donde se aplico fertilizante es mayor a la media de rendimientos
por hectárea donde NO se aplico fertilizante?
c) Con la muestra seleccionada, ¿podemos afirmar que menos del 15% de todas las
hectáreas son afectadas por plagas?
d) Con la muestra seleccionada, compare la dispersión en el rendimiento por
hectárea entre aquellas que se aplico compost y las que no. ¿Qué puede
concluir?
Concluya en función del valor crítico, definiendo una región de rechazo, y el valor-p.

3. La empresa solicita que proponga un modelo de regresión simple (elija una variable
independiente y llame a este modelo: modelo1). Interprete sus resultados. En
particular: ¿Qué tan grande es el efecto de su variable escogida en la producción
agrícola? ¿Cuál es la medida de ajuste de su modelo?
4. Realice un análisis de regresión con todas las variables disponibles (llame a este
modelo, modelo 2. Interprete sus resultados. Describa en detalle el efecto de todos
los coeficientes en la variable de respuesta y si son o no significativos para el modelo.
Justifique su respuesta planteando las pruebas de hipótesis correspondientes.
5. Evalué el grado de multicolinealidad del modelo 2. Entregue su análisis,
interpretando los resultados. Justifique su respuesta.
6. Seleccione las variables utilizando el método de eliminación hacia atrás y de
selección hacia adelante. Compare y discuta sus resultados. Escoja justificadamente
uno de los modelos propuesto por los métodos, a este último llámelo modelo 3.
7. Finalmente, valide su modelo 3 mediante graficas de diagnóstico y pruebas
estadísticas (analice residuos, evalúe autocorrelación y homocedasticidad).
Justifique su respuesta.

Fecha de entrega: Sábado 9 de diciembre.

También podría gustarte