Está en la página 1de 4

Universidad Nacional de Santiago del Estero Facultad de Agronomía y Agroindustrias

Bioestadística y Diseño
Ing. Agronómica
____________________________________________________________________________

Práctico 9

Tema: Regresión lineal simple. Correlación lineal. Año 2020


Objetivos:
- Que el alumno aplique el modelo lineal simple para representar la dependencia de
una variable de respuesta Y, respecto de otra variable explicativa X
- Evaluar hipótesis acerca de loa parámetros del modelo
- Elaborar e interpretar intervalos de confianza y predicción para la variable
ajustada
- Calcular e interpretar las medidas de bondad de ajuste

Para llevar a cabo los cálculos puede utilizar el programa Infostat, Excel o bien puede
realizarlos con calculadora

1) Se realizó un estudio sobre dos caracteres del maíz "colorado” para determinar si la altura
de la planta depende del diámetro del tallo y se obtuvieron los siguientes resultados:
Carácter 1 2 3 4 5 6 7 8 9 10
Diámetro del Tallo 1,8 2,2 2,1 2,2 2,3 2,4 2,5 2,5 2,7 2,8
Altura de la Planta 1,29 1,48 1,45 1,49 1,59 1,6 1,6 1,58 1,7 1,62
a) Estime la recta de regresión a través del método de mínimos cuadrados.
b) ¿Existe relación lineal entre ambos caracteres? Fundamente.
c) ¿El modelo es el adecuado? Pruebe empleando el análisis de la varianza.
d) Señale los valores que toman los otros indicadores de la calidad del modelo encontrado.
e) Utilice el modelo para predecir la altura de la planta, cuando el diámetro del tallo es de 2,3
cm. Calcule el residuo de ese valor.
f) Para un diámetro de 2,1 cm ¿Entre qué valores se espera esté la altura de la planta con una
confianza del 95%?

2) Se desea estudiar el crecimiento ontogénico (desarrollo de un organismo, desde la


fecundación de un cigoto hasta su senescencia) que presentan las plantas de girasol. Los datos
son los siguientes:
Semanas (X) 1 2 3 4 5 6 7 8 9 10 11
Altura (Y) 18 36 68 98 131 170 206 228 247 250 254
a) Realice un gráfico de dispersión de la altura en función de las semanas para visualizar la
existencia de una posible relación entre las variables.
b) Plantee las hipótesis necesarias para determinar si existe una relación lineal entre las
variables estudiadas y tome la decisión sobre dichas hipótesis usando como criterio un
intervalo de confianza del 95% de confianza.

1
Universidad Nacional de Santiago del Estero Facultad de Agronomía y Agroindustrias
Bioestadística y Diseño
Ing. Agronómica
____________________________________________________________________________
c) Luego de observar el grafico realizado en el punto anterior y teniendo en cuenta el
resultado obtenido de la prueba hecha en el ítem anterior, realice el ajustamiento al modelo
que mejor se adecuen los datos usando el método de mínimos cuadrados.
d) Pruebe la significancia del modelo de regresión hallado mediante el Anova.
e) Calcule el coeficiente de determinación y escriba la interpretación del mismo.
f) Construya un intervalo del 95% para predecir la altura de una planta de girasol cuando tiene
8 semanas.

3) Con el fin de determinar la forma de crecimiento embrionario de pollos, se registró el peso


seco de embriones de edades entre 6 y 16 días, siendo los siguientes:
Edad (días) 6 7 8 9 10 11 12 13 14 15 16
Peso 1,029 1,052 1,079 1,125 1,181 1,261 1,425 1,738 2,18 2,282 3,812
a) ¿Qué forma tiene el crecimiento embrionario del pollo entre los 6 y 16 días?
b) Encuentre la ecuación de la función estimada y realice la prueba correspondiente para
determinar si existe relación lineal entre las variables a un nivel de significación de 0,05.
c) Pruebe la validez del modelo encontrado.
d) Estime el peso seco que puede esperarse a una edad de 10 días con un intervalo del 95% de
confianza. Prediga con un intervalo del 95% el peso seco que puede llegar a tener un pollo a
una edad de 10 días.
e) Señale el valor del error estándar de la estimación ( S yx ) y explique cómo se lo interpreta.

4) En la zona de Marcos Juárez se llevó a cabo un ensayo sobre trigo para cuantificar la
relación que hay entre la disponibilidad de Nitrógeno en el suelo y la cantidad de Nitrógeno en
la planta (que se supone lineal). Se obtuvieron datos para 12 parcelas, en las que se registró el
contenido de nitrógeno en el suelo y los valores promedios de nitrógeno por planta y luego se
los analizaron obteniéndose la siguiente salida estadística:
Análisis de regresión lineal
Variable N R² R² Aj ECMP AIC BIC
N planta 12 0,95 0,95 7,4E-05 -81,85 -80,39

Coeficientes de regresión y estadísticos asociados


Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows VIF
const 0,08 0,01 0,06 0,09 9,35 <0,0001
N suelo 0,16 0,01 0,13 0,18 13,94 <0,0001 177,74 1,00

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo. 0,01 1 0,01 194,32 <0,0001
N suelo 0,01 1 0,01 194,32 <0,0001
Error 4,6E-04 10 4,6E-05
Total 0,01 11

Responda teniendo en cuenta la información dada previamente:


a) ¿Cuáles son las variables en estudio? ¿Y de qué tipo son?
b) ¿Cuántas mediciones se llevaron a cabo?
c) Indique la expresión de la recta de ajuste obtenida por el Método de Mínimos Cuadrados.
¿Cuál es la interpretación que se le da al valor obtenido de cada uno de sus componentes?

2
Universidad Nacional de Santiago del Estero Facultad de Agronomía y Agroindustrias
Bioestadística y Diseño
Ing. Agronómica
____________________________________________________________________________
d) ¿Cuál es el valor del error estándar de estimación de la pendiente?
e) Plantee y resuelva una hipótesis para la pendiente usando la información de la salida de
Infostat.
f) ¿Qué valor tiene el coeficiente de determinación? ¿Cómo se llega a obtener ese valor?
¿Cómo se interpreta este valor para este caso?
g) ¿Cuál es el valor del error estándar de estimación? ¿En qué unidades esta medido?
h) ¿El modelo es útil para hacer futuras predicciones? ¿Qué información utiliza para
responder esta pregunta?
h) En base a la prueba y al grafico que se presentan a continuación, se podrían considerar
válidos los resultados del ANOVA realizado. Justifique su respuesta.

Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
RDUO N planta 12 0,00 0,01 0,93 0,5399

3,00
Res. estudentizadosN planta

1,50

0,00

-1,50

-3,00
0,14 0,16 0,18 0,21 0,23
Predichos

5) Suponga que se calcula un coeficiente de correlación entre dos variables a partir de 12


pares de datos encontrándose que es igual a 0,8. ¿Puede afirmar que existe correlación lineal
entre las variables con un nivel de significación de 0,05?

6) Con el fin de elaborar un modelo para predecir el rendimiento promedio de las plantaciones
de una cepa de uva a partir del número de racimos promedio por planta al fin de la floración,
se obtuvieron datos en 12 plantaciones de esta cepa tomadas al azar en el área de San Rafael
(Mendoza). A continuación, se presentan los datos obtenidos.
Nº de racimos/ planta 116 83 111 97 116 80 125 116 117 93 107 122
Rendimiento (ton/ ha) 5.6 3.2 4.5 4.2 5.2 2.7 4.8 4.9 4.7 4.1 4.4 5.4
a) Encuentre la recta de regresión.
b) Realice la prueba de la pendiente ( = 0,05).
c) Pruebe la significancia del modelo de regresión usando el análisis de la varianza.

3
Universidad Nacional de Santiago del Estero Facultad de Agronomía y Agroindustrias
Bioestadística y Diseño
Ing. Agronómica
____________________________________________________________________________
d) Calcule el coeficiente de determinación.
e) Calcule el rendimiento promedio de las plantaciones que se obtiene cuando el número de
racimos por planta es 97. ¿Cuál es el valor del residuo?
f) Use Infostat para probar los supuestos del análisis de la varianza.

7) Se cuenta con los registros de diámetro a la altura del pecho (DAP, en cm) y la altura (H,
en m) de 10 Eucalyptus Grandis plantados en un rodal de Rivera;
DAP 22,85 22,59 17,42 19,81 19,91 18,69 21,86 21,23 19,17 19,39
H 22,45 20,54 15,65 17,97 17,74 18,61 21,21 22,44 18,89 19,85
Se desea saber si existe una asociación lineal entre las variables en estudio, para poder
resolver esta duda realice el análisis que usted crea correspondiente (trabaje con un nivel de
significancia del 5%).

8) Suponga que a partir de los datos de la tabla se calcula un coeficiente de correlación entre
las dos variables. ¿Puede afirmar que existe correlación lineal entre las mismas con un nivel de
significación de 0,05?
x 12 25 28 13 84 19 37
y 81 91 58 63 21 79 39

También podría gustarte