Está en la página 1de 5

Entregable 3.

A partir de los datos de la hoja intf-accept del archivo datosEntregables.xls se pide


analizar si la variable porcentaje de grasa intramuscular en vacuno de carne,
INTRAMFAT, podría explicar la variable aceptabilidad, ACCEPT.

1. Calcular la correlación entre ambas variables. ¿Es significativa? ¿Es relevante?


10 puntos.
Pearson's product-moment correlation

data: ACCEPT and INTRAMFAT


t = 2.132, df = 61, p-value = 0.03704
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.01666226 0.47979992
sample estimates:
cor
0.2633401

Una correlación de 0.2633401 que es cercano a cero, indica que no existe relación lineal
entre las variables.
Un p-value<0.05 indica que la correlación es estadísticamente significativa.

2. Realizar un análisis descriptivo de las variables y contrastar la normalidad de


ambas variables. 15 puntos.

> numSummary(Entregable3[,"INTRAMFAT", drop=FALSE],


statistics=c("mean", "sd", "IQR",
+ "quantiles"), quantiles=c(0,.25,.5,.75,1))
mean sd IQR 0% 25% 50% 75% 100% n NA
3.483333 1.782695 1.805 1 2.295 3.1 4.1 9.03 63 5

> numSummary(Entregable3[,"ACCEPT", drop=FALSE], statistics=c("mean",


"sd", "IQR", "quantiles"),
+ quantiles=c(0,.25,.5,.75,1))
mean sd IQR 0% 25% 50% 75% 100% n
4.700735 0.8087032 1.27 2.87 4.1425 4.66 5.4125 6.35 68

El análisis descriptivo de los datos indica que la variable INTRAMFAT presenta una mayor
desviación estándar (dispersión ) que la variable ACCEPT.

Gráfica qq-plots
Gráfica Histogramas

Gráfica box-plot

Gráfica densidad
Según las gráficas de QQ-plot, histogramas, box-plot y densidad, las variables siguen una
distribución normal. Sin valores atípicos, sin desviaciones importantes de la normalidad.

3. Analizar gráficamente la relación entre ambas variables, justificando la


designación de cada una de ellas como variable independiente o dependiente.
La nube de puntos ¿es una elipse? De no serlo, ¿a qué podría deberse la forma
que presenta? 20 puntos.

Según la gráfica obtenida no se observa una correlación lineal entre ambas variables. Se
eligió como variable dependiente a ACCEPT y como independiente a INTRAMFAT, ya que
la aceptabilidad dependerá del contenido de grasa intramuscular en vacuno de carne.
La nube de puntos parece una elipse circular, lo que corroboraría que no existe
correlación entre las variables.

4. Estimar los coeficientes 0 y 1, así como su significación. ¿Cómo se interpreta


1 en este caso? 15 puntos.

Residuals:
Min 1Q Median 3Q Max
-1.48121 -0.59005 0.05863 0.57488 1.78517

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.34453 0.21245 20.449 <2e-16 ***
INTRAMFAT 0.11595 0.05438 2.132 0.037 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.7634 on 61 degrees of freedom


(5 observations deleted due to missingness)
Multiple R-squared: 0.06935, Adjusted R-squared: 0.05409
F-statistic: 4.545 on 1 and 61 DF, p-value: 0.03704
Según los resultados obtenidos podemos decir que por cada incremento de grasa
intramuscular en vacuno de carne, la aceptabilidad se incrementa en 0.11595.

5. Estimar el grado en que la variable dependiente es determinada por la variable


independiente. 5 puntos.

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.34453 0.21245 20.449 <2e-16 ***
INTRAMFAT 0.11595 0.05438 2.132 0.037 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.7634 on 61 degrees of freedom
(5 observations deleted due to missingness)
Multiple R-squared: 0.06935, Adjusted R-squared: 0.05409
F-statistic: 4.545 on 1 and 61 DF, p-value: 0.03704

El valor de R2 indica que el 6,93% de la variabilidad de la aceptabilidad (variable


dependiente) es influenciada por el porcentaje de grasa intramuscular (variable
independiente) en vacuno de carne.

6. Realizar diagnósticos de las condiciones de aplicabilidad de la regresión. 10


puntos.

En el gráfico Residual vs Fitted se observa que los residuos están distribuidos al azar de
pero casi de manera simètrica a la línea 0, lo que indica la homogeneidad de varianzas.
En la gráfica Normal Q-Q no hay desviacions importantes y que la variable es de
respuesta normal.
7. Detectar outliers y posibles observaciones influyentes. 15 puntos.

También podría gustarte