Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion Lineal
ITBOCA
Práctica 4
Regresión Lineal
Competencias.
Identificar las formas que existen para la transformación de datos.
Distinguir el análisis de regresión lineal.
Analizar los diferentes modelos de regresión para determina cual utilizar bajo ciertas condiciones
de las variables a manipular.
Introducción
La regresión lineal describe la relación que pueda existir entre dos variables. A diferencia de
la correlación, la variable independiente en la regresión lineal es fijada por el investigador. La
regresión lineal es uno de los modelos estadísticos más
PRACTICA 5.1utilizado en diferentes áreas, como en
Prueba de Chi
acuacultura, en pesquerías, ecología y obviamente biología. En esteo modelo se revela la causa –
cuadrada, Independencia
Prueba de Asociación
efecto entre las variables a estudiar.
𝑦̂ = 𝑎 + 𝑏𝑥
a = y − bx
Correspondencia de la práctica
Esta práctica le corresponde a la unidad 2 con los temas y subtemas Regresión y correlación,
Regresión lineal Simple, Introducción a la regresión no lineal, Regresión múltiple.
Metodología
Ejemplo de Problema de Investigación
La hoja de Excel que contiene los datos de esta investigación se muestran abajo.
PRACTICA 4
Regresion Lineal
Manual de prácticas Bioestadísticas II ITBOCA
1. Planteamiento de hipótesis.
Las hipótesis para esta investigación son:
Hipótesis nula β=0, (que es la pendiente igual a cero)
Hipótesis alternativa que β≠0 (que la pendiente es diferente de cero)
Si el análisis de datos no aparece como una opción en la cinta de datos, tendrá que cargar el Paquete
de herramientas de Microsoft de Excel.
4. Complete el cuadro de diálogo como se muestra a continuación. Una descripción de las entradas
se da inmediatamente después del cuadro de diálogo.
PRACTICA 4
Regresion Lineal
Manual de prácticas Bioestadísticas II ITBOCA
• Rango Y de Entrada. Es el rango de los valores que contiene la hoja de Excel de la variable
(Concentración en el medio (μM/L)). Para ingresar el rango, haga clic en la ventana de Rango
Y de Entrada y arrastre desde la celda B1 hasta la celda B7. Si lo prefiere, escriba
manualmente B1:B7 en la ventana del Rango Y de Entrada.
• Rango X de entrada. Es el rango de los valores que contiene la hoja de Excel de la variable
(Concentración en el medio (μM/L)). Para ingresar el rango, haga clic en la ventana de Rango
X de Entrada y arrastre desde la celda A1 hasta la celda A7. Si lo prefiere, escriba
manualmente A1:A7 en la ventana del Rango X de Entrada.
• Rótulos. Podría hacer seleccionada ya que los nombres de las variables en las celdas A1 y
B1 se incluyeron en el rango de entrada y podrían no ser incluidas en el análisis de regresión.
No obstante estas etiquetas deben ser usadas en la hoja de salida.
• Nivel de confianza. No lo seleccione, utilizaremos el nivel de confianza del 95% que por
default nos da Excel.
5. Haga clic en aceptar, abajo se muestra cómo se genera la hoja de salida. Se recomienda ampliar
las columnas para que se pueda leer las etiquetas y los resultados completos.
PRACTICA 4
Regresion Lineal
Manual de prácticas Bioestadísticas II ITBOCA
Hoja de resultados
Estadísticas de la regresión
• R cuadrado Ajustado. Nuestra R2 tiende a ser una estimación optimista de la adecuación entre
el modelo y la población. R2 ajustado generalmente proporciona una mejor estimación. El R2
ajustado para nuestro problema muestra de dos variables fue 0.99894835045767.
Análisis de varianza
El Análisis de Regresión incluye una prueba de hipótesis de que la pendiente de la recta de
regresión es igual a O. Si la pendiente es significativamente diferente de 0, entonces nosotros
concluimos que existe una relación lineal estadísticamente significativa entre la Concentración en
el medio (μM/L) y la Concentración de células (μg/g).
•Total. Se refiere a la “variación total." Para este análisis, la variación total está dividida en variación
de la regresión y variación residual. Por lo tanto, es la suma de la variación de la regresión y variación
residual.
Para cada una de las fuentes de variación, se proporcionan los grados de libertad y las
sumas de cuadrados. La F, que se obtiene dividiendo el promedio de los cuadrados de la regresión
entre el promedio de los cuadrado de los residuos. El valor crítico de F es la probabilidad (P-valor)
asociados con el valor obtenido de F. En este caso la prueba es estadísticamente significativa con
alfa igual a 0,05, ya que el valor P de 2.66E-07 es menor que el valor de F obtenido.
Coeficientes
La información provista en la parte inferior de la hoja de salida se refiere a los coeficientes
de la ecuación de la regresión. La ecuación de la regresión de nuestro problema de investigación
está dado por y = -1.90+ 10.7X (REDONDEADOS)
límites pueden ser usados para formar 95% y 99% intervalo de confianza, El valor de la
probabilidad está asociada con los valores obtenidos del estadístico t. Los límites del intervalo
de confianza del 95% se aplican, alrededor del valor de la pendiente.
•Residuos. Esto es el error de predicción y es calculado Y -𝑦̂ Por ejemplo, para la observación 2 (X
=1) la Concentración en el medio (μM/L) fue 9. El Pronóstico Concentración en el medio (μM/L) para
la observación 2 fue 8.794930876. El Error de predicción para la observación 2 fue 9 - 8.794930876,
o -0.205069124.
De esta manera podemos concluir que 0.999 o 99.9 % de la varianza en “y” es dependiente
en x, lo cual quiere decir que cuando se conoce el valor de x nosotros reducimos la incertidumbre
acerca de “y” por 99.9 %. Hay una varianza residual o “inexplicable” de 100-99.9 = 0.01 % de la
varianza en “y” no explicada. Esta es varianza entre individuos que no es relacionada para x.Si todos
los puntos cayeran exactamente para ver la línea recta, R2=100% y la varianza no explicada sería
igual a cero. El coeficiente de determinación puede ser calculado por el análisis de correlación, en
este caso es el cuadrado del coeficiente de la correlación r. No obstante, en los tratamientos de
correlación r no podría ser considerada como una medida de la variación de y que es explicado o en
la dependiente de x pero más bien como la variación de y que esta es asociada con la varianza de
x y viceversa.
Predicción y de x.
Un importante uso de la regresión nos permite predecir el valor de y para dar un valor a x.
Esto debe hacerse con algunas restricciones. Aun cuando las predicciones acerca de y deben
mantenerse dentro de límites razonables de x, es importante recordar que y no es usualmente una
función exacta de x ya que y es una variable al azar normalmente distribuida, así de esta manera
cuando se predice el valor de y para x lo que se está haciendo es estimar el valor promedio de la
población de y para algún valor en particular de x. este valor estimado es designado como 𝑦̂
“sombrerito”.
Con esta ecuación podemos predecir valores de y con valores de x, por ejemplo nosotros
podríamos querer predecir el valor de 25 de Concentración en el medio (μM/L) sustituyendo este
valor para en X de la ecuación
PRACTICA 4
Regresion Lineal
Manual de prácticas Bioestadísticas II ITBOCA
𝑦̂ = −1.90 + 10.7(25)
En la celda A8, anote 25, active la celda B8 e ingrese la siguiente fórmula =-1.90+10.7*25,
haga clic en Enter y el resultado 265.6 se mostrará. Estos pasos los puede repetir para cualquier
valor de x que usted quiera inter o extrapolar.
Sugerencias didácticas
• Establecer y reconocer las diferencias y semejanzas entre la correlación y la regresión lineal.
• Dejar perfectamente claro que las predicciones de y en base a x deben realizarse con sumo
cuidado, ya que en fenómenos biológicos, por ejemplo la temperatura debe mantenerse bajo
límites razonables.