Está en la página 1de 5

Tema No.

5 Regresión y correlación
Actividad No. 1 Investigación documental
Carrera: Ingeniería en Agronomía (modalidad mixta)
Alumna: Alexia Zachamy Santillán Jimenez
Docente: Ireri Onchi Espinosa
No. De control: 21850611
Materia: Estadística 4M
Regresión
Un modelo de regresión es aquel que permite describir cómo influye una variable X
sobre otra variable Y.
 X: Variable independiente o explicativa.
 Y: Variable dependiente o respuesta.
El objetivo es obtener estimaciones razonables de Y para distintos valores de X a
partir de una muestra de n pares de valores (x1, y1), …, (xn, yn).
Ejemplos:

 Estudiar cómo influye la estatura del padre sobre la estatura del hijo.
 Estimar el precio de una vivienda en función de su superficie.
 Predecir la tasa de paro para cada edad.
 Aproximar la calificación obtenida en una materia según el número de horas
de estudio semanal.
 Prever el tiempo de computación de un programa en función de la velocidad
del procesador.
Regresión lineal
Es una técnica de modelado estadístico que se emplea para describir una variable
de respuesta continua como una función de una o varias variables predictoras.
Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o
a analizar datos experimentales, financieros y biológicos.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo
describe la relación entre una variable dependiente y (también conocida como la
respuesta) como una función de una o varias variables
independientes Xi (denominadas predictores). La ecuación general correspondiente
a un modelo de regresión lineal es:

Fuente: https://la.mathworks.com/discovery/linear-regression.html

donde β representa las estimaciones de parámetros lineales que se deben calcular y ϵ representa
los términos de error.

Tipos de regresión lineal


Regresión lineal simple: La relacion entre la variable de respuesta, Y, y la variable
de entrada, x, especificadas ambas en la anterior ecuación, se denomina regresión
lineal simple.
Regresión lineal múltiple: Modelos que utilizan múltiples predictores. Esta regresión
tiene múltiples Xi para predecir la respuesta Y. Este es un ejemplo de la ecuación:

Fuente: https://la.mathworks.com/discovery/linear-regression.html

Regresión lineal multivariante: Modelos para varias variables de respuesta. Esta


regresión tiene múltiples Yi que derivan de los mismos datos Y. Se expresan con
fórmulas diferentes. Este es un ejemplo del sistema con dos ecuaciones:

Fuente: https://la.mathworks.com/discovery/linear-regression.html

Aplicaciones de la regresión lineal


La regresión lineal cuenta con ciertas características ideales para las siguientes
aplicaciones:
 Predicción o pronóstico: utilice un modelo de regresión para crear un modelo
de pronóstico para un conjunto de datos específico. A partir de la moda,
puede usar la regresión para predecir valores de respuesta donde solo se
conocen los predictores.
 Fuerza de la regresión: utilice un modelo de regresión para determinar si
existe una relación entre una variable y un predictor, y cuán estrecha es esta
relación.
Regresión no lineal
La regresión no lineal genera una ecuación para describir la relacion no lineal entre
una variable de respuesta continua y una o más variables predictoras y predice
nuevas observaciones.
La regresión no lineal utiliza ecuaciones de regresión no lineal, que toman la forma:

Fuente: https://statologos.com/regresion-no-lineal/

Donde:
 X = un vector de p predictores,
 β = un vector de k parámetros,
 f(-) = una función de regresión conocida,
 ε = un término de error.

Coeficiente de determinación
Supongamos que pretendemos medir la variación del conjunto de valores de
repuesta Y1, . . ., Yn correspondientes al conjunto de valores de entrada x1, . . ., xn.
Una medida estadística estándar de la variación del conjunto de valores Y1, . . ., Yn
viene dada por:

(Sheldon 2005, Pág. 567)


Por ejemplo, si todos los Yi son iguales –y, por consiguiente, iguales Y-, SSYY será
igual a 0.
La variación implícita en los valores Yi se deriva de dos factores. En primer lugar,
como los valores de entrada xi son distintos, las variables de respuesta Yi tienen
medidas diferentes, lo cual produce cierta variación en sus alores. En segundo
lugar, la variación también proviene del hecho de que, aunque se tengan en cuenta
las diferencias entre los valores de entrada, cada una de las variables de respuesta
Yi tiene una varianza y, por consiguiente, no coincidirán exactamente con el valor
predicho para su entrada xi.
R2 recibe el nombre de coeficiente de determinación.
El coeficiente de determinación R2 tiene un valor comprendido de 0 y 1. Un valor de
R2 próximo a 1 indica que la mayor parte de la variación de la variable de respuesta
viene explicada por los distintos valores de entrada, mientras que un valor de R2
próximo a 0 indica que muy poca variación es explicada por los diferentes valores
de entrada.
Correlación
La correlación es una medida de la relación (covariación) lineal entre dos variables
cuantitativas contínuas (x, y). La manera más sencilla de saber si dos variables
están correlacionadas es determinar si co-varían (varían conjuntamente).
Trata de establecer la relación o dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios
de la otra. En caso de que suceda, diremos que las variables están correlacionadas
o que hay correlación entre ellas.

Coeficiente de correlación
El Coeficiente de Correlación es un valor cuantitativo de la relación entre dos o más
variables.
El coeficiente de correlación puede variar desde -1.00 hasta 1.00. La correlación de
proporcionalidad directa o positiva se establece con los valores +1.00 y de
proporcionalidad inversa o negativa, con -1.00. No existe relación entre las variables
cuando el coeficiente es de 0.00.

Correlación Lineal
Si disponemos de dos series de datos emparejadas, con frecuencia es útil conocer
si ambas variables están relacionadas, y, en caso afirmativo, encontrar la expresión
que refleja dicha relación. Si la ecuación que mejor relaciona dichas variables es la
de una recta, decimos que existe correlación lineal.

Bibliografía
Benites, L. (2021). Regresión no lineal. Obtenido de https://statologos.com/regresion-no-lineal/

FAO. (2008). Regresión y Correlación. Obtenido de https://www.fao.org/3/x6845s/x6845s02.htm

Ross, S. (2005). Regresión lineal. En S. Ross, Introducción a la Estadística (págs. 527-540).


Barcelona: REVERTÉ, S. A.

Sánchez, J. (2006). Correlación lineal y regresión. Obtenido de


https://hidrologia.usal.es/practicas/correlacion/Correlacion_explicacion.pdf

También podría gustarte