Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Asignatura
Estadística Aplicada
Docente
Ana María Palma
Año Lectivo
2022-2
Tema
Consulta de regresión lineal
ANÁLISIS DE REGRESIÓN
El análisis de regresión es un método estadístico que se utiliza para examinar la relación entre
dos o más variables cuantitativas. A través de esta técnica, una variable de interés, conocida
como variable dependiente, se modela como una función de otras variables, conocidas como
variables independientes.
El análisis de regresión puede ser lineal o no lineal, simple (con una sola variable
independiente) o múltiple (con varias variables independientes). El objetivo de este análisis es
describir y cuantificar la relación entre las variables, proporcionando una forma de predecir los
valores futuros de la variable dependiente basándose en los valores de las variables
independientes.
ECUACIÓN DE REGRESIÓN
La ecuación de regresión es una ecuación matemática que se utiliza en análisis de regresión
para describir la relación entre las variables.
En una regresión lineal simple, donde sólo hay una variable independiente y una variable
dependiente, la ecuación de regresión toma la forma de:
Y = a + bX + ε
De manera más técnica, si "y" son los valores observados, "ŷ" son los valores predichos por el
modelo, y "n" es
Y = β0 + β1X + ε
Donde:
Si β1 es positivo, indica que hay una relación directa entre X e Y: a medida que X aumenta, Y
también aumenta. Si β1 es negativo, indica que hay una relación inversa entre X e Y: a medida
que X aumenta, Y disminuye.
Este valor representa la estimación de la variable dependiente Y cuando todas las variables
independientes X son iguales a cero. En otras palabras, es el valor de Y cuando X es cero.
El intercepto proporciona información útil sobre la relación entre las variables, pero su
interpretación puede no tener sentido en algunos contextos, especialmente si no es plausible
que X sea igual a cero en el contexto de la investigación.
Donde:
Esta fórmula es útil para calcular el error estándar de la estimación en una regresión lineal
simple. En regresiones más complejas, el cálculo puede ser más complicado.
Por favor, ten en cuenta que esta fórmula se aplica cuando los términos de error tienen
varianza constante (homocedasticidad) y están normalmente distribuidos, supuestos típicos en
una regresión lineal ordinaria.
Donde:
Ŷ ± t*(S / sqrt(n))
Donde:
- Ŷ es la media estimada de Y.
- t es el valor crítico de la distribución t con n-2 grados de libertad y un nivel de confianza
especificado (por ejemplo, t=2 para un nivel de confianza del 95% con muchas observaciones).
Este intervalo de confianza proporciona un rango de valores dentro del cual podemos estar
razonablemente seguros de que se encuentra la verdadera media de Y para un valor específico
de X.
En otras palabras, el R² es una medida de cuán bien las predicciones del modelo de regresión
se ajustan a las diferencias reales.
Donde: