Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INGENIERÍA INDUSTRIAL
Estadística inferencial I
La regresión supone que hay una variable fija, controlada por el investigador (es la
variable independiente o predictora), y otra que no está controlada (variable
respuesta o dependiente). La correlación supone que ninguna es fija: las dos
variables están fuera del control de investigador. Los valores individuales se
representan en una gráfica bidimensional conocida como diagrama de dispersión.
En las siguientes gráficas se muestran los tipos de relación más comunes que
pueden observarse en los diagramas de dispersión.
La regresión en su forma más sencilla se llama regresión lineal simple. Se trata de
una técnica estadística que analiza la relación entre dos variables cuantitativas,
tratando de verificar si dicha relación es lineal. Si tenemos dos variables hablamos
de regresión simple, si hay más de dos variables regresión múltiple. Su objetivo es
explicar el comportamiento de una variable 𝑌 (dependiente), a partir de otra variable
𝑋 (independiente), también obtener estimaciones razonables a partir de una
muestra de n pares de valores.
Una vez que hemos hecho el diagrama de dispersión y después de observar una
posible relación lineal entre las dos variables, nos proponemos a encontrar la
ecuación de la recta que mejor se ajuste a la nube de puntos. Esta recta se
denomina recta de regresión. El mejor ajuste significa que deseamos encontrar la
línea recta para la cual las diferencias entre los valores reales y los valores que
serían estimados a partir de la línea ajustada de regresión sean lo más pequeñas
posible.
• Independencia de la recta
• Localización de la recta en algún punto
𝒚` = 𝒂 + 𝑩𝒙
Análisis residual
3. Independencia del error: requiere que el error (la diferencia entre un valor
observado y un valor estimado) es independiente de cada valor de 𝑿.
Conclusión
Como podremos darnos cuenta el objetivo principal de un modelo de regresión lineal
es encontrar la línea que mejor se ajuste y los valores óptimos de intersección y
coeficientes de manera que se minimice el error. El error es la diferencia entre el
valor real y el valor predicho y el objetivo es reducir esta diferencia. En resumen, es
predecir un valor futuro, basado en una secuencia de datos.
Referencias bibliográficas