Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Inferencial I
Ingeniería Industrial
Todos los días las personas toman decisiones personales o profesionales que nos basamos
en predicciones para sucesos futuros. Por ejemplo, si los responsables de las tomas de
decisiones pueden determinar como lo conocido se relaciona con el futuro pueden ayudar
considerablemente al proceso de toma de decisiones. Ah pues de esto exactamente de eso
se trata la regresión lineal en la estadística la utilizan para poder predecir y avanzar en sus
investigaciones.
Regresión Lineal
¿Qué es?
Es una técnica de análisis de datos que predice el valor de datos desconocidos mediante
el uso de otro valor de datos relacionado y conocido. Modela matemáticamente la variable
desconocida o dependiente y la variable conocida o independiente como una ecuación
lineal.
Por ejemplo, supongamos que tiene datos sobre sus gastos e ingresos del año pasado.
Las técnicas de regresión lineal analizan estos datos y determinan que tus gastos son la
mitad de tus ingresos. Luego calculan un gasto futuro desconocido al reducir a la mitad un
ingreso conocido futuro.
Tipos:
a) Simple: Se trata de establecer una relación entre una variable independiente y su
correspondiente variable dependiente. Esta relación se expresa como una línea
recta. No es posible trazar una línea recta que pase por todos los puntos de un
gráfico si estos se encuentran ordenados de manera caótica.
Por lo tanto, sólo se determina la ubicación óptima de esta línea mediante una
regresión lineal. Algunos puntos seguirán distanciados de la recta, pero esta
distancia debe ser mínima. El cálculo de la distancia mínima de la recta a cada
punto se denomina función de pérdida.
Ventajas Desventajas
La regresión lineal es simple de Por otro lado, en la técnica de regresión
implementar y más fácil de interpretar los lineal, los valores atípicos pueden tener
coeficientes de salida. efectos enormes en la regresión y los
límites son lineales en esta técnica.
Cuando sabe que la relación entre la A la inversa, la regresión lineal asume una
variable independiente y la dependiente relación lineal entre las variables
tiene una relación lineal, este algoritmo es dependientes e independientes. Eso
el mejor para usar debido a su menor significa que asume que hay una relación
complejidad en comparación con otros de línea recta entre ellos. Supone
algoritmos. independencia entre atributos.
La regresión lineal es susceptible de Analiza una relación entre la media de las
sobreajuste, pero se puede evitar variables dependientes y las variables
utilizando algunas técnicas de reducción independientes. Así como la media no es
de dimensionalidad, técnicas de una descripción completa de una sola
regularización (L1 y L2) y validación variable, la regresión lineal no es una
cruzada. descripción completa de las relaciones
entre variables.
¿Cómo funciona?
En esencia, una técnica de regresión lineal simple intenta trazar un gráfico lineal entre
dos variables de datos, x e y.
Como variable independiente, x se traza a lo largo del eje horizontal. Las variables
independientes también se denominan variables explicativas o variables predictivas. La
variable dependiente, y, se traza en el eje vertical.
También puede hacer referencia a los valores y como variables de respuesta o variables
pronosticadas.
Pasos en la regresión lineal
Para esta visión general, tenga en cuenta la forma más simple de la ecuación de gráfico
de líneas entre y x; y=c*x+m, donde c y m son constantes para todos los valores posibles
de x e y.
Así, por ejemplo, supongamos que los datos de entrada para (x, y) era (1,5), (2,8) y
(3,11). Para identificar el método de regresión lineal, debe seguir los siguientes pasos:
Trace una línea recta y mida la correlación entre 1 y 5.
Siga cambiando la dirección de la línea recta para los nuevos valores (2,8) y (3,11)
hasta que se ajusten todos los valores.
Identifique la ecuación de regresión lineal como y = 3*x + 2.
Extrapola o predice que y es 14 cuando x es.
Etapas:
El procedimiento por seguir puede dividirse en cuatro etapas:
La primera aproximación es a través de dibujar los puntos en un gráfico cartesiano
que muestre la relación entre las dos variables.
Luego se determina la ecuación de la línea que mejor describa dichos puntos.
A continuación, se calcula la variabilidad de la muestra en torno a la línea de
regresión calculada.
Finalmente se pueden hacer inferencias.
Sus Beneficios:
o La regresión lineal permite predecir el comportamiento de una variable
(dependiente o predicha) a partir de otra (independiente o predictora).
o Tiene presunciones como la linealidad de la relación, la normalidad, la aleatoriedad
de la muestra y homogeneidad de las varianzas.
o La regresión no prueba causalidad.
o Un artículo que usa regresión debe mencionar o mostrar que se analizó la “nube
de puntos” y que se hizo un análisis de los residuales.
o La línea de regresión no debe extenderse más allá de los datos obtenidos.
La varianza del error σ2 se estima a partir del Residual Standar Error (RSE), que
puede entenderse como la diferencia promedio que se desvía la variable respuesta de
la verdadera línea de regresión. En el caso de regresión lineal simple, RSE equivale a:
Intervalos de confianza:
Los residuos son muy importantes puesto que en ellos se basan las diferentes
medidas de la bondad de ajuste del modelo.
Bondad de ajuste del modelo:
Una vez que se ha ajustado un modelo es necesario verificar su eficiencia, ya que aun
siendo la línea que mejor se ajusta a las observaciones de entre todas las posibles, el
modelo puede ser malo. Las medidas más utilizadas para medir la calidad del ajuste
son: error estándar de los residuos, el test F y el coeficiente de determinación R2.
Error estándar de los residuos (Residual Standar Error, RSE): Mide la desviación
promedio de cualquier punto estimado por el modelo respecto de la verdadera recta
de regresión poblacional. Tiene las mismas unidades que la variable dependiente Y.
Una forma de saber si el valor del RSE es grande consiste en dividirlo entre el valor
medio de la variable respuesta, obteniendo así un % de la desviación.
En el siguiente trabajo me fue de gran utilidad ya que logre identificar y entender que es la
regresión lineal simple.
Entendí que esta describe la relación entre varias variables: una que es la variable
dependiente y una o varias variables independientes. Debido a la rapidez de creación y su
facilidad de interpretación, los modelos de regresión lineal son ampliamente utilizados con
éxito en los distintos ámbitos, como para hacer previsiones para describir sistemas.
Creo que este tema es muy útil cuando analizamos nuestros datos ya que con el podemos
encontrar patrones de secuencia.
Aunque logre comprender el tema, siento que me falta ponerlo en práctica, ya que se
necesita entender mejor, ya que es mucha teoría y distintas maneras de representarlo. Por
eso es mejor que lo ponga en práctica y refuerze mis conocimientos junto con la teoría.
REFERENCIAS
ML: ventajas y desventajas de la regresión lineal. (2022). Barcelona Geeks. Rudeus Greyrat.
Recuperado 27 de octubre de 2023, de https://barcelonageeks.com/ml-ventajas-y-
desventajas-de-la-regresion-lineal/