Está en la página 1de 9

Estadstica Aplicada

Ingeniera En Industrias Alimentarias IAM-0511 4 Anlisis de Regresin Lineal Simple, no Lineal y Mltiple
4.1 Introduccin al Anlisis de Regresin 4.2 Diagramas de Dispersin 4.3 Correlacin; Medicin de la intensidad y direccin de la asociacin entre las Variables 4.4 Significacin de la R de Pearson 4.5 Tipos de Modelos de Regresin 4.6 Desarrollo del Modelo de Regresin Lineal Simple 4.7 Mtodo de los Mnimos Cuadrados y su Interpretacin 4.8 Desarrollo del Modelo de Regresin Mltiple 4.9 Coeficiente de Determinacin Mltiple y su Interpretacin 4.10 Prediccin de la Variable Dependiente e Independiente 4.11 Desarrollo del Modelo de Regresin Exponencial y su Interpretacin 4.12 Desarrollo del Modelo de Regresin Logartmica y su Interpretacin

4.6 Desarrollo del Modelo de Regresin Lineal Simple

Concepto El establecimiento de una correlacin entre dos variables es importante, pero esto se considera un primer paso para predecir una variable a partir de la otra. (U otras, en el caso de la regresin mltiple.) Claro est, si sabemos que la variable X est muy relacionada con Y, ello quiere decir que podemos predecir Y a partir de X. Estamos ya en el terreno de la prediccin. (Evidentemente si, X no est relacionada con Y, X no sirve como predictor de Y.)
Nota: Emplearemos los trminos regresin y prediccin como casi sinnimos. (La razn del uso del trmino regresin es antigua, y se ha mantenido como tal.)

Concepto (2)
El tema bsico en regresin (con 2 variables) es ajustar los puntos del diagrama de dispersin de las variables X e Y. Para simplificar, nos centraremos especialmente (por simplicidad) en el caso de que la relacin entre X e Y sea lineal.

rendimiento

inteligencia

Claro est, el tema ahora es cmo conseguir cul es la mejor lnea que parece unir los puntos. Necesitamos para ello un criterio. Si bien hay otros criterios, el ms empleado comnmente, y el que veremos aqu, es el criterio de mnimos cuadrados.

Criterio de mnimos cuadrados: Es aquel que minimiza las distancias cuadrticas de los puntos con la lnea.

Repaso de la ecuacin de una recta


Y=A+BX A es la ordenada en el origen (es donde la recta corta el eje Y) B es la pendiente (observa que en el caso de las relaciones positivas, B ser positivo; en el caso de las relacin negativas, B ser negativo; si no hay relacin, B ser aproximadamente 0)

rendimiento inteligencia

Si queremos predecir Y a partir de X, necesitamos calcular (en el caso de relacin lineal) la recta de regresin de Y sobre (a partir de) X.

REGRESION
Se puede definir a la Regresin, como una correlacin matemtica basada en la ecuacin de la recta modificada. Existen varios tipos de regresin y todos se basan en modificaciones de la formula de regresin lineal : Y = a + b . X (ecuacin matemtica de la recta) Y es la variable dependiente (de estudio) y X la variable independiente. a y b son factores derivados de la ecuacin matemtica de la recta. Bsicamente, por medio de la regresin se pretende predecir el valor de una variable llamada genricamente Y, a travs de otra variable llamada X. La regresin se representa mediante un coeficiente R que oscila entre - 1 y + 1. Cuando la variable dependiente Y aumenta ante incrementos de la variable independiente X , el R es positivo y oscila entre 0 y 1. A su vez cuando Y disminuye ante incrementos de X el R es negativo, entre 0 y 1. Veamos algunos ejemplos para una mejor comprensin :

El grfico muestra la relacin existente entre sumatoria de puntos del Sistema Apache II a las 24 horas del ingreso y la probabilidad de mortalidad en terapia intensiva. El valor de R es 0,98 para un nivel de p < 0.001. El valor de R2 es 0.97. El R2 es un coeficiente importante en regresin. Se deduce de la elevacin al cuadrado de R y es representativo del grado de relacin entre variables. Un R2 de 0.97, significa que el valor de la probabilidad de mortalidad podr ser predecido en un 97% de las veces por el valor del Apache II.

Si analizamos la Probabilidad de sobrevida en UTI con respecto al valor del Apache II, obtenemos una curva de regresin similar pero negativa, con un R = 0,98 y nuevamente un R2 de 0.97. Por lo tanto el valor de R2 indica el porcentaje de variabilidad de los valores de Y que pueden ser explicadas en funcin de la variabilidad de los valores de X.

Los modelos de regresin no siempre son lineales y se basan en la ecuacin pura de la recta. Existen tambin modificaciones de esta ecuacin de tal manera que se pueden practicar anlisis de regresin cuadrtica, cbica, logartmica, logstica, etc. Adems la regresin puede ser simple o mltiple, constituyendo un tipo de anlisis multivariado. http://www.medal.org.ar/stadhelp/Std00015.htm Regresin lineal simple. Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi . Estimacin de los parmetros de la recta de regresin. El primer problema a abordar es obtener los estimadores de los parmetros de la recta de regresin , partiendo de una muestra de tamao n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que representan nuestra intencin de extraer para cada xi un individuo de la poblacin o variable Yi . Una vez realizada la muestra, se dispondr de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn, yn). El mtodo de estimacin aplicable en regresin, denominado de los mnimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones de los parmetros de la recta de regresin obtenidas con este procedimiento son:

Por tanto la recta de regresin estimada ser:

Un ejemplo. La recta de regresin representada corresponde a la estimacin obtenida a partir de 20 pares de observaciones: x representa la temperatura fijada en un recinto cerrado e Y el ritmo cardaco de un vertebrado.

REGRESION
Se puede definir a la Regresin, como una correlacin matemtica basada en la ecuacin de la recta modificada. Existen varios tipos de regresin y todos se basan en modificaciones de la formula de regresin lineal: Y = a + b. X (ecuacin matemtica de la recta) Y es la variable dependiente (de estudio) y X la variable independiente a y b son factores derivados de la ecuacin matemtica de la recta. Bsicamente, por medio de la regresin se pretende predecir el valor de una variable llamada genricamente Y, a travs de otra variable llamada X. La regresin se representa mediante un coeficiente R que oscila entre - 1 y + 1. Cuando la variable dependiente Y aumenta ante incrementos de la variable independiente X, el R es positivo y oscila entre 0 y 1. A su vez cuando Y disminuye ante incrementos de X el R es negativo, entre 0 y 1. Veamos algunos ejemplos para una mejor comprensin:

El grfico muestra la relacin existente entre sumatoria de puntos del Sistema Apache II a las 24 horas del ingreso y la probabilidad de mortalidad en terapia intensiva. El valor de R es 0,98 para un nivel de p < 0.001. El valor de R2 es 0.97. El R2 es un coeficiente importante en regresin. Se deduce de la elevacin al cuadrado de R y es representativo del grado de relacin entre variables. Un R2 de 0.97, significa que el valor de la probabilidad de mortalidad podr ser predecido en un 97% de las veces por el valor del Apache II.

Si analizamos la Probabilidad de sobrevida en UTI con respecto al valor del Apache II, obtenemos una curva de regresin similar pero negativa, con un R = - 0,98 y nuevamente un R2 de 0.97. Por lo tanto el valor de R2 indica el porcentaje de variabilidad de los valores de Y que pueden ser explicadas en funcin de la variabilidad de los valores de X. Los modelos de regresin no siempre son lineales y se basan en loa ecuacin pura de la recta. Existen tambin modificaciones de esta ecuacin de tal manera que se pueden practicar anlisis de regresin cuadrtica, cbica, logartmica, logstica, etc. Adems la regresin puede ser simple o mltiple, constituyendo un tipo de anlisis multivariado.

Esta es la llamada "Recta de regresin de dependencia de x respecto a y slo habra que cambiar en la expresin de la recta x por y, obtenindose la recta regresin de x sobre y. En la imagen siguiente se muestra la recta de regresin de y (peso) sobre x (talla) . En este caso se supone que represente cmo depende el peso de una persona de su talla.

Si recordamos que entre la talla y el peso decamos que exista una dependencia directa, la recta de regresin lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto: Dependencia directa - Pendiente de la recta positiva - Funcin creciente.

Ejemplo 4.- La recta de regresin de la variable y (talla) sobre x (peso) ser la recta: - que pasa por el punto (172,6 ; 66,3) - tiene de pendiente: 55,32 / 50,71 = 1,0909 Recta: y - 66,3 = 1,0909 (x - 172,6) que operando y simplificando queda: y = 1,0909x - 121,9 El valor del peso que suponamos aproximado para una talla de 185 cm sera: Peso 1.0909 185 - 121,9 = 79.9 Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas con la recta de regresin no son exactas.

También podría gustarte