Está en la página 1de 25

ANALISIS DE REGRESION

Introducción

• El objetivo de muchas investigaciones es el comprender y explicar las


relaciones entre variables. Frecuentemente, se requiere conocer como y en
que medida una variable de respuesta se relaciona con un grupo de variables.
El análisis de regresión es una técnica estadística para el modelamiento y la
investigación de la relación entre 2 o mas variables.

• Por ejemplo, en un proceso químico, supóngase que el rendimiento del


proceso esta relacionado con la temperatura de operación. El análisis de
regresión puede usarse para construir un modelo que permita conocer el
rendimiento para una temperatura dada.
Regresión lineal simple

Sean dos variables “x” y “y”, suponga que se quiere explicar el comportamiento de
“y” con base en los valores que toma x. Para esto, se mide el valor de “y” sobre un
conjunto de “n” valores de “x”, con lo que se obtienen “n” pares ordenados (x1, y1),
(x2, y2), …, (xn, yn).

A “y” se le llama la variable dependiente o la variable de respuesta y a “x” se le


conoce como la variable independiente o la variable regresora.

La variable “x” no necesariamente es aleatoria, ya que en muchas casos el


investigador fija estos valores; en cambio, “y” sí es una variable aleatoria.
Una manera de estudiar el comportamiento de “y” con respecto a “x” es mediante un
modelo de regresión que consiste en ajustar un modelo matemático de la forma:

y = f (x)

Suponga que las variables “x” y ”y” están relacionadas linealmente y que para cada valor
de “x”, la variable dependiente, “y”, es una variable aleatoria. Es decir, que cada
observación de “y” puede ser descrita por el modelo:

y = β0 + β1x +ε

esta ecuación es conocida como el modelo de regresión lineal simple. Bajo el supuesto
de que este modelo es adecuado y como el valor esperado del error es cero, E(ε) = 0, se
puede ver que el valor esperado de la variable “y”, para cada valor de “x”, esta dado por
una línea recta
E(yІx) = β0 + β1x
Ejemplo 1.

En un laboratorio se quiere investigar la forma en la que se relaciona la cantidad de fibra


(madera) en la pulpa con la resistencia del producto (papel). Los datos obtenidos en un
estudio experimental se muestran en la tabla.
Tabla. Datos de resistencia del papel
Condiciones para la regresión lineal
(Homogeneidad de la varianza )
Regresión lineal múltiple

• Una extensión natural del modelo de regresión lineal simple consiste en considerar
mas de una variable explicativa.

• Los modelo de regresión múltiple estudian la relación entre una variable de


interés Y (variable respuesta o dependiente) y un conjunto de variables explicativas
o regresoras X1, X2, . . . , Xp

• En el modelo de regresión lineal múltiple se supone que la función de regresión


que relaciona la variable dependiente con las variables independientes es lineal, es
decir:

Y = β0 + β1X1 + β2X2 + · · · + βpXp + ε


Factor 2
X2
Factor 1
X1
Variable dependiente

Factor n
Xn

Factor 1
X3
• Modelo determista (funcional)

Función: Y=f(x1, x2, …xn)

Y= β0 + β1x1 + β2x2+…+βnxn

• Modelo estocástico (real)


Función: Y=f(x1, x2, …xn)+ u

Y= β0 + β1x1 + β2x2+…+βnxn + u
Análisis de la muestra

𝑦1 𝑥1 1 𝑥11 … 𝑥1𝑘 𝑥1
𝑦2 𝑥2 1 𝑥21 … 𝑥2𝑘 𝑥2
. . . . .
𝑦= . 𝑥1 = . 𝑋= = .
. . . .
. . . . . .
𝑦𝑛 𝑥𝑛 1 𝑥𝑛1 … 𝑥𝑛𝑘 𝑥𝑛
• Forma vectorial
𝑦1 = 𝛽0 + 𝛽1𝑥11 + ⋯ + 𝛽𝑛𝑥1𝑘 + 𝑢1

𝑦2 = 𝛽0 + 𝛽1𝑥21 + ⋯ + 𝛽𝑛𝑥2𝑘 + 𝑢2
________________________________
𝑦𝑛 = 𝛽0 + 𝛽1𝑥𝑛1 + ⋯ + 𝛽𝑛𝑥𝑛𝑘 + 𝑢𝑛

• Forma matricial
𝒚=𝑿𝜷+𝒖
𝑦1 𝑥1 1 𝑥11 … 𝑥1𝑘 𝑥1 𝛽0 𝑒1
𝑦2 𝑥2 1 𝑥21 … 𝑥2𝑘 𝑥2 𝛽1 𝑒2
. . . . .
= . 𝛽=
. .
𝑦= . 𝑥1 = . 𝑋= 𝑒=
. . . . . .
. . . . . . . .
𝑦𝑛 𝑥𝑛 1 𝑥𝑛1 … 𝑥𝑛𝑘 𝑥𝑛 𝛽𝑛 𝑒𝑛
Calculo de los coeficientes

a)Estimación por mínimos cuadrados b)Función de máxima verosimilitud

• Objetivo • Objetivo
Estima los parámetros de la población Estima los parámetros de la población

• Función • Función
Minimizar los errores de los residuos Maximizar la probabilidad de ocurrencia

• Idea • Idea
Buscar los β que minimicen el error Buscar los β que hagan la función de densidad
lo mas probable posible

También podría gustarte