Está en la página 1de 11

Regresión simple

Tema 10 página 1
Introducción

La regresión y el análisis de correlación son las dos herramientas más poderosas y


útiles que los analistas de todo tipo tienen a su disposición para escrudiñar el
futuro.

La regresión se basa en la creencia de que se puede identificar y cuantificar alguna


relación funcional entre dos o más variables.

Se dice que una variable depende de la otra, Y depende de X, que se puede escribir
de la siguiente forma:

Y es la variable dependiente y X es la variable independiente.

Variable dependiente: Es la variable que se desea explicar o predecir; también se


le denomina regresando o variable de respuesta.

Variable independiente: Es la variable que se utiliza para explicar la variable


dependiente; también se le denomina variable explicativa o regresor.

Regresión simple: Establece que Y es una función de sólo una variable


independiente. También se le denomina regresión bivariada porque sólo hay dos
variables.

Regresión múltiple: Establece que Y es una función de dos o más variables


independientes, que se puede expresar como:

Tema 10 página 2
Regresión lineal: Es la relación entre X y Y que gráficamente se puede representar
por medio de una línea recta. Sostiene que a medida que X cambia, Y cambia en
una cantidad constante.

Regresión curvilinea: Es la relación entre X y Y que gráficamente se puede


representar con una curva. Sostiene que a medida que X cambia, Y cambia en una
cantidad diferente cada vez.

Diagrama de dispersión: Representa las observaciones por pares X y Y. Es habitual


colocar la variable independiente en el eje horizontal.

Tema 10 página 3
Determinación del modelo de regresión lineal simple

Dos puntos son necesarios para dibujar una línea recta que representa esta
relación lineal.

La ecuación de una línea recta se expresa como:

bo es el intercepto y b1 es la pendiente de la recta.

Ejemplo 1:

Ejemplo 2:

Tema 10 página 4
Las relaciones entre las variable son determinísticas o estocásticas.

Se dice que un modelo es determinístico porque la relación entre sus variables es


exacta y no hay error (salvo la aproximación).

Se dice que un modelo es estocástico porque la relación entre sus variables es


aleatoria y existe error. Esta relación se expresa como:

Esta representa la relación poblacional y son desconocidos y es el


término de error de la expresión.

El modelo poblacional se puede estimar sólo con datos muestrales de la siguiente


manera:

b0 y b1 son estimaciones de respectivamente y e es el término aleatorio


que habitualmente se le denomina residual cuando se utilizan datos muestrales.

El modelo de regresión estimado se expresa de la siguiente manera:

son el intercepto y la
pendiente de la recta de regresión estimada.

Tema 10 página 5
Mínimos cuadrados ordinario: La recta de mejor ajuste

El propósito de la regresión lineal es el de encontrar la recta que mejor se ajuste a


los datos muestrales.

Esta recta está determinada mediante la estimación de b0 y b1 mediante el proceso


matemático que se denomina mínimos cuadrados ordinarios (MCO).

El término del error: es la diferencia entre los valores reales de Y (Yi), y el estimado
de Y

Debido a que algunos errores son positivos y algunos son negativos, MCO
producirá una recta tal que la suma de esos errores sea cero:

MCO minimizará la suma de los errores elevados al cuadrado:

Para determinar esta recta de mejor ajuste , MCO requiere que se calcule la suma
de cuadrados y productos cruzados.

Suma de los cuadrados de X:

Suma de los cuadrados de Y:

Suma de los productos cruzados de X y Y:

Tema 10 página 6
Con la suma de los cuadrados y los productos cruzados, se calcula la pendiente de
la recta de regresión, llamada coeficiente de regresión y el intercepto.

Pendiente de la recta de regresión:

Intercepto de la recta de regresión:

Estos cálculos son extremadamente sensibles a las aproximaciones. Es importante


que se los haga con cuatro cifras decimales mínimo.

Tema 10 página 7
Tema 10 página 8
Análisis de correlación

El coeficiente de correlación es la medida de la fuerza de la relación


entre las dos variables, se le representa con la letra r. Puede asumir
valores entre - 1 y + 1.

Un valor r = -1 indica una relación negativa perfecta entre X y Y

Fórmula para calcular el coeficiente de correlación:

Tema 10 página 9
El coeficiente de determinación r²: Es otra medida quizá más
importante de la bondad de ajuste. Revela que porcentaje del
cambio en Y se explica por un cambio en X.

El coeficiente de determinación tiene significado sólo para las


relaciones lineales.

Se puede calcular elevando al cuadrado el coeficiente de correlación


o mediante la siguiente fórmula:

Tema 10 página 10
Ejercicio de aplicación

La gerencia de la aerolínea más pequeña del mundo, considera que existe una
relación directa entre los gastos publicitarios y el número de pasajeros que
escogen viajar en esta aerolínea. Para determinar si esta relación existe, el gerente
decidió utilizar los procedimientos MCO para determinar el modelo de regresión.
Se recolectaron valores mensuales por gastos de publicidad y número de pasajeros
para los n = 15 meses más recientes. Los datos aparecen en la siguiente tabla,
junto con otros caculos necesarios para hallar el modelo de regresión. Se observa
que los pasajeros están representados con la variable Y, ya que se asume que
depende de la publicidad.

Ejercicio de aplicación - Hoja de cálculo

Tema 10 página 11

También podría gustarte