Está en la página 1de 17

ESTADSTICA

SEMANA 6

NDICE
REGRESIN LINEAL ........................................................................................................................ 3
APRENDIZAJES ESPERADOS ........................................................................................................... 3
DEFINICIN DE REGRESIN LINEAL .......................................................................................... 3
EJEMPLO 1 ............................................................................................................................. 4
EJEMPLO 1.1 .......................................................................................................................... 5
EJEMPLO 1.2 .......................................................................................................................... 7
COEFICIENTE DE DETERMINACIN ........................................................................................... 8
COEFICIENTE DE CORRELACIN LINEAL .................................................................................... 8
EJEMPLO 1.3 .......................................................................................................................... 9
EJEMPLO 2 ............................................................................................................................. 9
EJEMPLO 2.1 ........................................................................................................................ 11
REGRESIN LINEAL MLTIPLE ..................................................................................................... 12
EJEMPLO 3 ........................................................................................................................... 13
COMENTARIO FINAL.................................................................................................................... 16
REFERENCIAS ............................................................................................................................... 17

ESTE DOCUMENTO CONTIENE LA SEMANA 6

REGRESIN LINEAL
APRENDIZAJES ESPERADOS
El objetivo de esta semana es comprender el tipo de problemtica donde se puede aplicar un
modelo de regresin lineal y, adems, calcular e interpretar los resultados de los diferentes
ejemplos.

INTRODUCCIN
El termino regresin tiene sus orgenes a principio del siglo XVIII, donde se utilizaba para buscar
relaciones entre una o ms variables que pueden aportar informacin para explicar otra variable
(variables independientes) y una variable que se quiere explicar (variable dependiente), la
evolucin del estudio y la aplicacin de esta tcnica en el mundo empresarial es en base a la
capacidad que tiene de analizar tendencias de datos histricos para poder predecir
comportamientos futuros de variables tan decisivas como las ventas, la produccin o los costos.

DEFINICIN DE REGRESIN LINEAL


Considrese n puntos en un plano cartesiano (X,Y), digamos (x1,y1), (x2,y2), (x3,y3), ,(xn,yn), la idea
geomtrica de regresin lineal, es encontrar una recta de la forma , que pase lo ms cerca de los
n puntos anteriores, es decir, la distancia entre estos puntos a la recta sea lo ms pequea posible.
Si se define como e1, e2, e3, ,en a estas distancias, se les puede escribir la funcin como:

Los parmetros de regresin

son conocidos como intercepto y pendiente,

respectivamente. Las estimaciones


que se obtienen al minimizar la suma
de los cuadrados de las distancias, son llamadas estimaciones del mtodo de los mnimos
cuadrados ordinarios, es decir:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

As la recta de regresin es:


son las soluciones a
variable Y recibe el nombre de variable dependiente y la variable X de independiente.

La

Solucin al problema de regresin


Con un poco de conocimientos en el clculo de mnimos y mximos, la solucin a:

EJEMPLO 1:
Considrese el nmero de empleados y los gastos fijos que se generan en cuatro empresas muy
similares, se cree que existe una relacin lineal entre ambas variables.

Al graficar los valores, queda clara la relacin lineal entre ambas variables, esta conclusin se basa
en el anlisis de las variables nmero de empleados y gastos fijos, ya que a medida que aumenta el
numero de empleados (eje x) tambin aumenta el monto de los gastos fijos, esto se puede
comprobar en el grfico que se muestra a continuacin:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

EJEMPLO 1.1:

Encontrar e interpretar estimadores de


en la siguiente tabla:

segn los datos presentados

De la tabla se obtiene:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

Si se determinan los errores y se dibuja la recta de regresin, quedara como sigue:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

EJEMPLO 1.2:
Al considerar la siguiente recta:
y construir una tabla equivalente a la anterior,
se determinarn los errores de la recta, tal como sigue:

Y se obtiene que la suma de los errores al cuadrado es 2.300, claramente muy superior a la recta
obtenida (en el ejemplo anterior) con el mtodo de los mnimos cuadrados.

ESTE DOCUMENTO CONTIENE LA SEMANA 6

COEFICIENTE DE DETERMINACIN
Es una medida estadstica que permite evaluar el ajuste de la ecuacin de regresin a los datos.
De acuerdo al resultado del
se pueden interpretar los valores cercanos a 0 como la inexistencia
del ajuste de la recta a los datos, el valor cercano a 1 se puede interpretar como la existencia de
un ajuste importante entre la variable dependiente y la(s) independiente(s).

Por lo tanto,
El coeficiente de determinacin corresponde al cuadrado del coeficiente de correlacin lineal.

COEFICIENTE DE CORRELACIN LINEAL


El coeficiente de correlacin (que es una medida de ajuste), cuantifica si el modelo lineal es
apropiado para determinar la relacin que existe entre las dos variables y se define como:

Interpretacin de resultados:
a) Para valores cercanos a 1 se puede decir que existe una alta asociacin lineal positiva, tal como
se presenta en el grfico A).
b) Para valores cercanos a -1 se puede decir que existe una alta asociacin lineal negativa, tal
como se presenta en el grfico B).
c) Para valores cercanos a 0 se puede decir que no existe asociacin lineal, sin descartar algn
otro tipo de asociacin, tal como se presenta en el grfico C).
Para la interpretacin, es mejor ocupar el valor que se obtiene de R2100 que indica el porcentaje
de la variabilidad de Y explicada por la variable X.
Grficamente, esto se interpreta a travs de los siguientes ejemplos:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

EJEMPLO 1.3:
Para continuar con el ejemplo anterior, revisemos el resultado del clculo de R y R2

La interpretacin de los resultados es la siguiente: un 99% de variabilidad de los gastos fijos de


estas empresas se explican por el nmero de empleados que la componen (revisar ejemplo 1)

EJEMPLO 2:
Una compaa local de energa seleccion una residencia tpica para desarrollar un modelo
emprico para el consumo de energa (en kilowatts por da) como una funcin de la temperatura
promedio diaria durante los meses de invierno. Se obtuvo la siguiente informacin durante un
periodo de 15 das.

a) Al graficar estos datos, sugiere la grfica una asociacin lineal?

ESTE DOCUMENTO CONTIENE LA SEMANA 6

De acuerdo al diagrama de dispersin (puntos), la grfica si sugiere una asociacin lineal negativa,
lo cual se ilustra a travs del grfico: el consumo de energa disminuye a medida que aumenta la
temperatura.

b) Para un modelo lineal simple, obtngase la ecuacin estimada de regresin y grafique esta
ecuacin sobre la grfica de la parte a) Al tabular los datos de la siguiente forma:

Se obtienen los siguientes resultados:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

10

Determinando las sumas de cuadrado se calcula el intercepto

y la pendiente

Finalmente, los estimadores:

Por lo que la ecuacin estimada de regresin quedara: La


representa la recta (color rojo) en el grfico de la parte a).

grfica

c) Interpretar los coeficientes de regresin estimados:


: Por cada grado de aumento de la temperatura, el consumo de energa disminuir en
aproximadamente 1,78 kW por da: o en forma equivalente por cada grado que disminuya la
temperatura, el consumo de energa aumentar en cerca de 1,78 kW por da.
: Cuando la temperatura alcanza los 0 Celsius, el consumo de energa es de aproximadamente
78,26 kW por da.

EJEMPLO 2.1:
a) Estimar los consumos individuales de energa para las siguientes temperaturas:
-10

-8

-5

-2

10

13

Reemplazando cada uno de los valores de x en la recta de regresin estimada, se obtiene

ESTE DOCUMENTO CONTIENE LA SEMANA 6

11

El resultado del reemplazo de cada una de las temperaturas planteadas, entrega un consumo
estimado, por lo tanto, una vez calculada la ecuacin de la recta, es posible interpolar valores de
consumo para distintas temperaturas, se obtiene a modo de ejemplo, para x = -10 se obtiene y =
78,26 1,78 (1)=96,06

b) Determinar el coeficiente de correlacin:

Se interpreta 100 R2 = 100 (-0,88)2 = 77,44 es decir 77,4% de la variabilidad en los consumos, se
pueden explicar por las temperaturas.

REGRESIN LINEAL MLTIPLE


Muchos de los problemas de regresin lineal no pueden ser resueltos solo con una variable
independiente, por lo tanto, es necesario ampliar la definicin anterior, incorporando 2 o ms
variables independientes, en el ejemplo nmero 3 se revisar un caso aplicado. En trminos
generales y simplificados la ecuacin quedara de la siguiente forma:

Para i = 1,2, n. Escribiendo el modelo para cada una de las observaciones, este puede ser
considerado como un sistema de ecuaciones lineales de la forma.

ESTE DOCUMENTO CONTIENE LA SEMANA 6

12

A continuacin se revisaran los resultados de un ejemplo aplicado de regresin lineal mltiple.

EJEMPLO 3:
Una determinada universidad realiz un estudio sobre la relacin que existe entre el coeficiente
intelectual (CI) con dos variables explicativas cantidad de horas de estudio semanal y el promedio
de sus calificaciones, para dicho estudio se obtuvo una muestra aleatoria de estudiantes de 8
bsico.
Alumno
1
2
3
4
5
6
7
8
9
10

CI
110
115
128
112
121
111
126
130
125
117

Tiempo estudio (hrs.) Promedio notas


4
55
5
63
9
68
8
47
14
68
5
49
8
67
11
50
20
66
9
65

Desarrollo:
Ci
119,5
7,47
55,83

Media
D.T
Varianza

Tiempo estudio (hrs.) Promedio notas


9,3
59,8
4,81
8,57
23,12
73,51

Los resultados obtenidos en Microsoft Excel son los siguientes:


Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,63552795
Coeficiente de determinacin R^2
0,40389577
Observaciones
10
Coeficientes calculados:
Parmetros ecuacin
Intercepto
TIEMPO estudio (hrs)
PROMEDIO notas

Coeficientes
98,5907347
0,7422419
0,234221

Por lo tanto, la ecuacin queda de la siguiente forma:


Anlisis de residuales
Observacin

Pronstico CI

ESTE DOCUMENTO CONTIENE LA SEMANA 6

Residuos
13

1
2
3
4
5
6
7
8
9
10

114,4
117,1
121,2
115,5
124,9
113,8
120,2
118,5
128,9
120,5

-4,4
-2,1
6,8
-3,5
-3,9
-2,8
5,8
11,5
-3,9
-3,5

NOTA: Para realizar un anlisis de regresin en Microsoft Excel, primero se debe ir a Archivo->
Opciones -> Complementos y habilitar el complemento anlisis de datos y luego ir a la opcin
Datos->Anlisis de datos-> Regresin
Las opciones anlisis de datos se encuentran en la siguiente ventana:

Luego seleccionar Regresin y se mostrar la siguiente ventana:

ESTE DOCUMENTO CONTIENE LA SEMANA 6

14

En esta ventana se deben seleccionar dos rangos de entrada, el rango correspondiente a la


variable dependiente (Y) y uno o ms columnas con la informacin de las variables independientes
(X).
Para complementar la informacin mencionada en esta semana revisar el siguiente link:
http://goo.gl/pqXY4

ESTE DOCUMENTO CONTIENE LA SEMANA 6

15

COMENTARIO FINAL
Durante esta semana aprendimos los conceptos bsicos del mtodo de regresin lineal simple, por
lo tanto, podemos complementar nuestro conocimiento sobre la construccin de grficos de
dispersin vistos en la semana 2 y agregar la recta de la ecuacin lineal, adicionalmente tambin
estamos en condiciones de interpretar los coeficientes de correlacin que se obtienen.

ESTE DOCUMENTO CONTIENE LA SEMANA 6

16

REFERENCIAS
Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadstica para
administracin y economa (10 edicin). Cencage Learning
Canavos, George. (1988). Introduccin y estadstica descriptiva. Probabilidad y estadstica.
Mxico: McGraw-Hill/Interamericana S. A.
Pagano, Robert R. (2011). Estadstica para las ciencias del comportamiento (9 edicin).
Cencage Learning.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:


IACC (2012). Estadstica. Semana 6.

ESTE DOCUMENTO CONTIENE LA SEMANA 6

17

También podría gustarte