Está en la página 1de 21

Tema 2.

Mtodos de
Regresin Estadstica

Parte I: Introduccin y Regresin simple

Mtodos Estadsticos en Ordenador


Grado en Relaciones Laborales y Recursos Humanos

INTRODUCCIN
El Anlisis de Regresin tiene como objetivo estudiar la
relacin entre variables.
Permite expresar dicha relacin en trminos de una
ecuacin que conecta una variable de respuesta Y, con
una o ms variables explicativas X1,X2,,Xk.
Finalidad:
Determinacin explcita del funcional que relaciona las
variables. (Prediccin)
Comprensin por parte del analista de las interrelaciones
entre las variables que intervienen en el anlisis.

EJEMPLOS
Se quiere estudiar la posible relacin existente entre la tasa de
desempleo en cierta regin con la tasa de delitos durante un
periodo de recesin econmica.
Como resultado de una nueva poltica empresarial, se ha
aumentado progresivamente la inversin en formacin de los
empleados en una multinacional. Se sospecha que este
incremento en inversin ha tenido gran importancia en los
beneficios de la empresa. Se desea describir cmo son los
beneficios en funcin de los gatos en inversin.
Describir la relacin entre la renta anual familiar y los gastos
en ocio.
Una empresa desea conocer la ecuacin que permita describir
(y predecir) las ventas de un producto en funcin de la
inversin en publicidad en televisin, en publicidad en radio y
en los peridicos.

PLANTEAMIENTO GENERAL
Notacin:
Y variable de respuesta (dependiente, endgena, explicada)
X1,X2,,Xk variables explicativas (independientes, exgenas,
regresores)

Modelo general de Regresin:


Y = m (X1,X2,,Xk ) +
m funcin de regresin
residuos del modelo (errores de observacin, inadecuacin del
modelo)

Variantes del Anlisis de Regresin


en SPSS
Segn el nmero de v. explicativas: Simple o Mltiple.
Supuestos sobre la funcin de regresin
Regresin lineal

Y = 0 + 1 X1+ 2 X2 ++ k Xk +
Estimacin curvilnea (Potencial, exponencial, hiperblica, etc.)
Y = exp (a + b X)

ln Y = a + b X
Linealizacin

Regresin no lineal (Algoritmos de estimacin iterativos)

Variantes del Anlisis de Regresin


en SPSS
Tipo de datos
Regresin logstica, Modelos Probit (La variable de respuesta
es binaria)
Regresin ordinal (La variable de respuesta es de tipo ordinal)
Escalamiento ptimo o regresin categrica (Las variables
explicativas y/o explicada, pueden ser nominales)
Situaciones especiales en la estimacin del modelo lineal: Mnimos
cuadrados en dos fases (correlacin entre residuos y v. explicativas),
estimacion ponderada (situacin de heterocedasticidad)

Submen REGRESIN
Regresin lineal mltiple

Ajuste de curvas mediante linealizacin

Modelos de regresin con


respuestas binarias u ordinales
Modelos de regresin no lineales

Modelos de regresin con


variables categricas

Correcciones en el modelo lineal

PARTE I: REGRESIN SIMPLE


Ejemplo 1: Se quiere estudiar la posible relacin
existente entre la tasa de desempleo en cierta
regin del sur de Europa con la tasa de delitos
durante 15 meses, en esa zona en un periodo de
recesin econmica.
Datos: Muestra de las tasas de desempleo y delitos
en 15 meses
Variables:
Tasa de desempleo
Tasa de delitos
Objetivo: Estudiar la influencia que tiene la tasa de
desempleo en la tasa de delitos.

Regresin simple

ejregsimple_1.sav

Regresin lineal simple


-Modelo tericoModelo lineal

Y = 0 + 1 X +

(1)

Parmetros
1 magnitud del efecto que X tienen sobre Y (incremento en la media de
Y cuando X aumenta una unidad)
0 trmino constante (promedio de Y cuando X vale 0)
residuos (perturbaciones aleatorias, error del modelo)

Hiptesis: Los residuos se suponen variables aleatorias incorreladas,


normales con media cero y la misma varianza.
Datos (observaciones, muestra) { (Yi, Xi) : i = 1,,n }
PROBLEMA

Suponiendo que la relacin entre las variables es como


en (1), estimar los coeficientes de la regresin: 0 y 1

Paso inicial: Explorar la relacin entre


las variables: diagrama de dispersin

Grficos / Cuadros de dilogo antiguos / Dispersin/puntos

Ajustar un modelo lineal mediante


regresin simple

Problema de mnimos cuadrados


2

Minimizar
0 , 1

{ Y (
i=1

+ 1Xi ) }

Objetivo: Hacer mnima la suma


residual de cuadrados:
2

{ Y (
i =1

+ 1X i ) } = Yi Y
i
i =1

} =
2

i =1

2
i

Solucin:

= s xy
1
s2x
0 = y 1x

Estimacin de los parmetros del


modelo lineal: ejemplo 1
Modelo terico:

T_Delito = 0 + 1 T_Desempleo +

Datos: ( xi , yi ) / yi = 0 + 1 xi + i

( i = 1, 2,..., n=15 )

Parmetros del modelo:


0 Tasa media de delitos en un mes donde la tasa de desempleo es cero
1 Incremento medio en la tasa de delitos cuando la tasa de desempleo se
incrementa en una unidad

Estimacin de los parmetros del


modelo lineal: ejemplo

s xy
1 = 2 = 1.663
sx
= y x = 5.296
0

La recta de regresin ajustada es:


Tasa de delitos = 5.296 + Tasa de desempleo * 1.663
Interpretacin:
Pendiente (1.663): Por cada unidad de que aumenta la tasa de desempleo, la
tasa de delitos aumenta en 1.663 unidades.
Ordenada en el origen (5.296): Cuando la tasa de desempleo es de 0 unidades
la tasa de delitos media es de 5.296 unidades

Estudio de la bondad del ajuste:


ANOVA del modelo de regresin
BONDAD DEL AJUSTE:
Descomposicin de la variabilidad

(Y y ) = (Y y )
2

i =1

VT

i =1

COEFICIENTE DE DETERMINACIN

0 R2 1

VE

(Y Y )

i =1

VNE

VE
VNE
R =
= 1
VT
VT
2

Estudio de la bondad del ajuste:


ANOVA del modelo de regresin
N

i =1

( yi y ) 2 =

VT

i =1

( y i y ) 2 +

VE

e
i =1

2
i

VNE

VE
VNE
VT

R2 =

VE
VNE
= 1
VT
VT

La bondad del ajuste viene dada por el coeficiente de determinacin R2 = 0.897.


Interpretacin: el 89.7% de la variabilidad de la tasa de delitos queda explicada por
la tasa de desempleo mediante el modelo lineal ajustado

Contraste de Regresin
OBJETIVO: Verificar la existencia de regresin lineal entre X e Y
FORMULACIN

H0: 1 = 0
H1: 1 0

H0: R2= 0
H1: R2 0

Aceptar la hiptesis nula H0 significara que las variables no estn


asociadas de forma lineal, esto es, el modelo lineal no es
adecuado para describir la posible relacin entre X e Y
TABLA ANOVA
FUENTE

SUMA DE
CUADRADOS

G.D.L.

MEDIA
CUADRTICA

MODELO

VE

VE

VNE

N-2

VNE/(N-2)

VT

N-1

RESIDUAL
TOTAL

Fexp

p-valor

VE
VNE

N-2

El p-valor es 0.000,
menor que 0.05,
entonces se rechaza la
hiptesis nula y por
tanto existe relacin
lineal entre las variables

Contraste de la ordenada en el origen


OBJETIVO: Verificar si tiene sentido incluir un trmino constante
en la ecuacin de la recta
FORMULACIN

H0: 0 = 0
H1: 0 0

Aceptar la hiptesis nula H0 significara que la constante se puede


eliminar del modelo, esto es, es ms adecuado describir la relacin
de dependencia de Y con X mediante una ecuacin del tipo Y= 1X

El p-valor=0.071>0.05, entonces se acepta la


hiptesis nula y por tanto parece
conveniente eliminar la constante del modelo.
No obstante el p-valor no es demasiado
grande.

EJERCICIO PROPUESTO 1
Enunciado: Como resultado de una nueva poltica
empresarial, se ha aumentado progresivamente la
inversin en formacin de los empleados en una
multinacional de software. Se sospecha que este
incremento en inversin ha tenido gran importancia en
los beneficios de la empresa. Se recogen datos
correspondientes a los gastos en inversin (en millones
de euros) y a los beneficios brutos de la empresa (en
millones de euros) en los ltimos diez meses.
a) Representa el diagrama de dispersin
b) Ajustar un modelo lineal y estudiar la bondad del
ajuste
c) Comprobar si existe relacin lineal entre las
variables.
d) Utilizando la opcin de regresin curvilnea,
realizar un ajuste exponencial. Comparar la
bondad de este ajuste con la del modelo lineal.
Qu modelo es preferible?

ejregsimple_2.sav

SOLUCIN
(a) Diagrama de dispersin

(b) Ajuste del modelo lineal (coeficientes y bondad del ajuste)

(c) Contraste de regresin (existencia de relacin lineal entre las variables)

SOLUCIN
(d) Ajuste del modelo
exponencial y comparacin
con el modelo lineal

EJERCICIO PROPUESTO 2
Enunciado: Se ha realizado un estudio para conocer si
existe relacin lineal entre la renta mensual de una
familia, en euros y el gasto en actividades de tipo
cultural, en euros. Los datos aparecen en la tabla
adjunta. Se pide:
a) Representa el diagrama de dispersin. Qu
modelo crees conveniente emplear?
b) Realiza un ajuste lineal, interpreta los
coeficientes de regresin y obtn el gasto en
actividades culturales de una familia con una renta
mensual disponible de 2500 euros.
c) Existe relacin lineal? Razona la respuesta.
d) A partir del resultado obtenido en el apartado c),
qu puedes afirmar ahora sobre la prediccin
obtenida en el apartado b)?
e) Tiene sentido considerar otros modelos?
Razona la respuesta

También podría gustarte