Está en la página 1de 11

CURSO: METODOLOGA DE INVESTIGACIN

(TCNICAS DE ANLISIS DE DATOS)

EL ANLISIS DE REGRESIN MLTIPLE

Anlisis de regresin mltiple

EL ANLISIS DE REGRESIN MLTIPLE: CONCEPTO


Mtodo multivariante que analiza la relacin entre una nica variable
dependiente (criterio) y varias variables independientes (predictores).
El objetivo es predecir cambios en la variable dependiente en respuesta
a cambios en varias de las variables independientes

Cada variable predictor es ponderada, indicando la ponderacin su


contribucin relativa a la prediccin conjunta

El conjunto de variables independientes ponderadas se denomina


valor terico de la regresin o ecuacin de regresin
Y= b0 + b1X1 + b2X2 +.....+ bn Xn

Tcnica de dependencia en la que los datos deben ser mtricos o


apropiadamente transformados

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (I)


Problema de investigacin

Primer paso

Seleccionar objetivo (s)


- Prediccin
- Explicacin
Seleccionar variables dep. e indep.

Segundo paso

Diseo de la investigacin
Seleccin del tamao muestral
Creacin de variables adicionales
No

Tercer paso

Supuestos en la regresin mltiple


Cumplen las variables individuales los
supuestos de:
normalidad
linealidad
homoscedasticidad?

Si

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (II)

Cuarto paso
Especificacin del investigador

Estimacin del modelo de regresin


especifica el investigador el modelo
o se utiliza algn procedimiento de
seleccin de las var. indep.?

Procedimiento de seleccin

Mtodo de estimacin secuencial


Estimacin progresiva/regresiva
Estimacin por etapas
Mtodo de combinacin
Examinar todas las
combinaciones posibles para
identificar la que mejor se ajusta
Cumple el valor terico de regresin los
supuestos del anlisis de regresin?
Si

Examinar significacin estadstica del modelo


Coeficiente de determinacin (R2)
Coeficiente de determinacin ajustado
Significacin de los coeficientes de regresin

No

A segundo paso:
Creacin de
variables
adicionales

Anlisis de regresin mltiple

DIAGRAMA DE DECISIN DE LA REGRESIN MLTIPLE (III)

Quinto paso

Interpretacin del valor terico de la regresin


Evaluar importancia relativa de las variables
independientes con los coeficientes beta
Valoracin de la multicolinealidad

Sexto paso

Validacin de los resultados


Contraste del modelo de regresin en
una nueva muestra de la poblacin

Dividir la muestra en dos partes y


utilizar una submuestra para crear el
modelo y otra para contrastarlo

Anlisis de regresin mltiple

OBJETIVOS DE LA REGRESIN MLTIPLE

Prediccin de la variable criterio con un conjunto de variables


independientes, de forma que se maximice el valor terico de
la regresin.
La prediccin del modelo elegido debe demostrar tanto
significacin prctica como estadstica

Explicacin objetiva del grado y carcter de la relacin entre


las variables independientes y la variable dependiente.
Concretamente:

Determinacin de la importancia relativa de cada variable

independiente sobre la variable dependiente (magnitud y direccin


de la relacin)

Evaluacin de la naturaleza de las relaciones entre las variables


independientes y la dependiente (lineal y/o curvilineal)

Evaluacin de las interrelaciones entre las variables independientes

Anlisis de regresin mltiple

CREACIN DE VARIABLES ADICIONALES

Transformaciones de las variables para cumplir los supuestos


Transformaciones ms comunes: inversa, raiz cuadrada y logaritmo

Incorporacin de datos no mtricos con variables ficticias


Cuando la variable dependiente se mide
como una variable dicotmica (0,1)

Cuando las variables independientes son


no mtricas, con dos o ms categoras

Anlisis discriminante
Regresin logstica

Se pueden sustituir por variables


ficticias. Cualquier variable no
mtrica con k categoras puede
representarse con k-1 variables
ficticias

Anlisis de regresin mltiple

SUPUESTOS EN LA REGRESIN MLTIPLE


NORMALIDAD
El perfil de la distribucin de los datos se corresponde con una distribucin normal. Si la variacin
respecto de la distribucin normal es amplia, los tests estadsticos resultantes no son vlidos,
dado que se requiere la normalidad para el uso de los estadsticos de la t y de la F.
La normalidad univariante ayuda a obtener normalidad multivariante, pero no la garantiza. La
normalidad multivariante implica que las variables individuales son normales.
cmo evaluarla?

1. Grfico de probabilidad normal de los residuos


2. Test de Kolmogorov-Smirnov sobre los residuos estandarizados
LINEALIDAD
Supuesto implcito en todas las tcnicas multivariantes basadas en medidas de correlacin.
Resulta necesario identificar cualquier desplazamiento de la linealidad que pueda impactar la
correlacin. cmo evaluarla? Examen visual de los residuos y Grfico de regresin parcial
HOMOSCEDASTICIDAD
Varianza constante del trmino de error. Se refiere al supuesto de que las variables dependientes
exhiban iguales niveles de varianza a lo largo del rango de los valores de las variables
independientes. cmo evaluarla?
1. Examen visual de los residuos
2. Test de Levene

Anlisis de regresin mltiple

MTODOS DE ESTIMACIN SECUENCIAL


Estimacin por etapas
(paso a paso stepwise)
1. Empezar con modelo de regresin simple,
seleccionando la variable independiente que
tenga la mayor correlacin con la variable
dependiente. Ecuacin: Y = b0 + b1X1
2. Examinar coeficientes de correlacin parcial
para encontrar una variable adicional que
explique la mayor parte del error que queda de
la primera ecuacin de regresin

3. Recalcular la ecuacin de regresin utilizando


las dos variables independientes, y examinar el
valor parcial F de la variable original del modelo
para ver si todava realiza una contribucin
significativa. Si no lo hace, se elimina. Si lo hace,
la ecuacin queda: Y = b0 + b1X1 + b2X2
4. Continuar este procedimiento con todas las
variables independientes restantes para ver si
deberan incluirse en la ecuacin. Si se incluye
alguna, hay que examinar las variables
previamente incluidas para juzgar si deben
mantenerse

Estimacin progresiva (forward) y


regresiva (backward)
El modelo de estimacin progresiva es similar
a la estimacin por etapas, mientras que la
estimacin regresiva implica calcular una
ecuacin de regresin con todas las variables
independientes, para a continuacin ir
eliminando aqullas que no contribuyan
significativamente.
La diferencia con la estimacin por etapas es
que en sta se pueden aadir o eliminar
variables en cada etapa, mientras que una vez
que se aade o elimina una variable en los
procedimientos de estimacin progresiva o
regresiva, no existe la posibilidad de revertir la
accin posteriormente.

Anlisis de regresin mltiple

EVALUACIN DE LA MULTICOLINEALIDAD
Situacin ideal: Tener una cantidad de variables independientes altamente
correlacionadas con la variable dependiente, pero con poca correlacin
entre s
Multicolinealidad: correlacin entre tres o ms variables independientes
Efecto
La multicolinealidad reduce el poder predictivo de cualquier variable
independiente individual, en la medida en que est asociado con las otras
variables independientes
A mayor colinealidad, la varianza nica explicada por cada variable
independiente se reduce y el porcentaje de prediccin compartida aumenta
Cmo detectar la existencia de multicolinealidad?
1. Examen de la matriz de correlacin de las variables independientes (altas correlaciones
indican elevada colinealidad)
2. Estadsticos de colinealidad: valor de tolerancia (TOL) y factor de inflacin de la varianza
(FIV) (valores de TOL prximos a 0 y elevados valores de FIV, superiores a 4, denotan
multicolinealidad)

Anlisis bivariante

TABULACIN CRUZADA
Mtodo de anlisis comnmente usado para clasificar variables categricas. A travs de una
tabla de contingencia, se cruzan dos variables y se interpretan los porcentajes.
Proporciona un valor chi-cuadrado, que permite contrastar si existe relacin entre las variables
que se cruzan. Valores significativos del estadstico indican que existe relacin.

EL ANLISIS DE LA VARIANZA (ANOVA)


Procedimiento para valorar las diferencias de grupo. Se utiliza para constrastar la hiptesis de
que varias medias muestrales son iguales. Las variables dependientes son mtricas, mientras
que el factor (variable independiente) es una variable categrica.
Proporciona un estadstico F. Valores significativos de F indican que existen diferencias
significativas entres las muestras.

REGRESIN SIMPLE
Mtodo univariante que analiza la relacin entre una variable dependiente (criterio) y una nica
variable independiente (predictor). El objetivo es predecir cambios en la variable dependiente
en respuesta a cambios en la variable independiente.

También podría gustarte