Está en la página 1de 6

Mtodos Cuantitativos.

FNSP U de A

REGRESIN LINEAL MLTIPLE


La regresin lineal mltiple estima los coeficientes de la ecuacin lineal, con una o
ms variables independientes, que mejor prediga el valor de la variable
dependiente. Por ejemplo, se puede intentar predecir el total de facturacin lograda
por servicios prestados en una IPS cada mes (la variable dependiente) a partir de
variables independientes tales como: Tipo de servicio, edad, frecuencia del servicio,
tipo de usuario y los aos de antigedad en el sistema del usuario.
Mtodos de seleccin de variables en el anlisis de regresin lineal
La seleccin del mtodo permite especificar cmo se introducen las variables
independientes en el anlisis. Utilizando distintos mtodos se pueden construir
diversos modelos de regresin a partir del mismo conjunto de variables.
Para introducir las variables del bloque en un slo paso seleccione Introducir. Para
eliminar las variables del bloque en un solo paso, seleccione Eliminar. La seleccin
de variables Hacia adelante introduce las variables del bloque una a una
basndose en los criterios de entrada . La eliminacin de variables Hacia atrs
introduce todas las variables del bloque en un nico paso y despus las elimina una
a una basndose en los criterios de salida . La entrada y salida de variables
mediante Pasos sucesivos examina las variables del bloque en cada paso para
introducirlas o excluirlas . Se trata de un procedimiento hacia adelante por pasos.
Los valores de significacin de los resultados se basan en el ajuste de un nico
modelo. Por ello, estos valores no suele ser vlidos cuando se emplea un mtodo
por pasos (Pasos sucesivos, Hacia adelante o Hacia atrs).
Todas las variables deben superar el criterio de tolerancia para que puedan ser
introducidas en la ecuacin, independientemente del mtodo de entrada
especificado. El nivel de tolerancia por defecto es 0,0001. Tampoco se introduce una
variable si esto provoca que la tolerancia de otra ya presente en el modelo se site
por debajo del criterio de tolerancia.
Todas las variables independientes seleccionadas se aaden a un mismo modelo de
regresin. Sin embargo, puede especificar distintos mtodos de introduccin para
diferentes subconjuntos de variables. Por ejemplo, puede introducir en el modelo de
regresin un bloque de variables que utilice la seleccin por pasos sucesivos, y un
segundo bloque que emplee la seleccin hacia adelante. Para aadir al modelo de
regresin un segundo bloque de variables, pulse en Siguiente.
Regresin lineal: Consideraciones sobre los datos
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las
variables categricas, como la religin, estudios principales o el lugar de residencia,
han de recodificarse como variables binarias (dummy) o como otros tipos de
variables de contraste.
Supuestos. Para cada valor de la variable independiente, la distribucin de la
variable dependiente debe ser normal. La varianza de distribucin de la variable
Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

Mtodos Cuantitativos.
FNSP U de A

dependiente debe ser constante para todos los valores de la variable independiente.
La relacin entre la variable dependiente y cada variable independiente debe ser
lineal y todas las observaciones deben ser independientes.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin
tpica. Para cada modelo: coeficientes de regresin, matriz de correlaciones,
correlaciones parciales y semiparciales, R mltiple, R cuadrado, R cuadrado
corregida, cambio en R cuadrado, error tpico de la estimacin, tabla de anlisis de
la varianza, valores pronosticados y residuos. Adems, intervalos de confianza al
95% para cada coeficiente de regresin, matriz de varianza-covarianza, factor de
inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia
(Mahalanobis, Cook y valores de influencia), DfBeta, DfAjuste, intervalos de
prediccin y diagnsticos por caso. Diagramas: diagramas de dispersin, grficos
parciales, histogramas y grficos de probabilidad normal.
Grficos. Los grficos pueden ayudar a validar los supuestos de normalidad,
linealidad e igualdad de las varianzas. Tambin son tiles para detectar valores
atpicos, observaciones poco usuales y casos de influencia. Tras guardarlos como
nuevas variables, dispondr en el Editor de datos de los valores pronosticados, los
residuos y otros valores diagnsticos, con los cuales podr poder crear grficos
respecto a las variables independientes. Se encuentran disponibles los siguientes
grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas
de la lista siguiente: la variable dependiente, los valores pronosticados tipificados,
los residuos tipificados, los residuos eliminados, los valores pronosticados
corregidos, los residuos estudentizados o los residuos eliminados estudentizados.
Represente los residuos tipificados frente a los valores pronosticados tipificados
para contrastar la linealidad y la igualdad de las varianzas.
Generar todos los grficos parciales. Muestra los diagramas de dispersin de los
residuos de cada variable independiente y los residuos de la variable dependiente
cuando se regresan ambas variables por separado sobre las restantes variables
independientes. En la ecuacin debe haber al menos dos variables independientes
para que se generen los grficos parciales.

Grficos de residuos tipificados. Puede obtener histogramas de los residuos


tipificados y grficos de probabilidad normal que comparen la distribucin de los
residuos tipificados con una distribucin normal.

METODOS DEPENDIENTES
ANALISIS DE REGRESION LINEAL MLTIPLE
Conceptualmente, el FIVi (Factor de incremento de la varianza) es la proporcin de
variabilidad de la isima variable, que explican el resto de las variables
independientes.

Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

Mtodos Cuantitativos.
FNSP U de A

La tolerancia de una variable es la proporcin de variabilidad de la variable, que no


se explica por el resto de las variables independientes.
La tolerancia y el FIV son muy tiles en la construccin de modelos de regresin. Si
construimos un modelo paso a paso entrando las variables de una en una, es til
conocer la tolerancia o el FIV de las variables independientes ya entradas en la
ecuacin. De esta manera, las variables con mayor tolerancia son las que mayor
informacin aportarn al modelo.
Adems de la tolerancia y el FIV, debemos estudiar la matriz de correlaciones. Altas
correlaciones entre las variables implicadas en el modelo deben considerarse como
indicios de colinealidad.
Puede ocurrir que, aun siendo pequeas las correlaciones entre las variables exista
colinealidad. Supongamos que tenemos K variables independientes y construimos
otra que sea la media de los valores de las otras K variables, en este caso la
colinealidad ser completa, pero si K es grande, los coeficientes de correlacin
sern pequeos. Por lo tanto, el estudio de la matriz de correlaciones no es
suficiente.
Una tcnica que cada vez se utiliza ms, aunque resulta algo sofisticada, es el
anlisis de los autovalores de la matriz de correlaciones o de la matriz del producto
cruzado.
A partir de los autovalores, se puede calcular l INDICE DE
CONDICIONAMIENTO IC tanto global del modelo como de cada variable.
El ndice de condicionamiento, es la raz cuadrada del cociente entre el mximo y el
mnimo autovalores. Si el IC es mayor que 30, existe colinealidad elevada, si el IC
es mayor que 10 y menor que 30, la colinealidad es moderada, si el IC es menor
que 10, no existe colinealidad.
Tambin es interesante el ndice de condicionamiento para cada variable Ici, que es
la raz cuadrada del cociente del mximo autovalor y el isimo autovalor. La
varianza de cada coeficiente de regresin, incluida la constante, puede ser
descompuesta como la suma de componentes asociadas a cada uno de los
autovalores si el porcentaje de la varianza de algunos coeficientes de correlacin se
asocia con el mismo autovalor, hay evidencia de colinealidad.

PASOS:
1.
2.
3.
4.
5.
6.
7.
8.

Identificar Xi, Y
Construr diagrama de dispersin
Estmar los parmetros del modelo.
Probar la signifcancia
Determinar la fuerza de la asociacin
Verificar la exactitud de la prediccin
Anlisis de residuales
Validacin cruzada del modelo

Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

Mtodos Cuantitativos.
FNSP U de A

REGRESION MULTIPLE DE VARIABLE FICTICIA 1


La utilizacin de la regresin en la investigacin de mercados podra verse
seriamente limitada por el hecho de que las variables independientes
deben presentarse en escalas de intervalos. Afortunadamente, existe una
forma de emplear variables independientes nominales dentro de un
contexto de regresin. El procedimiento recibe el nombre de Regresin
Mltiple de Variable Ficticia RMVF. Bsicamente RMVF convierte las
variables nominales en una serie de variables binarias que se codifican 01 por ejemplo, suponemos que deseamos utilizar la variable nominal
Sexo en una regresin. Podramos codificarla de la siguiente manera:
CATEGORIA
CODIGO
Masculino
0
Femenino
1
El intervalo entre 0 y 1 es igual y, por tanto, aceptable en la regresin. Ntese que
hemos convertido una variable nominal de dos categoras en una variable 0-1
podemos extender este enfoque a una variable nominal de mltiples categoras. La
variable nominal de cuatro categoras, rea de estudio 2, puede convertirse en tres
variables ficticias, x1, x2, y x3 de la siguiente manera:
AREA
x1
X2
X3
Humanidades
1
0
0
Salud
0
1
0
Matemticas
0
0
1
C. Naturales
0
0
0
Esta variable nominal de cuatro categoras se convierte en K-1 categoras son 0 1,
la K-sima categora se determina automticamente como 0 1. Crear una k-sima
variable ficticia sera redundante y, de hecho, invalidara toda la regresin. Es
arbitraria la eleccin de la categora en la cual todo equivale a cero.
Ntese que slo una de las variables x1, x2, x3 tomar el valor de 1 para cualquier
individuo y las otras dos X sern cero
R. Humano = a + b Humanidades + c Salud + d Matemticas + e C.Naturales
En una regresin podemos tener la cantidad de variables ficticias que sean
necesarias, sujetas a la restriccin de que cada variable ficticia utiliza un grado de
libertad. Por lo mismo, debemos contar con un tamao de muestra adecuado.

Tomado del texto Investigacin de Mercados. Kinnear y Taylor

Ejemplo adaptado

Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

Mtodos Cuantitativos.
FNSP U de A

REGRESIN LOGSTICA
La regresin logstica resulta til para los casos en los que se desea predecir la
presencia o ausencia de una caracterstica o resultado segn los valores de un
conjunto de variables predictoras. Es similar a un modelo de regresin lineal pero
est adaptado para modelos en los que la variable dependiente es dicotmica. Los
coeficientes de regresin logstica pueden utilizarse para estimar la razn de las
ventajas (odds ratio) de cada variable independiente del modelo. La regresin
logstica se puede aplicar a un rango ms amplio de situaciones de investigacin
que el anlisis discriminante.
Ejemplo. Qu caractersticas del estilo de vida son factores de riesgo de
enfermedad cardiovascular ? Dada una muestra de pacientes a los que se mide la
situacin de fumador, dieta, ejercicio, consumo de alcohol, y estado de enfermedad
cardiovascular , se puede construir un modelo utilizando las cuatro variables de
estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular
en una muestra de pacientes. El modelo puede utilizarse posteriormente para
derivar estimaciones de la razn de las ventajas para cada uno de los factores y
as indicarle, por ejemplo, cunto ms probable es que los fumadores desarrollen
una enfermedad cardiovascular frente a los no fumadores.
Datos. La variable dependiente debe ser dicotmica. Las variables independientes
pueden estar a nivel de intervalo o ser categricas; si son categricas, deben ser
variables dummy o estar codificadas como indicadores (existe una opcin en el
procedimiento para recodificar automticamente las variables categricas).
Supuestos. La regresin logstica no se basa en supuestos distribucionales en el
mismo sentido en que lo hace el anlisis discriminante. Sin embargo, la solucin
puede ser ms estable si los predictores tienen una distribucin normal
multivariante. Adicionalmente, al igual que con otras formas de regresin, la
multicolinealidad entre los predictores puede llevar a estimaciones sesgadas y a
errores tpicos inflados . El procedimiento es ms eficaz cuando la pertenencia a
grupos es una variable categrica autntica; si la pertenencia al grupo se basa en
valores de una variable continua (por ejemplo "CI alto " en contraposicin a "CI
bajo"), deber considerar el utilizar la regresin lineal para aprovechar la
informacin mucho ms rica ofrecida por la propia variable continua.
Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos
vlidos. Para cada variable categrica: codificacin de los parmetros. Para cada
paso: variables introducidas o eliminadas, historial de iteraciones, -2 log de la
verosimilitud, bondad de ajuste, estadstico de bondad de ajuste de HosmerLemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora, tabla de
clasificacin, correlaciones entre las variables, grfico de las probabilidades
pronosticadas y los grupos observados, chi-cuadrado residual. Para cada variable
de la ecuacin: Coeficiente (B), Error tpico de B, Estadstico de Wald, R, Razn de
las ventajas estimada (exp(B)), Intervalo de confianza para exp(B), Log de la
verosimilitud si el trmino se ha eliminado del modelo. Para cada variable que no
est en la ecuacin: Estadstico de puntuacin, R. Para cada caso: grupo
Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

Mtodos Cuantitativos.
FNSP U de A

observado, probabilidad pronosticada, grupo pronosticado, residuo, residuo


tipificado.
Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables o
cualquiera de los siguientes mtodos por pasos: Condicional hacia adelante, LR
hacia adelante, Wald hacia adelante, Condicional hacia atrs, LR hacia atrs o Wald
hacia atrs.
REGRESIN LOGSTICA MULTINOMIAL
La opcin Regresin logstica multinomial resulta til en aquellas situaciones en las
que desee poder clasificar a los sujetos segn los valores de un conjunto de
variables predictoras. Este tipo de regresin es similar a la regresin logstica, pero
ms general, ya que la variable dependiente no est restringida a dos categoras.
Datos. La variable dependiente debe ser categrica. Las variables independientes
pueden ser factores o covariables. En general, los factores deben ser variables
categricas y las covariables deben ser variables continuas.

Len Daro Bello P.

03/04/15

ldbello@guajiros.udea.edu.co

También podría gustarte