Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FNSP U de A
03/04/15
ldbello@guajiros.udea.edu.co
Mtodos Cuantitativos.
FNSP U de A
dependiente debe ser constante para todos los valores de la variable independiente.
La relacin entre la variable dependiente y cada variable independiente debe ser
lineal y todas las observaciones deben ser independientes.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin
tpica. Para cada modelo: coeficientes de regresin, matriz de correlaciones,
correlaciones parciales y semiparciales, R mltiple, R cuadrado, R cuadrado
corregida, cambio en R cuadrado, error tpico de la estimacin, tabla de anlisis de
la varianza, valores pronosticados y residuos. Adems, intervalos de confianza al
95% para cada coeficiente de regresin, matriz de varianza-covarianza, factor de
inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia
(Mahalanobis, Cook y valores de influencia), DfBeta, DfAjuste, intervalos de
prediccin y diagnsticos por caso. Diagramas: diagramas de dispersin, grficos
parciales, histogramas y grficos de probabilidad normal.
Grficos. Los grficos pueden ayudar a validar los supuestos de normalidad,
linealidad e igualdad de las varianzas. Tambin son tiles para detectar valores
atpicos, observaciones poco usuales y casos de influencia. Tras guardarlos como
nuevas variables, dispondr en el Editor de datos de los valores pronosticados, los
residuos y otros valores diagnsticos, con los cuales podr poder crear grficos
respecto a las variables independientes. Se encuentran disponibles los siguientes
grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas
de la lista siguiente: la variable dependiente, los valores pronosticados tipificados,
los residuos tipificados, los residuos eliminados, los valores pronosticados
corregidos, los residuos estudentizados o los residuos eliminados estudentizados.
Represente los residuos tipificados frente a los valores pronosticados tipificados
para contrastar la linealidad y la igualdad de las varianzas.
Generar todos los grficos parciales. Muestra los diagramas de dispersin de los
residuos de cada variable independiente y los residuos de la variable dependiente
cuando se regresan ambas variables por separado sobre las restantes variables
independientes. En la ecuacin debe haber al menos dos variables independientes
para que se generen los grficos parciales.
METODOS DEPENDIENTES
ANALISIS DE REGRESION LINEAL MLTIPLE
Conceptualmente, el FIVi (Factor de incremento de la varianza) es la proporcin de
variabilidad de la isima variable, que explican el resto de las variables
independientes.
03/04/15
ldbello@guajiros.udea.edu.co
Mtodos Cuantitativos.
FNSP U de A
PASOS:
1.
2.
3.
4.
5.
6.
7.
8.
Identificar Xi, Y
Construr diagrama de dispersin
Estmar los parmetros del modelo.
Probar la signifcancia
Determinar la fuerza de la asociacin
Verificar la exactitud de la prediccin
Anlisis de residuales
Validacin cruzada del modelo
03/04/15
ldbello@guajiros.udea.edu.co
Mtodos Cuantitativos.
FNSP U de A
Ejemplo adaptado
03/04/15
ldbello@guajiros.udea.edu.co
Mtodos Cuantitativos.
FNSP U de A
REGRESIN LOGSTICA
La regresin logstica resulta til para los casos en los que se desea predecir la
presencia o ausencia de una caracterstica o resultado segn los valores de un
conjunto de variables predictoras. Es similar a un modelo de regresin lineal pero
est adaptado para modelos en los que la variable dependiente es dicotmica. Los
coeficientes de regresin logstica pueden utilizarse para estimar la razn de las
ventajas (odds ratio) de cada variable independiente del modelo. La regresin
logstica se puede aplicar a un rango ms amplio de situaciones de investigacin
que el anlisis discriminante.
Ejemplo. Qu caractersticas del estilo de vida son factores de riesgo de
enfermedad cardiovascular ? Dada una muestra de pacientes a los que se mide la
situacin de fumador, dieta, ejercicio, consumo de alcohol, y estado de enfermedad
cardiovascular , se puede construir un modelo utilizando las cuatro variables de
estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular
en una muestra de pacientes. El modelo puede utilizarse posteriormente para
derivar estimaciones de la razn de las ventajas para cada uno de los factores y
as indicarle, por ejemplo, cunto ms probable es que los fumadores desarrollen
una enfermedad cardiovascular frente a los no fumadores.
Datos. La variable dependiente debe ser dicotmica. Las variables independientes
pueden estar a nivel de intervalo o ser categricas; si son categricas, deben ser
variables dummy o estar codificadas como indicadores (existe una opcin en el
procedimiento para recodificar automticamente las variables categricas).
Supuestos. La regresin logstica no se basa en supuestos distribucionales en el
mismo sentido en que lo hace el anlisis discriminante. Sin embargo, la solucin
puede ser ms estable si los predictores tienen una distribucin normal
multivariante. Adicionalmente, al igual que con otras formas de regresin, la
multicolinealidad entre los predictores puede llevar a estimaciones sesgadas y a
errores tpicos inflados . El procedimiento es ms eficaz cuando la pertenencia a
grupos es una variable categrica autntica; si la pertenencia al grupo se basa en
valores de una variable continua (por ejemplo "CI alto " en contraposicin a "CI
bajo"), deber considerar el utilizar la regresin lineal para aprovechar la
informacin mucho ms rica ofrecida por la propia variable continua.
Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos
vlidos. Para cada variable categrica: codificacin de los parmetros. Para cada
paso: variables introducidas o eliminadas, historial de iteraciones, -2 log de la
verosimilitud, bondad de ajuste, estadstico de bondad de ajuste de HosmerLemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora, tabla de
clasificacin, correlaciones entre las variables, grfico de las probabilidades
pronosticadas y los grupos observados, chi-cuadrado residual. Para cada variable
de la ecuacin: Coeficiente (B), Error tpico de B, Estadstico de Wald, R, Razn de
las ventajas estimada (exp(B)), Intervalo de confianza para exp(B), Log de la
verosimilitud si el trmino se ha eliminado del modelo. Para cada variable que no
est en la ecuacin: Estadstico de puntuacin, R. Para cada caso: grupo
Len Daro Bello P.
03/04/15
ldbello@guajiros.udea.edu.co
Mtodos Cuantitativos.
FNSP U de A
03/04/15
ldbello@guajiros.udea.edu.co