Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3.3 SasA RegreCategoricas
3.3 SasA RegreCategoricas
INTERMEDIO
Giampaolo Orlandoni Josefa Ramoni
1. Modelos de regresin con variables categricas independientes 2. Modelos de regresin de respuesta cualitativa
LA CATEGORA A LA CUAL NO SE LE ASIGNA UNA VARIABLE DICOTMICA SE CONOCE COMO BASE, DE COMPARACIN, DE CONTROL O REFERENCIA. ESTA CATEGORA ES USADA COMO REFERENCIA PARA TODAS LAS COMPARACIONES. LA SELECCIN DE LA CATEGORA DE REFERENCIA QUEDA A DECISIN DEL INVESTIGADOR.
1 SEXO =
SI ES HOMBRE
Prog reg data=ehm97; model logsal=edad edad2 sector educa2 educa3; by sexo; run;
CREACIN DE DICOTMICAS
EJEMPLO 3I-5-POBRES
data TempArray; set pobres; array al(3) al1-al3; do i = 1 to 3; al(i)=(almuerzo=i); end; drop i; run;
CREACIN DE DICOTMICAS
EJEMPLO 3I-6-EHM97
do i = 1 to 3;
educa(i)=(educ=i); end;
drop i;
Run;
proc reg data=tcambio; model tcp = ipc tusacd ; proc reg data=tcambio; model tcp= ipc tusacd cc ccipc cctusa; run; EJEMPLO 3I-7-TCAMBIO data tcambiomod; set tcambio; label cc='CC'; if periodo<='15JAN2003'd then cc=0; else if periodo >'15JAN2003'd then cc=1; ccipc=ipc*cc; cctusa=cc*tusacd; run;
ADEMS DE LOS MTODOS BASADOS EN LA FUNCIN LOGSTICA, EXISTEN OTROS, COMO POR EJEMPLO, LOS BASADOS EN LA REGRESIN PROBABILSTICA.
Y=
Y=
MEDIO DE TRANSPORTE: BICICLETA / MOTO MEDIO DE TRANSPORTE: TAXI MEDIO DE TRANSPORTE: AUTOBS MEDIO DE TRANSPORTE: VEHCULO PROPIO LOG [(Prob(Y= i | X)/Prob(Y=k+1| X)] = i + iX i=1,2,,K
EN TODOS ESTOS MODELOS, LAS VARIABLES EXPLICATIVAS PUEDEN SER CATEGRICAS (CLASS) O VARIABLES CONTINUAS, CON O SIN INTERACCIN. TODOS ELLOS SE CONOCEN COMO EFFECTS.
PROC LOGISTIC
PROC LOGISTIC < options >; MODEL Y = X; RUN; Y PUEDE SER O NO NUMERICA
POR DEFECTO, PROC LOGISTIC ASIGNA EL VALOR ORDENADO 1 A LA RESPUESTA Y=0 Y EL VALOR ORDENADO 2 A LA RESPUESTA Y=1
COMO RESULTADO, PROC LOGISTIC MODELA LA PROBABILIDAD DE NO-EVENTO (NO TRABAJAR)
PROC LOGISTIC
PARA MODELAR EL EVENTO RECODIFICAR LA VARIABLE RESPUESTA: EVENT: INDIQUE EXPLCITAMENTE QUE OPCIN DE RESPUESTA DESEA MODELAR
model Y(event=1) = X;
REF: ESPECIFIQUE LA OPCIN DE REFERENCIA O DE NO-EVENTO
model Y(ref=0) = X;
DESCENDING: ESPECIFIQUE EL ORDEN DE LA VARIABLE RESPUESTA
model Y(descending)=X; ASIGNE FORMATO A LA VARIABLE , DE MODO TAL QUE EL PRIMER VALOR
FORMATEADO (UNA VEZ ORDENADOS) CORRESPONDA AL EVENTO
proc format;
1. EJEMPLO DE RESPUESTA BINARIA title 'REGRESION SOBRE DATOS DE REMISION DE CANCER'; proc logistic data=Remission outest=betas covout; model remiss(event='1')=cell smear infil li blast temp Output out=pred p=phat lower=lcl upper=ucl predprob=(individual crossvalidate); run;
Ordered Total Value remiss Frequency 1 0 18 2 1 9 Probability modeled is remiss=1. Model Fit Statistics Intercept and Covariates 35.751 44.822 21.751
Testing Global Null Hypothesis: BETA=0 Test Likelihood Ratio Score Wald Chi-Square 12.6211 9.4609 4.5302 DF 6 6 6 Pr > ChiSq 0.0495 0.1493 0.6053
Parameter
DF
Estimate
Pr > ChiSq
1 1 1 1 1 1 1
Odds Ratio Estimates Point Estimate >999.999 >999.999 <0.001 49.203 1.163 <0.001 95% Wald Confidence Limits <0.001 <0.001 <0.001 0.504 0.013 <0.001 >999.999 >999.999 >999.999 >999.999 101.191 >999.999
Association of Predicted Probabilities and Observed Responses Percent Concordant Percent Discordant Percent Tied Pairs 88.3 11.7 0.0 162 Somers' D Gamma Tau-a c 0.765 0.765 0.353 0.883
l i
1.9 1.4 0.8 0.7 1.3 0.6
Prob (Y=1 | X) Probabilidad estimada de remisin, dados los valores de las variables explicativas
Step 1 2 3 .
DF 1 1 1
Hosmer and Lemeshow Goodness-of-Fit Test Chi-Square 6.2983 7 DF Pr > ChiSq 0.5054
PROC LOGISTIC PERMITE 4 MTODOS DE SELECCIN: FORWARD, BACKWARD, STEPWISE Y BEST SUBSET
0.000 0.020 0.040 0.060 0.080 0.100 0.120 0.140 0.160 0.180 0.200
9 9 9 9 9 9 9 9 8 8 8
18 11 11 11 11 10 10 9 9 9 8
33.3 59.3 59.3 59.3 59.3 63.0 63.0 66.7 63.0 63.0 66.7
A un nivel de prob de 0.2: se clasificaron correctamente 8 eventos y 10 no eventos. 8 no eventos se clasificaron incorrectamente como eventos y 1 evento se clasifico incorrectamente como evento. La tasa de correcta especificacin fue 18/27=66.7%
1 1 1 1 1 1 1 1 1 1 1
158.485 <.0001 1 160.550 <.0001 0 132.948 <.0001 4 97.7087 <.0001 53.9704 <.0001 25.8374 <.0001 0.0633 0.8013
Tendencia hacia valores bajo de categora (desagrado) para el primer aditivo, comparado con el cuarto: El cuarto aditivo tiene mejor saber que le primero. Los otros son incluso peores que el primero. Ranking de preferencias: 4to, 1ro, 3ro, 2do
Odds Ratio Estimates Effect Additive 1 vs 4 Additive 2 vs 4 Additive 3 vs 4 Point Estimate 5.017 143.241 27.734 95% Wald Confidence Limits 2.393 56.558 12.055 10.520 362.777 63.805