Está en la página 1de 4

Práctica Regresión Logística

En un estudio realizado con 70 pacientes víctimas de accidentes de tráfico con TCE se desea saber si variables del tipo lesión, la atención, el apoyo emocional o la edad del sujeto influyen en la rehabilitación total del paciente. La variable dependiente serían: Rehabilitación (0, no se rehabilita o 1, se rehabilita). Las variables independientes serían: apoyo (0, sin apoyo o 1, apoyo). Lesión (0 difusa o 1 localizada), Atención (0 no inmediata, o 1 inmediata) Edad.

Práctica Regresión Logística En un estudio realizado con 70 pacientes víctimas de accidentes de tráfico con
Práctica Regresión Logística En un estudio realizado con 70 pacientes víctimas de accidentes de tráfico con

1.

Especificación del modelo

VD = Rehabilitación VIs = Lesión (v1), Apoyo (v2), Atención (v3) y Edad (v4) El modelo logístico sería:

El término se llama LOGIT. Esto es importante.

  • 2. Estimación del modelo, valoración de ajuste y significación de los predictores.

¿Cuántos pasos establece el análisis? Debemos de ir a cualquier tabla que contenga una columna llamada Paso. Hay cogemos el mayor número. En este ejercicio son dos pasos. Por lo que hay dos pasos.

¿Quién entre en el primer paso? Para ello vamos a la tabla Variables en la ecuación. En ella vemos que en la fila Paso 1 entró edad. Esta es la VI que entró. Edad.

¿Y en el segundo? Miramos abajo y tenemos lesión.

¿El modelo final es estadísticamente significativo? Para saberlo tenemos que mirar la p en la tabla pruebas ómnibus. En ella aparece una columna con Chi-cuadrado y otra con Sig. Miramos la del paso 2 y vemos que la Significación es 0,000 que se pone: la significación es menor de 0,001. Ponemos el valor de Chi cuadrado también: 32, 012.

¿Valoración de ajuste? En esta práctica hay tres valoraciones: -2LL, la R2 de Cox y Snell y la R2 de Nagelkerke. Indicamos el valor de cada uno. Sus valores están en la tabla de resumen de los modelos. Ponemos sus valores: -2LL: 61,339; R2 de Cox y Snell es 0,367 y R2 de Nagelkerke es 0,498. En caso de que nos pida cuanto ganamos en valoración, haríamos la diferencia entre el -2LL del paso 1 y el 2. E indicamos que cuanto menor sea el -2LL mejor será el ajuste.

¿Número de casos correctamente clasificados? Usaremos la tabla de clasificación. Tenemos que comparar lo observado con lo pronosticado, y sumamos aquellos casos en los que acertáramos en el pronóstico (casos que predijimos que se rehabilitarían y lo hicieron y los que dijimos que no se rehabilitarían y no lo hicieron).

Significatividad de los coeficientes del modelo de regresión logística:

Aquí nos pedirá el valor de Wald de cada VI y su significatividad. Estos datos están en dos tablas distintas:

Variables en la ecuación y variables que no están en la ecuación. Miraremos el Wald en las que están en la ecuación y su significación, y en las que no están miraremos su puntuación y la significación (siempre será mayor de 0,05 y por eso no entraron). Nota: siempre miramos los valores en el paso 2.

Wald de apoyo = 1,514 y p(sig.) = 0,218. No influye significativamente ya que su significación es mayor de 0,05.

Wald de lesión = 7,086 y p(sig.) = 0,008. Influye significativamente ya que su significación es menor

de 0,05.

Wald de atención = 2,685 y p(sig.) = 0,101. No influye significativamente ya que su significación es mayor de 0,05.

Wald de edad = 13,737 y p(sig.) = <0,001. Influye significativamente ya que su significación es menor

de 0,05.

  • 3. Reespecificación del modelo.

Unicamente cogemos los valores que anotamos del Wald, y los sustituímos en la fórmula del modelo. Sólo en las variables que entraron, no las otras. Cogemos la a de la constante del paso 2 de la tabla variables que entraron en la ecuación.

  • 4. Interpretación de los coeficientes del modelo.

Para interpretarlo tenemos que ver las B en la tabla variables de la ecuación en el paso 2 siempre. Comenzamos con lesión. Sólo nos interesa el signo, y vemos que es + (+1,770). Por lo tanto concluimos que a mayor puntuación en lesión mayor probabilidad de rehabilitarse. Si el signo es positivo habrá una mayor probabilidad, si es negativo hay menos. Y ahora llega cuál sería su ODD Ratio. En esa misma tabla se obtiene el ODD Ratio del Exp(B). Y vemos que es 5,872. Siempre que sea el valor mayor de 1, será un factor protector. Si es menor es un factor de riesgo. Si es igual a 1 es indiferente. En este caso es un factor protector, por lo que tener una lesión focalizada (1) es un factor de protección. Para la edad, vemos que el valor de B es negativo (-0,154), así que hay menor probabilidad de rehabilitarse a mayor puntuación en edad. En la ODD Ratio, el Exp (b) es 0,858, por lo que es un factor de riesgo. Por lo que tener una mayor edad es un factor de riesgo.

  • 5. Simulación. Un individuo de 19 años con una lesión difusa.

Partiendo de esta fórmula:

Sustituimos los valores y tenemos que:

= 3,950 + 0 0,154*19

ESTO ES EL LOGIT: 1,024

= Inverso Ln 1,024 (En las calculadoras usamos e x y ponemos el número (1,024).

El resultado es 2,7843. Por lo que

= 2,7843. ESTO ES LA ODD: 2,7843

Partiendo de esto, ahora habría que despejar, por lo que:

P (Rehabilitarse) = 2,7843 * (1- P(Rehabilitarse) = 2,7843 2,7843P (Rehabilitarse) Volvemos a despejar y vemos que P + 2,7843P es 3,7843P por lo que:

3,7843P = 2,7843 Ahora despejamos P y vemos que: P = 2,7843/3,7843

P es 0,7357 o 73.57% de probabilidades de rehabilitarse. La probabilidad de no rehabilitarse es 1-P que es

26,43%

Siempre que nos pregunten (que lo harán) por probabilidad de rehabilitarse, hay que hacer esto. Si es mayor del 50%, predecimos que se rehabilita. Y si dice si acertamos, vamos a la matriz de datos para comprobar si este sujeto en concreto, o uno con sus mismas características si no nos lo dan se ha recuperado.

Con este modelo podemos hacer las variaciones que queramos. Si tiene una lesión focalizada o difusa, o mayor o menor edad.

Cuando nos pregunten por la ventaja de tener una lesión focalizada o una difusa (u otra variable) vamos al Exp(b) y vemos lo que nos dice: en este caso 5,872.

La Exp(b) puede calcularse obteniendo un cociente entre ODD. Antes calculamos una ODD. Podemos calcular otra variando la otra variable. El ejemplo nos pone que ahora el sujeto tiene una lesión localizada, por lo que tras despejar como antes vemos que la ODD es de 16,24. Hacemos el cociente entre la ODD2 y la ODD1 y tenemos el mismo valor que la Exp(B)