Está en la página 1de 6

Regresión Probit

El Análisis Probit tiene el objetivo de ajustar un modelo de regresión en el cual la


variable dependiente Y caracteriza un evento con sólo dos posibles resultados. Los daos
a modelarse pueden presentarse en dos formas:
1. Datos en los que Y consiste en un conjunto de 0’s y 1’s, donde 1 representa la
ocurrencia de uno de los dos resultados.
2. Datos en los cuales Y representa la proporción de veces que ocurre uno de los
dos resultados.
El modelo de regresión relaciona a Y con una o más variables predictoras X, que pueden
ser numéricas o categóricas. En este procedimiento, se asume que la probabilidad de un
evento está relacionada con los predictores a través de la función probit.
Como se sabe, con este tipo de datos también se puede usar el procedimiento de
Regresión Logística pero éste emplea una forma funcional diferente.
El procedimiento ajusta un modelo usando máxima verosimilitud o mínimos cuadrados
ponderados. La selección por pasos de variables es una opción. Para probar la
significancia de los coeficientes del modelo se realizan pruebas de cociente de
verosimilitud. Se puede graficar el modelo ajustado y predicciones generados a partir
del mismo.
En muchas situaciones, los entomólogos están interesados en determinar cómo las tasas
de mortalidad cambian en función a la dosificación de un plaguicida. Por ejemplo, se
puede tener un interés particular en la determinación de la dosis de pesticida en la que
responde 50% (LD50), 75% (LD 75), o 90% (LD90), de una población de insectos.
La dosis letal mediana (LD50) se define como la exposición, es decir la dosis de un
pesticida, obtenida por estadística, que se espera que cause la muerte del 50% de una
población de insectos. Definiciones similares se aplican a LD75 y DL90.
Varios procedimientos se han sugerido para la estimación de la mejor opción de
dosificación para un insecticida. La variable respuesta en la investigación entomológica
pueden ser binaria o medida en escala ordinal en lugar de numérica o de manera
continua.

Bioestadística Avanzada - Luz Bullón 1


Ejemplo de Aplicación

La siguiente tabla contiene un conocido conjunto de datos de Bliss (1935), muestra los
resultados de experimentos en los cuales se expusieron escarabajos a diferentes
concentraciones de bisulfuro de carbono. El archivo de datos muestra la dosis (dose), el
número de escarabajos expuestos (exposed), y el número de escarabajos muertos
(killed).

Dose Exposed Killed


1.6907 59 6
1.7242 60 13
1.7552 62 18
1.7842 56 28
1.8113 63 52
1.8369 59 53
1.8610 62 61
1.8839 60 60

Para estos datos, la variable dependiente Y es la proporción de escarabajos expuestos a


cada dosis que murieron, calculada por Y = Killed / Exposed, es decir, Y = muertos /
expuestos. Hay una sola variable predictora X = Dose (dosis). Hay un total de n = 481
sujetos.

Probit Analysis: Killed, Exposed versus Dose

Distribution: Normal

Response Information

Variable Value Count


Killed Event 291
Non-event 190
Exposed Total 481

Estimation Method: Maximum Likelihood

Regression Table

Standard
Variable Coef Error Z P
Constant -34.9353 2.63950 -13.24 0.000
Dose 19.7279 1.48406 13.29 0.000
Natural
Response 0

Log-Likelihood = -185.679

Bioestadística Avanzada - Luz Bullón 2


Goodness-of-Fit Tests

Method Chi-Square DF P
Pearson 9.5134 6 0.147
Deviance 10.1198 6 0.120

Tolerance Distribution

Parameter Estimates

Standard 95.0% Normal CI


Parameter Estimate Error Lower Upper
Mean 1.77085 0.0037778 1.76345 1.77826
StDev 0.0506895 0.0038132 0.0437407 0.0587423

Binary Fitted Line Plot


P(Event) = exp(-60.72 + 34.27 Dose)/(1 + exp(-60.72 + 34.27 Dose))

1.0

0.8
Probability of Event

0.6

0.4

0.2

0.0
1.70 1.75 1.80 1.85 1.90
Dose

Table of Percentiles

95.0% Fiducial
Standard CI
Percent Percentile Error Lower Upper
1 1.65293 0.0101162 1.62992 1.67039
2 1.66675 0.0091584 1.64596 1.68260
3 1.67552 0.0085607 1.65613 1.69036
4 1.68211 0.0081173 1.66376 1.69621
5 1.68748 0.0077614 1.66996 1.70098
6 1.69204 0.0074623 1.67522 1.70504
7 1.69605 0.0072032 1.67984 1.70862
8 1.69963 0.0069742 1.68396 1.71182
9 1.70289 0.0067685 1.68771 1.71474
10 1.70589 0.0065815 1.69115 1.71743
20 1.72819 0.0052879 1.71655 1.73762
30 1.74427 0.0045148 1.73455 1.75250
40 1.75801 0.0040281 1.74957 1.76556
50 1.77085 0.0037778 1.76321 1.77818
60 1.78369 0.0037662 1.77636 1.79129
70 1.79743 0.0040196 1.78989 1.80585
80 1.81351 0.0046021 1.80515 1.82346
90 1.83581 0.0057435 1.82565 1.84856
91 1.83881 0.0059167 1.82837 1.85197
92 1.84207 0.0061087 1.83131 1.85569
93 1.84566 0.0063240 1.83454 1.85979

Bioestadística Avanzada - Luz Bullón 3


94 1.84966 0.0065693 1.83814 1.86437
95 1.85423 0.0068544 1.84224 1.86961
96 1.85959 0.0071960 1.84703 1.87578
97 1.86619 0.0076241 1.85292 1.88339
98 1.87496 0.0082052 1.86071 1.89352
99 1.88877 0.0091427 1.87295 1.90952

Binary Logistic Regression: Killed versus Dose

Method

Link function Logit


Rows used 8

Response Information

Event
Variable Value Count Name
Killed Event 291 Event
Non-event 190
Exposed Total 481

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 272.97 272.970 272.97 0.000
Dose 1 272.97 272.970 272.97 0.000
Error 6 11.23 1.872
Total 7 284.20

Model Summary

Bioestadística Avanzada - Luz Bullón 4


Deviance Deviance
R-Sq R-Sq(adj) AIC
96.05% 95.70% 376.47

Coefficients

Term Coef SE Coef VIF


Constant -60.72 5.18
Dose 34.27 2.91 1.00

Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Dose 7.64563E+14 (2.53864E+12, 2.30264E+17)

Regression Equation

P(Event) = exp(Y')/(1 + exp(Y'))

Y' = -60.72 + 34.27 Dose

Goodness-of-Fit Tests

Test DF Chi-Square P-Value


Deviance 6 11.23 0.081
Pearson 6 10.03 0.124
Hosmer-Lemeshow 6 10.03 0.124

Binary Fitted Line: Killed versus Dose

Binary Fitted Line Plot

Method

Link function Logit


Rows used 8

Response Information

Event
Variable Value Count Name
Killed Event 291 Event
Non-event 190
Exposed Total 481

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 272.97 272.970 272.97 0.000
Dose 1 272.97 272.970 272.97 0.000
Error 6 11.23 1.872
Total 7 284.20

Model Summary

Deviance Deviance

Bioestadística Avanzada - Luz Bullón 5


R-Sq R-Sq(adj) AIC
96.05% 95.70% 376.47

Coefficients

Term Coef SE Coef VIF


Constant -60.72 5.18
Dose 34.27 2.91 1.00

Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Dose 7.64563E+14 (2.53864E+12, 2.30264E+17)

Regression Equation

P(Event) = exp(-60.72 + 34.27 Dose)/(1 + exp(-60.72 + 34.27 Dose))

Bioestadística Avanzada - Luz Bullón 6

También podría gustarte