Está en la página 1de 20

1

Identificacin de individuos con mayores vulnerabilidades de


contraccin de una enfermedad de transmisin sexual: Una
aproximacin con el modelo Poisson de ceros inflados

Jorge Salgado

16 de noviembre de 2011









RESUMEN













Este trabajo tiene como objetivo identificar a un vector de variables que
incrementa la probabilidad de contraer una enfermedad de transmisin sexual en
Espaa, utilizando la informacin provista por la encuesta de Salud y Hbitos
Sexuales elaborada por el INE. Se emplea una metodologa fundamentada en un
modelo ZIP adecuado para variables con ceros estructurales. La evidencia
emprica encontrada parece sugerir que la probabilidad de contraer una ETS se
incrementa en los varones, en los agentes que empiezan su actividad sexual de
manera ms temprana, en los que han utilizado drogas inyectables, en los que han
tenido ms parejas sexuales, y en los residentes de determinadas Comunidades.

2

1. INTRODUCCIN

Durante un prologando intervalo de tiempo, profesionales clnicos y
practicantes de salud pblica involucrados en el diagnstico de enfermedades sexuales
haban distinguido a subgrupos de usuarios con quienes interactuaban ms
frecuentemente que con otros. Esta dinmica constituy un indicativo sobre la
posibilidad que un pequeo nmero de infectados sea directa o indirectamente
decisivos en la expansin de una enfermedad de transmisin sexual. Ms
recientemente, a este grupo estratgico de la poblacin, ha sido conceptualizado como
core o ncleo de la enfermedad de transmisin sexual (Thomas y Tucker, 1996).

En particular, la investigacin del ncleo de la poblacin infectada por
enfermedades de transmisin sexual (ETS)
1
ha sido ampliamente discutida en una
dimensin terica y conceptual, no obstante, las aproximaciones empricas han sido
menos frecuentes. En la prctica siempre han existido dificultades en identificar a los
individuos que corresponden al grupo nuclear de la ETS (Snchez et al., 2008). Por una
parte, surgen dificultades en la seleccin de una metodologa adecuada de estimacin y
por otra, las limitaciones de las fuentes de informacin son particularmente relevantes
por la discrecionalidad de los encuestados.

Yorke et al. (1978) fueron pioneros en observar una distribucin no aleatoria de
una ETS para Estados Unidos. Encontraron que existen grupos pequeos con respecto
al total poblacional, que representan los vrtices de los procesos de expansin de la
enfermedad. Mediante informacin epidemiolgica mostraron que la prevalencia de la
enfermedad oscilaba estacionalmente sobre un equilibrio de estado determinado por
las condiciones mdicas y sociales. Ms tarde, en esta lnea Rothenberg (1983),
reconoci que los agentes con ETS, adems de compartir atributos comunes en sus
caractersticas individuales, frecuentemente estn concentrados espacialmente.



1
Es importante sealar la diferencia entre una infeccin por transmisin sexual (ITS) frente a una enfermedad por
transmisin sexual (ETS). La primera implica que un germen, virus, bacteria o parsito que puede causar una
enfermedad est presente dentro del cuerpo de un paciente. El infectado no tiene necesariamente sntomas es decir la
persona no se siente necesariamente enferma. Por el contrario, una enfermedad significa que la infeccin est realmente
causando sntomas en la persona infectada. Esta investigacin se concentra en las definiciones usadas en la Encuesta de
Salud y Hbitos Sexuales elaboradas por el INE, que incluye a las siguientes enfermedades: Clamidia, Gonorrea, Sfilis,
Tricomonas, lceras, Minosis, Hepatitis B, Uretritis, Ladilla, y otras. En la seccin metodolgica se amplia esta
informacin.
3

En una perspectiva econmica medidas preventivas en trminos de ejercicios de
poltica pblica focalizadas al ncleo de agentes regularmente infectados, reduciran las
tasas de crecimiento de la enfermedad y significaran un menor coste en la atencin y
en el control de una ETS en una perspectiva intertemporal y en el corto plazo.

Adicionalmente, para Cohen (2008) la instrumentalizacin de ests polticas de
atencin y prevencin sobre el ncleo no solo representa una reduccin de los costes
sanitarios, tienen tambin mejoras sustanciales en la calidad de vida de los agentes
vulnerables y en general dan lugar a externalidades positivas en todo el tejido social de
mayor complejidad en su cuantificacin. Por lo tanto, la investigacin sobre los
individuos del core de la ETS es fundamental desde el punto de vista mdico, social y
econmico.

En este marco, la siguiente investigacin busca caracterizar a los individuos de
mayor vulnerabilidad en la contraccin de una ETS en Espaa, utilizando la
informacin de la encuesta de Salud y Hbitos Sexuales. Se opta por la aplicacin de un
modelo Poisson con exceso de ceros (Zero inflated Poisson, ZIP) propuesto por
Lambert (1992) y Greene (1994). El ejercicio busca identificar a las variables que
incrementan la probabilidad de contraer una ETS, a partir de la variable sobre el
nmero de ETS contradas en los ltimos cinco aos. Adems, se contrastan los
resultados de la estimacin ZIP, con los conseguidos bajo un modelo Poisson y con un
modelo implementando una distribucin Binomial Negativa.

La metodologa ZIP empleada permite modelar al ejercicio en dos niveles,
corrigiendo las dificultades que implica una estimacin con ceros estructurales en la
variable endgena. Se considera que una parte de las observaciones con valor 0
corresponde a las personas que no han contrado la enfermedad en los ltimos cinco
aos, este segmento es parte de la distribucin Poisson, no obstante, existe una
proporcin de observaciones con valores 0 de tipo estructurales, de agentes
encuestados que nunca han tenido una ETS. Por lo tanto, la primera fase consiste en
distinguir si los individuos no han contrado nunca una ETS o si no la han contrado en
los ltimos cinco aos mediante una regresin logstica. Finalmente, la segunda fase
consiste en predecir el recuento de los individuos con valores cero de tipo estructurales
mediante un modelo Poisson.

4


La evidencia emprica encontrada parece sugerir que la probabilidad de
contraer una ETS se incrementa en los varones, en los agentes que empiezan su
actividad sexual de manera ms temprana, en los que han utilizado drogas inyectables,
en los que han tenido ms parejas sexuales, y en los residentes de determinadas
comunidades, coincidiendo con los resultados de Rothenberg(1983).

El resto de este documento esta organizado en cuatro secciones. La seccin
segunda describe a los elementos metodolgicos de la estimacin; la seccin tercera
presenta un resumen de hechos estilizados sobre la poblacin encuestada y sus
caractersticas con respecto a la contraccin de enfermedades de transmisin sexual,
adems se detallan algunos elementos sobre el diseo de la base de datos utilizada en
la estimacin; la seccin IV presenta los resultados de las estimaciones; finalmente la
seccin V resume los principales resultados y concluye.

2. METODOLOGA

Se parte por estimar un modelo Poisson, apropiado para estimaciones con la
variable endgena discreta y no negativa. En principio, este modelo de recuento brinda
mejores resultados frente a un modelo de regresin lineal, que en el escenario de una
variable endgena discreta suele producir predicciones fraccionarias o negativas para
una variable que solo admite valores enteros positivos(Romani, 2011).

No obstante, la variable dependiente de nmero de ETS contradas por los
encuestados en los ltimos cinco aos, adems de ser discreta positiva tiene un elevado
nmero de valores nulos observados, que pueden tener distinta naturaleza: por una
parte que el encuestado no ha contrado ninguna ETS a lo largo de su vida y por otra
que no ha contrado una en los ltimos cinco aos.

Para corregir la sobredispersin de la variable endgena se opta por realizar
una segunda estimacin fundamentada en un modelo Poisson con Ceros Inflados (Zero
Inflated Poisson model, ZIP). El modelo ZIP, asume que hay dos grupos latentes de
observaciones. El primer grupo lo integran individuos que tienen un valor de recuento
cero con una probabilidad igual a 1. El segundo grupo est comprendido por
5

encuestados que pueden tener un recuento cero, pero tienen una probabilidad no nula
de tener un recuento positivo (Domnech y Navarro, 2005)

Por lo tanto, la solucin del modelo ZIP a sta situacin combina dos sub-
modelos diferentes. Para predecir la probabilidad de pertenecer al primer grupo o al
segundo se estima una regresin logstica. La variable de respuesta es el logit de una
variable binaria que indica si el recuento es o no nulo. Para predecir el recuento de los
encuestados del segundo grupo se utiliza una estimacin Poisson (Abrarira et al.,
1996).

Siguiendo a Ordaz y Kazim (2006), si Z

denota la variable que es de particular


inters (el nmero de ETS que el encuestado i ha tenido) e

es su versin inflada de
ceros observada(el nmero de ETS que el encuestado i ha tenido en los ltimos cinco
aos), se puede escribir

= Z

(1)

, donde

es una variable aleatoria tipo Bernoulli que tomar el valor de 1 si el


encuestado a tenido una ETS y cero si no ha tenido. Si q

es la probabilidad para que el


agente encuestado i de no haber contrado una ETS en toda su vida, entonces la
probabilidad de haber tenido una ETS es P(

= 1) = 1 q. Si X
1
, , X
n
son las
variables explicativas, se puede expresar:

q

= 0(0([
0
+ [
1
X
1
++ [
n
X
n
))(2)

La parte derecha de la ecuacin es la funcin de distribucin logstica, que
caracteriza a la primera fase del modelo de estimacin de una regresin logstica.

La distribucin inflada con ceros ser entonces:

P(

= k) = q

(1 min(k, 1)) +(1 q


1
)P(Z

= k)), k = u,1,2, (3)



Si Z

sigue una distribucin Poisson de parmetro z

, la funcin de probabilidad
del modelo Poisson inflado de ceros(ZIP) tendr la siguiente forma:

6

P(

= k) = q

(1 min {k, 1]) +


(1-q
i
)c
-Z
i
x
i
k
k!
,con z

= exp {[
0
+ [
0
X
1
++[
n
X
n
](4)

Si I es el nmero total de individuos de la muestra, se puede tener el nmero de
encuestados que han tenido una ETS hace ms de cinco aos (I
0
), as como el nmero
total de ETS que han contrado(A
0
):

I
0
= _
{z
i
>0, I
i
=0]
,
N
=1
I
0
= Z

{z
i
>0, I
i
=0]
,
N
=1
(5)

, donde _
{A]
es la funcin caracterstica del suceso primera, genricamente A. Para el
modelo ZIP, las esperanzas de I
0
y I
0
son:

E(I
o
) = q

N
=1
(1 c
-x
) , E(I
o
) = q

N
=1
z

, (6)
, y las varianzas:
Ior(I
o
) = q

N
=1
(1 c
-x
)|1 q

(1 c
-x
i
)|,
Ior(I
o
) = q

N
=1
z

(1 + z

(1 q

)).(7)

Ahora es posible estimar el modelo y ver que variables resultan ms
significativas en la determinacin del nmero de individuos con ETS.

El siguiente cuadro resume el proceso de estimacin:

Cuadro No. 1
Resumen Metodolgico
i) Se considera la variable de nmero de ETS contradas en los ltimos cinco aos y se elabora
una regresin Poisson, con las variables restantes de la encuesta como explicativas
descartando las que puedan tener problemas de multicolinealidad o autocorrelacin.
ii) Se crea una nueva variable dicotmica fundamentada en la anterior (en donde el valor de 1 es
indicativo de al menos haber contrado una ETS en los ltimos cinco aos y el de cero de
ninguna).
iii) Por medio de un proceso Logit se distingue a los agentes que no han contrado ninguna ETS
de los que no han contrado una en los ltimos cinco aos.
iv) Se elabora nuevamente al proceso Poisson eliminando a las variables explicativas no
significativas o las que puedan tener problemas de multicolinealidad.
v) Se analizan los resultados del modelo final.


7

3. HECHOS ESTILIZADOS Y DESCRIPCIN DE LA BASE DE
DATOS PARA LA ESTIMACIN


El ejercicio economtrico est construido a parir de la Encuesta de Salud y
Hbitos Sexuales elaborada por el Instituto Nacional de Estadstica (INE) para el ao
2003. La muestra efectiva incluye 10.980 individuos para las 17 Comunidades
Autnomas y para Ceuta y Melilla.

En el agregado nacional, la poblacin encuestada de 18 a 49 aos ha tenido su
primera relacin sexual a una edad media de 18,6 aos, aunque los hombres un ao
antes, 18 aos, en contrastacin con las mujeres, 19 aos. El 80% de la poblacin tiene
su primera relacin sexual entre los 15 y 23 aos, un 10% con 15 aos o menos y otro
10% con 23 aos o ms. Del total de encuestados que ha tenido relaciones sexuales el
5,9% de los hombres y el 4,9% de las mujeres afirman haber sido diagnosticadospor
una ETS (excluyendo micosis y hepatitis B) en alguna ocasin. (INE, 2003)

En contrastacin con otros pases europeos, la proporcin de personas que
manifiestan haber sido diagnosticadas de alguna ETS en Espaa es ampliamente menor
a la encontrada en Noruega y Finlandia y ms cercana a la del resto de Europa, aunque
aun menor. En el Reino Unido por ejemplo, para el ao 2000 el 10.8% de los varones
indica haber contrado una enfermedad de transmisin sexual y el 12.6% de las
mujeres. (INE, 2003)

Una visualizacin por Comunidad Autnoma, muestra que del total de
encuestados a nivel nacional, los que refieren haber contrado alguna vez una ETS a lo
largo de su vida, estn localizados principalmente en Madrid, Catalua y Sevilla que
juntas agrupan al 30% del total. Mientras las de menor distribucin porcentual son
Aragn, La Rioja, Navarra y Extremadura, juntas representan al 10% del total. En el
Grfico No. 1 se muestra la composicin porcentual del total nacional por Comunidad
Autnoma.

En trminos relativos, como resultado del cociente entre el nmero encuestados
que afirma haber tenido una ETS a lo largo de su vida sobre el total de encuestados en
cada Comunidad Autnoma; Catalua muestra la concentracin ms alta de agentes,
con un 8.83%, seguida de La Rioja con 8.54%. Al menos, 9 Comunidades muestran
8

quecercadel 7% de sus encuestados ha tenido una ETS a lo largo de su vida. Los niveles
ms bajos se encuentran en Cantabria y Aragn. El Grfico No. 2 presenta estos
resultados.

Grfico No. 1:
Distribucin de infectados de ETS (al menos una ves a lo largo de la vida)


Fuente: Instituto Nacional de Estadstica (INE), Encuesta de Salud y Hbitos Sexuales.
Elaboracin: Jorge Salgado.

Grfico No. 2:
Relacin de encuestados que sealan haber tenido al menos una ETS sobre el total de
encuestados en cada CCAA


Fuente: Instituto Nacional de Estadstica (INE), Encuesta de Salud y Hbitos Sexuales.
Elaboracin: Jorge Salgado.
Aragn
P. Vasco
Navarra
Andaluca
Madrid
Castilla-La Mancha
Extremadura
Castilla y Len
Murcia
Comunidad
Valenciana
Catalua
Islas Baleares
Galicia
Asturias
Cantabria
La Rioja
Canarias
Andaluca
Madrid
Castilla-La Mancha
Extremadura
Castilla y Len
Murcia
Comunidad
Valenciana
Catalua
Islas Baleares
Galicia
Asturias
Cantabria
La Rioja
Canarias
Aragn
P. Vasco
Navarra
9



Por otra parte, a parir de los resultados de la Encuesta de Salud y Hbitos
Sexuales, se elabora una nueva base de datos en funcin de los requerimientos de la
estimacin.

En primera instancia se considera como posibles variables
explicativas(X
1
, , X
n
) del nmero de ETS en los ltimos cinco aos a las preguntas de
los apartados A, B, C, C1, C2, C3 y a las del apartado de Otras. Se descartan a las
preguntas de los apartados E y F, focalizadas en el comportamiento y conocimiento de
los encuestados acerca del VIH.

Con respecto a las variables de los apartados C1, C2 y C3 sobre Relaciones
Sexuales a lo Largo de la Vida originalmente separadas de acuerdo a la orientacin
sexual del encuestado, son agregadas y limitadas a las preguntas de: Edad de inicio de
las relaciones sexuales, Nmero de parejas sexuales, Uso de preservativo y Uso de
prostitucin alguna vez en la vida, el principal criterio de seleccin consiste en la
equivalencia de las preguntas en los tres grupos, en el caso de estas cuatro son iguales
para los tres apartados.

Asimismo, para el diseo de la variable endgena sobre el nmero de ETS
contradas en los ltimos cinco aos, se agrega a las preguntas sobre la contraccin a lo
largo de la vida de: Clamidia, Gonorrea, Sfilis, Tricomonas, lceras, Minosis, Hepatitis
B, Uretritis, Ladilla, y otras (todas correspondientes al Apartado D). La variable sobre
el nmero de ETS totales a lo largo de la vida es controlada por el periodo de
contraccin; se excluye alosencuestados cuya ltima ETS fue hace ms de cinco aos.En
este marco, se obtiene a la nueva variable sobre el nmero de ETS contradas a lo largo
de los cinco aos pasados. En el Grfico No. 3 se resume a las variables incorporadas en
la estimacin.





10



Grfico No. 3:
Grupo de variables para la estimacin


















4. ESTIMACIN

Se parte de un conjunto inicial de 81 posibles variables explicativas como
resultados de los procesos agregacin de las secciones C1, C2 y C3, de la eliminacin
de las preguntas no homogneas de los tres apartadosy descontando las que
comprenden a la variable endgena (la encuesta presenta un total de 312 preguntas).

El primer modelo estimado con una funcin Poisson, sin correcciones de ceros
estructurales, se plantea descartando a las variables que podran producir
multicolinealidad o autocorrelacin. El criterio principal para la seleccin parte del
anlisis de la matriz de varianzas y covarianzas y de la eliminacin de preguntas
conceptualmente cercanas (e.g. Nmero de consumiciones alcohlicas diarias,
Frecuencia de consumo de alcohol das por mes, y Das que ha estado bebido en el
ltimo mes)
Dependiente
Explicativas
Caractersticas sociodemogrficas
Estilos de vida
Informacin sexual
Experiencia sexual
Apartado B
Apartado C
Apartado C1
Apartado C2
Apartado C3
Apartado A
Otros
Nmero de ETS
en los ltimos
cinco aos

Clamiuia, uonoiiea, Sifilis, Tiicomonas,


0lceias, Ninosis, Bepatitis B,
0ietiitis, Lauilla, y otias

Controlado por el tiempo
Apartado D
11


Como resultado se tiene a un grupo inicial de 16 variables explicativas:
Comunidad Autnoma, consumo de alcohol, edad de inicio relaciones sexuales,
educacin sexual de los padres, estado civil, uso de drogas inyectables, nacionalidad,
nivel de estudio, nivel de estudio de la madre, nivel de estudio del padre, nmero de
parejas sexuales, nmero de salidas nocturnas a la semana, ocupacin, recurrencia a
servicios de prostitucin (alguna ves en su vida), sexo, uso de preservativo
2
.

El Cuadro No. 2 muestra los resultados de la estimacin de la variable endgena
(nmero de ETS en los ltimos cinco aos) para trece de las variables anteriores bajo
una estimacin Poisson.


Cuadro No. 2:
Estimacin del Modelo Poisson




En un examen inicial de la estimacin las variables de Comunidad Autnoma,
nivel de estudios terminados, nmero de parejas sexuales, y el sexo de los encuestados
pareceran tener incidencia en la contraccin de una ETS, no obstante, el valor

2
La edad del encuestado no fue considerada en el modelo ya que tiene una relacin directa con el incremento del riesgo
de tener un ETS, como resultado de una mayor exposicin.
12

esperado de la variable endgena (Mean dependent var) es igual a 0.074547, menor
que la varianza de 0.087241. Esta relacin podra ser un indicativo de un mal
comportamiento del modelo que se estima con una distribucin Poisson,
presumiblemente por no considerar la sobredispersin de la endgena.

En presencia de sobredispersin las estimaciones puntuales de los coeficientes
del modelo son insesgadas, pero sus varianzas, y por tato sus errores estndar estn
subestimados y sesgados (Cameron y Triveli, 1986). Se debera optar, en este caso por
un modelo que relaje la restriccin entre la igualdad de la media y la varianza, e.g. un
modelo binomial negativo.

Existen varias pruebas, para probar el supuesto de equidispersin. El ms
sencillo es el Deviance de la regresin, que es resultado de menos el doble producto
del cociente entre el Log likelihood y el nmero de observaciones incluidas en la
muestra menos las variables explicativas del modelo (grados de libertad), en este caso
2IIF
Rcs
=
(22114.2S2)
(822S16)
= u.S1S2 que es menor a uno, y no sugiere la existencia de
sobredispersin, por lo tanto, no sera necesario recurrir a un modelo binomial
negativo.

Adicionalmente, es conveniente recurrir a una prueba alternativa, evitando la
subjetividad de la prueba anterior al testear lo distante que est el cociente del valor
unitario. Una prueba alternativa consiste en evaluar la razn de verosimilitud entre el
modelo Poisson y la equivalente binomial negativa.

Cuadro No. 3:
Contraste del supuesto de equidispersin-Poisson goodness of fit (STATA)



La ausencia de significacin estadstica del p = 1 indica que no se rechaza el
supuesto de equidispersin por lo que no sera necesario la utilizacin de una binomial,
negativa. No obstante, en el Cuadro No. 4 se presentan los resultados de la estimacin
binomial negativa.
13



Cuadro No. 4
Estimacin del Modelo con una Binomial Negativa




Sin embargo, en consideracin de la construccin de la variable dependiente, y
como se muestra en el Cuadro No. 5 existen ceros estructurales, en la variable
endgena. En este marco, la aplicacin de un modelo Poisson con exceso de ceros (Zero
inflated Poisson model, ZIP) propuesto inicialmente por Lambert (1992) y Greene
(1994) permite modelar al ejercicio en dos niveles, corrigiendo las dificultades que
implica una estimacin Poisson que no distingue entre los encuestados que nunca han
tenido una ETS, frente a los que no la han tenido en los ltimos cinco aos.

Se considera entonces que una parte de las observaciones con valor 0
corresponde a las personas que no han contrado la enfermedad en los ltimos cinco
aos, este segmento es parte de la distribucin Poisson, pese a ello, existe tambin una
proporcin de observaciones con valores 0 de tipo estructurales, de agentes
encuestados que nunca han tenido una ETS.

Por lo tanto, la primera fase consiste en distinguir si los individuos no han
contrado nunca una ETS o si no la han contrado en los ltimos cinco aos mediante
14

una regresin logstica. La segunda fase consiste en predecir el recuento de los
individuos con valores cero de tipo estructurales mediante un modelo Poisson.

Cuadro No. 5
Estimacin del Modelo con una Binomial Negativa

Para la primera etapa se elabora la variable dicotmica para el nmero de
enfermedades de trasmisin sexual, que el encuestado ha tenido en el ltimo ao. Se
asigna el valor de uno al que al menos ha tenido una enfermedad y caso contrario un
cero. Posteriormente, se estima un modelo Logit, con la nueva variables, y se procede a
elaborar una prediccin de la variable observada y a eliminar los ceros estructurales
marcando un punto de corte, para las probabilidades asignadas a cada observacin. El
Cuadro No. 6 presenta la estimacin del modelo Logit.


Cuadro No. 6:
Estimacin del Modelo Logit

Dependent Variable: DUMN
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 10/16/11 Time: 07:38
Sample (adjusted): 2 10838
Included observations: 8223 after adjustments
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives


Variable Coefficient Std. Error z-Statistic Prob.


C -2.954511 0.426131 -6.933343 0.0000
CCAAVIV 0.017313 0.009288 1.863986 0.0623
Dependent Variable: NUMETS
Method: ML/QML - Poisson Count (Quadratic hill climbing)
Date: 10/14/11 Time: 13:44
Sample (adjusted): 2 10838
Included observations: 8223 after adjustments
Frequencies for dependent variable




Cumulative
Valu
e Count Percent Count Percent


0 7672 93.00 7672 93.30
1 500 6.00 8172 99.38
2 42 0.00 8214 99.89
3 7 0.00 8221 99.98
4 2 0.00 8223 100.00



15

CONSALCOH -0.020595 0.024531 -0.839579 0.4011
COMUSEXPAD 0.015520 0.095936 0.161776 0.8715
EDADX -0.001498 0.015108 -0.099142 0.9210
ESPEXT -0.019541 0.034283 -0.569986 0.5687
ESTATACIV -0.044238 0.066841 -0.661840 0.5081
INYECDROG -0.405557 0.469012 -0.864706 0.3872
NIVDEEST 0.066029 0.029941 2.205267 0.0274
NIVMADRE -0.010709 0.034292 -0.312282 0.7548
NIVPADRE 0.021924 0.028905 0.758497 0.4482
OCUP -0.030314 0.024095 -1.258110 0.2084
PAREJASX 0.269861 0.036657 7.361794 0.0000
SALNOC 0.012735 0.044960 0.283243 0.7770
SEXO -1.505274 0.113461 -13.26687 0.0000
USOPRES -0.022359 0.042766 -0.522825 0.6011


Mean dependent var 0.067007 S.D. dependent var 0.250050
S.E. of regression 0.245585 Akaike info criterion 0.464363
Sum squared resid 494.9815 Schwarz criterion 0.478012
Log likelihood -1893.227 Hannan-Quinn criter. 0.469028
Restr. log likelihood -2021.441 Avg. log likelihood -0.230236
LR statistic (15 df) 256.4277 McFadden R-squared 0.063427
Probability(LR stat) 0.000000


Obs with Dep=0 7672 Total obs 8223
Obs with Dep=1 551




Grfico No. 3:
Prediccin de la nueva variable




.00
.05
.10
.15
.20
.25
.30
2500 5000 7500 10000
DUMNF
Forecast: DUMNF
Actual: DUMN
Forecast sample: 1 10838
Adjusted sample: 2 10838
Included observations: 8223
Root Mean Squared Error 0.245346
Mean Absolute Error 0.120587
Mean Abs. Percent Error 6.029342
Theil Inequality Coefficient 0.721202
Bias Proportion 0.000000
Variance Proportion 0.690917
Covariance Proportion 0.309083
16

Finalmente, se estima al modelo Poisson con la restriccin en funcin de la
proporcin de 1 en la variable de prediccin. El corte se obtiene como resultado del
cociente de 551 / 8223 = 0.067007.

El Cuadro No. 8 resume los resultados estadsticos delaestimacin con un
modelo ZIP. En primera instancia la variable de sexo nos brinda indicativos que
apuntan a los varones como agentes con ms probabilidad en la contraccin de una
ETS. La Comunidad Autnoma sera relevante, coincidiendo con los resultados de
Rothenberg (1983) y en consideracin de los hechos estilizados que mostraban una
mayor concentracin de individuos enfermos alguna vez en comunidades como
Catalua o La Rioja.

De forma similar, las personas que mantienen relaciones sexuales de manera
ms temprana, las que alguna vez en su vida han utilizado drogas inyectables, as como
las que han tenido unmayor nmero de parejas sexuales tendran una mayor
probabilidad de contraer una ETS.

Por otra parte, es interesante sealar que la contraccin de una ETS, no sera
menor en la medida que aumenta el nivel de estudios, este resultado es consistente con
el resumen y anlisis de hechos estilizados sobre la muestra presentados por el INE en
2003. De forma intuitiva, podra ser explicado ya que un nivel de estudios ms alto,
implica una edad ms avanzada la cual ampla el riesgo de contraer una ETS.

Cuadro No. 8:
Estimacin del modelo ZIP


Dependent Variable: NUMETS
Method: ML/QML - Poisson Count (Quadratic hill climbing)
Date: 10/16/11 Time: 08:19
Sample: 1 10838 IF DUMNF>0.06700
Included observations: 3348
Convergence achieved after 6 iterations
Covariance matrix computed using second derivatives


Variable Coefficient Std. Error z-Statistic Prob.


C -2.793012 0.390275 -7.156518 0.0000
CCAAVIV 0.021477 0.010814 1.986066 0.0470
EDADX -0.036135 0.018374 -1.966632 0.0492
17

NIVDEEST 0.075949 0.030150 2.519057 0.0118
PAREJASX 0.319323 0.039111 8.164495 0.0000
SEXO -1.514811 0.396186 -3.823483 0.0001
INYECDROG -1.462709 1.003726 -1.457279 0.0850


R-squared 0.032658 Mean dependent var 0.119474
Adjusted R-squared 0.030920 S.D. dependent var 0.361011
S.E. of regression 0.355386 Akaike info criterion 0.739677
Sum squared resid 421.9647 Schwarz criterion 0.752464
Log likelihood -1231.219 Hannan-Quinn criter. 0.744251
Restr. log likelihood -1276.842 Avg. log likelihood -0.367748
LR statistic (6 df) 91.24694 LR index (Pseudo-R2) 0.035731
Probability(LR stat) 0.000000

Para profundizar, en el examen de la influencia del espacio geogrfico en la
contraccin de una ETS, se crea una categora dicotmica por cada comunidad incluida
en la muestra y se elabora la matriz de varianzas y covarianzas. Adicionalmente, se
elabora una prueba chi cuadrado entre la variable de haber sido diagnosticado con una
ETS y la CCAA donde vive el encuestado, ambos ejercicios tiene un carcter heurstico.
Cuadro No. 9:
Espacio y Enfermedades de Transmisin Sexual











18


Cuadro No. 10:
Contrastes de chi cuadrado

Los cuadros nueve y diez muestran en la mayora de los casos una relacin
esperada. Vivir en Cantabria (en los cuadros nueve y diez corresponde a ccaaviv6), por
ejemplo la Comunidad de menor contraccin de enfermedades per cpita de acuerdo al
Grfico No.2 parecera reducir la probabilidad de contraer una ETS, frente a vivir en
Catalua (en los cuadros nueve y diez corresponde a ccaaviv9) la comunidad con
mayor ETS per cpita.











19

5. CONCLUSIONES


Las estimaciones elaboradas a partir de los modelos: Poisson, Binomial
Negativa, y ZIP, parecen coincidir en que la probabilidad de contraer una ETS se
incrementa en los varones, en los agentes que empiezan su actividad sexual de manera
ms temprana, en los que utilizan o han utilizado drogas inyectables, en los que tienen
ms parejas sexuales a lo largo de su vida. La localizacin de los encuestados,
tambin, incidira en la probabilidad de contraer una ETS, como se detall en la seccin
tercera Catalua y la Rioja fueron en 2003 las que concentraban a un mayor nmero de
individuos, que alguna vez en su vida fueron contagiado por una ETS.

Por otra parte, bajo los resultados de las pruebas de Deviance y del Poisson
goodness of fit (implementado en STATA), parecera que la estimacin por un modelo
con una distribucin Binomial Negativa no brindara mejores resultados. No obstante,
por el diseo de la variable detallado en la seccin tercera, se conoca de la existencia
de ceros estructurales y por lo tanto, un modelo ZIP sera el ms adecuado. Sin
embargo, los resultados, en cuanto a los coeficientes ms relevantes, no difirieron en
gran medida entre los distintos modelos.















20

6. BIBLIOGRAFA

Cameron, C. and Trivedi, P., Microeconometrics Methods and Applications, Cambridge
University Press, 2005.

Cohen, J. et al., Does Preventive Care Save Money? Health Economics and the
Presidential Candidates, The New England Journal of Medicine, 2008.

Domnech i Massons J., Navarro, J., Regresin logstica binaria multinomial y de
Poisson, Signo, 2005.

Greene, W.H., Anlisis Economtrico. Madrid: Prentice Hall, 1999.

Instituto Nacional de Estadsta (INE), Encuesta de Salud y Hbitos Sexuales, 2007.

Lambert, D., Zero-inflated Poisson regression, with an application to defects in
manufacturing. Technometrics, 34, 1-14, 1992.

Long, S., Regression models for categorical and limited dependent variables, SAGE,
1997.

Ordaz, J., Kazim, K., Estimacin de la siniestralidad no declarada en el seguro de
automviles: una aplicacin a travs de modelos de recuento, Ministerio de Educacin
y Ciencia, VI Jornadas ASEPUMA IV Encuentro Internacional, 2006.

Roman, J., Resumen Regresin Poisson, Facultat de Economa, Universitat de
Barcelona, 2011.

Rothenberg, R., The geography of gonorrhoea: Empirical demonstration of core group
transmission, American Journal of Epidemiology; 117(6):688-694, 1983.

Sanchez, M., Conde, C., Uribe, F., Core group approach to identify college students at risk
for sexually transmitted infections, Centro de Investigaciones sobre Enfermedades
Infecciosas, Instituto Nacional de Salud Pblica, Cuernavaca, Morelos, Mxico, 2008.

Thomas, J., Tucker, M., Individual and Population Approaches to the Epidemiology and
Prevention of Sexually Transmitted Diseases and Human Immunodeficiency Virus
Infection, The Journal of Infectious Diseases, Oxford University Press, 1996.

Yorke J., Hethcote H., Nold, A., Dynamics andcontrol of the transmission of gonorrhoea:
Sex Transmition Disease, 5(2):51-6, 1978.

También podría gustarte