Está en la página 1de 46

TITULO:

UN MODELO ECONOMETRICO PARA EL SECTOR SALUD EN EL


DEPARTAMENTO DE CAJAMARCA

1.- INTRODUCCIÓN

Usualmente las políticas económicas están basadas tanto en aspectos teóricos


como en la evidencia empírica relacionada con el área en la cual se está
actuando. La teoría económica aporta las relaciones entre las variables y los
principios básicos que explican tanto su comportamiento, como el posible tipo de
función matemática que las entrelaza. Por su parte, la evidencia empírica muestra
la relación que existe en el mundo real entre las variables estudiadas con respecto
a un fenómeno económico determinado.

La econometría es aquella ciencia que se encarga de darnos los métodos


necesarios para comunicar ambos mundos, el teórico y el real, mediante bases
teóricas y procedimientos que facilitan la formulación y estimación de modelos
económicos para de esta manera explicar el comportamiento de la variable en
estudio durante un período en referencia, asimismo nos permite hacer inferencia y
pronostico de la misma con base en las variables independientes seleccionadas
en el modelo.

Todo este proceso contemplado en la econometría, nos permite la utilización del


modelo siendo el sustento teórico-práctico para formular políticas relacionadas con
el fenómeno en estudio.

El presente trabajo pretende formular un modelo econométrico que muestre la


importancia que tiene el sector salud (Departamento de Cajamarca) y logre
explicar su comportamiento satisfactoriamente. La formulación del modelo está
basada en la Teoría Económica, conjuntamente con la evidencia empírica obtenida
a través de la Encuesta Nacional de Hogares ENAHO 2010.
2.- OBJETIVOS

2.1.- Objetivos Generales:

 Formular un modelo econométrico que nos permitirá conocer cuales son las
variables que definen e influyen en la importancia del SECTOR SALUD EN
EL DEPARTAMENTO DE CAJAMARCA y de esta manera hacer un análisis
de su comportamiento y de las variables exógenas que influyen en ella.

2.2.- Objetivos Específicos:

 Definir con exactitud la ecuación econométrica que nos permita evaluar y


conocer el comportamiento de nuestra variable dependiente cualitativa en
estudio.

 Utilizar adecuadamente el instrumental teórico para definir las variables


exógenas en el modelo y verificar su acertada influencia empírica.

 Verificar la relación existente entre las variables exógenas ubicación del


establecimiento de salud, monto por medicamentos, monto por consulta,
presento algún síntoma o malestar, estuvo Ud. Hospitalizado, esta afiliado a
essalud.

 Analizar la relación que existe entre la variable presento Ud. alguna recaída
de enfermedad crónica y la variable endógena padece de alguna
enfermedad o malestar crónico.

 Comprobar que la tanto la variable edad y sexo pueden ser


fundamentalmente importantes cuando se quiere explicar el padecimiento
de alguna enfermedad o malestar crónico.

 Verificar que la relación entre las variables ha efectuado consulta por


prevención de enfermedades y la variable endógena padece de alguna
enfermedad o malestar crónico es negativa.

 Determinar y analizar los resultados obtenidos; utilizando las herramientas


de la econometría – teoría económica, respectivamente.

3.- MARCO TEORICO


3.1.- Situación de Salud

La salud de la población peruana es un reflejo de su realidad social: se ha


alcanzado una importante mejora en algunos indicadores de salud del país, sin
embargo, las grandes diferencias que enmascaran los promedios nacionales
ocultan las inequidades existentes en la salud. La mayor o menor probabilidad de
muerte y enfermedad está en función de factores como el estrato socioeconómico,
la condición de ruralismo, el género y el nivel educativo en que se encuentren las
personas y las comunidades.

Así, en las últimas décadas se ha producido una mejoría en la salud de la


población peruana, debido al proceso de urbanización, al aumento del nivel de
instrucción y acceso a servicios de saneamiento básico, los cambios en los estilos
de vida de la población, los cambios demográficos y el desarrollo de servicios en
el primer nivel de atención. Este último permitió incrementar el acceso de grupos
marginados a ciertos servicios de salud y mejorar algunos indicadores de salud,
en especial la mortalidad infantil de las zonas urbanas, mediante el control de las
enfermedades diarreicas e inmuno-prevenibles; sin embargo, en las zonas rurales
persisten altas tasas de mortalidad infantil, perinatal y materna (que no se ha
modificado sustancialmente en las últimas dos décadas.)

Sin embargo, considerando el contexto latinoamericano, la situación de salud en el


Perú es bastante insatisfactoria e inicua, comparada con países de similar o
inclusive menor desarrollo económico. Así, la mortalidad infantil en el Perú es una
de las más altas de América Latina, sólo superada por la República Dominicana,
Nicaragua, Bolivia y Haití, países con un ingreso per cápita bastante menor;
aquellos países con un ingreso per cápita similar al de Perú tienen tasas mucho
menores: la mitad en Colombia, cuatro veces menor en Costa Rica y cinco veces
menor en Cuba1. Asimismo, en las últimas décadas la razón de muerte materna no
ha variado sustancialmente en el país, siendo de 185 por 100,000 nacidos vivos
entre 1994 y el 20002, una de las más altas de América Latina, sólo superada por
Haití y Bolivia; aquellos países con similar ingreso per cápita tienen tasas mucho
menores: la cuarta parte en Colombia y cinco veces menor en Costa Rica y Cuba 3.

Adicionalmente, la situación de la salud del Perú es muy heterogénea, existiendo


grandes diferencias relacionadas con el nivel de pobreza. Las desigualdades

1
Ministerio de Salud: 2006.
2
INEI: Encuesta Demográfica y de Salud Familiar (ENDES) 2000. Lima, 2001.
3
Ministerio de Salud: 1999.
sociales, las malas condiciones de vida y el escaso acceso a servicios explican las
enormes brechas que existen entre la población urbana y la rural.

3.2.- La Salud como un Activo para la Producción

Los trabajadores más sanos son más fuertes y activos, física y mentalmente; por
consiguiente, es menos probable que pierdan el trabajo por enfermedad (propia o
de su familia). Son más productivos y ganan mejores sueldos; también ayudan a
atraer inversiones extranjeras directas. Un mal estado de salud puede significar
una menor productividad, una vida laboral más corta y un mayor número de días
perdidos por enfermedad. La salud y los logros educativos también están
estrechamente vinculados. Los niños sanos aprenden mejor y se convierten en
adultos mejor educados, capaces de ganar mejores sueldos. Es muy poco
probable que un niño de una familia sana deba interrumpir sus estudios por
problemas de salud, propios o de otros miembros de la familia. Las consecuencias
de la anquilostomiasis y la anemia concomitante es otro clásico ejemplo de mala
salud que interfiere en la actividad productiva.

3.3.- Salud y Pobreza

La creciente preocupación por la salud de los pobres se debe, a que se ha


constatado que en todo el mundo la mala salud aqueja mucho más a los pobres.
Las causas de la mala salud de los pobres son múltiples y están relacionadas
entre sí. Una nutrición deficiente, por ejemplo, debilita las defensas del cuerpo que
protegen de la infección, y la infección, a su vez, disminuye la eficaz absorción de
los nutrientes. El principal activo de los pobres, su cuerpo, queda así sin seguro.
La mala salud implica, entonces, un mayor nivel de riesgo para los pobres que
para quienes tienen más activos. Cuando la mala salud, en cualquiera de sus
formas, ataca el principal activo de los pobres, esos individuos se ven
imposibilitados de ganar el dinero que les permite obtener para sí, y por lo general
también para otros, tanto el alimento como los medicamentos. En otras palabras,
es muy probable que una crisis de salud tenga resultados catastróficos. Los
hallazgos de un estudio basado en datos de Indonesia muestran que el
aseguramiento incompleto, incluso de situaciones de enfermedad extremas,
entraña costos nada desdeñables para la economía de ese país.

3.4.- Salud y Desigualdad


Analizamos también la relación entre salud y desigualdad. Sin duda resulta muy
atrayente la idea de que antes de la "transición epidemiológica" el ingreso
determina la mortalidad, mientras que, pasada esa transición, lo que determina la
mortalidad, es la desigualdad del ingreso. En los países pobres, el ingreso es un
seguro contra muchas de las causas de enfermedad, mientras que en los países
ricos la desigualdad del ingreso indica la calidad del régimen social, el estrés y la
mortalidad en la sociedad. Sin embargo, no necesariamente hay que dar por
sentado que la relación entre el ingreso y la mortalidad cambie con el desarrollo
económico, dado que sería la pobreza, no las desigualdades, la que impulsa la
mortalidad y, además, el efecto de las desigualdades habrá de perdurar, pues
incluso en las economías ricas siempre hay quienes no son tan ricos.

3.5.- Capital Humano, Salud, Nutrición y Salarios

La buena salud y nutrición mejoran la productividad de los trabajadores 4. La salud


tiene repercusión directa sobre los ingresos y la riqueza doméstica, la
productividad en el trabajo, la participación de las fuerzas laborales, las tasas de
ahorro e inversión, los factores demográficos y otros factores de capital humano.
Varios mecanismos han sido propuestos. Primero, que la mala salud y la
malnutrición reducen la capacidad física y las facultades mentales del trabajador,
lo que conduce a menores productividad y poder de negociación que resultan en
bajos salarios. En segundo lugar, los trabajadores con enfermedades crónicas
pudieran no conseguir trabajo a ningún precio, cayendo en una trampa de pobreza
basada en la salud. En tales casos los programas de transferencia que promueven
una mayor equidad en salud estarían no solo reduciendo la pobreza, sino también
mejorando la eficiencia. Tercero, proporcionar recursos públicos para mejorar la
salud puede ayudar a los pobres a liberar recursos para otras inversiones, como la
educación, como un medio para escapar la pobreza.

Las poblaciones más sanas tienden a tener una productividad mayor de trabajo,
porque los trabajadores son más enérgicos físicamente, más robustos
mentalmente y pierden menos días laborales a causa de enfermedades propias o
de miembros de la familia.

Las personas más saludables que viven más tiempo tienen mayores incentivos
para invertir en desarrollar sus habilidades, porque esperan cosechar los
beneficios de tal inversión durante períodos más largos. Una mayor escolaridad

4
Para un examen reciente y amplio de los puntos de evidencia y medición, ver Strauss, John, Duncan,
Thomas, Health Nutrition and Economic Development, Journal of Economic Literature, XXXVI, June 1998,
Pp.766-817
promueve mayor productividad y, a su vez, mayores ingresos. La buena salud,
también, promueve la asistencia escolar y mejora la función cognoscitiva.

El aumento de la longevidad crea en las personas una mayor necesidad de


ahorrar para su jubilación. En la medida en que el aumento de los ahorros
conduzca a más inversiones, los trabajadores tendrán acceso a más capital y sus
ingresos subirán.

Una fuerza laboral saludable y educada atrae la inversión extranjera, además de


las externalidades positivas que un ambiente sano plantea para aumentar el
comercio, el turismo, la inversión y otras actividades económicas.

La nutrición es un factor importante de salud, que tiene repercusiones a largo


plazo en el recurso humano. Strauss y Thomas 5 examinan evidencias de que la
talla y el índice de masa corporal se determinan en gran parte por factores
nutricionales. Usando datos del Brasil y de los Estados Unidos, llegan a la
conclusión de que estas variables se correlacionan positivamente con los salarios
luego de un control por edades diferenciales y niveles de educación. Por ejemplo,
hay una fuerte asociación entre talla y salarios en el Brasil: los hombres más altos
ganan más. Un aumento de 1% en la talla se asocia con un aumento de casi 8%
en los salarios. Aun en los Estados Unidos de Norteamérica, los hombres
estadounidenses más altos ganan los salarios más altos. Además, las deficiencias
en la nutrición pueden tener costos a largo plazo al deteriorar el desarrollo
cognoscitivo de las personas. Se observó que los lactantes a los que se les
administra suplementos micronutrientes tienden a desarrollar mejores habilidades
motoras que aquellos que no lo reciben, un factor predictivo exacto del desarrollo
cognoscitivo total. La estatura y fuerza adulta dependen del consumo de nutrientes
y de una buena salud general durante la niñez y la adolescencia. Mejorar las
condiciones más tarde en la vida no logra revertir plenamente el impacto de la
malnutrición y las enfermedades a temprana edad.

3.6.- La Repercusión de Enfermedades Específicas en los Resultados


Económicos

Hay muchos ejemplos de evidente vinculación entre el control o la reducción de


enfermedades específicas y su repercusión en la productividad en el trabajo y/o el
5
Strauss, Duncan, op cit.
aumento de los ingresos. Un estudio reciente, usando el análisis de reglas de
clasificación encontró que el clima juega un papel dominante en las diferencias
interpaíses de morbilidad por malaria, pero concluyó, así mismo, que la ubicación
tropical no es destino: el clima, el acceso a la atención de salud rural y la igualdad
de ingresos influyen en la morbilidad por malaria. En un marco de crecimiento
transversal, se encontró que hay una significativa asociación negativa entre la
morbilidad por malaria y una mayor tasa de crecimiento del PIB que es muy fuerte
e incluso controla causales inversas. Una cuarta parte de los países muestra que
la repercusión negativa es de un cuarto de un por ciento por año, pero en África
del Bajo Sahara, la malaria por impacto de crecimiento absoluto estimado excede
la mitad de un por ciento por año6.

Sachs y Gallup investigaron la repercusión cuantitativa de la endemicidad de la


malaria en el crecimiento macroeconómico interpaíses. Controlando la ubicación
tropical, la ubicación en África, la esperanza de vida al nacer, la política de
comercio, la accesibilidad geográfica al comercio internacional y los ingresos
iniciales, se encontró que la endemicidad de la malaria falciperum se correlaciona
con las tasas de crecimiento per cápita del PIB reducidas sustancialmente durante
un período de 25 años. Se especuló que gran parte de esta repercusión podría
deberse a la integración obstaculizada de las zonas maláricas en las redes
mundiales de comercio7.

Por otro lado, Bloom y Mahal encontraron que la epidemia del SIDA ha tenido un
efecto insignificante en la tasa de crecimiento de los ingresos per cápita, sin
evidencias de causalidad inversa, en un total de 51 países en desarrollo y
desarrollados, usando modelos de crecimiento empírico establecidos y
controlando variedad o factores posiblemente correlacionados con la prevalencia
del SIDA que podrían influir en el crecimiento y explicar la simultaneidad en la
relación entre el SIDA y el crecimiento económico. Los autores terminan
manifestando que conclusiones similares podrían obtenerse analizando la
insignificante repercusión que la Peste Negra tuvo sobre los salarios en Inglaterra
y Francia en la Edad Media. No obstante, se plantea el punto de que las
consecuencias económicas más graves del SIDA se encontrarán en sectores
industriales y ocupacionales especiales, en regiones geográficas especiales y
entre grupos demográficos especiales. Los autores concluyen que estos tópicos
parecen ser las áreas más prometedoras para proseguir con la investigación, junto
con una mayor aplicación de análisis de costo-beneficio y costo-eficacia a los
6
McCarthy, F. Desmond, Wolf, Holger, Wu, Yi, The Growth costs of malaria , NBER, Paper 7541, Cambridge,
Feb 2000.
7
Gallup, John L, Jeffrey D. Sachs y Andrew Mellinger, Geography and economic development, 1998, cit in
Hamoudi, Amar A. And Sachs, Jeffrey D., Economic Consequences of Health Status, CID Working Paper No.
30, November 1999.
programas y políticas dirigidas a la atención de personas que viven con SIDA y a
la prevención de la transmisión del VIH8.

4.- ESPECIFICACIÓN DEL MODELO

Los datos a utilizar para la elaboración del modelo son de la siguiente fuente:

ENAHO: Encuesta Nacional De Hogares

8
Bloom, David E, Mahal, Ajay S., Does the AIDS epidemic really threaten economic growth?, NBER, Paper
5148, June 1995
Sector Salud:

 Año: 2010 - III Trimestre

 Departamento: Cajamarca – Código: 60 000

4.1.- Forma Funcional:

El modelo propuesto viene dado por la siguiente función:

¿Padece de alguna enfermedad o malestar crónico? = (¿El establecimiento


de salud donde se atendió se encuentra?, ¿Cuánto fue el monto total por las
medicinas?, ¿Cuánto fue el monto total por la consulta?, En las ultimas 4 semanas
¿Presento Ud. algún síntoma o malestar?, ¿Que edad tiene en años cumplidos?,
En los últimos 12 meses ¿estuvo Ud. Hospitalizado?, Ud. actualmente esta afiliado
a essalud, En los últimos 3 meses ¿Ha efectuado consulta por prevención de
enfermedades?, ¿En el establecimiento de salud donde fue atendido, los
medicamentos que le recetaron los encontró?, ¿Se soluciono el problema de salud
por el cual busco atención?, En las ultimas 4 semanas ¿Presento Ud. alguna
recaída de enfermedad crónica?, sexo)

En forma abreviada se tenemos:

Enfi = (Ubicentrosali, Montomedi, Montoconsi, Sintomasi, Edadi, Hospiti, Essaludi,


Prevenfi, Medicamentosi, Solprobsali, Recenfi, Sexoi)

Donde:

 Enfi : ¿Padece de alguna enfermedad o malestar crónico?:


1: Si.
0: No

 Ubicentrosali: ¿El establecimiento de salud donde se atendió se


encuentra? Toma dos valores:
1: Muy cerca
2: Cerca
3: Lejos
4: Muy Lejos
5: No sabe
 Montomedi: ¿Cuánto fue el monto total por las medicinas?

 Montoconsi: ¿Cuánto fue el monto total por la consulta?

 Sintomasi: En las ultimas 4 semanas ¿Presento Ud. algún síntoma o


malestar?
1: Si
0: No

 Edad: Expresado en años cumplidos.

 Hospiti: En los últimos 12 meses ¿estuvo Ud. Hospitalizado?


1: Si
0: No

 Essaludi : Ud. actualmente esta afiliado a essalud


1: Si
0: No

 Prevenfi: En los últimos 3 meses ¿Ha efectuado consulta por


prevención de enfermedades?:
1: Si
0: No

 Medicamentosi: ¿En el establecimiento de salud donde fue


atendido, los medicamentos que le recetaron los encontró?
1: Todos
2: La mayoría
3: Muy pocos
4: Ninguno
5: No sabe

 Solprobsali: ¿Se soluciono el problema de salud por el cual busco


atención?
1: Si totalmente
2: Si parcialmente
3: No, porque no tuvo dinero para medicamentos
4: No, porque no siguió las indicaciones del médico
5: No, porque el tratamiento no es el adecuado
6: Aún no concluye el tratamiento
7: otro

 Recenfi: En las ultimas 4 semanas ¿Presento Ud. alguna recaída de


enfermedad crónica?
1: Si
0: No

 Sexo : Expresado en:


1: Hombre
0: Mujer

4.2.- Modelo Económico:

Enfi = α0 + α1Ubicentrosali + α2Montomedi + α3Montoconsi + α4Sintomasi + α5Edadi


+ α6Hospiti + α7Essaludi + α8Prevenfi + α9Medicamentosi + α10Solprobsali +
α11Recenfi + α12Sexoi

4.3.- Modelo Econométrico:

Enfi = α0 + α1Ubicentrosali + α2Montomedi + α3Montoconsi + α4Sintomasi + α5Edadi


+ α6Hospiti + α7Essaludi + α8Prevenfi + α9Medicamentosi + α10Solprobsali +
α11Recenfi + α12Sexoi + µt

4.4.- Hipótesis

En la estimación se espera que los parámetros tengan los siguientes resultados:

 0: Parámetro Autónomo.

 1 > 0: Representa el grado de sensibilidad de la variable dependiente


cualitativa respecto a la Ubicación del centro de salud, su signo se espera sea
positivo debido a que si la ubicación del establecimiento de salud se encuentra
a menor/mayor distancia del centro poblado se tendrá menor/mayor probabilidad
de padecer una enfermedad o malestar crónico.

ENF
1  0
UBICENTROSAL

 2 > 0: Para la variable monto total por las medicinas se espera que tenga una
relación positiva. De manera que si monto de las medicinas es elevado el
individuo tendrá más probabilidad de padecer una enfermedad o malestar
crónico.

ENF
2  0
MONTOMED

 3 > 0: Para la variable monto total por la consulta se espera que tenga una
relación positiva. De manera que si monto de la consulta médica es elevado el
individuo tendrá más probabilidad de padecer una enfermedad o malestar
crónico.

ENF
3  0
MONTOCONS

 4 > 0: Representa el grado de sensibilidad de la variable dependiente cualitativa


respecto a la variable Presento algún síntoma o malestar?, se espera una
relación directa entre dicha variable y la variable dependiente cualitativa. Una
mayor presencia de síntomas/malestar en las últimas 4 semanas representa una
mayor probabilidad de padecer una enfermedad o malestar crónico.

ENF
4  0
SINTOMAS

 5 >< 0 : Representa el grado de sensibilidad de la variable dependiente


cualitativa respecto a la Edad .La relación es ambigua se espera signo positivo
o negativo.

ENF
5   0
EDAD

 6 > 0: Representa el grado de sensibilidad de la variable dependiente cualitativa


respecto a la variable ¿Estuvo Ud. Hospitalizado?, se espera una relación
directa entre dicha variable y la variable dependiente cualitativa. Una mayor
presencia de hospitalizaciones en los últimos 12 meses representa una mayor
probabilidad de padecer una enfermedad o malestar crónico.

ENF
6  0
HOSPIT

 7 < 0: Representa el grado de sensibilidad de la variable dependiente cualitativa


respecto a la variable Ud. actualmente esta afiliado a essalud, se espera que sea
de signo negativo, puesto que si el individuo esta afiliado a essalud reduce la
probabilidad de padecer una enfermedad o malestar crónico.

ENF
7  0
ESSALUD

 8 < 0: Representa el grado de sensibilidad de la variable dependiente cualitativa


respecto a la variable ¿ha efectuado consulta por prevención de enfermedades?,
se espera que sea de signo negativo. Un aumento en la frecuencia de consultas
para prevenir enfermedades disminuye la probabilidad de padecer una
enfermedad o malestar crónico.

ENF
8  0
PREVENF

 9 < 0: Respecto al parámetro asociado a la variable En el establecimiento de


salud donde fue atendido, los medicamentos que le recetaron los encontró?, se
espera que tenga una relación inversa, puesto que si aumenta la frecuencia de
encontrar los medicamentos recetados disminuye la probabilidad de padecer una
enfermedad o malestar crónico.

ENF
9  0
MEDICAMENTOS

 10 < 0: Se espera que la relación entre la variable Se soluciono el problema de


salud por el cual busco atención?, y la variable endógena cualitativa sea negativa.

ENF
 10  0
SOLPROBSAL
 11 > 0: Representa el grado de sensibilidad de la variable dependiente cualitativa
respecto a la variable Presento Ud. alguna recaída de enfermedad crónica?, se
espera una relación directa entre dicha variable y la variable dependiente
cualitativa. Una mayor presencia de recaídas en las últimas 4 semanas representa
una mayor probabilidad de padecer una enfermedad o malestar crónico.

NIEDU
 11  0
RECENF

 12 >< 0: Representa el grado de sensibilidad de la variable dependiente


cualitativa respecto al Sexo. Su influencia puede se positiva o negativo, el signo
de este parámetro nos permitirá establecer el efecto de la variable sexo sobre la
variable dependiente cualitativa en estudio.

ENF
 12   0
SEXO

5.- CONSTRUCCIÓN DEL MODELO LOGIT

5.1.- Regresiones Univariantes

ELECCIÓN DEL MODELO DE PROBABILIDAD LOGIT

VARIABLE SIGNO BETA T CALCULADO R Mc Fadden


UBICENTROSAL + -0.309767 -3.930095 0.016251
MONTOMED + 0.012769 3.384125 0.022484
MONTOCONS + 0.014464 1.122360 0.001314
SINTOMAS + 0.699657 4.175038 0.019657
EDAD ± 0.047642 11.17455 0.171368
HOSPIT + 1.543770 4.897182 0.025980
ESSALUD - 0.437427 1.625669 0.002815
PREVENF - 1.258889 0.888636 0.000833
MEDICAMENTOS - -0.215053 -3.597162 0.013615
SOLPROBSAL - -0.085445 -1.943183 0.004025
RECENF + 44.78047 1.54E-07 0.234265
SEXO ± -0.459912 -2.726070 0.008460

Ahora se procede a calcular el Z statistic al 10%, 5% y 1% para determinar el nivel


de significancia de las variables exógenas a ser incluidas en el modelo.
Z0.90 = 1.6449 al 10%, Z0.95 = 1.95997 al 5% y Z0.99 = 2.575829 al 1% de
significancia estadística.

Resumen de las Estimaciones Univariantes

VARIABLE SIGNO SIGNO SIGNIFICANCIA R2 DE MC


ESPERADO OBTENIDO ESTADISTICA FADDEN
UBICENTROSAL + - Altamente significativo Bajo
MONTOMED + + Altamente significativo Bajo
MONTOCONS + + No Significativo Bajo
SINTOMAS + + Altamente significativo Bajo
EDAD ± + Altamente significativo Regular
HOSPIT + + Altamente significativo Bajo
ESSALUD - + No Significativo Bajo
PREVENF - + No Significativo Bajo
MEDICAMENTOS - - Altamente significativo Bajo
Relativamente
SOLPROBSAL - - Significativo Bajo
RECENF + + No Significativo Alto
SEXO ± - significativo Bajo

 Por el criterio de los signos podemos apreciar que todas las variables
cumplen con los signos esperados con la excepción de las variables
ubicación del centro de salud (UBICENTROSAL), afiliado a essalud
(ESSALUD) y prevención de enfermedades (PREVENF), puesto que no
cumplen con los signos especificados por lo que quedan eliminados de
nuestro modelo.

 El criterio del nivel de significancia nos dice que se deberían eliminar


las variables monto de consulta (MONTOCONS) y la variable presento
alguna recaída de enfermedad crónica (RECENF), puesto que son no
significativas.
 Por lo tanto nos quedan las variables monto de medicinas
(MONTOMED), presento algún síntoma o malestar (SINTOMAS), estuvo
hospitalizado (HOSPIT) edad, los medicamentos que le recetaron los
encontró (MEDICAMENTOS), se soluciono el problema de salud por el
cual busco atención (SOLPROBSAL) y sexo

5.2.- Multicolinealidad

H0: Existencia de Multicolinealidad leve


H1: Existencia de Multicolinealidad grave.

MONTOMED SINTOMAS HOSPIT EDAD MEDICAMENTOS SOLPROBSAL SEXO


MONTOMED 1.000000 0.016987 0.034699 0.064069 -0.025755 -0.048729 0.037728
SINTOMAS 0.016987 1.000000 0.063816 0.264655 -0.097916 -0.073312 -0.105839
HOSPIT 0.034699 0.063816 1.000000 0.130955 -0.026392 -0.022921 -0.045841
EDAD 0.064069 0.264655 0.130955 1.000000 -0.014170 0.017732 -0.055164
MEDICAMENT
OS -0.025755 -0.097916 -0.026392 -0.014170 1.000000 0.917105 0.054031
SOLPROBSAL -0.048729 -0.073312 -0.022921 0.017732 0.917105 1.000000 0.047358
SEXO 0.037728 -0.105839 -0.045841 -0.055164 0.054031 0.047358 1.000000

Finalmente comprobamos la multicolinealidad entre las variables restantes r xy > 0.5


generando la matriz de correlación:

Se puede apreciar que existe multicolinealidad entre las variables Se soluciono el


problema de salud por el cual busco atención (SOLPROBSAL) y los
medicamentos que le recetaron los encontró (MEDICAMNETOS) entonces, se
elimina la variable con menor R2 MC FADDEN y la menos significativa. La variable
eliminada es SOLPROBSAL dado que su R2 MC FADDEN = 0.004025 y es
relativamente significativa.
Por lo tanto se concluye que el modelo a estimar es el siguiente:

Enfi = α0 + α1Montomedi + α2Sintomasi + α3Edadi + α4Hospiti + α5Medicamentosi +


α6Sexoi + µt

5.3.- Estimación del Modelo Logit

Dependent Variable: ENF


Method: ML - Binary Logit (Quadratic hill climbing)
Date: 02/23/11 Time: 23:51
Sample: 1 850
Included observations: 843
Convergence achieved after 5 iterations
Covariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C -1.926979 0.372206 -5.177190 0.0000


MONTOMED 0.009851 0.003429 2.872804 0.0041
SINTOMAS 0.107249 0.197567 0.542848 0.5872
HOSPIT 1.273866 0.358100 3.557288 0.0004
EDAD 0.046705 0.004557 10.24997 0.0000
MEDICAMENTOS -0.234355 0.070659 -3.316704 0.0009
SEXO -0.383702 0.195323 -1.964444 0.0495

Mean dependent var 0.221827 S.D. dependent var 0.415722


S.E. of regression 0.359438 Akaike info criterion 0.841243
Sum squared resid 108.0075 Schwarz criterion 0.880577
Log likelihood -347.5838 Hannan-Quinn criter. 0.856316
Restr. log likelihood -446.1244 Avg. log likelihood -0.412318
LR statistic (6 df) 197.0811 McFadden R-squared 0.220881
Probability(LR stat) 0.000000

Obs with Dep=0 656 Total obs 843


Obs with Dep=1 187

5.4.- Evaluación del Modelo

5.4.1.- Significancia Individual

 Monto gastado en medicinas (MONTOMED)

H0: α1 = 0 El parámetro no es estadísticamente significativo.


H0: α1 ≠ 0 El parámetro es estadísticamente significativo.

Z = 2.872804 > N (1.96), por lo tanto, se rechaza la hipótesis nula.


Como la probabilidad es menor a prob(0.0041) < 0.05, se concluye que el
parámetro de la variable monto gastado en medicinas es estadísticamente
significativo.

 Presento algún síntoma o malestar (SINTOMA)

H0: α2 = 0 El parámetro no es estadísticamente significativo.


H0: α2 ≠ 0 El parámetro es estadísticamente significativo.

Z= 0.542848 ~ N (1.96), por lo tanto, se acepta la hipótesis nula.

Como la probabilidad es mayor a prob (0.5872) > 0.05, se concluye que el


parámetro de la variable Presento algún síntoma o malestar, no es
estadísticamente significativo.

 Estuvo hospitalizado (HOSPIT)

H0: α3 = 0 El parámetro no es estadísticamente significativo.


H0: α3 ≠ 0 El parámetro es estadísticamente significativo.

Z= 3.557288 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a prob (0.0004) < 0.05, se concluye que el


parámetro de la variable estuvo hospitalizado, es estadísticamente significativo.

 EDAD

H0: α4 = 0 El parámetro no es estadísticamente significativo.


H0: α4 ≠ 0 El parámetro es estadísticamente significativo.

Z= 10.24997 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a prob (0.0000) < 0.05, se concluye que el


parámetro de la variable edad, es estadísticamente significativo.

 Los medicamentos que le recetaron los encontró (MEDICAMENTOS)


H0: α5 = 0 El parámetro no es estadísticamente significativo.
H0: α5 ≠ 0 El parámetro es estadísticamente significativo.

Z = -3.316704 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a p (0.0009) < 0.05, se concluye que el parámetro


de la variable Los medicamentos que le recetaron los encontró, es altamente
significativo.

 SEXO

H0: α6 = 0 El parámetro no es estadísticamente significativo.


H0: α6 ≠ 0 El parámetro es estadísticamente significativo.

Z = -1.964444 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a p (0.0495) < 0.05, se concluye que el parámetro


de la variable sexo, es altamente significativo.

5.4.2.- Significancia global:

H0: α1 = α2 = α3 = α4 = α5 = α6 = 0, (Los parámetros no son estadísticamente


significativos).

H1: α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6 ≠ 0, (Los parámetros son estadísticamente


significativos).

 El estadístico de prueba es: LR v/s Chi- Cuadrado.

 

LR =-2(ln l (r )  ln l (w) ) v/s X20.95, 6 = 12.5916

Entonces:
LR = 197.0811 > X20.95, 6 = 12.5916
LR > X2, Se rechaza la hipótesis nula, además como la probabilidad es 0.000000
concluimos que las variables que conforman el modelo es altamente significativo.
5.4.3.- Bondad de Ajuste

COEFICIENTE DE BONDAD

TIPO VALOR

R2 0.257857
EFFRON 0.257774
MC FADDEN 0.220881
CRAGG-UHLER 0.319249

Observando los diferentes R2 podemos concluir que entre un 25 a 32% de la


variación de la variable endógena cualitativa padece de alguna enfermedad o
malestar crónico es explicado conjuntamente por las variables exógenas monto de
medicinas (MONTOMED), presento algún síntoma o malestar (SINTOMAS),
estuvo hospitalizado (HOSPIT), EDAD, los medicamentos que le recetaron los
encontró (MEDICAMENTOS) y SEXO

R2 de Conteo

R2 de Conteo = # de Predicciones Correctas


# Total de Observaciones

R2 de Conteo = 702 = 83.27%


843

Observando el R2 de conteo podemos concluir que 83.27% de la variación de la


variable endógena cualitativa padece de alguna enfermedad o malestar crónico es
explicado conjuntamente por las variables exógenas monto de medicinas
(MONTOMED), presento algún síntoma o malestar (SINTOMAS), estuvo
hospitalizado (HOSPIT), EDAD, los medicamentos que le recetaron los encontró
(MEDICAMENTOS) y SEXO.

5.4.4.- Evaluación de la Capacidad Predictiva

Dependent Variable: ENF


Method: ML - Binary Logit (Quadratic hill climbing)
Date: 02/23/11 Time: 23:51
Sample: 1 850
Included observations: 843
Prediction Evaluation (success cutoff C = 0.5)

Estimated Equation Constant Probability


Dep=0 Dep=1 Total Dep=0 Dep=1 Total

P(Dep=1)<=C 625 110 735 656 187 843


P(Dep=1)>C 31 77 108 0 0 0
Total 656 187 843 656 187 843
Correct 625 77 702 656 0 656
% Correct 95.27 41.18 83.27 100.00 0.00 77.82
% Incorrect 4.73 58.82 16.73 0.00 100.00 22.18
Total Gain* -4.73 41.18 5.46
Percent
Gain** NA 41.18 24.60

Estimated Equation Constant Probability


Dep=0 Dep=1 Total Dep=0 Dep=1 Total

E(# of Dep=0) 547.33 108.67 656.00 510.48 145.52 656.00


E(# of Dep=1) 108.67 78.33 187.00 145.52 41.48 187.00
Total 656.00 187.00 843.00 656.00 187.00 843.00
Correct 547.33 78.33 625.66 510.48 41.48 551.96
% Correct 83.43 41.89 74.22 77.82 22.18 65.48
% Incorrect 16.57 58.11 25.78 22.18 77.82 34.52
Total Gain* 5.62 19.71 8.74
Percent
Gain** 25.32 25.32 25.32

El porcentaje correcto TOTAL de predicción del modelo logit es del 83.27%, de un


total de 843 observaciones, 187 padecen de alguna enfermedad o malestar
crónico, de los cuales el modelo ha acertado en 77 observaciones, las cuales
representan un porcentaje del 41.18%; respecto a quienes no padecen de alguna
enfermedad o malestar crónico de un total de 656 observaciones el modelo ha
acertado en 625 observaciones., la cuales representan un porcentaje del 95.27%.
El modelo nos predice con mayor precisión a los que no padecen de alguna
enfermedad o malestar crónico. Asimismo el porcentaje de ganancia de la
predicción del modelo con respecto a la probabilidad constante es de 24.60%.

5.4.5.- Test de Goodness of Fit


H0: El modelo se comporta bien y tiene buen ajuste.
H1: El modelo no se comporta bien ni tiene buen ajuste.
Dependent Variable: ENF
Method: ML - Binary Logit (Quadratic hill climbing)
Date: 02/23/11 Time: 23:51
Sample: 1 850
Included observations: 843
Andrews and Hosmer-Lemeshow Goodness-of-Fit Tests
Grouping based upon predicted risk (randomize ties)

Quantile of Risk Dep=0 Dep=1 Total H-L


Low High Actual Expect Actual Expect Obs Value

1 0.0298 0.0563 134 133.559 6 6.44072 140 0.03161


2 0.0565 0.0819 129 131.295 12 9.70522 141 0.58270
3 0.0825 0.1319 124 125.735 16 14.2652 140 0.23492
4 0.1319 0.2351 116 115.219 25 25.7811 141 0.02896
5 0.2367 0.4079 103 95.7527 37 44.2473 140 1.73556
6 0.4101 0.9823 50 54.4395 91 86.5605 141 0.58972

Total 656 656.000 187 187.000 843 3.20347

H-L Statistic: 3.2035 Prob. Chi-Sq(4) 0.5244


Andrews Statistic: 3.4362 Prob. Chi-Sq(6) 0.7524

H-L statistic = 3.2035 V/S X20.95, 4 = 9.4877

Según el Test de Goodness of Fit comparando el H-L statistic con la Chi-cuadrado


se acepta la hipótesis nula con lo cual se verifica que el modelo se comporta bien
y tiene buen ajuste.

5.4.6.- Normalidad de los Residuos


H0: Los residuos se aproximan a una distribución normal
H1: Los residuos no se aproximan a una distribución normal
350
Series: Standardized Residuals
300 Sample 1 850
Observations 843
250
Mean 0.007826
200 Median -0.287713
Maximum 5.318384
Minimum -2.794694
150
Std. Dev. 1.014549
Skewness 2.136905
100
Kurtosis 8.205219
50 Jarque-Bera 1593.261
Probability 0.000000
0
-2.5 0.0 2.5 5.0

Es estadístico es: JB = 1593.261 > X ( 0.95, 2 )  5.99


2

Según el Test de JB se rechaza la hipótesis nula por lo tanto los residuos no se


distribuyen con una normal.

5.4.7.- Autocorrelación
H0: Ausencia de Autocorrelación de orden m.
H1: Existencia de Autocorrelación de orden m.

Date: 02/25/11 Time: 10:22


Sample: 1 850
Included observations: 843

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

.|. | .|. | 1 0.022 0.022 0.4101 0.522


.|* | .|. | 2 0.066 0.065 4.0879 0.130

BP1= 843*(0.022)2 = 0.408012 < X20.95, 1 = 3.84, por tanto concluimos que
aceptamos la hipótesis nula, no existe autocorrelación de primer orden.

BP2= 843*[(0.022)2 + (0.066)2] = 4.08012 < X 20.95, 2 = 5.99, por tanto concluimos
que aceptamos la hipótesis nula, no existe autocorrelación de segundo orden.

5.4.8.- Heterocedasticidad
H0: Ausencia de Heterocedasticidad
H1: Existencia de Heterocedasticidad

Test for Equality of Variances of RESID01


Categorized by values of RESID01
Date: 02/25/11 Time: 00:07
Sample: 1 850
Included observations: 843

Method df Value Probability

Bartlett 3 14.00441 0.0029


Levene (3, 839) 7.648694 0.0000
Brown-Forsythe (3, 839) 6.969740 0.0001

Category Statistics

Mean Abs. Mean Abs.


RESID01 Count Std. Dev. Mean Diff. Median Diff.
[-1, -0.5) 31 0.097798 0.072515 0.068696
[-0.5, 0) 625 0.109901 0.089452 0.081355
[0, 0.5) 77 0.133138 0.109090 0.106910
[0.5, 1) 110 0.135557 0.116147 0.115893
All 843 0.358155 0.094106 0.087730

Bartlett weighted standard deviation: 0.115404

Observando los estadísticos de Bartlett (14.00441) es mayor a X 20.95, 3 = 7.814728,


se concluye que los residuos son heterocedasticos, puesto que la probabilidad de
rechazar la hipótesis nula es menor al 5%.

El estadístico Levene (7.648694) y Brown – Forsythe (6.969740) son mayores al


estadístico F0.95, 3, 839 = 2.61551, también permiten rechazar la hipótesis nula de
ausencia de heterocedasticidad.

5.4.9.- Corrección de Heterocedasticidad

Dependent Variable: ENF


Method: ML - Binary Logit (Quadratic hill climbing)
Date: 02/26/11 Time: 12:52
Sample: 1 850
Included observations: 843
Convergence achieved after 5 iterations
QML (Huber/White) standard errors & covariance

Variable Coefficient Std. Error z-Statistic Prob.

C -1.926979 0.350774 -5.493505 0.0000


MONTOMED 0.009851 0.002971 3.316096 0.0009
SINTOMAS 0.107249 0.196215 0.546587 0.5847
HOSPIT 1.273866 0.387239 3.289610 0.0010
EDAD 0.046705 0.004551 10.26156 0.0000
MEDICAMENTOS -0.234355 0.066445 -3.527042 0.0004
SEXO -0.383702 0.194515 -1.972613 0.0485

Mean dependent var 0.221827 S.D. dependent var 0.415722


S.E. of regression 0.359438 Akaike info criterion 0.841243
Sum squared resid 108.0075 Schwarz criterion 0.880577
Log likelihood -347.5838 Hannan-Quinn criter. 0.856316
Restr. log likelihood -446.1244 Avg. log likelihood -0.412318
LR statistic (6 df) 197.0811 McFadden R-squared 0.220881
Probability(LR stat) 0.000000

Obs with Dep=0 656 Total obs 843


Obs with Dep=1 187

6.- CONSTRUCCIÓN DEL MODELO PROBIT

6.1.- Regresiones Univariables

ELECCIÓN DEL MODELO DE PROBABILIDAD PROBIT

VARIABLE BETA T CALCULADO R Mc Fadden


UBICENTROSAL -0.185599 -3.851470 0.016287
MONTOMED 0.007589 3.573534 0.022739
MONTOCONS 0.008606 1.064053 0.001278
SINTOMAS 0.699657 4.175038 0.019657
EDAD 0.027467 11.59389 0.170025
HOSPIT 0.941586 4.804903 0.025980
ESSALUD 0.258494 1.599460 0.002815
PREVENF 0.768264 0.865614 0.000833
MEDICAMENTOS -0.128884 -3.530533 0.013674
SOLPROBSAL -0.051341 -1.933995 0.004101
RECENF 13.65396 0.234265
SEXO -0.266093 -2.738647 0.008460

Ahora se procede a calcular el Z statistic al 10%, 5% y 1% para determinar el nivel


de significancia de las variables exógenas a ser incluidas en el modelo.
Z0.90 = 1.6449 al 10%, Z0.95 = 1.95997 al 5% y Z0.99 = 2.575829 al 1% de
significancia estadística.

Resumen de las Estimaciones Univaribles


VARIABLE SIGNO SIGNO SIGNIFICANCIA R2 DE MC
ESPERADO OBTENIDO ESTADISTICA FADDEN
UBICENTROSAL + - Altamente significativo Bajo
MONTOMED + + Altamente significativo Bajo
MONTOCONS + + No Significativo Bajo
SINTOMAS + + Altamente significativo Bajo
EDAD ± + Altamente significativo Regular
HOSPIT + + Altamente significativo Bajo
ESSALUD - + No Significativo Bajo
PREVENF - + No Significativo Bajo
MEDICAMENTOS - - Altamente significativo Bajo
Relativamente
SOLPROBSAL - - Significativo Bajo
RECENF + + Alto
SEXO ± - significativo Bajo

 Por el criterio de los signos podemos apreciar que todas las variables
cumplen con los signos esperados con la excepción de las variables
ubicación del centro de salud (UBICENTROSAL), afiliado a essalud
(ESSALUD) y prevención de enfermedades (PREVENF), puesto que no
cumplen con los signos especificados por lo que quedan eliminados de
nuestro modelo.
 El criterio del nivel de significancia nos dice que se deberían eliminar
las variables monto de consulta (MONTOCONS) y la variable presento
alguna recaída de enfermedad crónica (RECENF), puesto que son no
significativas.

 Por lo tanto nos quedan las variables monto de medicinas


(MONTOMED), presento algún síntoma o malestar (SINTOMAS), estuvo
hospitalizado (HOSPIT) EDAD, los medicamentos que le recetaron los
encontró (MEDICAMENTOS), se soluciono el problema de salud por el
cual busco atención (SOLPROBSAL) y SEXO.

6.2.- Multicolinealidad

H0: Existencia de Multicolinealidad leve


H1: Existencia de Multicolinealidad grave.

MONTOMED SINTOMAS HOSPIT EDAD MEDICAMENTOS SOLPROBSAL SEXO


MONTOMED 1.000000 0.016987 0.034699 0.064069 -0.025755 -0.048729 0.037728
SINTOMAS 0.016987 1.000000 0.063816 0.264655 -0.097916 -0.073312 -0.105839
HOSPIT 0.034699 0.063816 1.000000 0.130955 -0.026392 -0.022921 -0.045841
EDAD 0.064069 0.264655 0.130955 1.000000 -0.014170 0.017732 -0.055164
MEDICAMENT
OS -0.025755 -0.097916 -0.026392 -0.014170 1.000000 0.917105 0.054031
SOLPROBSAL -0.048729 -0.073312 -0.022921 0.017732 0.917105 1.000000 0.047358
SEXO 0.037728 -0.105839 -0.045841 -0.055164 0.054031 0.047358 1.000000

Finalmente comprobamos la multicolinealidad entre las variables restantes r xy > 0.5


generando la matriz de correlación:

Se puede apreciar que existe multicolinealidad entre las variables Se soluciono el


problema de salud por el cual busco atención (SOLPROBSAL) y los
medicamentos que le recetaron los encontró (MEDICAMNETOS) entonces, se
elimina la variable con menor R2 MC FADDEN y la menos significativa. La variable
eliminada es SOLPROBSAL dado que su R2 MC FADDEN = 0.004025 y es
relativamente significativa.

Por lo tanto se concluye que el modelo a estimar es el siguiente:

Enfi = α0 + α1Montomedi + α2Sintomasi + α3Edadi + α4Hospiti + α5Medicamentosi +


α6Sexoi + µt
6.3.- Estimación del Modelo Probit

Dependent Variable: ENF


Method: ML - Binary Probit (Quadratic hill climbing)
Date: 02/25/11 Time: 11:14
Sample: 1 850
Included observations: 843
Convergence achieved after 4 iterations
Covariance matrix computed using second derivatives

Variable Coefficient Std. Error z-Statistic Prob.

C -1.115581 0.215575 -5.174903 0.0000


MONTOMED 0.005797 0.001983 2.923672 0.0035
SINTOMAS 0.060876 0.111764 0.544684 0.5860
HOSPIT 0.744866 0.209659 3.552751 0.0004
EDAD 0.026488 0.002515 10.53229 0.0000
MEDICAMENTOS -0.133156 0.041140 -3.236658 0.0012
SEXO -0.203273 0.109119 -1.862865 0.0625

Mean dependent var 0.221827 S.D. dependent var 0.415722


S.E. of regression 0.360134 Akaike info criterion 0.843379
Sum squared resid 108.4265 Schwarz criterion 0.882714
Log likelihood -348.4844 Hannan-Quinn criter. 0.858452
Restr. log likelihood -446.1244 Avg. log likelihood -0.413386
LR statistic (6 df) 195.2799 McFadden R-squared 0.218863
Probability(LR stat) 0.000000

Obs with Dep=0 656 Total obs 843


Obs with Dep=1 187

6.4.- Evaluación del Modelo

6.4.1.- Significancia Individual

 Monto gastado en medicinas (MONTOMED)

H0: α1 = 0 El parámetro no es estadísticamente significativo.


H0: α1 ≠ 0 El parámetro es estadísticamente significativo.
Z = 2.923672 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a prob (0.0035) < 0.05, se concluye que el


parámetro de la variable monto gastado en medicinas es estadísticamente
significativo.

 Presento algún síntoma o malestar (SINTOMA)

H0: α2 = 0 El parámetro no es estadísticamente significativo.


H0: α2 ≠ 0 El parámetro es estadísticamente significativo.

Z= 0.544684 ~ N (1.96), por lo tanto, se acepta la hipótesis nula.

Como la probabilidad es mayor a prob (0.5860) > 0.05, se concluye que el


parámetro de la variable Presento algún síntoma o malestar, no es
estadísticamente significativo.

 Estuvo hospitalizado (HOSPIT)

H0: α3 = 0 El parámetro no es estadísticamente significativo.


H0: α3 ≠ 0 El parámetro es estadísticamente significativo.

Z= 3.552751 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a prob (0.0004) < 0.05, se concluye que el


parámetro de la variable estuvo hospitalizado, es estadísticamente significativo.

 EDAD

H0: α4 = 0 El parámetro no es estadísticamente significativo.


H0: α4 ≠ 0 El parámetro es estadísticamente significativo.
Z= 10.53229 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a prob (0.0000) < 0.05, se concluye que el


parámetro de la variable edad, es estadísticamente significativo.
 Los medicamentos que le recetaron los encontró (MEDICAMENTOS)

H0: α5 = 0 El parámetro no es estadísticamente significativo.


H0: α5 ≠ 0 El parámetro es estadísticamente significativo.

Z = -3.236658 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a p (0.0012) < 0.05, se concluye que el parámetro


de la variable Los medicamentos que le recetaron los encontró, es altamente
significativo.

 SEXO

H0: α6 = 0 El parámetro no es estadísticamente significativo.


H0: α6 ≠ 0 El parámetro es estadísticamente significativo.

Z = -1.862865 > N (1.96), por lo tanto, se rechaza la hipótesis nula.

Como la probabilidad es menor a p (0.0625) < 0.10, se concluye que el parámetro


de la variable sexo, es relativamente significativo.

6.4.2.- Significancia global:

H0: α1 = α2 = α3 = α4 = α5 = α6 = 0, (Los parámetros no son estadísticamente


significativos).

H1: α1 ≠ α2 ≠ α3 ≠ α4 ≠ α5 ≠ α6 ≠ 0, (Los parámetros son estadísticamente


significativos).

 El estadístico de prueba es: LR v/s Chi- Cuadrado.


 

LR =-2(ln l (r )  ln l (w) ) v/s X20.95, 6 = 12.5916

Entonces:

LR = 195.2799 > X20.95, 6 = 12.5916


LR > X2, Se rechaza la hipótesis nula, además como la probabilidad es 0.000000
concluimos que el modelo es altamente significativo.
6.4.3.- Bondad de Ajuste

COEFICIENTE DE BONDAD

TIPO VALOR

R2 0.255059
EFFRON 0.254895
MC FADDEN 0.218863
CRAGG-UHLER 0.316656

Observando los diferentes R2 podemos concluir que entre un 25 a 31% de la


variación de la variable endógena cualitativa “padece de alguna enfermedad o
malestar crónico” es explicado conjuntamente por las variables exógenas monto
de medicinas (MONTOMED), presento algún síntoma o malestar (SINTOMAS),
estuvo hospitalizado (HOSPIT), EDAD, los medicamentos que le recetaron los
encontró (MEDICAMENTOS) y SEXO

R2 de Conteo

R2 de Conteo = # de Predicciones Correctas


# Total de Observaciones

R2 de Conteo = 700 = 83.04%


843

Observando el R2 de conteo podemos concluir que 83.04% de la variación de la


variable endógena cualitativa padece de alguna enfermedad o malestar crónico es
explicado conjuntamente por las variables exógenas monto de medicinas
(MONTOMED), presento algún síntoma o malestar (SINTOMAS), estuvo
hospitalizado (HOSPIT), EDAD, los medicamentos que le recetaron los encontró
(MEDICAMENTOS) y SEXO.

6.4.4.- Evaluación de la Capacidad Predictiva

Dependent Variable: ENF


Method: ML - Binary Probit (Quadratic hill climbing)
Date: 02/25/11 Time: 11:14
Sample: 1 850
Included observations: 843
Prediction Evaluation (success cutoff C = 0.5)

Estimated Equation Constant Probability


Dep=0 Dep=1 Total Dep=0 Dep=1 Total

P(Dep=1)<=C 625 112 737 656 187 843


P(Dep=1)>C 31 75 106 0 0 0
Total 656 187 843 656 187 843
Correct 625 75 700 656 0 656
% Correct 95.27 40.11 83.04 100.00 0.00 77.82
% Incorrect 4.73 59.89 16.96 0.00 100.00 22.18
Total Gain* -4.73 40.11 5.22
Percent
Gain** NA 40.11 23.53

Estimated Equation Constant Probability


Dep=0 Dep=1 Total Dep=0 Dep=1 Total

E(# of Dep=0) 545.91 109.10 655.01 510.48 145.52 656.00


E(# of Dep=1) 110.09 77.90 187.99 145.52 41.48 187.00
Total 656.00 187.00 843.00 656.00 187.00 843.00
Correct 545.91 77.90 623.80 510.48 41.48 551.96
% Correct 83.22 41.66 74.00 77.82 22.18 65.48
% Incorrect 16.78 58.34 26.00 22.18 77.82 34.52
Total Gain* 5.40 19.47 8.52
Percent
Gain** 24.34 25.03 24.68

El porcentaje correcto TOTAL de predicción del modelo Probit es del 83.04%, de


un total de 843 observaciones, 187 padecen de alguna enfermedad o malestar
crónico, de los cuales el modelo ha acertado en 75 observaciones, las cuales
representan un porcentaje del 40.11%; respecto a quienes no padecen de alguna
enfermedad o malestar crónico de un total de 656 observaciones el modelo ha
acertado en 625 observaciones., la cuales representan un porcentaje del 95.27%.
El modelo nos predice con mayor precisión a los que no padecen de alguna
enfermedad o malestar crónico. Asimismo el porcentaje de ganancia de la
predicción del modelo con respecto a la probabilidad constante es de 23.53%.

6.4.5.- Test de Goodness of Fit


H0: El modelo se comporta bien y tiene buen ajuste.
H1: El modelo no se comporta bien ni tiene buen ajuste.
Dependent Variable: ENF
Method: ML - Binary Probit (Quadratic hill climbing)
Date: 02/25/11 Time: 11:14
Sample: 1 850
Included observations: 843
Andrews and Hosmer-Lemeshow Goodness-of-Fit Tests
Grouping based upon predicted risk (randomize ties)

Quantile of Risk Dep=0 Dep=1 Total H-L


Low High Actual Expect Actual Expect Obs Value

1 0.0236 0.0533 134 134.180 6 5.82044 140 0.00578


2 0.0533 0.0827 129 131.459 12 9.54067 141 0.67996
3 0.0832 0.1389 124 125.228 16 14.7716 140 0.11420
4 0.1392 0.2496 115 113.766 26 27.2342 141 0.06932
5 0.2496 0.4095 104 94.5136 36 45.4864 140 2.93060
6 0.4127 0.9917 50 55.8590 91 85.1410 141 1.01773

Total 656 655.006 187 187.994 843 4.81759

H-L Statistic: 4.8176 Prob. Chi-Sq(4) 0.3065


Andrews Statistic: 5.9123 Prob. Chi-Sq(6) 0.4331

H-L statistic = 4.8176 V/S X20.95, 4 = 9.4877

Según el Test de Goodness of Fit comparando el H-L statistic con la Chi-cuadrado


se acepta la hipótesis nula con lo cual se verifica que el modelo se comporta bien
y tiene buen ajuste.

6.4.6.- Normalidad de los Residuos


H0: Los residuos se aproximan a una distribución normal
H1: Los residuos no se aproximan a una distribución normal.
300
Series: Standardized Residuals
Sample 1 850
250
Observations 843

200 Mean 0.006397


Median -0.287999
150 Maximum 5.851261
Minimum -2.717160
Std. Dev. 1.017303
100 Skewness 2.220205
Kurtosis 8.854565
50
Jarque-Bera 1896.510
Probability 0.000000
0
-2.5 0.0 2.5 5.0

Es estadístico es: JB = 1896.510 > X ( 0.95, 2 )  5.99


2

Según el Test de JB se rechaza la hipótesis nula por lo tanto los residuos no se


distribuyen con una normal.

6.4.7.- Autocorrelación
H0: Ausencia de Autocorrelación de orden m.
H1: Existencia de Autocorrelación de orden m.

Date: 02/25/11 Time: 18:47


Sample: 1 850
Included observations: 843

Autocorrelation Partial Correlation AC PAC Q-Stat Prob

.|. | .|. | 1 0.022 0.022 0.4221 0.516


.|. | .|. | 2 0.065 0.064 3.9575 0.138

BP1= 843*(0.022)2 = 0.408012 < X20.95, 1 = 3.84, por tanto concluimos que
aceptamos la hipótesis nula, no existe autocorrelación de primer orden.

BP2= 843*[(0.022)2 + (0.065)2] = 3.969687 < X20.95, 2 = 5.99, por tanto concluimos
que aceptamos la hipótesis nula, no existe autocorrelación de segundo orden.

6.4.8.- Heterocedasticidad

H0: Ausencia de Heterocedasticidad


H1: Existencia de Heterocedasticidad

Test for Equality of Variances of RESID01


Categorized by values of RESID01
Date: 02/25/11 Time: 18:52
Sample: 1 850
Included observations: 843

Method df Value Probability

Bartlett 3 13.04151 0.0045


Levene (3, 839) 7.199299 0.0001
Brown-Forsythe (3, 839) 6.364534 0.0003

Category Statistics

Mean Abs. Mean Abs.


RESID01 Count Std. Dev. Mean Diff. Median Diff.
[-1, -0.5) 31 0.096169 0.070288 0.065956
[-0.5, 0) 625 0.113568 0.093801 0.086344
[0, 0.5) 75 0.134179 0.108301 0.105983
[0.5, 1) 112 0.138754 0.119476 0.119388
All 843 0.358847 0.097637 0.091732

Bartlett weighted standard deviation: 0.118568

Observando los estadísticos de Bartlett (14.00441) es mayor a X 20.95, 3 = 7.814728,


se concluye que los residuos son heterocedasticos, puesto que la probabilidad de
rechazar la hipótesis nula es menor al 5%.

El estadístico Levene (7.648694) y Brown – Forsythe (6.969740) son mayores al


estadístico F0.95, 3, 839 = 2.61551, también permiten rechazar la hipótesis nula de
ausencia de heterocedasticidad.

6.4.9.- Corrección Heterocedasticidad

Dependent Variable: ENF


Method: ML - Binary Probit (Quadratic hill climbing)
Date: 02/26/11 Time: 13:29
Sample: 1 850
Included observations: 843
Convergence achieved after 4 iterations
QML (Huber/White) standard errors & covariance

Variable Coefficient Std. Error z-Statistic Prob.

C -1.115581 0.205856 -5.419223 0.0000


MONTOMED 0.005797 0.001676 3.459312 0.0005
SINTOMAS 0.060876 0.111495 0.545997 0.5851
HOSPIT 0.744866 0.221874 3.357154 0.0008
EDAD 0.026488 0.002510 10.55172 0.0000
MEDICAMENTOS -0.133156 0.039175 -3.399017 0.0007
SEXO -0.203273 0.109251 -1.860611 0.0628

Mean dependent var 0.221827 S.D. dependent var 0.415722


S.E. of regression 0.360134 Akaike info criterion 0.843379
Sum squared resid 108.4265 Schwarz criterion 0.882714
Log likelihood -348.4844 Hannan-Quinn criter. 0.858452
Restr. log likelihood -446.1244 Avg. log likelihood -0.413386
LR statistic (6 df) 195.2799 McFadden R-squared 0.218863
Probability(LR stat) 0.000000

Obs with Dep=0 656 Total obs 843


Obs with Dep=1 187

7.- COMPARACIÓN DEL MODELO LOGIT Y PROBIT

La comparación nos muestra que el mejor modelo es el Logit, puesto que al


evaluar los criterios abajo mencionados todos son menores para este modelo así
mismo el R2 Mc – Fadden es mas alto para el modelo en cuestión.

Akaike
2
R Schwarz Hannan SR
Quinn
Modelo 0.220881 0.841243 0.880577 0.856316 108.0075
Logit
Modelo 0.218863 0.843379 0.882714 0.858452 108.4265
Probit

7.1.- Efectos Marginales

Como hemos elegido como mejor modelo al Modelo Logit hallaremos los efectos
marginales de este modelo.

Pi
X ij = B j Pi (1  Pi )

EF_MEDICAME
EF_MONTOMED EF_SINTOMAS EF_HOSPIT EF_EDAD NTOS EF_SEXO

Mean 0.001278 0.013909 0.165210 0.006057 -0.030394 -0.049763


Median 0.001090 0.011861 0.140880 0.005165 -0.025918 -0.042435
Maximum 0.002463 0.026812 0.318466 0.011676 -0.004074 -0.006671
Minimum 0.000171 0.001865 0.022146 0.000812 -0.058589 -0.095926
Std. Dev. 0.000718 0.007818 0.092860 0.003405 0.017084 0.027970
Skewness 0.330471 0.330471 0.330471 0.330471 -0.330471 -0.330471
Kurtosis 1.611043 1.611043 1.611043 1.611043 1.611043 1.611043

Jarque-Bera 83.10741 83.10741 83.10741 83.10741 83.10741 83.10741


Probability 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000

Sum 1.077068 11.72556 139.2723 5.106329 -25.62212 -41.95031


Sum Sq. Dev. 0.000434 0.051465 7.260587 0.009760 0.245738 0.658738

Observations 843 843 843 843 843 843


ENF
 : Un aumento de 1% en el monto total por las medicinas
MONTOMED
aumenta la probabilidad de padecer de alguna enfermedad o malestar
crónico en promedio igual en 0.001278%.

ENF
 : Un aumento de la probabilidad en 1% en la variable
SINTOMAS
presento Ud. algún síntoma o malestar en las últimas 4 semanas, aumenta
la probabilidad de padecer de alguna enfermedad o malestar crónico en
promedio igual en 0.013909%.

ENF
 : Un aumento de la probabilidad en 1% en la variable Estuvo
HOSPIT
hospitalizado en los últimos 12 meses, aumenta la probabilidad de padecer
de alguna enfermedad o malestar crónico en promedio igual en 0.165210%.

ENF
 : Un aumento de la edad en un año aumenta la probabilidad en
EDAD
promedio de padecer de alguna enfermedad o malestar crónico en
0.006057%.

ENF
 : Un aumento de 1% en la probabilidad de la variable
MEDICAMENTOS
Encontró los medicamentos que le recetaron, disminuye la probabilidad de
padecer de alguna enfermedad o malestar crónico en promedio igual a
-0.030394%.

ENF
 : Un cambio en la probabilidad en 1% en la variable Sexo,
SEXO
disminuye la probabilidad de padecer de alguna enfermedad o malestar
crónico en promedio igual a -0.049763%.

7.2.- Predicción del Modelo Logit

Para la predicción del modelo lo haremos con el Modelo Logit por ser el mejor. Los
datos que se tomaron en cuenta corresponden a partir de la observación 851 –
939 que es el total de observaciones (89 datos).

Se tiene un total de 76 predicciones correctas de un total de 89 observaciones.


Nuestro R2 de Conteo es 85.39% lo que nos demuestra que nuestro modelo
predice bien debido a que el R2 es muy alto.

Tabulation of ENF-ENFF2
Date: 02/27/11 Time: 00:56
Sample: 851 939
Included observations: 89
Number of categories: 3

Value Count Percent


-1 2 2.25
0 76 85.39
1 11 12.36
Total 89 100.00

8.- MODELO DE VARIABLE DEPENDIENTE LIMITADA

Para la construcción del modelo censurado/Truncado se ha elegido como variable


dependiente al Monto gastado por medicamentos, se va a censurar a aquellos
individuos que tienen un gasto nulo en medicamentos.

8.1.- Especificación del Modelo


El modelo propuesto viene dado por la siguiente función:

Montomed = (Edad, Essalud, Montocons, Sexo).

Así tenemos el siguiente modelo econométrico de variable dependiente limitada.


En forma abreviada tenemos:

Montomedi =  0 +  1Edadi +  2Essaludi +  3Montoconsi +  3Sexoi + µi


Donde:

Variable dependiente limitada:

 Montomedi: Cuánto fue el monto total por las medicinas?

Variables Exógenas o independientes:

 Edad: Expresado en años cumplidos

 Essaludi : Ud. actualmente esta afiliado a essalud


1: Si
0: No

 Montoconsi: ¿Cuánto fue el monto total por la consulta?

 Sexo : Expresado en:


1: Hombre
0: Mujer

En la estimación se espera que los parámetros tengan los siguientes resultados:

Hipótesis

 0 >< 0, Parámetro autónomo.

 1 >< 0 : Representa el grado de sensibilidad de la variable dependiente respecto


a la Edad .La relación es ambigua se espera un signo positivo o negativo.
MONTOMED
1   0
EDAD

 2 < 0: Representa el grado de sensibilidad de la variable dependiente respecto a


la variable Ud. actualmente esta afiliado a essalud, se espera que sea de signo
negativo, puesto que si el individuo esta afiliado a essalud, esto implicaría un
gasto menor o nulo en medicinas.

MONTOMED
2  0
ESSALUD

 3 > 0: Para la variable monto total por la consulta se espera que tenga una
relación positiva. De manera que si monto de la consulta médica es elevado, esto
implicaría un gasto mayor en medicinas.

MONTOMED
3  0
MONTOCONS

 4 >< 0: Representa el grado de sensibilidad de la variable dependiente respecto


al Sexo. Su influencia puede se positiva o negativo, el signo de este parámetro
nos permitirá establecer el efecto de la variable sexo sobre la variable dependiente
en estudio.

MONTOMED
4   0
SEXO

8.2.- Estimación del Modelo

8.2.1.- Modelo Censurado

a) Tobit

Dependent Variable: MONTOMED


Method: ML - Censored Normal (TOBIT) (Quadratic hill climbing)
Date: 02/28/11 Time: 10:15
Sample: 1 939
Included observations: 932
Left censoring (value) at zero
Convergence achieved after 7 iterations
Covariance matrix computed using second derivatives

Coefficient Std. Error z-Statistic Prob.

C -51.84477 5.345807 -9.698213 0.0000


EDAD 0.408710 0.105086 3.889285 0.0001
ESSALUD -4.539204 8.472581 -0.535752 0.5921
MONTOCONS 4.112474 0.347893 11.82109 0.0000
SEXO 4.619516 4.697851 0.983325 0.3254

Error Distribution

SCALE:C(6) 57.13039 2.470219 23.12766 0.0000

R-squared 0.250538 Mean dependent var 7.415665


Adjusted R-squared 0.246491 S.D. dependent var 34.05213
S.E. of regression 29.55892 Akaike info criterion 4.133342
Sum squared resid 809073.9 Schwarz criterion 4.164483
Log likelihood -1920.137 Hannan-Quinn criter. 4.145218
Avg. log likelihood -2.060233

Left censored obs 631 Right censored obs 0


Uncensored obs 301 Total obs 932

Observando la estimación podemos concluir que los signos obtenidos son los
teóricamente esperados, sin embargo en la significancia estadística solo las
variables edad y monto de consulta son altamente significativas además se
observa que la bondad de juste del modelo es de 25%, lo que implicaría que
implicaría que el 25% en la variación de la variable endógena es explicado en
conjunto por las cuatro variables exógenas edad, essalud, montocons y sexo.

b) Logistic

Dependent Variable: MONTOMED


Method: ML - Censored Logistic (Quadratic hill climbing)
Date: 02/28/11 Time: 10:16
Sample: 1 939
Included observations: 932
Left censoring (value) at zero
Convergence achieved after 8 iterations
Covariance matrix computed using second derivatives

Coefficient Std. Error z-Statistic Prob.

C -23.19189 2.917104 -7.950311 0.0000


EDAD 0.200724 0.056494 3.553037 0.0004
ESSALUD -1.033120 4.632146 -0.223033 0.8235
MONTOCONS 2.976392 0.410337 7.253523 0.0000
SEXO 0.174485 2.519668 0.069249 0.9448

Error Distribution

SCALE:C(6) 18.35541 1.008769 18.19585 0.0000

R-squared 0.248360 Mean dependent var 7.415665


Adjusted R-squared 0.244301 S.D. dependent var 34.05213
S.E. of regression 29.60184 Akaike info criterion 3.918547
Sum squared resid 811425.0 Schwarz criterion 3.949689
Log likelihood -1820.043 Hannan-Quinn criter. 3.930424
Avg. log likelihood -1.952836

Left censored obs 631 Right censored obs 0


Uncensored obs 301 Total obs 932

Observando la estimación podemos concluir que los signos obtenidos son los
teóricamente esperados, sin embargo en la significancia estadística solo las
variables edad y monto de consulta son altamente significativas además se
observa que la bondad de juste del modelo es de 24%, lo que implicaría que
implicaría que el 24% en la variación de la variable endógena es explicado en
conjunto por las cuatro variables exógenas edad, essalud, montocons y sexo.

8.2.2.- Modelo Truncado

a) Tobit

Dependent Variable: MONTOMED


Method: ML - Censored Normal (TOBIT) (Quadratic hill climbing)
Date: 02/28/11 Time: 10:17
Sample (adjusted): 2 938
Included observations: 301 after adjustments
Truncated sample
Left censoring (value) at zero
Failure to improve Likelihood after 10 iterations
Covariance matrix computed using second derivatives

Coefficient Std. Error z-Statistic Prob.

C -806.1145 179.3339 -4.495049 0.0000


EDAD 5.357653 1.645951 3.255049 0.0011
ESSALUD 21.48882 95.33324 0.225407 0.8217
MONTOCONS 15.37945 2.302111 6.680584 0.0000
SEXO 118.2148 59.42711 1.989240 0.0467

Error Distribution

SCALE:C(6) 104.6314 10.66324 9.812345 0.0000

R-squared 0.408226 Mean dependent var 22.96146


Adjusted R-squared 0.398196 S.D. dependent var 56.92380
S.E. of regression 44.15921 Akaike info criterion 7.979170
Sum squared resid 575260.6 Schwarz criterion 8.053066
Log likelihood -1194.865 Hannan-Quinn criter. 8.008740
Avg. log likelihood -3.969651

Left censored obs 0 Right censored obs 0


Uncensored obs 301 Total obs 301

Observando la estimación podemos concluir que los signos obtenidos son los
teóricamente esperados a excepción de la variable essalud, sin embargo en la
significancia estadística solo las variables edad y monto de consulta son altamente
significativas además se observa que la bondad de juste del modelo es de 25%, lo
que implicaría que implicaría que el 0.408% en la variación de la variable
endógena es explicado en conjunto por las cuatro variables exógenas edad,
essalud, montocons y sexo.

b) Logistic

Dependent Variable: MONTOMED


Method: ML - Censored Logistic (Quadratic hill climbing)
Date: 02/28/11 Time: 10:19
Sample (adjusted): 2 938
Included observations: 301 after adjustments
Truncated sample
Left censoring (value) at zero
Convergence achieved after 11 iterations
Covariance matrix computed using second derivatives

Coefficient Std. Error z-Statistic Prob.

C -376.8512 53.86882 -6.995721 0.0000


EDAD 2.129567 0.792905 2.685776 0.0072
ESSALUD 29.60765 30.12529 0.982817 0.3257
MONTOCONS 8.920962 0.723078 12.33748 0.0000
SEXO 185.9648 35.20250 5.282716 0.0000

Error Distribution

SCALE:C(6) 19.27816 1.131202 17.04220 0.0000

R-squared 0.408099 Mean dependent var 22.96146


Adjusted R-squared 0.398067 S.D. dependent var 56.92380
S.E. of regression 44.16395 Akaike info criterion 8.024805
Sum squared resid 575384.0 Schwarz criterion 8.098701
Log likelihood -1201.733 Hannan-Quinn criter. 8.054375
Avg. log likelihood -3.992469

Left censored obs 0 Right censored obs 0


Uncensored obs 301 Total obs 301

Observando la estimación podemos concluir que los signos obtenidos son los
teóricamente esperados a excepción de la variable essalud, sin embargo en la
significancia estadística solo las variables edad y monto de consulta son altamente
significativas además se observa que la bondad de juste del modelo es de 25%, lo
que implicaría que implicaría que el 0.408% en la variación de la variable
endógena es explicado en conjunto por las cuatro variables exógenas edad,
essalud, montocons y sexo.

CONCLUSIONES

 Durante el tercer trimestre del año 2010 en el departamento de Cajamarca,


la variable endógena “padece de alguna enfermedad o malestar crónico” es
explicada por las variables explicativas: monto gastado en medicinas,
estuvo hospitalizado, presento algún síntoma o malestar, edad, encontró los
medicamentos que le recetaron y sexo.
 En las estimaciones del modelo Logit y Probit los parámetros de las
variables seleccionadas son estadísticamente significativas, es decir
explican adecuadamente el comportamiento de la variable dependiente a
excepción de la variable Síntomas.

 Tanto el modelo Logit como el modelo Probit son exactamente coincidentes


en la etapa de predicción, bondad del ajuste, significancia individual y global
del modelo.

 Respecto a que modelo se debe usar, solo se puede decir que ambos son
efectivos Y estadísticamente significativos, pero desde el punto de vista
practico, generalmente es utilizado el modelo Logit puesto que posee
menor criterio Akaike, Schwartz, Hanna Quinn y mayor R 2 de Mc fadden.

También podría gustarte