Documentos de Académico
Documentos de Profesional
Documentos de Cultura
685 822 147 - 4 PDF
685 822 147 - 4 PDF
RESUMEN
En este trabajo se propone un modelo con el que se estima el peso
relativo del capital humano y fsico en la formacin de las rentas familiares. El modelo se ha estimado utilizando como fuente estadstica la Encuesta Bsica de Presupuestos Familiares 1990-91. El procedimiento
(1)
Este trabajo ha sido parcialmente financiado por el proyecto de investigacin SEC 97/1469.
64
ESTADSTICA ESPAOLA
1. INTRODUCCIN
El trabajo que aqu se presenta, hay que situarlo dentro de la lnea de investigacin sobre la distribucin de la renta, medicin de la pobreza y desigualdad que
nuestro equipo de investigacin viene desarrollando desde 1990. En investigaciones
anteriores, como el del equipo ECB (1996), se pone de manifiesto la importancia de
la educacin, factores relacionados con el mercado de trabajo y el capital fsico, en la
generacin de la renta. La necesidad de profundizar en este aspecto nos ha llevado
a la elaboracin de este trabajo en el que se estima la funcin generadora de la renta
mediante un modelo de variables latentes(2), siguiendo los artculos de Dagum
(1996) y (1994). El mtodo de estimacin empleado es el de Mnimos Cuadrados
Parciales propuesto por Wold (1982).
El modelo propuesto hace depender la renta de dos variables latentes: capital fsico y capital humano. Si bien el capital fsico se ha introducido de forma explcita
como factor determinante de la renta en numerosos trabajos empricos, el capital
humano no ha sido objeto de anlisis econmico hasta la segunda mitad del siglo
veinte, con trabajos pioneros como el de Mincer (1958, 1970), Becker (1962, 1964),
y Schultz (1959, 1961). Anteriormente, la mayora de los economistas no iban ms
all del reconocimiento de las habilidades y la educacin como fuente de las diferencias en sueldos y salarios. Actualmente, la situacin va cambiando con la aparicin
(2)
Para una introduccin sobre modelos de variables latentes consultar Everitt (1984).
65
2. EL MODELO
Con el modelo que planteamos se pretende estimar qu peso relativo tienen en la
formacin de las rentas familiares el capital humano y el capital fsico. Dado que
estas variables no se pueden observar directamente, se ha optado por elaborar un
modelo con variables latentes.
Siguiendo la metodologa bsica establecida por Wold (1982), el modelo que
planteamos contiene relaciones estructurales de dos tipos:
El primer conjunto de ecuaciones, denominado bloque estructural, block structure,
outer model o factor model, establece las relaciones entre las variables latentes, 1,
2 y 3, y cada indicador. Estas relaciones se suponen lineales:
X 1i = 1i 1 + 1i ;
i = 1,2,..., h
X 2i = 2i 2 + 2i
i = 1,2,..., k
X 3 = 3 3 + 3
donde:
1: capital humano,
2: capital fsico,
3: renta.
[1]
66
ESTADSTICA ESPAOLA
Ausencia de correlacin entre las variables latentes de un bloque(3) y las perturbaciones aleatorias de otro bloque.
r(1i , 3) = 0
r(2i , 3) = 0
r(3, 1) = 0
r(3, 2) = 0
(3)
ta.
Un bloque est formado por las variables capital humano y fsico y el otro por la ren-
67
i p
r(2i , 2p) = 0
i p
Del segundo tipo de ecuaciones estructurales, que se suelen denominar ecuaciones de las variables latentes (inner relations, structural relation model o path model),
el modelo slo tiene una ecuacin que define las relaciones entre las variables
latentes:
3 = 11 + 22 + ,
[2]
Tambin aqu se introduce la hiptesis de ausencia de correlacin entre la perturbacin aleatoria y las variables latentes explicativas o exgenas, 1 y 2 :
r( 1, ) = 0
r( 2, ) = 0
[3]
68
ESTADSTICA ESPAOLA
indicadores son reflejos. Generalmente, para las variables latentes exgenas y los
indicadores formativos se emplea el modo B y el modo A para el caso de variables
latentes endgenas e indicadores reflejos.
Por tanto, en nuestro caso, ya que tenemos dos variables latentes exgenas, 1 y
2 y una endgena, 3, emplearemos el modo B para las dos primeras y el modo A
para 3:
X 3 = 3 1 + 3 2 + 3
h
i=1
i =1
3 = 1i X1i + 2i X 2i + 1 + 2
[4]
donde:
1i es el peso del indicador i de la primera variable latente.
2i es el peso del indicador i de la segunda variable latente.
3 es el peso del indicador de la tercera variable latente.
1 = f1 1i X1i
i= 1
k
2 = f 2 2i X 2i
[5]
i= 1
3 = f 3 3 X 3
En esta expresin se observa que las variables latentes son combinacin lineal
de sus indicadores.
Las variables manifiestas u observables estn estandarizadas, motivo por el cual
no se incluye trmino independiente en ninguna ecuacin.
La representacin grfica del modelo de variables latentes se denomina diagrama de flechas. Segn Bollen (1989), para algunos investigadores las relaciones
estructurales quedan reflejadas ms claramente en los diagramas que en las ecuaciones. Los indicadores se representan por cuadrados y van relacionados con las
variables latentes a travs de flechas. Las variables latentes se representan por
crculos. Si la variable latente es exgena, empleamos la relacin inwards, por lo que
se emplean flechas quebradas para unir el indicador con la variable latente, y todas
ellas confluyen en un punto. En cambio, la relacin entre los indicadores y la variable
69
latente endgena se hace a travs de flechas desde la variable latente a cada indicador. Es una relacin outwards, por tanto las flechas son continuas, y existe una por
cada indicador. Por ltimo, la relacin entre variables latentes se hace a travs de
flechas continuas que parten de la variable latente exgena a la endgena.
Cada inicio de flecha indica la presencia de una perturbacin aleatoria. En cada
flecha se indicar el signo esperado de la relacin entre variables latentes o entre
indicador y variable latente.
En la figura 1 se muestra el diagrama de flechas de nuestro modelo. Hay dos bloques, tres variables latentes y diversos indicadores por variables latentes.
Figura 1
DIAGRAMA DE FLECHAS DEL MODELO
X1,1
X1,2
+
X1, 3
+
+
X1,4
X1,5
+
+
X1,6
X1,7
X1,8
+
X1,9
+
X110
+
X3
X111
X2,1
X2,2
+
+
X2,3
+
X2,4
3. METODOLOGA Y DATOS
El modelo se ha estimado empleando como fuente estadstica la Encuesta Bsica de Presupuestos Familiares 1990-91, elaborada por el Instituto Nacional de
Estadstica. Esta encuesta consta de un tamao muestral sin ponderar de 21.155
70
ESTADSTICA ESPAOLA
(4) Se han eliminado dos casos atpicos, debido a un ingreso excesivo con origen en
premios extraordinarios de lotera y quinielas de las Administraciones Pblicas.
71
Cuadro 1
VARIABLES MEDIBLES
Nombre
Descripcin
X1,1
X1,2
X1,3
X1,4
X1,5
X1,6
X1,7
X1,8
X1,9
X1,10
X1,11
X2,1
X2,2
X2,3
X2,4
X3
En relacin al capital humano, los trabajos que tratan de recopilar y elaborar informacin para estudiar la evolucin de este factor en la poblacin, utilizan la distribucin por estudios de la poblacin o tasas de escolarizacin de la poblacin.
Obviamente, debe existir una relacin entre el nivel educativo familiar (reflejado en el
nivel de conocimientos adquiridos por los miembros del hogar), el capital humano y el
nivel de renta, por ello se incluyen los ndices X1,5, X1,6, X1,7, y X1,8 que recogen el
nmero de miembros del hogar analfabetos o sin estudios; con educacin primaria o
EGB; con BUP, COU, FP1 o FP2; y nmero de miembros del hogar con estudios
medios o superiores. Pero tambin pueden influir otros factores, como pueden ser el
nivel de vida, reflejado en el sector en el que se trabaja, indicadores X1,9, X1,10, y
X1,11, y la estructura familiar por edades, recogidos por X1,1, X1,2, X1,3 y X1,4. La
atencin se desplaza de los datos referentes al cabeza de familia hacia los de la
familia al completo, tomando los indicadores como el nmero de individuos del hogar
con un determinado nivel de estudios o con una edad determinada.
72
ESTADSTICA ESPAOLA
Como indicadores para el capital fsico se han empleado los rendimientos monetarios del capital y de la propiedad del hogar, X2,1; nmero de viviendas secundarias, X 2,2; coste de adquisicin de la vivienda habitual, X 2,3; y metros cuadrados de la
vivienda principal, X 2,4; debido a su estrecha relacin con esta variable latente. Para
la renta, el nico indicador empleado es el de ingresos monetarios totales del hogar.
Es decir, se ha identificado la renta con el ingreso monetario del hogar, de forma que
el coeficiente de carga para este indicador toma el valor uno.
El procedimiento de estimacin empleado es el de los mnimos cuadrados parciales (PLS) introducido por Wold (1982). Este es un mtodo iterativo que permite la
estimacin de los parmetros de un modelo multiecuacional como el presentado, en
el cual estn presentes una serie de variables no observables o latentes que son
estimadas como combinacin lineal de una serie de indicadores o variables manifiestas, tal y como se muestra en [5].
El empleo de mnimos cuadrados parciales (PLS) frente a otro mtodo de mximo verosimilitud para la estimacin de las relaciones estructurales, queda justificado
por las propiedades de este mtodo expuestas por Chin (1997).
El mtodo PLS es muy potente debido a las mnimas exigencias respecto a las
escalas de medida, tamao muestral y establecimiento de hiptesis de distribucin
de las perturbaciones aleatorias. La principal distincin entre PLS y enfoques de
estimacin basados en la covarianza, como LISREL, es debida a la finalidad del
modelo de ecuaciones estructurales. El segundo de los enfoques es ms apropiado
cuando se cuenta con una base terica consistente y se quiere verificar una teora,
pero hay una prdida de precisin debido a problemas de indeterminacin. Por tanto
no es apropiado para los modelos donde la principal preocupacin es la estimacin
de las relaciones estructurales. Por otro lado, PLS es ms adecuado para la estimacin de modelos susceptibles de aplicacin y prediccin, adems evita los problemas de indeterminacin y soluciones no admisibles.
Ya que PLS estima las variables latentes como combinacin de los indicadores,
se evita la posible indeterminacin y obtiene un valor concreto para los resultados
finales. Tambin, debido al empleo de un algoritmo iterativo consistente en estimaciones mnimo cuadrticas, la identificacin no es un obstculo para los modelos
recursivos ni se exige hiptesis sobre la funcin de distribucin de las variables.
Adems, el tamao de la muestra puede ser pequeo, dndose como regla genrica
que el tamao puede ser igual a diez veces el nmero de indicadores formativos, o a
diez veces el mayor nmero de coeficientes estructurales dirigidos a una construccin particular en la relacin estructural. En este estudio se cumple esta regla sobradamente. Adems PLS, en palabras de Wold (1985), no tiene competidor para
73
74
ESTADSTICA ESPAOLA
2
1
f 2 = 2i X 2in
N n i
1
2
f 3 = [ 3 X 3n ]
N n
1
2
1
2
[6]
1
2
3 = f3 X 3
75
Con la estimacin de la variable latente 3, obtenemos, a travs de mnimos cuadrados ordinarios, los pesos de los indicadores de las restantes variables latentes,
1i y 2i utilizando la expresin [4].
h
i =1
i =1
3 = 1i X1i + 2 i X 2i + 1 + 2
Con las estimaciones de los pesos de las variables latentes exgenas, y junto a
[5] y [6] se obtienen estimaciones de f1, f2, y de las variables latentes exgenas.
h
1 = f1
1i X 1i
i =1
k
2 i X 2i
2 = f2
i =1
De nuevo con las estimaciones de las variables latentes exgenas se halla, a travs de mnimos cuadrados generalizados, el valor del peso de la variable latente
endgena, 3, con [4] y [6].
3 1 + 3 2 + 3
X3 =
Este proceso continuar hasta alcanzar la convergencia. Hay unas reglas de convergencia:
< 10 5 o
(
) /
< 10 5
Por tanto al aplicar mnimos cuadrados parciales (PLS) obtenemos estimaciones
de los pesos, las variables latentes y los errores presentes en [4]
En la segunda etapa, una vez estimadas las variables latentes, se estiman los
parmetros del bloque estructural [1], de la ecuacin de las variables latentes [2] y de
la relacin causal predictiva [3].
Para hallar los parmetros del bloque estructural se aplican mnimos cuadrados
ordinarios en la ecuacin [1]. A estos parmetros se le denominan coeficientes de
carga, y su valor ha de coincidir con el esperado, que se refleja en el grfico de
flechas. Por tanto el signo de los mismos supone una primera comprobacin de la
validez del modelo.
76
ESTADSTICA ESPAOLA
X 1i = 1i 1 + 1i ; i = 1,2,..., h
X 2i = 2i 2 + 2i ; i = 1,2,..., k
[7]
X 3 = 3 3 + 3 ;
3 = 1 1+ 2 2 + ,
[8]
X 3 = 3 1 1 + 3 2 2 + 3 + 3
[9]
[10]
3i 0 = x 3i 3i 3
0 = 3 1 1 2 2
77
Hi2: Indica la proporcin de la varianza del indicador i reproducida por las variables latentes directamente conectadas a ese indicador. Un valor cercano a uno es
aconsejable.
Fi2: Indica la proporcin de la varianza del indicador que es reproducida por las
variables latentes conectadas al indicador. Al igual que los dos anteriores, un valor
alto es deseable.
: Raz de la media cuadrtica de las covarianzas de los residuos del bloque es-
S : Cociente de las dos anteriores. Valores pequeos de este ratio son recomendables.
: Raz de la media cuadrtica de la covarianza de los residuos inner.
R : Cociente de las dos anteriores. Es conveniente que el valor de este cociente sea reducido.
RMS de las Cov( , ): Raz de la media cuadrtica de la covarianza de los residuos del bloque estructural y de la variable latente. Valores pequeos de este estadstico y el siguiente son aconsejables.
RMS de las Cov( , ): Raz de la media cuadrtica de la covarianza de los residuos del bloque estructural y de los de la ecuacin de las variables latentes.
4. RESULTADOS DE LA ESTIMACIN
Para la estimacin de este modelo con variables latentes se han manejado diversas opciones, introduciendo diferentes indicadores para cada variable latente. De los
seis modelos planteados inicialmente se ha elegido el que arroja una estimacin de
los coeficientes de carga con signo igual al esperado, o, al menos, con menor discrepancia. Tambin se han tenido en cuenta los valores de los estadsticos antes
comentados(5).
Los resultados para el modelo se recogen en los cuadros 2 y 3.
Cuadro 2
PARMETROS ESTIMADOS
(5)
78
ESTADSTICA ESPAOLA
Coeficiente
Valor estimado
Coeficiente
Valor estimado
1,1
0,3550
1,1
-0,0035
1,2
0,5255
1,2
0,3716
1,3
0,1475
1,3
0,2595
1,4
-0,2132
1,4
0,2511
1,5
-0,2204
1,5
-0,0333
1,6
0,2063
1,6
0,1326
1,7
0,4940
1,7
0,2911
1,8
0,6837
1,8
0,5328
1,9
-0,0099
1,9
0,0507
1,10
0,7045
1,10
0,1235
1,11
0,7065
1,11
0,2718
2,1
0,7836
2,1
0,6103
2,2
0,4795
2,2
0,3511
2,3
0,4845
2,3
0,2293
2,4
0,5591
2,4
0,4334
1,0000
1,0000
0,5622
0,2230
79
Cuadro 3
ESTADSTICOS DE MODELO
Estadstico
2
Inner R
Valor
0,4372
0,29117
0,02733
0,12648
0,20581
/S
0,61454
0,16439
0,45437
/R
0,36180
0,04153
0,04420
Modo 1, 2
Inwards
Modo 3
Outwards
De los diversos modelos ensayados, el elegido presenta el coeficiente de determinacin de la ecuacin de las variables latentes ms alto. Lo que indica que el
43,72% de las variaciones en la renta son explicadas por las variaciones en el capital
fsico y humano estimados. Los resultados quedan recogidos en el diagrama de
flechas de la figura 2.
80
ESTADSTICA ESPAOLA
Figura 2
DIAGRAMA DE FLECHAS DEL MODELO AJUSTADO
X1,1
X1,2
X1,3
0.355
0.5255
0.1475
X1,4
-0.2132
X1,5
X1,6
-0.2204
0.2063
0.494
X1,7
0.5622
0.6837
X1,8
X1,9
-0.0099
0.7045
0.7065
X110
1
X3
X111
X2,1
0.7836
0.2230
X2,2
X2,3
0.4795
0.4845
0.5591
X2,4
Analizando los resultados, podemos concluir que la importancia relativa del capital humano en la generacin de la renta es ms del doble que la del capital fsico. En
otras versiones del modelo la relacin entre capital humano y capital fsico siempre
se ha mantenido entre 2 y 3, lo cual es un indicio de la robustez de este resultado.
Dentro del capital humano los indicadores con una mayor participacin son el
nmero de miembros en el sector secundario y terciario, junto con los miembros del
81
hogar con estudios medios o superiores. Por otro lado, los indicadores que tienen
relacin inversa con este factor son los miembros del hogar con 65 y ms aos,
miembros del hogar analfabetos o sin estudios y miembros del hogar en el sector
primario, indicadores que muestran la menor contribucin a la formacin de capital
humano en las familias. En el modelo estimado por Dagum y Vittadini (1996) el
indicador ms destacado es el de bienes races, que no tiene un homlogo en el
conjunto de indicadores de nuestro modelo. En el capital fsico el indicador con
mayor coeficiente de carga es el de coste de adquisicin de la vivienda habitual.
Una vez estimada la ecuacin de las variables latentes, se han estimado los valores de capital fsico y humano y se les ha ajustado el modelo de distribucin de
probabilidad de Dagum, as como a la renta. El modelo genrico de Dagum (1977)
es una combinacin de tres modelos de probabilidad:
F(x) = b1F1(x) + b2F2 (x) +b3F3(x), (b1,b2,b3 ) 0 b1 + b2 + b3 = 1
[11]
F1( x ) =
1 para x 0
1, x 0
F2 ( x ) =
0, x < 0
[12]
1 + x , x 0, (, , ) > 0
F3 ( x ) =
0, para x 0
82
ESTADSTICA ESPAOLA
3 2
b1 + b1( b1 ) + ( )G(0 < < 1)
G= 2
b1 + ( )
[13]
siendo:
G(0 < < 1) = ( 2 1) + (1 )
(, )
1
(, + )
[14]
(, )
1
(, + )
[15]
En el cuadro 4 se muestran los valores del ajuste del modelo (6) a las variables
renta capital fsico y capital humano. Los modelos para la renta y el capital humano se
han obtenido haciendo cero tanto b1 como b2, y tomando valor uno el parmetro b3.
Denotando como y a la variable renta, y h al capital humano, los modelos ajustados
son:
F( y) = (1 + 8.42931y 3.21887) 0.60405
F(h) = (1 + 58.50847h 6.303) 0.2737
(6)
83
Cuadro 4
RESULTADOS DEL AJUSTE DEL MODELO DE DAGUM A LA RENTA,
CAPITAL FSICO Y HUMANO
Renta
Capital humano
Capital fsico
0.0229281
b1
0.0208953
0.00001648
b2
0.0020328
0.60405
0.2737
0.26343
8.42931**
58.50847
790.38757**
3.21887
6.3030
3.26785
0.0002813
0.0002574*
Kolmogorov
0.01486
0.00705
0.00734*
Gini
0.3557
0.2754
0.47091
84
ESTADSTICA ESPAOLA
monetarias ntimamente ligadas con la riqueza y la renta, todo esto hace que al estar
ms desigualmente distribuidas las variables monetarias, y hacer depender la renta
de ellas, el ndice de Gini para la renta sea notablemente superior, aunque tambin
se ha de tener en cuenta que hablamos de distintos pases
5. CONCLUSIONES
El modelo que se plantea en este trabajo se puede considerar como un primer
paso para contrastar empricamente el papel del capital fsico y humano en la formacin de la renta. El mtodo que hemos empleado, mnimos cuadrados parciales, se
ha revelado como una herramienta til para la estimacin (poco exigente con las
hiptesis en esta etapa inicial) y adems ha permitido obtener valores observados
de las variables latentes. De esta forma se ha podido ajustar un modelo de probabilidad a los valores estimados de la renta, capital fsico y humano para estudiar sus
caractersticas distributivas.
Basndonos en las versiones estimadas del modelo, podemos concluir que el
coeficiente del capital humano es mayor (entre el doble y el triple) que el del capital
fsico, por lo que la importancia relativa del primero en la formacin de la renta es
mayor, independientemente del valor puntual que arroje la estimacin de cada versin. Esto nos sugiere que el gasto en educacin por parte del Estado puede tener
una gran repercusin en la generacin de renta, debido al peso que tienen en el
capital humano los factores educativos, y el peso que tiene a su vez el capital humano
en la generacin de la renta.
Tras el ajuste de modelos de probabilidad a las variables del modelo, nos encontramos con que existe una mayor desigualdad en el reparto de capital fsico que en el
capital humano. Adems, la renta, medida a travs del ingreso monetario del hogar,
introduce un mayor grado de desigualdad que, como consecuencia, nos lleva a que
el valor del ndice de Gini para la renta sea superior que el del capital humano.
En este artculo no se pretende agotar la lnea de investigacin, sino ms bien
servir de base para futuros trabajos que profundicen en las relaciones entre la renta,
el capital fsico y el capital humano. Por ejemplo, se podra profundizar estimando un
modelo bivariante de probabilidad del capital fsico y humano conjuntamente. Tambin se podran introducir datos intergeneracionales como indicadores para las
variables latentes, siempre que se disponga de informacin suficiente.
85
APNDICE
Cuadro 1 A
VARIABLES OBSERVABLES NO EMPLEADAS COMO INDICADORES
Nombre
Descripcin
X1, 12
X1, 13
X1, 14
X1, 15
X1, 16
X1, 17
X1, 18
X1, 19
X1, 20
X1, 21
X1, 22
X2, 5
Total prstamos
X2, 6
X2, 7
X2, 8
REFERENCIAS
BECKER, G.S. (1962): Investment in human capital: A theoretical analysis, Journal
of Political Economy LXX (5), Part 2, 9-49
BECKER, G.S. (1964): Human capital, New york: Columbia University Press and
NBER, 2 edition, 1975.
BOLLEN K.A. (1989): Structural equations with latent variables. Estados Unidos.
CHIN, W. (1997) A Partial Least squares Latent variable modeling approach for
measuring interactions effects: results from a monte carlo simulation study and
voicemail emotion/adoption study University of Calgary.
CHIN, W. (1997) Overview of the PLS method.University of Houston
86
ESTADSTICA ESPAOLA
87