Está en la página 1de 25

ESTADSTICA ESPAOLA

Vol. 43, Nm. 147, 2001, pgs. 63 a 87

Estimacin de una funcin generadora


de la renta mediante un modelo de
variables latentes(1)
por
GUILLERMINA MARTN REYES
Departamento de Estadstica y Econometra I
Universidad de Mlaga
Campus El Ejido
Plaza El Ejido s/n
29006 Mlaga
Tfno: 95 2 13 12 02

ANTONIO FERNNDEZ MORALES


Departamento de Estadstica y Econometra I
Universidad de Mlaga

ELENA BRCENA MARTN


Departamento de Estadstica y Econometra I
Universidad de Mlaga

RESUMEN
En este trabajo se propone un modelo con el que se estima el peso
relativo del capital humano y fsico en la formacin de las rentas familiares. El modelo se ha estimado utilizando como fuente estadstica la Encuesta Bsica de Presupuestos Familiares 1990-91. El procedimiento

(1)

Este trabajo ha sido parcialmente financiado por el proyecto de investigacin SEC 97/1469.

64

ESTADSTICA ESPAOLA

de estimacin empleado es el de los mnimos cuadrados parciales


(PLS) introducido por Wold (1982). Este es un mtodo iterativo que
permite la estimacin de los parmetros de un modelo multiecuacional
como el presentado, en el cual estn presentes una serie de variables
no observables o latentes que son estimadas como combinacin lineal
de una serie de indicadores o variables manifiestas. Finalmente se ha
ajustado el modelo de probabilidad de Dagum a los valores estimados
de estas variables para analizar sus caractersticas distributivas. De los
resultados podemos concluir que la aportacin del capital humano a la
generacin de la renta es ms del doble que la del capital fsico.
Palabras clave: Capital fsico, capital humano, variables latentes,
mnimos cuadrados parciales
Clasificacin AMS: 62P20

1. INTRODUCCIN
El trabajo que aqu se presenta, hay que situarlo dentro de la lnea de investigacin sobre la distribucin de la renta, medicin de la pobreza y desigualdad que
nuestro equipo de investigacin viene desarrollando desde 1990. En investigaciones
anteriores, como el del equipo ECB (1996), se pone de manifiesto la importancia de
la educacin, factores relacionados con el mercado de trabajo y el capital fsico, en la
generacin de la renta. La necesidad de profundizar en este aspecto nos ha llevado
a la elaboracin de este trabajo en el que se estima la funcin generadora de la renta
mediante un modelo de variables latentes(2), siguiendo los artculos de Dagum
(1996) y (1994). El mtodo de estimacin empleado es el de Mnimos Cuadrados
Parciales propuesto por Wold (1982).
El modelo propuesto hace depender la renta de dos variables latentes: capital fsico y capital humano. Si bien el capital fsico se ha introducido de forma explcita
como factor determinante de la renta en numerosos trabajos empricos, el capital
humano no ha sido objeto de anlisis econmico hasta la segunda mitad del siglo
veinte, con trabajos pioneros como el de Mincer (1958, 1970), Becker (1962, 1964),
y Schultz (1959, 1961). Anteriormente, la mayora de los economistas no iban ms
all del reconocimiento de las habilidades y la educacin como fuente de las diferencias en sueldos y salarios. Actualmente, la situacin va cambiando con la aparicin

(2)

Para una introduccin sobre modelos de variables latentes consultar Everitt (1984).

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

65

de trabajos que se ocupan de recopilar y elaborar informacin que permita aproximar


el valor de este factor (Serrano, 1996). En este estudio, tanto la renta como el capital
fsico y humano estn medidos a travs de indicadores o variables observables que
permiten el estudio de las relaciones entre las variables latentes. Finalmente, se ha
ajustado el modelo de probabilidad de Dagum a las variables renta, capital fsico, y
humano para analizar sus caractersticas distributivas.
El artculo se estructura en cinco apartados. En el segundo se describe el modelo
objeto de estimacin, haciendo referencia a su representacin grfica, as como a
las hiptesis y relaciones estructurales introducidas por Wold (1982) para la estimacin de modelos con variables latentes mediante el mtodo de Mnimos Cuadrados
Parciales. En el tercer apartado se describe la metodologa y los datos con los que
se trabajan. Los resultados de la estimacin se presentan en el cuarto apartado, y en
el quinto se exponen las conclusiones extradas del modelo estimado.

2. EL MODELO
Con el modelo que planteamos se pretende estimar qu peso relativo tienen en la
formacin de las rentas familiares el capital humano y el capital fsico. Dado que
estas variables no se pueden observar directamente, se ha optado por elaborar un
modelo con variables latentes.
Siguiendo la metodologa bsica establecida por Wold (1982), el modelo que
planteamos contiene relaciones estructurales de dos tipos:
El primer conjunto de ecuaciones, denominado bloque estructural, block structure,
outer model o factor model, establece las relaciones entre las variables latentes, 1,
2 y 3, y cada indicador. Estas relaciones se suponen lineales:
X 1i = 1i 1 + 1i ;

i = 1,2,..., h

X 2i = 2i 2 + 2i

i = 1,2,..., k

X 3 = 3 3 + 3

donde:
1: capital humano,
2: capital fsico,
3: renta.

[1]

66

ESTADSTICA ESPAOLA

X1i : indicadores de la primera variable latente.


X2i : indicadores de la segunda variable latente.
X3 : indicador de la tercera variable latente.
El coeficiente 1i se denomina coeficiente de carga (loading) del indicador X1i,
igual para 2i y X2i , y para 3 y X3.
En la ecuacin [1] tanto ji como j son desconocidas, por lo que es necesaria la
estandarizacin de las variables latentes para disminuir el nmero de parmetros
desconocidos, (los indicadores tambin se estandarizan), de forma que:
Var( 1) =1
Var( 2) =1
Var( 3) =1

Asimismo, se introducen las siguientes hiptesis:


Ausencia de correlacin entre la variable latente y las perturbaciones aleatorias
en cada unas de las ecuaciones de (1).
r(1i, 1) = 0
r(2i , 2) = 0
r(3, 3) = 0

Ausencia de correlacin entre las variables latentes de un bloque(3) y las perturbaciones aleatorias de otro bloque.
r(1i , 3) = 0
r(2i , 3) = 0
r(3, 1) = 0
r(3, 2) = 0

(3)
ta.

Un bloque est formado por las variables capital humano y fsico y el otro por la ren-

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

67

Ausencia de correlacin entre las perturbaciones aleatorias dentro de un mismo


bloque.
r(1i , 1p) = 0

i p

r(2i , 2p) = 0

i p

Del segundo tipo de ecuaciones estructurales, que se suelen denominar ecuaciones de las variables latentes (inner relations, structural relation model o path model),
el modelo slo tiene una ecuacin que define las relaciones entre las variables
latentes:
3 = 11 + 22 + ,

[2]

Tambin aqu se introduce la hiptesis de ausencia de correlacin entre la perturbacin aleatoria y las variables latentes explicativas o exgenas, 1 y 2 :
r( 1, ) = 0
r( 2, ) = 0

Como es lineal en 1, 2 y en 3, de esta hiptesis se deduce que:


r(1i, ) = 0
r(2i, ) = 0
r(3, ) = 0

De los dos conjuntos anteriores de relaciones estructurales se deduce:


a) La relacin causal predictiva a travs de la sustitucin de la variable latente endgena:
X 3 = 311 + 3 22 + 3 + 3

[3]

b) Las relaciones de ponderaciones (weight relations). Cada una de las variables


latentes se estima como una suma ponderada de sus indicadores o variables manifiestas, con unos pesos que vienen determinados por la relacin de ponderaciones.
Hay distintas formas de relacin de estas ponderaciones, modo A y modo B. Normalmente, cada bloque tendr un modo distinto dependiendo de si la variable latente
es exgena y los indicadores son formativos, o si la variable es endgena y los

68

ESTADSTICA ESPAOLA

indicadores son reflejos. Generalmente, para las variables latentes exgenas y los
indicadores formativos se emplea el modo B y el modo A para el caso de variables
latentes endgenas e indicadores reflejos.
Por tanto, en nuestro caso, ya que tenemos dos variables latentes exgenas, 1 y
2 y una endgena, 3, emplearemos el modo B para las dos primeras y el modo A
para 3:
X 3 = 3 1 + 3 2 + 3
h

i=1

i =1

3 = 1i X1i + 2i X 2i + 1 + 2

[4]

donde:
1i es el peso del indicador i de la primera variable latente.
2i es el peso del indicador i de la segunda variable latente.
3 es el peso del indicador de la tercera variable latente.

Asmismo, en el algoritmo de estimacin se emplean tambin las relaciones siguientes:


h

1 = f1 1i X1i
i= 1
k

2 = f 2 2i X 2i

[5]

i= 1

3 = f 3 3 X 3

En esta expresin se observa que las variables latentes son combinacin lineal
de sus indicadores.
Las variables manifiestas u observables estn estandarizadas, motivo por el cual
no se incluye trmino independiente en ninguna ecuacin.
La representacin grfica del modelo de variables latentes se denomina diagrama de flechas. Segn Bollen (1989), para algunos investigadores las relaciones
estructurales quedan reflejadas ms claramente en los diagramas que en las ecuaciones. Los indicadores se representan por cuadrados y van relacionados con las
variables latentes a travs de flechas. Las variables latentes se representan por
crculos. Si la variable latente es exgena, empleamos la relacin inwards, por lo que
se emplean flechas quebradas para unir el indicador con la variable latente, y todas
ellas confluyen en un punto. En cambio, la relacin entre los indicadores y la variable

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

69

latente endgena se hace a travs de flechas desde la variable latente a cada indicador. Es una relacin outwards, por tanto las flechas son continuas, y existe una por
cada indicador. Por ltimo, la relacin entre variables latentes se hace a travs de
flechas continuas que parten de la variable latente exgena a la endgena.
Cada inicio de flecha indica la presencia de una perturbacin aleatoria. En cada
flecha se indicar el signo esperado de la relacin entre variables latentes o entre
indicador y variable latente.
En la figura 1 se muestra el diagrama de flechas de nuestro modelo. Hay dos bloques, tres variables latentes y diversos indicadores por variables latentes.
Figura 1
DIAGRAMA DE FLECHAS DEL MODELO
X1,1
X1,2
+
X1, 3

+
+

X1,4

X1,5

+
+

X1,6

X1,7

X1,8

+
X1,9
+

X110

+
X3

X111

X2,1

X2,2

+
+

X2,3

+
X2,4

3. METODOLOGA Y DATOS
El modelo se ha estimado empleando como fuente estadstica la Encuesta Bsica de Presupuestos Familiares 1990-91, elaborada por el Instituto Nacional de
Estadstica. Esta encuesta consta de un tamao muestral sin ponderar de 21.155

70

ESTADSTICA ESPAOLA

familias de todo el territorio nacional(4). La unidad de anlisis que se ha tomado es


el hogar, dado que algunas de las variables vienen referidas a esta unidad y no
aparecen desagregadas por los individuos que componen la unidad familiar.
Los indicadores empleados se clasifican en tres grupos, dependiendo de las variables latentes con la que se relacionen, la descripcin de las variables manifiestas u
observables se ha incluido en el cuadro 1.
Del amplio conjunto de indicadores relacionados con las variables latentes, se
han introducido en el modelo los que figuran en el cuadro 1. Para su seleccin se han
tenido en cuenta los criterios que dicta la teora econmica teniendo en cuenta los
lmites que incorpora la informacin que suministra la EPF. Para explicar el capital
humano se han introducido indicadores no monetarios, a diferencia de lo que hace
Dagum (1996), que introduce como indicadores los bienes races, renta anual del
hogar, deuda total y valores. La razn de incluir slo indicadores no monetarios es
que nuestras variables latentes 1 y 2 son exgenas, y por tanto, los indicadores del
capital fsico y del humano son formativos, lo que desaconseja el empleo de indicadores monetarios que seran aconsejables en caso de indicadores reflejos (ste es el
caso en el que trabaja Dagum). El cuadro 1 A del apndice recoge una descripcin
de los indicadores no introducidos en el modelo, pero que se han tenido en cuenta en
el diseo del mismo. De los indicadores aportados por esta encuesta se han escogido aquellos que arrojan unos resultados ms coherentes, es decir, su coeficiente de
carga tiene igual signo que el que cabe deducir de la teora econmica. Adems,
para ser elegido, el indicador ha de elevar la capacidad explicativa del modelo. Por
ejemplo, las variables X 1,16 X1,17 X1,8 X1,20 X1,21 y X1,22 hacen referencia a situaciones
del cabeza de familia, tales como sector en el que trabaja o nivel educativo. Debido a
la escasa aportacin a la capacidad explicativa, se ha decidido sustituirlas por
variables referentes a todos los miembros de la familia.

(4) Se han eliminado dos casos atpicos, debido a un ingreso excesivo con origen en
premios extraordinarios de lotera y quinielas de las Administraciones Pblicas.

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

71

Cuadro 1
VARIABLES MEDIBLES
Nombre

Descripcin

X1,1

Miembros del hogar con 16-24 aos

X1,2

Miembros del hogar con 25-50 aos

X1,3

Miembros del hogar con 51-64 aos

X1,4

Miembros del hogar con 65 y ms aos

X1,5

Miembros del hogar analfabetos o sin estudios

X1,6

Miembros del hogar con educacin primaria o EGB

X1,7

Miembros del hogar con BUP, COU, FP1 o FP2

X1,8

Miembros del hogar con estudios medios o superiores

X1,9

Miembros del hogar en el sector Primario

X1,10

Miembros del hogar en el sector Secundario

X1,11

Miembros del hogar en el sector Terciario

X2,1

Coste de adquisicin de la vivienda habitual

X2,2

Nmero de viviendas secundarias

X2,3

Metros cuadrados de la vivienda principal

X2,4

Rendimientos monetarios del capital y la propiedad del hogar

X3

Ingresos monetarios totales del hogar

En relacin al capital humano, los trabajos que tratan de recopilar y elaborar informacin para estudiar la evolucin de este factor en la poblacin, utilizan la distribucin por estudios de la poblacin o tasas de escolarizacin de la poblacin.
Obviamente, debe existir una relacin entre el nivel educativo familiar (reflejado en el
nivel de conocimientos adquiridos por los miembros del hogar), el capital humano y el
nivel de renta, por ello se incluyen los ndices X1,5, X1,6, X1,7, y X1,8 que recogen el
nmero de miembros del hogar analfabetos o sin estudios; con educacin primaria o
EGB; con BUP, COU, FP1 o FP2; y nmero de miembros del hogar con estudios
medios o superiores. Pero tambin pueden influir otros factores, como pueden ser el
nivel de vida, reflejado en el sector en el que se trabaja, indicadores X1,9, X1,10, y
X1,11, y la estructura familiar por edades, recogidos por X1,1, X1,2, X1,3 y X1,4. La
atencin se desplaza de los datos referentes al cabeza de familia hacia los de la
familia al completo, tomando los indicadores como el nmero de individuos del hogar
con un determinado nivel de estudios o con una edad determinada.

72

ESTADSTICA ESPAOLA

Como indicadores para el capital fsico se han empleado los rendimientos monetarios del capital y de la propiedad del hogar, X2,1; nmero de viviendas secundarias, X 2,2; coste de adquisicin de la vivienda habitual, X 2,3; y metros cuadrados de la
vivienda principal, X 2,4; debido a su estrecha relacin con esta variable latente. Para
la renta, el nico indicador empleado es el de ingresos monetarios totales del hogar.
Es decir, se ha identificado la renta con el ingreso monetario del hogar, de forma que
el coeficiente de carga para este indicador toma el valor uno.
El procedimiento de estimacin empleado es el de los mnimos cuadrados parciales (PLS) introducido por Wold (1982). Este es un mtodo iterativo que permite la
estimacin de los parmetros de un modelo multiecuacional como el presentado, en
el cual estn presentes una serie de variables no observables o latentes que son
estimadas como combinacin lineal de una serie de indicadores o variables manifiestas, tal y como se muestra en [5].
El empleo de mnimos cuadrados parciales (PLS) frente a otro mtodo de mximo verosimilitud para la estimacin de las relaciones estructurales, queda justificado
por las propiedades de este mtodo expuestas por Chin (1997).
El mtodo PLS es muy potente debido a las mnimas exigencias respecto a las
escalas de medida, tamao muestral y establecimiento de hiptesis de distribucin
de las perturbaciones aleatorias. La principal distincin entre PLS y enfoques de
estimacin basados en la covarianza, como LISREL, es debida a la finalidad del
modelo de ecuaciones estructurales. El segundo de los enfoques es ms apropiado
cuando se cuenta con una base terica consistente y se quiere verificar una teora,
pero hay una prdida de precisin debido a problemas de indeterminacin. Por tanto
no es apropiado para los modelos donde la principal preocupacin es la estimacin
de las relaciones estructurales. Por otro lado, PLS es ms adecuado para la estimacin de modelos susceptibles de aplicacin y prediccin, adems evita los problemas de indeterminacin y soluciones no admisibles.
Ya que PLS estima las variables latentes como combinacin de los indicadores,
se evita la posible indeterminacin y obtiene un valor concreto para los resultados
finales. Tambin, debido al empleo de un algoritmo iterativo consistente en estimaciones mnimo cuadrticas, la identificacin no es un obstculo para los modelos
recursivos ni se exige hiptesis sobre la funcin de distribucin de las variables.
Adems, el tamao de la muestra puede ser pequeo, dndose como regla genrica
que el tamao puede ser igual a diez veces el nmero de indicadores formativos, o a
diez veces el mayor nmero de coeficientes estructurales dirigidos a una construccin particular en la relacin estructural. En este estudio se cumple esta regla sobradamente. Adems PLS, en palabras de Wold (1985), no tiene competidor para

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

73

muestras grandes y modelos complejos de variables latentes, donde la atencin


pasa de variables e indicadores individuales a un conjunto de ellos.
Sin embargo, este mtodo de estimacin presenta algn inconveniente, el primero es que los estimadores no son ptimos, respecto a insesgadez y consistencia,
debido a que es un mtodo de informacin limitada, (no se supone normalidad). Pero
asintticamente los estimadores son correctos cuando trabajamos con muestras
grandes (como en nuestro caso) y cuando el nmero de indicadores por variable
latente es elevado. Este inconveniente se ha tratado de eliminar incluyendo un mayor
nmero de indicadores para el capital fsico, pero debido a la escasez de indicadres
formativos del capital fsico que no estuvieran correlacionados con los de larenta,
slo se ha podido contar con los mancionados. Otro inconveniente es que los errores
estndar han de ser estimados por remuestreo, mediante Bootstrapping o Jackknifing.
En sntesis, en el enfoque de mximo verosimilitud (ML) se modeliza la matriz de
covarianzas de los indicadores y variables latentes; mientras que PLS modeliza y
predice valores de los indicadores y variables latentes, y en el proceso de estimacin
modeliza sus matrices de covarianzas.
Con ML se asume que los indicadores son independientes y estn distribuidos
conjuntamente segn una distribucin multivariante especificada previamente. En
cambio, en PLS no se supone la independencia entre los indicadores y no se estipula ninguna distribucin.
El mtodo ML proporciona estimadores consistentes, pero no se estiman valores
para las variables latentes. En PLS se estiman valores para todas las variables
latentes como suma ponderada de los indicadores y se obtienen estimaciones de las
variables latentes de los parmetros, pero stas son consistentes slo en el lmite.
Por ltimo, ML emplea hiptesis de verificacin y errores estndar estimados por
el enfoque asinttico clsico, mientras que PLS emplea el test de Stone-Geisser
para la relevancia predictiva y el test de Tukey, ambos sin suponer independencia ni
establecer hiptesis de distribucin.
De todos modos, estos dos mtodos han de ser entendidos como complementarios. Mientras que Mximo verosimilitud est pensado para la confirmacin de
teoras, PLS est enfocado al anlisis causal-predictivo en situaciones con insuficiente informacin terica. El empleo de PLS frente al mtodo LISREL se basa en la
finalidad de este estudio, ya que con l se pretende aplicar los resultados, llegando a
predecir la aportacin a la generacin de renta por parte del capital humano y del
capital fsico.

74

ESTADSTICA ESPAOLA

El procedimiento de estimacin a travs de PLS se divide en tres etapas que se


pueden describir brevemente como sigue:
En la primera etapa se trata de obtener valores para las variables latentes, basndonos en que stas son combinacin lineal de una serie de indicadores o variables manifiestas, ecuacin [5].
Los indicadores se suponen estandarizados, por lo que la media de los indicadores de las variables latentes tienen media 0. Los escalares f1, f2 y f3 se introducen
para que los indicadores X1i ,X2i y X3 tengan varianza 1. Estos coeficientes tienen la
siguiente expresin:
2
1

f1 = 1n X1n

N n i

2
1

f 2 = 2i X 2in
N n i

1
2
f 3 = [ 3 X 3n ]
N n

1
2

1
2

[6]

1
2

Elegiremos el signo de estos escalares, y por tanto de las estimaciones de las


variables latentes de forma que la mayora de los coeficientes de carga o parmetros
de la ecuacin [1] tengan signo coherente con el esperado en el diagrama de flechas.
Por tanto el signo de los coeficientes de carga estimados supone una primera
comprobacin de la validez del modelo.
Para la estimacin de los pesos en [5] elegimos la relacin expresada en [4] basada en la hiptesis consistente en que el primer bloque de variables latentes ( 1 y
2) se define a travs de las variables manifiestas correspondientes en sentido
inwards y la variable latente del segundo bloque ( 3) en sentido outwards, ya que sta
ltima es una variable endgena en la ecuacin [1] y las variables 1 y 2 son exgenas en dicha ecuacin.
Esta etapa de la estimacin consiste en un procedimiento iterativo que alterna
entre [4] y [5]. En primer lugar, se le da valor uno al peso del indicador de la variable
latente endgena, 3 (si en vez de un indicador tuvisemos varios para esta variable
latente, entonces le daramos valor uno slo a uno de los pesos). Con este peso se
estima el valor de la tercera variable latente y su escalar f3 utilizando [5] y [6].

3 = f3 X 3

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

75

Con la estimacin de la variable latente 3, obtenemos, a travs de mnimos cuadrados ordinarios, los pesos de los indicadores de las restantes variables latentes,
1i y 2i utilizando la expresin [4].
h

i =1

i =1

3 = 1i X1i + 2 i X 2i + 1 + 2

Con las estimaciones de los pesos de las variables latentes exgenas, y junto a
[5] y [6] se obtienen estimaciones de f1, f2, y de las variables latentes exgenas.
h

1 = f1
1i X 1i
i =1
k

2 i X 2i
2 = f2
i =1

De nuevo con las estimaciones de las variables latentes exgenas se halla, a travs de mnimos cuadrados generalizados, el valor del peso de la variable latente
endgena, 3, con [4] y [6].
3 1 + 3 2 + 3
X3 =

Este proceso continuar hasta alcanzar la convergencia. Hay unas reglas de convergencia:
< 10 5 o

(

) /
< 10 5
Por tanto al aplicar mnimos cuadrados parciales (PLS) obtenemos estimaciones
de los pesos, las variables latentes y los errores presentes en [4]
En la segunda etapa, una vez estimadas las variables latentes, se estiman los
parmetros del bloque estructural [1], de la ecuacin de las variables latentes [2] y de
la relacin causal predictiva [3].
Para hallar los parmetros del bloque estructural se aplican mnimos cuadrados
ordinarios en la ecuacin [1]. A estos parmetros se le denominan coeficientes de
carga, y su valor ha de coincidir con el esperado, que se refleja en el grfico de
flechas. Por tanto el signo de los mismos supone una primera comprobacin de la
validez del modelo.

76

ESTADSTICA ESPAOLA

X 1i = 1i 1 + 1i ; i = 1,2,..., h
X 2i = 2i 2 + 2i ; i = 1,2,..., k

[7]

X 3 = 3 3 + 3 ;

En la ecuacin de las variables latentes tambin se estiman los parmetros por


mnimos cuadrados ordinarios. Dadas las estimaciones de las variables latentes, el
signo de las correlaciones entre las endgenas y exgenas no es ambiguo, por tanto
el signo de los coeficientes en [2] debe ser el mismo que se esperaba en el diagrama de flechas. Esta es una segunda comprobacin de la validez del modelo.

3 = 1 1+ 2 2 + ,

[8]

En la relacin causal predictiva, se podrn estimar los indicadores endgenos en


funcin de las variables latentes exgenas, tambin a travs de mnimos cuadrados
ordinarios.

X 3 = 3 1 1 + 3 2 2 + 3 + 3

[9]

La tercera etapa consiste en la desestandarizacin y, por tanto, estimacin de


los trminos independientes. En la estimacin mnimo cuadrtica ordinaria, los
trminos independientes de la ecuacin [1] y [2] se pueden calcular directamente:
1i0 = x 1i 1i 1
2i0 = x 2i 2i 2

[10]

3i 0 = x 3i 3i 3
0 = 3 1 1 2 2

En esta expresin los indicadores no estn estandarizados.


Los estadsticos de diagnsticos y validez del modelo que empleamos son los
siguientes:
Rj 2: Indica la parte de la varianza de la variable latente j que es reproducida por
sus predictores. Un valor elevado de este estadstico sera deseable.

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

77

Hi2: Indica la proporcin de la varianza del indicador i reproducida por las variables latentes directamente conectadas a ese indicador. Un valor cercano a uno es
aconsejable.
Fi2: Indica la proporcin de la varianza del indicador que es reproducida por las
variables latentes conectadas al indicador. Al igual que los dos anteriores, un valor
alto es deseable.
: Raz de la media cuadrtica de las covarianzas de los residuos del bloque es-

tructural o residuos outer.


S: Raz de la media cuadrtica de la covarianza de los indicadores i .

S : Cociente de las dos anteriores. Valores pequeos de este ratio son recomendables.
: Raz de la media cuadrtica de la covarianza de los residuos inner.

R: Raz de la media cuadrtica de la varianza de las variables latentes.

R : Cociente de las dos anteriores. Es conveniente que el valor de este cociente sea reducido.
RMS de las Cov( , ): Raz de la media cuadrtica de la covarianza de los residuos del bloque estructural y de la variable latente. Valores pequeos de este estadstico y el siguiente son aconsejables.
RMS de las Cov( , ): Raz de la media cuadrtica de la covarianza de los residuos del bloque estructural y de los de la ecuacin de las variables latentes.

4. RESULTADOS DE LA ESTIMACIN
Para la estimacin de este modelo con variables latentes se han manejado diversas opciones, introduciendo diferentes indicadores para cada variable latente. De los
seis modelos planteados inicialmente se ha elegido el que arroja una estimacin de
los coeficientes de carga con signo igual al esperado, o, al menos, con menor discrepancia. Tambin se han tenido en cuenta los valores de los estadsticos antes
comentados(5).
Los resultados para el modelo se recogen en los cuadros 2 y 3.
Cuadro 2
PARMETROS ESTIMADOS
(5)

La estimacin se ha realizado con el programa LVPLSC versin 1.6 de Lohmler.

78

ESTADSTICA ESPAOLA

Coeficiente

Valor estimado

Coeficiente

Valor estimado

1,1

0,3550

1,1

-0,0035

1,2

0,5255

1,2

0,3716

1,3

0,1475

1,3

0,2595

1,4

-0,2132

1,4

0,2511

1,5

-0,2204

1,5

-0,0333

1,6

0,2063

1,6

0,1326

1,7

0,4940

1,7

0,2911

1,8

0,6837

1,8

0,5328

1,9

-0,0099

1,9

0,0507

1,10

0,7045

1,10

0,1235

1,11

0,7065

1,11

0,2718

2,1

0,7836

2,1

0,6103

2,2

0,4795

2,2

0,3511

2,3

0,4845

2,3

0,2293

2,4

0,5591

2,4

0,4334

1,0000

1,0000

0,5622

0,2230

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

79

Cuadro 3
ESTADSTICOS DE MODELO
Estadstico
2

Inner R

Valor
0,4372

0,29117

0,02733

0,12648

0,20581

/S

0,61454

0,16439

0,45437

/R

0,36180

RMS de las Cov(,)

0,04153

RMS de las Cov(,)

0,04420

Modo 1, 2

Inwards

Modo 3

Outwards

De los diversos modelos ensayados, el elegido presenta el coeficiente de determinacin de la ecuacin de las variables latentes ms alto. Lo que indica que el
43,72% de las variaciones en la renta son explicadas por las variaciones en el capital
fsico y humano estimados. Los resultados quedan recogidos en el diagrama de
flechas de la figura 2.

80

ESTADSTICA ESPAOLA

Figura 2
DIAGRAMA DE FLECHAS DEL MODELO AJUSTADO
X1,1

X1,2

X1,3

0.355
0.5255
0.1475

X1,4
-0.2132

X1,5

X1,6

-0.2204
0.2063
0.494

X1,7

0.5622

0.6837

X1,8

X1,9

-0.0099
0.7045

0.7065

X110

1
X3

X111

X2,1
0.7836

0.2230
X2,2

X2,3

0.4795
0.4845

0.5591

X2,4

Analizando los resultados, podemos concluir que la importancia relativa del capital humano en la generacin de la renta es ms del doble que la del capital fsico. En
otras versiones del modelo la relacin entre capital humano y capital fsico siempre
se ha mantenido entre 2 y 3, lo cual es un indicio de la robustez de este resultado.

Dentro del capital humano los indicadores con una mayor participacin son el
nmero de miembros en el sector secundario y terciario, junto con los miembros del

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

81

hogar con estudios medios o superiores. Por otro lado, los indicadores que tienen
relacin inversa con este factor son los miembros del hogar con 65 y ms aos,
miembros del hogar analfabetos o sin estudios y miembros del hogar en el sector
primario, indicadores que muestran la menor contribucin a la formacin de capital
humano en las familias. En el modelo estimado por Dagum y Vittadini (1996) el
indicador ms destacado es el de bienes races, que no tiene un homlogo en el
conjunto de indicadores de nuestro modelo. En el capital fsico el indicador con
mayor coeficiente de carga es el de coste de adquisicin de la vivienda habitual.
Una vez estimada la ecuacin de las variables latentes, se han estimado los valores de capital fsico y humano y se les ha ajustado el modelo de distribucin de
probabilidad de Dagum, as como a la renta. El modelo genrico de Dagum (1977)
es una combinacin de tres modelos de probabilidad:
F(x) = b1F1(x) + b2F2 (x) +b3F3(x), (b1,b2,b3 ) 0 b1 + b2 + b3 = 1

[11]

De tal forma que:


e x , x < 0, > 0

F1( x ) =

1 para x 0

1, x 0

F2 ( x ) =

0, x < 0

[12]

1 + x , x 0, (, , ) > 0

F3 ( x ) =

0, para x 0

En estos tres modelos los parmetros y son parmetros de forma, mientras


es un parmetro de escala. b 1, b2 y b3 son la proporcin de observaciones negativas,
nulas y positivas respectivamente.
Para el capital humano y la renta se ha tomado b1 y b2 igual a cero por no tener
valores observados negativos ni nulos. En cambio, para el capital fsico se ha estimado el modelo generalizado, por tomar todo tipo de valores.
El ndice de Gini del modelo es:

82

ESTADSTICA ESPAOLA

3 2
b1 + b1( b1 ) + ( )G(0 < < 1)
G= 2
b1 + ( )

[13]

siendo:
G(0 < < 1) = ( 2 1) + (1 )

(, )
1
(, + )

[14]

(w) es la media de la variable

B(.) la funcin Beta de Euler


Para la renta y el capital humano, al no presentarse valores negativos ni nulos, (b1
y b2 son cero), la expresin del ndice de Gini es:
G = 1 +

(, )
1
(, + )

[15]

En el cuadro 4 se muestran los valores del ajuste del modelo (6) a las variables
renta capital fsico y capital humano. Los modelos para la renta y el capital humano se
han obtenido haciendo cero tanto b1 como b2, y tomando valor uno el parmetro b3.
Denotando como y a la variable renta, y h al capital humano, los modelos ajustados
son:
F( y) = (1 + 8.42931y 3.21887) 0.60405
F(h) = (1 + 58.50847h 6.303) 0.2737

Para el capital fsico el modelo se ha ajustado sustituyendo b1, b2 y b3 por sus


valores:
F(k ) = 0.0208953e 0 .00001648 k + 0.0020328 + (1 + 790.38757k 3.26785 ) 0 .26343

(6)

El modelo se ha ajustado con el programa EPID versin 1.8

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

83

Cuadro 4
RESULTADOS DEL AJUSTE DEL MODELO DE DAGUM A LA RENTA,
CAPITAL FSICO Y HUMANO
Renta

Capital humano

Capital fsico

0.0229281

b1

0.0208953

0.00001648

b2

0.0020328

0.60405

0.2737

0.26343

8.42931**

58.50847

790.38757**

3.21887

6.3030

3.26785

Suma de cuadrados de 0.009197


los errores

0.0002813

0.0002574*

Kolmogorov

0.01486

0.00705

0.00734*

Gini

0.3557

0.2754

0.47091

*Corresponde slo al ajuste de la parte positiva


**Tanto la variable renta como capital fsico estn expresados en millones, por tanto
este coeficiente cambia de escala

El estadstico Kolmogorov- Smirnov, como indicador de la bondad del ajuste, y la


suma de cuadrados de los errores toman valores pequeos en los tres modelos, lo
cual indica que los modelos especificados se ajustan bastante bien para las tres
variables. Del cuadro 4, usando el ndice de Gini como indicador de la desigualdad,
se deduce que la distribucin del capital humano es la menos desigual, seguida de la
renta y el capital fsico. De estos resultados se concluye que capital fsico introduce
en la formacin de renta un grado de desigualdad ms elevado que el existente en el
capital humano, y por tanto la renta, al ser combinacin de ambas, presenta un ndice
de Gini intermedio. Este ndice est ms prximo al del capital humano, debido a la
mayor aportacin de ste en la generacin de la renta.
Comparando el valor del ndice de Gini con el obtenido por Dagum (1994) para
Estados Unidos para 1983, se observa que la distribucin de la renta es ms desigual en este pas que en Espaa en 1990-1991. Pero hay que detenerse en estos
resultados, ya que Dagum hace depender la renta de la riqueza total y capital humano. La desigualdad de la renta es elevada, pero inferior a la del capital humano y la
riqueza total. La riqueza total es una variable monetaria, y es directamente observable, y el capital humano es un variable latente, y la hace depender de variables

84

ESTADSTICA ESPAOLA

monetarias ntimamente ligadas con la riqueza y la renta, todo esto hace que al estar
ms desigualmente distribuidas las variables monetarias, y hacer depender la renta
de ellas, el ndice de Gini para la renta sea notablemente superior, aunque tambin
se ha de tener en cuenta que hablamos de distintos pases

5. CONCLUSIONES
El modelo que se plantea en este trabajo se puede considerar como un primer
paso para contrastar empricamente el papel del capital fsico y humano en la formacin de la renta. El mtodo que hemos empleado, mnimos cuadrados parciales, se
ha revelado como una herramienta til para la estimacin (poco exigente con las
hiptesis en esta etapa inicial) y adems ha permitido obtener valores observados
de las variables latentes. De esta forma se ha podido ajustar un modelo de probabilidad a los valores estimados de la renta, capital fsico y humano para estudiar sus
caractersticas distributivas.
Basndonos en las versiones estimadas del modelo, podemos concluir que el
coeficiente del capital humano es mayor (entre el doble y el triple) que el del capital
fsico, por lo que la importancia relativa del primero en la formacin de la renta es
mayor, independientemente del valor puntual que arroje la estimacin de cada versin. Esto nos sugiere que el gasto en educacin por parte del Estado puede tener
una gran repercusin en la generacin de renta, debido al peso que tienen en el
capital humano los factores educativos, y el peso que tiene a su vez el capital humano
en la generacin de la renta.
Tras el ajuste de modelos de probabilidad a las variables del modelo, nos encontramos con que existe una mayor desigualdad en el reparto de capital fsico que en el
capital humano. Adems, la renta, medida a travs del ingreso monetario del hogar,
introduce un mayor grado de desigualdad que, como consecuencia, nos lleva a que
el valor del ndice de Gini para la renta sea superior que el del capital humano.
En este artculo no se pretende agotar la lnea de investigacin, sino ms bien
servir de base para futuros trabajos que profundicen en las relaciones entre la renta,
el capital fsico y el capital humano. Por ejemplo, se podra profundizar estimando un
modelo bivariante de probabilidad del capital fsico y humano conjuntamente. Tambin se podran introducir datos intergeneracionales como indicadores para las
variables latentes, siempre que se disponga de informacin suficiente.

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

85

APNDICE
Cuadro 1 A
VARIABLES OBSERVABLES NO EMPLEADAS COMO INDICADORES
Nombre

Descripcin

X1, 12

Miembros del hogar con 0-15

X1, 13

Edad del cabeza de familia

X1, 14

Sexo del cabeza de familia

X1, 15

Sexo del cnyuge

X1, 16

Cabeza de familia en el sector Primario

X1, 17

Cabeza de familia en el sector Secundario

X1, 18

Cabeza de familia en el sector Terciario

X1, 19

Miembros del hogar con 16 aos o ms

X1, 20

Cabeza de familia con estudios primarios o EGB

X1, 21

Cabeza de familia con BUP, Cou, FP1 o FP2

X1, 22

Cabeza de familia con estudios universitarios medios o superiores

X2, 5

Total prstamos

X2, 6

Tenencia de la vivienda principal (Propiedad)

X2, 7

Tenencia de la vivienda principal (Arrendamiento)

X2, 8

Tamao del municipio

REFERENCIAS
BECKER, G.S. (1962): Investment in human capital: A theoretical analysis, Journal
of Political Economy LXX (5), Part 2, 9-49
BECKER, G.S. (1964): Human capital, New york: Columbia University Press and
NBER, 2 edition, 1975.
BOLLEN K.A. (1989): Structural equations with latent variables. Estados Unidos.
CHIN, W. (1997) A Partial Least squares Latent variable modeling approach for
measuring interactions effects: results from a monte carlo simulation study and
voicemail emotion/adoption study University of Calgary.
CHIN, W. (1997) Overview of the PLS method.University of Houston

86

ESTADSTICA ESPAOLA

DAGUM , C. (1977): A new model of personal income distribution: Specification and


Estimation Economie Applique, XXX, 3, 413-436
DAGUM , C. (1994): Human capital, income and wealth distribution models and their
applications to the USA., Proceedings of the American Statistical Association,
Chicago
DAGUM , C. Y CHIU, K. (1991): Users Manual for the Program EPID (Econometric
Package for Income Distribution) for the Personal Computers Revised Version,
Ottawa: Statistics Canada.
DAGUM , C. Y VITTADINI, G. (1996): Human capital measurement and distribution,
The American Statistical Association, Chicago.
EQUIPO DE INVESTIGACIN ECONOMA CUANTITATIVA DEL BIENESTAR (1996): La
medicin de la pobreza en Andaluca Cuadernos de Ciencias Econmicas y
Empresariales. Papeles de Trabajo, 17.
EVERITT B.S. (1984): An introduction to Latent Variable models. University Press,
Cambridge.
INE (1994): Encuesta Bsica de Presupuestos Familiares 1990-91.
LOHMLLER, J.B. (1984): LVPLS Program Manual, Zentralarchiv, Universidad de
Colonia.
MINCER, J. (1958): Investment in Human Capital and Personal Income Distribution,
Journal of Political Economy, LXVI, 281-302
MINCER, J. (1970): The distribution of labor incomes, Journal of Economic Literature, VIII (1); 1-26
SCHULTZ, T.W. (1959) Investment in man : An economists view, Social research
review, XXXIII (2), 109-117
SCHULTZ, T.W. (1961): Investment in human capital American Economic Review, LI
(1), 1-17
SERRANO L. (1996) Indicadores de capital humano y productividad, Revista de
Economa Aplicada. n 10
WOLD, H. (1982): Soft Modeling. The Basic Design and Some Extensions, en
Jreskog, K.G. y Wold, H.(1982); Systems Under Indirect Observation, North Holland, Amsterdam.
WOLD, H. (1985) Partial Least Squares en Skotz y Johnson (Eds.), Encyclopedia of
Statistical Sciences (Vol.6), Nueva York: Wiley, 581-591.

ESTIMACIN DE UNA FUNCIN GENERADORA DE LA RENTA MEDIANTE UN MODELO DE VARIABLES LATENTES

ESTIMATION OF A GENERATING INCOME FUNCTION TROUGH A


LATENT VARIABLES MODEL
SUMMARY
This study proposes a model for estimating the relative weight of the
human capital and physics capital in the income generation using the
EPF survey for 1990-1991.
The method of estimation applied is the Partial Least Squares (Wold
1982). This is an iterative method that allows the estimation of multiequational models coefficients in presence of latent variables. These
variables are estimated as linear combination of manifest variables.
The Dagum model has been fitted to these estimated variables in
order to analyse the distributive characteristics.
We can conclude that the human capital contribution is more than
twice the one of the physics capital.
Key words: physics capital, human capital, latent variables, partial least
squares.
AMS Classification: 62P20.

87

También podría gustarte