Está en la página 1de 316

Manejo de las

bases de datos
y la construccin
de indicadores
socioeconmicos
Gilberto Aboites y Nicholas Sisto
editores

Universidad Autnoma de Coahuila

Aboites_PL01.indd 1 12/2/14 11:51 AM


Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

Universidad Autnoma de Coahuila


Comercializadora y Editora de Libros, S.A. de C.V. / Ediciones DeLaurel

Obra impresa
ISBN (UAdeC): 978-607-506-201-3
ISBN (DeLaurel): 978-607-9396-13-8

Obra en archivo electrnico


ISBN (UAdeC): 978-607-506-214-3

Primera edicin: diciembre de 2014


Primera edicin electrnica: febrero de 2015

Reservados todos los derechos. Queda prohibida la


reproduccin o transmisin total o parcial del contenido
de la presente obra en cualesquiera formas, sean electrnicas,
mecnicas o por fotocopia, sin el consentimiento previo
y por escrito de los titulares de los derechos.

Impreso en Mxico/Printed in Mxico

Ediciones DeLaurel es una marca registrada de Comercializadora


y Editora de Libros, S. A. de C. V.

Coordinador editorial: Miguel Quintero


Diseo de portada: Ivo Aboites Ortega
Diseo de interiores: Alejandra Basurto Cadena
Diagramacin electrnica: Felicia Garnett
Presentacin

Este libro es uno de los varios productos que a lo largo del tiempo se han generado
por los investigadores del Centro de Investigaciones Socioeconmicas (CISE) de la
Universidad Autnoma de Coahuila (UAdeC) y remite a las relaciones de trabajo que
se han forjado mediante una intensa y fructfera vinculacin con investigadores
de diversas instituciones acadmicas del pas y del extranjero.

En 2004, como resultado de las polticas impulsadas desde el gobierno federal a


travs de la Secretara de Educacin Pblica, se conformaron en el CISE los cuer-
pos acadmicos Reestructuracin Regional y Polticas Pblicas, y Crecimiento
Econmico y Economa Espacial, mismos que mantienen el estatus de consoli-
dados y que en esencia han dado la cobertura institucional y operativa bajo la cual,
en ese centro, se realizan la docencia e investigacin, pues permite articular los es-
fuerzos individuales al mantener ejes tericos y metodolgicos comunes. Gracias a 3
ello, hemos dispuesto de los recursos necesarios para la ejecucin de nuestras acti-
vidades y por tanto, este trabajo debe su realizacin al apoyo material que nos pro-
porcion, entre 2012 y 2014, el Programa Integral de Fortalecimiento Institucional
(PIFI), as como al apoyo que la SEP ha otorgado a la Red de Cuerpos Acadmicos
denominado Anlisis y Evaluacin de Polticas Econmicas y Sociales, mientras
que en el plano de nuestra universidad es menester sealar que el libro fue posible
por el apoyo de la Coordinacin General de Estudios de Postgrado e Investigacin
de la UAdeC y la direccin del CISE.

Lo anterior pone de manifiesto que el xito de los proyectos compartidos demanda,


aparte del compromiso intelectual, la voluntad de las instituciones para apoyar mate-
rialmente la realizacin de las actividades vinculatorias, pues aunque las actuales tec-
nologas de comunicacin (v. gr. Internet) facilitan el intercambio de materiales y
comentarios, no sustituyen el dilogo cara a cara ni el trabajo colectivo y compartido.

A partir del trabajo de investigacin que cotidianamente realizamos quienes parti-


cipamos de este texto, nos dimos cuenta que no eran muchos los documentos a los
cuales pudieran recurrir nuestros estudiantes, especficamente sobre la parte ins-
trumental, operativa o metodolgica, de manera que consideramos pertinente pre-
parar un texto, que de forma sencilla y didctica, ofreciera el cmo y para qu de
construir un indicador socioeconmico o cul base de datos utilizar para abordar
determinada problemtica socioeconmica.

Por lo anterior se trata de un documento que dio preponderancia a la parte didc-


tica, instrumental y metodolgica, evitando profundizar en los contenidos tericos
conceptuales, dado que no pretende sintetizar o evitar el esfuerzo que la inves-
tigacin acadmica demanda en trminos de buscar, identificar y sistematizar la
literatura sobre un tema, sino nicamente apoyar con referencias y notas puntuales
respecto al cmo y para qu de los indicadores y las bases socioeconmicas, por

Aboites_PL01.indd 3 12/2/14 11:51 AM


ejemplo trabajar un ndice de Gini, una correlacin o regresin o sobre la perti-
nencia de utilizar los censos y las encuestas que divulga el Instituto Nacional de
Estadstica y Geografa (INEGI).

Tres grandes apartados se incluyen en el libro. El primero abarca los captulos 1, 2,


3 y 4 referente a las definiciones generales de una base de datos, su pertinencia y
utilidad en el anlisis socioeconmico y la manera como se pueden estandarizar.
Despus se describe el software libre disponible para el procesamiento de informa-
cin en modelos economtricos y finalmente se explica la manera como se puede
trabajar la informacin censal a nivel de hogares. Por medio de ese ejercicio se des-
glosa los operadores bsicos que deben considerarse en el anlisis socioeconmico
de las bases de datos y se proporcionan algunas herramientas indispensables para
realizar otros ejercicios, ms de tipo socioeconmico y economtrico, que consti-
tuyen el eje del apartado dos, integrado por los captulos 5, 6, 7, 8 y 9.

En ellos se ejemplifica la utilizacin de indicadores socioeconmicos con los cuales


4 se aborda la segregacin ocupacional por gnero. Posteriormente, se presenta un
ejercicio economtrico referente al anlisis de los patrones de consumo y hogares
bajo condiciones socioeconmicas de pobreza alimentaria, que incluye el contras-
te nacional/estatal con el que se ejemplifica la manera de restringir informacin
socioeconmica a una entidad federativa o a un conjunto de localidades que agre-
gadas remiten a un estado. Enseguida, otros captulos abordan aspectos del merca-
do laboral, como lo es el diagnstico socioeconmico de una regin, para aterrizar
en el desarrollo de indicadores que regularmente determinan la demanda laboral
y se desarrolla el tema de las diferencias salariales. Cierra el apartado un captulo
que ejemplifica un anlisis del gasto en los hogares, tomando como eje el contraste
entre hogares que disponen de bicicleta como medio de transporte y aquellos que
no, de lo cual se desprenden mltiples conclusiones en relacin con el ahorro y la
predisposicin al gasto.

El ltimo apartado corresponde a los captulos 10, 11 y 12 y remiten al uso de indica-


dores economtricos para analizar el servicio del agua y se analiza la posibilidad de
trabajar anlisis economtricos valindose de bases de datos con diferentes niveles
de representatividad estadstica, con los que se puede trabajar el tema de pobreza a
nivel municipal, finalizando con un anlisis del crecimiento regional; captulos que
presuponen una habilitacin mayor, tanto en estadstica como en economa, ya
que aunque describen de manera precisa lo que debe realizarse, no proporcionan
los archivos sintaxis (SPSS) o do file (STATA).

Aboites_PL01.indd 4 12/2/14 11:51 AM


ndice

Perfil curricular de los autores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1. Bases de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Gilberto Aboites, Vicente Aboites y Jos R. Reyes

2. Alternativas libres para el procesamiento de informacin


en modelos economtricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Jos R. Reyes, Miguel . Mendoza y Jos L. Fraga

3. La construccin del dato, por ejemplo de la variable hogar,


en el censo de poblacin y vivienda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Hctor Rodrguez y Gilberto Aboites

4. Hogar, familia y su tipologa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


Gilberto Aboites, Hctor Rodrguez y Francisco Martnez

5. Segregacin ocupacional por gnero: herramientas


de medicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
Juana Delgadillo, Gilberto Aboites y Nora Garro

6. Patrones de consumo y hogares en pobreza alimentaria.


Jalisco 1996 y 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Sandra Rueda, Gilberto Aboites e Ignacio Llamas

7. Mercado laboral en la industria metalmecnica.


Regin sureste de Coahuila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
Gilberto Aboites, David Castro, Gustavo Felix y Luis Gutirrez

8. La bicicleta y la cartera. Mxico: 1994-2012 . . . . . . . . . . . . . . . . . . . . . . . . 188


Alejandro Dvila, Miriam Valds y Gilberto Aboites

9. Brecha salarial por gnero en Saltillo: un ejercicio metodolgico . . . 224


David Castro Lugo, Reyna E. Rodrguez y Mario Camberos Castro

10. Disparidad regional en el acceso al servicio de agua entubada


en Mxico, 1980-2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Nicholas P. Sisto, Ismael Aguilar y Laura M. Colima

11. Mapeo de la pobreza de ingresos en los municipios


de Coahuila, 2010 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266
Enrique Minor y Hada Senz

12. Anlisis diferencial-estructural aplicado al estudio


del crecimiento regional en Mxico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
Isaac Leobardo Snchez Jurez

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303

Aboites_PL01.indd 5 12/2/14 11:51 AM


Perfil curricular de los autores

Gilberto Aboites Manrique. Doctorado en Ciencias Sociales por la Universidad de Gua-


dalajara-CIESAS. Actualmente es investigador en el CISE de la UAdeC y profesor de
Sociologa en la Universidad Autnoma Agraria Antonio Narro (UAAAN). Ha sido investi-
gador y/o profesor en la Universidad Autnoma Metropolitana (UAM) Azcapotzalco, en la
Universidad de York (Canad), en el Colegio de la Frontera Norte, en la Universidad Estatal
Sam Houston (Texas) y en el Instituto de Investigaciones Econmicas de la UNAM. Sus
temas de investigacin son: reestructuracin del hogar, cambios en los patrones alimen-
tarios y evaluacin socioeconmica de la tecnologa. Es miembro del Sistema Nacional
de Investigadores (SNI) en Mxico y autor y coautor de diferentes artculos y libros.

Vicente Aboites Manrique. Doctorado en Fsica por la Universidad de Essex, Inglaterra.


Curs estudios de especializacin en la Universidad de Pars y un posdoctorado en la
Universidad de Berln. Fue fellow Maria Curie de la Comunidad Econmica Europea,
6 para ser investigador en el Imperial College de la Universidad de Londres. En 1986 fund
el laboratorio de lseres del Centro de Investigaciones en ptica, del cual es director e
investigador titular. Fue investigador visitante del Grupo de Dinmica de Sistemas del
Centro de Investigacin en Matemticas en Guanajuato. Ha publicado en Mxico y en
el extranjero trece libros y decenas de artculos internacionales. Es miembro del SNI ni-
vel II, de la Academia de Ciencias de Nueva York, del Instituto de Fsica de Gran Bretaa
y de la Academia Mexicana de Ciencias.

Jos Refugio Reyes Valds. Cursa en el programa de doctorado en Economa Regional


del CISE de la UAdeC. Tiene maestra en Estadstica Experimental por la UAAAN y licen-
ciatura en Educacin Media en Fsica y Matemticas por la Escuela Normal Superior de
Coahuila. En la UAdeC es catedrtico e investigador en el Centro de Investigacin en
Matemticas Aplicadas (CIMA), profesor invitado en el CISE, catedrtico de la Facultad
de Sistemas, y miembro y colaborador de cuerpos colegiados. Sus reas de inters son la
estadstica, el cmputo cientfico y la econometra.

Miguel ngel Mendoza Zamora. Maestra en Ciencias en Estadstica Experimental por


la UAAAN y licenciado en Matemticas Aplicadas por la Escuela de Matemticas de la
UAdeC. Es catedrtico de la Facultad de Sistemas de la UAdeC desde 1994 y sus reas
de inters son la estadstica, los mtodos numricos y la investigacin de operaciones.

Jos Luis Fraga Almanza. Licenciado en Matemticas Aplicadas de la Facultad de


Ciencias Fsico Matemticas de la UAdeC. Es administrador del rea de cmputo del
CIMA. Sus reas de inters son: estadstica, mtodos numricos, investigacin de ope-
raciones, cmputo cientfico, sistemas operativos y redes.

Hctor Rodrguez Ramrez. Doctorado en Ciencias Sociales por el Colegio de la Frontera


Norte. Actualmente es profesor e investigador del Instituto Tecnolgico de Estudios
Superiores de Monterrey (ITESM) en el Doctorado en Poltica Pblica de la EGAP, campus
Monterrey. Labor en la Secretara de Planeacin y Desarrollo Econmico del gobierno del
estado de Aguascalientes (1989-1991); fue profesor-investigador, coordinador de la maes-
tra en Ciencias Polticas y secretario acadmico de la Unidad de Posgrado en Estudios del

Aboites_PL01.indd 6 12/2/14 11:51 AM


Desarrollo de la Universidad Autnoma de Zacatecas (1998-2001). Tambin se desempe
como investigador titular en el CISE y ha participado en varios proyectos de investigacin
con instituciones acadmicas norteamericanas y europeas. Es miembro del SNI.

Francisco Martnez Gmez. Doctorado en Ciencias Sociales por la Universidad de


Guadalajara-CIESAS-Occidente. Actualmente es investigador del CISE de la UAdeC y
profesor en el Departamento de Economa Agrcola de la UAAAN. Su tema de investiga-
cin es la globalizacin de la economa y la sociedad y sus impactos en la agricultura y
el desarrollo rural. Es miembro del SNI y autor y coautor de diferentes artculos y libros.

Juana Delgadillo Briones. Maestra en Economa Regional por la UAdeC. Alumna del
programa de Doctorado en Economa Regional 2012-2016 del CISE de la UAdeC. Sus
temas de investigacin se enfocan a la participacin de la mujer en el mercado laboral.

Nora Nidia Garro Bordonaro. PhD en Economa de la Educacin por la Universidad


de Stanford, California, USA. Se desempea como profesora-investigadora en la UAM-
Iztapalapa desde su fundacin en 1974. Sus temas de investigacin se refieren al mer-
cado laboral, el sistema educativo y el sistema de seguridad social. Es miembro del SNI. 7

Sandra Rueda Barrientos. Maestra en Economa Regional por el CISE y licenciada en


Economa Agrcola por la Universidad Autnoma de Chapingo. Ha publicado dos traba-
jos arbitrados y su lnea de investigacin refiere al anlisis econmico de los patrones de
consumo en el hogar.

Ignacio Llamas Huitrn. PhD en Economa de la Educacin por la Universidad de


Stanford, California, EUA. Se desempea como profesor-investigador en la UAM
Iztapalapa desde la fundacin de esta en 1974. Ha realizado estancias de investigacin en
Estados Unidos de Amrica en la Universidad de Stanford, California, y en TAMIU, Texas.
Sus temas de investigacin se refieren a teora microeconmica, sistemas de evaluacin
de polticas pblicas, mercado laboral y el sistema educativo. Es miembro del SNI.

David Castro Lugo. Doctorado en Economa Aplicada por la Universidad Autnoma de


Barcelona. Actualmente es profesor-investigador del CISE de la UAdeC y Coordinador
de posgrado del CISE. Es autor y coautor de diversos artculos y captulos de libros sobre
temas de mercado laboral, economa regional y servicios. Es miembro del cuerpo aca-
dmico Reestructuracin Regional y Polticas Pblicas, y del SNI.

Gustavo Flix Verduzco. Doctorado en Economa por la Universidad Autnoma de


Barcelona. Actualmente es maestro investigador en el CISE de la UAdeC. Ha sido inves-
tigador de El Colegio de la Frontera Norte, ha escrito varios artculos cientficos acerca de
los determinantes del crecimiento y del comercio internacional, se ha especializado en
econometra y es miembro del SNI as como profesor con perfil PROMEP.

Luis Gutirrez Flores. Doctorado en Ciencias Econmicas por la Universidad Autnoma


de Baja California. Es director y maestro investigador en el CISE de la UAdeC y profe-
sor de ctedra en el Departamento de Negocios del ITESM campus Saltillo. Es autor y
coautor de varios trabajos de investigacin que versan sobre el anlisis de la distribucin
del ingreso y la pobreza desde una perspectiva regional, as como de la innovacin como
factor impulsor del crecimiento. Es miembro del SNI y profesor con perfil PROMEP.

Aboites_PL01.indd 7 12/2/14 11:51 AM


Reyna Elizabeth Rodrguez Prez. Doctorado en Ciencias por el Centro de Investigacin
en Alimentacin y Desarrollo (CIAD) tras obtener la maestra en Desarrollo Regional y
titularse de la Universidad de Sonora. Actualmente es profesora e investigadora de la
Facultad de Economa de la UAdeC, despus de laborar en la Universidad Tecnolgica
de Hermosillo. Su lnea de investigacin actual es la economa laboral sobre la que ha
publicado diversos artculos en revistas cientficas indizadas, captulos de libros, artculos
periodsticos, adems de impartir conferencias, asistencia a congresos y direcciones de
tesis en temas sobre cambio tecnolgico y mercado laboral, desigualdad salarial y discri-
minacin salarial por gnero, entre otros. Es miembro del SNI.

Mario Camberos Castro. Investigador titular D en el departamento de Economa y pro-


fesor del posgrado en Desarrollo Regional del Centro de Investigacin en Alimentacin y
Desarrollo (CIAD). Doctor en Economa por la Universidad Autnoma de Baja California
(UABC) y C a Dr. por la UAM Iztapalapa. Es miembro del SNI nivel II. Premio Nacional de
Investigacin Social y de Opinin Pblica (2011) y Premio Nacional Solidaridad (1994).
Sus reas de investigacin son el bienestar econmico, la desigualdad, la pobreza, el
mercado de trabajo y la evaluacin de polticas pblicas.
8
Alejandro Dvila Flores. Economista egresado de la UAdeC con el promedio ms alto
de su generacin. Realiz la maestra en Economa en la UNAM y el doctorado en la
Universidad de Pars. En ambas recibi mencin honorfica. Ha desarrollado activi-
dades de investigacin y docencia en diferentes instituciones como El Colegio de la
Frontera Norte, unidad Antonio Narro; la UAM; la Universidad Autnoma Chapingo
y en la American University en Washington, D.!C. Fue coordinador en la Divisin de
Ciencias Socioeconmicas de la UAAAN; rector de la UAdeC; coordinador de Estudios
de Posgrado e Investigacin y director del CISE. Fungi como presidente y vicepresi-
dente de El Colegio de Economistas de Coahuila, A.!C. y secretario acadmico en dos
consejos directivos del Colegio Nacional de Economistas. Tambin ha sido integrante
de la Comisin Tcnica de Acreditacin del Consejo Nacional para la Acreditacin de la
Ciencia Econmica, A.!C. (CONACE). Es autor de varios libros y artculos publicados en
revistas especializadas y es investigador del SNI nivel II.

Miriam Valds Ibarra. Maestra y doctorado en Economa Regional por el CISE de la


UAdeC con mencin honorfica en ambos. Realiz una estancia de investigacin en
la University North Texas (UNT) y es actual miembro de la Red de Economa Regional
y Urbana. Tambin ha sido docente en el ITESM campus Saltillo, UVM campus Saltillo,
UANE, UTC y UAdeC y ha participado en diversos proyectos de consultora para el
sector pblico y privado, siendo sus principales temas de investigacin modelos re-
gionales multisectoriales, anlisis de productividad y eficiencia y, tcnicas de anlisis
econmico regional.

Nicholas P. Sisto. Doctorado en Economa por la University of Toronto (Canad).


Actualmente es investigador en el CISE de la UAdeC. Ha sido profesor en el Tecnolgico
de Monterrey (Monterrey), la Universidad de Guanajuato, University of the South Pacific
y Ryerson Polytechnic University. Su investigacin se ha centrado en temas relaciona-
dos con el uso urbano de agua, los impactos de eventos hidrometeorolgicos extre-
mos y la productividad del agua de riego, entre otros. Ha sido consultor para el Instituto
Mexicano de Tecnologa del Agua y para diversos organismos internacionales, entre

Aboites_PL01.indd 8 12/2/14 11:51 AM


ellos la Organizacin de las Naciones Unidas. Es miembro del SNI y autor y coautor de
diferentes artculos y libros.

Ismael Aguilar Barajas. Maestra y doctorado en Planeacin Urbana y Regional por la


Escuela de Economa y Ciencia Poltica de Londres, adems es ingeniero civil por la Uni-
versidad Michoacana de San Nicols de Hidalgo. Es investigador y profesor titular en
Economa del Tecnolgico de Monterrey desde 1991 y coordinador del grupo de estu-
dios sobre los problemas econmicos en la frontera norte de Mxico, adems de repre-
sentar al sistema Tec de Monterrey en el Consejo Consultivo del Agua y en el Programa
Interinstitucional de la Regin Amrica del Norte. Anteriormente fue investigador y
profesor en El Colegio de Mxico y trabaj directamente como consultor en varias en-
tidades pblicas y privadas. Tambin ha sido profesor visitante en varias universidades
de Mxico y en el extranjero. Sus temas de investigacin incluyen: sustentabilidad am-
biental, diagnsticos relacionados con la infraestructura, productividad de la agricultura
y del agua en Mxico, as como la integracin econmica del noroeste de Mxico con
Texas. El reconocimiento de su trabajo en investigacin incluye su membresa en el SNI
nivel II. 9

Laura Maribel Colima Valadez. Cursa el doctorado en Economa Regional en el CISE de


la UAdeC. Es licenciada en Economa Agrcola por la Universidad Autnoma Chapingo
y cuenta con una maestra en Economa Regional del CISE de la UAdeC. Sus principales
temas de investigacin son la economa ambiental y de los recursos naturales y estudios
regionales.

Enrique Minor Campa. Licenciado en Economa por la UAM Iztapalapa, con estudios de
maestra y doctorado en Economa en El Colegio de Mxico. Ha sido profesor investiga-
dor del Instituto Politcnico Nacional y del ITESM campus Ciudad de Mxico, as como
consultor en diversas evaluaciones, como la del programa social Microrregiones. En la
actualidad es profesor en la Escuela de Graduados en Administracin Pblica y Poltica
Pblica (EGAP) del ITESM, campus ciudad de Mxico, y se desempea como director
de Planeacin y Normatividad de la Poltica de Evaluacin en el Consejo Nacional de
Evaluacin de la Poltica de Desarrollo Social.

Hada Melissa Senz Vela. Licenciada en Matemticas Aplicadas (2008) con maestra
en Economa Regional por la UAdeC. Actualmente desarrolla la tesis doctoral Un tra-
tamiento reciente de la pobreza en el programa de doctorado en Economa Regional
2012-2016 del CISE de la UAdeC. Sus temas de investigacin estn enfocados en m-
todos cuantitativos para el anlisis de problemticas socioeconmicas, disparidades
regionales, polticas pblicas y desarrollo econmico.

Isaac Leobardo Snchez Jurez. Doctorado en Ciencias Sociales con especialidad


en Estudios Regionales por El Colegio de la Frontera Norte. Actualmente es profesor
e investigador del departamento de Ciencias Sociales de la Universidad Autnoma de
Ciudad Jurez. Ha sido investigador invitado en la Cepal-Chile. Ha realizado una estan-
cia de investigacin posdoctoral en la Universidad Central de Colombia. Es miembro
del SNI y de la American Economic Association y director general de Nesis, revista de
Ciencias Sociales y Humanidades.

Aboites_PL01.indd 9 12/2/14 11:51 AM


Gilberto Aboites Manrique
Vicente Aboites Manrique
Jos Refugio Reyes Valds

Aboites_PL01.indd 10 12/2/14 11:51 AM


B ases
de datos

11

E
l captulo precisa conceptos bsicos para el manejo y cons-
truccin de las bases de datos y argumenta la conveniencia
de revisar las bases de datos socioeconmicas disponibles en
Mxico antes de realizar un trabajo de campo para recopilar infor-
macin de primera mano, ya que esto reduce el gasto en tiempo
y dinero, adems de facilitar la comparabilidad entre la informa-
cin disponible y la capturada por uno.

Es frecuente escuchar afirmaciones u opiniones sustentadas en relaciones, explci-


tas o implcitas, respecto de diferentes elementos. Por ejemplo la talla de las perso-
nas y el nivel de ingresos o la obesidad y la escolaridad, lo cual evidencia la manera
en que las ciencias socioeconmicas se pueden beneficiar del uso y manejo de la
informacin organizada.

Quiz las preguntas ms generales y bsicas de esas ciencias refieran a cmo los
arreglos o la disposicin de los grupos sociales afectan a la condicin y la con-
ducta humana, o cmo es que los individuos influyen en los arreglos o la disposi-
cin de los grupos sociales. Esa relacin dual entre lo individual y social conduce
a interesantes problemticas, que da con da remiten al empleo de datos colec-
tados y organizados para entender las interrogantes que de ellas se desprenden
y formular respuestas o explicaciones entre ciertas variables que se argumen-
tan pertinentes (Sweet and Grace-Martin, 2012). Por ejemplo, las condiciones de
pobreza en que viven muchos nios y sus familias limitan las posibilidades para
que en el futuro esos infantes accedan a mejores condiciones de bienestar material
y cultural?

Aboites_PL01.indd 11 12/2/14 11:51 AM


Durante la vida estudiantil y profesional es comn preguntar si los fundamentos de
Manejo de las bases de datos y la construccin

nuestras conclusiones son vlidos, mxime cuando en el medio cultural permea


la idea de que las ciencias sociales no siguen los patrones de cientificidad, que se
asumen propios en las ciencias por excelencia: fsica, qumica o matemticas. Ello,
invariablemente est ligado con el prejuicio de que los conocimientos y saberes
de indicadores socioeconmicos

provenientes de un marco metodolgico cualitativo presentan menos veracidad,


asumiendo implcitamente que es ocioso inquirir lo mismo cuando partimos de
datos cuantificables, pues suponemos que de alguna manera refieren a una mayor
precisin y por ende objetividad, dando por sentado la validez de uno y la duda en
el otro. Aunque de origen todo conocimiento parte de la percepcin, es decir de
un acto subjetivo, arrastrando de esa manera la carga consciente e inconsciente
con la que procedemos (Goldstein, 2002:2).

La experiencia docente en el rea socioeconmica nos dice que muchos estu-


diantes para trabajar un problema seleccionan la metodologa con base en el re-
chazo a los nmeros, por el simple desconocimiento que sobre lo cuantitativo y lo
12 cualitativo se tiene, de suerte tal que la seleccin no corresponde con lo que real-
mente sera deseable o conveniente. As, prefieren refugiarse en sus zonas de con-
fort, es decir, repetir y hacer aquello que suponen es ms fcil por desconocimiento
de lo otro, aunque eso al final los limita y restringe, ya que en mltiples ocasiones
los resultados de una investigacin se robustecen por la utilizacin de diferen-
tes aproximaciones metodolgicas que se complementan y apoyan mutua-
mente, pues en ciencias sociales muchos fenmenos eluden la cuantificacin y
entonces la complementariedad entre lo cuantificable y no cuantificable es desea-
ble (Imber, 1994).

El deseo de saber si las relaciones causales, que especulamos probables en una rela-
cin entre eventos del mundo social, se pueden confirmar, nos conduce a recopilar
informacin para posteriormente sistematizarla e intentar algn tipo de medicin.
Atendiendo a nuestra experiencia laboral, parece sensato suponer que es frecuente
que los estudiantes recopilen informacin socioeconmica yendo al campo las
ms de las veces sin una adecuada validacin estadstica e incluso sin referencia o
conocimiento alguno de la informacin disponible, lo cual, en el mejor de los ca-
sos replica esfuerzos realizados y, en el peor y ms frecuente, genera informacin
estadstica que no es correcto utilizar porque no permite extrapolar los resultados a
otras regiones o condiciones, propiciando la equivocada idea de que un ejercicio
estadstico es suficiente para fundamentar nuestras conclusiones como cientficas.
Por ejemplo, podemos preguntarnos si el registro de las caractersticas de edad,
sexo, escolaridad y lengua de las familias vecinas a nuestro hogar sera suficiente
para suponer que todos, en otros lugares, presentan las mismas caractersticas; ob-
viamente la respuesta es no, independientemente de que hayamos elaborado his-
togramas, calculado algunas medidas de tendencia central o quiz realizado algn
ejercicio de correlacin y regresin. En sntesis, la validez de nuestras conclusiones
no depende exclusivamente de la herramienta con la que hayamos procedido al
anlisis, sino de eso y muchas otras cosas ms que a lo largo del libro se indican e
incluso se desarrollan.

Aboites_PL01.indd 12 12/2/14 11:51 AM


El hecho mismo de que hayamos intentado recopilar y sistematizar informacin
destaca la importancia que las sociedades le han dado a esa actividad. Por ejemplo,
cmo se decide cuntos hospitales sern necesarios dentro de cinco aos?, cmo
se decide cuntas vacunas o tratamientos para enfermedades especficas se reque-
rirn este ao?, cul es el desempleo esperado para el prximo ao y qu medidas
se tomarn para afrontar esta situacin?, cuntas escuelas y nuevos maestros se
requerirn en los prximos aos?, las medidas tomadas para afrontar la criminali-
dad en el pas estn dando los resultados esperados?, con qu estrategias se van a
implementar las reformas en el sistema jurdico nacional?

Tales preguntas tienen que ver con diversos aspectos de la vida como salud y educa-

Bases de datos
cin y tienen en comn el hecho de que su respuesta requiere de planteamientos y
anlisis estadsticos. Esto no debera de extraarnos pues la palabra estadstica provie-
ne del trmino alemn statistik, introducido originalmente por Gottfried Achenwall
en 1749 para referirse al anlisis de los datos del Estado, siendo hasta el siglo XIX cuan-
do el trmino estadstica adquiri el significado de recolectar y clasificar datos.
13
Los censos son una importante fuente de informacin en todo pas y sabemos que
desde 3000 a.!C. los babilonios ya usaban muestras en barro para recopilar datos
sobre la produccin agrcola y de los productos vendidos o cambiados. Tambin se
sabe que los egipcios analizaban los datos de la poblacin y la renta del pas mucho
antes de construir las pirmides en el siglo XI a.!C. Otros ejemplos notables se en-
cuentran en antiguas tribus judas y en China desde antes de 2000 a.!C. Sabemos
tambin que los antiguos griegos realizaban censos hacia 590 a.!C. cuya informa-
cin se utilizaba para cobrar impuestos.

Hoy, el uso de la estadstica se ha extendido ms all de sus orgenes como un ser-


vicio al Estado o al gobierno ya que cada vez ms personas, empresas e institucio-
nes usan la estadstica para tomar decisiones. Esto es as porque nos proporciona
pistas a partir de las cuales podemos proyectar con certeza el futuro.

Por otra parte, es interesante anotar que los mtodos estadstico-matemticos


emergieron con la teora de probabilidad, la cual data desde la correspondencia en
1654 entre Pascal y Pierre de Fermat. Posteriormente Christian Huygens, en 1657, da
el primer tratamiento cientfico que se conoce a la materia. El libro Arsconiectandi
de Jakob Bernoulli (publicado pstumamente en 1713) y la Doctrina de posibili-
dades, publicado en 1718, de Abraham de Moivre, estudiaron la materia como una
rama de las matemticas. En la era moderna, el trabajo de Kolmogrov ha sido fun-
damental en la formulacin del modelo de la teora de probabilidades, el cual es
usado mediante la estadstica. En sntesis, no podramos imaginar el manejo de un
Estado moderno (o una gran empresa) sin una planeacin basada en el riguroso
estudio estadstico de la informacin disponible.

Ahora bien, a la informacin colectada y organizada, generalmente en tablas, se le


suele identificar con las bases de datos, pero qu es o qu se entiende por una base
de datos? Quiz la manera ms intuitiva de comprenderla es imaginar un archivo,

Aboites_PL01.indd 13 12/2/14 11:51 AM


tambin nombrado archivero. Este refiere a un artefacto que delimita un espacio para
Manejo de las bases de datos y la construccin

almacenar o contener informacin, por ejemplo la que almacenamos dentro de una


carpeta. Bien, pues las bases de datos son justamente eso, espacios contenedores
de uno o ms archivos, generalmente con formato de hoja de clculo (por ejemplo
Excel) o archivos propiamente generados por software especializado en el manejo de
de indicadores socioeconmicos

las bases tales como el SPSS o DBF, aunque igual puede incluir archivos texto o pdf.
En cualquier caso, un elemento definitorio de estas es que cuentan con algn tipo de
orden o estructura que permite acceder fcilmente a la informacin almacenada, ya
que de lo contrario ser simplemente informacin acumulada (Forta, 2006).

De lo anterior se desprende que una de las caractersticas principales es que se puede


acceder a la informacin contenida de manera eficiente, es decir, no redundante.
Generalmente se le denomina llave al elemento que permite vincular a los dife-
rentes archivos, folder, carpetas o tablas que contiene una base de datos para que
podamos establecer relaciones ordenadas y coherentes entre los elementos. Por
ejemplo, en una tabla podemos almacenar la informacin demogrfica de una po-
14 blacin y en otra la informacin econmica y, mediante el elemento llave, selec-
cionar exclusivamente la informacin que corresponde al individuo X, extrayendo
tanto sus caractersticas demogrficas como econmicas. Lo anterior implica que
el elemento llave debe estar presente en todos los archivos, carpetas o tablas de una
base de datos, de suerte tal que su existencia permita procesar la informacin con
referencia a ese elemento que es nico e intransferible.

Las tablas estn formadas por columnas, donde cada columna representa un cam-
po que tendr un tipo predefinido para prevenir inconsistencias o la insercin de
datos que no corresponden al tipo establecido. Por ejemplo, una columna puede
remitir a informacin alfanumrica (nombres de personas, de entidades federativas
o pases, etctera) y otra columna a informacin numrica, v. gr. el nmero de per-
sonas que viven en una vivienda o el nmero de aos correspondientes a la esco-
laridad de una persona, etctera. As, una tabla es un arreglo rectangular que posee
campos (columnas) y registros (renglones) a los cuales tambin se les denomina
cuadros de doble entrada.

Una vez que se establecen los campos de una tabla se agregarn registros (renglo-
nes) que contienen la informacin a almacenar. Por ejemplo, podemos construir
una tabla en la que cada rengln corresponde a una persona o a un hogar. As, cada
registro contiene al menos una columna que determina su unicidad y esa carac-
terstica previene la duplicidad de informacin o la inconsistencia entre registros.
La columna o columnas que identifican a cada registro como nico se denominan
llave (key);1 adems, estas variables registradas en determinadas columnas permi-
ten el enlace con otras tablas complementarias.

1 En este como en otros campos del saber actual, es comn el uso de vocablos en ingls que de
hecho se han integrado a diferentes lenguas, de suerte tal que muchas personas entienden su sig-
nificado pero no as la referencia al trmino lingsticamente adecuado en cada idioma. Dado lo
anterior, a lo largo del captulo se utilizarn indistintamente algunos vocablos en ingls o espaol
de manera que el lector no experto se familiarice en el uso y sentido de los mismos.

Aboites_PL01.indd 14 12/2/14 11:51 AM


Imaginemos un hospital en el que cada mdico lleva un registro de los pacientes
atendidos en el que indica su nombre, edad, peso, talla, los sntomas que presenta
al momento de la consulta, el diagnstico y los medicamentos recetados. La in-
formacin de cada mdico puede organizarse en una tabla donde cada rengln
corresponder a los pacientes y las columnas a las variables: nombre, edad, peso,
talla, los sntomas que presenta al momento de la consulta, el diagnstico y los me-
dicamentos recetados (Cuadro 1, vase en p. 16).

De esta manera, si alguno de esos pacientes consulta en otra fecha a otro mdi-
co del mismo hospital, podra cruzarse la informacin con base en las variables
Nombre y Fecha de nacimiento, las cuales seran las variables llave a partir de las

Bases de datos
que se podra vincular informacin diversa almacenada en tablas diferentes.

No obstante, generalmente elaboramos o utilizamos tablas que se van articulando


conforme a nuestras necesidades y es frecuente utilizar cuadros que provienen de
hojas de clculo, as como tablas que uno mismo genera al capturar informacin
levantada en campo, y solo cuando queremos realizar algn tipo de anlisis nos 15
damos cuenta de que el diseo no fue el mejor, que presenta algunas redundancias
y es entonces que resulta recomendable normalizarlas.

Para ilustrar el proceso de construir una base de datos normalizada se utilizar como
referencia el Cuadro 2. Este contiene las siguientes columnas: CE (Clave de la en-
tidad), ENT (Nombre de la entidad), IME (ndice de marginacin estatal), CM (Clave
del municipio), MUN (Nombre del municipio), POB (Poblacin del municipio), IMM
(ndice de marginacin municipal) y GM (Grado de marginacin).

Este cuadro presenta datos redundantes pues repite claves, nombres de la entidad
e ndices de marginacin estatal debido a que tiene informacin anidada agrega-
da en dos niveles, a saber, municipio y entidad. Adems, la informacin es de dos

Cuadro 2. Tabla a normalizar

CE ENT IME CM MUN POB IMM GM


1 Aguascalientes -0.9535 1 Aguascalientes 723!043 -1.831 MB
1 Aguascalientes -0.9535 2 Asientos 40!547 -0.62 M
1 Aguascalientes -0.9535 3 Calvillo 50!183 -0.875 B
5 Coahuila de Zaragoza -1.1371 27 Ramos Arizpe 56!708 -1.67 MB
5 Coahuila de Zaragoza -1.1371 28 Sabinas 53!042 -1.694 MB
5 Coahuila de Zaragoza -1.1371 29 Sacramento 2!063 -1.081 B
5 Coahuila de Zaragoza -1.1371 30 Saltillo 648!929 -1.921 MB
11 Guanajuato 0.0919 15 Guanajuato 153!364 -1.272 MB
11 Guanajuato 0.0919 16 Huantaro 18!456 -0.363 M
11 Guanajuato 0.0919 17 Irapuato 463!103 -1.252 MB

Aboites_PL01.indd 15 12/2/14 11:51 AM


12/2/14 11:51 AM
Cuadro 1. Doctor Juan Camaney
Doctor Juan Camaney
Sntomas
Edad Talla de
Fecha de Peso que presenta Fecha de la Medicamentos
Nombre (aos cintura Diagnstico
nacimiento (kg.) al momento consulta recetados
cumplidos) (pulgadas)
de la consulta
Dolor Infecciones
Octavio Paz 50 10/03/1963 85 36 de estmago por 11/12/2013 Penicilina
y nuseas estreptocoo
Dificultad Inflamacin
Juan Rulfo 45 14/02/1968 78 32 12/12/2013 Broncodilatador
para respirar de bronquios
Reflujo
Carlos
65 10/05/1948 96 45 y vmito Hernia diatal 13/12/2013 Anticidos
Fuentes
matutino
Elena
35 16/09/1978 47 11 Ansiedad Estrs 14/12/2013 Ansiolticos
Poniatowska

Aboites_PL01.indd 16
de indicadores socioeconmicos

16
Manejo de las bases de datos y la construccin
tipos: una es fija (CE y ENT) y otra corresponde a una variable eventual (IME) ya que
puede tener cambios de distinta ndole. Las mismas observaciones aplican para
los municipios.

Para realizar la normalizacin de la tabla se debe separar la informacin fija de la va-


riable manteniendo siempre una liga (llave) que permita relacionarlas; para el caso
de entidades la llave es CE, por lo que las primeras tablas derivadas son la de identi-
ficacin de entidades y la de variables de entidad (cuadros 3 y 4).

Cuadro 3. Identificacin de entidades Cuadro 4. Variables de entidad

Bases de datos
CE ENT CE IME
1 Aguascalientes 1 -0.9535
5 Coahuila de Zaragoza 5 -1.1371
11 Guanajuato 11 0.0919
17
Con un procedimiento similar se construyen las tablas que concentran la infor-
macin de los municipios (cuadros 5 y 6). Estos, al estar insertados en una entidad,
requieren de una llave que combina CE y CM, que es la informacin mnima reque-
rida para relacionar todas las tablas.

Cuadro 5. Identificacin
de municipios Cuadro 6. Variables de municipio

CE CM MUN CE CM POB IMM GM


1 1 Aguascalientes 1 1 723!043 -1.831 MB
1 2 Asientos 1 2 40!547 -0.62 M
1 3 Calvillo 1 3 50!183 -0.875 B
5 27 RamosArizpe 5 27 56!708 -1.67 MB
5 28 Sabinas 5 28 53!042 -1.694 MB
5 29 Sacramento 5 29 2!063 -1.081 B
5 30 Saltillo 5 30 648!929 -1.921 MB
11 15 Guanajuato 11 15 153!364 -1.272 MB
11 16 Huanmaro 11 16 18!456 -0.363 M
11 17 Irapuato 11 17 463!103 -1.252 MB

Las tablas de identificacin, tanto de entidades como de municipios, permanecen


fijas aun cuando se calculen nuevas variables, esto, entre otras cosas, optimiza la
informacin que permanece fija y reduce sustancialmente el riesgo de errores al
evitar la duplicidad de informacin. Por ejemplo, si por error se omitiera una letra en
el nombre de las entidades en los registros 01, Aguascalientes y 01, Aguascalientes,
la combinacin de ambos se tomara como dos entidades distintas si solo se utili-
zara la tabla inicial.

Aboites_PL02.indd 17 12/2/14 11:51 AM


Dado que los campos llave son elementos vnculo entre las distintas tablas, estos de-
Manejo de las bases de datos y la construccin

ben ser nicos para garantizar lo que se denomina integridad referencial. Para ilustrar
la relevancia de esto, digamos que no hay tal normalizacin y se tienen dos tablas
de entidades. En una de estas aparece el nombre de la entidad como Coahuila y en
la otra como COAHUILA; al intentar vincular las dos tablas no se encontrara coin-
de indicadores socioeconmicos

cidencia o bien, si en la misma tabla aparece la entidad escrita de las dos maneras, al
agrupar la informacin, estas seran consideradas como dos entidades distintas.

Lo anterior es un ejemplo de lo que debe alertarnos al momento de empezar a tra-


bajar. Ante estas eventualidades lo primero es limpiar la base de datos, homogenei-
zando y normalizando la misma.

Supngase que se tiene un registro de informacin cuyo formato es el siguiente:

Cdigo Cdigo
Estado Ciudad Pas Estado Ciudad Pas
Postal Postal
18
25070 COA Saltillo MX 25950 COA General Ce MX
25050 COA Saltillo MX 25950 COA General Ce MX
25284 COA Saltillo MX 25079 COA Saltillo MX
25070 COA Saltillo MX 25079 COA General Ce MX
25090 COA Saltillo MX 25950 COA General Ce MX
25180 COA Saltillo MX 25130 COA Saltillo MX
25000 COA Saltillo MX 25080 COA Saltillo MX
25090 COA Saltillo MX 25194 COA Saltillo MX
25135 COA Saltillo MX 25076 COA Saltillo MX
25072 COA Saltillo MX 25050 COA Saltillo MX
25088 COA Saltillo MX
25079 COA Saltillo MX
25096 COA Saltillo MX
0 COA General Ce MX
25078 COA Saltillo MX
25079 COA Saltillo MX
25084 COA Saltillo MX
25079 COA Saltillo MX
25124 COA Saltillo MX
25079 COA Saltillo MX
25050 COA Saltillo MX
25079 COA Saltillo MX
25071 COA Saltillo MX
25079 NL Galeana MX
25167 COA Saltillo MX
25079 COA Saltillo MX
25071 COA Saltillo MX
25064 COA Saltillo MX
25071 COA General Ce MX
25079 COA Saltillo MX
25079 COA Saltillo MX
25079 COA Saltillo MX
25079 COA General Ce MX
25079 COA Saltillo MX 25079 COA Saltillo MX

25079 COA Saltillo MX 25950 COA General Ce MX

25019 COA Saltillo MX 25290 COA Saltillo MX


25950 COA General Ce MX 25079 COA Saltillo MX
25079 COA Saltillo MX 25079 COA Saltillo MX
25076 COA Saltillo MX 25079 COA Saltillo MX
25300 COA Saltillo MX 25050 COA Saltillo MX
25950 COA General Ce MX 25950 COA General Ce MX
25000 COA Saltillo MX 25950 COA Gneral Cep MX
25950 COA General Ce MX 25079 COA Saltillo MX

Aboites_PL02.indd 18 12/2/14 11:51 AM


Una revisin rpida de la tabla permite percatarnos que presenta algunas inconsis-
tencias; por ejemplo, en el campo (o columna) Ciudad, aparece General Ce y Gneral
Cep que por obviedad sabemos se refieren a la misma ciudad y que la diferencia
obedece a errores de captura. Para identificar y corregir estos errores es recomen-
dable solicitar un anlisis de frecuencia en cada uno de los campos, columnas o
variables de la tabla y despus solicitar una ordenacin de los campos para proceder
a estandarizar los registros.

Porcentaje Porcentaje
Ciudad Frecuencia Porcentaje
vlido acumulado

Bases de datos
Vlidos Galeana 1 1.6 1.6 1.6
General Ce 12 19.0 19.0 20.6
Gneral Cep 1 1.6 1.6 22.2
Saltillo 49 77.8 77.8 100.0
Total 63 100.0 100.0
19
Sin embargo, eso no se presentar cuando trabajemos con las bases que propor-
ciona el Inegi, pues este organismo ha dedicado tiempo y recursos para la norma-
lizacin de sus bases, de suerte tal que los productos a disposicin del pblico no
ameritan el procedimiento.

Lo sealado hasta aqu puede considerarse como una introduccin necesaria para
empezar a trabajar con bases de datos. Sin embargo, para quienes deseen profundi-
zar en el tema, a continuacin se explica cmo utilizar un servidor en el que se pue-
den crear y trabajar eficientemente bases de datos con software diferente al SPSS,
STATA o R.

El servidor de MySQL

Para crear una base de datos (Dubois, 2006) se debe iniciar el servidor de MySQL y
se asigna un nombre a dicha base; en este ejercicio la llamaremos mibase. Esto se
hace como sigue:

abrir una consola;


ejecutar mysql -uroot;
ejecutar create database mibase.

Posteriormente se crean las tablas que conformarn la base de datos. Para ejem-
plificar solo haremos una tabla con 3 campos (columnas): id de tipo int (entero),
ent de tipo varchar de extensin 50 e ind de tipo double (real doble), con el campo
id definido como key. Esto se realiza mediante la siguiente secuencia de comandos:

use mibase;
create table mitabla(id int NOT NULL, ent varchar(50) NOT NULL, ind double
NOT NULL, PRIMARY KEY (id));

Aboites_PL02.indd 19 12/2/14 11:51 AM


MySQL desplegar los campos y su definicin mediante el comando select
Manejo de las bases de datos y la construccin

columns from mitabla. Finalmente se insertar un registro en la tabla y se desplie-


gan todos los registros (en este caso solo ser uno):

insert into mitabla values(5, Coahuila, -1.25);


de indicadores socioeconmicos

select * from mitabla;

En la prctica, los registros no se insertan uno a uno a menos que se trate de un sis-
tema, por ejemplo, de alta de personas en algn registro. Este tipo de captura gene-
ralmente se hace desde un programa dedicado con interfaz de usuario final, donde
la instruccin de insertar datos no es visible al capturista. Para agregar registros en
bloque existen funciones especficas.

Importar, exportar y respaldar datos

20 En el servidor MySQL se puede concentrar informacin disponible en otros for-


matos, uno de los ms comunes es el archivo de texto CSV. La mayora de los pro-
gramas que utilizan fuentes de datos organizadas en tablas permiten importar y
exportar en este formato.

Para importar datos de un archivo CSV a una tabla en MySQL se requiere el siguien-
te procedimiento:

acceder al servidor MySQL;


crear la tabla de datos dentro de la base que la contendr;
salir del servidor MySQL;
tener la tabla en formato CSV conservando el nombre de la creada en MySQL
as como el de los campos, aunque para estos la tabla CSV no llevar los nom-
bres de manera explcita;
desde la carpeta donde se encuentre el archivo CSV ejecutar la sentencia:
mysqlimport -uroot --local --fields-terminated-by=, mibase mitabla.csv;
donde mibase y mitabla son la base y tabla utilizadas.

Para exportar datos de una consulta desde el servidor MySQL a un archivo en for-
mato CSV se ejecuta el siguiente comando:

select * from mitabla order by id into outfile ~/Data/tmp/mitabla.csv


fields terminated by ,;

Desde la consola Linux o MacOS se puede realizar una consulta de MySQL median-
te una lnea de comando y guardarla en una archivo de texto:

echo use dbName; select * from tblName | mysql -uroot -p > data/
fileName.txt

Aboites_PL02.indd 20 12/2/14 11:51 AM


Es recomendable realizar un respaldo peridico de las bases de datos, esto se hace
mediante la funcin mysqldump, ya sea como actualizacin o por considerar el
riesgo de prdida de la informacin por distintos causas (errores, fallas de equipo,
etctera). El respaldo de mibase se realiza de la siguiente manera:

mysqldump -uroot mibase > rsp_mibase.dump

El respaldo rsp_mibase.dump se guardar en el directorio actual.

Para restablecer una base de datos a partir de un respaldo se ejecuta la siguiente

Bases de datos
sentencia desde una consola con ruta establecida en el directorio del respaldo:

mysql -uroot -p mibase < rsp_mibase.dump

Consultas (query)
21
Un servidor de datos no solo es un contenedor de informacin, sino que permite
realizar consultas (query) o actualizaciones de la base de datos. Para realizar acciones
en una base de datos MySQL se utiliza el lenguaje SQL (Structured Query Language),
el cual est diseado especficamente para comunicarse con bases de datos.

Algunas de las ventajas de SQL son:

no es un lenguaje propietario, por lo que puede utilizarse en cualquier plata-


forma, adems de que la mayora de los servidores de datos lo soportan;
es fcil de aprender en cuanto a que la cantidad de comandos no es extenso;
en contraste con su simplicidad, puede ejecutar operaciones complejas en
bases de datos.

En las secciones siguientes se asumir que las cuatro tablas (con los datos comple-
tos) referidas en los cuadros 3 y 4 fueron importadas a la base de datos con nombre
mibase siguiendo el procedimiento que se indica en el apartado descrito.

Consultas en una sola tabla

El comando ms utilizado en SQL es SELECT pues se usa en prcticamente todas


las consultas. Para realizar una consulta sobre una base de datos primero se inicia
el servidor de MySQL; posteriormente se ejecuta mysql -uroot y use mibase para
acceder a la base de datos de referencia.

Por ejemplo, para desplegar todos los registros de la tabla id_ent se utiliza la sentencia:

select * from id_ent;

Aboites_PL02.indd 21 12/2/14 11:51 AM


lo que da como resultado:
Manejo de las bases de datos y la construccin

mysql> SELECT * FROM id_ent;


+----+-----------------------------------------+
| ce | ent |
de indicadores socioeconmicos

+----+-----------------------------------------+
| 1 | Aguascalientes |
| 2 | Baja California |
| 3 | Baja California Sur |
| 4 | Campeche |
| 5 | Coahuila de Zaragoza |
.
.
.
| 30 | Veracruz de Ignacio de la Llave |
22 | 31 | Yucat? |
| 32 | Zacatecas |
+----+-------------------------------------------+
32 rows in set (0.00 sec)

El smbolo * indica que se seleccionarn todos los campos (columnas) y todos los
registros (renglones) de la tabla.

La seleccin se puede restringir a ciertos campos y registros por medio de filtros.


Suponga que de la tabla ind_ent se desea seleccionar los registros cuyos valores del
campo ime cumplen la condicin de ser menores que cero; realice lo siguiente:

mysql> SELECT * FROM ind_ent WHERE ime < 0;


+----+-------+
| ce | ime |
+----+-------+
| 1 | -0.95 |
| 2 | -1.25 |
| 3 | -0.72 |
| 5 | -1.14 |
|.

.
| 25 | -0.15 |
| 26 | -0.75 |
| 28 | -0.68 |
| 29 | -0.13 |
+----+-------+
18 rows in set (0.00 sec)

Aboites_PL02.indd 22 12/2/14 11:51 AM


Ms an, supongamos que se requieren aquellas entidades cuyo valor de ime se
encuentre entre -0.5 y 0.5; esto se realiza con el comando AND:

mysql> SELECT * FROM ind_ent WHERE ime > -0.5 AND ime < 0.5;
+----+-------+
| ce | ime |
+----+-------+
| 10 | -0.02 |
| 11 | 0.09 |
| 16 | 0.46 |
| 17 | -0.44 |

Bases de datos
| 18 | 0.19 |
| 22 | -0.14 |
| 23 | -0.32 |
| 25 | -0.15 |
| 27 | 0.46 |
| 29 | -0.13 |
| 31 | 0.43 | 23
| 32 | 0.16 |
+----+-------+
12 rows in set (0.00 sec)

Los filtros se pueden combinar con la seleccin de algunos campos de inters y


registros que cumplan con ciertas condiciones. Por ejemplo, en la tabla ind_mun,
es de inters seleccionar los campos cm, imm y ln de la entidad con clave distinta
de 5 y cuyo valor de imm sea menor que -1.95:

mysql> SELECT ce, cm, imm, ln FROM ind_mun WHERE ce!=5 AND
imm < -1.95;
+----+-----+-------+------+
| ce | cm | imm | ln |
+----+-----+-------+------+
| 8 | 19 | -2.13 | 2451 |
| 9 | 2 | -1.99 | 2444 |
| 9 | 3 | -2.13 | 2450 |
| 9 | 14 | -2.37 | 2454 |
| 9 | 15 | -2.05 | 2447 |
| 9 | 16 | -2.11 | 2449 |
| 14 | 39 | -1.98 | 2441 |
| 15 | 20 | -2.1 | 2448 |
| 15 | 54 | -2 | 2445 |
| 15 | 121 | -1.98 | 2442 |
| 19 | 19 | -2.27 | 2453 |
| 19 | 26 | -1.99 | 2443 |
| 19 | 46 | -2.2 | 2452 |
| 26 | 19 | -2.01 | 2446 |
+----+-----+-------+------+
14 rows in set (0.01 sec)

Aboites_PL02.indd 23 12/2/14 11:51 AM


La operacin AND (interseccin) es de tipo booleano. Otras operaciones de este
Manejo de las bases de datos y la construccin

tipo son: OR (unin), NOT (negacin o complemento) y != (distinto a).

En los ejemplos presentados hasta ahora, los criterios de seleccin involucran ele-
mentos que estn estrictamente determinados: clave de entidad, clave de muni-
de indicadores socioeconmicos

cipio, umbral del imm, etctera. Considrese el problema de seleccionar aquellas


entidades que inicien con la letra C; para lograr esto se utilizan el comando LIKE y
lo que se denomina comodn (wildcard). El comodn % se utiliza para sustituir a una
cadena de caracteres. El problema planteado se resuelve de la siguiente manera:

mysql> SELECT * FROM id_ent WHERE ent LIKE C%;


+----+-----------------------------+
| ce | ent |
+----+-----------------------------+
| 4 | Campeche |
24 | 5 | Coahuila de Zaragoza |
| 6 | Colima |
| 7 | Chiapas |
| 8 | Chihuahua |
+----+-----------------------------+
5 rows in set (0.04 sec)

El comodn % se puede utilizar en distintos lugares, de tal manera que se hara una
bsqueda sobre el patrn de caracteres que se encuentre entre ellos. Por ejemplo,
aquellas entidades que tengan los patrones C, hu y a; en ese orden se obtienen me-
diante la consulta:

mysql> SELECT * FROM id_ent WHERE ent LIKE C%hu%a;


+----+-----------------------------+
| ce | ent |
+----+-----------------------------+
| 5 | Coahuila de Zaragoza |
| 8 | Chihuahua |
+----+------------------------------+
2 rows in set (0.00 sec)

Los patrones buscados pueden estar o no en forma consecutiva.

Consultas en ms de una tabla

Una de las funciones esenciales del lenguaje SQL es la capacidad de realizar con-
sultas de un conjunto de tablas que tienen elementos (campos) que les permiten
relacionarse. La eficiencia de SQL radica en el proceso de normalizacin de tablas,

Aboites_PL02.indd 24 12/2/14 11:51 AM


lo que permite tener un conjunto de tablas consistente en cuanto a la coincidencia
de sus campos se refiere.

Si se quieren los ndices de marginacin por entidad ime de aquellas entidades cu-
yos nombres inicien con la letra m y adems que estn ordenadas en forma des-
cendente respecto a ime, se procede como sigue:

mysql> SELECT id_ent.ce, id_ent.ent, ind_ent.ime FROM id_ent, ind_


ent WHERE id_ent.ce = ind_ent.ce AND id_ent.ent LIKE M% ORDER
BY ind_ent.ime DESC;

Bases de datos
+----+--------------------------------+--------+
| ce | ent | ime |
+----+--------------------------------+--------+
| 16 | Michoacn de Ocampo | 0.46 |
| 17 | Morelos | -0.44 |
25
| 15 | Mxico | -0.62 |
+----+--------------------------------+--------+
3 rows in set (0.00 sec)

Notemos que cuando se combina ms de una tabla, en la seleccin de campos


se tiene que especificar la tabla de la cual proviene cada uno de ellos. En la parte
de la expresin

id_ent.ce = ind_ent.ce

se indica cules son los campos de referencia que permiten relacionar ambas ta-
blas para evitar duplicidades. Asimismo, se introduce el comando ORDER BY
que indica el campo o campos respecto de los cuales se quiere ordenar la tabla
resultante; adems, mediante el comando DESC, se indica que deben estar en
forma descendente.

Agrupamientos y campos agregados

SQL no se limita a realizar consultas sobre campos existentes, tiene tambin la ca-
pacidad de generar campos agregados como resultado de un agrupamiento o de la
combinacin de otros campos. El concepto de agrupamiento se refiere bsicamen-
te a evaluar una funcin, generalmente sobre un campo numrico agrupado por
un campo categrico.

La tabla ind_mun contiene un campo denominado pob. La cantidad agre-


gada de poblacin por entidad se puede generar como la suma de las poblacio-
nes de los municipios en cada entidad; as, para las entidades con clave de 1 a 10,
se tiene:

Aboites_PL02.indd 25 12/2/14 11:51 AM


mysql> select ce, SUM(pob) as pt FROM ind_mun WHERE ce <= 10
Manejo de las bases de datos y la construccin

GROUP BY ce;
+----+-------------+
| ce | pt |
de indicadores socioeconmicos

+----+-------------+
| 1 | 1065416 |
| 2 | 2844469 |
| 3 | 512170 |
| 4 | 754730 |
| 5 | 2495200 |
| 6 | 567996 |
| 7 | 4293459 |
| 8 | 3241444 |
| 9 | 8720916 |
26
| 10 | 1509117 |
+----+--------------+
10 rows in set (0.01 sec)

En esta consulta se aplic la funcin SUM sobre el campo pob agrupado por el cam-
po categrico ce al cual se le asign el nombre de pt.

Si se desea agregar una condicin sobre el valor de campo agregado, en este caso
pt, al usar el comando WHERE producir un error ya que no opera sobre grupos; en
tal caso se utiliza la sentencia HAVING. Por ejemplo, las entidades con una pobla-
cin mayor a 1!000!000 habitantes son:

mysql> select ce, SUM(pob) as pt FROM ind_mun WHERE ce <= 10


GROUP BY ce HAVING pt > 1000000;
+----+-------------+
| ce | pt |
+----+-------------+
| 1 | 1065416 |
| 2 | 2844469 |
| 5 | 2495200 |
| 7 | 4293459 |
| 8 | 3241444 |
| 9 | 8720916 |
| 10 | 1509117 |
+----+-------------+
7 rows in set (0.00 sec)

Aboites_PL02.indd 26 12/2/14 11:51 AM


Para agregar los nombres de las entidades se procede como sigue:

mysql> select id_ent.ce, id_ent.ent, SUM(ind_mun.pob) as pt FROM


id_ent, ind_mun WHERE id_ent.ce = ind_mun.ce AND id_ent.ce <=
10 GROUP BY ind_mun.ce HAVING pt > 1000000;
+----+-----------------------------+------------+
| ce | ent | pt |
+----+-----------------------------+-------------+
| 1 | Aguascalientes | 1065416 |

Bases de datos
| 2 | Baja California | 2844469 |
| 5 | Coahuila de Zaragoza | 2495200 |
| 7 | Chiapas | 4293459 |
| 8 | Chihuahua | 3241444 |
27
| 9 | Distrito Federal | 8720916 |
| 10 | Durango | 1509117 |
+----+-----------------------------+--------------+
7 rows in set (0.00 sec)

Otra opcin es crear primero un VIEW, que guarda una consulta pero se comporta
como una tabla, esto es, se ejecuta cada vez que se utiliza. Por tanto, podemos crear
primero las entidades con ms de 1 000 000 de habitantes como un VIEW:

mysql> CREATE VIEW pobtotent AS SELECT ce, SUM(pob) as pt FROM


ind_mun WHERE ce <= 10 GROUP BY ce HAVING pt > 1000000;

El resultado de esta tabla virtual se utiliza en una segunda consulta:

mysql> SELECT id_ent.ce, id_ent.ent, pobtotent.pt FROM id_ent, po-


btotent WHERE id_ent.ce = pobtotent.ce;

El resultado obtenido es el mismo que el primer procedimiento realizado en un


solo query.

Lo que se hizo con las consultas anteriores es agrupar datos y asociarlos a una fun-
cin resumen. Los campos agregados que se obtienen como funciones de los va-
lores en las columnas se agregan en forma anloga. Por ejemplo, a partir de la tabla
ind_mun se desea crear el campo wg definido como el producto de los valores en
las columnas pob e imm para la entidad con clave 1:

Aboites_PL02.indd 27 12/2/14 11:51 AM


mysql> SELECT *, imm*ln AS wg FROM ind_mun WHERE ce=1;
Manejo de las bases de datos y la construccin

+----+----+--------+-------+------+------+----------+
| ce | cm | pob | imm | gm | ln | wg |
+----+----+--------+-------+------+------+----------+
| 1 | 1 | 723043 | -1.83 | MB | 2419 | -4426.77 |
de indicadores socioeconmicos

| 1 | 2 | 40547 | -0.62 | M | 1730 | -1072.6 |


| 1 | 3 | 50183 | -0.88 | B | 1935 | -1702.8 |
| 1 | 4 | 13687 | -0.75 | B | 1841 | -1380.75 |
| 1 | 5 | 82623 | -1.23 | MB | 2188 | -2691.24 |
| 1 | 6 | 38912 | -1.31 | MB | 2239 | -2933.09 |
| 1 | 7 | 45471 | -1.14 | B | 2122 | -2419.08 |
| 1 | 8 | 7631 | -0.81 | B | 1885 | -1526.85 |
| 1 | 9 | 17372 | -0.72 | B | 1814 | -1306.08 |
| 1 | 10 | 17115 | -0.64 | M | 1748 | -1118.72 |
| 1 | 11 | 28832 | -1.15 | B | 2127 | -2446.05 |
28 +----+----+--------+-------+------+------+----------+
11 rows in set (0.00 sec)

Insertar, eliminar y modificar datos

En sistemas de administracin o actualizacin de informacin, las actualizaciones


se realizan generalmente desde una interfaz de usuario final. Los querys necesarios
para realizar los cambios en una base de datos por lo regular no son visibles para
el usuario.

Considere la tabla mitabla que contiene los campos id (entero), est (string) e ind
(doble) en los se requiere insertar los valores 18, Michoacn y 0.5, respectivamente;
esto se logra mediante la expresin:

mysql> INSERT INTO mitabla VALUES(18, Michoac?, 0.5);

Eliminar un registro se realiza mediante el comando DELETE:

mysql> DELETE FROM mitabla WHERE id=18;

Es factible tambin realizar actualizaciones solo en alguno de los campos mediante


la sentencia UPDATE. En el supuesto de que se agregue un nuevo registro a mitabla:

mysql> INSERT INTO mitabla VALUES(15, Distrito, -1.5);

se observa que se insert Distrito en lugar de Distrito Federal. La actualizacin se


realiza de la siguiente manera:

mysql> UPDATE mitabla SET est=Distrito Federal WHERE id=15;

Aboites_PL02.indd 28 12/2/14 11:51 AM


Si bien un registro se puede actualizar eliminndolo y crendolo con la nueva in-
formacin, esto no es prctico. Los registros pueden tener una gran cantidad de
campos adems de estar indexados, lo que puede provocar inconsistencia en el
esquema relacional de las tablas o bien, cometer errores en la actualizacin en otros
campos de la tabla.

Anotaciones

La informacin organizada mediante una estructura de base de datos relacional


en conjuncin con el lenguaje SQL constituye una herramienta muy potente en el
manejo de informacin. Uno de los principales problemas que se presenta al ana-

Bases de datos
lizar datos desde algn paquete estadstico es la complejidad para ensamblar datos
filtrados y ordenados de cierta manera. Utilizar una estructura de datos como puen-
te entre los datos crudos y los programas estadsticos garantiza un ahorro impor-
tante de tiempo y, sobre todo, consistencia en la informacin, que de otra manera
podra derivar en errores a veces imperceptibles.
29
El carcter universal del lenguaje SQL permite disponer de una serie de programas
con informacin consistente. Esta informacin puede ser utilizada de dos maneras:
la primera es generar datos organizados para cierto uso; la segunda es aprovechar
las capacidades de muchos de estos programas que pueden acceder y utilizar la
informacin de la base de datos. Algunos de los programas que se pueden conectar
directamente al servidor MySQL son: R, GRETL, SPSS, STATA y Eviews, entre otros.

Con el desarrollo de las tecnologas de informacin y comunicacin (TIC) se abren


otras posibilidades de acceder a bancos de datos, particularmente al hacerlo de
manera remota a travs de Internet. MySQL proporciona esa posibilidad al poder
utilizarlo a distancia y da un carcter de ubicuidad a la informacin que se quiere
procesar. Adems de la ventaja que se tiene al centralizar el contenido en un servi-
dor remoto se aade la seguridad en cuanto a la persistencia de los datos, ya que se
pueden tener sistemas redundantes para preservar su integridad.

Aboites_PL02.indd 29 12/2/14 11:51 AM


2 Jos Refugio Reyes Valds
Miguel ngel Mendoza Zamora
Jos Luis Fraga Almanza

Aboites_PL02.indd 30 12/2/14 11:51 AM


A
lternativas
libres para el
procesamiento
de informacin
en modelos
economtricos

31

L
as alternativas libres para cmputo cubren toda la gama de
software necesario para cubrir distintas necesidades: siste-
ma operativo, suites de oficina, edicin de textos cientficos,
diseo grfico, diseo editorial y cmputo cientfico. En este ca-
ptulo se presentan aquellos programas encaminados al procesa-
miento de informacin cientfica enfocados en econometra.

Tambin se da una introduccin al sistema operativo Linux y posteriormente se


tratan los programas que poseen herramientas especializadas en econometra ta-
les como PSPP, GRETL y R. Finalmente, se hace una revisin del programa Octave
orientada al anlisis numrico y al lgebra lineal. Para el caso de los GRETL y R se
mostrar su funcionamiento con un problema comn de regresin mltiple. En el
caso de PSPP se omite ya que comparte la misma sintaxis de SPSS, que es uno de los
programas ms utilizados para procesamiento de datos socioeconmicos.

! Sistemas operativos

Los tres principales sistemas operativos que se utilizan en la actualidad son Windows,
MacOS y Linux. Los dos ltimos estn basados en la plataforma UNIX, cuya carac-
terstica comn es la robustez y estabilidad que presentan y ya que la mayora del
software libre est bien amalgamado con el sistema Linux en sus mltiples versio-
nes, mucho de este se encuentra disponible para las otras dos plataformas.

El sistema Linux es un sustituto de alto desempeo alternativo de Windows pues


presenta mayor estabilidad y eficiencia en el procesamiento, adems de que existen

Aboites_PL02.indd 31 12/2/14 11:51 AM


diversas distribuciones y son gratuitas. Particularmente una de las versiones ms so-
Manejo de las bases de datos y la construccin

portadas es Ubuntu, la cual puede descargarse de Internet (www.ubuntu.com/).

Distribucin Ubuntu de Linux


de indicadores socioeconmicos

Ubuntu es de las distribuciones ms ampliamente utilizadas y cuenta con mayor


soporte gratuito e infinidad de sitios de apoyo para su uso (Hagen, 2012). Posee una
interfaz grfica de fcil acceso e intuitiva, contrario a lo que se piensa de que Linux
es un sistema complejo solo para expertos en la materia. De hecho su interfaz es
simplificada, lo que facilita el uso del software instalado sin necesidad de apoyarse
en algn manual.

El proceso de instalacin de Ubuntu no requiere de conocimientos avanzados de


informtica pues resulta ms sencillo y rpido que otros sistemas operativos. La
instalacin consta de una serie de pasos que en su mayora se realizan automti-
camente, adems puede hacerse de tal manera que se disponga de Linux a la par
32 que convive con otro sistema, como Windows. Cabe aclarar que sistemas ms re-
cientes de Windows han modificado la estructura de bios en los nuevos equipos,
lo que conlleva restricciones para su instalacin compartida aunque existen proce-
dimientos documentados para hacerlo. Sin embargo, para el mximo desempeo
de Linux, es recomendable tener solo este sistema ya que cubre las necesidades de
cmputo en diversos mbitos de aplicacin.

Si se desea instalar Linux y mantener Windows, aconsejamos realizar antes una


copia de seguridad de los archivos que se tengan en la mquina. Para obtener el
mayor rendimiento de Ubuntu Linux se debe disponer de al menos un procesador
Intel Pentium 4, 2 Ghz o superior, 512 MB de RAM, 20 GB de disco duro y conexin
a Internet de banda ancha para procesos de actualizacin.

Figura 1. Interfaz grfica de Ubuntu

Aboites_PL02.indd 32 12/2/14 11:51 AM


Antes de decidir instalar Ubuntu, la distribucin tiene la modalidad de ejecutarse de
manera virtual, esto es, puede explorarse sin ser instalado para ver la compatibilidad

de informacin en modelos economtricos


Alternativas libres para el procesamiento
con el hardware de la computadora. Para tal efecto, al iniciar desde un CD (DVD), la
opcin de probar la distribucin aparece en forma explcita. Aunque aqu no damos
el proceso de instalacin, se muestra la interfaz Ubuntu en la Figura 1.

Ubuntu posee un gestor propietario que permite acceder una gran cantidad de apli-
caciones gratuitas. Todas las aplicaciones que se discuten aqu estn disponibles
para esta distribucin.

Software para estadstica y econometra

El propsito de esta seccin es introducir al manejo de los principales programas


sustitutos o complementarios del software comercial para procesamiento de in-
formacin estadstica y particularmente economtrica. La descripcin de los pro-
gramas se har mediante el desarrollo de un ejemplo representativo desarrollado en 33
cada uno de estos.

R es un potente lenguaje orientado al manejo de objetos estadsticos y grficos y


es quiz el ms robusto y flexible para el procesamiento de informacin estadstica
(Crawley, 2007). Su forma nativa de trabajo es en consola, esto es, se trabaja con
instrucciones directas en lnea de comandos. Se puede invocar el programa desde
la consola del sistema operativo de referencia mediante el comando R. El programa
R nativo tiene una consola sobria como se muestra en la Figura 2.

Figura 2. Interfaz nativa de R

Aboites_PL03.indd 33 12/2/14 11:52 AM


Figura 3. Interfaz de RCommander
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

34

Para quien gusta programar la consola inicial es suficiente, sin embargo, existen
varias interfaces grficas que permiten acceder al lenguaje. Entre las ms utiliza-
das se encuentra RCommander (Figura 3) y RStudio (Figura 4). Aqu trabajarremos
con RStudio que aunque no posee un men de funciones de acceso directo, tiene
otras caractersticas deseables, una de estas es que existe la versin RStudio Server
con la cual se puede acceder al lenguaje en forma remota desde un navegador
web. El programa Rstudio se puede obtener en la seccin de descargas del sitio
www.rstudio.com.

Al utilizarse RStudio por primera vez, muestra tres secciones disponibles: la de la


izquierda es la lnea de comandos, la superior derecha muestra las variables que
se estn utilizando, la inferior derecha permite visualizar los directorios, grficas,
paquetes y documentos de ayuda. La Figura 4 muestra cuatro secciones, la parte
superior izquierda se genera una vez que se ha escrito un primer script.

R es un potente lenguaje orientado a procesar informacin esencialmente de na-


turaleza estadstica desde un enfoque de objetos, sin embargo se pueden efectuar
muchas tareas complejas tales como manejo de matrices, resolucin de proble-
mas de optimizacin y, particularmente, se pueden crear una variedad de grficas

Aboites_PL03.indd 34 12/2/14 11:52 AM


Figura 4. Interfaz de RStudio

de informacin en modelos economtricos


Alternativas libres para el procesamiento
35

de alta calidad y complejidad. Este lenguaje tiene, entre sus principales virtudes, la
flexibilidad para crear funciones propias adems de miles de libreras disponibles
adicionales a las que son instaladas inicialmente.

La orientacin a objetos que tiene R lo hace robusto en varios sentidos. Por ejem-
plo, con un solo comando se genera una gran cantidad de informacin asociada
al objeto que se aplica. Este objeto puede ser un vector, una matriz, una lista o una
data frame (trama de datos), estructura de datos ms utilizada en R. Esto es, cada
funcin asignada a una variable objeto conlleva el almacenamiento de metadatos
que son utilizados posteriormente en conjuncin con otras variables generadas.
Cabe mencionar que inclusive un grfico puede se considerado una variable de la
que se extraen parmetros de inters.

La instalacin en las plataformas MacOS y Windows es estndar, esto es, no requie-


re de instrucciones especiales para hacerlo. El programa se puede descargar de la
pgina www.r-project.org/ y seleccionar la versin y algn servidor en particular de
la lista que aparece. Para el caso de Linux (Ubuntu) mediante el administrador
de instalaciones synaptic se localiza como r-base y agregar las libreras base ne-
cesarias en el proceso de instalacin. Es importante distinguir que R es un lenguaje
mientras que RStudio es una interfaz grfica utilizada para su manejo.

La documentacin es muy extensa para este software y se puede encontrar en la


propia pgina, adems de que existe una gran cantidad de libros especializa-
dos para la aplicacin en reas especficas. En el sitio dado en la seccin de manua-
les se recomienda An Introduction to R para quien desee incursionar en la sintaxis
de este lenguaje.

Aboites_PL03.indd 35 12/2/14 11:52 AM


Sintaxis
Manejo de las bases de datos y la construccin

Un vector se puede considerar como un arreglo lineal de datos ya sea numricos


a alfanumricos y es la unidad bsica de informacin en R. Para asignar un valor a
una variable se utiliza la combinacin de caracteres <-, de tal manera que se ubica
de indicadores socioeconmicos

a su izquierda el nombre de la variable y a la derecha el objeto que se le va a asignar.


Por ejemplo, para crear la variable dat con los valores 2, 3, 5, 2, 1, 0, 9, 8, 6, 6, en la
consola se escribe:

dat <- c(2,3,5,2,1,0,9,8,6,6)

y se presiona ENTER (se asume de aqu en adelante que se presionar ENTER para
ejecutar un comando). Despus de hacerlo la informacin quedar almacenada en
dicha variable. Para visualizarla se escribe el nombre de la variable y se ejecuta:

dat
36
lo que desplegar:

[1] 2 3 5 2 1 0 9 8 6 6

donde [1] indica la posicin en el vector del primer elemento en el rengln que se
despliega. Esto es til sobre todo si se tienen muchos datos y la informacin es des-
plegada en varios renglones.

A partir de un vector se puede obtener informacin estadstica como el mnimo,


mximo, media, desviacin estndar, grfica, etctera, de una manera relativamen-
te sencilla. Para mostrar algunas de las funciones se generar un vector con 1000
dato en forma aleatoria de una distribucin normal con media 50 y desviacin es-
tndar 10. Utilizando el mismo nombre para la variable se procede como sigue:

dat <- rnorm(1000,50,10)

No es necesario desplegar todos los datos para trabajar con esta informacin.
Estadsticas bsicas se obtienen mediante el comando summary aplicado a los datos:

summary(dat)

que da como resultado:

Min. 1st Qu. Median Mean 3rd Qu. Max.

19.65 42.93 50.12 50.08 57.01 81.12

Los datos corresponden al mnimo, primer cuartil, mediana, media, tercer cuartil y
mximo, en ese orden. Al replicar este ejemplo se obtendrn valores ligeramente

Aboites_PL03.indd 36 12/2/14 11:52 AM


distintos ya que provienen de una simulacin de datos aleatorios que se generan en
el momento de definir la variable.

de informacin en modelos economtricos


Alternativas libres para el procesamiento
La informacin que se ha obtenido hasta ahora es mnima en relacin con lo que
se puede hacer con este conjunto de datos. Considerando que los datos provienen
de una variable continua es factible generar tres tipos bsicos de grfica: dispersin,
histograma y diagrama de caja. Las tres lneas de comando siguientes generan las
figuras 5, 6 y 7, respectivamente.

plot(dat, pch=16, cex=0.75, col=terrain.colors(20), xlab=Dato, ylab=Valor,


main=Dispersion);

hist(dat, col=c(bisque1, bisque3), xlab=Clases, ylab=Frecuencia,


main=Histograma);

boxplot(dat, col=bisque2, notch=TRUE, main=Boxplot);


37
Figura 5. Diagrama de dispersin

Figura 6. Histograma

Aboites_PL03.indd 37 12/2/14 11:52 AM


Figura 7. Diagrama de caja
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

En cada instruccin, lo que aparece entre parntesis despus de la primera coma


38 son parmetros adicionales, por ejemplo para generar el diagrama de dispersin
bastara con escribir plot(dat); sin embargo, lo que se hizo fue definir etiquetas para
personalizarla con tipo de punto, tamao y color. Para cada tipo de grfico existe
una gran cantidad de parmetros que nos permiten hacer lo que se denomina sin-
tona fina de los grficos y tener, por tanto, un control muy amplio sobre el com-
portamiento de lo que queremos generar.

Aunque la intencin no es llegar hasta ese nivel de profundidad, es importante


mencionar que inclusive los grficos en s mismos, R los considera objetos de los
cuales se puede extraer informacin adicional. Esto significa que un grfico puede
guardarse como una variable que es til para su anlisis por los metadatos que con-
tiene. Por ejemplo, un histograma posee una variable implcita llamada counts que
determina la frecuencia observada en cada una de las clases de histograma.

Aplicacin

Aunque existen infinidad de modelos que pueden ser procesados en R, a manera de


ejemplo de lo que puede realizar se har un modelo de regresin para salarios en re-
lacin con el nivel de educacin y experiencia mediante el modelo de la Ecuacin 1.

Cabe mencionar que la descripcin se centrar en el proceso para realizar la regre-


sin en R y no para hacer un anlisis sobre la validez del modelo utilizado.

ln(W) = u + 1(ED) + 2(EXP) 3(EXP2) + u


Ecuacin 1. Modelo para diferencia salarial

Los datos corresponden al tercer trimestre de 2005 de ENOE, los cuales se pueden
obtener en formato DBF, sin embargo si se tienen disponibles en formato STATA o
SPSS pueden ser importados directamente por R. Aqu se obtendrn los datos direc-
tamente de formato STATA. Para realizar el ejemplo se requiere agregar una librera

Aboites_PL03.indd 38 12/2/14 11:52 AM


para generar histogramas con datos ponderados. Para tal efecto, en la ventana in-
ferior derecha de RStudio, se selecciona la pestaa Packages, posteriormente Install

de informacin en modelos economtricos


Alternativas libres para el procesamiento
packages; en el campo central de la ventana emergente se escribe plotrix asegu-
rndose de que la casilla Install dependencies est activada. Una vez hecho esto se
presiona Install (Figura 8).

Figura 8. Instalacin de libreras de RStudio

39

Se indicarn paso a paso los comandos requeridos para procesar la informacin


y estimar el modelo expresado en la Ecuacin 1. Todos los pasos se pueden guar-
dar en un script ya que permite corregirlo o modificarlo en cualquier momento.
Para tal efecto, en la parte superior izquierda de la barra de herramientas de RStudio,
se selecciona el icono con una hoja en blanco y signo de + y la opcin R Script. En
la hoja en blanco que se despliega se escribe:

DifSalarial2 <- function(){}

Se guarda el archivo con el nombre DifSalarial2.R. Los scripts de R llevarn la exten-


sin .R y se recomienda que el nombre del archivo coincida con la primera lnea
del documento que define una funcin. Posteriormente todo el cdigo generado se
insertar sobre los signos de llaves, es decir, cada lnea de comando que se explique
se agregar dentro de las llaves. Al final de la seccin se mostrar el script completo
como quedara finalmente. Para ejecutar el script cada que se realiza un cambio,
se debe seleccionar Source en la barra de herramientas de la ventana superior iz-
quierda (Figura 9); esto genera la siguiente lnea en la la parte inferior izquierda de
la consola:

source(~/Documents/book/CiseBD/cise_bd_dev/DifSalarial2.R)

Aboites_PL03.indd 39 12/2/14 11:52 AM


Figura 9 Carga y ejecucin de un script en RStudio
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

Para realizar el procesamiento del script basta escribir en la consola DifSalarial() y


presionar ENTER. Los resultados de tipo texto se mostrarn en la consola y las gr-
ficas en la ventana inferior derecha.

Primero se deben agregar algunas libreras que sern necesarias para ejecutar el
script. La primera es foreign que da acceso a mltiples formatos de datos, como los
son CSV, SPSS, STATA, DBF, entre otros. La segunda librera es plotrix y genera histo-
gramas con datos ponderados. Para tal efecto, se agregan las siguientes dos lneas:
40
library(foreign)

library(plotrix)

Si se desean agregar comentarios al script se anteceden del smbolo # para indi-


carle a R que no sern procesados. Ahora se requiere acceder a los datos que sern
procesados, esto se hace mediante el comando read.dta para formato generado en
STATA.

dat <- read.dta(~/Documents/book/CiseBD/cise_bd_data/enoe3t05.dta)

names(dat)[417] <- anos_edu;

Los datos sern asignados a la variable dat que se encuentran en la ruta especificada
entre comillas y tiene el nombre de enoe3t05.dta. La segunda lnea se utiliz para
cambiar el nombre a la variable en la posicin 417 de la base de datos y eliminar
caracteres acentuados ya que originalmente estaba escrita con la letra (aos). Es
recomendable utilizar nombres cortos para las variables, sin espacios y sin carac-
teres acentuados.

El siguiente paso es seleccionar solo aquellas variables de inters en el modelo a utili-


zar. En este caso son el logaritmo del salario (logw), escolaridad (anos_edu), experien-
cia laboral (exp), experiencia laboral al cuadrado (exp2), factor de ponderacin (fac),
sexo (sexo) y ciudad (ciudad). La seleccin se har para la ciudad 1 (Distrito Federal)
y cada uno de los sexos, donde 0 es mujer y 1 hombre. Para los logaritmos de salario y
experiencia laboral se utilizarn valores mayores a cero. Esto se realiza utilizando la
funcin subset mediante la cual se definen restricciones y variables a seleccionar:

dat.m <- subset(dat, sexo==0 & ciudad==1 & logw>0 & exp>0,
select=c(logw, anos_edu, exp, exp2, fac, sexo, ciudad))

Aboites_PL03.indd 40 12/2/14 11:52 AM


dat.h <- subset(dat, sexo==1 & ciudad==1 & logw>0 & exp>0,
select=c(logw, anos_edu, exp, exp2, fac, sexo, ciudad))

de informacin en modelos economtricos


Alternativas libres para el procesamiento
Los datos de las mujeres se guardan en la variable dat.m y los hombres en dat.h. El
siguiente paso es obtener los histogramas del logaritmo del salario ponderado por la
variable fac. El resultado obtenido se muestra en las figuras 10 y 11, generado a partir
de las siguientes lneas de cdigo, respectivamente:

weighted.hist(dat.m$logw, dat.m$fac, col=c(bisque1,bisque3), xlab=LOG


SALARIO, ylab=FRECUENCIA RELATIVA, freq=FALSE);
weighted.hist(dat.h$logw, dat.h$fac, col=c(bisque1,bisque3), xlab=LOG
SALARIO, ylab=FRECUENCIA RELATIVA, freq=FALSE);

Figura 10. Mujeres

41

Figura 11. Hombres

Aboites_PL03.indd 41 12/2/14 11:52 AM


Finalmente se realiza la regresin del modelo dado en la Ecuacin 1 mediante el
Manejo de las bases de datos y la construccin

comando lm (regresin lineal) del logaritmo del salario como variable dependiente,
y escolaridad, experiencia y experiencia al cuadrado como variables independien-
tes. La sintaxis incluye la fuente de datos y la indicacin de que sern pondera-
dos por la variable fac; el objeto resultante se guarda, para el caso de mujeres en
de indicadores socioeconmicos

la variable lm.m. El resultado se imprime mediante el comando print y la fun-


cin summary se utiliza para obtener los metadatos del objeto resultante como se
muestra enseguida:

lm.m <- lm(logw ~ anos_edu+exp+exp2, weights=fac, data=dat.m);


print(summary(lm.m));

lm.h <- lm(logw ~ anos_edu+exp+exp2, weights=fac, data=dat.h);


print(summary(lm.m));

Dado que para cada uno de los sexos tiene la misma estructura solo se muestra el
42 resultado generado correspondiente a mujeres:

Call:
lm(formula = logw ~ anos_edu + exp + exp2, data = dat.m, weights = fac)
Weighted Residuals:
Min 1Q Median 3Q Max
-124.398 -9.485 -0.354 8.810 80.990
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.086e+00 6.409e-02 110.563 < 2e-16 ***
anos_edu 1.100e-01 4.057e-03 27.101 < 2e-16 ***
exp 1.603e-02 3.900e-03 4.110 4.21e-05 ***
exp2 -2.653e-05 8.388e-05 -0.316 0.752
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 16.68 on 1248 degrees of freedom


Multiple R-squared: 0.376,Adjusted R-squared: 0.3745
F-statistic: 250.6 on 3 and 1248 DF, p-value: < 2.2e-16

El resultado est dividido en cuatro bloques: el primero replica el modelo proce-


sado; el segundo despliega estadsticas generales de los residuales ponderados; el
tercero muestra la estimacin de coeficientes, errores estndar, valor t y el p esti-
mado; el cuarto bloque presenta el error estndar residual, la estimacin del R2, el
estadstico F, los grados de libertad y el valor p para el modelo.

Se observa que los estimadores para el coeficiente independiente, escolaridad y ex-


periencia son significativos mientras que la experiencia al cuadrado no lo es. El
ajuste es bajo trminos de la variabilidad explicada al tener un valor R2 = 0.376.

Aboites_PL03.indd 42 12/2/14 11:52 AM


Script generado en R

de informacin en modelos economtricos


Alternativas libres para el procesamiento
Todos los pasos realizados se muestran en el script guardado con el nombre
DifSalarial.R.

DifSalarial2 <- function(){


# AGREGAR LIBRERIAS
library(foreign)
library(plotrix)
# OBTENER DATOS FUENTE
dat <- read.dta(~/Documents/book/CiseBD/cise_bd_data/enoe3t05.dta)
names(dat)[417] <- anos_edu;
# SELECCIONAR SUBCONJUNTOS DE DATOS
dat.m <- subset(dat, sexo==0 & ciudad==1 & logw>0 & exp>0,
select=c(logw, anos_edu, exp, exp2, fac, sexo, ciudad));
dat.h <- subset(dat, sexo==1 & ciudad==1 & logw>0 & exp>0,
select=c(logw, anos_edu, exp, exp2, fac, sexo, ciudad)); 43
# HISTOGRAMAS DE LOGARITMO DE SALARIOS PONDERADOS POR FAC
weighted.hist(dat.m$logw, dat.m$fac, col=c(bisque1,bisque3),
xlab=LOG SALARIO, ylab=FRECUENCIA RELATIVA, freq=FALSE);
weighted.hist(dat.h$logw, dat.h$fac, col=c(bisque1,bisque3),
xlab=LOG SALARIO, ylab=FRECUENCIA RELATIVA, freq=FALSE);
# MODELO DE REGRESION
lm.m <- lm(logw ~ anos_edu+exp+exp2, weights=fac, data=dat.m);
print(summary(lm.m));
lm.h <- lm(logw ~ anos_edu+exp+exp2, weights=fac, data=dat.h);
print(summary(lm.m));
}

Una de las ventajas de contar con un script es que puede ser ampliado y modificado,
adems de que puede realizarse el mismo procesamiento para una fuente de datos
distinta. Ms an, es factible guardar grficos y tablas resultantes en forma automtica
y en diversos formatos. En el caso de las tablas se soportan los formatos ya mencio-
nados para distintos programas de estadstica o CSV para hojas de clculo. Los grfi-
cos pueden guardarse como postscript, EPS, PDF, PNG, JPEG, TIFF y SVG, entre otros.

La ventaja de poder generar datos procesados y guardarlos en otros formatos, es la


posibilidad de realizar dicho proceso en varias etapas segn el tipo de anlisis que
se requiera. Aunque R puede generar informacin georeferenciada, los resultados
obtenidos pueden tener el formato para ser utilizado en otros paquetes especializa-
dos como QGIS (Rudiger et al., 2013), por ejemplo.

GRETL

GRETL tiene su contraparte comercial Eviews. Aunque este software est enca-
minado al manejo de datos de naturaleza economtrica, constituye un programa

Aboites_PL03.indd 43 12/2/14 11:52 AM


muy completo para el tratamiento de informacin estadstica en general. Entre
Manejo de las bases de datos y la construccin

otras caractersticas posee la cualidad de interactuar con el lenguaje R, el cual es


ms completo y flexible.

Una de las ventajas es poder trabajar en un entorno grfico o bien en lnea de co-
de indicadores socioeconmicos

mando mediante un script para ejecutar rdenes secuenciales. La interfaz grfica


de GRETL es muy sencilla (Figura 12). En GRETL se pueden importar varios for-
matos como lo son CSV, Octave, Open Document (LibreOffice, OpenOffice), SPSS,
Eviews y STATA (Figura 13), lo que facilita la tarea del manejo de informacin ya que
no utiliza un formato propietario.

Figura 12. Interfaz inicial

44

Aplicacin

El modelo de regresin en la ecuacin 1 se procesar mediante el entorno grfico.


Los datos fuente son importados de un formato CSV (hoja de clculo) a diferencia
de R donde se realiza directamente de formato STATA. Una vez importados los da-
tos data_m.csv de las mujeres, siguiendo la secuencia mostrada en la Figura 13, se
selecciona el modelo de mnimos cuadrados ponderados indicados en la Figura 14.

Una vez seleccionado el tipo de modelo, se definen las variables dependientes, in-
dependientes y el ponderado, y se presiona OK para generar los resultados (Figura
15). Los valores obtenidos coinciden con los de R.

La ventana de resultados de GRETL de la Figura 15 muestra un men con una se-


rie de alternativas acerca de los resultados obtenidos. En la opcin Save se pueden
guardar los valores ajustados y los residuales, adems de otros. Mediante la opcin

Aboites_PL03.indd 44 12/2/14 11:52 AM


Figura 13. Importar distintos formatos

de informacin en modelos economtricos


Alternativas libres para el procesamiento
45

Figura 14. Seleccin de mnimos cuadrados ponderados en GRETL

Graphics se generan grficas de residuales o valores ajustados contra las variables


independientes, las cuales se pueden exportar a diversos formatos (EPS, PDF, EMF).
Tambin se genera la grfica de tipo Q-QPlot de los residuales estimados contra
los esperados con el supuesto de normalidad. En el men Analysis se genera infor-
macin relativa a valores reales y ajustados en la regresin, pronsticos, intervalos
de confianza de coeficientes y matriz de covarianza.

Observaciones

Para usuarios acostumbrados al programa Eviews, GRETL se presenta como una


alternativa excelente y verstil. A diferencia de Eviews, GRETL tiene la posibilidad
de invocar a R y enviar un conjunto de datos; esto es particularmente til cuando se

Aboites_PL03.indd 45 12/2/14 11:52 AM


Figura 15. Resultados de mnimos cuadrados ponderados en GRETL
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

requiere de un modelo ms robusto o personalizado que exige una segunda etapa


46 de procesamiento. Otra ventaja es su capacidad de exportar resultados al procesa-
dor de textos cientficos LATEX con la calidad que caracteriza a este programa.

Si bien GRETL es una alternativa importante con capacidad de procesamiento


mediante interfaz grfica o bien mediante un script, en contraste, el programa R
tendra algunas ventajas por su capacidad de manejo de grandes cantidades de in-
formacin, la enorme cantidad de libreras disponibles y la capacidad de generar las
propias libreras por parte del usuario. Otra ventaja de R es su integracin sencilla
con bases de datos como MySQL o PosgreSQL para acceso local y remoto y su eje-
cucin en un entorno de red a travs de RStudio Server.

PSPP

Este programa es equivalente al software comercial SPSS con el cual comparte mu-
chas de sus caractersticas y particularmente la interfaz grfica (Figura 16).

Figura 16. Interfaz grfica de PSPP

Aboites_PL03.indd 46 12/2/14 11:52 AM


Figura 17. Regresin en PSPP

de informacin en modelos economtricos


Alternativas libres para el procesamiento
Dada la similitud con el programa SPSS se omite el proceso de importar datos CSV.
Adems, es importante aclarar que el modelo de mnimos cuadrados ponderados 47
no ha sido integrado, sin embargo es factible ponderar en la tabla de datos alguna de
las variables. En tal caso, solo para mostrar su funcionamiento se estiman los par-
metros del modelo en la Ecuacin 1 sin considerar mnimos cuadrados ponderados.

La Figura 17 presenta las ventanas emergentes y los resultados obtenidos en la esti-


macin del modelo no ponderado.

De los tres programas para procesamiento estadstico presentados aqu, el ms


desarrollado, soportado, con capacidad de crecimiento y superior a la mayora de
los paquetes comerciales es sin duda R. Enseguida se encuentra GRETL por su ni-
vel de madurez y funcionalidad equiparable a su contraparte comercial Eviews.
Finalmente PSPP, que aunque es el menos maduro sigue en continuo desarrollo y
cuenta con una funcionalidad cercana a su equivalente comercial SPSS.

Para el usuario que quiera extenderse prcticamente sin lmite en el uso y desarrollo
de libreras orientadas al anlisis estadstico se recomienda utilizar R como la mejor
opcin, particularmente por su alto nivel de desempeo y sin las limitaciones pre-
supuestales que imponen los paquetes comerciales.

Para aquellos que prefieran el uso prctico de funciones preestablecidas y un am-


biente grfico, la seleccin recomendada es GRETL. El programa es maduro, bien
soportado, completo, adems de proveer la alternativa de programacin e interac-
cin directa con el lenguaje R.

QtOctave

Octave es quiz de los programas con ms tiempo y ha sido fuente de desarrollo


tanto de software comercial como libre (Eaton et al., 2008). Enfocado en el cmpu-
to cientfico, especficamente en el numrico con nfasis en problemas asociados

Aboites_PL03.indd 47 12/2/14 11:52 AM


al lgebra lineal, se le puede equiparar al programa comercial Matlab. En su ver-
Manejo de las bases de datos y la construccin

sin original se trabaja directamente con comandos en consola, sin embargo,


para diversas distribuciones de Linux, se cuenta con la versin de entorno grfico
QtOctave que se instala de manera sencilla y directa.
de indicadores socioeconmicos

La interfaz de QtOctave (Figura 18) es sobria, con una serie de ventanas y mens y
con dos componentes de especial inters, a saber, una terminal y un editor de cdigo.
En la terminal se pueden ingresar comandos directamente lnea a lnea y en el edi-
tor se escriben programas secuenciales para su procesamiento posterior.

Otra alternativa libre igualmente robusta y en continuo desarrollo es Scilab (www.


scilab.org/). Comparte la misma sintaxis que Octave y Matlab y est disponible para

Figura 18. Interfaz grfica de QtOctave

48

Figura 19. Interfaz grfica de Scilab

Aboites_PL03.indd 48 12/2/14 11:52 AM


las plataformas Linux, Mac y Windows. Viene con un ambiente grfico integrado
adems de un simulador de sistemas (Figura 19).

de informacin en modelos economtricos


Alternativas libres para el procesamiento
Sintaxis

Posee una sintaxis natural e intuitiva y una gran cantidad de funciones para
diversas tareas, la mayora coincide con las utilizadas en Matlab. A manera de in-
troduccin se muestran algunos ejemplos aplicados directamente en la terminal.
Por ejemplo, para definir una matriz de orden 3X3, esto es, una matriz cuadrada de
orden tres cuyos componentes, ledos como renglones, son los dgitos, se escribe
de la siguiente manera:

X = [1, 2, 3; 4, 5, 6; 7, 8, 9]

Si despus de capturar esto se da ENTER, se despliega inmediatamente la matriz en


forma de texto. Si se aade la puntuacin ; despus del corchete de la derecha, la
matriz no se despliega pero queda almacenada, en este caso, en la variable X. 49

Una vez definida una matriz se pueden realizar sobre esta una serie de operacio-
nes directas: transpuesta, reduccin por filas, inversa (si es cuadrada y no singular),
seudoinversa, determinante (si es cuadrada), factorizacin, diagonalizacin, entre
otras. La siguiente secuencia muestra la aplicacin de las primeras cinco operacio-
nes sobre la matriz X:

X
rref(X)
inv(X)
pinv(X)
det(X)

En cada uno de los casos al ejecutar el comando se despliega el resultado. En caso


de no ser factible el clculo de alguno de estos por la estructura de una matriz ser
indicado en un mensaje.

Aplicacin

Una gran cantidad de modelos economtricos multivariados estn ya integrados


en programas especializados como lo son R y GRETL, sin embargo, otras aplica-
ciones requieren de herramientas especializadas para el manejo de matrices, tal
es el caso de problemas asociados a insumo-producto (Miller and Blair, 2009).
La aplicacin que se desarrolla aqu es elemental y servir como referencia para
ver la potencia de Octave para procesar este tipo de informacin.

Considere una matriz tcnica de coeficientes (ecuacin 2), esto es, las proporciones
de produccin que son requeridas por una industria de entre aquellas en un siste-
ma econmico, en este caso tres industrias.

Aboites_PL04.indd 49 12/2/14 11:52 AM


( )
0.39600 0.20000 0.14286
Manejo de las bases de datos y la construccin

A= 0.15385 0.45168 0.42857


0.23077 0.33333 0.40413

Ecuacin 2. Matriz tcnica de coeficientes


de indicadores socioeconmicos

Se puede comprobar que las columnas tienen una suma menor que uno, esto debido
a que se considera una demanda externa al sistema econmico de referencia. El
vector de demanda externa, dado en unidades monetarias cualesquiera, se define en
la ecuacin 3. Cabe sealar que en el ejemplo este fue generado en forma aleatoria.

( )
182
f= 219
720

Ecuacin 3. Vector de demanda externa


50
Finalmente, la produccin requerida para satisfacer tanto la demanda interna como
externa queda establecida por la ecuacin 4.

X = (I A)1 f

Ecuacin 4. Produccin total requerida

A la matriz (I A)1 se le denomina Inversa de Leontief y se denota como L.

La Figura 20 muestra en la ventana del editor los pasos realizados para obtener la
demanda requerida. En la ventana de la terminal se observan los resultados gene-
rados una vez ejecutado el programa desde el editor. Si el vector de demanda se

Figura 20. Modelo abierto de Lenontief en QtOctave

Aboites_PL04.indd 50 12/2/14 11:52 AM


hubiera especificado en lugar de generarlo en forma aleatoria, bastaran los si-
guientes tres pasos para obtener la demanda requerida:

de informacin en modelos economtricos


Alternativas libres para el procesamiento
A = [0.39600, 0.20000, 0.14286; 0.15385, 0.45168, 0.42857;
0.23077, 0.33333, 0.40413]
F = [182; 219; 720]
X = inv(eye(3)-A)*F

Observaciones finales

La cantidad de alternativas libres disponibles para el tratamiento de informacin se


extiende mucho ms all del mbito de la econometra, esas cubren un amplia es-
pectro de cmputo cientfico prcticamente en cualquier disciplina. Su diversidad
y capacidad de crecimiento rebasa por mucho a los programas comerciales por dos
razones sustanciales: la primera es que usualmente son de cdigo abierto, lo que
permite modificar el cdigo fuente; la segunda es que existe una gran comunidad 51
mundial de cientficos y aprendices de esta herramientas que constantemente in-
corporan mejoras o nuevas funciones a los diversos programas.

De las comunidades que actualmente tienen ms peso es indudablemente la del


lenguaje R, la cual aporta utileras para prcticamente cualquier rea que requiere de
procesamiento de datos, ya sea de naturaleza estocstica o determinstica.

Finalmente, el software libre disponible se puede dividir en varias categoras, con al-
gunos de los programas disponibles (con su contraparte comercial), en funcin de
su mbito de aplicacin como sigue:

1. Sistemas operativos
a. Linux (MacOS, Windows)
2. Suites de oficina
a. LibreOce (iWorks, Microsoft Office)
3. Diseo grfico y editorial
a. Gimp (Photoshop)
b. Inkscape (Freehand)
c. Scribus (In Design, Quark Press)
4. Cmputo cientfico
a. Estadstica (econometra)
R (S-PLUS)
GRETL (Eviews)
PSPP (SPSS)
b. Cmputo numrico
Octave (Matlab)
Scilab (Matlab)
c. Matemtica simblica
WxMaxima (Mathematica)

Aboites_PL04.indd 51 12/2/14 11:52 AM


3 Hctor Rodrguez
Gilberto Aboites

Aboites_PL04.indd 52 12/2/14 11:52 AM


L
a construccin
del dato, por
ejemplo de la
variable hogar,
en el censo de
poblacin y
vivienda

53

U
na de las interrogantes que primero se le presentan a cual-
quier estudiante o investigador del mbito socioeconmi-
co, refiere a contestar si debe o no recopilar informacin
de primera mano para avanzar en su investigacin. Y es frecuente
que despus de llevar un curso de estadstica o muestreo se sien-
tan capacitados para levantar la informacin que ocupan. No obs-
tante, al margen de su preparacin y habilidad, es recomendable
que primero revisen la informacin estadstica del INEGI,1 ya que
seguramente encontrarn ms informacin de la que se imagi-
nan e incluso es posible que descubran que existe informacin
que les resultar mejor, ms sugerente o eficaz de la que haban
considerado. Adems, puede constituir un ejercicio que les resol-
ver dudas respecto de la manera de formular una pregunta o de
la forma como pueden organizar las respuestas, con la ventaja de
que el INEGI ya prob y confirm que las preguntas y respuestas
se corresponden de manera eficaz.

Por otra parte, conservar la estructura de las preguntas aplicadas por ese organismo
permitir contrastar la informacin capturada, siempre que se respeten los criterios
tcnicos estadsticos del muestreo a fin de que los grados de confianza y error sean
compatibles con las bases de datos publicadas y disponibles; as podremos con-
trastar la informacin de manera puntual y precisa, con plena certeza de la validez
de nuestras inferencias. Por ende, cuando se pueda y se requiera, es conveniente

1 Ver pgina web: www.inegi.org.mx/est/contenidos/proyectos/estadistica/default.aspx.

Aboites_PL04.indd 53 12/2/14 11:52 AM


utilizar los mismos criterios, preguntas y definiciones conceptuales empleadas por
Manejo de las bases de datos y la construccin

el INEGI en los levantamientos censales o en las encuestas.

Lo anterior es importante, aunque parezca trivial, pues la pregunta misma deter-


mina la calidad y precisin de la respuesta. Muchas veces el investigador sabe o
de indicadores socioeconmicos

cree saber la informacin que busca capturar con la aplicacin de un cuestionario,


pero la manera como redacta la pregunta no siempre es interpretada, por el que
responde, de la forma como el investigador quisiera, ya que depende de considera-
ciones culturales. Por ejemplo, un campesino no es igual que un obrero, burcrata
o empresario, o bien una mujer percibe una situacin de manera diferente que un
hombre, de ah la necesidad de probar las preguntas redactadas prestando atencin
a los matices y diferencias de interpretacin que da el entrevistado, reformulndo-
las hasta que estemos ciertos de que todos entienden lo que el investigador desea
saber mediante una pregunta. A esto se le denomina pilotear un cuestionario y es
una actividad fundamental pues garantiza que efectivamente los datos capturados
respondern a las preguntas, y en consecunecia a nuestras dudas e inquietudes.
54
Tambin es importante cerrar en lo posible las preguntas y respuestas, de mane-
ra que se facilite la captura de la informacin y su posterior anlisis cuantitativo;
no obstante, en muchas ocasiones se formulan preguntas abiertas con el propsito
de capturar la diversidad y matices que los entrevistados dan a cierta informacin,
aunque se est conciente que ello significar un esfuerzo futuro de compactacin
o aglutinacin temtica de las respuestas. En este caso, el investigador debe estar
claro que al ordenar, clasificar y compactar las respuestas no propicia sesgos, es
decir, que no distorsiona las respuestas capturadas en la encuesta.

Cuando no se respetan los criterios sealados, se corre el riesgo de cometer errores


que pueden ser desde preguntas incorrectamente formuladas hasta de captura. En
el primer caso nos damos cuenta del error cuando comenzamos la aplicacin del
cuestionario y durante la entrevista nos vemos forzados a replantear el contenido
de la misma, aunque de esta manera se puede sesgar al entrevistado porque al hacer
explcito nuestro inters es comn que le demos elementos para que inconscien-
temente los retome y los vierta como respuestas propias. Tambin puede suceder
que al revisar las respuestas capturadas estas correspondan a interrogantes que en
realidad no quisimos formular. Eso es frecuente cuando la aplicacin del cuestio-
nario la realizan personas distintas a quien lo dise. Por ello es relevante pilotear
las preguntas antes de aplicar los cuestionarios de manera generalizada y evaluar si
es factible retomar las preguntas ya formuladas por el INEGI.

Contrario a lo que suponen muchos estudiantes cuando comienzan a introducir-


se al tema de la informacin socioeconmica, el levantamiento de informacin
en campo es una actividad cara y demanda un esfuerzo enorme de planeacin.
Disear un cuestionario, pilotearlo y aplicarlo en campo significa tiempo y dinero.
Para dar una idea de esto, considrese que un encuestador cobra alrededor de 150
pesos por cuestionario, de unas 40 preguntas, siempre y cuando en su aplicacin
se tarde entre veinte y treinta minutos, ya sea que trate de preguntas cerradas o de

Aboites_PL04.indd 54 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
opcin mltiple y no se enfrente con problemas logsticos para contactar al sujeto
que deber encuestar; en el mejor de los casos, un encuestador puede llegar a apli-

La construccin del dato, por ejemplo de la


car cinco o en condiciones excepcionales diez cuestionarios por da.

El diseo de un software para capturar y convertir en base de datos la informacin


levantada en los cuestionarios cuesta cerca de diez mil pesos si no presenta mayo-
res exigencias; si la informacin se desea georeferenciada, el precio del software se
multiplica por diez, esto es, cien mil pesos por localidad. Hay que agregar los costos
logsticos (traslados, estancia, etctera). En sntesis, aplicar una encuesta es caro y
por lo mismo es menester planear perfectamente el trabajo a fin de evitar incon-
venientes, pues cada uno significa incrementar los costos y perder tiempo. No es
por tanto una actividad fcil ni sencilla, menos an barata. Si se revisan los apar-
tados Mtodo de captacin (2000) y Mtodo de operacin (2010) de las Sntesis
Metodolgicas de los Censos del INEGI, puede tenerse una idea aproximada del
tiempo y costo que demanda la preparacin del levantamiento de la informacin.

Otro caso recurrente es la falta de estandarizacin de los rangos empleados en las 55


variables socioeconmicas. Por ejemplo, las pirmides de poblacin generalmente
refieren a rangos de cinco aos de edad (0 a 4; 5 a 9; 10 a 14 y as sucesivamente),
sin embargo, algunos investigadores definen otros parmetros y el resultado es que
no se pueden contrastar correctamente los resultados obtenidos en campo con los
reportados por fuentes oficiales y por artculos que consideran esa informacin.

En esta misma direccin hay que tener cuidado de precisar los criterios convenien-
tes de utilizar ya que, por ejemplo, en los pases latinoamericanos es comn utilizar
deciles de ingreso para el anlisis de la desigualdad econmica o las disparidades
materiales, mientras que en los pases desarrollados lo frecuente es construir quin-
tiles de ingreso. Esto responde a la manera como en cada economa se distribuye
la variable ingreso, en donde a mayor heterogeneidad y por ende dispersin de la
variable se aumenta el nmero de rangos.

Por otra parte, tambin es importante tomar en cuenta que uno de los criterios fun-
damentales para determinar si un conocimiento generado es cientfico o no, de-
pende de la posibilidad de contrastar los datos, de suerte tal que es indispensable
contar con algn referente cientficamente vlido contra el cual revisar nuestros
resultados; por ello es comn replicar lo ya hecho o utilizar los datos provenientes
de medios de segunda y tercera clase, es decir, levantados por otras personas para
propsitos distintos a los nuestros. En cualquier caso, se debe profundizar en el
conocimiento de cmo se levantaron y qu es exactamente lo que significa un n-
mero o registro dentro de una tabla o base de datos, pues es imposible medir algo
con algn sentido y sensatez si no sabemos de qu se trata.

De ah que la primera cuestin es tener claridad y exactitud en las definiciones em-


pleadas, sea que uno genere la informacin directamente (primera mano) o que
utilicemos informacin generada por otro (segunda mano). Existen, sin duda, al-
gunas definiciones que de suyo son obvias y otras que al reflexionar un poco resul-

Aboites_PL04.indd 55 12/2/14 11:52 AM


tarn complejas. Por ejemplo, si un bilogo tiene como variable de su investigacin
Manejo de las bases de datos y la construccin

el peso de los animales y trata de relacionarla con el crecimiento del animal (esta-
tura), seguramente el peso lo medir en unidades como kilogramos o libras y ni
siquiera se cuestionar la validez de ese procedimiento. En cambio, en las ciencias
socioeconmicas muchas de las variables utilizadas son variables complejas y su
de indicadores socioeconmicos

definicin no es unvoca lo que da lugar a mltiples interpretaciones, pues es co-


mn emplear variables que en realidad constituyen agregaciones e interacciones
entre diferentes indicadores, por ejemplo la variable pobreza.

Por tanto, siempre que se pueda definir un trmino de varias maneras, el recopila-
dor de datos debe establecer cul de las definiciones posibles parece la ms sensata
y qu definicin se presta ms a una recopilacin de datos eficiente y relativamente
econmica, situacin que supone que entre las varias definiciones posibles se ha
optado por una y se pide al usuario de datos que acepte esa definicin especfica al
interpretar las cifras.

56 Ahora bien, para el caso especfico de los censos de poblacin, aunque pudie-
ra suponerse que el investigador entiende la informacin contenida en ellos, es
conveniente realizar un escrutinio de las bases de datos indagando cules son las
preguntas a partir de las cuales se captur y proces la informacin: cul es la
unidad de anlisis, es decir, persona, hogar, empresa, etctera?; cul es el nivel de
representacin espacial o geogrfica que proporciona esa base de datos?; fueron
localidades menores de 2!500 habitantes, mayores de esa cantidad?; considera el
criterio de zona metropolitana o rea metropolitana?; cul es la periodicidad con
la que se ha levantado ese tipo de informacin?; es mensual, trimestral, semestral,
anual, bianual, quinquenal, por dcadas?; se ha mantenido a lo largo del tiempo la
misma estructura, las mismas preguntas y la misma codificacin o han cambiado?;
en qu formato se ofrece la informacin?, como cuadros de salida (generalmente
Excel) o a nivel de microdatos en formato DBF?; cul es el grado de accesibili-
dad del material complementario a la informacin?, por ejemplo, est disponible
el cuestionario utilizado en la captura?; se tiene un documento metodolgico?;
estn disponibles el o los catlogos de codificacin?; cunto cuesta o qu tan
difcil es acceder a la informacin? La respuesta a estas interrogantes indicarn la
pertinencia de emplear dicha informacin.

! Cmo importar microdatos del INEGI

Primero se accede a la pgina web del INEGI con la recomendacin de utilizar el


motor de bsqueda Explorer porque ofrece de inmediato la opcin Guardar como,
mientras que los otros motores de inmediato nos mandan a ejecutar.

Hecho lo anterior se selecciona la pestaa Estadstica, luego Banco de datos, en-


seguida Microdatos (Figura 1), luego la opcin Censos y conteos y dentro de esta
Poblacin y vivienda, en la que se despliegan las versiones 2010, 2005, 2000, 1995,
1990; con un clic en 2000 se despliega la pgina de Censo de Poblacin y Vivienda

Aboites_PL04.indd 56 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 1. Pgina web del INEGI

La construccin del dato, por ejemplo de la


57

2000. En esta pgina se observan tres apartados: Aspectos metodolgicos, que


contiene archivos en formato PDF; Acceso a microdatos, en el que seleccionamos
la opcin Muestra (cuestionario ampliado)!-!descarga, y finalmente Otras formas
de consulta.

Al seleccionar Muestra (cuestionario ampliado)!-!descarga, automticamente nos


abre otra ventana donde se selecciona la entidad federativa con la que queremos tra-
bajar, en este caso ser Coahuila de Zaragoza (Figura 2).

Figura 2. Seleccin de la entidad federativa

Aboites_PL04.indd 57 12/2/14 11:52 AM


Al hacerlo ofrece las opciones de Ejecutar, Guardar o Cancelar el archivo m2k_01.
Manejo de las bases de datos y la construccin

exe (compactado en zip); damos la opcin Guardar, para lo cual es recomendable


hacerlo en una carpeta previamente rotulada. Posteriormente se descomprime el
archivo zip y se obtienen tres archivos en formato Data Base Format (DBF), mismo
que en automtico ofrece el INEGI.
de indicadores socioeconmicos

Estos archivos se pueden acceder directamente con SPSS, basta colocarse en la


pantalla de inicio, seleccionar Abrir datos e indicar en Archivos de tipo que se desea
abrir un archivo con formato DBF y enseguida dar un clic en Abrir (Figura 3).

Figura 3. Cartula vista de datos SPSS

58

Figura 4. Base de datos de la poblacin de Aguascalientes

Aboites_PL04.indd 58 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Al abrir el archivo se despliega la base de datos correspondiente a la poblacin de
Aguascalientes de la muestra censal de 2000 (Figura 4). Antes de continuar es reco-

La construccin del dato, por ejemplo de la


mendable guardarla (en Archivo y luego Guardar como) con un nombre adecua-
do para identificarla en cualquier momento, por ejemplo COAH 2000 poblacin.
Tambin es aconsejable almacenar los archivos en una carpeta nica en la que se
puedan tener subcarpetas, cada una con propsitos distintos, para guardar en una,
por ejemplo, las bases originales y en otra las modificadas.

! Construccin de la llave Identificador del hogar

En general, los censos de poblacin se concentran en las variables sociodemogr-


ficas ms importantes (edad, sexo, nmero de hijos, situacin laboral) y para el caso
del censo levantado en 2000 las unidades de observacin fueron los residentes ha-
bituales de una vivienda, en el entendido que toda persona que habita normalmen-
te en ella, es decir, que ah duerme, prepara sus alimentos, come y se protege del
ambiente, la reconoce como su lugar de residencia. 59

As, la vivienda es todo espacio delimitado normalmente por paredes y techos, de


cualquier material, con entrada independiente, que las personas utilizan para vivir y
protegerse del ambiente (INEGI, 2003:7).

Al margen de cualquier consideracin terica en relacin con los conceptos resi-


dente y vivienda, INEGI busc la identificacin de criterios unvocos que eviten,
en lo posible, la discrecionalidad en el levantamiento de la informacin. Esta es
una caracterstica fundamental que est presente en la informacin que genera el
Instituto y que, de entrada, proporciona confianza en la informacin.

Para el caso de Mxico, la informacin censal ha presentado algunos cambios. De


acuerdo con el INEGI (2003:6-7), en 1895 se levant el primer censo de poblacin
de la poca moderna y desde entonces se han realizado doce levantamientos,
con una periodicidad de diez aos, a excepcin del realizado en 1921 que fue pos-
tergado un ao por la revolucin. As, los censos se realizan cada diez aos y siem-
pre en aos terminados en cero, esto es 1980, 1990, 2000, 2010, etctera.

Desde 1950 se procede al levantamiento censal de poblacin y vivienda de forma


simultnea, lo cual implica la posibilidad de cruzar informacin de ambos aspectos,
mientras que en el pasado la vivienda solo era un tema tangencialmente abordado.

Destaca, adems, el hecho de que a partir de 1995 se aplica, en periodos intercensa-


les, un levantamiento muestral al que se denomina Conteo de Poblacin y Vivienda,
mismo que originalmente inclua la captura de informacin demogrfica, social,
y de vivienda y economa. Sin embargo, a partir del 2005 se elimin el apartado
econmico limitando la secuencia temporal de los anlisis socioeconmicos con
fundamento en esa informacin digitalizada.

Aboites_PL04.indd 59 12/2/14 11:52 AM


En estadstica descriptiva se denomina censo al recuento de individuos que con-
Manejo de las bases de datos y la construccin

forman una poblacin, definida esta como un conjunto de elementos de referencia


sobre el que se realizan las observaciones. La diferencia entre censo y encuesta es
que el primero refiere a toda la poblacin objetivo, mientras que la encuesta incluye
solamente una fraccin de ese universo, al que se denomina muestra estadstica-
de indicadores socioeconmicos

mente representativa de la poblacin.

Hasta 2003, los documentos publicados en Mxico con base en la informacin


censal tenan como unidad de anlisis a las personas, toda vez que en el censo lo
que interesaba era indagar cuntos eran, dnde estaban y cmo eran los elementos
de una poblacin dada.

Con fundamento en las leyes de confidencialidad vigentes en el pas, el INEGI no


proporcionaba microdatos cuando permitan identificar personas o familias den-
tro de una localidad que por sus dimensiones no garantizaba el anonimato, por
eso en las bases de datos censales la variable D_R apareca en blanco (Figura 5), dado
60 que esta clave corresponda al cdigo de registro de la vivienda censada. As las co-
sas, la llave (key) que permita vincular la informacin censal a nivel de hogar no era
accesible al investigador ni al pblico.

En 2003, el doctor Hctor Rodrguez, entonces investigador del CISE de la UAdeC,


logr construir un identificador del hogar mediante la agregacin de diferentes va-
riables, que en conjunto delimitaban la pertenencia de las personas a una vivienda
y un hogar.2

Figura 5. Aguascalientes. Censo General de Poblacin y Vivienda 2000

2 Hogar: unidad formada por una o ms personas, unidas o no por lazos de parentesco, que resi-
den habitualmente en la misma vivienda y se sostienen de un gasto comn para la alimentacin
(INEGI 2003:28).

Aboites_PL04.indd 60 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Para Rodrguez, lo que en la base censal daba identidad a los individuos eran las
variables municipio (mun), unidad primaria de muestreo (upm)3 y nmero de vi-

La construccin del dato, por ejemplo de la


vienda (numviv), de suerte tal que construy el identificador del hogar con una
combinacin de ellas, componindolo por 15 dgitos y con lectura de izquierda
a derecha.4

El identificador del hogar fue construido con base en el mtodo de prueba y error,
y consisti en un conjunto de operaciones bsicas de aritmtica (sumas y mul-
tiplicaciones) que proporcionaron un dgito factible de ser interpretado. Aunque
a la distancia parece obvio o simple, en su momento fue un hallazgo que permi-
ti, por primera vez, utilizar esa base de datos para realizar anlisis, no solo de in-
dividuos sino tambin de hogares (Figura 6), cuestin que con anterioridad solo

Figura 6. Identificador del hogar utilizando la base de datos


del Censo General de Poblacin y Vivienda 2000

61

3 Las Unidades Primarias de Muestreo estn constituidas por una o parte de un rea Geoestadstica
Bsica (AGEB) o por varias AGEB colindantes, esto es, cuando no se completa el mnimo de vivien-
das requeridas para formar la UPM. Segn la zona de referencia su constitucin es la siguiente:
UPM en urbano alto.
Un AGEB con un mnimo de 480 viviendas.
La unin de dos o ms AGEB colindantes y del mismo estrato, con un mnimo de 480 viviendas
en conjunto.
UPM en el resto de las zonas.
Un AGEB o la unin de dos o ms AGEB que contengan:
de 100 a 1 000 viviendas en localidades urbanas y
de 50 a 850 viviendas en localidades rurales.
Cabe aclarar que en la zona rural, por lo regular, un AGEB est conformada por varias localidades
con poblacin menor a 2 500 habitantes, por lo tanto la dispersin de la poblacin en el rea geo-
grfica puede ser muy grande, en este caso se clasifican en UPM, con poblacin no dispersa o de
fcil acceso, y UPM, con poblacin dispersa o de difcil acceso (INEGI 2003).
4 La variable entidad federativa no se incluy porque las tablas de la base de datos censal estaba or-
ganizada a nivel de estado.

Aboites_PL04.indd 61 12/2/14 11:52 AM


el INEGI poda hacer pues era el nico que dispona de la base de datos y de la
Manejo de las bases de datos y la construccin

variable llave.

El procedimiento empleado ms que complicado fue ingenioso. El principio es


que si se multiplica un nmero cualquiera por 10, se sabe que el resultado ser el
de indicadores socioeconmicos

mismo nmero ms un dgito nuevo ubicado a la derecha, esto es, por ejemplo:
80 * 10 = 800.

Ese resultado ser invariablemente semejante si en lugar de multiplicar por 10 se


hace por 100 o por 1000, con el nico cambio de que se agregarn tantos ceros a
la derecha como ceros tenga la cifra por la cual se multiplica el nmero base. As,
para construir el identificador del hogar, en el supuesto de que la variable mun re-
fiere al nmero 999, la upm a 9999 y la numviv a 9999, se multiplica cada una de
las variables por un nmero que permita ordenar las tres variables en una secuen-
cia idntica.

62 Y para determinar las cantidades por las que se debe multiplicar cada una de las va-
riables, primero se requiere saber la cantidad de dgitos que totalizan la suma de las
tres variables sealadas, en este caso es 11 ya que mun = 3 dgitos, upm = 4 dgitos
y numviv = 4 dgitos, lo que significa que la variable tendr al menos 11 dgitos.
Adems, se inserta en medio de cada variable el dgito 0 que funciona como sepa-
rador, por ende se agregan dos: uno entre mun y upm y otro entre upm y numviv
y se tienen hasta aqu 13 dgitos. Finalmente se introduce 10 al principio de cada
identificador del hogar para garantizar que conserven la misma extensin. As, el
identificador tiene un total de 15 dgitos. La siguiente tabla ilustra la lgica y el pro-
cedimiento seguido.

mun 999 10000000000 = 999 * 10,000,000,000 9990000000000

upm 9999 100000 = 9999 * 100,000 999900000

numviv 9999 1 = 9999 * 1 9999

1 100000000000000 = 1 * 100,000,000,000,000 100000000000000

109990999909999

mun upm numviv

Observe que en el ltimo rengln la variable mun es la primera que aparece, luego
de un separador sigue la upm, enseguida otro separador y finalmente la numviv. De
aqu lo importante es el orden que guardan los dgitos.

El algoritmo utilizado por el doctor Rodrguez fue el siguiente:

IDENTIFICADOR=(MUNICIPIO*10,000,000,000)+(UPM*100,000)
+(NUMVIV)+(100,000,000,000,000)
(mun*10000000000)+(upm*100000)+(numviv)+(100000000000000)

Aboites_PL04.indd 62 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
De acuerdo con esto, el resultado se interpreta leyendo de izquierda a derecha, de
la siguiente forma:

La construccin del dato, por ejemplo de la


a b c d e f
10 001 0 0087 0 0001

a. Los dos primeros dgitos son de control y no tienen ningn inters.


b. Los tres siguientes dgitos sirven para identificar el municipio. En este caso es
001, que corresponde a Abasolo.
c. El siguiente dgito 0 es un separador.
d. Los siguientes cuatro dgitos sirven para identificar la upm. En este caso es 0087.
e. El siguiente dgito 0 es un separador.
f. Los cuatro ltimos dgitos sirven para identificar el nmero de vivienda. En este
ejemplo el nmero de vivienda es 0001. 63

Como puede apreciarse en la Figura 7, esos dgitos corresponden a los cinco pri-
meros renglones de la base de datos censal de Coahuila en 2000 y a simple vista se
puede identificar qu personas integran un hogar, toda vez que en el arreglo matri-
cial de esa tabla censal cada rengln corresponde a una persona.

Figura 7. Coahuila

Para las ciencias sociales esto constituy un paso importante porque el nivel de re-
presentatividad estadstica que permita la base censal no la proporcionaba ninguna
otra base socioeconmica disponible. Basta pensar que la informacin demogrfi-
ca y socioeconmica se trabajaba desde el nivel municipio y por agregacin poda
llegarse a estado o regin, siendo el propio investigador el que determinaba el ta-

Aboites_PL04.indd 63 12/2/14 11:52 AM


mao e integrantes de las unidades administrativas (municipios) que incluira en su
Manejo de las bases de datos y la construccin

regin, considerando obviamente el nivel pas.5

Una dcada ms tarde, en 2010, el INEGI incorpor dos variables inexistentes en el


censo 2000, a saber, el de id_viv (identificador de vivienda) y el id_per (identificador
de indicadores socioeconmicos

de persona) y elimin la variable numhog, correspondiente al nmero de hogar que


refera al carcter principal o secundario del hogar. Mediante la agregacin de estas
variables fue posible construir una variable similar llamada hogar censal, sealando
que el cambio obedeci a que el criterio de compartir un gasto para los alimentos
era solo uno de los varios arreglos que llevan a cabo los integrantes de los hogares
para satisfacer sus necesidades.

En el censo 2010, el hogar censal ya refiere a la unidad formada por el conjunto de


personas que residen en la misma vivienda, independientemente de sus vnculos
parentales (INEGI, 2011:27), lo cual, como se dijo, fue el criterio central en la cons-
truccin del identificador del hogar utilizando la base censal de 2000.
64
Como se ver ms adelante, la construccin del identificador del hogar se puede
realizar mediante la instruccin Concatenar para hacer la operacin ms amigable
y sencilla, pero para quien comienza a adentrarse en el manejo de las bases de datos
socioeconmicas es fundamental entender el razonamiento que est detrs de la
operacin, pues de manera recurrente tendr que construir diferentes identificado-
res, siendo la cuestin central distinguir entre lo que hace a algo nico e individual
de lo que aglutina a individuos, hogares, municipios, etctera.

Identificador del hogar

Como ya se mencion, lo que daba identidad a los individuos en la base censal


2000 eran las variables mun, upm y numviv; por tanto se utilizarn estas variables
en la siguiente instruccin:

(mun*10000000000)+(upm*100000)+(numviv)+(100000000000000)

Primero es conveniente realizar un anlisis de frecuencia en las tres variables defi-


nidas para determinar qu valores son vlidos y cules no. Para ello se ejecutan las
siguientes instrucciones dando ENTER cada vez (Figura 8):

Anlisis
Estadsticos descriptivos
Frecuencias
Aceptar

5 Esta cualidad permite que en la actualidad CONEVAL pueda construir indicadores de marginacin
y pobreza a nivel de municipio, empatando la estructura socioeconmica capturada mediante las
ENIGH, y traspasarla a la base de datos censal (vese captulo 11).

Aboites_PL04.indd 64 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 8

La construccin del dato, por ejemplo de la


65

Como puede apreciarse en el Cuadro 1, la variable upm tiene 5!454 casos perdi-
dos, lo cual obedece a que el INEGI no incluy esa informacin para todos los
casos reportados en la base censal. Dichos casos constituyen los hogares que
no podrn ser identificados, lo cual restringe la precisin del anlisis, pero dados
los montos porcentuales de los casos perdidos, puede afirmarse que en ninguna
entidad federativa se afecta realmente la validez de las inferencias que podamos
realizar, pues el rango de hogares no identificados es de 0 a 3%. Por ejemplo, en
este caso se pierde 0.2% de los individuos lo cual significa una prdida de 0.3% de
los hogares.

Cuadro 1. Estadsticos

mun upm numviv


N Vlidos 2287816 2282362 2287816
Perdidos 0 5454 0

Una vez realizado el anlisis y revisado el rango de la variable que dio problemas
(de 1 a 9001), se aplica esa restriccin a la tabla para asegurarnos de trabajar exclusi-
vamente con datos vlidos (Figura 9):

Datos
Seleccionar casos
Si se satisface la condicin
Aceptar

Hecho lo anterior, ya se puede construir el identificador del hogar mismo al que


se denominar id, bajo el principio de que se asigna un nombre a una variable de

Aboites_PL05.indd 65 12/2/14 11:52 AM


Figura 9
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

66

manera que directa e inmediatamente nos remite a su significado e interpretacin,


independientemente de que podamos agregar una palabra o comentario que expli-
cite el tipo de variable y contenido de esta.

Es importante sealar que dependiendo de la versin de SPSS, el procedimiento


se realizar con el factor de ponderacin activado o desactivado. A partir de la ver-
sin 14 de SPSS se puede trabajar indistintamente; en cambio, con las anteriores, la
construccin del identificador debe realizarse sin el ponderador activo pues existe
el riesgo de corromper el archivo y perder la informacin.

Ahora bien, la base censal de 2000 se elabor considerando una representatividad


muestral de 10% para cada entidad federativa, mientras que en la de 2010, aunque se
mantuvo el criterio de 10% general, en cada entidad federativa se reportan porcenta-
jes de representatividad diferentes, lo que eventualmente puede generar problemas
cuando trabajamos con variables muy acotadas geoestadsticamente, por ejemplo,
al restringir la base para tener solo una poblacin que se dedique a la actividad eco-
nmica denominada avicultura y en localidades menores de 2!500 habitantes.

Como se dijo anteriormente, la informacin se puede agregar desde el nivel in-


dividuo hasta pas, pasando por hogar, comunidad, localidad, municipio, estado
o regin; pero el elemento clave de la agregacin recae en la variable jefe de ho-
gar, la cual es resultado de una definicin declarativa, es decir, fue la respuesta
de las personas adultas a la pregunta del cuestionario censal del INEGI aplicado en
cada hogar:

Por favor, dgame el nombre de las personas que viven en su hogar,


empezando por el jefe o la jefa; deme tambin el nombre de los nios
chiquitos y los ancianos (incluya a los sirvientes que duermen aqu).

Aboites_PL05.indd 66 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Por tanto, no tenemos elementos para establecer los criterios que en cada caso el
entrevistado utiliz para determinar quin era el jefe del hogar. Sin embargo, en

La construccin del dato, por ejemplo de la


general se asocia con la persona que ms ingresos aporta al hogar.

Otro convencionalismo en este archivo es que el dgito 999 significa no especifica-


do, de ah que cuando en un anlisis de frecuencia una variable adopta el valor de
999 significa no especificado o insuficientemente especificado.6

En el censo 2000, el archivo correspondiente a los datos de poblacin se organiz


con 73 variables y cada una poda adoptar diferentes valores, mismos que se pue-
den revisar en el Catlogo de codificacin del INEGI y puede ser descargado de
www.inegi.org.mx.

Antes de trabajar el archivo es conveniente revisar el cuestionario ampliado que se


utiliz para recabar la informacin censal en cada vivienda con el propsito de co-
nocer qu fue lo que se pregunt y las opciones utilizadas por el INEGI para capturar
la informacin, pues es frecuente cometer errores por la suposicin de significados. 67

Por ejemplo, la pregunta 5 del cuestionario ampliado es:

DERECHOHABIENCIA Tiene (NOMBRE) derecho a servicio mdico


en: el Seguro Social (IMSS)?...1; el ISSSTE?...2; Pemex, Defensa o
Marina?...3; otra institucin?______; Entonces, no tiene derecho a
servicio mdico...5

lo cual es muy diferente de la pregunta 8:

USO DE SERVICIOS DE SALUD. Cuando (NOMBRE) tiene problemas


de salud, en dnde se atiende? En el Seguro Social (IMSS)?...1; El
ISSSTE?...2; Pemex, Defensa o Marina?...3; En el Centro de Salud
(SSA)...4; En el IMSS-Solidaridad...5; En el consultorio, clnica u
hospital privado...6; En otro lugar _____; No se atiende...8

En ambos casos la respuesta refiere al servicio de salud, pero la pregunta 5 inquiere


por derechohabiencia y la 8 por la instancia a la que se recurre por atencin mdica.
El Cuadro 2, correspondiente al cruce de ambas variables, ilustra el punto al sealar
que nicamente 90.3% de las personas con derechohabiencia en el IMSS, censados
en el ao 2000 en Coahuila, acudieron a esa institucin, el resto se atendi en otras
instancias. Es decir, sin una comprensin cabal de cada pregunta se pueden ma-
linterpretar los datos.

6 De hecho, dependiendo de la pregunta, el dgito que representa no especificado puede variar,


pero en todos los casos se emplea el 9, 99, 999 hasta el 99999, este ltimo en referencia a la variable
ingreso personal.

Aboites_PL05.indd 67 12/2/14 11:52 AM


Cuadro 2. Tabla de contingencia sersalud * imss
Manejo de las bases de datos y la construccin

imss
Total
1 9
sersalud 1 Recuento 1277326 1070 1278396
de indicadores socioeconmicos

% dentro de imss 90,3% 4,0% 88,7%


2 Recuento 5914 158 6072
% dentro de imss ,4% ,6% ,4%
3 Recuento 59 212 271
% dentro de imss ,0% ,8% ,0%
4 Recuento 10076 703 10779
% dentro de imss ,7% 2,6% ,7%
5 Recuento 14251 398 14649
% dentro de imss 1,0% 1,5% 1,0%
6 Recuento 85944 17571 103515
% dentro de imss 6,1% 65,9% 7,2%
68 7 Recuento 3930 3193 7123
% dentro de imss ,3% 12,0% ,5%
8 Recuento 6174 155 6329
% dentro de imss ,4% ,6% ,4%
9 Recuento 11409 3202 14611
% dentro de imss ,8% 12,0% 1,0%
Total Recuento 1415083 26662 1441745
% dentro de imss 100,0% 100,0% 100,0%

Una lectura general de las variables incluidas nos indica la gama temtica que
podemos abordar, desde la demografa hasta la economa, con la posibilidad de
desagregar cada uno de los mbitos. Por ejemplo, en demografa se puede trabajar
crecimiento poblacional, migracin, esperanza de vida, fertilidad, natalidad o en
economa cuestiones generales como el ingreso de una poblacin hasta cuestiones
del mercado laboral.

Conforme avanzaron las versiones de SPSS fue posible automatizar el procedi-


miento, para lo cual se emplea la funcin concatenar. Veamos.

Lo primero es revisar el formato en el que se presentan las variables de la base de


datos, para lo cual seleccionamos Vista de variables, ubicada en la parte inferior
izquierda del monitor. Como puede apreciarse, las variables son de tipo cadena o
string y ninguna presenta datos perdidos (Figura 10).7

Para proceder a la construccin del indentificador del hogar se seleccio-


na Transformar y luego Calcular variable. En Variable de destino le indicamos
id_hogar, que es la clave que emplearemos para la construccin del identificador.

7 Las variables de la base censal 2000, que el INEGI venda en CD hace algunos aos, se daban en
formato numrico. Las descargas actuales de Internet proporcionan las variables en formato ca-
dena y por tanto hay que convertirlo a numrico para seguir este procedimiento.

Aboites_PL05.indd 68 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 10

La construccin del dato, por ejemplo de la


69

Se despliega la ventana Calcular variable: Tipo y eti... donde se inserta en Etiqueta


el texto Identificador de hogar y se activa en Tipo la opcin Cadena.

Despus, en Expresin de cadena se agrega la instruccin para concatenar selec-


cionando en Grupo de funciones la opcin Todo y luego en Funciones y variables
especiales la opcin Concat; bajo las teclas de las operaciones lgicas se indica para
qu sirve dicha funcin. Como puede verse, al activar Concat, en automtico apa-
rece un parntesis con dos signos de interrogacin y entre ellos una coma. Esto
indica que se pueden concatenar cuando menos dos variables o incluir tantas
como se necesiten separndolas con una coma (Figura 11).

Figura 11

Aboites_PL05.indd 69 12/2/14 11:52 AM


Con lo anterior tenemos la nueva variable, la cual aparece al final de la base de da-
Manejo de las bases de datos y la construccin

tos. Pero, cul puede ser la utilidad de disponer de esta nueva variable? Vamos a
ejemplicarlo mediante un ejercicio que consiste en calcular la variable Ingreso total
del hogar por concepto de salarios. Se trata de agregar todos los ingresos salariales
de los integrantes que hay en cada hogar, situacin que sera imposible de no con-
de indicadores socioeconmicos

tar con el identificador del hogar.

Para ello, primero se revisa el formato de la variable con Vista de variables; como
est en formato cadena se cambia a numrico dando un clic en Tipo, con lo cual
se despliega Tipo de variable y se selecciona Numrico, se da Aceptar (Figura 12).

Figura 12

70

Posteriormente se hace un anlisis de frecuencia de la variable ingresos, el que


arroja que existen 3!368 casos cuyos ingresos son de 999999, valor que el INEGI
considera como clave para los valores indeterminados, dado lo cual se debe truncar
la base de datos dejando como valor mximo posible el de 999998.

Para ello, en Vista de datos se selecciona Datos y se elige la opcin Seleccionar


casos para activar Si se satisface la condicin. Con clic en Si la op... se despliega
la ventana donde se inserta la instruccin para cortar la base de datos de acuerdo
con el criterio requerido, en este caso es que la variable ingresos sea <= 999998
(Figura 13).

Al finalizar lo anterior ya se pueden agregar los valores correspondientes a la va-


riable ingreso y se podr analizar cuntas personas aportan al ingreso salarial por
hogar. Asimismo, ser posible contrastar la situacin de las personas que reciben
salario y la de los hogares en los que existe al menos un aportante de ingreso por
concepto de salario.

Aboites_PL05.indd 70 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 13

La construccin del dato, por ejemplo de la


71
Para ello, nuevamente se abre Vista de datos y en Datos se selecciona Agregar;
en la pantalla que se despliega, en Variables de segmentacin, se introduce la
variable id_hogar previamente calculada, con lo cual estamos dando la instruccin
de que se agreguen nicamente los casos que tengan un valor idntico en la va-
riable de segmentacin. Despus, en Variables agregadas, se introduce la variable
ingresos y a continuacin se indica qu se har con esa variable para lo cual se ac-
tiva Funcin. En este caso se requiere realizar una suma (Figura 14). Al dar Aceptar
estar terminada la nueva variable ingreso total del hogar con base en el salario.

Y para poder realizar los anlisis correspondientes nicamente aplicamos el


factor de ponderacin de la base de datos, de manera que en lugar de tener in-
formacin de la muestra censal la informacin que trabajemos corresponda a la

Figura 14

Aboites_PL05.indd 71 12/2/14 11:52 AM


informacin censal total. Para esto se activa Datos y luego Ponderar casos, aunque
Manejo de las bases de datos y la construccin

previamente la variable Factor se debe convertir de formato cadena a numrico,


segn las instrucciones anteriormente sealadas.

A continuacin procederemos a realizar algunos ejercicios para familiarizarnos con


de indicadores socioeconmicos

el contenido de la base de datos censal y habilitarnos en el manejo de la misma.

Ejercicio 1

En este ejercicio se determinar el total de una poblacin y enseguida se identifica-


rn cuntos de ella son hombres y cuntas son mujeres. Despus se estratificar la
poblacin por rangos de edad a fin de construir una pirmide de poblacin. Sexo y
edad son las variables con las cuales vamos a trabajar.

La pregunta del cuestionario censal es:

72 Ahora le voy a preguntar por (NOMBRE) _________________


(NOMBRE) es mujer
(NOMBRE) es hombre
CIRCULE UN SOLO CDIGO
Hombre... 1
Mujer... 2
Cuntos aos cumplidos tiene (NOMBRE)?
MENOR DE UN AO, ANOTE 000

Para realizar el anlisis se procede de la siguiente manera:

Anlisis
Estadsticos descriptivos
Frecuencias
Se seleccionan las variables que se quiere trabajar y se da Aceptar (Figura 15)

La pantalla de resultados arroja la siguiente informacin:

Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado
102 17 .0 .0 99.8
103 37 .0 .0 99.8
104 18 .0 .0 99.8
105 6 .0 .0 99.8
115 44 .0 .0 99.8
123 19 .0 .0 99.8
999 5439 .2 .2 100.0
Total 2287816 100.0 100.0

Aboites_PL05.indd 72 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 15

La construccin del dato, por ejemplo de la


73

Eso indica que en el 2000 la poblacin en Coahuila era de 2!87!816 personas, de las
cuales 49.5% fue hombres y 50.5% mujeres, con edades de 0 a 123 aos cumplidos,
ms 5!439 personas que no respondieron, no se acordaron o no supieron contestar
a la pregunta de su edad, por lo cual el sistema los considera con el dgito 999.

Ahora bien, dado que la base original no presenta la variable edad estructurada en
rangos, es necesario construir una nueva variable. Para ello recodificamos la varia-
ble edad, siguiendo el siguiente procedimiento:

Transformar
Recodificar en distintas variables

Se selecciona la variable que queremos recodificar y se agrega en Variable numrica;


luego, en Variable de resultado se introduce el nombre o clave de la nueva variable,
en este caso edad_rango, y con clic en Cambiar se completa automticamente la
ventana. Posteriormente se abre Valores antiguos y nuevos donde se agregan los
dgitos originales en el lado izquierdo (Valor antiguo) y del lado derecho los valores
nuevos (Valor nuevo), para este caso tambin vamos a utilizar Rango para agregar
lo que necesitamos: los rangos de edad de cinco en cinco. Despus de introducir
cada rango y valor se pulsa Aadir para incorporar los cambios. Para finalizar se da
Continuar y luego Aceptar (Figura 16).

En la ventana de resultados aparece el recuadro siguiente:

Aboites_PL05.indd 73 12/2/14 11:52 AM


Figura 16
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

74

el cual nos indica la operacin que hemos realizado; esta se puede interpretar como
Recodificar la variable edad (0 hasta 4 = 1)... introduciendo el resultado en la nueva
variable edad_rango y ejecutar esa rutina.

Al contenido del recuadro se le conoce como sintaxis y representa un testimonio


de las instrucciones hemos dado para proceder con la base de datos. Ms adelante
ampliaremos la informacin a este respecto.

Al terminar la recodificacin se puede pedir un anlisis de frecuencia de la nueva


variable. Se procede como sigue.

Anlisis
Estadsticos descriptivos
Frecuencias
Se selecciona la variable edad_rango y se da Aceptar

Cuadro 3. edad_rango

Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado
Vlidos 1,00 250604 11.0 11.0 11.0

2,00 256327 11.2 11.2 22.2

3,00 239861 10.5 10.5 32.7

4,00 226084 9.9 9.9 42.6

5,00 221173 9.7 9.7 52.3

6,00 202888 8.9 8.9 61.2


(Contina)

Aboites_PL05.indd 74 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
(Continuacin)
Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado

La construccin del dato, por ejemplo de la


Vlidos 7,00 176218 7.7 7.7 68.9

8,00 158690 6.9 7.0 75.9

9,00 130664 5.7 5.7 81.6

10,00 100196 4.4 4.4 86.0

11,00 85823 3.8 3.8 89.8

12,00 64249 2.8 2.8 92.6

13,00 57101 2.5 2.5 95.1

14,00 41279 1.8 1.8 96.9

15,00 29793 1.3 1.3 98.2

16,00 20705 .9 .9 99.1

17,00 10453 .5 .5 99.6 75


18,00 6319 .3 .3 99.8

19,00 2662 .1 .1 99.9

20,00 1288 .1 .1 100.0

Total 2282377 99.8 100.0

Perdidos Sistema 5439 .2

Total 2287816 100.0

En este punto tenemos dos opciones. La primera es completar la base de datos y


establecer en ella las etiquetas correspondientes a cada dgito y rango, o editar el
cuadro de salida intercambiando el significado de los dgitos 1, 2, 3 20 por los ran-
gos a los que cada uno refiere, mismos a los que se puede recurrir en la sintaxis:

0 thru 4=1
5 thru 9=2
10 thru 14=3
15 thru 19=4
20 thru 24=5
25 thru 29=6
30 thru 34=7
35 thru 39=8
40 thru 44=9
45 thru 49=10
50 thru 54=11
55 thru 59=12
60 thru 64=13
65 thru 69=14
70 thru 74=15

Aboites_PL05.indd 75 12/2/14 11:52 AM


75 thru 79=16
Manejo de las bases de datos y la construccin

80 thru 84=17
85 thru 89=18
90 thru 94=19
95 thru 130=20
de indicadores socioeconmicos

En este caso es conveniente completar la base de datos para ajustarla a nuestras


necesidades con la ventaja de que, en teora, la informacin quedar guardada para
siempre. El procedimiento es el siguiente.

Damos clic en Vista de variables para desplegar las variables contenidas en la base
de datos. Luego colocamos el cursor en la celda correspondiente al rengln edad_
rango y a la columna Valores; en el recuadro que aparece se da un clic para abrir la
ventana Etiquetas de valor, en la que se introduce en Valor el dgito de un rango y
en Etiqueta su significado: 0 a 4 aos; se repite la operacin cuantas veces sea ne-
cesario con clic en Aadir en cada caso (Figura 17).
76

Figura 17

Al terminar se hace un anlisis de frecuencia de la nueva variable:

Anlisis
Estadsticos descriptivos
Frecuencias
Seleccionamos nuevamente la variable que se quiere trabajar: edad_rango.
(Figura 18)

As, tenemos una tabla que arroja la informacin solicitada y conoceremos los valores
absolutos y relativos correspondientes a cada rango de edad.

Aboites_PL05.indd 76 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Figura 18

La construccin del dato, por ejemplo de la


77

Cuadro 4. edad_rango

Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlidos 0 a 4 aos 250604 11.0 11.0 11.0
5 a 9 aos 256327 11.2 11.2 22.2
10 a 14 aos 239861 10.5 10.5 32.7
15 a 19 aos 226084 9.9 9.9 42.6
20 a 24 aos 221173 9.7 9.7 52.3
25 a 29 aos 202888 8.9 8.9 61.2
30 a 34 aos 176218 7.7 7.7 68.9
35 a 39 aos 158690 6.9 7.0 75.9
40 a 44 aos 130664 5.7 5.7 81.6
45 a 49 aos 100196 4.4 4.4 86.0
50 a 51 aos 85823 3.8 3.8 89.8
55 a 59 aos 64249 2.8 2.8 92.6
60 a 64 aos 57101 2.5 2.5 95.1
65 a 69 aos 41279 1.8 1.8 96.9
70 a 74 aos 29793 1.3 1.3 98.2
75 a 79 aos 20705 .9 .9 99.1
80 a 84 aos 10453 .5 .5 99.6
85 a 89 aos 6319 .3 .3 99.8
90 a 94 aos 2662 .1 .1 99.9
95 y ms aos 1288 .1 .1 100.0
Total 2282377 99.8 100.0
Perdidos Sistema 5439 .2
Total 2287816 100.0

Aboites_PL05.indd 77 12/2/14 11:52 AM


Para saber la distribucin de esos datos segn sexo haremos una tabla de contin-
Manejo de las bases de datos y la construccin

gencia, comnmente llamada cross section, con el siguiente procedimiento:

Analizar
Estadsticos descriptivos
de indicadores socioeconmicos

Tablas de contingencia
Se seleccionan las variables sexo y edad_rango ubicando la primera en
Columna y la segunda en Fila; clic en Aceptar.

Es importante destacar que invariablemente se debe seguir el criterio de ubicar en


Columna aquella variable que tiene menos variacin y en Fila la variable con mayor
variacin a fin de que la tabla de salida tenga un formato vertical, pues en general se
facilitan la impresin y la presentacin de resultados.

La tabla de salida es la siguiente:

78 Cuadro 5. Tabla de contingencia edad_rango * sexo


Recuento
sexo
Total
1 2
edad_rango 0 a 4 aos 127774 122830 250604
5 a 9 aos 129803 126524 256327
10 a 14 aos 121293 118568 239861
15 a 19 aos 113500 112584 226084
20 a 24 aos 109073 112100 221173
25 a 29 aos 98693 104195 202888
30 a 34 aos 84502 91716 176218
35 a 39 aos 76206 82484 158690
40 a 44 aos 64649 66015 130664
45 a 49 aos 48837 51359 100196
50 a 51 aos 41222 44601 85823
55 a 59 aos 31852 32397 64249
60 a 64 aos 28002 29099 57101
65 a 69 aos 19768 21511 41279
70 a 74 aos 14907 14886 29793
75 a 79 aos 10041 10664 20705
80 a 84 aos 4679 5774 10453
85 a 89 aos 2789 3530 6319
90 a 94 aos 1015 1647 2662
95 y ms aos 642 646 1288
Total 1129247 1153130 2282377

Aboites_PL05.indd 78 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
Como puede apreciarse, nicamente proporciona los valores absolutos; de estos
se pueden calcular los porcentajes o bien graficar la informacin. Elegir una cosa u

La construccin del dato, por ejemplo de la


otra depender de los requerimientos del investigador.

Para calcular los porcentajes se puede trabajar directamente en SPSS con los valores
absolutos. Se selecciona Casillas y luego se activan las opciones Fila, Columna y/o
Total dando a continuacin un clic en Continuar.

Para hacer una grfica de barras horizontal, se copia en Excel la tabla de salida con
los valores de hombres y mujeres, segn los rangos. En la hoja de clculo se utiliza
un truco sencillo para obtener la pirmide de poblacin: la columna 1 (hombres) se
multiplica por menos uno (-1) a fin de que adquiera valores negativos (Figura 19).

Figura 19

79

Ejercicio 2

A continuacin realizaremos un ejercicio de tipo econmico con el cual se calcu-


larn los montos y porcentajes de la poblacin segn su actividad econmica. Para
ello se determinar la poblacin econmicamente activa (PEA), la poblacin eco-
nmicamente ocupada (PO) y la poblacin econmicamente inactiva (PEI).

En general, se asume que la condicin de actividad (o tipo de actividad) es la rela-


cin entre cada persona y la actividad econmica corriente, determinada median-
te la cuantificacin de la poblacin econmicamente activa, considerando como
edad mnima los 12 aos cumplidos en adelante (Sucazes, 1999:312), aunque en
otros instrumentos de recoleccin de informacin, como la ENIGH, se considera
14 aos. Es interesante saber que a nivel internacional el criterio de los 12 aos es
predominante, aunque entre 12 y 15 aos la proporcin de personas es muy baja.8

8 Para este ejercicio se utiliza el criterio de 12 aos en virtud de que la Constitucin Poltica de los
Estados Unidos Mexicanos, de 1917 a 1972, estipulaba esa edad. Sin embargo, a partir de diciembre
de 1972 a junio del 2013 se estableci de 14 aos y desde el 30 de junio a la fecha (2014) de 15 aos.

Aboites_PL05.indd 79 12/2/14 11:52 AM


Las opciones, de acuerdo con el INEGI (2003), se expresan como sigue:
Manejo de las bases de datos y la construccin

Ocupacin principal
Horas trabajadas
Poblacin Situacin en el trabajo
de indicadores socioeconmicos

Econmicamente Ocupada Ingresos por trabajo


Activa Sector de actividad
Prestaciones laborales
Lugar de trabajo
Desocupada
Poblacin
Estudiante
de 12 aos
Poblacin Dedicada a los quehaceres del hogar
y ms
Econmicamente Jubilada o pensionada
Inactiva Incapacitada permanentemente para trabajar
Otro tipo de inactividad

Jubilacin o pensin
Con otros Ayuda de familiares
80 Otros ingresos Procampo o Progresa
ingresos Becas, rentas, intereses bancarios
Sin otros ingresos

Por otra parte, es fundamental tener claro el periodo de referencia al que se alude
cuando se indaga la PEA, pues incide en el monto de la poblacin ocupada o desocu-
pada e impacta al considerar los datos para formular polticas o acciones en materia
laboral. De ah la importancia de preguntar a los entrevistados si trabajaron en deter-
minado periodo o, en caso de negativa, si buscaron trabajo en otro momento, pues
la PEA se compone de los que trabajan y los que no trabajan pero buscaron empleo.

En el censo 2000, dos preguntas permiten construir la condicin de actividad, la 22


y la 23. Veamos.

22. CONDICIN DE ACTIVIDAD


La semana pasada (NOMBRE):
lea las opciones hasta obtener una respuesta afirmativa y circule un solo cdigo
Trabaj?... 1
tena trabajo, pero no trabaj?... 2
busc trabajo?... 3
Es estudiante?... 4
Se dedica a los quehaceres del hogar?... 5
Es jubilado o pensionado(a)?... 6
Est incapacitado(a) permanentemente para trabajar?... 7
No trabaja?... 8
23. VERIFICACIN DE ACTIVIDAD
Adems de (RESPUESTA DE 22), la semana pasada (NOMBRE):
lea las opciones hasta obtener una respuesta afirmativa y circule un solo cdigo
ayud en un negocio familiar?... 1
vendi algn producto?... 2

Aboites_PL05.indd 80 12/2/14 11:52 AM


variable hogar, en el censo de poblacin y vivienda
hizo algn producto para vender?... 3
ayud trabajando en el campo o en la cra de animales?... 4

La construccin del dato, por ejemplo de la


a cambio de un pago realiz otro tipo de actividad?... 5
Por ejemplo: lav o planch ajeno, cuid coches.
No trabaja?... 6

Es importante un anlisis detenido de estas preguntas para no cometer errores o al


menos saber lo que implican nuestras decisiones al momento de organizar datos.

Como hemos sealado, lo primero es pedir un anlisis de frecuencia de la variable.

Anlisis
Estadsticos descriptivos
Frecuencias
Se selecciona la variable conact

Debemos observar que la tabla de salida reporta nmeros con dos dgitos; uno de 81
ellos es el 99, el cual debe interpretarse como no especificado o insuficientemente
especificado y que representa el 0.4% del universo considerado (Cuadro 6).

Cuadro 6. conact

Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado
Vlidos 10 784119 34.3 46.6 46.6
13 1733 .1 .1 46.7
14 8516 .4 .5 47.2
15 24456 1.1 1.5 48.7
16 4222 .2 .3 48.9
18 8509 .4 .5 49.4
19 408 .0 .0 49.4
20 12849 .6 .8 50.2
30 10678 .5 .6 50.8
40 200670 8.8 11.9 62.8
50 351529 15.4 20.9 83.7
60 37515 1.6 2.2 85.9
70 8751 .4 .5 86.4
80 222468 9.7 13.2 99.6
99 6202 .3 .4 100.0
Total 1682625 73.5 100.0
Perdidos Sistema 605191 26.5
Total 2287816 100.0

Aboites_PL06.indd 81 12/2/14 11:53 AM


Generalmente estos datos se borran y no se consideran para efectos del anlisis
Manejo de las bases de datos y la construccin

pues resulta ms prctico. Tambin se pueden considerar pero habra que indicar
qu se hace con esos datos toda vez que no caben en ninguna de las opciones que
manejamos: PEA, PO ni PEI.
de indicadores socioeconmicos

En este ejercicio los borramos (tcnicamente se dice limpiar la variable). El proce-


dimiento es el siguiente.

Datos
Seleccionar casos

Activamos Si se satisface la condicin y damos clic en Si la op... para desplegar la


ventana Seleccionar casos: Si la opcin, en la cual se da doble clic a la variable de
inters para insertarla en el recuadro en blanco, esto tambin se puede hacer con
un clic en despus de seleccionar la variable.

82 Hecho lo anterior introducimos la instruccin requerida para restringir los valo-


res de la variable valindonos de los operadores lgicos del teclado virtual de la
pantalla o bien del teclado de la computadora. Finalmente damos clic en Aceptar
(Figura 20).

Figura 20

Al terminar nuevamente pedimos un anlisis de frecuencia de la variable conact.

Anlisis
Estadsticos descriptivos
Frecuencias
Seleccionamos la variable conact y damos Aceptar para confirmar la restric-
cin solicitada.

Aboites_PL06.indd 82 12/2/14 11:53 AM


variable hogar, en el censo de poblacin y vivienda
En la tabla de resultados puede apreciarse que efectivamente ya no aparece el dgito
99, con lo cual la variable conact queda de 10 a 80.

La construccin del dato, por ejemplo de la


Cuadro 7. conact, hasta dgito 80

Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado
Vlidos 10 784119 46.8 46.8 46.8

13 1733 .1 .1 46.9

14 8516 .5 .5 47.4

15 24456 1.5 1.5 48.8

16 4222 .3 .3 49.1

18 8509 .5 .5 49.6

19 408 .0 .0 49.6 83
20 12849 .8 .8 50.4

30 10678 .6 .6 51.0

40 200670 12.0 12.0 63.0

50 351529 21.0 21.0 84.0

60 37515 2.2 2.2 86.2

70 8751 .5 .5 86.7

80 222468 13.3 13.3 100.0

Total 1676423 100.0 100.0

Como se desprende de la pregunta 22 del censo de poblacin 2000, el significado


est dado por el primer dgito.

As sabemos que del 10 al 20 las personas trabajaron y en consecuencia son PO, es


decir, parte del PEA; que del 10 al 30 trabajaron o buscaron trabajo; sabemos que del
40 al 70 las personas estaban socialmente justificadas para no trabajar y no buscar
trabajo o sea que son catalogadas como PEI.

Sin embargo, surge la pregunta de cmo considerar a los 80, pues en estricto
sentido no se encuentran en una situacin que socialmente las justifique para
no trabajar o estar en busca de trabajo, de ah que escapan a nuestros criterios
de clasificacin.

En este caso las opciones son nuevamente dos: o las consideramos PEA o las
consideramos PEI. Ambas decisiones han sido utilizadas y por ende son correc-
tas siempre y cuando se haga explcito el razonamiento por el cual se tom una u
otra decisin.

Aboites_PL06.indd 83 12/2/14 11:53 AM


No obstante, es importante sealar que el tema rebasa por mucho las implicacio-
Manejo de las bases de datos y la construccin

nes de una decisin pragmtica u operativa, pues remite a lo que recientemente


en los medios de comunicacin han referido como poblacin nini (ni estudia ni
trabaja) y si revisamos su estructura de edad se puede comprender la magnitud de
su importancia.
de indicadores socioeconmicos

Para ello debemos proceder a restringir nuevamente la variable conact pero ahora
al dgito 80.

Datos
Seleccionar casos

Activamos Si se satisface la condicin y damos clic en Si la op... para desplegar la


ventana Seleccionar casos: Si la opcin, en la cual se da doble clic a la variable de
inters para insertarla en el recuadro en blanco o un clic en despus de seleccio-
nar la variable.
84
Hecho lo anterior introducimos la instruccin que requerimos, para restringir los
valores que deseamos tenga la variable, valindonos de los operadores lgicos que
se ubican en la ventana abierta. Y finalmente damos clic Aceptar (Figura 21).

Figura 21

Al terminar, pedimos un anlisis de tablas de contingencia con las variables edad


y sexo.

Anlisis
Estadsticos descriptivos
Tablas de contingencia
Se selecciona la variable edad y se ubica en Filas y sexo se coloca en Columnas

Aboites_PL06.indd 84 12/2/14 11:53 AM


variable hogar, en el censo de poblacin y vivienda
Con base en los resultados se puede discriminar an ms la informacin pues al
margen de la respuesta que registra la base censal, es claro que las personas con

La construccin del dato, por ejemplo de la


ms de cierta edad no tienen la fortaleza fsica para trabajar o buscar trabajo, es
decir, podemos incorporarlas a la PEI, mientras que el resto podra incluirse en
la PEA.

Sin embargo, socialmente es fundamental indagar por qu la variable conact 80


arroja que no estudiaba ni trabajaba ms del 51.87% de los hombres clasificados y
51.04% de las mujeres; es decir, por qu en el ao 2000 en Coahuila, en valores ab-
solutos, 51 345 hombres y 63 021 mujeres, ambos gneros de entre 12 y 30 aos, no
estudiaban ni trabajaban.

Con la informacin expuesta hasta el momento, podemos proceder a construir una


nueva variable que nos permita identificar de manera inmediata a las personas por
su condicin econmica segn PEA, PO y PEI, para ello procedemos a recodificar
la variable conact:
85
Transformar
Recodificar en distintas variables
Se selecciona la variable conact y a continuacin se asigna un nombre a la
nueva variable, a la que llamaremos condicion_act

Luego, en Valores antiguos y nuevos, se insertan en el lado derecho los valores an-
tiguos y en el izquierdo los valores que recodifican a los antiguos; clic en Continuar.
Al regresar a la pantalla original se da un clic en Aceptar.

Como se aprecia en la Figura 22, los 80 fueron incorporados a la PEA y no se consi-


dera el valor 99, es decir, se eliminaron esos casos de la base de datos.

Figura 22

Aboites_PL06.indd 85 12/2/14 11:53 AM


Finalmente, mediante esta recodificacin, al establecer quin es quin en materia
Manejo de las bases de datos y la construccin

de actividad econmica, podemos trabajar el cruce entre variables.

Cuadro 8. condicion_act
de indicadores socioeconmicos

Porcentaje Porcentaje
Frecuencia Porcentaje
vlido acumulado
Vlidos 1 844812 36.9 50.4 50.4

2 233146 10.2 13.9 64.3

3 598465 26.2 35.7 100.0

Total 1676423 73.3 100.0

Perdidos Sistema 611393 26.7

Total 2287816 100.0


86
Ejercicio 3

Vamos a trabajar ahora en la construccin de regiones mediante un identificador


regional, mismo al que llamaremos zms (zona metropolitana de Saltillo) compuesto
por los municipios de Saltillo, Ramos Arizpe, Arteaga y General Cepeda.

Lo primero que debemos hacer es revisar la variable mun.

Anlisis
Estadsticos descriptivos
Tablas de contingencia
Se selecciona la variable mun

Despus revisamos el Catlogo de Municipios para conocer el nmero que identifica


a cada uno de ellos: Saltillo (30), Ramos Arizpe (27), Arteaga (4) y General Cepeda (11).

Con base en esta informacin se construir un identificador regional que agrupa a


tales municipios.

Transformar
Calcular variable

En Variable de destino se agrega zms, que es el nombre que hemos dado al identi-
ficador y luego, en Expresin numrica, se incorpora el nmero 1 y se oprime Si la
opcin... en la parte inferior izquierda de la pantalla.

Se selecciona la opcin Incluir si el caso satisface la condicin y se introduce la res-


triccin, en este caso: (mun = 30) + (mun = 27) + (mun = 4) + (mun = 11) (Figura 23).

Aboites_PL06.indd 86 12/2/14 11:53 AM


variable hogar, en el censo de poblacin y vivienda
Figura 23

La construccin del dato, por ejemplo de la


87

Finalmente se hace un anlisis de frecuencia de la variable nueva para comprobar


que las instrucciones fueron ejecutadas segn lo requerimos.

Anlisis
Estadsticos descriptivos
Tablas de contingencia
Se selecciona la variable zms

De esta manera tenemos la posibilidad de realizar cuantos cruces de variables ne-


cesitemos entre la zms y cualquier municipio o el estado mismo. Igualmente, esta
operacin se puede realizar con estados diferentes y sus municipios; por ejem-
plo, se podra trabajar la regin La Laguna, que incluye municipios de Coahuila y
Durango, siempre y cuando se parta de una base que previamente tenga a ambos
estados, ya que de no ser as se tendra que utilizar un procedimiento de agregacin.

Aboites_PL06.indd 87 12/2/14 11:53 AM


4 Gilberto Aboites
Hctor Rodrguez
Francisco Martnez

Aboites_PL06.indd 88 12/2/14 11:53 AM


H ogar, familia
y su tipologa

!
89

E
n este captulo se analizan las posibilidades de estructu-
rar tipologas de hogar a partir de las variables que aporta el
XIII Censo General de Poblacin y Vivienda 2010, aunque
pudiera ampliarse a otras bases de datos socioeconmicas gene-
radas por el INEGI. Ello representa una necesidad para las ciencias
socioeconmicas en virtud de las mltiples transformaciones que
la demografa captura como descensos en la fecundidad y mor-
talidad, incrementos en la esperanza de vida al nacer, el envejeci-
miento poblacional, la intensa urbanizacin y la separacin entre
sexualidad y reproduccin, aspectos todos que denotan la primera
transicin demogrfica, mientras que los cambios de carcter cul-
tural en el hogar y la familia (Giddens, 1991; Jelin, 1998) remiten a
lo que se conoce como segunda transicin demogrfica (Ariza y
de Oliveira, 2001) que ahora el censo nos permite indagar, habida
cuenta de la incorporacin de nuevas variables respecto al de 2000.

Hoy convivimos con personas que habitan hogares sin la presencia del pap o la
mam u hogares donde los hijos no se emancipan; donde crecientemente la mu-
jer es responsable de mantenerlos, sola o acompaada de un familiar, por deci-
sin propia o por divorcio y de manera reiterada acompaada por un adulto mayor
(madre y/o padre); arreglos familiares que entrelazan historias truncadas: padres
divorciados que deciden juntarse, cada cual con sus hijos o incluso con la existen-
cia creciente de hogares unipersonales de jvenes y viejos (Giddens, 1991; Castells,
1996; Beck, 1998 y 2000; Jelin, 1998; Sunkel, 2006), que en conjunto refieren a reali-
dades sociales diferentes a lo que en sociologa Talcott Parsons supuso dominantes1

1 Male breadwinner model (Parsons y Bales, 1956).

Aboites_PL06.indd 89 12/2/14 11:53 AM


y que la tradicin jurdica de Mxico plasm en los cdigos civiles como normas
Manejo de las bases de datos y la construccin

que regulan a la familia y su funcin.

As, aunque la familia remite a estructuras sociales que organizan la convivencia, la


sexualidad y la procreacin (Jelin, 1998:21) eso tambin se ha transformado con el
de indicadores socioeconmicos

tiempo, de manera que no hay un nico modelo sino una diversidad de hogares y
familias, por lo cual el reto es capturar esa diversidad en cada poca social.

Para entender esa realidad, la antropologa ha desarrollado nuevas y ms comple-


jas taxonomas, por ejemplo matri y patrilinealidad, matri y patrilocalidad, linajes y
clanes, reglas de exogamia y endogamia, monogamia y poligamias/poligenias de
diversas formas (Jelin, 1998) y, desde otra perspectiva analtica, la economa y la
sociologa piensan esa diversidad mediante la construccin de nuevas tipologas
con las cuales comprenderla.

El documento se estructura en cuatro partes. La primera refiere a la presente in-


90 troduccin, despus el desarrollo temtico, las conclusiones y finalmente la des-
cripcin del procedimiento utilizado, referido al archivo sintaxis que genera la
utilizacin del software SPSS.

! Desarrollo temtico

Hasta hace poco, la informacin contenida en las bases de datos sociodemogr-


ficas de Mxico resultaba insuficiente para estudiar el tema hogar y familia y eran
escasas las publicaciones. En el recuento 2005, el INEGI seala que

en 1953 el Departamento de Muestreo de la Secretaria de Industria


y Comercio (sic) public Caractersticas de la poblacin del D.F.
y ms tarde, a solicitud de la Organizacin para la Agricultura y
la Alimentacin (FAO), un estudio sobre Ingresos y Egresos de la
poblacin de Mxico a nivel de vivienda, analizando el consumo
diario de caloras (1958). Dos aos despus el documento: Las 16
ciudades Principales de la Repblica Mexicana. Ingresos y Egresos
Familiares (1960). Aos despus se public La Encuesta Mexicana
de Fecundidad (1975) y Proyecciones de la Poblacin Mexicana (1978),
en la denominada Serie III. Evaluacin y Anlisis. Pero fue a raz del
Seminario de Anlisis del Censo de Poblacin y Vivienda, celebrado
en 1989, que se plante la realizacin de diferentes monografas con el
propsito de analizar los resultados censales y divulgar sus resultados.
As en 1997 se public el texto: Los hogares en Mxico, que era un
trabajo de tipo descriptivo donde a partir del nmero de miembros, del
tamao promedio y del tipo y clase de hogar se analiz la relacin entre
hogar y vivienda, entre hogares familiares y no familiares, adems de
escudriar la variable parentesco y por ese conducto clasificarlos en
completo, monoparental y sin ncleo familiar del jefe (INEGI, 2005).

Aboites_PL06.indd 90 12/2/14 11:53 AM


En referencia con jefe de hogar se analizaron las caractersticas de los hogares
y en particular la condicin de estos en trminos de gnero, edad, nivel de escola-
ridad, estado civil, condicin de actividad y tipo de ocupacin, culminando con el
anlisis de algunas caractersticas socioeconmicas del hogar, como el nivel pro-
medio de escolaridad de los miembros, el ingreso del hogar y las caractersticas de
los perceptores de ingreso.

Hogar, familia y su tipologa


Desde el mundo acadmico, Rodolfo Tuirn (1993) public, en cuanto a arreglos
familiares y residenciales se refiere, una clasificacin que distingua diez tipos de
hogar agrupados en cinco categoras bsicas (Cuadro 1), para lo cual utiliz los
datos de tres observaciones: la Encuesta Mexicana de Fecundidad (EMF, 1976), la
Encuesta Nacional Demogrfica (END, 1982) y la Encuesta Nacional de Fecundidad
y Salud (ENFES, 1987).

Cuadro 1. Tipologa de hogar Tuirn (1993)

Categoras bsicas de hogar Tipos de hogar 91


Nuclear estricto (pareja sin hijos)
1. Hogar nuclear Nuclear conyugal (pareja con hijos solteros)
Nuclear monoparental (jefe con hijos solteros)
Pareja sin hijos y otros parientes
Pareja con hijos solteros y otros parientes
2. Hogar extenso
Jefe con hijos solteros y otros parientes
Jefe con otros parientes
3. Hogar compuesto Hogar compuesto
4. Hogar unipersonal Hogar unipersonal
5. Hogar de corresidentes Hogar de corresidentes
Fuente: Elaboracin propia con base en Tuirn (1993:21).

En Mxico, la mayora de las bases de datos manejan una tipologa integrada por
cinco criterios: nuclear, ampliado, compuesto, unipersonal y de corresidentes,
misma que utiliza la Encuesta Nacional de Ingreso Gasto de los Hogares (ENIGH) y
en la que adems se agreg la opcin de agrupamiento Familiares no especificado
(Cuadro 2, Esquema 1).

Cuadro 2. Mxico. Tipologa de hogares


en las bases de datos en Mxico

1 Familiar nuclear
2 Familiar ampliado
3 Familiar compuesto
4 Familiar no especificado
5 No familiar unipersonal
6 No familiar de corresidentes
9 No especificado

Aboites_PL06.indd 91 12/2/14 11:53 AM


Esquema 1. Tipologa de hogares en las bases de datos en Mxico
Manejo de las bases de datos y la construccin

Nucleares
Familiares Ampliados
de indicadores socioeconmicos

Compuestos
Hogares

Unipersonales
No familiares
De corresidentes

Fuente: INEGI (2002). "Caractersticas del censo", Censo General de Poblacin y Vivienda 2000,
Mxico, p. 24.

La ENIGH trabaja la variable hogares a partir del:

92 tipo de relacin consangunea, legal, de afinidad o de costumbre


entre el jefe(a) y los otros integrantes del hogar, sin considerar a los
trabajadores domsticos y a los familiares de estos ni a los huspedes.
Se clasifican en: unipersonal: hogar formado por una sola persona
que es el jefe(a); nuclear: hogar constituido por un solo grupo familiar
primario; ampliado: hogar formado por el jefe(a) y su grupo familiar
primario ms otros grupos familiares u otros parientes; compuesto:
hogar formado por un hogar nuclear o ampliado con personas sin
parentesco con el jefe(a); corresidente: hogar formado por dos o ms
personas que no tienen parentesco con el jefe(a) (INEGI, 2011).

Y las bases de datos censales, aunque contienen las variables con las cuales estruc-
turar los hogares y las familias de forma similar a la ENIGH, se diferencian de esta
por el nivel de desagregacin de informacin que pueden ofrecer al mantener la
representatividad estadstica desde el nivel municipio y por agregacin estado y
nacin, con desagregacin rural/urbano. Sin embargo, en sus versiones digitales
solo estn disponibles los censos 2000 y 2010, si bien tambin pueden incluirse
los conteos de poblacin y vivienda 1995 y 2005, aunque estos nicamente tienen
representatividad estatal y por agregacin nacional.

Los censos han sufrido importantes modificaciones. Por ejemplo, el censo 2000
no dejaba trabajar la informacin a nivel hogar y solo fue posible hacerlo hasta que
Hctor Rodrguez desarroll un algoritmo para la construccin de hogares,2 y en la
ltima versin de 2010 quitaron la variable numhog con la cual se identificaban los
hogares principal y secundario. Adems, eliminaron la variable ingreso total per-
sonal intoper, dejando nicamente el ingreso por concepto de sueldos o salarios,
consecuentemente desapareci la cantidad monetaria atribuida a remesas nacio-

2 Ver captulo 3 del libro.

Aboites_PL06.indd 92 12/2/14 11:53 AM


nales e internacionales, pero en beneficio del censo 2010 se encuentra el hecho de
haber agregado las variables correspondientes a la presencia o no en el hogar de los
padres de quienes los habitan.

Los criterios de clasificacin, es decir de agrupamiento y diferenciacin de los ho-


gares, suponen diferentes situaciones de las personas que viven y se reproducen

Hogar, familia y su tipologa


dentro de un espacio fsico, al que llamamos vivienda y que cuando el propsito
de la convivencia es la reproduccin social y biolgica llamamos hogar y/o familia.

De acuerdo con Torrado (1981), la diferenciacin y agregacin se puede realizar en


trminos de hogares unipersonales o multipersonales, siendo estos ltimos los que
contendran el caso de los hogares familiares (Cuadro 3). Dado ese criterio (nmero
de integrantes) esa tipologa incluye las anteriormente sealadas, ya que en la op-
cin de varias personas se incluye a los hogares nucleares, extendidos y compues-
tos, llegando a contemplar 11 diferentes opciones de hogar (Cuadro 3).

Cuadro 3. Clasificacin segn composicin de los hogares particulares 93


(tema derivado que permite distribuir a la poblacin que vive en hogares
particulares en las clases excluyentes que se indican)

1. Hogares unipersonales a]
1.1. Hogar unipersonal
2. Hogares multipersonales a]-b]
2.1. Hogar nuclear c]
2.1.1. Matrimonio sin hijos
2.1.2. Matrimonio con hijo(s) soltero(s)
2.1.3. Uno de los progenitores con hijo(s) soltero(s)
2.2. Hogar extendido c]
2.2.1. Hogar nuclear con padres o suegros del jefe
exclusivamente
2.2.2. Hogar nuclear con al menos un ncleo familiar secundario
formado por un hijo casado del jefe, su cnyuge (yerno/nuera),
con o sin hijos (nietos), con o sin otros parientes del jefe
2.2.3. Hogar nuclear con otros parientes (excluidas las categoras
2.2.1. y 2.2.2.)
2.2.4. Hogar extendido sin ncleo familiar (grupo de personas
emparentadas no incluido en las categoras precedentes)
2.3. Hogar compuesto
2.3.1. Hogar nuclear con otros no parientes
2.3.2. Hogar extendido con otros no parientes
2.3.3. Hogar compuesto por personas no emparentadas entre s

Fuente: Torrado, S. (1981). Estrategias familiares de vida en Amrica latina: La familia como unidad
de investigacin censal (segunda parte), Notas de poblacin, Centro Latinoamericano de Demogra-
fa (CELADE), ao IX, nm. 27, San Jos, Costa Rica, diciembre, ISSS 0303-1829, p. 15.

Aboites_PL06.indd 93 12/2/14 11:53 AM


Aos despus, Barquero y Trejos (2004) manejaron 12 criterios de clasificacin
Manejo de las bases de datos y la construccin

(Cuadro 4), mismos que en general emplean las fuentes oficiales como CEPAL, es
decir, uno ms que en la tipologa de Torrado (1981) y dos ms que en la de Tuirn.
de indicadores socioeconmicos

Cuadro 4. Clasificacin segn composicin de los hogares particulares

Categora Criterio definicin


Jefe(a) y cnyuge, sin hijos, sin otros familiares y sin
1 Nuclear sin hijos
no familiares
Jefe(a), cnyuge e hijos, sin otros familiares
2 Nuclear con hijos
y sin no familiares
Jefe(a), sin cnyuge con hijos, sin otros familiares
3 Nuclear monoparental
y sin no familiares
Nuclear sin hijos, con otros familiares,
4 Extenso sin hijos
sin no familiares
94 Nuclear con hijos, con otros familiares,
5 Extenso con hijos
sin no familiares
Nuclear monoparental, con otros familiares,
6 Extenso monoparental
sin no familiares
Jefe(a), sin cnyuge y sin hijos, con otros familiares,
7 Extenso sin ncleo
sin no familiares
8 Compuesto nuclear Hogares nucleares, con otros no familiares
9 Compuesto extenso Hogares extensos, con otros no familiares
10 Compuesto sin ncleo Extenso sin ncleo, con otros no familiares
11 Unipersonal nicamente jefe(a)
12 No familiar Jefe(a) y no familiares

Fuente: Elaboracin propia con base en Barquero Barquero, J. y J. D. Trejos Solrzano (2004). Tipo
de hogar, ciclo de vida familiar y pobreza en Costa Rica 1987-2002, en revista electrnica Poblacin
y salud en Mesoamrica, Costa Rica, Centro Centroamericano de Poblacin Universidad de Costa
Rica, vol. 2, nm. 1, julio-diciembre: revistas.ucr.ac.cr/index.php/psm/article/view/13950

Como podr apreciarse, existen mltiples similitudes y algunas diferencias entre


las tipologas que nos hablan, ms que de criterios para clasificar, de los aspectos o
nfasis que los autores queran explicitar o enfatizar.

En cuanto a las similitudes puede decirse que todas diferencian hogar de familia
con base en el criterio parentesco, es decir, que solo hay familia cuando existen
relaciones de parentesco.

Todas deslindan los hogares en funcin del nmero de integrantes, si bien solo
Torrado (1981) lo explicita al contrastar hogares multipersonales y unipersonales,
mientras que en las otras se da por sentada esa diferencia. Un caso interesante es la
propuesta de Barquero y Trejos (2004), pues acotan la opcin al sealar nicamente
jefe(a); ya que es posible identificar hogares unipersonales en los que, adems del

Aboites_PL06.indd 94 12/2/14 11:53 AM


jefe de hogar, habita un trabajador. En general se asume que los trabajadores son
una categora excluida en la construccin de las tipologas de hogar, de la misma
manera que no se consideran al momento de calcular el nmero de personas por
hogar, pero ello no significa que no introduzcan una diferencia y que incluso esa
condicin aumente con el tiempo, pues en la cultura latinoamericana la idea de los
asilos o casas de retiro no est bien vista para los adultos mayores; en cambio, el he-

Hogar, familia y su tipologa


cho de que un adulto mayor viva sin parientes y acompaado por un empleado no
genera reaccin, como tampoco la genera un adulto mayor que se hace compaa
con una persona sin relacin de parentesco. Sin embargo, en esas circunstancias
cabra clasificar los hogares como corresidentes (Tuirn, 1993) o como Jefe(a) y no
familiares segn Barquero y Trejos (2004) o la opcin Hogar compuesto Hogar
compuesto por personas no emparentadas entre s que plante Torrado (1981) y
que la ENIGH incluye en la categora No familiar de corresidentes.

Todas coinciden en agrupar a los hogares nucleares, si bien Torrado (1981) introdu-
ce el matiz de la referencia al matrimonio y no nicamente la referencia a la pareja
(cuadros 1, 2, 3 y 4), as como introduce la referencia al progenitor con hijo soltero, 95
mientras que Tuirn y Barquero y Trejo hablan de hogar nuclear monoparental.

Las diferencias principales se concentran en la categora de hogar extenso o exten-


dido, pues aunque todas parten de un hogar nuclear en cualquiera de sus categoras
introducen matices y precisiones que las diferencian entre s. En particular Torrado
(1981) en la categora Hogar nuclear con padres o suegros del jefe exclusivamente
acota la convivencia del hogar nuclear a estar con padres o suegros, con lo cual la
integracin con otros parientes la considera aparte.

Las otras tipologas aunque contemplan esa posibilidad, no especifican que sean
suegros o padres del jefe. El matiz es interesante, pues dentro de los hogares ex-
tensos la convivencia con padres o suegros est aumentando y reestructurando la
vida familiar al introducir cambios importantes, por ejemplo, en la transmisin de
los valores sociales y tambin en trminos de los roles sociales que los actores jue-
gan dentro del hogar para consolidar la idea de un rol secundario hacia los adultos
mayores (Aboites et al., 2011).

Otro deslinde de Torrado (1981) es referirse al Hogar nuclear con al menos un otro
ncleo familiar secundario formado por un hijo casado del jefe, su cnyuge (yerno/
nuera), con o sin hijos (nietos), con o sin otros parientes del jefe. Eso permite dife-
renciar los hogares extensos, inquiriendo especficamente por los hogares donde
los hijos casados comparten la vivienda paterna, pues aunque en las otras tipologas
es factible calificarlos no refieren a una categora que los deslinde, lo cual refiere a
propsitos diferentes entre los autores, donde claramente Torrado (1981) concentra
la atencin en dos fenmenos sociales que comenzaban a descollar en la vida fa-
miliar de los pases latinoamericanos, a saber, la configuracin de hogares extensos
urbanos, incorporando padres, suegros e hijos que conviven con sus nuevos hoga-
res al interior del hogar paterno, situacin que en la literatura se ha vinculado con
las estrategias de vida para sortear los aos de crisis y dcadas perdidas.

Aboites_PL06.indd 95 12/2/14 11:53 AM


En sntesis, siempre que se trabaja en la construccin de una tipologa se debe tener
Manejo de las bases de datos y la construccin

primero claridad respecto a los propsitos de esta y con base en ello procurar es-
tructurar los datos empricos dentro de los estancos heursticos que supone siem-
pre ese instrumento.
de indicadores socioeconmicos

! Procedimiento para la construccin de una tipologa

A continuacin se presenta la sintaxis utilizada, advirtiendo que la visualizacin del


archivo difiere del formato texto desarrollado en extenso, sin embargo, es perfecta-
mente factible transcribirlo tal cual al archivo sintaxis y proceder a correrlo.

XII Censo General de Poblacin y Vivienda 2000 (Figura 2)

*********************************
*********************************
CENSO DE POBLACIN Y VIVIENDA 2000.
96 ***********************************
****************************************
*****************************************

GET FILE=C:\Users\gilberto\Documents\BASES DE DATOS\CENSO 2000\


Aguascalientes-Guerrero\COAHUILA2000.sav.
DATASET NAME Conjunto_de_datos1 WINDOW=FRONT.

*Lo primero es construir el id Identificador del hogar.

DATASET ACTIVATE Conjunto_de_datos1.


COMPUTE id=(mun * 10000000000) + (upm * 100000) + (numviv) +
(100000000000000).

Figura 2

Aboites_PL06.indd 96 12/2/14 11:53 AM


VARIABLE LABELS id Identificador de hogar.
EXECUTE.

*Despus, dado que la base de datos del Censo 2000 no tiene etiquetadas las
variables, ni tampoco tiene el valor relacionado a cada opcin se agregan.
VARIABLE LABELS otropare Otro parentesco.

Hogar, familia y su tipologa


VALUE LABELS otropare
100 JEFE O JEFA
200 ESPOSA(O)
300 HIJO(A)
401 TRABAJADOR(A) DOMESTICO(A)
402 RECAMARERA(O)
403 COCINERO(A)
404 LAVANDERA(O)
405 NIERA(O)
406 MOZO
97
407 JARDINERO
408 VELADOR
409 PORTERO(A)
410 CHOFER
411 AMA DE LLAVES
412 MAYORDOMO
420 ESPOSA(O) DEL (LA) SIRVIENTE(A)
430 HIJO(A) DEL(LA) SIRVIENTE(A)
440 OTROS PARIENTES DE LOS SIRVIENTES
501 NO TIENE PARENTESCO
502 AMIGO(A)
503 EX-ESPOSO(A)
601 MADRE O PADRE
602 MADRASTRA O PADRASTRO
603 HERMANO(A)
604 HERMANASTRO(A)
605 ABUELO(A)
606 BISABUELO(A)
607 TATARABUELO(A)
608 NIETO(A)
609 BISNIETO(A)
610 TATARANIETO(A)
611 TIO(A)
612 SOBRINO(A)
613 PRIMO(A)
614 SUEGRO(A)
615 CONSUEGRO(A)
616 NUERA O YERNO
617 CUADO(A)

Aboites_PL07.indd 97 12/2/14 11:53 AM


618 CONCUO(A)
Manejo de las bases de datos y la construccin

619 TUTOR(A)
620 TUTELADO(A)
621 PADRINO O MADRINA
622 AHIJADO(A)
de indicadores socioeconmicos

623 COMPADRE O COMADRE


624 OTRO PARENTESCO
999 NO ESPECIFICADO.

*Ahora vamos a construir la variable dicotmica esposa.

USE ALL.
COMPUTE filter_$=(otropare = 200).
VARIABLE LABELS filter_$ otropare = 200 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
98 FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
SORT CASES BY id.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\esposa.sav
/PRESORTED
/BREAK=id
/esposa=NU(otropare).
DELETE VARIABLE filter_$.
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\esposa.sav
/BY id.
EXECUTE.
RECODE esposa (1 thru 999=1) (ELSE=0).
EXECUTE.

*Ahora vamos a construir la variable dicotmica hijo.

USE ALL.
COMPUTE filter_$=(otropare = 300).
VARIABLE LABELS filter_$ otropare = 300 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
SORT CASES BY id.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\hijo.sav
/PRESORTED

Aboites_PL07.indd 98 12/2/14 11:53 AM


/BREAK=id
/hijo=NU(otropare).
DELETE VARIABLE filter_$.
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\hijo.sav
/BY id.

Hogar, familia y su tipologa


EXECUTE.
RECODE hijo (1 thru 999=1) (ELSE=0).
EXECUTE.

*Ahora vamos a construir la variable dicotmica no_pariente.

USE ALL.
COMPUTE filter_$=(otropare >= 501 & otropare <= 503).
VARIABLE LABELS filter_$ otropare >= 501 & otropare <= 503 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected. 99
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\no_pariente.sav
/PRESORTED
/BREAK=id
/no_pariente=NU(otropare).
DELETE VARIABLE filter_$.
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\no_pariente.sav
/BY id.
EXECUTE.
RECODE no_pariente (1 thru 999=1) (ELSE=0).
EXECUTE.

*Ahora vamos a construir la variable dicotmica pariente.

USE ALL.
COMPUTE filter_$=(otropare >= 601 & otropare <= 624).
VARIABLE LABELS filter_$ otropare >= 601 & otropare <= 624 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\pariente.sav
/PRESORTED
/BREAK=id

Aboites_PL07.indd 99 12/2/14 11:53 AM


/pariente=NU(otropare).
Manejo de las bases de datos y la construccin

DELETE VARIABLE filter_$.


MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\pariente.sav
/BY id.
de indicadores socioeconmicos

EXECUTE.
RECODE pariente (1 thru 999=1) (ELSE=0).
EXECUTE.
*****************

DATASET ACTIVATE Conjunto_de_datos1.


IF ((esposa = 1 & hijo = 0 & no_pariente = 0 & pariente = 0)) Tip_1=1.
EXECUTE.
IF ((esposa = 1 & hijo = 1 & no_pariente = 0 & pariente = 0)) Tip_2=2.
EXECUTE.
100 IF ((esposa = 0 & hijo = 1 & no_pariente = 0 & pariente = 0)) Tip_3=3.
EXECUTE.
IF ((esposa = 1 & hijo = 0 & no_pariente = 0 & pariente = 1)) Tip_4=4.
EXECUTE.
IF ((esposa = 1 & hijo = 1 & no_pariente = 0 & pariente = 1)) Tip_5=5.
EXECUTE.
IF ((esposa = 0 & hijo = 1 & no_pariente = 0 & pariente = 1)) Tip_6=6.
EXECUTE.
IF ((esposa = 0 & hijo = 0 & no_pariente = 0 & pariente = 1)) Tip_7=7.
EXECUTE.
IF ((esposa = 1 & hijo = 1 & no_pariente = 1 & pariente = 0)) Tip_8=8.
EXECUTE.
IF ((esposa = 1 & hijo = 1 & no_pariente = 1 & pariente = 1)) Tip_9=9.
EXECUTE.
IF ((esposa = 0 & hijo = 0 & no_pariente = 1 & pariente = 1)) Tip_10=10.
EXECUTE.
IF ((esposa = 0 & hijo = 0 & no_pariente = 0 & pariente = 0)) Tip_11=11.
EXECUTE.
IF ((esposa = 0 & hijo = 0 & no_pariente = 1 & pariente = 0)) Tip_12=12.
EXECUTE.
RECODE Tip_1 Tip_2 Tip_3 Tip_4 Tip_5 Tip_6 Tip_7 Tip_8 Tip_9 Tip_10 Tip_11
Tip_12 (SYSMIS=0).
EXECUTE.
COMPUTE tip_hogar=Tip_1 + Tip_2 + Tip_3 + Tip_4 + Tip_5 + Tip_6 + Tip_7 +
Tip_8 + Tip_9 + Tip_10 + Tip_11 + Tip_12.
EXECUTE.

*Nota: Al haber excluido a los trabajadores y a los no especificados implica que


quedar un residuo sin clasificacin.

Aboites_PL07.indd 100 12/2/14 11:53 AM


VARIABLE LABELS tip_hogar Tipologia de hogar desagregada.
VALUE LABELS tip_hogar
11 Unipersonal
1 Nuclear sin hijos
2 Nuclear con hijos
3 Nuclear monoparental

Hogar, familia y su tipologa


4 Extenso sin hijos
5 Extenso con hijos
6 Extenso monoparental
7 Extenso sin ncleo
8 Compuesto nuclear
10 Compuesto extenso
12 Compuesto sin ncleo.
WEIGHT BY factor.
FREQUENCIES VARIABLES=tip_hogar
/ORDER=ANALYSIS. 101
WEIGHT OFF.

XII Censo General de Poblacin y Vivienda 2010 (Figura 3)

*********************************
*CENSO DE POBLACIN Y VIVIENDA 2010.
***********************************
****************************************
*****************************************
****************************
GET

Figura 3

Aboites_PL07.indd 101 12/2/14 11:53 AM


FILE=C:\Users\gilberto\Documents\BASES DE DATOS\MICRODATOS CENSALES
Manejo de las bases de datos y la construccin

2010\COAHUILA\Personas_05.sav.
DATASET NAME Conjunto_de_datos1 WINDOW=FRONT.

*************************
de indicadores socioeconmicos

*TIPOLOGIA DE HOGAR.
********************
*Construccin de variables de exclusin y agregacin.
********************

*ESPOSA.
***********.
DATASET ACTIVATE Conjunto_de_datos1.
USE ALL.
COMPUTE esposa=(PARENT = 02 & (otropare_c <= 399 | otropare_c >= 500)).
FORMATS esposa (f1.0).
102
FILTER BY esposa.
EXECUTE.
SORT CASES BY id_viv.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\esposa2010.sav
/PRESORTED
/BREAK=id_viv
/esposa=NU(parent).
DELETE VARIABLE esposa.
SORT CASES BY id_viv(A).
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\esposa2010.sav
/BY id_viv.
EXECUTE.
RECODE esposa (1 thru 9=1) (ELSE=0).
EXECUTE.

*HIJOS.
***********
DATASET ACTIVATE Conjunto_de_datos1.
USE ALL.
COMPUTE hijos=(PARENT = 03 & (otropare_c <= 399 | otropare_c >= 500)).
FORMATS hijos (f1.0).
FILTER BY hijos.
EXECUTE.
SORT CASES BY id_viv.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\hijos2010.sav
/PRESORTED

Aboites_PL07.indd 102 12/2/14 11:53 AM


/BREAK=id_viv
/hijos=NU(parent).
DELETE VARIABLE hijos.
SORT CASES BY id_viv(A).
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\hijos2010.sav

Hogar, familia y su tipologa


/BY id_viv.
EXECUTE.
RECODE hijos (1 thru 15=1) (ELSE=0).
EXECUTE.

*OTRO PARENTESCO.
***********
DATASET ACTIVATE Conjunto_de_datos1.
USE ALL.
COMPUTE otro_p=(PARENT = 04 | PARENT = 05 | PARENT = 06 | PARENT = 07 103
| PARENT = 08 & (otropare_c <= 399 | otropare_c >= 500)).
FORMATS otro_p (f1.0).
FILTER BY otro_p.
EXECUTE.
SORT CASES BY id_viv.
AGGREGATE
/OUTFILE=C:\Users\gilberto\Documents\otro_p2010.sav
/PRESORTED
/BREAK=id_viv
/otro_p=NU(parent).
DELETE VARIABLE otro_p.
SORT CASES BY id_viv(A).
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\otro_p2010.sav
/BY id_viv.
EXECUTE.
RECODE otro_p (1 thru 15=1) (ELSE=0).
EXECUTE.

*SIN PARENTESCO.
***********
DATASET ACTIVATE Conjunto_de_datos1.
USE ALL.
COMPUTE sin_p=(PARENT = 09 | PARENT = 99 & (otropare_c <= 399 |
otropare_c >= 500)).
FORMATS sin_p (f1.0).
FILTER BY sin_p.
EXECUTE.
SORT CASES BY id_viv.

Aboites_PL07.indd 103 12/2/14 11:53 AM


AGGREGATE
Manejo de las bases de datos y la construccin

/OUTFILE=C:\Users\gilberto\Documents\sin_p2010.sav
/PRESORTED
/BREAK=id_viv
/sin_p=NU(parent).
de indicadores socioeconmicos

DELETE VARIABLE sin_p.


SORT CASES BY id_viv(A).
MATCH FILES /FILE=*
/TABLE=C:\Users\gilberto\Documents\sin_p2010.sav
/BY id_viv.
EXECUTE.
RECODE sin_p (1 thru 15=1) (ELSE=0).
EXECUTE.
DELETE VARIABLE filter_$.
IF (esposa = 1 & hijos = 0 & sin_p= 0 & otro_p = 0) NUCLEAR1=1.
104 EXECUTE.
IF (Esposa = 1 & hijos = 1 & sin_p = 0 & otro_p = 0) NUCLEAR2=2.
EXECUTE.
IF (Esposa = 0 & hijos = 1 & sin_p = 0 & otro_p = 0) NUCLEAR3=3.
EXECUTE.
IF (Esposa = 1 & hijos = 0 & sin_p = 0 & otro_p = 1) NUCLEAR4=4.
EXECUTE.
IF (Esposa = 1 & hijos = 1 & sin_p = 0 & otro_p = 1) NUCLEAR5=5.
EXECUTE.
IF (Esposa = 0 & hijos = 1 & sin_p = 0 & otro_p = 1) NUCLEAR6=6.
EXECUTE.
IF (Esposa = 0 & hijos = 0 & sin_p = 0 & otro_p = 1) NUCLEAR7=7.
EXECUTE.
IF (Esposa = 1 & hijos = 1 & sin_p = 1 & otro_p = 0) NUCLEAR8=8.
EXECUTE.
IF (Esposa = 1 & hijos = 1 & sin_p = 1 & otro_p = 1) NUCLEAR9=9.
EXECUTE.
IF (Esposa = 0 & hijos = 0 & sin_p = 1 & otro_p = 1) NUCLEAR10=10.
EXECUTE.
IF (Esposa = 0 & hijos = 0 & sin_p = 0 & otro_p = 0) NUCLEAR11=11.
EXECUTE.
IF (Esposa = 0 & hijos = 0 & sin_p = 1 & otro_p = 0) NUCLEAR12=12.
EXECUTE.

RECODE NUCLEAR1 NUCLEAR2 NUCLEAR3 NUCLEAR4 NUCLEAR5 NUCLEAR6


NUCLEAR7 NUCLEAR8 NUCLEAR9 NUCLEAR10
NUCLEAR11 NUCLEAR12 (SYSMIS=0).
EXECUTE.
COMPUTE tipohog=NUCLEAR1 + NUCLEAR2 + NUCLEAR3 + NUCLEAR4 +
NUCLEAR5 + NUCLEAR6 + NUCLEAR7 +NUCLEAR8

Aboites_PL07.indd 104 12/2/14 11:53 AM


+NUCLEAR9 + NUCLEAR10 + NUCLEAR11 + NUCLEAR12.
EXECUTE.
VARIABLE LABELS tipohog.
VALUE LABELS tipohog
1 NUCLEAR SIN HIJOS
2 NUCLEAR CON HIJOS

Hogar, familia y su tipologa


3 NUCLEAR MONOPARENTAL
4 EXTENSO SIN HIJOS
5 EXTENSO CON HIJOS
6 EXTENSO MONOPARENTAL
7 EXTENSO SIN NUCLEO
8 COMPUESTO NUCLEAR
9 COMPUESTO EXTENSO
10 COMPUESTO SIN NUCLEO
11 UNIPERSONAL
12 NO FAMILIAR. 105
FREQUENCIES VARIABLES=tipohog
/ORDER=ANALYSIS.

DELETE VARIABLES esposa hijos otro_p sin_p NUCLEAR1 NUCLEAR2 NUCLEAR3


NUCLEAR4 NUCLEAR5
NUCLEAR6 NUCLEAR7 NUCLEAR8 NUCLEAR9 NUCLEAR10 NUCLEAR11
NUCLEAR12.

*Adems, para analizar parte de la complejidad del nuevo hogar es importante


conocer si los hijos son hijos de ambos padres o de alguno de ellos, de manera
que apreciemos los nuevos arreglos del hogar.
****************

DELETE VARIABLE filter_$.


DATASET ACTIVATE Conjunto_de_datos1.
STRING paren_idmad (A8).
COMPUTE paren_idmad=CONCAT(PARENT,IDMADREC).
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
USE ALL.
COMPUTE filter_$=(PARENT = 03 & IDMADRE = 02 & IDPADRE = 01).
VARIABLE LABELS filter_$ PARENT = 03 & IDMADRE = 02 & IDPADRE = 01
(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
RECODE filter_$ (1=1) (ELSE=0) INTO hijos_tipo1.
EXECUTE.

Aboites_PL07.indd 105 12/2/14 11:53 AM


FILTER OFF.
Manejo de las bases de datos y la construccin

USE ALL.
EXECUTE.
*Esto permite identificar a los hijos de la mam y pap que viven en el mismo
hogar. Seran un hogar con ncleo.
de indicadores socioeconmicos

USE ALL.
COMPUTE filter_$=(PARENT = 03 & IDMADRE = 02 & IDPADREC = 88).
VARIABLE LABELS filter_$ PARENT = 03 & IDMADRE = 02 & IDPADREC = 88
(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
RECODE filter_$ (1=2) (ELSE=0) INTO hijos_tipo2.
106 EXECUTE.
FILTER OFF.
USE ALL.
EXECUTE.
DELETE VARIABLE filter_$.
* Esto permite identificar a los hijos de la mam pero no del pap que viven
en el hogar.

USE ALL.
COMPUTE filter_$=(PARENT = 03 & IDMADREC = 88 & IDPADRE = 01).
VARIABLE LABELS filter_$ PARENT = 03 & IDMADREC = 88 & IDPADRE = 01
(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
RECODE filter_$ (1=3) (ELSE=0) INTO hijos_tipo3.
EXECUTE.
FILTER OFF.
USE ALL.
EXECUTE.
DELETE VARIABLE filter_$.
* Esto permite identificar a los hijos del pap pero no de la mam que viven
en el hogar.

USE ALL.
COMPUTE filter_$=(PARENT = 03 & IDMADREC = 88 & IDPADREC = 88).
VARIABLE LABELS filter_$ PARENT = 03 & IDMADREC = 88 & IDPADREC = 88
(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.

Aboites_PL07.indd 106 12/2/14 11:53 AM


FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
RECODE filter_$ (1=4) (ELSE=0) INTO hijos_tipo4.
EXECUTE.
FILTER OFF.

Hogar, familia y su tipologa


USE ALL.
EXECUTE.
DELETE VARIABLE filter_$.
* Esto permite identificar a los hijos que no son del pap ni de la mam de ese
hogar.

*********************************************
*Symbol Definition
*EQ or = Equal to
*NE or ~= or = or <> Not equal to
107
*LT or < Less than
*LE or <= Less than or equal to
*GT or > Greater than
*GE or >= Greater than or equal to
*************************************

IF (SEXO = 1 & PARENT = 01) jefe1=1.


EXECUTE.
IF (SEXO = 3 & PARENT = 01) jefe2=3.
EXECUTE.
IF (SEXO = 1 & PARENT = 02) conyuge1=1.
EXECUTE.
IF (SEXO = 3 & PARENT = 02) conyuge2=3.
EXECUTE.
RECODE jefe1 jefe2 conyuge1 conyuge2 (SYSMIS=0).
EXECUTE.
WEIGHT OFF.
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES
/BREAK=ID_VIV
/jefe1_sum=SUM(jefe1).
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES
/BREAK=ID_VIV
/jefe2_sum=SUM(jefe2).

AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES

Aboites_PL07.indd 107 12/2/14 11:53 AM


/BREAK=ID_VIV
Manejo de las bases de datos y la construccin

/conyuge1_sum=SUM(conyuge1).
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES
/BREAK=ID_VIV
de indicadores socioeconmicos

/conyuge2_sum=SUM(conyuge2).

COMPUTE pareja=jefe1_sum + jefe2_sum + conyuge1_sum + conyuge2_sum.


EXECUTE.

USE ALL.
COMPUTE filter_$=(PARENT = 01 ).
VARIABLE LABELS filter_$ PARENT = 01 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
108 FILTER BY filter_$.
EXECUTE.

DATASET ACTIVATE Conjunto_de_datos1.


FREQUENCIES VARIABLES=tipohog
/ORDER=ANALYSIS.
*termina tipologia.
**************************
*********************************
*Identificacin de hogar principal y secundario.
*************************************

RECODE PARENT (01=01) (05=02) (06=02) (07=02) INTO tiphog.


EXECUTE.
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES
/BREAK=ID_VIV
/tipo_hog=NU(tiphog).

VARIABLE LABELS tipo_hog Tipo de hogar.


VALUE LABELS tipo_hog
1 Hogar principal
2 Hogar secundario
3 Hogar secundario
4 Hogar secundario
5 Hogar secundario
6 Hogar secundario
7 Hogar secundario
8 Hogar secundario

Aboites_PL07.indd 108 12/2/14 11:53 AM


9 Hogar secundario.

USE ALL.
COMPUTE filter_$=(PARENT = 01 ).
VARIABLE LABELS filter_$ PARENT = 01 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.

Hogar, familia y su tipologa


FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
WEIGHT BY FACTOR.
FREQUENCIES VARIABLES=tipo_hog
/ORDER=ANALYSIS.
DELETE VARIABLE filter_$.

109

Aboites_PL07.indd 109 12/2/14 11:53 AM


5 Juana Delgadillo*
Gilberto Aboites
Nora Garro

* La base de este captulo corresponde a la tesis de maestra en Economa


Regional presentada por la autora, bajo la direccin de los coautores.
E-mail: jdelgadillob@gmail.com

Aboites_PL07.indd 110 12/2/14 11:53 AM


S
egregacin

ocupacional

por gnero:

herramientas

de medicin

111

! Introduccin

L
a segregacin ocupacional por gnero se refiere a la propen-
sin de que hombres y mujeres se empleen en ocupaciones
diferentes y, en general, redunda en una fuerte concentra-
cin laboral de las mujeres dentro de una reducida cantidad de
ocupaciones caracterizadas por presentar los salarios ms bajos
del mercado laboral. Esta situacin refuerza el que su participacin
sea claramente ms baja que la de los hombres, ya que percibir
salarios as, debilita las aspiraciones de una incorporacin en el
mercado productivo y es uno de los principales componentes de
las restricciones en el acceso a oportunidades de trabajo mejor,
dado lo cual la OECD (2013:198) se refiere a ella como fallos del
mercado y de las instituciones. Por ejemplo, en 2010 las mujeres
representaban 34.88% de la poblacin ocupada en Mxico y esta-
ban concentradas en cinco de las cincuenta y dos ocupaciones
analizadas en el XIII Censo de Poblacin y Vivienda; adems, casi
48% trabajaba en ocupaciones cuyos salarios por hora estaban por
debajo del promedio nacional.

Se aborda el problema desde dos perspectivas analticas, a saber, la oferta y la de-


manda laboral. La primera se refiere a las preferencias de las mujeres por cierto tipo
de ocupaciones, adecuadas a los roles que ellas desempean en el mbito fami-
liar; mientras que la demanda refiere a las preferencias que se tiene por contratar
a hombres o mujeres para ciertas ocupaciones (Anker, 1997:14). Sin embargo, en
ambas se ha recurrido a instrumentos analticos similares, dado lo cual en este ca-
ptulo se presenta, de manera sinttica y didctica, el procedimiento para calcular

Aboites_PL07.indd 111 12/2/14 11:53 AM


los indicadores empleados en el anlisis de la segregacin ocupacional por gnero,
Manejo de las bases de datos y la construccin

tomando como estudio de caso a Mxico y en particular la informacin estadstica


censal de 2010.

El documento se estructura en cuatro partes. La primera refiere a la presente intro-


de indicadores socioeconmicos

duccin, seguida por la metodologa, resultados y el archivo sintaxis que genera la


utilizacin del software SPSS.

! Metodologa

De acuerdo con la literatura (vase en el Anexo el Cuadro A1), los principales m-


todos de anlisis de la participacin femenina en el mercado laboral remiten a los
siguientes instrumentos:

Tasa de representacin (TR)


112 ndice de segregacin parcial (ISP)
ndice de disimilitud (ID) (Duncan y Duncan, 1955)
Indicador de segregacin de Moir y Selby Smith (MSS o WE)
ndice de Mac Lachlan (IP)

A continuacin se describe cada uno a la vez que se indica la importancia de


su utilizacin.

Tasa de representacin

Esta herramienta permite mostrar cmo est distribuida la participacin de las


mujeres en las distintas ocupaciones. Para su obtencin se consideran la Tasa de
Participacin en cada Ocupacin (TPO), tanto para mujeres como para hombres, y
la Tasa de Participacin en la Fuerza Laboral (TPFL).

La funcin para la TPO femenina se obtiene de la siguiente manera:

fi
[1] TIPOf =
ni

Y para el caso de los hombres, la TPO masculina se expresa como:

mi
[1a] TIPOm =
ni

donde:

fi = Nmero de mujeres en la ocupacin i


mi = Nmero de hombres en la ocupacin i
ni = Total de empleados en la ocupacin i

Aboites_PL07.indd 112 12/2/14 11:53 AM


Para el clculo de la TPFL femenina se utiliza la funcin:

F
[2] TPFLf =

por gnero: herramientas de medicin


N

Mientras que el clculo de la TPFL masculina se obtiene mediante:

M
[2a] TPFLm =

Segregacin ocupacional
N

donde:

F = Nmero de mujeres en la fuerza laboral


M = Nmero de hombres en la fuerza laboral
N = Total de empleados en la fuerza laboral

Utilizando las funciones [1] y [2], se obtiene la TR femenina mediante la expresin

fi F 113
[3] TRF = +
ni N

Mientras que la TR masculina se obtiene de las funciones [1a] y [2a], expresada como:

mi M
[3a] TRM = +
ni N

Ahora bien, ya que la tasa de representacin se obtiene dividiendo la participacin


femenina en la ocupacin i entre la participacin femenina en el mercado laboral,
la obtencin de una tasa cuyo valor sea menor a la unidad indicar que la mujer est
subrepresentada en dicha ocupacin; por el contrario, la obtencin de una tasa con
valor superior a la unidad indicar que la mujer est sobrerrepresentada en dicha
ocupacin (Cceres et al., 2011:2 y 3).

De acuerdo con Anker (1997:68), esta herramienta es considerada como parte de la


estadstica descriptiva y categoriza las ocupaciones en tres tipos: masculinas, feme-
ninas e integradas por gnero. Por tanto, segn los valores establecidos por Cceres
et al. (2011) las ocupaciones se consideraran masculinas y/o femeninas cuando el
valor obtenido de la tasa de representacin sea mayor a 1.25, mientras que la ocu-
pacin se considerar integrada por gnero cuando el valor de la tasa de represen-
tacin mujer/hombre quede comprendido entre 1 y 1.25.

ndice de segregacin parcial

La utilizacin del ndice de segregacin parcial permite neutralizar el hecho de que


los hombres y las mujeres participan en diferente proporcin en el mercado labo-
ral. As, un valor por encima de la unidad indicar que las mujeres se encuentran
sobrerrepresentadas en dicha ocupacin, mientras que un signo por debajo de la
unidad indicar que los hombres son quienes se encuentran sobrerrepresentados
en esa ocupacin.

Aboites_PL08.indd 113 12/2/14 11:53 AM


Ibez (2008:93) menciona que un valor por encima de la unidad indica que la
Manejo de las bases de datos y la construccin

ocupacin favorece a las mujeres y un valor por debajo de la unidad favorece a los
hombres. Sin embargo, para determinar si efectivamente la ocupacin favorece o
no a uno u otro gnero se enlazan los resultados con el salario promedio de cada
una de las ocupaciones, adems del salario promedio general, de ah que el ndice
de indicadores socioeconmicos

de segregacin parcial se conforma por las tasas de concentracin (TC) por ocupa-
cin femenina y masculina, es decir:

fi
[4] TCf = para el caso de las mujeres y
F

mi
[4a] TCm = para el caso de los hombres
M

Estos ndices permiten observar la fraccin del empleo femenino y masculino total
114 que se sitan en la ocupacin i (Cceres et al., 2011:3). Ahora bien, si volvemos a la
definicin de ocupaciones integradas por gnero, de acuerdo a la tasa de represen-
tacin, podemos observar que el ndice de segregacin parcial refleja el resultado de
dividir la tasa de representacin femenina entre la masculina, por tanto se conside-
rar que los valores del ndice de segregacin parcial, ubicados entre 1 y 1.25 sern
las ocupaciones integradas por gnero.

Utilizando los ndices de concentracin femenino y masculino (funciones [4] y [4a])


se obtiene el ndice de segregacin parcial.

fi m
[5] ISp = + i
F M

donde:

fi = Nmero de mujeres en la ocupacin i


mi = Nmero de hombres en la ocupacin i
F = Nmero de mujeres en la fuerza laboral
M = Nmero de hombres en la fuerza laboral

Este ndice permite, adems, estimar la participacin relativa de las mujeres por
ocupacin, pues siguiendo a Ortiz (1996) y de acuerdo con lo antes sealado, este
ndice se define como la razn entre la tasa de ocupacin femenina y la tasa de
ocupacin masculina, dado lo cual el valor de uno representa igual participacin
de hombres y mujeres en la ocupacin i, mientras que el valor de cero refle-
ja una total participacin de hombres y un valor infinito una total participacin
de mujeres.

Por otra parte, se considerar que mujeres y hombres estarn subrepresentados


cuando el valor de la tasa de representacin sea menor a 0.5 (Anker, 1997:87).

Aboites_PL08.indd 114 12/2/14 11:53 AM


ndice de disimilitud

El ID es la suma, a lo largo de todas las ocupaciones, del valor absoluto de las dife-

por gnero: herramientas de medicin


rencias entre la participacin femenina y la participacin masculina en cada ocupa-
cin respecto al total de mujeres y hombres en el mercado laboral, respectivamente,
dividido finalmente entre dos (Cceres et al., 2011:16), donde a mayor igualdad en
la distribucin, menor ser la segregacin (Emerek et al., 2003:5).

Segregacin ocupacional
El ndice se establece como:

1 f mi
[6] ID = i
2 i F M

donde:

fi = Nmero de mujeres en la ocupacin i


mi = Nmero de hombres en la ocupacin i 115
F = Nmero de mujeres en la fuerza laboral
M = Nmero de hombres en la fuerza laboral

De acuerdo con lo anterior, este indicador utiliza los ndices de concentracin fe-
menina y masculina (funciones [4] y [4a]) y considera a la segregacin como una
distribucin diferente de hombres y mujeres entre las categoras ocupacionales e
indica la proporcin de mujeres (o de hombres) que sera necesario que cambien
de ocupacin para lograr una perfecta integracin (Emerek et al., 2003:5; Cceres
et al. 2011:16).

El ndice toma valores entre cero y uno; cero cuando no existe segregacin, es de-
cir, cuando existe la misma proporcin de hombres y mujeres en cada ocupacin
y uno al haber completa disimilitud, es decir, cuando cada ocupacin es completa-
mente femenina o masculina (Cceres et al., 2011).1

Indicador de segregacin Moir and Selby-Smith

El indicador MSS se basa en que la participacin de las mujeres en cada ocupa-


cin es diferente a su participacin en la fuerza laboral total. Mide la diferencia

1 Cceres et al. (2011) ejemplificaron con una economa hipottica de tres ocupaciones; al to-
mar como referencia este supuesto, realizaron un ejercicio para visualizar cundo se presenta una
completa segregacin:
(1) (2) (3) (4) = (2) (3)
Ocupacin Mujeres Hombres Diferencia en valor absoluto
A 1 0 1
B 0 0.7 0.7
C 0 0.3 0.3
SUMA 1 1 2
ID = 2/2 = 1, segregacin completa

Aboites_PL08.indd 115 12/2/14 11:53 AM


absoluta de la proporcin de mujeres y la proporcin de empleados en las ocupa-
Manejo de las bases de datos y la construccin

ciones (Emerek et al., 2003:6).

El ndice se establece como:


de indicadores socioeconmicos

fi n
[7] MSS = i
i F N

donde:

fi = Nmero de mujeres en la ocupacin i


mi = Nmero de hombres en la ocupacin i
F = Nmero de mujeres en la fuerza laboral
M = Nmero de hombres en la fuerza laboral
N = Total de empleados en la fuerza laboral

116 Para la construccin de este ndice se emplean los ndices de concentracin feme-
nina (funcin [4]) y de concentracin por ocupacin. El MSS puede interpretarse
como la proporcin de la poblacin ocupada que tendra que cambiar de ocupa-
cin a fin de eliminar la segregacin. Una distribucin ms equitativa de hombres y
mujeres entre las ocupaciones disminuira la segregacin, aunque tambin dismi-
nuira ante un descenso de la participacin masculina en el empleo. El ndice ser
igual a cero en caso de completa igualdad y ser igual a dos veces la proporcin
masculina en el empleo,2 (2"*"M/N), cuando exista segregacin total, es decir, cuan-
do cada ocupacin sea completamente masculina3 (Emerek et al., 2003:17).

ndice de Karmel y Maclachlan

El ndice IP basa la segregacin en una distribucin diferente de hombres y mujeres


en las distintas ocupaciones, por lo que ante una distribucin ms equitativa habra
menor segregacin. Toma en cuenta las diferencias de la participacin femenina y
masculina en el empleo (Emerek et al., 2003:7).

2 Emerek et al. (2003:18) demostraron mediante clculos que el MSS puede ser reformulado como
M Mi F M
MSS = i =2 ID , mostrando la relacin entre los dos ndices (MSS e ID).
N i M F N
3 Siguiendo con el ejemplo formulado para demostrar una completa disimilitud, se utilizaron los
mismos datos para visualizar una completa segregacin con el indicador MSS:
(4) (5) = (2) (4)
(1) (2) (3)
Proporcin de empleados Diferencia
Ocupacin Mujeres Hombres
en la ocupacin en valor absoluto
A 1 0 0.4 0.6
B 0 0.7 0.42 0.42
C 0 0.3 0.18 0.18
Proporcin en la
0.4 0.6 1 1.2
fuerza laboral
MSS = 1.2; 2 * (M/N) = 2 * 0.6 = 1.2 = Segregacin completa

Aboites_PL08.indd 116 12/2/14 11:53 AM


Se establece como:

1 M M
[8] 1 mi fi

por gnero: herramientas de medicin


IP =
N i N N

donde:

Segregacin ocupacional
fi = Nmero de mujeres en la ocupacin i
mi = Nmero de hombres en la ocupacin i
M = Nmero de hombres en la fuerza laboral
N = Total de empleados en la fuerza laboral

A diferencia de los ndices anteriores, el IP considera la proporcin de participacin


en el empleo de los hombres y de las mujeres, pudiendo interpretarse como la pro-
porcin de la fuerza laboral femenina o masculina que necesitara cambiar de em-
pleo para que se elimine la segregacin. El ndice IP tendr un valor de cero en caso
de completa igualdad y dos veces la participacin masculina multiplicada por la 117
participacin femenina,4 (2"*"M/N"*"F/N), en caso de completa disimilitud; ya que el
valor mximo que puede alcanzar el producto M/N"*"F/N es cuando M/N = F/N = ,
entonces, el IP ascendera a 0.5 como mximo5 (Emerek et al., 2003:8).

Datos y aplicacin

Datos

Los datos estadsticos empleados para la medicin de la segregacin ocupacional


por gnero provienen, en este captulo, del Censo de Poblacin y Vivienda 2010
(INEGI, 2011) particularmente de las tablas de poblacin y la referencia espacial es el
pas en su conjunto.

De esos datos se desprende la Grfica 1 en la cual se plasman los porcentajes de


poblacin femenina y masculina que participan en el mercado laboral, la cual nos

4 Mediante clculos, Emerek et al. demuestran la relacin que existe entre los tres ndices (ID, MSS e IP):

F Ni F F M F
IP = i = MSS = 2 ID .
N i N F N N N
5 La ejemplificacin siguiente se realiz con el fin de visualizar el caso de completa disimilitud:

(8)
(1) (2) (3) (4) (5) (6) (7)
Valor absoluto
Ocupacin Mujeres Hombres Total (1 M/N) (5)*(3) (5)*(2)
(6) (7)
A 90 0 90 0.5 0 45 45
B 0 63 63 0.5 31.5 0 31.5
C 0 27 27 0.5 13.5 0 13.5
Suma 90 90 180 90
Proporcin en la
0.5 0.5 1
fuerza laboral total
Valor mximo
1/N = 0.005555556 *"SUMA(8) 90 = 0.5 =
de disimilitud

Aboites_PL08.indd 117 12/2/14 11:53 AM


Grfica 1. Composicin por gnero de la poblacin
Manejo de las bases de datos y la construccin

en Mxico, 2010

80%
74.38%
de indicadores socioeconmicos

70% 66.14% 65.12%

60%
51.30% 52.12%
48.70% 47.88%
50%

40%
33.86% 34.88% Hombres

30% Mujeres
25.62%

20%

10%

118 0%
Poblacin Poblacin Poblacin Poblacin Poblacin
total en edad econmicamente ocupada desocupada
(PT) econmica (PEE) activa (PEA) (PO) (PD)

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

permite observar que no obstante existir en 2010 una poblacin femenina mayor a
50%, solo representaba alrededor de un tercio de la poblacin femenina econmi-
camente activa con 33.9%.

La aplicacin metodolgica se lleva a cabo en el mismo orden en el que fueron


descritos en el apartado 2. De acuerdo con Anker (1997) los ndices de segregacin
son sensibles al grado de desagregacin de datos, tambin comenta que despus
de llevar a cabo un ejercicio, encontr que se obtiene una diferencia ms grande
cuando se pasa de ocupaciones agregadas a nivel de un dgito a ocupaciones desa-
gregadas a nivel de dos dgitos; pero, por otra parte, cuando se pasa de ocupaciones
desagregadas a dos dgitos a ocupaciones desagregadas a tres dgitos la diferencia
en los ndices es mucho menor; por lo cual se llega a la conclusin de que el mane-
jo de datos para ocupaciones es mejor desagregarlos a dos dgitos.

La clasificacin de ocupaciones utilizada es la denominada Clasificacin nica de


Ocupaciones (CUO) y de acuerdo con el INEGI dicha clasificacin permite no solo
generar informacin que refleja la estructura ocupacional del pas, sino que permite
compararla con otros sistemas de clasificacin internacional. La clasificacin de
ocupaciones ms agregada a nivel de un dgito contempla un total de 9 ocupa-
ciones; le sigue el nivel de desagregacin a dos dgitos, conformada por un total de
52 ocupaciones; el siguiente nivel de desagregacin es a tres dgitos, comprendida
por 155 ocupaciones y finalmente el nivel ms desagregado, a cuatro dgitos, con
un total de 468 ocupaciones. En este documento, el anlisis se realiz a nivel de dos
dgitos, es decir, considera un total de 52 ocupaciones, las cuales se enlistan en el
Cuadro 1.

Aboites_PL08.indd 118 12/2/14 11:53 AM


Cuadro 1. Clasificacin nica de Ocupaciones (CUO)
con nivel de desagregacin de dos dgitos

por gnero: herramientas de medicin


Clave Descripcin
11 Funcionarios y altas autoridades de los sectores pblico, privado y social

12 Directores y gerentes en servicios financieros, administracin y sociales

Segregacin ocupacional
13 Directores y gerentes en produccin, tecnologa y transporte

14 Directores y gerentes de ventas, restaurantes, hoteles y otros establecimientos

15 Coordinadores y jefes de rea en servicios financieros, administrativos y sociales

16 Coordinadores y jefes de rea en produccin y tecnologa

Coordinadores y jefes de rea de ventas, restaurantes, hoteles y otros


17
establecimientos

Otros directores, funcionarios, gerentes coordinadores y jefes de rea


19
no clasificados anteriormente
119
Especialistas en ciencias econmico-administrativas, ciencias sociales,
21
humanistas y en artes

Investigadores y especialistas en ciencias exactas, biolgicas, ingeniera,


22
informtica y en telecomunicaciones

23 Profesores y especialistas en docencia

24 Mdicos, enfermeras y otros especialistas en salud

Auxiliares y tcnicos en ciencias econmico-administrativas, ciencias sociales,


25
humanistas y en artes

Auxiliares y tcnicos en ciencias exactas, biolgicas, ingeniera, informtica y en


26
telecomunicaciones

27 Auxiliares y tcnicos en educacin, instructores y capacitadores

28 Enfermeras, tcnicos en medicina y trabajadores de apoyo en salud

29 Otros especialistas y tcnicos no clasificados anteriormente

31 Secretarias, capturistas, cajeros y trabajadores de control de archivo y transporte

32 Trabajadores que brindan y manejan informacin

Otras secretarias capturistas cajeros y trabajadores que brindan informacin no


39
clasificados anteriormente

41 Comerciantes en establecimientos

42 Empleados de ventas en establecimientos

43 Trabajadores en el alquiler

Otros comerciantes, empleados en ventas y agentes de ventas en establecimiento


49
no clasificados anteriormente

51 Trabajadores en la preparacin y servicio de alimentos y bebidas

52 Trabajadores en cuidados personales y del hogar

Aboites_PL08.indd 119 12/2/14 11:53 AM


Clave Descripcin
Manejo de las bases de datos y la construccin

53 Trabajadores en servicios de proteccin y vigilancia

54 Trabajadores de las fuerzas armadas


Otras ocupaciones en servicios personales y vigilancia no clasificadas
de indicadores socioeconmicos

59
anteriormente
61 Trabajadores en actividades agrcolas y ganaderas

62 Trabajadores en actividades pesqueras, forestales, caza y similares


Otros trabajadores en actividades agrcolas, ganaderas, forestales, caza y pesca no
69
clasificados anteriormente
71 Trabajadores en la extraccin y las edificaciones de construcciones

72 Artesanos y trabajadores en el tratamiento y elaboracin de productos de metal


Artesanos y trabajadores en la elaboracin de productos de madera, papel, textiles
73
y de cuero y piel

120 Artesanos y trabajadores en la elaboracin de productos de hule, caucho, plstico


74
y de sustancias qumicas
Trabajadores en la elaboracin y procesamiento de alimentos, bebidas y
75
productos de tabaco
Artesanos y trabajadores en la elaboracin de productos de cermica, vidrio,
76
azulejo y similares
79 Otros trabajadores artesanales no clasificadas anteriormente

81 Operadores de instalaciones y maquinaria industrial


Ensambladores y montadores de maquinaria, herramientas y productos metlicos
82
y electrnicos
83 Conductores de transporte y de maquinaria mvil
Otros operadores de maquinaria industrial, ensambladores y conductores de
89
transporte no clasificados anteriormente
91 Trabajadores de apoyo en actividades agropecuarias, pesca y caza

92 Trabajadores de apoyo en la minera, construccin e industria


Ayudantes de conductores de transporte, conductores de transporte de traccin
93
humana y animal, y cargadores
94 Ayudantes en la preparacin de alimentos

95 Vendedores ambulantes
Trabajadores domsticos, de limpieza, planchadores y otros trabajadores
96
de limpieza
Trabajadores de paquetera, de apoyo para espectculos y repartidores
97
de mercancas
Otros trabajadores en actividades elementales y de apoyo no clasificados
98
anteriormente
99 Ocupacin no especificada

Fuente: Instituto Nacional de Estadstica y Geografa (2010).

Aboites_PL08.indd 120 12/2/14 11:53 AM


Aplicacin

La primera parte de este apartado est dedicada a lo que Anker (1988) denomina

por gnero: herramientas de medicin


herramientas de estadstica descriptiva, conformadas por la tasa de representacin
y el ndice de segregacin parcial, y despus se proceder a la construccin de los
indicadores de la segregacin ocupacional por gnero.

Segregacin ocupacional
Como paso preliminar, ya que la base de datos contempla el nivel ms desagregado
cuatro dgitos para la ocupacin en la cual se desempea el trabajador, se lleva
a cabo la agregacin a nivel de dos dgitos, conforme al Cuadro 1; para tal efecto
se utiliza la siguiente sintaxis aplicada a la variable OCUACTIV_C, generando una
nueva variable denominada ocupacion02:

RECODE OCUACTIV_C (1999=19) (3999=39) (4111=41) (4999=49) (5999=59)


(6999=69) (7999=79) (8999=89) (9411=94) (9888=98) (9999=99) (1111 thru
1135=11) (1211 thru 1226=12) (1311 thru 1324=13) (1411 thru 1423=14) (1511 thru
1526=15) (1611 thru 1629=16) 121
(1711 thru 1723=17) (2111 thru 2175=21) (2211 thru 2281=22) (2311 thru 2343=23)
(2411 thru 2428=24) (2511 thru 2563=25) (2611 thru 2662=26) (2711 thru
2716=27)
(2811 thru 2827=28) (2991 thru 2992=29) (3101 thru 3142=31) (3201 thru
3232=32)
(4201 thru 4233=42) (4311 thru 4312=43) (5101 thru 5116=51) (5201 thru
5254=52)
(5301 thru 5314=53) (5401 thru 5413=54) (6101 thru 6131=61) (6201 thru
6311=62)
(7101 thru 7135=71) (7201 thru 7223=72) (7301 thru 7353=73) (7401 thru
7412=74)
(7501 thru 7517=75) (7601 thru 7614=76) (8101 thru 8199=81) (8201 thru
8212=82)
(8301 thru 8352=83) (9111 thru 9124=91) (9211 thru 9239=92) (9311 thru
9332=93)
(9511 thru 9521=95) (9601 thru 9663=96) (9711 thru 9733=97) INTO
ocupacion02.

Enseguida se emite una tabla de contingencia, en la que se solicita que los renglo-
nes contengan los valores de la variable ocupacion02 y en las columnas la variable
sexo, previa ponderacin, mediante la siguiente sintaxis:

WEIGHT BY FACTOR.

CROSSTABS
/TABLES=ocupacion02 BY SEXO
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.

Aboites_PL08.indd 121 12/2/14 11:53 AM


Manejo de las bases de datos y la construccin

De lo que resulta el Cuadro 2, mismo que contiene los datos base sobre los cuales se
aplicarn las herramientas de medicin

Cuadro 2. Poblacin por ocupacin a nivel de dos dgitos, 2010


de indicadores socioeconmicos

Sexo
Total
Ocupacin Hombre Mujer
(Ni)
(Mi) (Fi)
Funcionarios y altas autoridades de los sectores
72,341 26,116 98,457
pblico, privado y social

Directores y gerentes en servicios financieros,


199,388 155,793 355,181
administracin y sociales

Directores y gerentes en produccin,


152,032 42,642 194,674
tecnologa y transporte
122 Directores y gerentes de ventas, restaurantes,
194,631 109,329 303,960
hoteles y otros establecimientos

Coordinadores y jefes de rea en servicios


181,144 130,336 311,480
financieros, administrativos y sociales

Coordinadores y jefes de rea en produccin y


140,062 26,823 166,885
tecnologa

Coordinadores y jefes de rea de ventas,


71,132 40,996 112,128
restaurantes, hoteles y otros establecimientos

Otros directores, funcionarios, gerentes


coordinadores y jefes de rea no clasificados 43,348 23,838 67,186
anteriormente

Especialistas en ciencias econmico-


administrativas, ciencias sociales, humanistas 739,046 500,687 1,239,733
y en artes

Investigadores y especialistas en ciencias


exactas, biolgicas, ingeniera, informtica y en 481,252 120,062 601,314
telecomunicaciones

Profesores y especialistas en docencia 453,806 817,674 1,271,480

Mdicos, enfermeras y otros especialistas en


232,881 212,987 445,868
salud

Auxiliares y tcnicos en ciencias econmico-


administrativas, ciencias sociales, humanistas 416,990 405,822 822,812
y en artes

Auxiliares y tcnicos en ciencias exactas,


biolgicas, ingeniera, informtica y en 1,710,259 127,559 1,837,818
telecomunicaciones

Auxiliares y tcnicos en educacin, instructores


129,181 158,165 287,346
y capacitadores

Aboites_PL08.indd 122 12/2/14 11:53 AM


Sexo
Total
Ocupacin Hombre Mujer
(Ni)
(Mi) (Fi)

por gnero: herramientas de medicin


Enfermeras, tcnicos en medicina y
143,576 364,504 508,080
trabajadores de apoyo en salud
Otros especialistas y tcnicos no clasificados
251,517 244,366 495,883
anteriormente

Segregacin ocupacional
Secretarias, capturistas, cajeros y trabajadores
654,280 1,164,481 1,818,761
de control de archivo y transporte
Trabajadores que brindan y manejan
159,106 303,628 462,734
informacin
Otras secretarias capturistas cajeros y
trabajadores que brindan informacin no 143,310 126,659 269,969
clasificados anteriormente
Comerciantes en establecimientos 1,147,178 1,273,422 2,420,600
Empleados de ventas en establecimientos 1,847,443 1,835,267 3,682,710
123

Trabajadores en el alquiler 35,802 13,345 49,147


Otros comerciantes, empleados en ventas
y agentes de ventas en establecimiento no 27,048 23,407 50,455
clasificados anteriormente
Trabajadores en la preparacin y servicio de
700,200 947,193 1,647,393
alimentos y bebidas
Trabajadores en cuidados personales y del
245,110 466,526 711,636
hogar
Trabajadores en servicios de proteccin y
905,365 114,495 1,019,860
vigilancia
Trabajadores de las fuerzas armadas 78,942 1,870 80,812
Otras ocupaciones en servicios personales y
5,002 3,301 8,303
vigilancia no clasificadas anteriormente
Trabajadores en actividades agrcolas y
3,870,744 297,043 4,167,787
ganaderas
Trabajadores en actividades pesqueras,
315,731 20,876 336,607
forestales, caza y similares
Otros trabajadores en actividades agrcolas,
ganaderas, forestales, caza y pesca no 5,934 657 6,591
clasificados anteriormente
Trabajadores en la extraccin y la edificaciones
2,263,869 26,097 2,289,966
de construcciones
Artesanos y trabajadores en el tratamiento y
679,882 17,641 697,523
elaboracin de productos de metal
Artesanos y trabajadores en la elaboracin de
productos de madera, papel, textiles y de cuero 668,686 423,713 1,092,399
y piel

Aboites_PL08.indd 123 12/2/14 11:53 AM


Sexo
Manejo de las bases de datos y la construccin

Total
Ocupacin Hombre Mujer
(Ni)
(Mi) (Fi)
Artesanos y trabajadores en la elaboracin
de productos de hule, caucho, plstico y de 76,238 10,005 86,243
de indicadores socioeconmicos

sustancias qumicas
Trabajadores en la elaboracin y
procesamiento de alimentos, bebidas y 437,821 328,890 766,711
productos de tabaco
Artesanos y trabajadores en la elaboracin
de productos de cermica, vidrio, azulejo y 143,719 22,380 166,099
similares
Otros trabajadores artesanales no clasificadas
52,973 50,706 103,679
anteriormente
Operadores de instalaciones y maquinaria
921,340 489,262 1,410,602
industrial
124
Ensambladores y montadores de maquinaria,
herramientas y productos metlicos y 283,100 247,644 530,744
electrnicos
Conductores de transporte y de maquinaria
2,120,971 34,500 2,155,471
mvil
Otros operadores de maquinaria industrial,
ensambladores y conductores de transporte no 117,462 55,574 173,036
clasificados anteriormente
Trabajadores de apoyo en actividades
926,098 138,842 1,064,940
agropecuarias, pesca y caza
Trabajadores de apoyo en la minera,
1,259,325 184,392 1,443,717
construccin e industria
Ayudantes de conductores de transporte,
conductores de transporte de traccin humana 263,531 4,730 268,261
y animal, y cargadores
Ayudantes en la preparacin de alimentos 60,584 105,617 166,201
Vendedores ambulantes 523,080 540,088 1,063,168
Trabajadores domsticos, de limpieza,
712,017 1,898,756 2,610,773
planchadores y otros trabajadores de limpieza
Trabajadores de paquetera, de apoyo para
207,143 49,438 256,581
espectculos y repartidores de mercancas
Otros trabajadores en actividades elementales y
79,670 26,764 106,434
de apoyo no clasificados anteriormente
Ocupacin no especificada 271,504 146,442 417,946
(M) (F) (N)
Total
27,822,794 14,901,350 42,724,144

Fuente: Censo de Poblacin y Vivienda 2010. INEGI.

Aboites_PL08.indd 124 12/2/14 11:53 AM


A continuacin se describe la utilizacin de los diferentes mtodos de medicin, a
efecto de obtener algo de practicidad se consideran nicamente las cinco primeras
ocupaciones as como los totales correspondientes por gnero y el total general.

por gnero: herramientas de medicin


Los resultados completos as como su anlisis sern tratados en el apartado 4.

Estadstica descriptiva

Segregacin ocupacional
Tasa de representacin

Recordemos la forma funcional de la tasa de representacin, la cual est expresa-


fi F mi M
da como [3] TRF = + para las mujeres, y como [3a] TRM = + para los
ni N ni N
hombres. El Cuadro 3 muestra las primeras cinco ocupaciones con cada uno de
los datos.

Cuadro 3. Personal ocupado en las primeras cinco ocupaciones


y el total nacional por gnero, de acuerdo a la Clasificacin nica 125
de ocupaciones a nivel de dos dgitos, 2010

Sexo
Total
Ocupacin Hombre Mujer
( ni )
(mi) (fi)
Funcionarios y altas autoridades de los sectores
72,341 26,116 98,457
pblico, privado y social

Directores y gerentes en servicios financieros,


199,388 155,793 355,181
administracin y sociales

Directores y gerentes en produccin,


152,032 42,642 194,674
tecnologa y transporte

Directores y gerentes de ventas, restaurantes,


194,631 109,329 303,960
hoteles y otros establecimientos

Coordinadores y jefes de rea en servicios


181,144 130,336 311,480
financieros, administrativos y sociales

(M) (F) (N)


Total
2,782,2794 490,1350 42,724,144

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Se obtiene, en principio, la TPO para mujeres y para hombres, de acuerdo con


f m
las funciones: [1] TIPOf = i y [1a] TIPOm = i .
ni ni
F
Adems, se saca la TPFL femenina y masculina con base en [2] TPFLf = y [2a]
M N
TPFLm = . Los resultados para las primeras cinco ocupaciones se muestran en
N
el Cuadro 4.

Aboites_PL08.indd 125 12/2/14 11:53 AM


Cuadro 4. Tasa de participacin por ocupacin (TPO)
Manejo de las bases de datos y la construccin

y Tasa de Participacin en la Fuerza Laboral (TPFL), mujeres y hombres 2004,


primeras cinco ocupaciones a dos dgitos

Tasa de participacin
por ocupacin (TPO)
de indicadores socioeconmicos

Hombre Mujer
Ocupacin
(Mi!/Ni) (Fi!/Ni)
Funcionarios y altas autoridades de los sectores
0.73474715 0.26525285
pblico, privado y social
Directores y gerentes en servicios financieros,
0.56137012 0.43862988
administracin y sociales
Directores y gerentes en produccin, tecnologa y
0.78095688 0.21904312
transporte
Directores y gerentes de ventas, restaurantes, hoteles y
0.6403178 0.3596822
otros establecimientos
Coordinadores y jefes de rea en servicios financieros,
126 0.58155901 0.41844099
administrativos y sociales
(M/N) (F/N)
Tasa de participacin en la Fuerza Laboral (TPFL) 0.65121946 0.34878054
0.34878054 0.34878054

Se procede a calcular la tasa de representacin, considerando los valores obtenidos


f F
en los Cuadros 3 y 4, de acuerdo con la funcin [3] TRF = i + ! para el caso de
M M n i N
las mujeres y la funcin [3a] TRM = i + para el de los hombres, los resultados
ni N
se muestran en el Cuadro 5.

Cuadro 5. Tasa de representacin femenina y masculina


para las primeras cinco ocupaciones a dos dgitos

Tasa de Tasa de
representacin representacin
Ocupacin
masculina femenina
(TRM) (TRF)
Funcionarios y altas autoridades de los
1.1282635 0.76051506
sectores pblico, privado y social
Directores y gerentes en servicios financieros,
0.86202909 1.25760996
administracin y sociales
Directores y gerentes en produccin,
1.19922227 0.62802563
tecnologa y transporte
Directores y gerentes de ventas, restaurantes,
0.98325963 1.03125649
hoteles y otros establecimientos
Coordinadores y jefes de rea en servicios
0.89303076 1.19972574
financieros, administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Aboites_PL08.indd 126 12/2/14 11:53 AM


ndice de segregacin parcial

Para el clculo del ndice de segregacin parcial se utilizan las funciones corres-

por gnero: herramientas de medicin


pondientes a las tasas de concentracin femenina y masculina, de acuerdo con
fi mi
[4] TCf = y [4a] TCm = , respectivamente. El resultado para las primeras cinco
F M
ocupaciones se muestran en el Cuadro 6.

Segregacin ocupacional
Cuadro 6. Tasa de concentracin femenina y masculina para las cinco
primeras ocupaciones a dos dgitos 2010

Tasa de Tasa de
Ocupacin concentracin concentracin
masculina (TCm) femenina (TCf )
Funcionarios y altas autoridades de los sectores
0.00260006 0.00175259
pblico, privado y social
Directores y gerentes en servicios financieros, 127
0.00716635 0.01045496
administracin y sociales
Directores y gerentes en produccin,
0.0054643 0.00286162
tecnologa y transporte
Directores y gerentes de ventas, restaurantes,
0.00699538 0.00733685
hoteles y otros establecimientos
Coordinadores y jefes de rea en servicios
0.00651063 0.00874659
financieros, administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

fi m
Al considerar la funcin [5] ISp = + i , a partir de los datos obtenidos en el
F M
Cuadro 6, se obtiene a su vez el ndice de segregacin parcial, los resultados se
muestran en el Cuadro 7.

Cuadro 7. ndice de segregacin parcial


para las cinco primeras ocupaciones a dos dgitos

ndice de segregacin
Ocupacin
parcial (ISp)
Funcionarios y altas autoridades de los sectores pblico,
0.67405801
privado y social
Directores y gerentes en servicios financieros, administracin
1.45889504
y sociales
Directores y gerentes en produccin, tecnologa y transporte 0.5236941
Directores y gerentes de ventas, restaurantes, hoteles
1.04881403
y otros establecimientos
Coordinadores y jefes de rea en servicios financieros,
1.3434316
administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Aboites_PL08.indd 127 12/2/14 11:53 AM


Indicadores de la segregacin ocupacional por gnero
Manejo de las bases de datos y la construccin

En esta subseccin aplicaremos la metodologa para determinar los tres ndices de


segregacin ocupacional por gnero descritos en el apartado 2 Metodologa y con-
tinuaremos utilizando los datos contenidos en el Cuadro 3.
de indicadores socioeconmicos

ndice de disimilitud
1 f mi
Partiendo de la funcin [6] ID = i ", se puede observar que para llegar
2 i F M
a ella se requiere en primera instancia llevar a cabo el clculo de las tasas de con-
centracin, mismas que ya tenemos disponibles en el Cuadro 6, restando a la tasa
femenina el valor de la tasa masculina y considerando dicha diferencia en valor
f m
absoluto i i se obtienen los datos contenidos en el Cuadro 8.
F M
Cuadro 8. Diferencia en valor absoluto por ocupacin
128 entre la Tasa de Concentracin Femenina y la Masculina,
para las cinco primeras ocupaciones a nivel de dos dgitos, 2010

Diferencia entre la tasa de


concentracin femenina (TCf)
Ocupacin
y la masculina (TCm).
Valores absolutos
Funcionarios y altas autoridades de los sectores
0.00084747
pblico, privado y social

Directores y gerentes en servicios financieros,


0.0032886
administracin y sociales

Directores y gerentes en produccin, tecnologa


0.00260268
y transporte

Directores y gerentes de ventas, restaurantes,


0.00034147
hoteles y otros establecimientos

Coordinadores y jefes de rea en servicios


0.00223596
financieros, administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

De acuerdo con la funcin [6] el paso siguiente es llevar a cabo la sumatoria de las
52 ocupaciones y el resultado dividirlo entre dos, de esa forma se obtendr el ndice
de disimilitud. Los resultados se describirn en el siguiente apartado.

Indicador de segregacin de Moir y Selby Smith


fi n
Para el clculo del ndice MSS partiremos de la funcin [7] MSS = i , pu-
i F N
diendo observar que requerimos para tal propsito las tasas de concentracin fe-
menina, pero tambin las tasas de concentracin de las ocupaciones, dado lo cual
se obtienen los datos que se presentan en el Cuadro 9.

Aboites_PL08.indd 128 12/2/14 11:53 AM


Cuadro 9. Diferencia en valor absoluto
entre las tasas de concentracin femenina y de ocupaciones,
de las cinco primeras ocupaciones a dos dgitos, 2010

por gnero: herramientas de medicin


Tasa de Tasa de
Diferencia
concentracin concentracin
Ocupacin en valor
femenina ocupaciones
absoluto

Segregacin ocupacional
(TCf) (TCn)

Funcionarios y altas autoridades de


los sectores pblico, privado 0.00175259 0.00230448 0.00055189
y social

Directores y gerentes en servicios


financieros, administracin 0.01045496 0.00831336 0.0021416
y sociales

Directores y gerentes en 129


produccin, tecnologa 0.00286162 0.00455653 0.00169491
y transporte

Directores y gerentes de ventas,


restaurantes, hoteles y otros 0.00733685 0.00711448 0.00022237
establecimientos

Coordinadores y jefes de
rea en servicios financieros, 0.00874659 0.00729049 0.0014561
administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Para llegar al valor del ndice MSS se lleva a cabo la suma de las diferencias obteni-
das en las 52 ocupaciones.

ndice de MacLachlan
1 M M
Para el ndice IP, partimos de la funcin [8] IP = 1 mi fi para
N i N N
la cual utilizaremos los datos del Cuadro 3, as como el dato de la TPFL masculina
(M/N), que es de 0.65121946 segn el Cuadro 4. Como podemos observar, la dife-
M
rencia de la unidad menos la TPFL masculina 1 es en s la TPFL femenina,
N
que de acuerdo con el Cuadro 4, es de 0.34878054. En el Cuadro 10 se muestran los
resultados de cada una de las partes contenidas entre las barras en la funcin [8], as
como la diferencia en trminos absolutos.

Los pasos siguientes para llegar al valor del IP consiste en realizar una sumatoria de
las diferencias absolutas a lo largo de las 52 ocupaciones, cuyo resultado se divide
entre la fuerza laboral total (N), que es de 42,724,144 de acuerdo con el Cuadro 3.

Aboites_PL09_10.indd 129 12/2/14 11:45 AM


Cuadro 10. Resultados del clculo IP
Manejo de las bases de datos y la construccin

para las cinco primeras ocupaciones a dos dgitos, 2010

Tasa de Tasa de
participacin participacin Diferencia
de indicadores socioeconmicos

Ocupacin en la fuerza en la fuerza en trminos


laboral (TPFL) laboral (TPFL) absolutos
femenina * mi masculina * fi

Funcionarios y altas
autoridades de los sectores 25231.133 17007.2474 8223.88559
pblico, privado y social

Directores y gerentes en
servicios financieros, 69542.6542 101455.433 31912.7791
administracin y sociales
130
Directores y gerentes en
produccin, tecnologa 53025.803 27769.3002 25256.5028
y transporte

Directores y gerentes de
ventas, restaurantes, hoteles 67883.5052 71197.1724 3313.66717
y otros establecimientos

Coordinadores y jefes de
rea en servicios financieros, 63179.5021 84877.3396 21697.8375
administrativos y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Hasta aqu hemos realizado paso a paso el clculo de las diferentes tasas e ndices
y a efecto de hacer ms prctico el ejercicio solo se exhibieron los resultados para
las primeras cinco ocupaciones. El apartado siguiente tiene como finalidad llevar a
cabo un anlisis de los resultados obtenidos a fin de plantear cmo se encontraba
estructurada la participacin femenina (pero tambin la masculina) en el mercado
laboral mexicano en 2010.

! Resultados

Tasa de representacin

Considerando la definicin de la tasa de representacin contenida en el apartado


2 de este documento y siguiendo la categorizacin de ocupaciones como feme-
ninas, masculinas e integradas por gnero, el Cuadro 11 muestra aquellas ocupa-
ciones que cumplen con la definicin de poder categorizarse como femeninas y el
Cuadro 12 muestra las ocupaciones categorizadas como masculinas.

Aboites_PL09_10.indd 130 12/2/14 11:45 AM


Cuadro 11. Ocupaciones femeninas de acuerdo con la tasa de representacin

Tasa de Tasa de

por gnero: herramientas de medicin


Clave Descripcin representacin representacin
masculina femenina
Trabajadores domsticos, de limpieza,
96 planchadores y otros trabajadores de 0.4188 2.0852
limpieza

Segregacin ocupacional
Enfermeras, tcnicos en medicina y
28 0.4339 2.0569
trabajadores de apoyo en salud
Trabajadores que brindan y manejan
32 0.5280 1.8813
informacin
Trabajadores en cuidados personales
52 0.5289 1.8796
y del hogar
23 Profesores y especialistas en docencia 0.5481 1.8438
Secretarias, capturistas, cajeros y
31 trabajadores de control de archivo 0.5524 1.8357
131
y transporte
94 Ayudantes en la preparacin de alimentos 0.5598 1.8220
Trabajadores en la preparacin y servicio
51 0.6527 1.6485
de alimentos y bebidas
Auxiliares y tcnicos en educacin,
27 0.6903 1.5782
instructores y capacitadores
41 Comerciantes en establecimientos 0.7277 1.5083
95 Vendedores ambulantes 0.7555 1.4565
42 Empleados de ventas en establecimientos 0.7703 1.4288
Auxiliares y tcnicos en ciencias
25 econmico-administrativas, ciencias 0.7782 1.4141
sociales, humanistas y en artes
Otros especialistas y tcnicos no
29 0.7789 1.4129
clasificados anteriormente
Otros trabajadores artesanales no
79 0.7846 1.4022
clasificadas anteriormente
Mdicos, enfermeras y otros especialistas
24 0.8020 1.3696
en salud
Otras secretarias, capturistas, cajeros y
39 trabajadores que brindan informacin no 0.8151 1.3451
clasificados anteriormente
Ensambladores y montadores de
82 maquinaria, herramientas y productos 0.8191 1.3378
metlicos y electrnicos
Otros comerciantes, empleados en ventas
49 y agentes de ventas en establecimiento no 0.8232 1.3301
clasificados anteriormente
Directores y gerentes en servicios
12 0.8620 1.2576
financieros, administracin y sociales

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Aboites_PL09_10.indd 131 12/2/14 11:45 AM


Cuadro 12. Ocupaciones masculinas de acuerdo
Manejo de las bases de datos y la construccin

con la Tasa de Representacin, 2010

Tasa de Tasa de
Clave Descripcin representacin representacin
de indicadores socioeconmicos

masculina femenina
Trabajadores en la extraccin y la
71 1.5181 0.0327
edificaciones de construcciones
Conductores de transporte y de
83 1.5110 0.0459
maquinaria mvil
Ayudantes de conductores de transporte,
93 conductores de transporte de traccin 1.5085 0.0506
humana y animal, y cargadores
54 Trabajadores de las fuerzas armadas 1.5000 0.0663
Artesanos y trabajadores en el tratamiento
72 1.4967 0.0725
y elaboracin de productos de metal
132 Trabajadores en actividades pesqueras,
62 1.4403 0.1778
forestales, caza y similares
Auxiliares y tcnicos en ciencias exactas,
26 biolgicas, ingeniera, informtica y en 1.4290 0.1990
telecomunicaciones
Trabajadores en actividades agrcolas
61 1.4261 0.2043
y ganaderas
Otros trabajadores en actividades agrcolas,
69 ganaderas, forestales, caza y pesca no 1.3825 0.2858
clasificados anteriormente
Trabajadores en servicios de proteccin
53 1.3632 0.3219
y vigilancia
Artesanos y trabajadores en la elaboracin
74 de productos de hule, caucho, plstico 1.3574 0.3326
y de sustancias qumicas
Trabajadores de apoyo en la minera,
92 1.3395 0.3662
construccin e industria
Trabajadores de apoyo en actividades
91 1.3354 0.3738
agropecuarias, pesca y caza
Artesanos y trabajadores en la elaboracin
76 de productos de cermica, vidrio, azulejo 1.3287 0.3863
y similares
Coordinadores y jefes de rea en
16 1.2888 0.4608
produccin y tecnologa

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Lo que resalta a primera vista de los Cuadros 11 y 12, es una mayor cantidad de ocu-
paciones denominadas como femeninas, las cuales suman diez, contra 15 ocupa-
ciones catalogadas como masculinas.

Aboites_PL09_10.indd 132 12/2/14 11:45 AM


ndice de segregacin parcial

Ahora, al abordar el ndice de segregacin parcial bajo la perspectiva de que ante un

por gnero: herramientas de medicin


valor situado entre 1 y 1.25 estaremos frente a una ocupacin integrada por gnero,
el Cuadro 13 muestra las ocupaciones en las cuales se obtuvieron dichos valores.

Cuadro 13. Ocupaciones integradas por gnero,

Segregacin ocupacional
de acuerdo con el ndice de segregacin parcial, 2010

ndice de
Clave Descripcin segregacin
parcial
Otras ocupaciones en servicios personales y vigilancia no
59 1.2321
clasificadas anteriormente
Artesanos y trabajadores en la elaboracin de productos de
73 1.1831
madera, papel, textiles y de cuero y piel
Coordinadores y jefes de rea de ventas, restaurantes, hoteles 133
17 1.0760
y otros establecimientos
Directores y gerentes de ventas, restaurantes, hoteles y otros
14 1.0488
establecimientos
Otros directores, funcionarios, gerentes coordinadores y jefes
19 1.0267
de rea no clasificados anteriormente

La Grfica 2 muestra el salario por ocupacin promedio y el existente en el mercado


laboral, de lo cual se puede observar que

Grfica 2. Promedio de salario por hora por ocupacin

Salario promedio en el mercado laboral

Otros directores, funcionarios, gerentes


coordinadores y jefes de rea no clasificados
Directores y gerentes de ventas, restaurantes,
hoteles y otros establecimientos
Coordinadores y jefes de rea de ventas,
restaurantes, hoteles y otros establecimientos
Artesanos y trabajadores en la elaboracin de
productos de madera, papel, textiles y de cuero
Otras ocupaciones en servicios personales y
vigilancia no clasificados anteriormente

0 10 20 30 40 50 60 70 80 90 100

En el Cuadro 13 se puede observar que solo cinco de las 52 ocupaciones a dos dgi-
tos se pueden catalogar como integradas por gnero y que tres de dichas ocupacio-
nes presentan un salario por encima del promedio en el mercado laboral mientras
dos tienen un salario debajo del mismo.

Aboites_PL09_10.indd 133 12/2/14 11:45 AM


La Grfica 3 muestra las cinco ocupaciones en las que se concentra la fuerza laboral
Manejo de las bases de datos y la construccin

femenina, con 47.77% del total, lo que permite visualizar que son ocupaciones en las
cuales el salario por hora percibido est situado por debajo del promedio nacional;
aunado a esto, se observa que las horas trabajadas estn por debajo del promedio
no solo nacional sino tambin de las horas trabajadas promedio por las mujeres.
de indicadores socioeconmicos

Grfica 3. Ocupaciones con mayor concentracin femenina,


con salario por hora y horas trabajadas promedio, 2010

50
45
40
35
Salario/hora
30
25 Horas
trabajadas
20
134 15
10
5
0
servicio de alimentos y bebidas
Promedio

Trabajadores domsticos,

Empleados de ventas
en establecimientos

Comerciantes
en establecimientos
de limpieza, planchadores y

Secretarias, capturistas, cajeros


y trabajadores de control
de archivo y transporte

Trabajadores en la preparacin y
otros trabajadores de limpieza

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Indicadores de la segregacin ocupacional por gnero

ndice de disimilitud

El ID obtenido, contemplando las ocupaciones a dos dgitos, fue de 0.4805, lo cual


indica, de acuerdo a la descripcin de este indicador, que es necesario que 48.05%
de hombres y mujeres cambien de ocupacin para lograr una perfecta integracin.

Indicador de segregacin de Moir y Selby Smith

El resultado obtenido para el clculo del MSS fue de 0.6259, lo cual se interpreta
como la necesidad de que 62.59% de la poblacin ocupada cambie de ocupacin a
fin de eliminar la segregacin.

Aboites_PL09_10.indd 134 12/2/14 11:45 AM


ndice de MacLachlan

En el caso del IP, el resultado obtenido fue 0.2183, lo cual se interpreta como la

por gnero: herramientas de medicin


proporcin de hombres o mujeres que necesitaran cambiar de empleo para que se
elimine la segregacin.

Despus de obtener los resultados de los tres indicadores de segregacin ocupacio-

Segregacin ocupacional
nal por gnero, pudieran surgir las preguntas: cul es el indicador ms apropiado
para su medicin? y cmo es que difieren entre ellos? Para responder estas cues-
tiones llevaremos a cabo un ejercicio que consiste en demostrar la relacin existen-
te entre los tres indicadores, para lo cual consideraremos los valores mximos que
pueden alcanzar cada uno de los indicadores.

Si nos remitimos al apartado dos de este documento, recordaremos que los valores
mximos que se pueden obtener en cada uno son los que se muestran en el Cuadro
14, al realizar el clculo obtendremos los valores del Cuadro 15 y mediante los dife-
135
rentes indicadores se obtendr la segregacin ocupacional por gnero del Cuadro
16; por ltimo, se dividen estos ltimos valores entre su valor mximo. Podemos
concluir que por medio de este procedimiento todos derivan en el mismo valor,
pero que para su interpretacin es ms prctico finalizar con el valor obtenido por
el ndice de disimilitud, ya que permite hablar en trminos porcentuales.

Cuadro 14. Indicadores de segregacin ocupacional por gnero,


valores mximos que pueden alcanzar

Indicador Valor mximo


ndice de disimilitud (ID) 1
Moir and Selby Smith (MSS) (2 * M/N)
ndice de Karmel y Maclachlan (IP) (2 * M/N * F/N)

Fuente: Emerek et al., 2003:8.

En el Cuadro 15 se plasman los valores mximos que pueden alcanzar los indicado-
res considerando que las mujeres representan una proporcin 0.3487 de la fuerza
laboral total y los hombres 0.6512.

Cuadro 15. Indicadores de segregacin ocupacional


por gnero, valor mximo 2010

Indicador Valor mximo


ndice de disimilitud (ID) 1
Moir and Selby Smith (MSS) 1.3024
ndice de Karmel y Maclachlan (IP) 0.4542

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Aboites_PL09_10.indd 135 12/2/14 11:45 AM


Cuadro 16. ndices de segregacin ocupacional
Manejo de las bases de datos y la construccin

por gnero, 2010

Indicador ndice 2010


ndice de disimilitud (ID) 0.4805
de indicadores socioeconmicos

Moir and Selby Smith (MSS) 0.6259


ndice de Karmel y Maclachlan (IP) 0.2183

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

Al dividir los ndices obtenidos entre los valores mximos se llega a los valores pon-
derados, representados en el Cuadro 17.

Cuadro 17. ndices de segregacin ocupacional


136 por gnero, 2010, ponderados

Indicador ndice 2010


ndice de disimilitud (ID) 0.4805
Moir and Selby Smith (MSS) 0.4805
ndice de Karmel y Maclachlan (IP) 0.4805

Fuente: Censo de Poblacin y Vivienda 2010, INEGI.

! Anexo

Cuadro A1. Metodologa utilizada para el anlisis


de segregacin ocupacional por gnero

Autor Periodo Metodologa


Abramo y Valenzuela
1990-2002 Tasa de participacin, promedio
(2006)

ID, Tasa de representacin.


Anker and Hein (1985,
1960, 1970 y 1980 Pocentaje de ocupaciones
1986)
dominadas por gnero

Banco Mundial (1994) 1950/1960 vs. 1970/1980 ID

Baker (1988) 1968 a 1978 ID. Tasa de representacin

Blau y Ferber (1992) 1988 a 1990 en su mayora ID

1953-1966 en su mayora Porcentaje de mujeres en situacin


Boserup (1970)
1960 de empleo

1950-1971, 1965 en
Boulding (1976) ID. Tasa de representacin
promedio

Aboites_PL09_10.indd 136 12/2/14 11:45 AM


Autor Periodo Metodologa
Porcentaje de fuerza laboral
Consejo Nrdico masculina y fuerza laboral femenina
1990 a 1992

por gnero: herramientas de medicin


de Ministros, (1995) trabajando en ocupaciones con 10,
40, 60 y 90 por ciento de mujeres
Tasa de participacin en la actividad
Cuadros, 2004 1980-2000
econmica por sexo. Porcentaje

Segregacin ocupacional
Charles (1992) 1985 o un ao cercano ndice de relacin
Del Razo (2003) 1994-2001 ID
Emerek et al.(2003) 1995 a 2000 ID. MSS (WE). IP
Garro y Rodrguez (1995) 1987-1993 Tasa de participacin
Horton (1993) 1950 a 1990 ID
Jacobs y Lim (1992) 1960 a 1980 ID. ID de tamao estndar
ID, WE, IP, Indicadores de
Jurez y Aboites (2008) 1992, 1996, 2002 participacin, representacin
y concentracin 137
OECD. (1985) 1970 a 1993 ID. ndice WE
OECD (1988) 1960 A 1970. 1980-1986 ID
Psacharopoulos y
1950/1960 a 1970/1980 ID. Tasa de representacin
Tzanatos (1992)
Reubens y Harrison (1983) 1970 a 1975 ID. Ocupaciones ms comunes
Roos (1985) 1970 ID. Tasa de representacin
Rosenfeld and Kalleberg
1980 a 1987 ID
(1990)
ID, ndice de segregacin, ndice 0.
Rubery and Fragan (1993) 1983, 1987, 1990 15 ocupaciones dominadas por
hombres y 15 por mujeres
Sarav (1997) 1979-1995 Tasa de participacin
Treinman y Roos (1983) 1970 ID. Tasa de representacin. WE
UN ECE (Naciones
1970, 1980 ID. Tasa de representacin. WE
Unidas 1985a)

Fuente: Elaboracin propia con base en Anker (2001), con elementos de Boserup (1970), Garro y
Rodrguez (1995), Del Razo (2003), Emerek (2003), Cuadros (2004), Abramo (2006), Bernat (2007) y
Jurez y Aboites (2008).

ID = ndice de disimilitud. Indica la proporcin de mujeres ocupadas que sera necesario que cam-
bien de ocupacin para lograr una perfecta integracin.

MSS (WE) = Indicador de segregacin, mide la diferencia absoluta de la proporcin de mujeres y la


proporcin de empleados en las ocupaciones.

IP = ndice que mide la proporcin de la fuerza laboral que se necesitara cambiara de empleo para
eliminar la segregacin.

El ndice cero parte de que existe un mercado laboral verdaderamente desagregado, con una par-
ticipacin de 50% de mujeres en el mercado laboral, as como 50% de mujeres en cada ocupacin.

Aboites_PL09_10.indd 137 12/2/14 11:45 AM


6 Sandra Rueda Barrientos*
Gilberto Aboites Manrique
Ignacio Llamas Huitrn

* La base de este captulo corresponde a la tesis de maestra en Economa


Regional presentada por la autora (vase Rueda, 2013), bajo la direccin
de los coautores.

Aboites_PL09_10.indd 138 12/2/14 11:45 AM


P
atrones
de consumo
y hogares
en pobreza
alimentaria,
Jalisco 1996
y 2008

139

! Introduccin

E
l inters por estudiar los patrones de gasto alimentario de
los hogares se ha incrementado en los ltimos aos. Ello
se debe a la disponibilidad de ms y mejor informacin
estadstica; a la necesidad de lograr una mayor comprensin de
las relaciones existentes entre la estructura socioeconmica de la
poblacin y el mercado; y al inters de alcanzar un mejor enten-
dimiento de esos fenmenos a nivel de las unidades poltico ad-
ministrativas denominadas estados.

El gasto en alimentacin refleja un comportamiento cultural transmitido a tra-


vs de los hbitos de consumo condicionado, en buena medida, por la capa-
cidad econmica que tienen los hogares para adquirir los bienes y servicios en
el mercado. Lo anterior significa una distribucin del gasto significativamente
diferente entre hogares pobres y no pobres, as como entre los rurales y los urba-
nos. Entonces, se entiende por un patrn de gasto alimentario a la estructura del
gasto en alimentos que un hogar o un grupo social acostumbra consumir, for-
mado culturalmente por hbitos, costumbres y tradiciones (Aboites y Flix, 2010;
Martnez et al., 2010).

Este trabajo indaga, apoyado en la informacin estadstica de la Encuesta Nacional


de Ingreso Gasto de los Hogares (ENIGH), si existen diferencias significativas en-
tre los patrones de gasto alimentario a nivel estatal con respecto a los observados
a nivel nacional. Con esa inquietud en mente se identific una entidad federal
muestreada en forma representativa por el INEGI, de suerte tal que permitiera el con-
traste estado/pas. El estado de Jalisco, para 1996 y 2008, present esa caracterstica.

Aboites_PL09_10.indd 139 12/2/14 11:45 AM


Con la finalidad de acotar el contraste en trminos de la capacidad adquisitiva de los
Manejo de las bases de datos y la construccin

hogares, se decidi trabajar cuatro grupos de hogares: pobres y no pobres, y rurales


y urbanos.

La diferenciacin de los hogares facilit el abordaje metodolgico del tema, as


de indicadores socioeconmicos

como la justificacin de la pertinencia social de la investigacin, pues se tra-


ta un problema socialmente importante: la pobreza al nivel de hogar. Basta mirar
la Grfica 1 para percatarse de su dimensin. En 2010, 69% de los hogares viva
en la pobreza y las magnitudes entre el mbito nacional (ilustrado con lneas conti-
nuas dentro de la grfica) y estatal (ilustrado con puntos) mostraban tendencias si-
milares, aunque con diferencias sustantivas en trminos porcentuales, pues Jalisco
se mantena por debajo de la media nacional en las tres clasificaciones de pobreza
(alimentaria, de capacidades y de patrimonio).1

Grfica 1. Evolucin de las lneas de pobreza


en Mxico y Jalisco, 1992-2010
140

Fuente: Elaboracin propia con base en estimaciones de CONEVAL basadas en ENIGH 1996,
2000, 2005 y 2008; Segundo conteo de poblacin y vivienda 2005; y XII Censo de poblacin y
vivienda 2000.

Este captulo responde a las preguntas

cules son las diferencias ms importantes entre los patrones de gasto de los
hogares rurales y urbanos, y entre los hogares pobres y no pobres?; y
cul ha sido el cambio en el patrn de gasto alimentario de los hogares ja-
liscienses pobres, no pobres, rurales y urbanos entre 1996 y 2008?

El propsito central es aportar informacin metodolgica til para las personas inte-
resadas en el manejo de las bases de datos socioeconmicas, para que puedan repro-

1 El CONEVAL ha trabajado abundantemente el tema de pobreza y las lneas de pobreza; vase:


www.coneval.gob.mx/Medicion/Paginas/Lineas-de-bienestar-y-canasta-basica.aspx.

Aboites_PL09_10.indd 140 12/2/14 11:45 AM


ducir el ejercicio e incluso realizar un anlisis semejante, fundamentado en la teora
del consumidor, haciendo uso de una funcin de utilidad del tipo Cobb-Douglas.

en pobreza alimentaria, Jalisco 1996 y 2008


El documento se organiz en cuatro secciones: introduccin, desarrollo temtico,
conclusiones y descripcin del procedimiento utilizado. Esta ltima seccin inclu-

Patrones de consumo y hogares


ye el archivo do file correspondiente al software STATA, el cual muestra el uso de
distintos indicadores en el anlisis socioeconmico.

! Desarrollo temtico

El patrn de consumo alimentario se caracteriz mediante funciones de utilidad


donde cada ni representa la proporcin de gasto para cada grupo de poblacin y
grupo de alimentos en que se organiz la informacin del gasto alimentario, regis-
trada en la ENIGH, contrastando el nivel nacional con el estado de Jalisco para 1996
y 2008 (Cuadro 1).
141
El anlisis comparativo se realiz mediante el uso de la funcin de utilidad tipo
Cobb-Douglas,2 de suerte tal que cada grupo tendra una funcin de utilidad
de la forma siguiente:

max u(x1, x2 ,, xn) = x 1 1x 2 2 x nn

s.a. m = p1 x1 + p2 x2) = ++ pn xn

donde

u = utilidad
m = gasto
xi = cantidades de consumo
i = proporciones de gasto
pi = precios

Para calcular la proporcin del gasto en cada uno de los bienes consumidos se
utilizaron las siguientes frmulas:

1 = p1 x1 / m, 2 = p2 x2 / m ,,n = pn xn / m

i = 1 para cada funcin de utilidad

2 Esta funcin tiene la propiedad de que los exponentes de los argumentos representan las propor-
ciones del ingreso del hogar gastadas en cada uno de los bienes. La observacin de las canastas
consumidas y los precios a los que consume un hogar puede ayudar a generar funciones in-
directas de utilidad. Sin embargo, debido a la ausencia de informacin de precios y cantidades se
trabajar con este tipo de funcin puesto que contamos con informacin de proporciones de gasto
(Nicholson, 2004).

Aboites_PL09_10.indd 141 12/2/14 11:45 AM


Cuadro 1. Gasto de los hogares por grupo de alimentos
Manejo de las bases de datos y la construccin

Pobres No pobres Rural Urbano


Cereales 1P 1N 1R 1U

Carnes, pescados y mariscos 2P 2N 2R 2U


de indicadores socioeconmicos

Lcteos 3P 3N 3R 3U

Huevo 4P 4N 4R 4U

Tubrculos crudos o frescos 5P 5N 5R 5U

Verduras y legumbres 6P 6N 6R 6U

Leguminosas 7P 7N 7R 7U

Frutas 8P 8N 8R 8U

Bebidas no alcohlicas 9P 9N 9R 9U

Alimentos y bebidas 10P 10N 10R 10U


consumidas fuera del hogar
142 Otros alimentos 11P 11N 11R 11U

Fuente: Elaboracin propia.

Donde cada una de las i expresa la proporcin del gasto destinado por los hogares
rurales, urbanos, pobres y no pobres a cada grupo de alimentos. El hecho de con-
siderar la sumatoria igual a 1 implica que los hogares obtienen utilidad nicamente
del gasto en alimentos ya que es el tema de inters. Sin embargo, el gasto de los
hogares en alimentos represent solo 42% y 33.6% en 1996 y 2008, respectivamente.

As, el gasto en alimentos se agrup por grupos de bienes de manera tal que pu-
dieran ser notorias las diferencias tanto en las proporciones de gasto como en el
cambio en las mismas entre los dos aos del anlisis (Cuadro 1).

Las funciones de utilidad correspondientes a los gastos en alimentos muestran un


patrn de gasto de los hogares dividido en 6 subconjuntos que se intersecan entre
s, cuyas proporciones del gasto, en cada grupo de alimentos, indica la importancia
relativa promedio de este en las preferencias de los hogares (Cuadro 2).

De esta manera se obtuvo un resumen del patrn de gasto alimentario para cada
subconjunto de hogares en ambos aos. Las diferencias identificadas entre las pro-
porciones de gasto en 1996 y 2008 se interpretaron como cambios en los patrones
de gasto alimentario; asumiendo que todo lo que se compra en el hogar es consu-
mido y que la utilidad se obtiene de los alimentos consumidos. El gasto del ingreso
disponible destinado a cada grupo de alimentos expresa las preferencias o las prio-
ridades de los hogares cuando eligen sus despensas o canastas de bienes.

Las funciones del Cuadro 2 implican tericamente que cada conjunto de hogares
maximiza su utilidad al tomar tales decisiones de gasto. Por ejemplo, como puede
verse en las Grficas 2 y 3, considerando las proporciones en que se distribuy el

Aboites_PL09_10.indd 142 12/2/14 11:45 AM


Cuadro 2. Funciones de utilidad

en pobreza alimentaria, Jalisco 1996 y 2008


1996 max u J 6 = Ce1.172Cpm2.229 La3.154 H 4.032T5.012V6.069 Le7.076 F8.035 B9.072 Fh100.066O11.082
2008 max u J 8 = Ce1.185Cpm2.188 La3.136 H 4.027T5.011V6.066 Le7.035 F8.033 B9.084 Fh100.152O11.082
max uP 6 = Ce1.228Cpm2.188 La3.135 H 4.041T5.013V6.077 Le7.135 F8.021 B9.056 Fh10.026O11.08

Patrones de consumo y hogares


max uP 8 = Ce1.251Cpm2.158 La3.141 H 4.046T5.011V6.074 Le7.058 F8.021 B9.086 Fh10.073O11.081
max u N 6 = Ce1.154Cpm2.242 La3.16 H 4.03T5.012V6.066 Le7.058 F8.04 B9.077 Fh10.079O11.082
max u N 8 = Ce1.178Cpm2.192 La3.135 H 4.025T5.011V6.066 Le7.033 F8.034 B9.083 Fh10.16O11.083
max uR 6 = Ce1.204Cpm2.226 La3.127 H 4.026T5.014V6.081 Le7.102 F8.026 B9.066 Fh10.037O11.092
max uR 8 = Ce1.211Cpm2.182 La3.13 H 4.03T5.014V6.072 Le7.051 F8.03 B9.084 Fh10.108O11.087
max uU 6 = Ce1.157Cpm2.231 La3.167 H 4.036T5.011V6.063 Le7.064 F8.04 B9.075 Fh10.081O11.077
max uU 8 = Ce1.175Cpm2.191 La3.138 H 4.026T5.01V6.065 Le7.030 F8.034 B9.083 Fh10.167O11.081
max u1Q 6 = Ce1.249Cpm2.161 La3.111 H 4.042T5.014V6.084 Le7.163 F8.017 B9.054 Fh100.026O11.08 143
max u1Q 8 = Ce1.245Cpm2.168 La3.134 H 4.041T5.013V6.074 Le7.057 F8.022 B9.088 Fh100.078O11.078
max uRQ & = Ce1.159Cpm2.241 La3.161 H 4.031T5.012V6.066 Le7.062 F8.038 B9.075 Fh100.073O11.082
max uRQ 8 = Ce1.175Cpm2.192 La3.136 H 4.025T5.011V6.066 Le7.032 F8.035 B9.083 Fh100.163O11.083

Fuente: Elaboracin propia con base en clculos a partir de las ENIGH 1996 y 2008.

gasto alimentario en cada uno de los hogares, se aprecia que los hogares con ma-
yor poder adquisitivo asignaron 24.2% y 19.2% de su ingreso a la compra de carnes,
mientras que los hogares cuyo ingreso fue menor (hogares en pobreza alimentaria)
asignaron 18.8% y 15.8% en los dos aos de estudio, respectivamente. Esta tendencia
se replic al considerar como pobres a los hogares del primer quintil, lo cual sugiere
que se trata de un bien de lujo para los hogares pobres y, en consecuencia, pro-
porcionalmente el gasto es menor en los hogares pobres que en los no pobres.

Grfica 2. Patrn de gasto del estado de Jalisco, 1996

Fuente: Elaboracin propia con base en ENIGH 1996.

Aboites_PL09_10.indd 143 12/2/14 11:45 AM


Grfica 3. Patrn de gasto del estado de Jalisco, 2008
Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

Fuente: Elaboracin propia con base en ENIGH 2008.


144
Tambin se observ que los hogares pobres dedicaron 13.5% y 5.8% de su gasto a le-
guminosas y semillas, mientras que los no pobres le dedicaron solamente 5.8% y 3.3%
en los dos aos de estudio, respectivamente. Diferencias similares se observan en-
tre los hogares rurales y urbanos, ya que estos dedicaron al gasto en leguminosas
y semillas, respectivamente, 10% y 6.4% en 1996, y 5.1% y 3.0% en 2008. Estas cifras
apoyan la hiptesis de que los hogares pobres consumen estos bienes en mayor
proporcin que los no pobres, porque son una fuente de protena de bajo precio.

Ahora bien, para analizar el cambio en los patrones de gasto alimentario se obtu-
vieron las diferencias porcentuales de participacin de cada categora de alimentos,
para cada grupo de hogares. As, en la Grfica 4 puede apreciarse que para el estado
de Jalisco hubo un incremento en el consumo fuera del hogar de 8.5%, en bebidas
de 2.4% y en cereales de 1%. Mientras que el gasto disminuy 4% en carnes, 2% en
leche y derivados, y 4% en leguminosas y semillas.

El consumo fuera del hogar aument en todos los hogares entre los dos aos de
estudio, si bien el aumento fue menor en los hogares pobres, rurales y del primer
quintil en relacin con sus respectivas contrapartes: no pobres, urbanos y de los
quintiles 2-5. Tambin el consumo en bebidas aument en todos los hogares, pero
el comportamiento fue el inverso del observado en el consumo fuera del hogar;
es decir, el aumento fue menor en los hogares no pobres, urbanos y de los quin-
tiles 2-5 en relacin con sus respectivas contrapartes: pobres, rurales y del quintil
5. Asimismo, el consumo de cereales aument en todos los hogares; el aumento
fue similar en los hogares pobres y no pobres; sin embargo, el aumento fue menor
en los hogares rurales y en los del primer quintil en relacin con sus contrapartes:
hogares urbanos y de los quintiles 2-5.

El gasto en leguminosas y semillas disminuy en todos los hogares entre los dos
aos de estudio. La disminucin fue mayor en los hogares pobres pues su gasto

Aboites_PL09_10.indd 144 12/2/14 11:45 AM


Grfica 4. Cambio porcentual en el patrn de gasto alimentario
de los hogares del estado de Jalisco

en pobreza alimentaria, Jalisco 1996 y 2008


Patrones de consumo y hogares
Cereales Carnes, Leche y Huevo Tubrculos Verduras y Leguminosas Frutas Bebidas Fuera
pescados derivados legumbres y semillas (c, t, ch) del hogar
y mariscos

Fuente: Elaboracin propia con base en ENIGH 1996 y 2008. 145

en este rubro decreci 8%, en los del primer quintil decreci 11% y en los hogares
rurales 6%. Mientras que la cada en el gasto en leguminosas y semillas fue menor
en los hogares no pobres con alrededor de 3% y en los de los quintiles 2-5 con un
decremento de 3.7%.

El gasto en carnes, pescados y mariscos disminuy en todos los hogares con ex-
cepcin de los del primer quintil. De acuerdo con FAO-OMS (2003) y Rodrguez y
Ortiz (1983) existe una tendencia hacia el consumo de protenas de origen animal
en detrimento de la de origen vegetal. Sin embargo, los resultados obtenidos en es-
ta investigacin sealan que en el estado de Jalisco no fue as, dado que el gasto
en el grupo de alimentos que incluye tales protenas (carnes, pescados y mariscos)
disminuy en casi todos los hogares.

Segn la FAO, en India la leche se comport en aos recientes como un bien de


lujo, lo cual no sucede en el estado de Jalisco en los aos analizados. En el estado
se observ un aumento en el gasto en productos lcteos de los hogares pobres,
rurales y del primer quintil mientras que se observ una disminucin en sus con-
trapartes: hogares no pobres, urbanos y de los quintiles 2-5. Es probable que ello
se asocie con el hecho de que Jalisco aporta 18% del total nacional de leche pero,
sobre todo, al precio subsidiado de este artculo (Fuentes y Soto, 2006).

En las Grficas 5 y 6 se muestran las diferencias en el patrn de gasto alimentario de


Mxico con respecto al de Jalisco para 1996 y 2008, respectivamente. En general
se observa una tendencia hacia la homogeneizacin de un patrn de gasto alimen-
tario nacional. Al comparar ambas grficas, puede notarse que las diferencias en el
gasto en leche y derivados, huevo y tubrculos han disminuido entre 1996 y 2008;
aunque las diferencias en gasto en lcteos y tubrculos se mantuvieron constantes
para los hogares pobres y los del primer quintil. En la primera observacin, Jalisco

Aboites_PL09_10.indd 145 12/2/14 11:46 AM


Grfica 5. Diferencias entre el gasto promedio
Manejo de las bases de datos y la construccin

en alimentos nacional y de Jalisco, 1996


de indicadores socioeconmicos

Cereales Carnes Leche y Huevo Tubrculos Verduras y Leguminosas Frutas Bebidas Fuera Otros
derivados legumbres y semillas (c, t, ch) del hogar

146 Fuente: Elaboracin propia con base en ENIGH 1996.

tuvo un gasto en carne superior a nivel nacional, en todos los hogares, con excep-
cin de los rurales, de alrededor de 4%. Tambin tuvo un gasto superior al nacional
en leche y derivados en todos los hogares con una diferencia promedio de 4%, lo
que puede deberse a que el estado de Jalisco es una zona productora de leche; asi-
mismo, tuvo un gasto superior en leguminosas y semillas de 1% en promedio.

Grfica 6. Diferencias entre el gasto promedio


en alimentos nacional y de Jalisco, 2008

Cereales Carnes, Leche y Huevo Tubrculos Verduras y Leguminosas Frutas Bebidas Fuera Otros
pescados derivados legumbres y semillas (c, t, ch) del hogar
y mariscos

Fuente: Elaboracin propia con base en ENIGH 2008.

Aboites_PL09_10.indd 146 12/2/14 11:46 AM


La tendencia a la homogeneizacin de un patrn de gasto alimentario nacional
tambin se observ en el gasto en cereales ya que la diferencia promedio entre

en pobreza alimentaria, Jalisco 1996 y 2008


el gasto en Jalisco y en Mxico disminuy entre 1996 y 2008. Cabe sealar que, en
2008, los hogares no pobres, rurales y urbanos, tuvieron un gasto en cereales con
tendencia a acercarse a la media nacional; la excepcin fue el gasto de los hoga-

Patrones de consumo y hogares


res pobres y del primer quintil, que ahora consumen ms cereales en el estado de
Jalisco que a nivel nacional, aunque en porcentajes diferentes.

El gasto en carnes, pescados y mariscos disminuy en los hogares de Jalisco y, con


ello, disminuy la diferencia del gasto en este rubro entre el estado y el promedio
nacional. Es de notar que todos los hogares de Jalisco mostraron un promedio en el
gasto fuera del hogar mayor al promedio nacional.

Finalmente, la informacin que se muestra en la Grfica 7 permite validar tres gran-


des tendencias. Primera, existe una tendencia hacia un patrn nacional de gasto
alimentario entre 1996 y 2008. Aunque se reproducen las diferencias entre los
patrones de gasto de los hogares segn su situacin econmica, pobre-no pobre, 147
y segn el tamao de la localidad, rural-urbano, el comportamiento general en el
gasto alimentario de los hogares se mueve en la misma direccin; las diferencias
en todos los grupos tienen el mismo signo (positivo o negativo), lo cual indica cierta
tendencia hacia la convergencia en el gasto alimentario.

Segunda, se observa una tendencia hacia la urbanizacin del patrn nacional de


gasto alimentario. Ello se manifiesta en el gasto en los grupos: huevo, verduras
y gasto fuera del hogar; aunque se mantienen las diferencias entre los patrones de
los hogares pobres y no pobres.

Grfica 7. Diferencias en el patrn de gasto del hogar


pobre-no pobre y rural-urbano

Cereales Carnes Leche y Huevo Tubrculos Verduras y Leguminosas Frutas Bebidas Fuera Otros
derivados legumbres y semillas (c, t, ch) del hogar

Fuente: Elaboracin propia con base en ENIGH 1996 y 2008.

Aboites_PL09_10.indd 147 12/2/14 11:46 AM


Tercera, las familias pobres y rurales gastan ms en cereales y leguminosas, con un
Manejo de las bases de datos y la construccin

promedio de 2% ms que las familias no pobres y urbanas. Este grupo alimentario


constituye, tal vez, la principal fuente de protena de los hogares mexicanos pues
tambin pudo observarse que el consumo de carnes es significativamente menor
en los hogares no pobres y urbanos.
de indicadores socioeconmicos

El patrn de gasto alimentario de Jalisco tendi hacia la homogeneizacin con


el patrn de gasto nacional entre los aos analizados, 1996 y 2008. Este hecho se
observ particularmente en los grupos de alimentos: leche y derivados, huevo,
tubrculos y cereales. Adems, se pudo apreciar que existe una tendencia a la con-
vergencia en el gasto rural y urbano en cereales, carnes, leche y derivados, legumi-
nosas y semillas, as como en frutas. Esta tendencia permite afirmar que existe una
tendencia hacia la urbanizacin de los patrones de gasto.

Los resultados ms sorprendentes se presentan en el gasto en alimentos fue-


ra del hogar, ya que entre 1996 y 2008 dicho gasto tuvo un enorme crecimiento;
148 por ejemplo, creci 16.3% en los quintiles 2-5. Incluso los hogares en pobreza ali-
mentaria incrementaron su gasto fuera del hogar pasando de 2.6% en 1996 a 7.3%
en 2008.

! Conclusiones

Cabe sealar que el consumo en bebidas se increment en todos los grupos de la


poblacin, destacando el incremento en los hogares del primer quintil, los pobres
y los del rea rural.

! Pasos en el programa STATA

Los archivos se deben organizar en carpetas para cada uno de los aos de ENIGH
que se van a analizar. Por ejemplo, se genera una carpeta y se nombra ENIGH 08,
y dentro de esta se incluye una primera, a la que se llamar data, para guardar las
bases de datos descargadas de INEGI en formato DTA (el cual es compatible con el
programa); una segunda servir para guardar los do files: el archivo de pobreza que
publica CONEVAL-INEGI y los que a continuacin se sealan, usados para obtener
las proporciones de gasto en alimentos.

A continuacin se corre el do file de pobreza para generar as las tres lneas de po-
breza: lp1 o lnea de pobreza alimentaria, que es a la que se considerar como
poblacin pobre; lp2, lnea de pobreza de capacidades; y lp3, la lnea de pobre-
za patrimonial.

Posteriormente se elabora un archivo ms del mismo tipo con las siguientes


instrucciones:

Aboites_PL09_10.indd 148 12/2/14 11:46 AM


* En este archivo se desarrollan las instrucciones para obtener los datos de
las variables tanto a nivel nacional como a nivel entidad federativa, puede

en pobreza alimentaria, Jalisco 1996 y 2008


seleccionarse cualquiera de los estados o simplemente eliminar unas u
otras para realizar el anlisis de las variables solamente para Mxico o para
uno de los estados. Las primeras instrucciones despliegan una tabla que

Patrones de consumo y hogares


contiene la extensin de la matriz de datos, se configura el tamao de la
memoria, el mximo de variables a utilizar;
#delimit;
clear matrix;
clear;
cap clear;
cap log close;
set mem 500m;

*Ahora se vincula al programa con las carpetas que se generaron para que
en ellas se guarden los archivos temporales y se extraigan de ellas los datos;
gl data=C:\Users\Sandy\Documents\Base de Datos\ENIGH 08\data; 149
gl log=C:\Users\Sandy\Documents\Base de Datos\ENIGH 08\log;
gl bases=C:\Users\Sandy\Documents\Base de Datos\ENIGH 08\temp;

*indica que los datos que se van a usar son los de gasto diario que es uno
de los archivos descargados de INEGI y se encuentra en la carpeta de data;
use $data\gastodiario.dta, clear;

*con las siguientes instrucciones se generaron las variables que definen los
grupos de alimentos, las claves que indican la delimitacin de cada grupo,
estn en el archivo descriptivo de la ENIGH que se descarga del mismos
sitio que los datos;
gen dcereales=cond(clave>=A001 & clave<=A024,1,0);
gen dcarnes=cond(clave>=A025 & clave<=A074,1,0);
gen dlecheyder=cond(clave>=A075 & clave<=A092,1,0);
gen dhuevo=cond(clave>=A093 & clave<=A094,1,0);
gen dtuberculos=cond(clave>=A101 & clave<=A106,1,0);
gen dverdylegr=cond(clave>=A107 & clave<=A136,1,0);
gen dlegmsysem=cond(clave>=A137 & clave<=A146,1,0);
gen dfrutas=cond(clave>=A147 & clave<=A172,1,0);
gen dbebidasctch=cond((clave>=A215 & clave<=A222,1,0)|
(clave>=A176 & clave<=A182),1,0);
gen dfuerah=cond(clave>=A243 & clave<=A247,1,0);
gen dotros=cond((clave>=A173 & clave<=A175,1,0)|
(clave>=A183 & clave<=A212,1,0)|(clave>=A095 & clave<=A100),1,0);

*indica el gasto total en alimentos;


egen dalimentos=rsum(dcereales-dotros);
tab dalimentos;

Aboites_PL09_10.indd 149 12/2/14 11:46 AM


*Debido a que existe tambin un clculo de gasto trimestral, se calcula
Manejo de las bases de datos y la construccin

el gasto mensual dividiendo ste entre 3, y posteriormente se multiplica


el gasto diario en cada grupo de alimentos por sta nueva variable para
obtener el gasto mensual.
gen gasm=gas_tri/3;
de indicadores socioeconmicos

gen cereales=dcereales*gasm;
gen carnes=dcarnes*gasm;
gen lecheyder=dlecheyder*gasm;
gen huevo=dhuevo*gasm;
gen tuberculos=dtuberculos*gasm;
gen verdylegr=dverdylegr*gasm;
gen legmsysem=dlegmsysem*gasm;
gen frutas=dfrutas*gasm;
gen bebidasctch=dbebidasctch*gasm;
gen fuerah=dfuerah*gasm;
gen otros=dotros*gasm;
150 gen alimentos=dalimentos*gasm;

*genera una nueva variable para identificar al hogar;


gen str folio= folioviv + foliohog;

*suma el gasto mensual de todos los grupos de alimentos para obtener el


gasto en alimentos mensual total;
collapse (sum) cereales-alimentos, by(folio);

*ordena las variables por folio;


sort folio;

*divide el gasto mensual en cada grupo de alimentos entre el gasto total,


para obtener las proporciones de gasto en cada grupo de alimentos por mes
tomando al gasto total en alimentos como cien por ciento;
gen rcereales=cereales/alimentos;
gen rcarnes=carnes/alimentos;
gen rlecheyder=lecheyder/alimentos;
gen rhuevo=huevo/alimentos;
gen rtuberculos=tuberculos/alimentos;
gen rverdylegr=verdylegr/alimentos;
gen rlegmsysem=legmsysem/alimentos;
gen rfrutas=frutas/alimentos;
gen rbebidasctch=bebidasctch/alimentos;
gen rfuerah=fuerah/alimentos;
gen rotros=otros/alimentos;

*indica la ruta para guardar todos los clculos y variables realizados;


save $bases\gasto alimentos.dta, replace;

Aboites_PL09_10.indd 150 12/2/14 11:46 AM


*variables de control para corroborar que las sumas sean correctas ;
egen control=rsum(cereales-otros);

en pobreza alimentaria, Jalisco 1996 y 2008


gen control2=alimentos/control;
tab control2;

Patrones de consumo y hogares


*control de que las razones sean correctas;
egen cl=rsum(rcereales-rotros);
tab cl;

Hasta aqu ya estn generadas las lneas de pobreza y las variables de gasto mensual.
Se elabora un nuevo do file para realizar el anlisis de gasto planteado previamente,
el cual requiere conocer las proporciones del gasto que realizan los hogares rurales,
urbanos, en pobreza alimentaria y no pobres en cada grupo de alimentos.

#delimit;
clear matrix; 151
clear;
cap clear;
cap log close;
set mem 500m;

*Ahora se vincula al programa con las carpetas que se generaron para que
en ellas se guarden los archivos temporales y se extraigan de ellas los datos;
gl data=C:\ Documents\Base de Datos\ENIGH 08\data;
gl log=C:\ Documents\Base de Datos\ENIGH 08\log;
gl bases=C:\ Documents\Base de Datos\ENIGH 08\temp;

*Indica que use la base de datos generada con el do file de pobreza y la


ENIGH llamada base final08.dta, y que se encuentra ya en la carpeta de
archivos temporales;

use $bases\basefinal08.dta, clear;

*Genera la variable entidad seleccionando los primeros dgitos de la


variable folio ya existente;
gen entidad=substr(folio,1,2);
destring entidad, replace;

*Incidencia en hogares creando una tabla que muestra el porcentaje de los


hogares en pobreza alimentaria, de capacidades y de patrimonio;

tabstat poblp1 poblp2 poblp3 if entidad==14 [w=factor], by(rururb)


stats(mean sum) format(%15.4g);

Aboites_PL09_10.indd 151 12/2/14 11:46 AM


*Incidencia en personas creando una tabla que muestra el porcentaje de
Manejo de las bases de datos y la construccin

personas en pobreza alimentaria, de capacidades o de patrimonio y adems


tomando en cuenta tambin si su hogar se localiza en zona rural o urbana;
tabstat poblp1 poblp2 poblp3 if entidad==14 [w=factorp], by(rururb)
stats(mean sum) format(%15.4g);
de indicadores socioeconmicos

*ordena por folio y une la base de datos de gasto en alimentos;


sort folio;
merge folio using $bases\gasto alimentos.dta;

*crea una tabla con las proporciones de consumo para todos los grupos de
alimentos y los hogares en situacin de pobreza alimentaria y no pobres a
nivel nacional, considerando adems el factor de expansin del censo;
tabstat rcereales- rotros [w=factor], c(s);
tabstat rcereales- rotros [w=factor] if poblp1==1, c(s);
tabstat rcereales- rotros [w=factor] if poblp1==0, c(s);
152
*Genera la misma informacin que la tabla anterior pero considerando
nicamente al estado de Jalisco;
tabstat rcereales- rotros [w=factor] if ent==14, c(s);
tabstat rcereales- rotros [w=factor] if ent==14 & poblp1==1, c(s);
tabstat rcereales- rotros [w=factor] if ent==14 & poblp1==0, c(s);

#delimit;
*Crea la tabla de proporciones de consumo para los hogares localizados en
zonas rurales y urbanas en el estado de Jalisco;
tabstat rcereales- rotros [w=factor] if ent==14, c(s);
tabstat rcereales- rotros [w=factor] if ent==14 & rururb==1, c(s);
tabstat rcereales- rotros [w=factor] if ent==14 & rururb==0, c(s);

#delimit;
*Para calcular los errores estndar nacional pobreza;
svyset upm [w=factor], strata(est_dis) vce(linearized);
svy linear, level(95): mean rcereales-rotros;
svy linear, level(95): mean rcereales-rotros, over(poblp1);

#delimit;
*Para calcular los errores estndar de las proporciones estimadas del estado
de Jalisco de los hogares en pobreza;
svyset upm [w=factor], strata(est_dis) vce(linearized) singleunit(centered);
svy linear, level(95): mean rcereales-rotros if ent==14;
svy linear, level(95): mean rcereales-rotros if ent==14, over(poblp1);

Aboites_PL09_10.indd 152 12/2/14 11:46 AM


#delimit;
*Para calcular los errores estndar de las proporciones de consumo

en pobreza alimentaria, Jalisco 1996 y 2008


estimadas de la poblacin rural y urbana a nivel nacional;
svyset upm [w=factor], strata(est_dis) vce(linearized);
svy linear, level(95): mean rcereales-rotros;

Patrones de consumo y hogares


svy linear, level(95): mean rcereales-rotros, over(rururb);

#delimit;
*Para calcular los errores estndar de las proporciones de consumo
estimadas para la poblacin rural y urbana de Jalisco;
svyset upm [w=factor], strata(est_dis) vce(linearized) singleunit(centered);
svy linear, level(95): mean rcereales-rotros if ent==14;
svy linear, level(95): mean rcereales-rotros if ent==14, over(rururb);

153

Aboites_PL09_10.indd 153 12/2/14 11:46 AM


7 Gilberto Aboites
David Castro
Gustavo Flix
Luis Gutirrez

Aboites_PL09_10.indd 154 12/2/14 11:46 AM


M
ercado laboral

en la industria

metalmecnica.

Regin sureste

de Coahuila

155

! Introduccin

A
partir de los aos setenta, Coahuila vivi un proceso de
cambio estructural que contrast con lo ocurrido a nivel na-
cional. De 1970 a 2006, el sector primario en el estado pas
de 9.6 del PIB a 3.2% pero, a pesar de esto, represent una cada
menos acentuada que el nacional, el cual disminuy de 12 a 3.5%
en el mismo periodo. Sin embargo, los cambios ms relevantes y
contrastantes se apreciaron en los sectores secundario y terciario,
apuntando hacia la consolidacin de una vocacin ms industrial
y equilibrada, pues el primero creci de 35.9 a 42.4% mientras que el
terciario, aunque con fluctuaciones, se mantuvo en 54.4%; situacin
que difiere del nivel nacional, ya que el sector secundario cay de
32.3 a 26.5% y el terciario aument de 55.7 a 70% (Dvila A., 2011:26).

Lo anterior refleja la presencia creciente y dominante de la industria automotriz


Chrysler, General Motors y recientemente Daimler (Freightliner) asentada en lo que
se conoce como regin sureste de Coahuila, as como la preponderancia estadstica
de la divisin industrial 3 (manufactura), particularmente la 3.8 (productos metlicos,
maquinaria y equipo); y en cuanto a servicios, la nmero 7 (transporte, almacena-
miento y comunicaciones) y la 8 (servicios financieros, seguros y bienes inmuebles).

A partir de 1979 las empresas automotrices se instalaron en una zona limtrofe entre
los municipios de Ramos Arizpe y Saltillo, pero ya en las postrimeras del siglo XX
y principios del XXI se expandieron hacia el sureste del municipio de Saltillo, en la
regin llamada Can de Derramadero, donde se instalaron Chrysler y Daimler, as
como las industrias proveedoras (Aboites y Castro, 2011).

Aboites_PL09_10.indd 155 12/2/14 11:46 AM


Dada esta situacin, es recurrente que el gobierno, empresas y organismos civiles
Manejo de las bases de datos y la construccin

se pregunten por los cambios que el mercado laboral enfrentar en la industria au-
tomotriz, pues resulta clave para el crecimiento econmico del estado.

Es inters de este captulo responder a las interrogantes de cul es el tamao de la


de indicadores socioeconmicos

demanda laboral de la industria metalmecnica en la regin sureste de Coahuila y


si habr dificultades para abastecer esa demanda laboral.

El documento se organiz en cuatro apartados: introduccin, desarrollo temtico,


conclusiones y descripcin del procedimiento utilizado, referido a los archivos sin-
taxis, el que permitir evidenciar el uso de distintos indicadores socioeconmicos.

Ya que el trabajo estar delimitado a la regin sureste de Coahuila, integrada por


los municipios de Saltillo, Ramos Arizpe, Arteaga y General Cepeda, se consider la
informacin a nivel municipal y zona metropolitana,1 lo que remite de continuo al
cruce de informacin entre esas localidades. Lo anterior oblig a utilizar la informa-
156 cin censal 2000 y 2010 dado que solo ella provee ese nivel de desagregacin. Sin
embargo, para el anlisis a profundidad de las ocupaciones y condiciones laborales,
fue necesario recurrir a la Encuesta Nacional de Ocupacin y Empleo (ENOE) para
cubrir los aos de 2007 a 2013, periodo del cual dispone de informacin compatible.

! Desarrollo temtico

Demografa y economa

Lo primero fue indagar el volumen de la poblacin que se encontraba trabajando


o buscando trabajo, es decir, la poblacin econmicamente activa (PEA), determi-
nando los segmentos que la componen: la poblacin econmicamente inactiva
(PEI) y la poblacin ocupada (PO), para de esa manera poder responder cul es la
magnitud de la poblacin que vive en la regin y cunto de esta es PEA y PO, y
posteriormente determinar cunto de la PO labora en la industria metalmecnica,
cuestiones que permiten discernir si la metalmecnica tendra problemas o no de
oferta laboral.

De acuerdo con la informacin estadstica, desde 1970 Coahuila crece por encima
de los valores nacionales, siendo Saltillo y Ramos Arizpe los municipios que se han
consolidado como los motores del crecimiento poblacional (Cuadro 1).

Ahora bien, atendiendo a la informacin demogrfica, diferenciada segn rangos


de edad, puede apreciarse que Saltillo y General Cepeda tuvieron un crecimiento
significativo en el rango de 65 aos y ms, con tasas de 5.99% y 4.28% respectiva-
mente, marcando una tendencia hacia el envejecimiento poblacional (Cuadro 2).

1 La zona metropolitana de Saltillo (SEDESOL, CONAPO, INEGI, 2004:21).

Aboites_PL09_10.indd 156 12/2/14 11:46 AM


Cuadro 1. Sureste de Coahuila. Poblacin y tasas de crecimiento, 1970-20102

metalmecnica. Regin sureste de Coahuila


1970 1980 1990 2000 2005 2010
Repblica
51,805,500 69,424,200 85,472,400 100,197,759 106,451,679 112,322,757
Mexicana
Coahuila 1,114,956 1,557,265 1,972,340 2,282,377 2,543,160 2,737,739

Mercado laboral en la industria


Arteaga 15,763 18,345 17,414 19,211 21,620 22,864
General
13,202 13,568 11,966 11,277 12,231 12,448
Cepeda
Ramos
19,266 23,092 28,246 39,827 47,511 75,603
Arizpe
Saltillo 190,994 321,758 440,920 573,764 652,730 721,852

1970-1980 1980-1990 1990-2000 2000-2005 2000-2010


Repblica
2.83 2.13 1.60 1.29 1.10
Mexicana
157
Coahuila 3.23 2.42 1.47 2.30 1.76
Arteaga 1.46 0.53 0.99 2.51 1.68
General
0.26 1.29 0.60 1.73 0.95
Cepeda
Ramos
1.75 2.06 3.46 3.75 6.19
Arizpe
Saltillo 5.04 3.22 2.65 2.74 2.22

Fuente: Elaboracin propia con informacin censal de INEGI, usando la base de datos muestral
digital para 2000 y 2010.

De acuerdo con esta informacin, tres tendencias demogrficas impactaran el


mercado laboral de la industria metalmecnica:

en General Cepeda la PEA tender a decrecer;


Saltillo mantendr en todos los rangos tasas de crecimiento demogrfico su-
periores a las estatales, con ligera ventaja de crecimiento en el grupo de hom-
bres respecto al de mujeres;
Ramos Arizpe continuara su espectacular crecimiento demogrfico apoyado
por fuertes movimientos migratorios, particularmente intermunicipales.

2 La tasa de crecimiento demogrfico puede calcularse de la siguiente manera:

Pt + h
ln
Pt
r=
h
donde ln = logaritmo natural
Pt = poblacin al inicio del periodo
Pt + h = poblacin al final del periodo
h = tiempo medido en aos de dicho periodo (Rodrguez, 2007)

Aboites_PL09_10.indd 157 12/2/14 11:46 AM


12/2/14 11:46 AM
Cuadro 2. Sureste de Coahuila. Poblacin por rangos de edad, 2000-2010
2000 2010 Tasa de crecimiento 2000-2010
Muni/
Sexo
ran_ed 0 a 14 15 a 64 mayor 0 a 14 15 a 64 mayor 0 a 14 15 a 64 mayor
Total Total Total
aos aos 65 aos aos aos 65 aos aos aos 65 aos
Arteaga
3,257 5,662 859 9,778 3,385 7,367 954 11,706 0.37 2.55 1.02 1.74
Mujeres
General
2,007 3,384 448 5,839 1,868 3,920 788 6,576 -0.7 1.42 5.47 1.15
Cepeda
Hombre Ramos
7,460 12,327 1,089 20,876 12,327 25,004 1,330 38,661 4.87 6.85 1.94 5.97
Arizpe
Saltillo 93,801 180,108 10,603 284,512 102,162 234,728 20,128 357,018 0.83 2.57 6.21 2.2
Total
378,870 696,536 53,841 1,129,247 401,758 871,784 82,692 1,356,234 0.57 2.17 4.16 1.77
Coahuila
Arteaga 3,286 5,428 719 9,433 3,346 6,979 833 11,158 0.18 2.44 1.43 1.63
General
1,963 3,077 398 5,438 1,780 3,564 528 5,872 -0.95 1.42 2.74 0.74
Cepeda
Ramos
Mujer 6,119 11,984 848 18,951 12,034 23,717 1,191 36,942 6.55 6.61 3.29 6.47
Arizpe
Saltillo 90,998 185,965 12,289 289,252 103,670 238,806 22,358 364,834 1.26 2.42 5.8 2.25
Total
367,922 726,550 58,658 1,153,130 394,077 897,468 89,960 1,381,505 0.67 2.05 4.14 1.75
Coahuila
Arteaga 6,543 11,090 1,578 19,211 6,731 14,346 1,787 22,864 0.27 2.49 1.21 1.69
General
3,970 6,461 846 11,277 3,648 7,484 1,316 12,448 -0.82 1.42 4.28 0.96
Cepeda
Ramos
Total 13,579 24,311 1,937 39,827 24,361 48,721 2,521 75,603 5.66 6.74 2.55 6.21
Arizpe
Saltillo 184,799 366,073 22,892 573,764 205,832 473,534 42,486 721,852 1.04 2.49 5.99 2.22
Total

Aboites_PL09_10.indd 158
746,792 1,423,086 112,499 2,282,377 795,835 1,769,252 172,652 2,737,739 0.62 2.11 4.15 1.76
Coahuila
Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI.
de indicadores socioeconmicos

158
Manejo de las bases de datos y la construccin
Corresponde ahora determinar la manera cmo en cada localidad se distribuye la

metalmecnica. Regin sureste de Coahuila


poblacin, atendiendo a su condicin de actividad econmica, es decir, identificar
los montos y porcentajes de la PEA, la PO y la PEI (Cuadro 3).

Cuadro 3. Sureste de Coahuila. Actividad econmica de la poblacin, 2010

Mercado laboral en la industria


PEA PO PEI PEA PO PEI

Arteaga 8,306 7,856 9,214 0.75% 0.76% 0.94%

General
4,444 4,268 5,112 0.40% 0.41% 0.52%
Cepeda
Ramos
32,011 30,895 23,333 2.89% 2.98% 2.38%
Arizpe

Saltillo 310,462 293,068 241,385 28.04% 28.24% 24.64%

Total 1,107,128 1,037,924 979,733 100.00% 100.00% 100.00%


159
Fuente: Elaboracin propia con datos del Censo de poblacin y vivienda 2010, INEGI.

Al haber estimado lo anterior, ya se est en condiciones de calcular la poblacin que


habra en un ao cualquiera, posterior a la referencia, dada una base y una tasa de
crecimiento demogrfico estimada. Para ello se despeja Pt + h de la ecuacin utili-
zada para el clculo de la tasa de crecimiento, de esa manera es posible estimar la
poblacin para cualquier ao, por ejemplo hasta el 2025 (vase Grfica 1), haciendo
uso de la funcin logstica-exponencial:

Pt+h = Pt * er*h
donde

e = nmero exponencial
Pt = poblacin al inicio del periodo
Pt + h = poblacin al final del periodo
h = tiempo medido en aos de dicho periodo
r = tasa de crecimiento (Rodrguez, 2007)

Con base en la informacin presentada es claro que nicamente Ramos Arizpe


puede tener limitaciones en la oferta laboral, toda vez que se presentan yuxtapo-
siciones entre la PEA y PO, siendo la primera una aproximacin de la oferta y la
segunda de la demanda laboral.

Teniendo una idea clara de los volmenes de la poblacin y su distribucin en


cuanto a la actividad econmica, es factible dimensionar la estructura del aparato
econmico vigente en cada municipio y por ende en la regin, pasando de un nivel
general de anlisis a uno de mayor precisin, que permitir determinar si en parti-
cular la rama metalmecnica tendra problemas de oferta laboral.

Aboites_PL09_10.indd 159 12/2/14 11:46 AM


Grfica 1. Sureste de Coahuila. Proyecciones del crecimiento
Manejo de las bases de datos y la construccin

en la poblacin total, ocupada y no ocupada en metalmecnica, 2011-2025


de indicadores socioeconmicos

160

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Para ello se requiere diseccionar la PO segn las ramas econmicas en las que
laboraba la poblacin. Con fundamento en ese criterio, puede afirmarse que en
Coahuila ninguna actividad econmica absorbi ms poblacin ocupada
que la industria manufacturera (vanse las columnas 1 y 2 de la Grfica 2) y en
particular la metalmecnica. Sin embargo, cuando esa informacin se desagrega
a nivel municipio, es claro que no todos participan de la misma estructura econ-
mica. Por ejemplo, en Arteaga y General Cepeda la actividad silvoagropecuaria fue
la ms relevante.

Por otra parte, dado que la informacin censal es capturada considerando a la vi-
vienda como unidad de anlisis, es posible identificar el tamao de la localidad en
donde la poblacin reside y por ese conducto determinar si se trata de poblacin
rural o urbana, con base en el criterio de que la poblacin rural es aquella que radica
en localidades de hasta 2!500 habitantes y urbana el resto.

As se pudo definir a nivel municipio si la PEA viva en mbito urbano o rural y,


simultneamente, identificar a la poblacin que labora en la industria y viva en
una localidad rural (Cuadros 4 y 5), lo cual posibilita plantear diferentes hiptesis
respecto del papel que juega la nueva ruralidad en el desarrollo industrial, pues la
informacin estadstica indica una tendencia positiva en esa direccin.

Aboites_PL09_10.indd 160 12/2/14 11:46 AM


Grfica 2. Sureste de Coahuila.

metalmecnica. Regin sureste de Coahuila


Estructura econmica por rama, 2000 y 2010
Transportes, correo y almacenamiento
n.e.
100.0%
Gobierno
Otros servicios

Mercado laboral en la industria


Servicios de alojamiento temporal
80.00% Servicios de esparcimiento
Servicios de salud
Servicios educativos
60.00% Servicio apoyo a negocios
Direccin corporativos y empresas
Servicios profesionales
40.00% Servicios inmobiliarios
Servicios financieros
Informacin medios masivos
20.00% Comercio al por menor
Comercio al por mayor
Industria manufacturera
Construccin
161
0.00%
Coahuila Coahuila Arteaga Arteaga General General Ramos Ramos Saltillo Saltillo Silvoagropecuaria
2000 2010 2000 2010 Cepeda Cepeda Arizpe Arizpe 2000 2010 Metalmecnica
2000 2010 2000 2010

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Cuadro 4. Sureste Coahuila. Hogares por municipio

Rural Rural Urbano Urbano Total Total Rural Urbano Total

Tasa de crecimiento
2000 2010 2000 2010 2000 2010
2000-2010

Arteaga 3,217 3,902 1,478 2,219 4,695 6,121 1.36 1.48 1.41

General
1,816 2,256 900 1,060 2,716 3,316 1.38 1.33 1.36
Cepeda
Ramos
2,251 2,502 7,454 17,984 9,705 20,486 1.27 1.64 1.6
Arizpe

Saltillo 3,704 4,598 132,058 188,512 135,762 193,110 1.37 1.46 1.45

Coahuila 59,489 71,955 496,304 664,760 555,793 736,715 1.36 1.42 1.42

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Las consecuencias de esa circunstancia son muchas, pero resaltan las vinculadas
con las polticas de desarrollo urbano, histricamente catico y desordenado, que
impactan en el terreno ambiental pero tambin en la socialidad (ONU-Hbitat, 2011).

Aboites_PL11_12.indd 161 12/2/14 11:47 AM


Cuadro 5. Habitantes rurales y trabajadores industriales, 2010
Manejo de las bases de datos y la construccin

Metal- Otras Metal- Otras


Total Total
mecnica actividades mecnica actividades
Rural 4,034 84,248 88,282 3.42% 9.16% 8.51%
de indicadores socioeconmicos

Coahuila Urbano 113,791 835,851 949,642 96.58% 90.84% 91.49%


Total 117,825 920,099 1,037,924 100.00% 100.00% 100.00%
Rural 43 4,831 4,874 7.86% 66.10% 62.04%
Arteaga Urbano 504 2,478 2,982 92.14% 33.90% 37.96%
Total 547 7,309 7,856 100.00% 100.00% 100.00%
Rural 152 2,568 2,720 46.91% 65.11% 63.73%
General
Urbano 172 1,376 1,548 53.09% 34.89% 36.27%
Cepeda
Total 324 3,944 4,268 100.00% 100.00% 100.00%
Rural 0 2,943 2,943 0.00% 12.09% 9.53%
Ramos
Urbano 6,544 21,408 27,952 100.00% 87.91% 90.47%
Arizpe
Total 6,544 24,351 30,895 100.00% 100.00% 100.00%
162 Rural 224 5,895 6,119 0.52% 2.36% 2.09%
Saltillo Urbano 42,995 243,954 286,949 99.48% 97.64% 97.91%
Total 43,219 249,849 293,068 100.00% 100.00% 100.00%

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Ello es as, porque a mayor distancia entre el trabajo y la vivienda es menor el tiempo
que tienen los miembros familiares de interactuar y por ende de construir lazos de
solidaridad, situacin que a la postre conlleva la disminucin de la cohesin social;
aunque al parecer quienes tienen su hogar en localidades rurales y trabajan en el
mundo industrial y urbano, han encontrado un mecanismo mediante el cual rom-
per el crculo de la pobreza (de Janvry y Sadoulet, 2001; de Janvry, 2010). Lo anterior
evidencia la relevancia de seguir indagando en la temtica de la distribucin en el
espacio del mercado laboral (rural/urbano), ya que seguramente condicionar cada
vez ms el comportamiento econmico de las regiones.

Una vez precisado si la residencia de la planta laboral era rural o urbana, queda por
averiguar si a lo largo del tiempo se presentaron cambios en trminos de la par-
ticipacin laboral segn el gnero (mujer/hombre), cuestin que en las ciencias
socioeconmicas se visualiza bajo el concepto de segregacin ocupacional.

Aunque est documentado que las mujeres se han incorporado crecientemente a las
actividades econmicas como trabajadoras, generadoras de ingresos y son aportan-
tes de recursos monetarios al hogar, en cada regin y rama econmica se presen-
tan diferencias y matices. Para el caso de la industria metalmecnica, las evidencias
apuntan a que existe segregacin y disparidad salarial en Mxico, en especfico en
la regin sureste de Coahuila (Jurez y Aboites, 2008; Delgadillo 2012)3 pues en la
industria metalmecnica persiste un modelo de trabajo masculino (Cuadro 6).

3 Vase el captulo 5 de este libro: "Segregacin ocupacional por gnero: herramientas de medicin.

Aboites_PL11_12.indd 162 12/2/14 11:47 AM


Cuadro 6. Sureste de Coahuila. Estructura por gnero

metalmecnica. Regin sureste de Coahuila


de la industria metalmecnica, 2010

Hombre Mujer
Coahuila 80.32% 19.68%

Mercado laboral en la industria


Arteaga 82.08% 17.92%

General Cepeda 97.53% 2.47%

Ramos Arizpe 77.70% 22.30%

Saltillo 83.59% 16.41%

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Adems, con fundamento en la informacin estadstica, pudo apreciarse que en


los municipios con preponderancia de la industria metalmecnica, Ramos Arizpe
y Saltillo, el valor que ms se repeta remita a mujeres con edad superior al de los 163
hombres (vase el valor de la moda en el Cuadro 7), lo cual seguramente se re-
laciona con que la informacin censal no permite discriminar entre operarios y
administrativos, siendo este grupo el que mayores edades debe de presentar. Pero
en cualquier caso, el observar tasas de crecimiento demogrfico de 6.19 en Ramos
Arizpe y de 2.22 en Saltillo, superiores al estatal (Cuadros 1 y 2), dentro del rango
15-65 aos, indica que la oferta laboral femenina seguir como una opcin impor-
tante a considerar.

Cuadro 7. Sureste de Coahuila. Edad de los trabajadores


de la industria metalmecnica, 2000-2010

Tasa de
# total Moda
Entidad/gnero crecimiento
2000 2010 2000 2010 2000/2010
Hombre 58,720 94,649 23 25 16.12%
Coahuila
Mujer 13,201 23,110 22 27 17.51%
Hombre 290 449 25 25 15.48%
Arteaga
Mujer 1 98 24 20 980.00%

General Hombre 430 316 22 31 7.35%


Cepeda Mujer 22 8 17 20 3.64%

Ramos Hombre 1,746 5,072 25 25 29.05%


Arizpe Mujer 604 1,456 23 28 24.11%
Hombre 25,251 36,128 24 25 14.31%
Saltillo
Mujer 5,440 7,091 21 39 13.03%

Fuente: Elaborada con informacin de los censos de poblacin y vivienda 2000 y 2010 del INEGI, y
de CONAPO, 2011.

Aboites_PL11_12.indd 163 12/2/14 11:47 AM


En conclusin, considerando que la oferta laboral est dada por la PEA y que la
Manejo de las bases de datos y la construccin

demanda refiere a la PO, es factible afirmar que no hay en el escenario futuro ele-
mentos de juicio suficientes para suponer que el crecimiento demogrfico ser in-
suficiente para abastecer la demanda laboral dentro de la industria metalmecnica.
de indicadores socioeconmicos

Ocupacin y actividad

En este punto, como ya se han sealado las caractersticas generales del mercado
laboral en la regin sureste de Coahuila, queda por ver la ocupacin que realizaban
las personas, es decir, responder a la pregunta qu hacen quienes laboran en la in-
dustria metalmecnica?; sin embargo, eso escapa de la informacin que los censos
aportan, de ah que se recurre al cuestionario ampliado de la ENOE, en particular al
del primer trimestre de 2009 y 2013, y al del segundo de 2007.

Solo que al hacerlo se pierde la posibilidad de diferenciar la problemtica a nivel


municipio, pues la ENOE nicamente tiene representatividad a nivel estatal y para
164 las ciudades que encuesta. Por tanto, la informacin corresponde a Saltillo y Ramos
Arizpe, pero no al resto de los municipios en el sureste del estado.

Para el anlisis se tom en cuenta a la poblacin ocupada4 de la manufactura5 y de


la industria metalmecnica,6 as como a la poblacin desocupada disponible,7 con-
siderando las variables escolaridad, gnero, edad, remuneraciones y prestaciones
sociales de los trabajadores asalariados.

La clasificacin de la poblacin permiti identificar que en 2007 los trabajadores


industriales eran la mayor parte del volumen total laboral, seguido de comerciantes,
trabajadores de servicios personales y oficinistas, sin embargo, esa relacin vari
durante el periodo de estudio, dado que los profesionistas, tcnicos y trabajadores
del arte tuvieron un crecimiento de 44.6% en los nuevos empleos, constituyendo la
tercera ocupacin ms relevante, de manera que uno de cada dos trabajadores ocu-
pados en la zona de Saltillo, durante el primer trimestre de 2013, fueron trabajadores
industriales, profesionistas y tcnicos (Cuadro 8).

En cuanto a las actividades econmicas presentes en la regin, Saltillo, al igual que


el pas, mostr una fuerte concentracin en los servicios, de manera que estos ab-
sorbieron ms de 40% de los empleos en la economa local, seguido por la industria
manufacturera.

4 Corresponde a la pregunta 1, opcin 1, del cuestionario ampliado, quienes manifestaron que du-
rante la semana pasada trabajaron al menos una hora a la semana.
5 A partir de la pregunta 4a (a qu se dedica la empresa, negocio o institucin donde trabaja?) y con
base en el Sistema de Clasificacin Industrial de Amrica del Norte (SCIAN), se consider sector
manufacturero a las industrias clasificadas con las claves 311 hasta 339.
6 Para efectos del estudio, en esta industria se incluyen las actividades clasificadas como: metlica
bsica (331), fabricacin de productos metlicos (332) y fabricacin de equipo de transporte (336).
7 Aquellos que en la pregunta 1 manifestaron no haber trabajado la semana pasada y en la pregunta
2c expresaron estar dispuestos a trabajar la semana pasada.

Aboites_PL11_12.indd 164 12/2/14 11:47 AM


Cuadro 8. Saltillo. Poblacin ocupada por tipo de ocupacin, 2007-2013

Profesionales, Trabajadores

Aboites_PL11_12.indd 165
Trabajadores Trabajadores Trabajadores
tcnicos y Funcionarios industriales Operadores Trabajadores
Aos de la Oficinistas Comerciantes en servicios en proteccin
trabajadores y directivos artesanos de transporte agropecuarios
educacin personales y vigilancia
del arte y ayudantes

2007 14,649 8,885 4,809 18,149 60,861 32,736 9,963 19,697 4,708 465

2009 18,738 8,466 6,699 21,201 54,368 30,143 8,572 22,579 4,438 1,043

2013 30,541 8,571 6,142 22,222 73,083 31,788 11,884 24,904 622 830

Participacin %

2007 311.2 188.7 102.1 385.5 1292.7 695.3 211.6 418.4 100.0 9.9

2009 422.2 190.8 150.9 477.7 1225.1 679.2 193.2 508.8 100.0 23.5

2013 4910.1 1378.0 987.5 3572.7 11749.7 5110.6 1910.6 4003.9 100.0 133.4

Variacin
15,892 314 1,333 4,073 12,222 948 1,921 5,207 4,086 365
absoluta

Variacin
108.5 3.5 27.7 22.4 20.1 2.9 19.3 26.4 86.8 78.5
relativa %

Contribucin
-388.9 7.7 32.6 99.7 299.1 23.2 47.0 127.4 100.0 8.9
%

Fuente: INEGI, ENOE, varios aos.

Mercado laboral en la industria


165

metalmecnica. Regin sureste de Coahuila

12/2/14 11:47 AM
Para 2007, considerando el rango de edad de 18 a 70 aos, Saltillo contaba con una
Manejo de las bases de datos y la construccin

PEA8 de 200 mil personas (Cuadro 9), donde los hombres representaron el 59% y el
resto las mujeres.

Cuadro 9. Saltillo. Poblacin ocupada por actividad, 2007-2013


de indicadores socioeconmicos

Industria ma-
Ao Construccin Comercio Servicios Agropecuario
nufacturera

2007 13,239 48,077 36,758 75,035 804

2009 14,931 41,965 33,182 83,454 1,434

2013 17,926 64,267 39,360 86,659 1,052

Participacin %

2007 7.6 27.6 21.1 43.1 0.5

2009 8.5 24 19 47.7 0.8

166 2013 8.6 30.7 18.8 41.4 0.5

Variacin
4,687 16,190 2,602 11,624 248
absoluta

Variacin
35.4 33.7 7.1 15.5 30.8
relativa (%)

Contribucin
13.3 45.8 7.4 32.9 0.7
(%)

Fuente: INEGI, ENOE, varios aos.

Poblacin econmicamente activa y ocupacin en Saltillo

La clasificacin de la PEA, atendiendo a su estado ocupacional, permite identificar


que la tasa de desempleo abierto para 2007 fue de 6.9%, lo cual, en trminos abso-
lutos, represent 13!800 personas.9 Para 2009 dicho indicador subi a 10.1% (21!400
trabajadores), producto de la crisis econmica, y posteriormente descendi para
llegar en el primer trimestre de 2013 a una tasa de desempleo de 6.9% que afect
a 16!600 personas (Cuadro 10), hecho que se interpreta como un indicador de la
magnitud del ejrcito de reserva laboral existente en Saltillo.

Entre 2007 y 2013, en un lapso de seis aos, la PEA aument en ms de 38 mil per-
sonas, equivalente a 19.4%; as, al primer trimestre de 2013 se dispona de 240 mil
trabajadores, donde los hombres contribuyeron con 51.9% del incremento, siendo

8 En este apartado se acota la PEA a la poblacin en edad laboral ubicada en el rango de 18 a 70


aos que participa en el mercado laboral, ya sea ocupada o en busca de trabajo, en virtud de que
en la rama metalmecnica esos rangos de edad son los predominantes. Lo anterior significa que
a diferencia de lo visto en el apartado sociodemogrfico (Grafica 2), la PEA remite a un grupo ms
restringido de poblacin.
9 Se calcula como el cociente entre la poblacin desocupada y la PEA

Aboites_PL11_12.indd 166 12/2/14 11:47 AM


Cuadro 10. Saltillo. PEA, 2007-2013

metalmecnica. Regin sureste de Coahuila


Poblacin
Ao Ocupados Desocupados econmicamente
activa
2007 186,694 13,820 200,514

Mercado laboral en la industria


2009 190,969 21,411 212,380
2013 222,738 16,608 239,346
Variacin absoluta 36,044 2,788 38,832
Crecimiento (%) 19.3 20.2 19.4

Fuente: INEGI. ENOE, varios aos.

una cifra inferior a su participacin (59.0%), lo cual indica que las mujeres represen-
taron el crecimiento ms dinmico con 18!600 nuevas incorporaciones al mercado
laboral (Cuadro 11).
167
Aunque la proporcin difiere entre la poblacin ocupada y la econmicamente
activa, siendo mayor la primera, esto flucta en funcin del comportamiento de
la actividad econmica, de suerte tal que, a mayor actividad, los valores entre la
PO y la PEA se encuentran ms prximos. Para 2007, la proporcin de personas
ocupadas dentro de la PEA fue superior a 93.0%, fluctuando entre ese ao y 2013.
Ahora bien, la distribucin entre hombres y mujeres manifest una tendencia per-
manente en detrimento de estas, a pesar de lo cual presentaron un desempeo
ms dinmico (3.9%) que los hombres (2.7%), situacin que permiti incrementar la
presencia de las mujeres en el mercado laboral local, representando casi 42% de
la poblacin ocupada y contribuyendo as con 50% de los nuevos empleos gene-
rados (Cuadro 11).

Cuadro 11. Saltillo. Poblacin ocupada por sexo 2007, 2009 y 2013

Aos Mujer Hombre Total


2007 75,404 111,290 186,694
2009 79,027 111,942 190,969
2013 93,258 129,480 222,738
Participacin %
2007 40.4 59.6 100.0
2009 41.4 58.6 100.0
2013 41.9 58.1 100.0
Variacin absoluta 17,854 18,190 36,044
Variacin relativa % 23.7 16.3 19.3
Contribucin % 49.5 50.5 100.0

Fuente: INEGI. ENOE, varios aos.

Aboites_PL11_12.indd 167 12/2/14 11:47 AM


Entre 2007 y 2013 en Saltillo se generaron ms de 36 mil nuevos empleos, repre-
Manejo de las bases de datos y la construccin

sentando un crecimiento acumulado de 19.3%; es decir, a pesar de la inestabilidad


econmica internacional y la debilidad de la economa nacional, el empleo neto en
Saltillo creci a una tasa promedio anual de 3.2% (Cuadro 12).
de indicadores socioeconmicos

Las fluctuaciones en la actividad econmica pueden tambin apreciarse desde


la perspectiva de los desocupados, lo que sera como el reverso de la moneda lla-
mada poblacin ocupada. De acuerdo con la informacin estadstica de Saltillo, el
nmero de trabajadores desocupados y su tasa de desempleo aumentaron en 2009
y posteriormente ambas se redujeron en 2013, dado lo cual los desempleados con-
tabilizaron 16!608 personas ese ao (Cuadro 12) y, como se ha indicado, las mujeres
tuvieron mayores niveles de desocupacin que los hombres.

Cuadro 12. Saltillo. Poblacin desocupada


y tasa de desempleo por sexo, 2007-2013

168 Ao Mujer Hombre Total


2007 6,791 7,029 13,820
2009 10,013 11,398 21,411
2013 7,599 9,009 16,608
Tasa de desempleo (porcentaje)
2007 8.3 5.9 6.9
2009 11.2 9.2 10.1
2013 7.5 6.5 6.9

Fuente: INEGI, ENOE, varios aos.

Metalmecnica

Qu tan relevante es la actividad metalmecnica en Saltillo, en trminos de em-


pleo? Qu tipo de mano de obra demanda y cul ha sido su comportamiento en
los ltimos seis aos?

Para el segundo trimestre de 2007 esta actividad generaba 23!500 empleos asalaria-
dos, cifra que para el primer trimestre de 2013 alcanz 43!900 empleos remunera-
dos, lo que significa que en seis aos casi se duplic el personal ocupado a pesar de
la contraccin observada en 2009.

En 2007, por cada diez empleos manufactureros subordinados y remunerados, cin-


co se ubicaban en la metalmecnica y para 2013 la proporcin aument a siete de
cada diez, lo cual implica que se fortaleci su presencia.

La distribucin de los empleos por sexo indica que poco ms de dos terceras partes
est constituido por trabajadores hombres, confirmando lo anteriormente sealado
(Cuadro 13).

Aboites_PL11_12.indd 168 12/2/14 11:47 AM


Cuadro 13. Saltillo, metalmecnica. Distribucin y comportamiento

metalmecnica. Regin sureste de Coahuila


de personal ocupado por sexo, 2007-2013

Ao Mujer Hombre Total


2007 7,503 16,020 23,523

Mercado laboral en la industria


2009 6,241 14,237 20,478

2013 14,341 29,554 43,895

Participacin (porcentaje)

2007 31.9 68.1 100.0

2009 30.5 69.5 100.0

2013 32.7 67.3 100.0

Variacin absoluta 6,838 13,534 20,372

Variacin relativa (%) 91.1 84.5 86.6


169
Contribucin (%) 33.6 66.4 100.0

Fuente: INEGI, ENOE, varios aos.

Ahora bien, al inquirir por la estructura ocupacional de la metalmecnica, en tr-


minos de edad, los datos sealan que refiere a una poblacin mayoritariamente
joven; de hecho el grupo de 26-35 aos tiene mayor relevancia en relacin con la
manufactura y los trabajadores con ms de 45 aos de edad solo representaron 15%
del total de ocupados, permaneciendo sin cambios esa proporcin durante el pe-
riodo 2007-2013 (Cuadro 14).

Cuadro 14. Saltillo, metalmecnica. Distribucin y comportamiento


de personal ocupado por grupo de edad, 2007-2013

Ao 18-25 26-35 36-45 46-55 56-70


2007 6,360 8,461 5,005 2,968 729

2009 4,046 7,904 5,397 2,452 679

2013 11,157 15,049 11,034 5,327 1,328

Participacin (participacin)

2007 27.0 36.0 21.3 12.6 3.1

2009 19.8 38.6 26.4 12.0 3.3

2013 25.4 34.3 25.1 12.1 3.0

Variacin absoluta 4,797 6,588 6,029 2,359 599

Variacin relativa (%) 75.4 77.9 120.5 79.5 82.2

Contribucin (%) 23.5 32.3 29.6 11.6 2.9

Fuente: INEGI, ENOE, varios aos.

Aboites_PL11_12.indd 169 12/2/14 11:47 AM


Manejo de las bases de datos y la construccin

Al identificar la estructura laboral por edad y sexo era preciso indagar la estructura
laboral por tipo de ocupacin. Sobre el particular puede decirse que la categora de
trabajadores industriales fue la ocupacin principal, concentrando seis de cada diez
trabajadores en el sector, porcentaje ligeramente superior al existente en la manu-
de indicadores socioeconmicos

factura, seguido por los oficinistas con poco menos de 10% en 2007 (Cuadro 15).

Cuadro 15. Saltillo, metalmecnica. Distribucin y comportamiento


de trabajadores por ocupacin, 2007-2013

Profesionales, Trabajadores
Operadores
tcnicos y industriales,
Aos Oficinistas de Otros* Total
trabajadores artesanos
transporte
del arte y ayudantes
2007 1,518 14,419 2,254 649 4,683 23,523

170 2009 1,765 11,392 1,096 399 5,826 20,478

2013 5,118 25,396 3,056 2,465 7,860 43,895

Participacin (porcentaje)

2007 6.5 61.3 9.6 2.8 19.9 100.0

2009 8.6 55.6 5.4 1.9 28.5 100.0

2013 11.7 57.9 7.0 5.6 17.9 100.0

Variacin
3,600 10,977 802 1,816 3,177 20,372
absoluta

Variacin
237.2 76.1 35.6 279.8 67.8 86.6
relativa (%)

Contribucin
17.7 53.9 3.9 8.9 15.6 100.0
%

* En esta categora se ubican: funcionarios y directivos, trabajadores de la educacin, comerciantes,


proteccin y vigilancia, trabajadores en servicios personales, entre otros.
Fuente: INEGI, ENOE, varios aos.

Cul es la estructura del empleo por tamao de establecimiento en este sector? A


partir del Cuadro 16 es posible establecer que la metalmecnica en Saltillo presenta
una fuerte concentracin en los establecimientos grandes (con ms de 250 ocu-
pados) y esa caracterstica se fortalece en el ltimo ao, dado que fue el tamao de
empresa que mostr el mayor dinamismo durante el periodo; no obstante que en el
ao de crisis estos establecimientos fueron los ms afectados junto a los de tamao
medio (de 51-250), mientras que las empresas de menor dimensin aumentaron su
plantilla laboral y su participacin en 2009. Lo anterior permite establecer que en
Saltillo y particularmente en la actividad metalmecnica existen dinmicas econ-
micas diferentes por tamao de empresas, lo cual seguramente est vinculado con
el tipo de mercado al que atienden cada una de estos establecimientos.

Aboites_PL11_12.indd 170 12/2/14 11:47 AM


Cuadro 16. Saltillo, metalmecnica. Distribucin de trabajadores

metalmecnica. Regin sureste de Coahuila


por tamao de empresa, 2007-2013

Tamao de empresa 2007 2009 2013


Hasta 10 ocupados 1,034 2,102 1,709

Mercado laboral en la industria


De 11-50 ocupados 1,322 1,618 1,110
51-250 ocupados 2,909 1,681 5,002
Ms de 250 ocupados 18,258 15,077 36,074
Total 23,523 20,478 43,895
Participacin (porcentaje)
Tamao de empresa 2007 2009 2013
Hasta 10 ocupados 4.4 10.3 3.9
De 11-50 ocupados 5.6 7.9 2.5
51-250 ocupados 12.4 8.2 11.4
Ms de 250 ocupados 77.6 73.6 82.2 171
Total 100.0 100.0 100.0

Fuente: INEGI, ENOE, varios aos.

! Conclusiones

No se aprecian restricciones demogrficas que indiquen una perspectiva de es-


casez en cuanto a la oferta laboral.
Las mujeres constituyen un volumen significativo de la PEA y crecientemente
elevan sus niveles de escolaridad, situacin que las ubica como una opcin la-
boral importante.
Para Saltillo cinco de cada diez empleos manufactureros subordinados y remu-
nerados se ubicaban en la metalmecnica en 2007, y para 2013 la proporcin
aument a siete de cada diez.
La metalmecnica presenta una fuerte concentracin en los establecimientos
grandes (con ms de 250 ocupados).

! Sintaxis

Procedimiento demogrfico (SPSS)

*********************************
*CENSO DE POBLACIN Y VIVIENDA 2000.
***********************************
*Primero construimos la variable PEA, PO y PEI.
GET FILE=C:\Users\gilberto\Documents\BASES DE DATOS\CENSO 2000\
Aguascalientes-Guerrero\COAHUILA2000.sav.
DATASET NAME Conjunto_de_datos1 WINDOW=FRONT.

Aboites_PL11_12.indd 171 12/2/14 11:47 AM


*Se identifica la PEA Y PEI.
Manejo de las bases de datos y la construccin

RECODE conact (30=2) (10 thru 20=1) (40 thru 80=3) INTO pea.
EXECUTE.
VARIABLE LABELS pea Condicin de Actividad Economica.
VALUE LABELS pea
de indicadores socioeconmicos

1 Poblacin ocupada
2 Poblacin Econmicamente Activa
3 Poblacin Econmicamente Inactiva.
*Para poder trabajar la variable edad fue necesario construir rangos, de
manera que fuera manejable el volumen de informacin.
*Recodificar la variable edad para tener rangos.
RECODE edad (0 thru 4=1) (5 thru 9=2) (10 thru 14=3) (15 thru 19=4) (20 thru
24=5) (25 thru 29=6) (30 thru 34=7) (35 thru 39=8)
(40 thru 44=9) (45 thru 49=10) (50 thru 54=11) (55 thru 59=12) (60 thru 64=13)
(65 thru 69=14) (70 thru 74=15) (75 thru 79=16)
(80 thru 84=17) (85 thru 89=18) (90 thru 199=19) (999=20) INTO rangos_edad.
172
EXECUTE.
VALUE LABELS rangos_edad 1 0 a 4 2 5 a 9 3 10 a 14 4 15 a 19 5 20 a 24 6
25 a 29
7 30 a 34
8 35 a 39
9 40 a 44
10 45 a 49
11 50 a 54
12 55 a 59
13 60 a 64
14 65 a 69
15 70 a 74
16 75 a 79
17 80 a 84
18 85 a 89
19 90 en adelante
20 No especificado.
*Construir una sola variable con condicin de actividad econmica y
situacin en el trabajo.
COMPUTE PEA1=pea * 10 + sittra.
EXECUTE.
DO IF (pea = 3).
RECODE PEA1 (SYSMIS=3).
END IF.
EXECUTE.
DO IF (pea = 2).
RECODE PEA1 (SYSMIS=2).
END IF.
EXECUTE.

Aboites_PL11_12.indd 172 12/2/14 11:47 AM


VARIABLE LABELS PEA1 Condicin de Actividad Economica y sitra.

metalmecnica. Regin sureste de Coahuila


VALUE LABELS PEA1
11 Pob ocu_obrero o empleado
12 Pob ocu_jornalero o pen
13 Pob ocu_patrn

Mercado laboral en la industria


14 Pob ocu_trabajador por su cuenta
15 Pob ocu_trab. sin pago
19 Pob ocu_n.e.
2 Poblacin econmicamente activa
3 Poblacin Econmicamente Inactiva..
*Recodificamos variable actrab_c para ajustarla al SCIAN 2000.
RECODE acttrab_ (331=1) (335=1) (550=55) (610=61) (999=999) (110 thru
119=11) (210 thru 212=21)
(220 thru 222=22) (230 thru 239=23) (310 thru 339=31) (430 thru
439=43) (460 thru 469=46) (480 thru 493=4849) (510 thru 516=51) (520 thru
529=52) (530 thru 539=53)
173
(540 thru 541=54) (560 thru 564=56) (620 thru 623=62) (710 thru 713=71)
(720 thru 722=72) (810 thru
816=81) (930 thru 939=93) INTO ACTRAB.
EXECUTE.
*Se identifica la Actividad Econmica a la que pertecen - Se crea Metal
mecnica.
VARIABLE LABELS ACTRAB Actividad econmica.
VALUE LABELS ACTRAB
1 Metal mecnica
11 Silvoagropecuario
21 Mineria
22 electricidad, agua y gas
23 construccin
31 Ind. Manufactura
43 comercio al por mayor
46 comercio al por menor
4849 transportes correo y almacenamiento
51 informacin medios masivos
52 servicios financieros
53 servicios inmobiliarios
54 servicios profesionales
55 direccin corporativos y empresas
56 servicio apoyo a negocios
61 servicios educativos
62 servicios de salud
71 servicios de esparcimiento
72 servicios de alojamiento temporal
81 otros servicios
93 Gobierno

Aboites_PL11_12.indd 173 12/2/14 11:47 AM


999 n.e..
Manejo de las bases de datos y la construccin

*Evaluacin de poblacin ocupada por actividad econmica.


CROSSTABS
/TABLES=ACTRAB BY PEA1
/FORMAT=AVALUE TABLES
de indicadores socioeconmicos

/CELLS=COUNT
/COUNT ROUND CELL.
************************
*Anlisis de medias PEA Actividad, situacin conyugal y religin.
*permite comparar edades promedio, por actividad econmica y situacin
conyugal.
************************
*a nivel estado.
MEANS TABLES=edad BY PEA1 ACTRAB estcon
/CELLS MEAN COUNT STDDEV SUM.
174
*A nivel Industria manufacturera.
USE ALL.
COMPUTE filter_$=(ACTRAB = 31).
VARIABLE LABELS filter_$ ACTRAB = 31 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
MEANS TABLES=edad BY PEA1 ACTRAB estcon
/CELLS MEAN COUNT STDDEV SUM.
*A nivel Industria Metalmecnica.
USE ALL.
COMPUTE filter_$=(ACTRAB = 1).
VARIABLE LABELS filter_$ ACTRAB = 1 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
MEANS TABLES=edad BY PEA1 ACTRAB estcon
/CELLS MEAN COUNT STDDEV SUM.
DELETE VARIABLE filter_$.
*********************************
*Anlisis PO por SCIAN 2000
*********************************
*COAHUILA.
DELETE VARIABLE filter_$.

DATASET ACTIVATE Conjunto_de_datos1.


WEIGHT BY factor.

Aboites_PL11_12.indd 174 12/2/14 11:47 AM


FREQUENCIES VARIABLES=ACTRAB

metalmecnica. Regin sureste de Coahuila


/ORDER=ANALYSIS.
CROSSTABS
/TABLES=ACTRAB BY tam_loc
/FORMAT=AVALUE TABLES

Mercado laboral en la industria


/CELLS=COUNT
/COUNT ROUND CELL.
*ARTEAGA.
USE ALL.
COMPUTE filter_$=(MUN=4).
VARIABLE LABEL filter_$ MUN=4 | MUN=11 | MUN=27 | MUN=30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=ACTRAB 175
/ORDER=ANALYSIS.
CROSSTABS
/TABLES=ACTRAB BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*GENERAL CEPEDA.
USE ALL.
COMPUTE filter_$=(MUN=11).
VARIABLE LABEL filter_$ MUN=4 | MUN=11 | MUN=27 | MUN=30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=ACTRAB
/ORDER=ANALYSIS.
CROSSTABS
/TABLES=ACTRAB BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*RAMOS ARIZPE.
USE ALL.
COMPUTE filter_$=(MUN=27).
VARIABLE LABEL filter_$ MUN=4 | MUN=11 | MUN=27 | MUN=30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.

Aboites_PL11_12.indd 175 12/2/14 11:47 AM


FREQUENCIES VARIABLES=ACTRAB
Manejo de las bases de datos y la construccin

/ORDER=ANALYSIS.
CROSSTABS
/TABLES=ACTRAB BY tam_loc
/FORMAT=AVALUE TABLES
de indicadores socioeconmicos

/CELLS=COUNT
/COUNT ROUND CELL.
*SALTILLO.
USE ALL.
COMPUTE filter_$=(MUN=30).
VARIABLE LABEL filter_$ MUN=4 | MUN=11 | MUN=27 | MUN=30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMAT filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
176 FREQUENCIES VARIABLES=ACTRAB
/ORDER=ANALYSIS.
CROSSTABS
/TABLES=ACTRAB BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
DELETE VARIABLE filter_$.
USE ALL.
COMPUTE filter_$=(PEA1 > 10 & mun = 30).
VARIABLE LABELS filter_$ PEA1 > 10 & mun = 30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=ACTRAB BY PEA1 BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
USE ALL.
COMPUTE filter_$=(PEA1 > 10 & mun = 27).
VARIABLE LABELS filter_$ PEA1 > 10 & mun = 27 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS

Aboites_PL11_12.indd 176 12/2/14 11:47 AM


/TABLES=ACTRAB BY PEA1 BY tam_loc

metalmecnica. Regin sureste de Coahuila


/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
USE ALL.

Mercado laboral en la industria


COMPUTE filter_$=(PEA1 > 10 & mun = 4).
VARIABLE LABELS filter_$ PEA1 > 10 & mun = 4 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=ACTRAB BY PEA1 BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT 177
/COUNT ROUND CELL.
USE ALL.
COMPUTE filter_$=(PEA1 > 10 & mun = 11).
VARIABLE LABELS filter_$ PEA1 > 10 & mun = 11 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=ACTRAB BY PEA1 BY tam_loc
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
**********************************
*Calcular los datos de actividad econmica para hacer las proyecciones,
restringiendo por municipio, edad, sexo y escolaridad.
***********************************
DELETE VARIABLE filter_$.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=rangos_edad BY pea BY mun
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*********************************
*sin embargo, dado que PEA y PO son parte de la PEA debo modificar el
valor de la PEA, porque aqu est excluida la PO.
*******************************

Aboites_PL11_12.indd 177 12/2/14 11:47 AM


*COAHUILA.
Manejo de las bases de datos y la construccin

USE ALL.
COMPUTE filter_$=(pea = 1 | pea = 2).
VARIABLE LABELS filter_$ pea = 1 | pea = 2 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
de indicadores socioeconmicos

FORMATS filter_$ (f1.0).


FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 1).
VARIABLE LABELS filter_$ pea = 1(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
178 FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 3).
VARIABLE LABELS filter_$ pea = 3(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
*ARTEGA.
USE ALL.
COMPUTE filter_$=((pea = 1 | pea = 2) & mun = 4).
VARIABLE LABELS filter_$ (pea = 1 | pea = 2) & mun = 4 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 1&& mun = 4).
& mun = 4(FILTER).
VARIABLE LABELS filter_$ pea = 1&

Aboites_PL11_12.indd 178 12/2/14 11:47 AM


VALUE LABELS filter_$ 0 Not Selected 1 Selected.

metalmecnica. Regin sureste de Coahuila


FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum

Mercado laboral en la industria


/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 3 & mun = 4).
VARIABLE LABELS filter_$ pea = 3 & mun = 4(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE 179
/ORDER=ANALYSIS.
*GRAL. CEPEDA.
USE ALL.
COMPUTE filter_$=((pea = 1 | pea = 2) & mun = 11).
VARIABLE LABELS filter_$ (pea = 1 | pea = 2) & mun = 11 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 1 mun = 11).
VARIABLE LABELS filter_$ pea = 1 mun = 11 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 3 mun = 11).
VARIABLE LABELS filter_$ pea = 3 mun = 11(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.

Aboites_PL11_12.indd 179 12/2/14 11:47 AM


FREQUENCIES VARIABLES=edad escoacum
Manejo de las bases de datos y la construccin

/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
*RAMOS ARIZPE.
USE ALL.
de indicadores socioeconmicos

COMPUTE filter_$=((pea = 1 | pea = 2) & mun = 27).


VARIABLE LABELS filter_$ (pea = 1 | pea = 2) & mun = 27 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
180 COMPUTE filter_$=(pea = 1 & mun = 27).
VARIABLE LABELS filter_$ pea = 1 & mun = 27(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 3 & mun = 27).
VARIABLE LABELS filter_$ pea = 3 & mun = 27(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
*SALTILLO.
USE ALL.
COMPUTE filter_$=((pea = 1 | pea = 2) & mun = 30).
VARIABLE LABELS filter_$ (pea = 1 | pea = 2) & mun = 30 (FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.

Aboites_PL11_12.indd 180 12/2/14 11:47 AM


USE ALL.

metalmecnica. Regin sureste de Coahuila


COMPUTE filter_$=(pea = 1 & mun = 30).
VARIABLE LABELS filter_$ pea = 1 & mun = 30(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.

Mercado laboral en la industria


EXECUTE.
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
USE ALL.
COMPUTE filter_$=(pea = 3 & mun = 30).
VARIABLE LABELS filter_$ pea = 3 & mun = 30(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE. 181
FREQUENCIES VARIABLES=edad escoacum
/STATISTICS=MEAN MODE
/ORDER=ANALYSIS.
DELETE VARIABLE filter_$.
*Ahora calculo la PEA por rangos de edad.
*COAHUILA.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=rangos_edad BY pea
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*ARTEAGA.
USE ALL.
COMPUTE filter_$=(mun = 4).
VARIABLE LABELS filter_$ mun = 4(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=rangos_edad BY pea
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*GRAL. CEPEDA.
USE ALL.
COMPUTE filter_$=(mun = 11).

Aboites_PL11_12.indd 181 12/2/14 11:47 AM


VARIABLE LABELS filter_$ mun = 11(FILTER).
Manejo de las bases de datos y la construccin

VALUE LABELS filter_$ 0 Not Selected 1 Selected.


FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
de indicadores socioeconmicos

DATASET ACTIVATE Conjunto_de_datos1.


CROSSTABS
/TABLES=rangos_edad BY pea
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*RAMOS ARIZPE.
USE ALL.
COMPUTE filter_$=(mun = 27).
VARIABLE LABELS filter_$ mun = 27(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
182 FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=rangos_edad BY pea
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.
*SALTILLO.
USE ALL.
COMPUTE filter_$=(mun = 30).
VARIABLE LABELS filter_$ mun = 30(FILTER).
VALUE LABELS filter_$ 0 Not Selected 1 Selected.
FORMATS filter_$ (f1.0).
FILTER BY filter_$.
EXECUTE.
DATASET ACTIVATE Conjunto_de_datos1.
CROSSTABS
/TABLES=rangos_edad BY pea
/FORMAT=AVALUE TABLES
/CELLS=COUNT
/COUNT ROUND CELL.

Procedimiento referente al mercado laboral (STATA)

Previo a las instrucciones para obtener los insumos de los cuadros, se llev a cabo
la concatenacin de los archivos con informacin sociodemogrfica y cuestio-
narios de ocupacin y empleo I y II, cuyo procedimiento se indica en el captulo
Rodrguez-Castro.

Aboites_PL11_12.indd 182 12/2/14 11:47 AM


Las instrucciones para llevar a cabo la depuracin de la base de datos una vez inte-

metalmecnica. Regin sureste de Coahuila


grada se presenta a continuacin.

Seleccin del rea metropolitana de Saltillo

destring cd_a, replace

Mercado laboral en la industria


gen ciudad=cd_a
keep if ciudad==17

Seleccionar rango de edad

*generar la variable edad


*Acotar edad de 18 a 70 aos de edad
gen edad=eda
keep if edad >=18 & edad <=70

Cuadro 7: Instrucciones para obtener los insumos del cuadro 183

*Poblacin ocupada: condicin de ocupacin


gen ocupacin=c_ocu11c
*Ocupacin 0= ?
*Ocupacin 1= Profesionales, tcnicos y trabajadores del arte
*Ocupacin 2= Trabajadores de la educacin
*Ocupacin 3= Funcionarios y directivos
*Ocupacin 4= Oficinistas
*Ocupacin 5= Trabajadores industriales artesanos y ayudantes
*Ocupacin 6= Comerciantes
*Ocupacin 7= Operadores de transporte
*Ocupacin 8= Trabajadores en servicios personales
*Ocupacin 9= Trabajadores en proteccin y vigilancia
*Ocupacin 10= Trabajadores agropecuarios
*Ocupacin 11= No especificado

Cuadro 8: Instrucciones para obtener los insumos del cuadro

*Sector de actividad economica


gen rama=o_rama
*o_rama 1= Construccin
*o_rama 2= Industria manufacturera
*o_rama 3= Comercio
*o_rama 4= Servicios
*o_rama 5= Otros
*o_rama 6= Agropecuario
*o_rama 7= No especificado

Aboites_PL11_12.indd 183 12/2/14 11:47 AM


Cuadro 9: Instrucciones para obtener los insumos del cuadro
Manejo de las bases de datos y la construccin

*Condicin de actividad
gen actividad=clase2
gen ocupados=actividad
de indicadores socioeconmicos

replace ocupados=1 if actividad==1


replace ocupados=2 if actividad==2
replace ocupados=3 if actividad==3
drop if actividad==4
*Condicin de actividad 1=Poblacin ocupada
*Condicin de actividad 2=Poblacin desocupada
*Condicin de actividad 3=Disponibles
*Condicin de actividad 4=No disponibles

Cuadro 10: Instrucciones para obtener los insumos del cuadro

184 *Condicin de actividad


gen actividad=clase2
gen ocupados=actividad
replace ocupados=1 if actividad==1
replace ocupados=2 if actividad==2
replace ocupados=3 if actividad==3
drop if actividad==4
*Condicin de actividad 1=Poblacin ocupada
*Condicin de actividad 2=Poblacin desocupada
*Condicin de actividad 3=Disponibles
*Condicin de actividad 4=No disponibles
*Generar la variable sexo
gen sexo=sex
replace sexo=0 if sexo==2
*SExo
*0=Mujer
*1=Hombre
by sexo, sort : table ocupados if ocupados==1 [fweight = fac], contents(freq )

Cuadro 11: Instrucciones para obtener los insumos del cuadro

*Condicin de actividad
gen actividad=clase2
gen ocupados=actividad
replace ocupados=1 if actividad==1
replace ocupados=2 if actividad==2
replace ocupados=3 if actividad==3
drop if actividad==4
*Condicin de actividad 1=Poblacin ocupada
*Condicin de actividad 2=Poblacin desocupada

Aboites_PL11_12.indd 184 12/2/14 11:47 AM


*Condicin de actividad 3=Disponibles

metalmecnica. Regin sureste de Coahuila


*Condicin de actividad 4=No disponibles
*Generar la variable sexo
gen sexo=sex
replace sexo=0 if sexo==2
*SExo

Mercado laboral en la industria


*0=Mujer
*1=Hombre
by sexo, sort : table ocupados if ocupados==2 [fweight = fac], contents(freq )

Cuadro 12: Instrucciones para obtener los insumos del cuadro

*Subsector de actividad economica


gen subsector=p4a
gen metalmecanica= subsector
replace metalmecanica=1 if subsector==3310| subsector==3320|
subsector==3360 185
replace metalmecanica=0 if subsector==1110| subsector==1121|
subsector==1122| subsector==1130| subsector==1141| subsector==1142|
subsector==1150| subsector==2110| subsector==2121| subsector==2122|
subsector==2123| subsector==2129| subsector==2131| subsector==2132|
subsector==2199| subsector==2210| subsector==2221| subsector==2222|
subsector==2361| subsector==2363| subsector==2370| subsector==2381|
subsector==2382| subsector==2399|subsector==3110| subsector==3120|
subsector==3130| subsector==3140| subsector==3150| subsector==3160|
subsector==3210| subsector==3220| subsector==3230| subsector==3240|
subsector==3250| subsector==3260| subsector==3270| subsector==3330|
subsector==3340| subsector==3350| subsector==3370| subsector==3380|
subsector==3399| subsector==4310| subsector==4320| subsector==4330|
subsector==4340| subsector==4350| subsector==4360| subsector==4370|
subsector==4399| subsector==4611| subsector==4612| subsector==4620|
subsector==4631| subsector==4632| subsector==4641| subsector==4642|
subsector==4651| subsector==4652| subsector==4661| subsector==4662|
subsector==4671| subsector==4672| subsector==4681| subsector==4682|
subsector==4690| subsector==4699| subsector==4810| subsector==4820|
subsector==4830| subsector==4840| subsector==4850| subsector==4860|
subsector==4870| subsector==4881| subsector==4882| subsector==4910|
subsector==4920| subsector==4930| subsector==5110| subsector==5120|
subsector==5150| subsector==5160| subsector==5170| subsector==5180|
subsector==5190| subsector==5210| subsector==5221| subsector==5222|
subsector==5223| subsector==5224| subsector==5229| subsector==5230|
subsector==5240| subsector==5310| subsector==5321| subsector==5322|
subsector==5330| subsector==5411| subsector==5412| subsector==5413|
subsector==5414| subsector==5510| subsector==5611| subsector==5612|
subsector==5613| subsector==5614| subsector==5615| subsector==5616|
subsector==5620| subsector==6111| subsector==6112| subsector==6119|

Aboites_PL11_12.indd 185 12/2/14 11:47 AM


subsector==6121| subsector==6122| subsector==6131| subsector==6132|
Manejo de las bases de datos y la construccin

subsector==6139| subsector==6141| subsector==6142| subsector==6150|


subsector==6211| subsector==6212| subsector==6219| subsector==6221|
subsector==6222| subsector==6231| subsector==6232| subsector==6239|
subsector==6241| subsector==6242| subsector==6251| subsector==6252|
de indicadores socioeconmicos

subsector==7111| subsector==7112| subsector==7113| subsector==7114|


subsector==7115| subsector==7120| subsector==7131| subsector==7132|
subsector==7133| subsector==7210| subsector==7221| subsector==7222|
subsector==7223| subsector==8111| subsector==8112| subsector==8119|
subsector==8121| subsector==8122| subsector==8123| subsector==8124|
subsector==8125| subsector==8130| subsector==8140| subsector==9311|
subsector==9312| subsector==9313| subsector==9314| subsector==9319|
subsector==9320| subsector==9700| subsector==9800| subsector==9999
*Industrias mtalicas bsicas-331
*Fabricacin de equipos metlicos-332
*Fabricacin de equipo de transporte-336
186 *Se consideran estos tres subsectores representantes de la industria metal-
mecanica
*Generar la variable sexo
gen sexo=sex
replace sexo=0 if sexo==2
*SExo
*0=Mujer
*1=Hombre
by sexo, sort : table ocupados if ocupados==1 [fweight = fac], contents(freq )
by(metalmecanica)

Cuadro 13: Instrucciones para obtener los insumos del cuadro

*Rangos de edad
gen grupo_edad=edad
replace grupo_edad=1 if grupo_edad>=18 & grupo_edad<=25
replace grupo_edad=2 if grupo_edad>=26 & grupo_edad<=35
replace grupo_edad=3 if grupo_edad>=36 & grupo_edad<=45
replace grupo_edad=4 if grupo_edad>=46 & grupo_edad<=55
replace grupo_edad=5 if grupo_edad>=56 & grupo_edad<=70
by grupo_edad, sort : table ocupados if ocupados==1 [fweight = fac],
contents(freq ) by(metalmecanica)

Cuadro 14: Instrucciones para obtener los insumos del cuadro

gen ocupacin=c_ocu11c
*Ocupacin 0= ?
*Ocupacin 1= Profesionales, tcnicos y trabajadores del arte
*Ocupacin 2= Trabajadores de la educacin
*Ocupacin 3= Funcionarios y directivos

Aboites_PL11_12.indd 186 12/2/14 11:47 AM


*Ocupacin 4= Oficinistas

metalmecnica. Regin sureste de Coahuila


*Ocupacin 5= Trabajadores industriales artesanos y ayudantes
*Ocupacin 6= Comerciantes
*Ocupacin 7= Operadores de transporte
*Ocupacin 8= Trabajadores en servicios personales
*Ocupacin 9= Trabajadores en proteccin y vigilancia

Mercado laboral en la industria


*Ocupacin 10= Trabajadores agropecuarios
*Ocupacin 11= No especificado
by ocupacin, sort : table ocupados if ocupados==1 [fweight = fac],
contents(freq ) by(metalmecanica)

Cuadro 15: Instrucciones para obtener los insumos del cuadro

*generar tamao de empresa


gen emp_tamao=p3q
replace emp_tamao=0 if p3q<4
replace emp_tamao=1 if p3q>3 & p3q<8 187
replace emp_tamao=2 if p3q>7 & p3q<10
replace emp_tamao=3 if p3q>9 & p3q<=99
* 0 micro
* 1 pequeas
* 2 medianas
* 3 Grandes
by emp_tamao, sort : table ocupados if ocupados==1 [fweight = fac],
contents(freq ) by(metalmecanica)

Aboites_PL11_12.indd 187 12/2/14 11:47 AM


8 Alejandro Dvila
Miriam Valds
Gilberto Aboites

Aboites_PL11_12.indd 188 12/2/14 11:47 AM


L
La bicicleta y la cartera. Mxico: 1994-2012
a bicicleta
y la cartera.
Mxico:
1994-2012

189

D
ada la nueva orientacin de la poltica federal en materia
de movilidad urbana sustentable, se consider oportuno
aprovechar la informacin de las encuestas nacionales de
ingreso gasto de los hogares, con el propsito de realizar un an-
lisis exploratorio de la relacin existente entre la utilizacin de la
bicicleta, como medio de transporte, y los patrones de consumo
en los hogares mexicanos; pues no obstante la ausencia de pol-
ticas explcitas para promover el uso de la bicicleta como medio
de transporte, 4 millones 680 mil 377 hogares declararon poseer al
menos una en el ao 2012, lo cual equivale a 14.83% de los hogares
existentes en Mxico, mismos que en conjunto reportaron poseer
6 millones 296 mil 592 bicicletas utilizadas con ese propsito; n-
mero equivalente a 5.4% de la poblacin total del pas, de las cuales
51.2% se localiz en hogares radicados en poblaciones menores a
los 15 mil habitantes, es decir rurales, y el resto en ciudades con
mayor poblacin.

De acuerdo con la informacin presentada en la Grfica 1, este porcentaje ha fluc-


tuado entre 12.17 y el 18.58% durante el periodo de estudio y no se percibe una ten-
dencia claramente definida. Dicho porcentaje correspondi a la proporcin entre
el total de hogares que registraron poseer al menos una bicicleta como medio de
transporte y el nmero total de hogares a nivel nacional.

La propia encuesta report una elevada participacin de hogares que no poseen


ningn medio de transporte para cubrir sus necesidades de movilidad, por lo cual

Aboites_PL11_12.indd 189 12/2/14 11:47 AM


Grfica 1. Mxico: Porcentaje de hogares con al menos una bicicleta
Manejo de las bases de datos y la construccin

como medio de transporte, 1994-2012


de indicadores socioeconmicos

190
Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

dependen de la caminata y del transporte pblico (Grfica 2). Si bien esa propor-
cin muestra una tendencia decreciente durante el periodo, para la observacin
ms reciente (ao 2012) casi la mitad del total de los hogares se encontraba en esta
circunstancia, lo que significa que para los integrantes de esos hogares, el uso de la

Grfica 2. Mxico: Porcentaje de los hogares de cada estrato de ingreso


con al menos una bicicleta como medio de transporte, 1994-2012

30.0%

25.0%
21.6%

20.0%
18.8% 19.4%
15.0% 13.4% 16.9% 16.8% 13.7%

10.0%
10.3% 10.6%

5.0% 6.8%

0.0%
Estrato de ingreso
1 2 3 4 5 6 7 8 9 10
1994 2000 2006 2012

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

Aboites_PL11_12.indd 190 12/2/14 11:47 AM


bicicleta puede ser una alternativa interesante de movilidad, mxime considerando
las ventajas en trminos de salud, tiempo y econmicas.

La bicicleta y la cartera. Mxico: 1994-2012


Lo anterior nos llev a preguntar si la presencia de bicicletas en los hogares mexi-
canos est asociada con el ingreso del que disponen y si ese medio de transporte
se vincula a comportamientos econmicos diferenciados, en cuanto al gasto, dado
lo cual el propsito de este captulo fue indagar en la estructura del gasto de los
hogares, as como en los cambios que se percibieron, contrastando hogares con
al menos una bicicleta como medio de transporte y hogares que no disponan
de ese recurso.

El documento se organiz en cuatro secciones: la introduccin, el desarrollo te-


mtico, las conclusiones y la descripcin del procedimiento utilizado, referido a los
archivos sintaxis o do file, segn refieran al software SPSS o STATA, lo cual permiti
evidenciar el uso de distintos indicadores en el anlisis socioeconmico.

Para la realizacin del anlisis se consideraron cuatro observaciones de la Encuesta 191


Nacional de Ingreso Gasto de los Hogares: 1994, 2000, 2006 y 2012 cubriendo as un
periodo de tiempo amplio y del cual se dispone informacin compatible.

! Desarrollo temtico

Hogares, bicicletas y deciles de ingreso

Existen comportamientos econmicos (gasto en los hogares) diferenciados se-


gn las restricciones de ingreso? Para responder a esa interrogante es frecuente
dividir a la poblacin total de hogares en 10 rangos de ingreso, capturando de esa
manera la distribucin de la variable ingreso y con ello las distintas asociaciones
que resultan al vincular el ingreso con otros indicadores econmicos como, por
ejemplo, los gastos. Para ello, siguiendo las recomendaciones del INEGI, se cons-
truyeron los rangos con base en la variable ingreso corriente monetario.

La Grfica 3 muestra los porcentajes por estrato de ingreso de los hogares respecto
de la posesin de bicicletas como medios de transporte. Ese indicador seala el
promedio de hogares que, dentro de cada rango, cuenta con al menos una bicicleta
como medio de transporte.

De ah se desprende que el decil con menor participacin de hogares con esa ca-
racterstica fue el de ms altos ingresos (decil 10) y el valor mximo (21.6%) se ob-
serv en el tercer grupo de ingresos. Los deciles 2 a 6 tuvieron valores superiores al
promedio registrado en 2012.

No se aprecian variaciones sustanciales en el tiempo y los porcentajes de 2012 fue-


ron en general superiores a los observados en el 2000 (excluyendo al decil 8), pero

Aboites_PL11_12.indd 191 12/2/14 11:47 AM


Grfica 3. Mxico: Diferencias porcentuales en el gasto monetario, gasto
Manejo de las bases de datos y la construccin

corriente e ingreso corriente de los hogares con y sin bicicleta


como medio de transporte , 1994-2012
de indicadores socioeconmicos

192

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

inferiores a los registrados en casi todos los estratos de ingreso en 1994 (salvo en los
estratos 1 y 3) y 2006 (excepto el decil 10).

Lo anterior muestra que los comportamientos econmicos son diferentes segn


la magnitud de los ingresos, es decir, que la tenencia de bicicleta como medio de
transporte vara segn el ingreso reportado por los hogares, de ah que resulta in-
teresante indagar las diferencias en la manera de gastar el ingreso por parte de los
hogares, segn registren contar con ese tipo de transporte, observando los grandes
agregados del gasto.

Para ello se trabaj con dos grupos de hogares: los que s tienen al menos una bicicleta
como medio de transporte y los que no tienen; pudiendo desagregar la informacin
entre los hogares que no tienen bicicleta ni algn otro medio de transporte, de
aquellos que aunque no tienen bicicleta s cuentan con otro medio de transporte.

Estructura del gasto segn los deciles de ingreso de los hogares

Partiendo de los resultados anteriores, esto es, agregar los hogares por deciles de
ingreso, a continuacin respondemos a la pregunta: En la estructura del gasto de
los hogares, organizados por deciles de ingreso, se observan diferencias vinculadas
a la presencia o ausencia de bicicletas como medios de transporte?

Para dar respuesta a esa pregunta se tom en cuenta la estructura general de gas-
tos por hogar que presenta la ENIGH en el archivo concentrado, considerando la

Aboites_PL11_12.indd 192 12/2/14 11:47 AM


informacin agregada en diez grandes grupos, bajo los cuales se captur la diversi-
dad en el comportamiento del gasto, a nivel nacional, a saber:

La bicicleta y la cartera. Mxico: 1994-2012


1) Alimentos
2) Vestido y calzado
3) Vivienda
4) Limpieza
5) Salud
6) Transporte
7) Comunicaciones
8) Educacin
9) Esparcimiento
10) Personal

Partiendo de ese nivel de informacin, se agregaron los gastos correspondientes a


cada rubro y decil, de manera que pudo calcularse la participacin para cada decil
y rubro dentro del gasto total, pudiendo mensurarse las proporciones de partici- 193
pacin y con ello determinar la relevancia de cada uno dentro del total, es decir la
estructura de gasto.

El Cuadro 1 contiene la informacin del monto y estructura del gasto monetario


realizado por los hogares mexicanos en los cuatro aos referidos i.e. los porcentajes.
Tambin incluye una estimacin de los gastos no monetarios y del gasto corriente
total (la suma de los dos anteriores). Los datos corresponden al promedio por trimes-
tre de cada ao y los valores en dinero se proporcionan en precios corrientes. Como
puede apreciarse el gasto monetario en alimentos, dada su magnitud, condiciona al
resto, sin embargo, el transporte es el segundo en importancia (13.5% en 2012).

El cuadro muestra tambin los cambios ocurridos a lo largo del tiempo (1994 a 2012)
y de ah se desprende que los rubros que ganaron mayor importancia relativa en el
gasto de los hogares mexicanos fueron: comunicaciones y cuidados personales
(+2.5% en ambos casos), seguidos por el transporte (+1.5). Sin embargo, dado que no
se distingui entre los hogares con y sin bicicleta, fue insuficiente para ilustrar los
cambios en las variaciones dentro de las estructuras de gasto, cuestin que se vin-
cula a la pregunta cmo influye la disponibilidad de al menos una bicicleta como
medio de transporte, en los montos de los ingresos y gastos, as como en la estruc-
tura del consumo de los hogares mexicanos?

En relacin con los gastos monetarios y corrientes, as como respecto a los ingre-
sos corrientes, los hogares que no posean al menos una bicicleta como medio de
transporte, registraron montos superiores al promedio general en las tres variables y
durante las cuatro observaciones revisadas. Lo contrario se observ en aquellos ho-
gares con al menos una bicicleta empleada para el transporte (Grfica 3). Tambin
en este ltimo grupo se visualiz que esta desviacin no solo es de signo contrario,
sino de una mayor magnitud relativa, lo cual nos lleva a preguntar: qu ocurre con
estas diferencias cuando se consideran los distintos estratos de ingreso?

Aboites_PL13_14.indd 193 12/2/14 11:48 AM


12/2/14 11:48 AM
Cuadro 1. Mxico: gasto trimestral de los hogares y estructura del gasto monetario trimestral
de los hogares, 1994-2012 (miles de pesos corrientes y porcentajes)
1994 2000 2006 2012
Concepto
Monto % Monto % Monto % Monto %
Alimentos 1,730.5 33.6 4,710.7 29.9 6,737.5 29.5 8,688.2 34.0
Vestido y calzado 346.9 6.7 906.9 5.8 1,344.7 5.9 1,307.0 5.1
Vivienda 465.8 9.0 1,307.3 8.3 2,033.3 8.9 2,264.2 8.9
Limpieza 441.5 8.6 1,288.8 8.2 1,457.3 6.4 1,546.5 6.1
Salud 197.2 3.8 563.4 3.6 932.8 4.1 636.4 2.5
Transporte 640.9 12.4 2,235.3 14.2 3,233.2 14.1 3,451.0 13.5
Comunicaciones 128.1 2.5 566.8 3.6 1,099.9 4.8 1,269.0 5.0
Educacin 480.3 9.3 1,488.8 9.5 2,188.8 9.6 2,412.4 9.4
Esparcimiento 276.6 5.4 1,247.9 7.9 1,354.3 5.9 1,116.6 4.4
Personal 447.4 8.7 1,437.0 9.1 2,491.6 10.9 2,863.7 11.2
Gasto monetario 5,155.3 100.0 15,753.0 100.0 22,873.3 100.0 25,554.9 100.0
Gasto no monetario 2,109.3 29.0 4,973.7 24.0 7,324.7 24.3 8,190.8 24.3

Aboites_PL13_14.indd 194
Gasto corriente 7,264.6 100.0 20,726.7 100.0 30,197.9 100.0 33,745.7 100.0
Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares realizadas por el INEGI, aos 1994, 2000, 2006 y 2012.
de indicadores socioeconmicos

194
Manejo de las bases de datos y la construccin
Para responder lo anterior, nuevamente se calcularon las diferencias entre hogares
con al menos una bicicleta y sin esta, solo que el procedimiento se repite para cada

La bicicleta y la cartera. Mxico: 1994-2012


uno de los deciles de ingreso y para cada ao incluido en el estudio, encontrando
que el patrn de los gastos monetarios y corrientes por estrato de ingreso es muy si-
milar, por esta razn la Grfica 4 solamente presenta los resultados correspondien-
tes a los gastos corrientes, registrando las diferencias porcentuales en esta variable
entre los hogares con y sin bicicleta como medio de transporte. La intensidad en los
tonos de gris va subiendo gradualmente hasta la observacin ms reciente (la del
ao 2012). Las desviaciones porcentuales para los hogares sin bicicleta son registra-
das en la forma cilndrica, en tanto las de los hogares con este medio de transporte
se indican con el icono de las pirmides.

Lo primero que llama la atencin es la similitud en los niveles de gasto en los deciles
dos a siete, pues las diferencias respecto al valor medio son inferiores a 5% (solo en
tres de 48 observaciones se superaron ligeramente esos porcentajes, en todos los
casos se trat de hogares con bicicleta: para el decil 2, los valores de 2004; para el 5,
los de 2006 y; para el 7, los de 2000). 195

En los hogares que cuentan con al menos una bicicleta como medio de trans-
porte, los gastos corrientes difirieron significativamente del promedio en los gru-
pos extremos: en el decil 1 as como en los estratos 8 a 10. En el primer caso, los
hogares con bicicleta tuvieron gastos sensiblemente superiores al promedio y a
los de los hogares sin bicicleta. Esta circunstancia se invirti en los tres conglome-
rados de ingresos ms elevados, especialmente en el estrato 10.

Grfica 4. Mxico: Hogares con y sin bicicleta como medio de transporte.


Diferencias porcentuales en el gasto corriente promedio
de cada estrato de ingreso, 1994-2012

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

Aboites_PL13_14.indd 195 12/2/14 11:48 AM


Ahora bien, si en lugar de analizar los gastos corrientes se analizan los ingresos
Manejo de las bases de datos y la construccin

corrientes (Grfica 5) es posible observar que las tendencias sealadas se muestran


con mayor nitidez, pues en los grupos 2 a 9, las diferencias respecto al promedio
son inferiores a 5% en todas los registros (64 en total).
de indicadores socioeconmicos

En el estrato ms pobre, salvo en 2006, los ingresos de los hogares con bicicleta
superaron la media de su grupo en ms de 5% y fueron siempre superiores en un
porcentaje aun mayor a los hogares que no contaban con este medio de transporte.
Nuevamente en el caso del decil 10 las diferencias se amplifican y cambian de sig-
no: los hogares con bicicleta tuvieron ingresos sensiblemente menores.

Como las diferencias en los estratos superiores son mayores a las del inferior y en
virtud de las desigualdades existentes en los niveles absolutos de ingresos y gastos
entre los deciles extremos, podemos concluir que los menores niveles globales de
gastos e ingresos en los hogares con bicicleta se explican mayoritariamente por las
disparidades del estrato superior (Grfica 5). As, los niveles de gasto e ingreso entre
196 hogares con bici y sin esta, son bastante similares en los estratos intermedios y sen-
siblemente diferentes y en direccin contraria en los niveles extremos.

Por otra parte, identificados los niveles de ingreso y gasto corriente por estrato
de ingreso, fue posible determinar el ahorro corriente, dado que este refiere a la
diferencia entre el ingreso y gasto. De igual manera, al dividir el ahorro corriente
entre el ingreso corriente, obtuvimos la tasa de ahorro corriente. La Grfica 6

Grfica 5. Mxico: Hogares con y sin bicicleta como medio de transporte.


Diferencias porcentuales en el ingreso corriente promedio
de cada estrato de ingreso, 1994-2012

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

Aboites_PL13_14.indd 196 12/2/14 11:48 AM


Grfica 6. Mxico: Diferencias porcentuales en las tasas de ahorro corriente
entre los hogares con bicicleta como medio de transporte y los hogares

La bicicleta y la cartera. Mxico: 1994-2012


que no disponen de bicicleta con este propsito.
Datos por estrato de ingreso 1994-2012

197

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

cuantifica las diferencias respecto a la media de su grupo de ingreso en las tasas


de ahorro corriente, entre los hogares que cuentan con bicicleta como medio de
transporte y los que no reunieron esa condicin. Se presentan cuatro observaciones
para cada grupo de ingreso, correspondientes a los aos contemplados en el
estudio. Nuevamente la gama de grises sube de intensidad a medida que se avanza
en el tiempo.

Con excepcin de los dos grupos de menores ingresos, las tasas de ahorro corriente
de los hogares con bicicleta fueron regularmente superiores a las de aquellos que
no contaban con este medio de transporte y esta diferencia tendi a amplificarse a
medida que nos desplazamos hacia estratos de ingreso superior. Estos datos permi-
ten derivar una conclusin interesante: una poltica pblica que logre incrementar
el uso de la bicicleta como medio de transporte en Mxico, especialmente en los
grupos de mayor ingreso, tendra un efecto positivo en la tasa de ahorro privado.

Al detectar el efecto positivo que en la tasa de ahorro privado tendra el uso de la bi-
cicleta como medio de transporte, nos preguntamos si existen diferencias relevan-
tes en los patrones de consumo de los hogares mexicanos que utilizan la bicicleta
como medio de transporte respecto de aquellos que no lo hacen.

El Cuadro 2 computa las diferencias en las estructuras de gasto corriente trimestral


en 2012. En la primera columna se presentan los resultados para todos los hogares,
independientemente de sus niveles de ingreso, en tanto que en las diez columnas
restantes se registran esas variaciones por estrato de ingreso.

Aboites_PL13_14.indd 197 12/2/14 11:48 AM


12/2/14 11:48 AM
Cuadro 2. Mxico: diferencias en las estructuras de gasto monetario trimestral
entre los hogares con bicicleta como medio de transporte y el resto, 2012 (porcentajes)
DECIL
Total
1 2 3 4 5 6 7 8 9 10
Alimentos 6.5 0.9 3.4 5.8 0.5 0.2 1.0 2.9 7.0 0.3 3.2
Vestido y calzado 0.3 0.3 0.8 1.0 1.2 0.4 0.2 0.5 0.2 1.0 0.4
Vivienda 1.5 0.2 2.1 2.5 0.7 2.3 3.4 3.1 2.4 1.2 1.9
Limpieza 0.2 0.7 0.5 0.5 1.2 0.3 0.1 0.4 0.9 0.6 0.4
Salud salvo medicamentos
0.8 0.7 0.5 0.8 0.4 0.3 8.4 1.7 1.4 0.4 0.1
(DPACP)
Medicamentos contra
diabetes, presin arterial 0.1 0.1 0.1 0.0 0.1 0.1 0.1 0.1 0.0 0.0 0.2
y control de peso
Transporte 1.7 2.1 0.5 3.5 2.5 0.7 2.8 1.4 0.1 0.9 0.6
Mantenimiento 0.1 0.1 0.2 0.2 0.1 0.0 0.0 0.2 0.0 0.4 0.0
Combustibles 1.6 1.0 0.7 1.2 0.9 0.7 0.8 1.1 1.4 0.4 1.0
Adquisicin de vehculos 0.8 2.2 0.6 0.1 0.5 0.7 1.0 0.0 1.2 0.1 0.1
Transporte pblico urbano 0.8 1.4 0.8 1.5 0.8 1.2 1.5 0.3 2.3 0.1 1.5
Transporte pblico forneo 0.1 0.2 0.6 0.5 0.2 0.5 0.4 0.2 0.4 0.3 0.1
Comunicaciones 0.7 0.5 0.4 0.0 0.2 0.2 0.9 1.2 1.3 0.2 0.5
Educacin y esparcimiento 1.73 0.05 2.92 0.07 2.16 3.89 0.05 2.04 2.22 0.71 1.50

Aboites_PL13_14.indd 198
Personal 1.73 3.53 1.16 0.25 1.27 0.69 0.02 2.29 1.87 2.45 1.68
Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares realizadas por INEGI, aos 1994, 2000, 2006 y 2012.
de indicadores socioeconmicos

198
Manejo de las bases de datos y la construccin
Vistos los resultados es posible afirmar que el conjunto de hogares que emplean al
menos una bicicleta para fines de transporte gastaron menos en transporte, edu-

La bicicleta y la cartera. Mxico: 1994-2012


cacin y esparcimiento, cuidados personales, vivienda, comunicaciones, limpieza
y compra de medicamentos para la diabetes, la presin arterial y el control de peso.

Sobre estos ltimos es importante referir que el gasto absoluto en esos medicamen-
tos fue bajo, pero la reduccin relativa en el caso de hogares con bicicleta result
la ms importante (58.3 por ciento) y se extiende a 9 de los 10 deciles de ingreso.
Dado lo cual sera muy interesante estimar los ahorros de medios de transporte
no motorizados en los gastos mdicos y de hospitalizacin de padecimientos co-
mnmente asociados a la vida sedentaria y patrones de consumo alimenticio con
altas ingestas calricas. Por ejemplo, siguiendo la metodologa que la Organizacin
Mundial de la Salud desarroll para este propsito.1

En el caso del transporte, destaca la menor participacin del gasto en combusti-


bles, adquisicin de vehculos y mantenimiento. Las economas en los dos ltimos
rubros son compensadas por mayores erogaciones proporcionales en transporte 199
pblico urbano y forneo, dejando una reduccin neta de 1.7% en los gastos mone-
tarios totales. Con excepcin de los hogares ms pobres, los ahorros en el consumo
de combustible fueron relevantes en el resto de los estratos de ingreso. En los deci-
les 1 a 7 la disponibilidad de bicicleta para el transporte se asoci con una reduccin
en las erogaciones en transporte pblico (sustitucin de un medio por otro), en tan-
to que en los deciles 8 y 10 los gastos en transporte pblico urbano aparecen como
medios de transporte complementarios a la bicicleta.

El ahorro en gastos de vivienda es importante y general, dado lo cual valdra la pena


profundizar en el anlisis de las causas, indagando si disponer de una bicicleta per-
mite a las personas ubicarse en zonas en las cuales las propiedades tienen un
menor valor.

Los ahorros en comunicaciones se concentraron en los deciles 4 a 9, en tanto los


menores gastos proporcionales en educacin, esparcimiento y cuidados persona-
les tendieron a concentrarse en los extremos (hogares muy pobres y los tres deciles
con mayor ingreso).

Los hogares con bicicleta gastaron ms en alimentos (salvo los estratos 2, 5 y 6), sa-
lud (excepto los deciles 1, 3, 4 y 7), as como en vestido y calzado (la nica excepcin
se observ en el estrato 5).

Ahora bien, evidenciado el impacto positivo que puede generar en los hogares te-
ner y utilizar la bicicleta como medio de transporte, en trminos de ahorro y gasto,
quisimos indagar si, con fundamento en la informacin de la ENIGH, era posible
evidenciar algunas ventajas econmicas, ambientales y de salud asociadas al uso
de la bicicleta como medio de transporte.

1 Para esto se puede consultar: www.euro.who.int/transport/policy/ 20070503_1.

Aboites_PL13_14.indd 199 12/2/14 11:48 AM


Por ello, en la Grfica 7 se muestra el nmero promedio de vehculos motorizados,
Manejo de las bases de datos y la construccin

con excepcin de motocicletas, para cada uno de los diez estratos de ingreso en
las diferentes observaciones temporales (1994-2012), de lo cual se desprenden dos
tendencias: una mayor dependencia de los vehculos motorizados a medida que
aumentan los niveles de ingreso y un desplazamiento de las curvas hacia arriba,
de indicadores socioeconmicos

indicando que la dependencia de los automotores se increment para todos los ho-
gares mexicanos, aun para los de ingresos ms reducidos, si bien solo hasta el decil
9 la razn entre el total de hogares y vehculos alcanza la unidad; esto es que en los
deciles 9 y 10 a cada hogar le correspondi al menos un vehculo, apreciacin que
confirma lo sealado por Naciones Unidas:

En los ltimos diez aos, la tasa de crecimiento del parque automo-


tor fue de un elevado 9% anual, [pero] el 80% de este crecimiento co-
rresponde al transporte privado que resuelve la movilidad del 20 por
ciento de la poblacin.

200 Entre 1960 y 2002 la tasa de crecimiento de los vehculos fue de 7.5% promedio
anual, el de la poblacin total fue de 2.47%, resultando en un crecimiento del ndice
de motorizacin (IM) de 4.9% promedio anual. En el periodo comprendido entre
2002-2009, el crecimiento del IM fue de 8.75% anual. Una comparacin interna-
cional muestra que Mxico est experimentando tasas de crecimiento de su parque
vehicular de ms del doble que la de sus socios comerciales de Amrica del Norte

Grfica 7. Promedio de autos y/o camionetas por hogar.


Datos por estrato de ingreso (unidades), 1994-2012
1.8

1.6
Autos y/o camionetas por hogar

1.4

1.2

0.8

0.6

0.4

0.2
Estrato de ingreso
0
1 2 3 4 5 6 7 8 9 10
1994 2000 2006 2012

Fuente: Elaboracin propia con informacin de las encuestas de ingreso gasto de los hogares reali-
zadas por el INEGI, aos 1994, 2000, 2006 y 2012.

Aboites_PL13_14.indd 200 12/2/14 11:48 AM


(ONU-Hbitat 2011a:X, 64). Situacin que se asume en los diagnsticos de la actual
administracin pblica federal:

La bicicleta y la cartera. Mxico: 1994-2012


Las ciudades crecieron de manera horizontal y anrquica, con nuevos
desarrollos ubicados en zonas cada vez ms alejadas de los cen-
tros de trabajo y de servicios, sin contemplar una densidad habitacio-
nal adecuada que permitiera proveer los servicios bsicos y de forma
eficiente, sin vas de comunicacin u opciones de transporte sufi-
cientes (Gobierno Federal 2013:3).

Lo anterior ilustra una tendencia hacia la individualizacin del transporte motoriza-


do, misma que se expresa con claridad en los deciles 9 y 10, dado que son los nicos
cuya capacidad adquisitiva no limita la eleccin entre un vehculo motorizado y
otro bien. En otras palabras, la pobreza y desigualdad que aqueja a nuestra sociedad
limita, en general, un aumento de la carga vehicular.

No obstante, tales estrategias de movilizacin parecen altamente lesivas para el in- 201
greso del hogar al generar deseconomas. Primero porque el gasto en combustible
es proporcionalmente mayor entre menores ingresos se disponga y esto se agrava
dado que los vehculos en los primeros deciles confieren un menor rendimiento,
en atencin a su antigedad y por ser mayoritariamente de trabajo (pick up) (Cua-
dro 3); segundo, porque no necesariamente la mayor velocidad que tericamente
ofrece disponer de un vehculo propio, se puede concretar en los hechos, dado
que el congestionamiento vehicular est aumentando los tiempos de traslado, de
suerte tal que l nico medio que realmente beneficia en el tiempo resulta ser la
bicicleta o la motocicleta, pues permite sortear los embotellamientos.

Por ejemplo

En un ejercicio realizado en la Ciudad de Mxico, en ocho corredo-


res de transporte se indica que debido a la velocidad promedio de 7.2
kilmetros, un usuario invierte 2 horas 30 minutos en trasladarse,
cuando debera realizar la mitad del tiempo, que se traduce en una
prdida por da de 106 pesos, que equivalen a 25 mil 677 pesos al ao
(Ciudadnosenred, 2012).

Las estadsticas de la ENIGH tambin validan las ventajas econmicas, ambienta-


les y de salud asociadas al uso de la bicicleta como medio de transporte. Dado lo
sealado, el gobierno mexicano debera promover la incorporacin del uso de la
bicicleta como un instrumento efectivo de combate a la pobreza, a la vez que sera
una opcin interesante de movilidad altamente eficiente en los traslados interme-
dios; todo lo cual conllevara indiscutibles beneficios econmicos, ambientales y
de salud pblica.

En Mxico, la poblacin urbana es casi de 90 millones y en las 93 ciudades con


ms de 100 mil habitantes se genera ms de 88% de la produccin bruta total de la

Aboites_PL13_14.indd 201 12/2/14 11:48 AM


Cuadro 3. Mxico: total de vehculos automotores y su antigedad, 2012
Manejo de las bases de datos y la construccin

antiguedad_ antiguedad_ antiguedad_ Total


Decil de ingreso
auto van picku automotores
Media_aos 4.2 5.7 8.5
de indicadores socioeconmicos

1 N 83,511.0 70,661.0 140,306.0 294,478.0


% 1.13 2.31 5.09 2.23
Media_aos 5.2 4.9 6.7
2 N 183,818.0 127,992.0 229,308.0 541,118.0
% 2.49 4.18 8.32 4.10
Media_aos 6.7 6.3 6.9
3 N 261,132.0 145,534.0 264,136.0 670,802.0
% 3.54 4.75 9.58 5.08
Media_aos 4.5 5.3 5.7
4 N 355,812.0 174,974.0 347,705.0 878,491.0
202
% 4.82 5.71 12.61 6.65
Media_aos 4.7 6.8 6.7
5 N 554,396.0 202,318.0 223,928.0 980,642.0
% 7.51 6.60 8.12 7.43
Media_aos 5.5 5.7 7.0
6 N 578,658.0 277,060.0 290,403.0 1,146,121.0
% 7.84 9.04 10.54 8.68
Media_aos 5.8 6.0 7.3
7 N 857,115.0 404,644.0 240,209.0 1,501,968.0
% 11.61 13.21 8.71 11.38
Media_aos 5.6 5.1 6.9
8 N 1,189,118.0 428,895.0 331,211.0 1,949,224.0
% 16.11 14.00 12.02 14.77
Media 5.0 4.7 6.1
9 N 1,418,998.0 433,112.0 315,462.0 2,167,572.0
% 19.23 14.13 11.45 16.42
Media 4.3 4.6 6.9
10 N 1,898,271.0 799,130.0 373,656.0 3,071,057.0
% 25.72 26.08 13.56 23.26
Media 5.0 5.3 6.8
Total N 7,380,829.0 3,064,320.0 2,756,324.0 13,201,473.0
% 100.00 100.00 100.00 100.00
Deciles N 4,506,387.0 1,661,137.0 1,020,329.0 7,187,853.0
8-10 % 54.21 37.02 54.45 61.06

Fuente: INEGI (Instituto Nacional de Estadstica y Geografa). Elaborada con informacin de la En-
cuesta de Ingreso Gasto de los Hogares de 2012.

Aboites_PL13_14.indd 202 12/2/14 11:48 AM


nacin, ah es donde se concentra el consumo energtico y en consecuencia los
efectos adversos al ambiente.

La bicicleta y la cartera. Mxico: 1994-2012


La OECD (2010) estableci que entre el 60 y 80% de la energa consumida se realiza
en las ciudades y en esa misma proporcin estas participan en la emisin de CO2;
y el Centro Mario Molina (2013) seal que el transporte motorizado es responsable
de 31.2% de las emisiones de CO2. Por su parte, Galindo (2009) refiere que en Mxico
los automviles particulares aportan el 18% de las emisiones de gas con efecto in-
vernadero en el pas. Por ende, la reduccin y mayor eficiencia en el uso del trans-
porte urbano, as como el uso de medios de transporte no contaminantes, v gr.
bicicleta, constituyen una estrategia importante en el combate a la contaminacin
y a la reduccin de los gases invernadero.

Si se analiza la proporcin del gasto en combustibles, puede inferirse que no todas


las personas y hogares participan de la misma manera en la contaminacin am-
biental en cuanto a emisiones de CO2 se refiere, ya que el gasto total en ese rubro es
variado dependiendo del ingreso que tengan los hogares, siendo mayor la conta- 203
minacin y la responsabilidad entre quienes ms gastan por el uso de automotores.

Por ejemplo, los tres deciles con mayor ingreso (30% de la poblacin ms rica) rea-
lizan el 70.03% del gasto en combustible de los hogares, esto es $25!169.1 millones
de un total de $35!941.8 gastados en 2012 (Cuadro 2) y representan 61% del parque
vehicular motorizado de los hogares, es decir autos, van y pick up (Cuadro 3). De ah
se desprende que esos deciles participan en las emisiones de CO2 y en el subsidio a
las gasolinas en una proporcin de 60 a 70%.

! Conclusiones

Se pudo documentar que el comportamiento econmico de los hogares di-


fiere entre quienes tienen y no tienen bicicleta, destacando las consecuencias
observadas en materia de ahorro en el ingreso del hogar.
Las tasas de ahorro corriente de los hogares con bicicleta son regularmente
superiores a las de aquellos que no cuentan con este medio de transporte
y esta diferencia tiende a amplificarse a medida que nos desplazamos hacia
estratos de ingreso superior, dado lo cual una poltica pblica que logre incre-
mentar el uso de la bicicleta como medio de transporte en Mxico, especial-
mente en los grupos de mayor ingreso, tendra un efecto positivo en la tasa
de ahorro privado.
La dependencia de los automotores se increment para todos los hogares
mexicanos, aun para los de ingresos ms reducidos, sin embargo, la pobreza
y desigualdad que aqueja a nuestra sociedad limita, en general un aumento
de la carga vehicular.
Existen ventajas econmicas, ambientales y de salud asociadas al uso de la bi-
cicleta como medio de transporte, dado lo cual el gobierno mexicano debera
promover su incorporacin como un instrumento efectivo de combate a la

Aboites_PL13_14.indd 203 12/2/14 11:48 AM


pobreza, a la vez que podra ser una opcin interesante de movilidad altamen-
Manejo de las bases de datos y la construccin

te eficiente en los traslados intermedios; todo lo cual conllevara indiscutibles


beneficios econmicos, ambientales y de salud pblica.
de indicadores socioeconmicos

! Sintaxis

/* PROCEDIMIENTO */
/*El anlisis a la Encuesta de Ingreso-Gasto de los hogares abarca cuatro
aos: 1994, 2000, 2006 y 2012. Debido a que en cada ao, la encuesta se
realiz con ligeras modificaciones en la metodologa, a continuacin se
hace un tratamiento especfico a las bases de datos de cada ao, con el
objetivo de que estas puedan ser comparables en el tiempo.*/
/* PREPARACIN DE LA BASE DE DATOS CORRESPONDIENTE A LA
ENIGH 1994 */
/*Se limpia la memoria y se establecen una cantidad de memoria */
204 clear all
/* A partir de la versin Stata 12, Stata ajusta automticamente la cantidad de
memoria necesaria*/
set memory 500m
/*Se parte de la base de datos Concentrado con la ruta especfica. Debe
tenerse en cuenta que la direccin indicada a continuacin corresponde
al lugar en donde cada persona almacena su Informacin por tanto debe
modificarse la direccin en donde est guardado el archivo o las bases de
datos y por ende las tablas que se utilizarn, as como el nombre de ste.*/
use C:\Datos\Enigh\1994\Microdatos\Copia\Concen.dta, clear
/*Se genera una variable comn a los cuatro aos que sea la
correspondiente al identificador del hogar, del factor de expansin, del
ingreso corriente y del tamao de localidad*/
sort folio
gen IDhogar = folio
sort IDhogar
rename hog factor_hog
rename estrato tam_loc
rename tam_hog tot_integ
rename gastot gasto_tot
rename gascor gasto_cor
rename gasmon gasto_mon
rename gasnom gasto_nom
rename ingtot ing_total
rename ingmon ing_mon
rename ingcor ing_cor
rename educacion educa_espa
rename vestido vesti_calz
*Se generan deciles de ingreso
xtile decil = ing_cor [w=factor_hog], nq(10)

Aboites_PL13_14.indd 204 12/2/14 11:48 AM


table decil [w=factor_hog], c(n ing_cor mean ing_cor min ing_cor max
ing_cor)

La bicicleta y la cartera. Mxico: 1994-2012


*Se hace una distincin de localidades urbanas y rurales
gen tipo_loc=0
replace tipo_loc=1 if tam_loc==1
replace tipo_loc=1 if tam_loc==2
*Guardo la base de datos en la ruta deseada
save C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta
/*De la base de datos Hogares extraigo las variables necesarias para el
anlisis, haciendo la previa homologacin de variables*/
use C:\Datos\Enigh\1994\Microdatos\Copia\Hogares.dta, clear
sort folio
gen IDhogar = folio
sort IDhogar
rename factor factor_hog
rename estrato tam_loc
/*Extraigo el nmero de vehculos por hogar, en la base de datos 1994 todo 205
est incluido en una misma variable, donde cada posicin significa el tipo
de vehculo*/
generate int num_auto = real(substr(vehiculos,1,1))
/*Se hace la distincin del tipo de vehculo, la variable no permite la
distincin entre auto, van, triciclo y bicicleta.*/
gen num_van=0
generate int num_pickup = real(substr(vehiculos,2,1))
generate int num_moto = real(substr(vehiculos,3,1))
generate int num_bici = real(substr(vehiculos,4,1))
gen num_trici= 0
generate int num_carret = real(substr(vehiculos,5,1))
generate int num_canoa = 0
generate int num_otro = real(substr(vehiculos,6,1))
/*Guardo las variables que me sirven en una base de datos diferente*/
keep IDhogar num_auto num_van num_pickup num_moto num_bici
num_trici num_carret num_canoa num_otro
save C:\Datos\Enigh\1994\Microdatos\Copia\Hogaresvartransp.dta
/*Aado las variables del tipo de automvil al concentrado y guardo el
concentrado*/
use C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta, clear
sort IDhogar
merge 1:1 IDhogar using C:\Datos\Enigh\1994\Microdatos\Copia\
Hogaresvartransp.dta
save C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta, replace
/*De la base de datos Gastos, se extraen las variables de gasto relacionado
transporte, gasto en combustible, educacin, adquisicin de vehculos,
refacciones, control de diabetes, control de peso e hipertensin, realizando
la previa homologacin de variables*/
use C:\Datos\Enigh\1994\Microdatos\Copia\Gastos94.dta, clear

Aboites_PL13_14.indd 205 12/2/14 11:48 AM


gen IDhogar = folio
Manejo de las bases de datos y la construccin

sort IDhogar
rename gas_tri gasto_tri
*Gasto en combustible
gen combus =gasto_tri if (clave==F006 | clave==F007 | clave==F008 |
de indicadores socioeconmicos

clave==F009 | clave==F010)
*Gasto en gasolina y diesel
gen gasdiesel=gasto_tri if (clave==F006)
*Gasto en transporte pblico
gen publico=gasto_tri if (clave==B001 | clave==B002 | clave==B003 |
clave==B004 | clave==B005 | clave==B006| clave==B007)
*Gasto en transporte publico urbano: B001 a B005: Metro, autobs, trolebs,
colectivo o microbs, *taxi
gen publicourb=gasto_tri if (clave==B001 | clave==B002 | clave==B003 |
clave==B004 | clave==B005)
*Gasto en transporte pblico forneo
206 gen foraneo=gasto_tri if (clave==M001 | clave==M002 | clave==M003 |
clave==M004 | clave==M005 | clave==M006)
*Gasto en comunicacin
gen comunica=gasto_tri if (clave==F001 | clave==F002 | clave==F003 |
clave==F004 | clave==F005)
*Gasto en educacin
gen educacion=gasto_tri if (clave==E001 | clave==E002 | clave==E003
| clave==E004 | clave==E005 | clave==E006 | clave==E007 |
clave==E008 | clave==E009 | clave==E0010 | clave==E011 |
clave==E012 | clave==E013 | clave==E014 | clave==E015 | clave==E016
| clave==E017 | clave==H029 | clave==H030 )
*Gasto en adquisicin de vehiculos
gen adqui_vehi=gasto_tri if (clave==M007 | clave==M008 |
clave==M009 | clave==M010 | clave==M011)
*Gasto en refacciones
gen refaccion=gasto_tri if (clave==M012 | clave==M013 | clave==M014 |
clave==M015 | clave==M016 | clave==M017 | clave==M018)
*Se realiza en concentrado por hogar de las variables de inters
collapse (sum) combus publico foraneo comunica educacion gasdiesel
publicourb adqui_vehi refaccion, by(IDhogar)
sort IDhogar
*Guardo las variables en una nueva base de datos
save C:\Datos\Enigh\1994\Microdatos\Copia\ghogar_adicional.dta
*No hay gastos personales en diabetes, peso, combustible y transporte
publico
*Agrego la base de datos anterior al concentrado
use C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta, clear
sort IDhogar
/* al realizar la union de dos archivos se genera una nueva variable _merge,
por lo que dada la mezcla anterior, se borra la variable anteriore*/

Aboites_PL13_14.indd 206 12/2/14 11:48 AM


drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\1994\Microdatos\Copia\ghogar_

La bicicleta y la cartera. Mxico: 1994-2012


adicional.dta
*Cambia valores perdidos por 0
mvencode combus, mv(0) override
mvencode refaccion, mv(0) override
mvencode adqui_vehi, mv(0) override
mvencode publico, mv(0) override
mvencode foraneo, mv(0) override
mvencode comunica, mv(0) override
mvencode educacion, mv(0) override
mvencode gasdiesel, mv(0) override
mvencode publicourb, mv(0) override
/*Se realiza una homologacin de nombre de variables con las dems bases
de datos*/
gen esparci = educa_espa-educacion
gen gt_gasdiesel=gasdiesel 207
gen gt_ppublicourb=publicourb
gen mantenim=refaccion+combus
/*No. vehculos motorizados por hogar*/
gen num_vehmot= num_auto+ num_van+ num_pickup+ num_moto
/*No. vehculos motorizados para ms de 1 persona*/
gen num_vehmotm= num_auto+ num_van+ num_pickup
/*No. Vehculos motorizados de una persona por hogar */
gen num_vehmotu= num_moto
/* No. bicicletas y triciclos x hogar como medio de transporte*/
gen num_bicitrici= num_bici+ num_trici
/*No. otros medios de transporte x hogar*/
gen num_otrosveh= num_carret+ num_canoa+ num_otro
/*Genero nmero de bicicletas ponderadas por cada integrante por hogar*/
gen num_btpc= num_bicitrici/tot_integ
/*Agrego una variable para identificar el ao*/
gen anio=1994
/*Agrego una variable correspondiente al deflactor anual*/
gen def=19.1040
/*Guardo la base de datos 1994, en caso de que ya exista se le pone despues
de la ruta , replace, en caso contrario solo se pone la ruta antecedida por el
comando save*/
save C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta, replace
/* PREPARACIN DE LA BASE DE DATOS CORRESPONDIENTE A LA
ENIGH 2000 */
/*Se limpia la memoria*/
clear
/*Se parte de la base de datos Concentrado con la ruta especfica*/
use C:\Datos\Enigh\2000\Microdatos\Copia\Concen.dta, clear
/*Se genera una variable comn a los cuatro aos que sea la

Aboites_PL13_14.indd 207 12/2/14 11:48 AM


correspondiente al identificador del hogar, del factor de expansin, del
Manejo de las bases de datos y la construccin

ingreso corriente y del tamao de localidad


*/
sort folio
gen IDhogar = folio
de indicadores socioeconmicos

sort IDhogar
rename hog factor_hog
rename ingcor ing_cor
rename estrato tam_loc
rename tam_hog tot_integ
rename medica medicinas
rename gastot gasto_tot
rename gascor gasto_cor
rename gasmon gasto_mon
rename ingtot ing_total
rename ingmon ing_mon
208 rename gasnom gasto_nom
rename vestido_c vesti_calz
rename educacion educa_espa
rename educa educacion
*Se generan deciles de ingreso corriente
xtile decil = ing_cor [w=factor_hog], nq(10)
table decil [w=factor_hog], c(n ing_cor mean ing_cor min ing_cor max
ing_cor)
*Se hace una distincin de localidades urbanas y rurales
gen tipo_loc=0
replace tipo_loc=1 if tam_loc==1
replace tipo_loc=1 if tam_loc==2
*Guardo la base de datos en la ruta deseada, en caso de que ya exista se le
pone despues de la ruta , replace, en caso contrario solo se pone la ruta
antecedida por el comando save*/
save C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta
/*De la base de datos Hogares extraigo las variables necesarias para el
anlisis, haciendo la previa *homologacin de variables
*/
use C:\Datos\Enigh\2000\Microdatos\Copia\Hogares.dta, clear
sort folio
gen IDhogar = folio
sort IDhogar
rename factor factor_hog
rename estrato tam_loc
/*Extraigo el nmero de vehculos por hogar, en la base de datos 2000 el
tipo de vehculo est *incluido en una misma variable, donde cada posicin
significa el tipo de vehculo
*/
/*Se hace la distincin del tipo de vehculo, la variable no permite la

Aboites_PL13_14.indd 208 12/2/14 11:48 AM


distincin entre auto, triciclo y *bicicleta.
*/

La bicicleta y la cartera. Mxico: 1994-2012


generate int num_auto = real(substr(vehiculos,1,1))
gen num_van=0
generate int num_pickup = real(substr(vehiculos,3,1))
generate int num_moto = real(substr(vehiculos,5,1))
generate int num_bici = real(substr(vehiculos,7,1))
gen num_trici= 0
generate int num_carret = real(substr(vehiculos,9,1))
generate int num_canoa = real(substr(vehiculos,11,1))
generate int num_otro = real(substr(vehiculos,13,1))
/*Guardo las variables que me sirven en una base de datos diferente
*/
keep IDhogar num_auto num_van num_pickup num_moto num_bici
num_trici num_carret num_canoa num_otro
save C:\Datos\Enigh\2000\Microdatos\Copia\Hogaresvartransp.dta
/*Aado las variables del tipo de automvil al concentrado y guardo el 209
concentrado, en caso de que ya exista se le pone despues de la ruta ,
replace, en caso contrario solo se pone la ruta antecedida por el comando
save*/
use C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta, clear
sort IDhogar
merge 1:1 IDhogar using C:\Datos\Enigh\2000\Microdatos\Copia\
Hogaresvartransp.dta
save C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta, replace
/*De la base de datos Gastos, se extraen las variables de gasto relacionado
transporte, gasto en *combustible, educacin, adquisicin de vehculos,
refacciones, control de diabetes, control de peso *e hipertensin, realizando
la previa homologacin de variables
*/
use C:\Datos\Enigh\2000\Microdatos\Copia\Gastos.dta, clear
gen IDhogar = folio
sort IDhogar
rename gas_tri gasto_tri
*Gasto en combustible
gen combus =gasto_tri if (clave==F007 | clave==F008 | clave==F009 |
clave==F010 | clave==F011)
*Gasto en gasolina y diesel
gen gasdiesel=gasto_tri if (clave==F007)
*Gasto en transporte publico urbano: B001 a B005: Metro, autobs, trolebs,
colectivo o microbs, *taxi
gen publicourb=gasto_tri if (clave==B001 | clave==B002 | clave==B003 |
clave==B004 | clave==B005)
*Gasto en adquisicin de vehiculos
gen adqui_vehi=gasto_tri if (clave==M007 | clave==M008 |
clave==M009 | clave==M010 | clave==M011)

Aboites_PL13_14.indd 209 12/2/14 11:48 AM


*Gasto en refacciones
Manejo de las bases de datos y la construccin

gen refaccion=gasto_tri if (clave==M012 | clave==M013 | clave==M014 |


clave==M015 | clave==M016 | clave==M017 | clave==M018)
*Se realiza en concentrado por hogar de las variables de inters
sort IDhogar
de indicadores socioeconmicos

collapse (sum) combus gasdiesel publicourb adqui_vehi refaccion,


by(IDhogar)
*Guardo las variables en una nueva base de datos
save C:\Datos\Enigh\2000\Microdatos\Copia\ghogar_adicional.dta
*No hay gastos personales en diabetes, peso, combustible y transporte
publico
*Agrego la base de datos anterior al concentrado
use C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta, clear
sort IDhogar
drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\2000\Microdatos\Copia\ghogar_
210 adicional.dta
*Cambia valores perdidos por 0
mvencode combus, mv(0) override
mvencode gasdiesel, mv(0) override
mvencode publicourb, mv(0) override
mvencode refaccion, mv(0) override
mvencode adqui_vehi, mv(0) override
*Se realiza una homologacin de variables con las dems bases de datos
*Gasto total en gasolina y diesel hogar y poblacional
gen gt_gasdiesel=gasdiesel
*Gasto total en transporte pblico urbano hogar y poblacional
gen gt_ppublicourb=publicourb
*Gasto total en mantenimiento
gen mantenim=refaccion+combus
*No. vehculos motorizados por hogar
gen num_vehmot= num_auto+ num_van+ num_pickup+ num_moto
*No. vehculos motorizados para ms de 1 persona
gen num_vehmotm= num_auto+ num_van+ num_pickup
*No. Vehculos motorizados de una persona por hogar
gen num_vehmotu= num_moto
* No. bicicletas y triciclos x hogar como medio de transporte
gen num_bicitrici= num_bici+ num_trici
*No. otros medios de transporte x hogar
gen num_otrosveh= num_carret+ num_canoa+ num_otro
*Genero nmero de bicicletas ponderadas por cada integrante por hogar
gen num_btpc= num_bicitrici/tot_integ
*Agrego una variable para identificar el ao
gen anio=2000
*Agrego una variable correspondiente al deflactor anual
gen def=61.8643

Aboites_PL13_14.indd 210 12/2/14 11:48 AM


*Guardo la base de datos 2000, en caso de que ya exista se le pone despues
de la ruta , replace, en caso contrario solo se pone la ruta antecedida por el

La bicicleta y la cartera. Mxico: 1994-2012


comando save*/
save C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta, replace
/* PREPARACIN DE LA BASE DE DATOS CORRESPONDIENTE A LA
ENIGH 2006 */
/*Se limpia la memoria */
clear
/* Se emplea la base de datos tradicional, de manera que sea compatible la
comparacin con las bases de datos 1994 y 2000.
Se parte de la base de datos Concentrado con la ruta especfica
*/
use C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen.dta,
clear
/*Se genera una variable comn a los cuatro aos que sea la
correspondiente al identificador del hogar, del factor de expansin, del
ingreso corriente y del tamao de localidad 211
*/
sort folio
gen IDhogar = folio
sort IDhogar
/* Se realiza una homologacin de los nombres de las variables acorde a las
dems bases de datos*/
rename hog factor_hog
rename ingcor ing_cor
rename estrato tam_loc
rename medica medicinas
rename gastot gasto_tot
rename gascor gasto_cor
rename gasmon gasto_mon
rename gasnom gasto_nom
rename ingtot ing_total
rename ingmon ing_mon
rename vestido_c vesti_calz
rename educacion educa_espa
rename educa educacion
*Se generan deciles de ingreso
xtile decil = ing_cor [w=factor_hog], nq(10)
table decil [w=factor_hog], c(n ing_cor mean ing_cor min ing_cor max
ing_cor)
*Se hace una distincin de localidades urbanas y rurales
gen tipo_loc=0
replace tipo_loc=1 if tam_loc==1
replace tipo_loc=1 if tam_loc==2
*Guardo la base de datos en la ruta deseada
save C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen2006.

Aboites_PL13_14.indd 211 12/2/14 11:48 AM


dta
Manejo de las bases de datos y la construccin

/*De la base de datos Hogares extraigo las variables necesarias para el


anlisis, haciendo la previa homologacin de variables*/
use C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Hogares.dta,
clear
de indicadores socioeconmicos

sort folio
gen IDhogar = folio
sort IDhogar
rename factor factor_hog
rename estrato tam_loc
/*Extraigo el nmero de vehculos por hogar, en la base de datos 2006 el
tipo de vehculo ya se encuentra separado en distintas variables*/
gen num_auto=vehi04_1
gen num_van=vehi04_2
gen num_pickup=vehi04_3
gen num_moto=vehi04_4
212 gen num_bici=vehi04_5
gen num_trici= vehi04_6
gen num_carret= vehi04_7
gen num_canoa= vehi04_8
gen num_otro= vehi04_9
/*Guardo las variables que me sirven en una nueva base de datos*/
keep IDhogar num_auto num_van num_pickup num_moto num_bici
num_trici num_carret num_canoa num_otro
save C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\
Hogaresvartransp.dta
*Agrego las variables anteriores al concentrado
use C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen2006.dta,
clear
sort IDhogar
merge 1:1 IDhogar using C:\Datos\Enigh\2006 Tradicional\Microdatos\
Copia\Hogaresvartransp.dta
save C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen2006.
dta, replace
/*De la base de datos Gastos, se construyen las variables de gasto
relacionado transporte, gasto en combustible, educacin, adquisicin de
vehculos, refacciones, control de diabetes, control de peso *e hipertensin,
realizando la previa homologacin de variables
*/
use C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Gastos.dta, clear
gen IDhogar = folio
sort IDhogar
rename gas_tri gasto_tri
*Gasto en control de diabetes
gen g_diabetes=gasto_tri if (clave==J032 | clave==J057)
*Gasto en control de presin alta

Aboites_PL13_14.indd 212 12/2/14 11:48 AM


gen g_pres_alta=gasto_tri if (clave==J031 | clave==J056)
*Gasto en control de peso

La bicicleta y la cartera. Mxico: 1994-2012


gen g_peso=gasto_tri if (clave==J036 | clave==J037 | clave==J038)
*Gasto en combustible
gen combus =gasto_tri if (clave==F010 | clave==F011 | clave==F012
| clave==F013 | clave==F014 | clave==F015 | clave==F016 |
clave==F017)
*Gasto en gasolina y diesel
gen gasdiesel=gasto_tri if (clave==F010 | clave==F011 | clave==F0012)
/*Gasto en transporte publico urbano: B001 a B005: Metro, autobs,
trolebs, colectivo o microbs, taxi*/
gen publicourb=gasto_tri if (clave==B001 | clave==B002 | clave==B003 |
clave==B004 | clave==B005)
*Gasto en adquisicin de vehiculos
gen adqui_vehi=gasto_tri if (clave==M007 | clave==M008 |
clave==M009 | clave==M010 | clave==M011)
*Gasto en refacciones 213
gen refaccion=gasto_tri if (clave==M012 | clave==M013 | clave==M014 |
clave==M015 | clave==M016 | clave==M017 | clave==M018)
/*Se realiza en concentrado por hogar de las variables de inters*/
sort IDhogar
collapse (sum) g_diabetes g_pres_alta g_peso combus gasdiesel publicourb
adqui_vehi refaccion, by(IDhogar)
*Guardo las variables en una nueva base de datos
save C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\ghogar_
adicional.dta
/*No hay gastos personales en diabetes, peso, combustible y transporte
publico*/
*Agrego la base de datos anterior al concentrado
use C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen2006.dta,
clear
sort IDhogar
drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\2006 Tradicional\Microdatos\
Copia\ghogar_adicional.dta
*Cambia valores perdidos por 0
mvencode g_diabetes, mv(0) override
mvencode g_pres_alta, mv(0) override
mvencode publicourb, mv(0) override
mvencode refaccion, mv(0) override
mvencode adqui_vehi, mv(0) override
/*Se realiza una homologacin de variables con las dems bases de datos*/
/*Gasto total en medicinas para diabetes por hogar y poblacin*/
gen gt_diabetes=g_diabetes
/*Gasto total en medicinas para control de presin alta por hogar y
poblacional*/

Aboites_PL13_14.indd 213 12/2/14 11:48 AM


gen gt_pres_alta=g_pres_alta
Manejo de las bases de datos y la construccin

/*Gasto total en medicinas para control de peso por hogar y poblacional*/


gen gt_peso=g_peso
/*Gasto total en gasolina y diesel por hogar y poblacional*/
gen gt_gasdiesel=gasdiesel
de indicadores socioeconmicos

/*Gasto total en transporte pblico urbano por hogar y poblacional*/


gen gt_ppublicourb=publicourb
*Gasto total en mantenimiento
gen mantenim=refaccion+combus
*No. vehculos motorizados por hogar
gen num_vehmot= num_auto+ num_van+ num_pickup+ num_moto
/*No. vehculos motorizados para ms de 1 persona*/
gen num_vehmotm= num_auto+ num_van+ num_pickup
/*No. Vehculos motorizados de una persona por hogar */
gen num_vehmotu= num_moto
/* No. bicicletas y triciclos x hogar como medio de transporte*/
214 gen num_bicitrici= num_bici+ num_trici
*No. otros medios de transporte x hogar
gen num_otrosveh= num_carret+ num_canoa+ num_otro
/*Genero nmero de bicicletas ponderadas por cada integrante por hogar*/
rename tam_hog tot_integ
gen num_btpc= num_bicitrici/tot_integ
/*Agrego una variable para identificar el ao*/
gen anio=2006
/*Agrego una variable correspondiente al deflactor anual*/
gen def=81.51602
*Guardo la base de datos 2006
save C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\Concen2006.
dta, replace
/* PREPARACIN DE LA BASE DE DATOS CORRESPONDIENTE A LA
ENIGH 2012 */
/*Se limpia la memoria y se establece una cantidad de memoria*/
clear
/* Se emplea la base de datos tradicional, de manera que sea compatible la
comparacin con las bases de datos 1994 y 2000.
Se parte de la base de datos Concentrado con la ruta especfica*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\Concen.
dta, clear
/*Se genera una variable comn a los cuatro aos que sea la
correspondiente al identificador del hogar, del factor de expansin, del
ingreso corriente y del tamao de localidad*/
sort folioviv foliohog
gen IDhogar = folioviv + foliohog
sort IDhogar
*Se generan deciles de ingreso*/
xtile decil = ing_cor [w=factor_hog], nq(10)

Aboites_PL13_14.indd 214 12/2/14 11:48 AM


/*Se hace una distincin de localidades urbanas y rurales*/
gen tipo_loc=0

La bicicleta y la cartera. Mxico: 1994-2012


replace tipo_loc=1 if tam_loc==1
replace tipo_loc=1 if tam_loc==2
/*Guardo la base de datos en la ruta deseada, en caso de que ya exista se
le pone despues de la ruta , replace, en caso contrario solo se pone la ruta
antecedida por el comando save*/*/
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta
/*De la base de datos Hogares extraigo las variables necesarias para el
anlisis, haciendo la previa homologacin de variables*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\Hogares.
dta, clear
gen IDhogar = folioviv + foliohog
sort IDhogar
/*Guardo las variables que me sirven en una base de datos diferente*/
keep IDhogar num_auto anio_auto num_van anio_van num_pickup 215
anio_pickup num_moto anio_moto num_bici anio_bici num_trici anio_
trici num_carret anio_carret num_canoa anio_canoa num_otro anio_otro
est_alim est_trans
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Hogaresvartransp.dta
/*Aado las variables de la base de datos anterior a la BD concentrado*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta, clear
sort IDhogar
merge 1:1 IDhogar using C:\Datos\Enigh\2012 Tradicional\Microdatos\
Stata - copia\Hogaresvartransp.dta
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta, replace
/*De la base de datos Gastos, se construyen las variables de gasto
relacionado transporte, gasto en combustible, educacin, adquisicin de
vehculos, refacciones, control de diabetes, control de peso e hipertensin,
realizando la previa homologacin de variables*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\G_hogar.
dta, clear
gen IDhogar = folioviv + foliohog
/*Gasto en control de diabetes por hogar*/
gen g_diabetes=gasto_tri if (clave==J032 | clave==J057)
/*Gasto en control de presin alta por hogar*/
gen g_pres_alta=gasto_tri if (clave==J031 | clave==J056)
/*Gasto en medicinas para control de peso por hogar*/
gen g_peso=gasto_tri if (clave==J036 | clave==J037 | clave==J038)
/*Gasto en gasolina y diesel por hogar*/
gen gasdiesel=gasto_tri if (clave==F007 | clave==F008 | clave==F009)
/*Gasto en transporte pblico urbano por hogar: B001 a B005: Metro,

Aboites_PL13_14.indd 215 12/2/14 11:48 AM


autobs, trolebs, colectivo o microbs, taxi*/
Manejo de las bases de datos y la construccin

gen publicourb=gasto_tri if (clave==B001 | clave==B002 | clave==B003 |


clave==B004 | clave==B005)
/*Se realiza en concentrado por hogar de las variables de inters*/
sort IDhogar
de indicadores socioeconmicos

collapse (sum) g_diabetes g_pres_alta g_peso gasdiesel publicourb,


by(IDhogar)
sort IDhogar
/*Guardo las variables en una nueva base de datos*/
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\ghogar_
adicional.dta
/*Agrego a los gastos por hogar, los gastos personales en diabetes, peso,
combustible y transporte publico*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\G_person.
dta, clear
gen IDhogar = folioviv + foliohog
216 /*Gasto personal en control de diabetes*/
gen gp_diabetes=gasto_tri if (clave==J032 | clave==J057)
/*Gasto personal en control de presin alta*/
gen gp_pres_alta=gasto_tri if (clave==J031 | clave==J056)
/*Gasto personal en control de peso*/
gen gp_peso=gasto_tri if (clave==J036 | clave==J037 | clave==J038)
/*Gasto personal en gasolina y diesel*/
gen pgasdiesel=gasto_tri if (clave==F007 | clave==F008 | clave==F009)
/*Gasto personal en transporte publico urbano*/
gen ppublicourb=gasto_tri if (clave==B001 | clave==B002 | clave==B003
| clave==B004 | clave==B005)
/*Se realiza en concentrado por hogar de las variables de inters*/
sort IDhogar
collapse (sum) gp_diabetes gp_pres_alta gp_peso pgasdiesel ppublicourb,
by(IDhogar)
sort IDhogar
/*Guardo las variables en una nueva base de datos*/
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\gpobl_
adicional.dta
/*Identificacion de diabetes y presion alta*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\Pobla12.
dta, clear
gen IDhogar = folioviv + foliohog
gen peso_n=real(peso)
gen prob_sal_n=real(prob_sal)
gen diabetes_n=real(diabetes)
gen pres_alta_n=real(pres_alta)
replace prob_sal_n = 0 if prob_sal_n==2
replace diabetes_n = 0 if diabetes_n==2
replace peso_n = 0 if peso_n==2

Aboites_PL13_14.indd 216 12/2/14 11:48 AM


replace pres_alta_n = 0 if pres_alta_n==2
collapse (sum) peso_n diabetes_n pres_alta_n prob_sal_n, by(IDhogar)

La bicicleta y la cartera. Mxico: 1994-2012


sort IDhogar
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\pobl_
adicional.dta
/*Agrego la base de datos anterior al concentrado*/
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta, clear
sort IDhogar
drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\2012 Tradicional\Microdatos\
Stata - copia\ghogar_adicional.dta
drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\2012 Tradicional\Microdatos\
Stata - copia\gpobl_adicional.dta
drop _merge
merge 1:1 IDhogar using C:\Datos\Enigh\2012 Tradicional\Microdatos\ 217
Stata - copia\pobl_adicional.dta
/*Cambia valores perdidos por 0*/
mvencode gp_diabetes, mv(0) override
mvencode g_diabetes, mv(0) override
mvencode gp_pres_alta, mv(0) override
mvencode g_pres_alta, mv(0) override
mvencode gp_peso, mv(0) override
mvencode g_peso, mv(0) override
mvencode pgasdiesel, mv(0) override
mvencode gasdiesel, mv(0) override
mvencode ppublicourb, mv(0) override
mvencode publicourb, mv(0) override
/*Genero el gasto total por variable, sumando el gasto por hogar y el gasto
personal*/
/*Gasto total en medicinas para diabetes por hogar y poblacin*/
gen gt_diabetes=gp_diabetes+g_diabetes
/*Gasto total en medicinas para control de presin alta por hogar y
poblacional*/
gen gt_pres_alta=gp_pres_alta+g_pres_alta
/*Gasto en medicinas para control de peso por hogar*/
gen gt_peso=gp_peso+g_peso
/*Gasto total en gasolina y diesel por hogar y poblacional*/
gen gt_gasdiesel=pgasdiesel+gasdiesel
/*Gasto total en transporte pblico urbano por hogar y poblacional*/
gen gt_ppublicourb=ppublicourb+publicourb
/*Se realiza una homologacin de variables con las dems bases de datos*/
rename esparci esparcispaqtur
gen esparci=esparcispaqtur+ paq_turist
gen personal = personales+transf_gas

Aboites_PL13_14.indd 217 12/2/14 11:48 AM


*No. vehculos motorizados por hogar
Manejo de las bases de datos y la construccin

gen num_vehmot= num_auto+ num_van+ num_pickup+ num_moto


*No. vehculos motorizados para ms de 1 persona
gen num_vehmotm= num_auto+ num_van+ num_pickup
*No. Vehculos motorizados de una persona por hogar
de indicadores socioeconmicos

gen num_vehmotu= num_moto


/* No. bicicletas y triciclos x hogar como medio de transporte*/
gen num_bicitrici= num_bici+ num_trici
*No. otros medios de transporte x hogar
gen num_otrosveh= num_carret+ num_canoa+ num_otro
/*Genero nmero de bicicletas ponderadas por cada integrante por hogar*/
gen num_btpc= num_bicitrici/tot_integ
**************************************************************************
***
/*Agrego una variable para identificar el ao*/
gen anio=2012
218 /*Agrego una variable correspondiente al deflactor anual*/
gen def=105.1959
/*Guardo la base de datos 2012*/
save C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta, replace
/* SE CONCENTRAN LAS CUATRO BASES DE DATOS EN UN SOLO
ARCHIVO */
/*Solo mantengo las variables que se utilizan de la Base de Datos
Concentrado construida para el ao 2012*/
clear
use C:\Datos\Enigh\2012 Tradicional\Microdatos\Stata - copia\
Concen2012.dta, clear
keep IDhogar ubica_geo tam_loc factor_hog tot_integ p12_64 ing_total
ing_cor ing_mon gasto_tot gasto_cor gasto_mon gasto_nom alimentos
vesti_calz vivienda alquiler agua energia limpieza cuidados salud medicinas
transporte publico foraneo adqui_vehi mantenim refaccion comunica
educacion esparci educa_espa combus personal decil tipo_loc num_auto
num_van num_pickup num_moto num_bici num_trici num_carret num_
canoa num_otro g_diabetes g_pres_alta g_peso gasdiesel publicourb gp_
diabetes gp_pres_alta gp_peso pgasdiesel ppublicourb peso_n diabetes_n
pres_alta_n prob_sal_n gt_diabetes gt_pres_alta gt_peso gt_gasdiesel gt_
ppublicourb num_vehmot num_vehmotm num_vehmotu num_bicitrici
num_otrosveh num_btpc anio def
/*Le agrego la base de datos Concentrado construida para el ao 2006*/
append using C:\Datos\Enigh\2006 Tradicional\Microdatos\Copia\
Concen2006.dta, keep(IDhogar ubica_geo tam_loc factor_hog tot_integ
p12_64 ing_total ing_cor ing_mon gasto_tot gasto_cor gasto_mon gasto_
nom alimentos vivienda alquiler agua energia limpieza cuidados salud
medicinas transporte publico foraneo adqui_vehi mantenim refaccion
comunica educacion esparci educa_espa vesti_calz combus personal decil

Aboites_PL13_14.indd 218 12/2/14 11:48 AM


tipo_loc num_auto num_van num_pickup num_moto num_bici num_trici
num_carret num_canoa num_otro g_diabetes g_pres_alta g_peso gasdiesel

La bicicleta y la cartera. Mxico: 1994-2012


publicourb gt_diabetes gt_pres_alta gt_peso gt_gasdiesel gt_ppublicourb
num_vehmot num_vehmotm num_vehmotu num_bicitrici num_otrosveh
num_btpc anio def)
/*Le agrego la base de datos Concentrado construida para el ao 2000*/
append using C:\Datos\Enigh\2000\Microdatos\Copia\Concen2000.dta,
keep(IDhogar ubica_geo tam_loc factor_hog tot_integ p12_64 ing_total
ing_cor ing_mon gasto_tot gasto_cor gasto_mon gasto_nom alimentos
vivienda alquiler agua energia limpieza cuidados salud medicinas
transporte publico foraneo adqui_vehi mantenim refaccion comunica
educacion esparci educa_espa vesti_calz combus personal decil tipo_loc
num_auto num_van num_pickup num_moto num_bici num_trici
num_carret num_canoa num_otro gasdiesel publicourb gt_gasdiesel gt_
ppublicourb num_vehmot num_vehmotm num_vehmotu num_bicitrici
num_otrosveh num_btpc anio def)
/*Le agrego la base de datos Concentrado construida para el ao 1994*/ 219
append using C:\Datos\Enigh\1994\Microdatos\Copia\Concen1994.dta,
keep(IDhogar ubica_geo tam_loc factor_hog tot_integ p12_64 ing_total
ing_cor ing_mon gasto_tot gasto_cor gasto_mon gasto_nom alimentos
vesti_calz vivienda limpieza salud transporte publico educacion educa_
espa comunica combus personal publico foraneo adqui_vehi mantenim
refaccion decil tipo_loc num_auto num_van num_pickup num_moto
num_bici num_trici num_carret num_canoa num_otro gasdiesel
publicourb gt_gasdiesel gt_ppublicourb num_vehmot num_vehmotm
num_vehmotu num_bicitrici num_otrosveh num_btpc anio def)
/*Gener una variable que rena todos los medios de transporte*/
gen num_mtranstot= num_vehmot+ num_vehmotm+ num_vehmotu+
num_bicitrici + num_otrosveh
/*Identifico los hogares que tengan bicicleta*/
gen hogbici=1
replace hogbici=0 if num_btpc==0
/*Renombro la variable ao*/
ren anio year
/*Renombro la variable def por def2010, dado que el deflactor tiene base
2010*/
ren def def2010
/*Se crean los deflactores generales base 2012*/
gen def2012=100 if year==2012
replace def2012=77.48972354 if year==2006
replace def2012=58.80866595 if year==2000
replace def2012=18.16040326 if year==1994
/*Se crean los deflactores para las variables de salud base 2012*/
gen DefSalud2012=100 if year==2012
replace DefSalud2012=79.13368043 if year==2006
replace DefSalud2012=61.10948388 if year==2000

Aboites_PL13_14.indd 219 12/2/14 11:48 AM


replace DefSalud2012=16.78052522 if year==1994
Manejo de las bases de datos y la construccin

/*Se crean los deflactores para las variables de transporte base 2012*/
gen DefTransp2012=100 if year==2012
replace DefTransp2012=74.97224361 if year==2006
replace DefTransp2012=59.15713471 if year==2000
de indicadores socioeconmicos

replace DefTransp2012=16.86490829 if year==1994


/*Se crean los deflactores para las variables de transporte pblico urbano
base 2012*/
gen DefTrPubUrb2012=100 if year==2012
replace DefTrPubUrb2012=74.34604754 if year==2006
replace DefTrPubUrb2012=53.27522173 if year==2000
replace DefTrPubUrb2012=15.82789629 if year==1994
/*Se crean los deflactores para las variables de gasolina y aceite base 2012*/
gen DefGasAceite2012=100 if year==2012
replace DefGasAceite2012=65.61385397 if year==2006
replace DefGasAceite2012=48.36622586 if year==2000
220 replace DefGasAceite2012=12.88562219 if year==1994
/*Se crean los deflactores para las variables de alimentos base 2012*/
gen DefAlimentos2012=100 if year==2012
replace DefAlimentos2012=68.14391095 if year==2006
replace DefAlimentos2012=50.79903677 if year==2000
replace DefAlimentos2012=15.12557383 if year==1994
/*Se crean los deflactores para las variables de vestido y calzado base 2012*/
gen DefVesticalz2012=100 if year==2012
replace DefVesticalz2012=85.53406664 if year==2006
replace DefVesticalz2012=75.37230757 if year==2000
replace DefVesticalz2012=23.95807051 if year==1994
/*Se crean los deflactores para las variables de vivienda base 2012*/
gen DefVivienda2012=100 if year==2012
replace DefVivienda2012=86.42940826 if year==2006
replace DefVivienda2012=64.008984 if year==2000
replace DefVivienda2012=21.76532323 if year==1994
/*Se crean los deflactores para las variables de educacin base 2012*/
gen DefEduca2012=100 if year==2012
replace DefEduca2012=78.75725478 if year==2006
replace DefEduca2012=52.42941707 if year==2000
replace DefEduca2012=17.9732946 if year==1994
/*Se crean las variable a precios del ao 2012 acorde a su deflactor
correspondiente*/
gen ing_total2012= (ing_total/ def2012)*100
gen ing_cor2012= (ing_cor/ def2012)*100
gen ing_mon2012= (ing_mon/ def2012)*100
gen gasto_tot2012= ( gasto_tot/ def2012)*100
gen gasto_cor2012= ( gasto_cor/ def2012)*100
gen gasto_mon2012= ( gasto_mon/ def2012)*100
gen alimentos2012= (alimentos/DefAlimentos2012)*100

Aboites_PL13_14.indd 220 12/2/14 11:48 AM


gen vivienda2012=(vivienda/DefVivienda2012)*100
gen alquiler2012= (agua/DefVivienda2012)*100

La bicicleta y la cartera. Mxico: 1994-2012


gen energia2012= (energia/DefVivienda2012)*100
gen limpieza2012= (limpieza/DefVivienda2012)*100
gen cuidados2012= (cuidados/DefVivienda2012)*100
gen salud2012= (salud/DefSalud2012)*100
gen medicinas2012= (medicinas/DefSalud2012)*100
gen educa_espa2012=(educa_espa/DefEduca2012)*100
gen educacion2012=(educacion/DefEduca2012)*100
gen esparci2012=(esparci/DefEduca2012)*100
gen vesti_calz2012=(vesti_calz/DefVesticalz2012)*100
gen gt_diabetes2012= (gt_diabetes/DefSalud2012)*100
gen gt_pres_alta2012= (gt_pres_alta/DefSalud2012)*100
gen gt_peso2012= (gt_peso/DefSalud2012)*100
gen personal2012=(personal/DefSalud2012)*100
gen transporte2012= (transporte/DefTransp2012)*100
gen combus2012= ( combus/ DefTransp2012)*100 221
gen publico2012=(publico/DefTransp2012)*100
gen mantenim2012=(mantenim/DefTransp2012)*100
gen refaccion2012=(refaccion/DefTransp2012)*100
gen comunica2012=(comunica/DefTransp2012)*100
gen gt_ppublicourb2012= ( gt_ppublicourb/DefTrPubUrb2012)*100
gen gt_gasdiesel2012= ( gt_gasdiesel/DefGasAceite2012)*100
/*Se crean las variables en logaritmo natural, por si se necesitan estimar
elasticidades*/
gen ln_gt_ppublicourb2012=ln( gt_ppublicourb2012)
gen ln_gt_gasdiesel2012=ln( gt_gasdiesel2012)
gen ln_gt_diabetes2012=ln(gt_diabetes2012)
gen ln_gt_pres_alta2012=ln( gt_pres_alta2012)
gen ln_gt_peso2012=ln( gt_peso2012)
gen ln_combus2012=ln( combus2012)
gen ln_transporte2012=ln( transporte2012)
gen ln_gasto_cor2012=ln( gasto_cor2012)
gen ln_ing_cor2012=ln(ing_cor2012)
gen ln_num_btpc=ln(num_btpc)
/*Calculo nmero de vehculos motorizados por integrante*/
gen num_motopc= num_vehmotm/ tot_integ
/*Identifico la entidad federativa de cada hogar*/
generate str EntidadF = substr(ubica_geo,1,2)
/*Identifico la variable municipio de cada hogar*/
gen str Municipio = substr(ubica_geo,3,3)
/*Salvo el concentrado*/
save C:\Datos\Enigh\Concentrado.dta
/*************************************************************************
**
****************ALGUNOS EJEMPLOS DE

Aboites_PL13_14.indd 221 12/2/14 11:48 AM


ANLISIS*******************************
Manejo de las bases de datos y la construccin

**************************************************************************
***/
/*Se puede acotar el anlisis a una entidad federativa, por ejemplo,si solo
quiero analizar a *Coahuila de Zaragoza: clave 05*/
de indicadores socioeconmicos

*keep if EntidadF==05
/*Tabulado de numero de bicicletas o triciclos por hogar, poneradas por el
factor de expansin, por ao. */
by year, sort : table num_btpc [pweight = factor_hog]
/*Tabulado de numero de hogares con y sin bicicleta por ao*/
table year hogbici [fweight = factor_hog], contents(freq )
/*Tabulado de numero de hogares con y sin bicicleta por ao con formato
2 decimales*/
table year hogbici [fweight = factor_hog], contents(freq ) format(%13.2f)
/* No. de medios de transporte por hogar por ao*/
table num_mtranstot year [fweight = factor_hog], contents(freq ) format
222 (%13.0f)
/* Sumar el gasto corriente y el gasto en gasolina y diesel para cada ao,
ponderados por el factor, unicamente para los ltimos tres deciles de
ingreso */
by year, sort: sum gasto_cor gt_gasdiesel2012 [fweight = factor_hog] if
decil>7
/*Se puede analizar el gasto en cualquier variable por ao, por ejemplo, si se
quiero analizar la estructura de gasto por hogar, a precios corrientes: gasto
corriente, gasto en alimentos, gasto en vestido y calzado, gasto en vivienda,
gasto en salud, gasto en transporte, gasto en comunicacin y gasto en
educacin. */
by year, sort: sum gasto_cor alimentos vesti_calz vivienda salud transporte
comunica educacion [w=factor_hog]
/*Estructura de gasto por ao y por hogares con bicicleta, y sin bicicleta */
by year hogbici, sort: sum gasto_cor alimentos vesti_calz vivienda salud
transporte comunica educacion [w=factor_hog]
/*Estructura de gasto por ao y por hogares con bicicleta, y sin bicicleta y
por decil de ingreso */
by year hogbici decil, sort: sum gasto_cor alimentos vesti_calz vivienda
salud transporte comunica educacion [w=factor_hog]
*/Analizar patrones de consumo de hogares con bicileta y sin bicleta, por
ao, en precious corrientes*/
by year, sort: table hogbici [w=factor_hog], c( mean alimentos mean vesti_
calz mean vivienda mean salud mean gt_diabetes)
/* Puedo tabular la media de medio de transportes por hogar por ao*/
table decil tipo_loc[w=factor_hog], c(mean num_vehmot mean num_
vehmotm mean num_vehmotu mean num_bicitrici mean num_
otrosveh)
/*No. de hogares con bicicleta o triciclo mo medio de transporte, por ao*/
by year, sort: tab hogbici [w=factor_hog]

Aboites_PL13_14.indd 222 12/2/14 11:48 AM


/*Es possible estimar las elasticidades con las variables previamente
convertidas a logaritmo*/

La bicicleta y la cartera. Mxico: 1994-2012


by year, sort : regress ln_gt_ppublicourb2012 ln_num_btpc [fweight =
factor_hog]
/*Imprimir coeficientes de correlacin y p-values: si el p-value<0.05,
rechaza la hiptesis nula referente a que el niv. de corr es 0, por lo tanto el
coef de correlacin es no nulo*/
by year decil, sort : pwcorr num_vehmot num_vehmotm num_vehmotu
num_bicitrici num_otrosveh salud medicinas transporte publico adqui_
vehi mantenim refaccion combus [fweight = factor_hog], sig star(.05)
/*Analizar por parte del ingreso, como cambia el patron de adquisicion de
vehiculo*/
by year, sort: table decil [fweight = factor_hog], contents(mean num_
vehmot mean num_vehmotm mean num_vehmotu mean num_bicitrici
mean num_otrosveh)

223

Aboites_PL13_14.indd 223 12/2/14 11:48 AM


9 David Castro Lugo
Reyna E. Rodrguez
Mario Camberos Castro

Aboites_PL13_14.indd 224 12/2/14 11:48 AM


B
recha salarial

por gnero

en Saltillo:

Un ejercicio

metodolgico

225

Pueden las personas recibir ms o menos ingresos o salarios


por el hecho de ser hombre o mujer, migrante u originario del
lugar, tener la piel negra o blanca, ser indgena o no, profesar
la religin catlica o alguna otra, ser heterosexual o no? En caso de
existir estas diferencias en los ingresos, de qu magnitud es?, la
causa de esta brecha salarial entre distintos grupos es por discri-
minacin o existen otros factores?

Estas y otras preguntas han sido planteadas desde hace mucho tiempo, y puede
considerarse que a partir de la publicacin de Economics of Discrimination de Gary
S. Becker en 1957, el tema de la discriminacin econmica, como posible fuente
de la brecha salarial, ha formado parte de la temtica de economa laboral. Los es-
tudios que intentan identificar la presencia de discriminacin, medir la magnitud,
evolucin y origen de la misma, cubren un nmero importante de pases en todos
los continentes.

Mxico no es la excepcin y desde los primeros trabajos publicados (Alarcn y


McKinley, 1994; Garro y Rodrguez, 1995), el tema ha tenido una presencia per-
manente en revistas nacionales e internacionales, as como en libros y captulos,
producto de estudios tanto a nivel nacional como regional y sectorial,2 hecho que
puede interpretarse como indicador de la importancia que los acadmicos asignan
a este temtica, mientras que a nivel de la administracin pblica, la creacin de

2 Para una revisin sobre los principales estudios sobre brecha salarial y discriminacin en Mxico,
vase Rodrguez y Castro (2014).

Aboites_PL15_16.indd 225 12/2/14 11:49 AM


El Consejo Nacional para Prevenir La Discriminacin (CONAPRED), el 29 de abril
Manejo de las bases de datos y la construccin

del 2003, da muestra de la relevancia del tema, como objeto de polticas pblicas.3

El presente captulo tiene por objetivo realizar un ejercicio didctico que permita
determinar, bajo el enfoque metodolgico tradicional (Oaxaca-Blinder), la magni-
de indicadores socioeconmicos

tud de la brecha salarial por sexo no explicada por las caractersticas de las personas
y que de manera convencional se considera como discriminacin salarial.

El ejercicio se desarrolla utilizando como fuente de informacin el tercer trimestre


del 2005 y 2012 de la Encuesta Nacional de Ocupacin y Empleo (ENOE) para la ciu-
dad de Saltillo y empleando como herramienta el paquete estadstico de STATA v. 13.

Adems de atender un propsito didctico que permita a los estudiantes de licen-


ciatura y posgrado introducirse a este tema de una manera prctica y sencilla, el
uso de informacin reciente permite tener un conocimiento actualizado sobre
el comportamiento de la brecha de ingresos por sexo y sus componentes, dentro
226 de los cuales se ubica la discriminacin salarial.

La descomposicin de la brecha en las retribuciones por sexo permite establecer


que la parte no explicada (discriminacin) de la diferencia salarial, representa ms
de 80% de la brecha salarial y que durante el periodo de estudio, no obstante que la
diferencia de ingreso se mantiene estable en aproximadamente 20%, la contribu-
cin de la discriminacin para explicar esa diferencia aumenta.

Es resto del documento se compone de cuatro apartados; en el primero se pre-


sentan los conceptos, teoras y metodologa, para posteriormente continuar con la
base de datos. Los resultados del ejercicio son abordados en el tercer apartado y se
finaliza con las conclusiones del mismo.

! Concepto, teoras y metodologa

Concepto

Qu se entiende por discriminacin? Aun cuando existen diversas definiciones


desde diferentes enfoques disciplinarios, para la perspectiva econmica una defi-
nicin razonable es la siguiente:

Existe discriminacin econmica cuando las mujeres o los trabaja-


dores pertenecientes a grupos minoritarios que tienen la misma
capacidad, nivel de estudios, formacin y experiencia que los varones
del grupo mayoritario reciben un trato inferior en la contratacin, el
acceso a una ocupacin, los ascensos, el salario o las condiciones de
trabajo (McConnell et al., 2003:435).

3 Para mayor informacin sobre el CONAPED, vase la pgina: www.conapred.org.mx/

Aboites_PL15_16.indd 226 12/2/14 11:49 AM


Para el caso particular de las remuneraciones decimos que existe discriminacin
salarial cuando "las mujeres ganan menos que los hombres por hacer el mismo
trabajo. En trminos ms tcnicos, existe discriminacin salarial cuando las di-

en Saltillo: Un ejercicio metodolgico


ferencias salariales no se deben a la presencia de diferencias en productividad
(McConnell et al., 2003:435).

Teoras de la discriminacin

Brecha salarial por gnero


Por qu existe la discriminacin o cmo explicar su presencia? Al respecto po-
demos encontrar varias teoras, pero se destacan fundamentalmente la teora del
gusto por la discriminacin, atribuida a Becker (1957), y la discriminacin estadstica
de Phelps (1972).

La primera, parte del gusto de las personas por discriminar a otras, Becker (1957),
plantea que este gusto lleva al individuo a actuar como si tuviera una disponibili-
dad a pagar para evitar realizar transacciones con las personas desfavorecidas, dado
que ello le implica un costo subjetivo o psicolgico. En el caso de los productores, el 227
gusto por la discriminacin puede llevarlos a contratar varones a un precio mayor
con el fin de no emplear a mujeres aun cuando ambos son igualmente productivos
o en su caso contratar a mujeres con remuneraciones inferiores a la que reciben
los varones.

La segunda teora parte de la idea de que se juzga a las personas a partir de las ca-
ractersticas promedio del grupo al que pertenece y no de las propiedades indivi-
duales; as, cuanto ms heterogneo sea el grupo ms diferencias existirn entre el
promedio y cada individuo, y por tanto mayor ser el nivel de error y la posibilidad
de discriminacin por este hecho.

A diferencia de lo que ocurre en la teora anterior, en este caso puede decirse que no
existe un gusto por la discriminacin, sino que el empleador a partir de caracters-
ticas como la edad, sexo, raza, etctera, intenta aproximar atributos de produccin,
apoyado en comportamiento promedio, lo que implicara la existencia de una ra-
cionalidad y no necesariamente una desventaja.

Metodologa

Cmo medir la discriminacin? Para determinar la magnitud del gusto por la


discriminacin, Becker captura la discriminacin a travs de un indicador, d, que
refleja el impacto de los costos discriminatorios en trminos monetarios y acta
como puente entre costo monetario y costo neto. Este coeficiente se explica de
la siguiente manera: si el empleador no tiene prejuicios para contratar a hombres,
el costo de contratarlo es el salario Wh. Sin embargo, el costo de emplear a una
mujer sera el salario Wm ms el costo subjetivo,4 por tanto el empresario que tiene
prejuicios solo contratar mujeres si su salario es inferior a los hombres. De esta

4 Esto considerando que hombres y mujeres son perfectamente sustitutivos.

Aboites_PL15_16.indd 227 12/2/14 11:49 AM


manera, para emplear mujeres, el salario femenino debe ser menor que el de los
Manejo de las bases de datos y la construccin

varones en la cuanta del indicador de discriminacin, que no es otra cosa que el


valor monetario del costo subjetivo, as:

Wm = Wh d (1]
de indicadores socioeconmicos

Si hombres y mujeres no son perfectamente sustituibles, entonces pueden exis-


tir diferencias salariales aun en ausencia de discriminacin y si adems modifica-
mos el indicador d, para expresarlo en trminos relativos (coeficiente), se obtiene el
coeficiente de discriminacin (D) como una medida de discriminacin:

D = [(Wh/Wm) (Wh/Wm)o]/[(Wh/Wm)o] [2]

donde (Wh /Wm) es la razn salarial hombre-mujer observado y (Wh /Wm)o es la ra-
zn salarial en ausencia de discriminacin, que bajo un esquema de minimizacin
de costos correspondera a la razn de productividades marginales hombre-mujer.
228
D + 1 = (Wh /Wm)/(Wh /Wm)o expresado en logaritmos queda:

Ln (D + 1) = ln (Wh/Wm) ln (Wh/Wm)o [3]

La expresin anterior se puede presentar como:

ln ((Wh/Wm) = ln (Wh/Wm)o + Ln (D + 1) [3a]

e indica que la brecha salarial entre hombres y mujeres tiene dos componentes: el
primero, correspondiente a la diferencia salarial vinculada con la dotacin de capi-
tal humano entre hombres y mujeres, y que generara diferencias en productividad
mejor conocida como la parte de la brecha salarial no discriminatoria; y el segundo,
que se relaciona con la discriminacin dado que no se sustenta en consideraciones
o criterios de racionalidad econmicas objetivos.

La expresin tambin puede presentarse as:

Ln (D + 1) = ln ((Wh/(Wh)o) + ln ((Wm)o/Wm) [4]

donde se puede establecer que si la estructura salarial de los hombres es la no


discriminatoria,5 la discriminacin se manifiesta como:

Ln (D + 1) = ln (Wm)o ln (Wm) [5]

Es decir, la diferencia entre lo que deberan recibir las mujeres en condiciones de


equidad y lo que realmente perciben.

5 Para diferentes propuestas de estructuras salariales no discriminatorias, vase Oaxaca y Ranson


(1994).

Aboites_PL15_16.indd 228 12/2/14 11:49 AM


Las ecuaciones salariales de Mincer (1974), apoyadas en la teora del capital huma-
no, permiten, mediante mnimos cuadrados ordinarios, hacer una estimacin de la
estructura salarial de grupos determinados, as:

en Saltillo: Un ejercicio metodolgico


Ln (Wi) = Xi + i i = 1, n
donde

Brecha salarial por gnero


Wi = tasa salarial del i-esimo trabajador
Xi = vector de caractersticas individuales
= vector de coeficientes
= trmino de perturbacin

Esto es, la remuneracin salarial del trabajador i, (Wi ) es determinado por las ca-
ractersticas individuales, lase dotacin de capital humano (Xi ), como pueden ser
escolaridad, experiencia, etctera, multiplicado por la retribucin (rendimiento) a
esas caractersticas (), ms un factor de perturbacin aleatoria, que se distribuye
normalmente y cuya media es 0. El salario estimado es: 229

Ln( h) = h (gorro)h

Ln( m) = m(gorro)m

donde h y m es el salario medio para hombres y mujeres, respectivamente, es


el vector de valores medios de los regresores o variables explicativas y los s (gorro)
son los vectores de los coeficientes estimados por sexo.

A partir de [3a]

Ln( h) Ln( m) = h (gorro)h m (gorro)m

Al sumar y restar por el trmino (gorro) y reordenando trminos llegamos a


m h
la expresin:

Ln( = (gorro)h ( + ((gorro) (gorro) )


h) Ln( m) h m) m h h [6]

donde se puede apreciar que la brecha salarial es desagregada en dos trminos, tal
como se indica en la ecuacin [3a]. El primer trmino corresponde a la diferencia
salarial asociada a las caractersticas y el segundo representa la parte no explicada
de la disparidad salarial, dado que captura la diferencia en los rendimientos a las
caractersticas de hombres y mujeres (((gorro)h (gorro)h)6 y que se asocia a la
discriminacin; con lo cual es posible descomponer empricamente la diferencia
salarial por grupos, en este caso por sexo.

6 Si no existieran diferencias en los rendimientos a las caractersticas por sexo, la expresin


((gorro)h (gorro)h) sera cero y por tanto cero todo el segundo trmino, indicando que la brecha
salarial solo es asociada a la disparidad en las dotaciones de capital humano.

Aboites_PL15_16.indd 229 12/2/14 11:49 AM


Una vez mostrada la metodologa, a continuacin se presentna las caractersticas
Manejo de las bases de datos y la construccin

de la base de datos a utilizar, as como las modificaciones y adecuaciones nece-


sarias para poder realizar la descomposicin de la brecha salarial, como se indic
lneas arriba.
de indicadores socioeconmicos

! Bases de datos

Para ilustrar la metodologa, as como su aplicacin en STATA, se usan las bases de


datos provenientes de la Encuesta Nacional de Ocupacin y Empleo (ENOE). Se
trata de una base de datos integrada por un conjunto de tablas con informacin
de diferente tipo, las cuales se relacionan entre s mediante campos de identifica-
cin que le son comunes y que sirven para vincularlas. Es deseable contar con una
base de datos con toda la informacin relevante para realizar una investigacin.
Sin embargo, esto no es posible en muchas ocasiones debido a que las fuentes de
informacin se encuentran dispersas. Como ejemplo tenemos las bases de datos
230 provenientes de la ENOE.

La informacin de la ENOE es presentada en cinco tablas de datos tipo .dbf (en for-
matos de programas especializados como Dbase o Fox Pro), las cuales son: vivienda
(VIVT305), hogares (HOGT305), sociodemogrfico (SDEMT305) y los cuestionarios
de ocupacin y empleo I (COE1T305) y II (COE2T3057). Para fines de este trabajo
solo nos enfocaremos en la combinacin de las ltimas tres tablas mencionadas,
ya que el objetivo de esta investigacin es analizar la estructura de empleo y salarios
por lo que no se consideran viviendas ni hogares, sino individuos.

Las bases de datos en STATA se caracterizan por tener extensin .dta. A menudo, en
los anlisis que realizamos debemos trabajar con bases de datos en formatos que no
son de STATA (.dta), tal es el caso de las ENOE con tablas de tipo .dbf, las cuales
no pueden importarse y requieren ser convertidas a .txt (archivos de texto) desde
donde es posible importarlos a STATA utilizando el comando insheet.

Concatenar tablas

Para concatenar8 las tablas es necesaria la creacin de una llave principal en cada
una de ellas, para la unificacin de una base master integrada por todas las tablas.
La llave principal est formada por varios campos comunes que se encuentran en
las diferentes tablas y que sirven para relacionarlas. Los campos se utilizan como
referencia para identificar las columnas que conforman cada una de las tablas, los
cuales se asocian a las preguntas del instrumento de captacin: el cuestionario.
INEGI las presenta en las tablas Sdem, Coe1 y Coe2.

7 Los ltimos tres dgitos corresponden al trimestre y ao, en este caso indica que es el trimestre 3 y
el ao 2005.
8 Agregar o juntar diferentes mdulos de informacin en uno solo.

Aboites_PL15_16.indd 230 12/2/14 11:49 AM


Para relacionar la tabla sociodemogrfica con las de ocupacin y empleo I y II se de-
ben tomar en cuenta los siguientes campos para la creacin de la llave principal: ciu-
dad auto representada (CD_A); entidad (ENT); control (CON); vivienda seleccionada

en Saltillo: Un ejercicio metodolgico


(V_SEL); nmero de hogar (N_HOG); hogar mudado (H_MUD); nmero de rengln
(N_REN). Asimismo, de 2005 a 2010 la tabla sociodemogrfica contiene un campo
con el nombre FAC, el cual almacena el factor de expansin de cada registro e in-
dica cuntas personas representa el entrevistado en poblacin. Con base en la llave

Brecha salarial por gnero


principal, es posible trasladar el efecto de expansin (campo FAC) de la tabla sociode-
mogrfica al cuestionario de ocupacin y empleo I y II; sin embargo, esta condicin
cambia a partir de 2011, ya que desde ese ao todas las tablas contienen el campo FAC.

A la llave principal en cada tabla se le asigna el nombre de folio y para generarlo


las variables que lo integran se homologan convirtindolas a string (alfanumricas)
utilizando el comando tostring; estas variables se suman para despus convertir
folio en una variable de tipo numrico con el comando destring. Una vez creada la
variable folio, en cada tabla se procede a concatenar la informacin.
231
Para combinar la tabla sociodemogrfica con las de ocupacin y empleo I y II utili-
zamos el comando merge.

Al combinar las tablas se genera una base de datos master (la primera en abrirse) y
otra using (la que se combina con la tabla master). Sin embargo, existen diferen-
tes opciones para la relacin entre dichas tablas en funcin de si existen o no va-
lores repetidos en la llave principal. Si se crea una variable de sistema _merge==1
significa que el dato proviene de la base master; si _merge==2, implica que el dato
aparece nicamente en la tabla using; y si _merge==3, significa que el dato aparece
en la base master y en la tabla using. Es importante explicar que el archivo master
se refiere al conjunto de datos cargados en la memoria y using al conjunto de datos
que est en disco y que se unir al archivo cargado.

Por lo que la variable interna _merge indica el conjunto de datos del cual se obtu-
vieron las observaciones de cada fila. Esta variable es importante en la verificacin
de cmo fue realizada la unin de los datos. Por ejemplo, en el ejercicio que se
realiza en este trabajo, se unieron la base sdem (master) y coe1 (using) en un primer
paso, para despus crear una master sdem_coe1 y unir coe2 using, y as crear una
base master con la unin de las tablas sdem, coe1 y coe2. Como se seal ante-
riormente, la variable _merge vale 1 cuando las observaciones del regln proceden
del archivo master, vale 2 cuando las observaciones proceden del archivo using y
vale 3 cuando las observaciones provienen de ambos archivos. Los valores de la
variable _merge se pueden visualizar con el comando list o bien desde el editor de
datos con el comando edit.

Seleccin de la muestra y variables de estudio

Dado que el objetivo de este ejercicio es realizar la descomposicin de la brecha


salarial por sexo en el rea metropolitana de Saltillo (AMS), dentro de la poblacin

Aboites_PL15_16.indd 231 12/2/14 11:49 AM


de estudio se considera a quienes perciben ingresos salariales, por tanto esta pobla-
Manejo de las bases de datos y la construccin

cin cae dentro de la categora de remunerados (obtienen salarios) y subordinados


(tiene un jefe o patrn), su edad se encuentra entre 16 y 65 aos de edad y su jornada
laboral se ubica en el rango de 15 a 70 horas a la semana. Las variables de inters
son el salario mensual, la experiencia, la experiencia al cuadrado y el trabajo de
de indicadores socioeconmicos

tiempo completo.

Generacin de variables

Primero se selecciona de la muestra total el AMS al generar la variable ciudad deri-


vado de cd_a, para ello se utiliza el comando generate, despus se convierte ciudad
a numrica con el comando destring, ya que esta variable originalmente viene en
formato string (alfanumrica), para despus depurar la base con el comando keep
ordenando a STATA que solo deje en la base el AMS, ya que es nuestra poblacin
de estudio.

232 Para la seleccin de los trabajadores remunerados y subordinados se utiliza el co-


mando keep para mantener en la memoria y eliminar el resto de las categoras;
lo mismo sucede en la eleccin del rango de edad de trabajadores y el trabajo de
tiempo completo.

La variable experiencia se obtiene a travs de la edad del individuo y los aos de


educacin formal alcanzados menos seis, ya que es la edad en que el trabajador
inicia su educacin primaria. La experiencia al cuadrado es una aproximacin
al modelo bsico del ciclo vital, donde la concavidad del perfil de edad-ingreso
se capta mediante el trmino lineal y cuadrtico de la experiencia, es decir donde se
captan los rendimientos decrecientes del capital humano.

Generacin de variables dicotmicas

Por otra parte, al estar la muestra conformada por mujeres y hombres, se genera una
nueva variable llamada sexo con el comando generate, en este caso es de tipo dico-
tmica o binaria, lo que significa que son variables que pueden tener solamente dos
valores (0 y 1). Se asigna el valor de 1 para el sexo masculino y 0 para el femenino.

Generar logaritmo del salario

Los salarios de los trabajadores son captados en forma mensual en pesos corrientes
mexicanos, por lo que se deflactaron por el ndice de Precios al Consumidor (IPC)
de 2012 emitido por el Banco de Mxico. En este estudio se aborda el salario men-
sual, el cual se convierte en logaritmo9 con la finalidad de aprovechar algunas ven-
tajas de esta transformacin, como lo son que sus coeficientes pueden interpretarse
como elasticidades o semielasticidades; que reduce el rango de las variables y las

9 El logaritmo natural es la inversa de la funcin exponencial; es decir, el logaritmo natural es la fun-


cin para la cual x = In(ex) o, equivalentemente, x = In[exp(x)]. La base del logaritmo natural es e.

Aboites_PL15_16.indd 232 12/2/14 11:49 AM


estimaciones son menos sensibles a los valores extremos de las variables; adems,
los supuestos de los modelos lineales es ms factible que se cumplan bajo especi-
ficaciones logartmicas.

en Saltillo: Un ejercicio metodolgico


! Resultados

Brecha salarial por gnero


Estadstica descriptiva

Una vez depurada la base de datos y antes de analizar los resultados de la descom-
posicin de la desigualdad salarial, es necesario revisar las variables que se consi-
deran en el anlisis para cada uno de los dos grupos de estudio (Cuadro 1). Respecto
al salario mensual, es posible destacar tres elementos: a) en los dos aos de estudio,
la mujer obtuvo una menor remuneracin respecto a los hombres, la cual es del
orden de aproximadamente 20% en promedio; b) la remuneracin promedio por
sexo indica que durante los aos de anlisis se presenta una reduccin salarial en
trminos reales tanto para hombres como mujeres, lo que puede explicarse por la 233
recesin econmica iniciada en 2008 y que al ltimo ao de referencia los asala-
riados an no logran recuperar el poder adquisitivo previo a la crisis10, y; c) la con-
traccin econmica parece haber impactado de manera ms severa a las mujeres,
dado que la reduccin salarial fue mayor para este grupo, hecho que puede tener
dos interpretaciones o una combinacin de ellas: i) en periodos de contraccin
econmica, el mercado laboral femenino de Saltillo resulta desproporcionalmente
ms afectado que el de los hombres y ii) el incremento de la participacin laboral de

Cuadro 1. Principales estadsticas descriptivas del mercado laboral


del rea metropolitana de Saltillo, 2005 y 2012

2005 2012
Variable Mujeres Hombres Mujeres Hombres
Salario mensual* 5,679.4 7,048.5 4,800.31 6,040.7
Aos educativos 10.64 10.33 11.54 10.80
Jornada laboral 42.22 46.49 42.42 46.86
Aos de experiencia 17.73 18.18 18.55 18.60
Participacin laboral femenina 32.08 37.25
Proporcin de tiempo completo 77.12 90.80 76.31 92.06
Observaciones 55,126 115,824 81,879 142,310

* Pesos de 2012.
Fuente: Elaboracin propia con base en datos de la ENOE. Aos respectivos.

10 Es importante sealar que dada la elevada integracin de la economa de la Zona Metropolitana de


Saltillo con el entorno internacional a travs de la industria automotriz, la regin fue fuertemente
impactada durante la crisis que inici en 2008.

Aboites_PL15_16.indd 233 12/2/14 11:49 AM


las mujeres en la economa de Saltillo, al pasar de 32.08 a 37.25%, se dio a costa de
Manejo de las bases de datos y la construccin

una reduccin salarial.

En trminos de aos de escolaridad promedio, se observa, como habra de esperar,


que los niveles educativos aumentaron durante el periodo de estudio, pero ade-
de indicadores socioeconmicos

ms que las mujeres tienen una mayor dotacin respecto a los hombres y esta di-
ferencia se incrementa con el tiempo. Un segundo elemento que compone lo que
se considera capital humano es la experiencia, en este rengln las mujeres registran
menos aos de experiencia promedio que los hombres; sin embargo, para 2012, las
diferencias prcticamente desaparecen, ubicndose los grupos con poco ms de
18 aos y medio de experiencia. Estos dos ltimos elementos, el comportamiento
de la escolaridad y la experiencia, indican que la brecha de capital humano por sexo
se ha reducido.

En relacin con la jornada laboral, se observa que los hombres en promedio tra-
bajan ms horas a la semana que las mujeres y durante el lapso de estudio esta
234 diferencia no parece reducirse, la cual es aproximadamente 10% ms por semana.

Finalmente, las mujeres siguen teniendo menor presencia en el mercado de traba-


jo, aunque, como se seal lneas arriba, se aprecia una creciente participacin de
las mujeres en la economa de la capital de Coahuila; no obstante, los niveles son
inferiores al promedio nacional.

El comando decompose

Para hacer este tipo de anlisis de manera fcil, rpida y accesible se programa un
pequeo script (ado-file), el cual cuenta con las funcionalidades explicadas en la
metodologa. Para esto, primero se instala en STATA el comando decompose para
que dicho comando realice el anlisis descrito en la tcnica de Oaxaca (1973)-Blinder
(1973). Un archivo ado contiene una rutina para ejecutar un comando, en este ejer-
cicio dicho comando es el decompose y se obtuvo llamando su instalacin desde
un do-file de la pgina web de STATA.

Para el comando decompose la sintaxis es la siguiente:

regress logw aos_edu t_completo exp exp2 if sexo==1 & ciudad==17 [fw==fac]
decompose, save (high)

regress logw aos_edu t_completo exp exp2 if sexo==0 & ciudad==17 [fw==fac]
decompose, save (low)

decompose, detail

Tal como lo muestra la sintaxis, se realiza un anlisis de regresin lineal utilizando


el comando regress para estudiar la relacin entre el logaritmo del salario mensual
(lngw) con los aos educativos (aos_edu), jornada a tiempo completo (t_completo),

Aboites_PL15_16.indd 234 12/2/14 11:49 AM


la experiencia (exp) y experiencia al cuadrado (exp2) de cada sexo, utilizando el fac-
tor expansin (fac). En este caso la variable dependiente es lngw y el resto de ellas
son explicativas.

en Saltillo: Un ejercicio metodolgico


A continuacin se presentan los resultados de dichas estimaciones por sexo y am-
bos aos tal y como arroja el programa de salida; mismos que incluyen informa-
cin sobre el nmero de observaciones e indicadores estadsticos tradicionales, el

Brecha salarial por gnero


valor de los coeficientes de las variables explicativas, su significancia individual e
intervalo de confianza a 95% de significancia.

235

Aboites_PL15_16.indd 235 12/2/14 11:49 AM


Dado que la metodologa Oaxaca-Blinder implica una comparacin entre dos gru-
Manejo de las bases de datos y la construccin

pos excluyentes, para la estimacin de la descomposicin en STATA es necesario


especificar estos grupos, en este caso, el grupo de hombres es considerado como
alto (dado que tiene la media ms alta en la variable dependiente). Los coeficientes
y las medias de la estimacin de la ecuacin salarial de los hombres se guardan en
de indicadores socioeconmicos

la matriz highcm y la suma de los pesos relativos en la matriz highobs; mientras que
las estimaciones de las mujeres se guardan en la matriz lowcm y a su vez la suma
de los pesos relativos en la matriz lowobs, tal y como se especifica en la instruccin.
Esta informacin servir de insumo para la descomposicin.

Con la finalidad de mostrar de manera ms clara los resultados de las estimaciones


y su comparacin por sexo y en el tiempo, en el Cuadro 2 se presenta la informa-
cin de manera resumida.

Cuadro 2. Resultado de las estimaciones salariales por sexo


para Saltillo, 2005 y 2012
236
2005 2012
Variable Mujeres Hombres Mujeres Hombres
Aos educativos 0.083699 0.072003 0.084959 0.083583
Jornada completa 0.304856 0.339526 0.302655 0.381096
Aos de experiencia 0.034874 0.046995 0.024678 0.019937
Aos de experiencia2 0.000522 0.000776 0.000363 0.000244
Constante 6.98748 7.16861 6.9762 7.150083
Nmero de observaciones 55,126 115,824 81,879 142,310
R2 ajustado 0.3022 0.2997 0.2954 0.3001

Nota: En todos los casos los coeficientes son significativos con 99% de confianza.
Fuente: Elaboracin propia con base en los datos de la ENOE, aos respectivos.

Los resultados de las estimaciones salariales indican que los coeficientes presentan
el signo esperado, es decir, todos son positivos (excepto la experiencia al cuadrado)
y significativos.

Dentro de los aspectos a destacar podemos mencionar que el rendimiento de la


escolaridad por ao se ubica entre 7.2 y 8.5% en el periodo, donde las mujeres tie-
nen mayor rendimiento que los hombres para 2005 (8.3 vs 7.2%) y de acuerdo con
el intervalo de confianza (tabla de salida), la diferencia por sexo es significativa. Sin
embargo, para 2012 estas diferencias desaparecen producto de un aumento en la
rentabilidad de la educacin de los hombres.

Los trabajadores que laboran tiempo completo, 40 o ms horas por semana, reciben
una remuneracin mensual mayor, entre 30.3 y 38.1%, frente a los de medio tiempo.
Por sexo, se aprecian diferencias importantes a favor de los hombres, mismas que
aumentan durante el periodo de anlisis, pasando de 3 a 8 puntos porcentuales, tal
como se aprecia en el Cuadro 2.

Aboites_PL15_16.indd 236 12/2/14 11:49 AM


Grfica 1. rea metropolitana de Saltillo.
Rendimiento acumulado de la experiencia laboral por sexo, 2005 y 2012

en Saltillo: Un ejercicio metodolgico


Brecha salarial por gnero
237
Fuente: Elaboracin propia a partir del cuadro 2.

Para evaluar el rendimiento de la experiencia, es importante considerar que su


comportamiento no es lineal, por lo que su evaluacin debe hacerse considerando
ambos trminos (experiencia y experiencia al cuadrado) para capturar su rendi-
miento decreciente. Con la finalidad de apreciar con mayor precisin el com-
portamiento de la experiencia con el tiempo y si se presentan modificaciones de la
misma en los aos de anlisis por sexo, la Grfica 1 presenta el rendimiento acumu-
lado por sexo para ambos aos de estudio.

En la grfica se pueden destacar al menos tres elementos relevantes. El primero es


que el rendimiento de la experiencia se reduce significativamente en 2012 respecto
al ao previo y esto se presenta en ambos sexos, comportamiento que es diferente a
lo observado en la educacin, donde aumenta para hombres y se mantiene estable
en mujeres, aunque no es posible determinar si dicho desempeo es ocasionado
por la crisis de los aos previos y en los prximos se esperara una recuperacin,
o es consecuencia de un cambio estructural en el mercado laboral de regin donde
la experiencia pierde relevancia.

El segundo aspecto es que para 2005 se genera mayor retribucin salarial para los
hombres, aunque para el ltimo ao de estudio favorece a las mujeres, lo que im-
plica que durante el lapso de anlisis se presentaron modificaciones relativas im-
portantes por sexo. Finalmente, se puede destacar la existencia de cambios en la
estructura, especialmente de los hombres, la cual pasa de elevadas tasas y rendi-
mientos marginales decrecientes altos (se aprecia en la pendiente de la curva de
los hombres para 2005) a tasas de beneficio menores pero con rendimientos a ms
largo plazo, hecho que sin duda tiene implicaciones importantes para el mercado
laboral regional de los hombres.

Aboites_PL15_16.indd 237 12/2/14 11:49 AM


Por otra parte, el piso salarial, captado por la constante, que correspondera al ingre-
Manejo de las bases de datos y la construccin

so medio que recibe un(a) trabajador(a) sin aos de escolaridad, sin experiencia y
con una jornada laboral inferior a 40 horas semanales, indica que es favorable a los
hombres y que esta diferencia se mantiene a lo largo del periodo. Es decir, el piso
salarial muestra ser estable en el tiempo y permanece invariable no obstante los
de indicadores socioeconmicos

efectos econmicos adversos, como pudo ser la crisis iniciada en 2008.

En general, la capacidad explicativa del modelo expresado mediante el indicador R2


ajustado,11 est en niveles convencionales y se debe sealar que durante el periodo
de anlisis se mantiene estable y adems es similar por sexo, indicando que la ca-
pacidad explicativa del modelo no se altera en el tiempo y es igualmente eficiente
por gnero. Los resultados son similares a los que reporta Mincer (1974:53) en sus
estimaciones con R2 que oscilan entre 0.24 a 0.32.

Descomposicin del diferencial salarial por sexo


238 Con los resultados de las regresiones de ambos grupos de inters obtenidos a par-
tir de las estimaciones salariales, mismos que fueron comentados previamente,
en esta seccin se muestran los resultados de la metodologa expuesta aplicando
el comando decompose, ejecutado con STATA, con la finalidad de determinar la
magnitud de las diferencias salariales y la proporcin de estas desigualdades no
asociadas a las caractersticas de los grupos, misma que puede considerarse como
discriminacin salarial.

La descomposicin de la brecha salarial por sexo se presenta a continuacin tal


como STATA arroja los resultados de salida para los dos aos de estudio.

11!El R2 de la regresin es la proporcin de la varianza muestral de Y explicada por (o predicha por)


i
X . Es decir, miden la bondad del ajuste de la recta de regresin MCO a los datos. El R2 oscila entre
i
0 y 1, y mide la proporcin de la varianza de Yi explicada por Xi.

Aboites_PL15_16.indd 238 12/2/14 11:49 AM


en Saltillo: Un ejercicio metodolgico
Brecha salarial por gnero
239

Qu informacin presentan los resultados de salida de la descomposicin? La tabla


muestra un resumen del resultado de la descomposicin, mismo que se presenta
en dos partes.

La superior muestra los resultados absolutos donde se indica el valor medio de los
grupos (expresado en logaritmo, dado que as se especific en los datos) en este
caso hombres (high) (H) y mujeres (low) (L), la brecha en los valores medios de los
grupos anteriores (R) y la descomposicin de dicha diferencia de ingreso expresada
en tres componentes: i) la disparidad asociada con la dotacin de factores, es decir,
el primer trmino de la ecuacin (6); ii) la diferencia asociada con los rendimientos
(coeficientes) a las caractersticas de los grupos, en este caso hombres y mujeres; y
el tercer elemento, que es la interaccin de los dos anteriores.

En la parte inferior de los resultados de salida se presentan los valores de la parte


explicada y no explicada de la brecha salarial, as como su contribucin relativa de
cada uno de estos factores dentro de la descomposicin, considerando distintos
puntos de referencia desde donde se puede apreciar la discriminacin.

Una pregunta frecuente es qu distribucin del ingreso debe considerarse como


no discriminatoria? Esta inquietud admite al menos tres vertientes: i) la distribucin
del ingreso de la poblacin con menor ingreso promedio, en este caso las mujeres;
ii) la distribucin del ingreso de la poblacin con mayor ingreso promedio, hom-
bres, y; iii) una combinacin de las dos anteriores.

La tabla de resultados que arroja STATA ayuda a responder lo anterior al presentar


cuatro opciones de distribucin, correspondientes a la informacin relativa.

Aboites_PL15_16.indd 239 12/2/14 11:49 AM


Manejo de las bases de datos y la construccin
de indicadores socioeconmicos

240

Las distribuciones asumidas son las siguientes.

La columna 1 considera que la distribucin no discriminatoria es la que pre-


sentan las mujeres, por tanto, si el rendimiento a las caractersticas de los
hombres es mayor que el de las mujeres, se puede hablar de la existencia de
discriminacin a favor de los hombres.

Aboites_PL15_16.indd 240 12/2/14 11:49 AM


La columna 2 asume la distribucin masculina como la no discriminatoria y
desde esta perspectiva la discriminacin ser en contra de las mujeres. Esta
y la anterior alternativa fueron propuestas por Oaxaca (1973) y Blinder (1973),

en Saltillo: Un ejercicio metodolgico


entre otros.
La columna 3 supone una distribucin no discriminatoria en el punto me-
dio de la que presentan hombres y mujeres, opcin que es propuesta por
Reimers (1983).

Brecha salarial por gnero


La ltima columna corresponde a una sugerencia de Cotton (1988), la cual
consiste en ponderar los coeficientes por el tamao de los grupos, tal como lo
indica la nota al pie de la tabla.

Las columnas 3 y 4 corresponden a una combinacin de las dos primeras, por tanto
la discriminacin total se podra componer de dos partes, una favorable a los hom-
bres y otra en contra de las mujeres.12

Estas cuatro distribuciones de ingresos no discriminatorias son las utilizadas ms


frecuentemente y de entre ellas destaca la que toma como referencia la correspon- 241
diente a los hombres. Por tal motivo, en la discusin de resultados, nicamente se
comentar sobre los indicadores obtenidos en la columna 2, dejando al lector la
interpretacin de los resultados bajo la consideracin de las otras opciones de dis-
tribucin no discriminatoria.13

El primer rengln de la parte inferior de la tabla presenta el valor de la brecha salarial


no explicada por las diferencias en las dotaciones medias de los grupos y que habi-
tualmente es conocido como el valor de la discriminacin o la magnitud en que se
reducira la brecha salarial entre grupos en ausencia de discriminacin.

El rengln dos muestra el valor de la brecha salarial por sexo, que se explica por la di-
ferencia en las dotaciones de factores entre grupos, o sea la disparidad salarial o de re-
muneraciones que encuentra justificacin o sustento en una consideracin objetiva.

Finalmente, los renglones 3 y 4 presentan la contribucin relativa de los elementos


citados en los dos renglones anteriores.

El Cuadro 3 presenta los resultados que se obtuvieron con el comando decompose,


considerando como estructura no discriminadora la distribucin de los hombres.

La informacin presentada en el cuadro incluye la descomposicin de los dos aos


de estudio, lo cual permite, por una parte, comparar el comportamiento de la bre-
cha salarial en dos momentos en el tiempo, y en segundo lugar, discutir sobre los
cambios que se presentan al interior de la brecha salarial.

12 !Los resultados de salida de STATA que se presentan en las tablas no indican qu parte de la discri-
minacin es a favor de los hombres y cul en contra de las mujeres, solo muestran el agregado.
13!Para una discusin sobre la diferencia en resultados considerando distintas distribuciones no dis-
criminatorias o criterios de descomposicin, vase Silber y Weber (1999).

Aboites_PL15_16.indd 241 12/2/14 11:49 AM


Cuadro 3. Saltillo. Descomposicin del diferencial salarial
Manejo de las bases de datos y la construccin

por sexo, 2005 y 2012

Indicadores 2005 2012


Salario promedio masculino* 8.683 8.623
de indicadores socioeconmicos

Salario promedio femenino* 8.470 8.425

Diferencia salarial 0.212 0.198

Atributos 0.037 0.005

Discriminacin absoluta 0.175 0.193

% explicado (atributos) 17.6 2.7

% no explicado (discriminacin) 82.4 97.3

* Salario expresado en logaritmo.


Fuente: Elaboracin propia con base en los datos de la ENOE, aos respectivos.
242
En relacin con el primer punto, en este cuadro tambin se puede apreciar que
existe una diferencia salarial a favor de los hombres de alrededor de 20%, como
se seal anteriormente, y adems que durante el periodo de anlisis esta brecha
remunerativa se mantiene prcticamente inalterada, no obstante la cada de los sa-
larios reales promedios por sexo.

En cuanto a la descomposicin, se observa que la eliminacin de la discrimina-


cin permitira reducir significativamente la brecha salarial por sexo. Para el caso de
2005, la diferencia salarial se reducira en 17.5 puntos porcentuales, lo que equivale
a ms de 80% de la disparidad salarial total y esta proporcin aumenta an ms para
2012, indicando que el combate a la discriminacin permitira una igualacin de los
salarios mensuales por sexo, pues de acuerdo a las estimaciones realizadas, solo el
2.7% de la brecha salarial a favor de los hombres encuentra sustento en las carac-
tersticas y el resto est asociado con diferencias en la retribucin a las dotaciones,
hecho que se considera discriminacin salarial.

Si bien la brecha salarial en Saltillo se mantiene relativamente estable a lo largo del


tiempo, lo que implica que esta magnitud es persistente, dos aspectos son motivos
de preocupacin: i) una gran proporcin de la diferencia salarial est asociada a la
presencia de discriminacin salarial por sexo, y ii) que durante el tiempo de estudio,
esta causa se consolida como prcticamente la nica fuente explicativa de la brecha
salarial, no obstante el avance en los indicadores de capital humano de las mujeres.

En resumen, los resultados obtenidos siguiendo la metodologa descrita, nos per-


miten asegurar que existen diferencias salariales que no se explican por los atributos
asociados al capital humano, ya que aunque estos tienden a crecer en el periodo de
estudio, las mujeres reciben salarios inferiores a los que deberan recibir de acuerdo
con sus caractersticas y si estas cualidades fueran valoradas bajo el mismo par-
metro que las de los hombres.

Aboites_PL15_16.indd 242 12/2/14 11:49 AM


! Conclusiones

La descomposicin de la brecha en las retribuciones por sexo permite establecer

en Saltillo: Un ejercicio metodolgico


que la parte no explicada (discriminacin) de la diferencia salarial representa ms de
80% de la brecha salarial y que durante el periodo de estudio, no obstante que la di-
ferencia de ingreso se mantiene estable en aproximadamente 20%, la contribucin
de la discriminacin para explicar esa diferencia aumenta.

Brecha salarial por gnero


El ejercicio tambin permiti observar que el comando decompose es una herra-
mienta fcil de usar, rpida y fiable, sin embargo no es el nico mtodo de des-
composicin en economa utilizando STATA, ya que existen otros comandos
como nldecompose, fairlie, nopomatch, rqdeco, jmpierce2, smithwelch, gdecomp,
ldecomp, dfl, gfields, shapley. Asimismo, para analizar la inequidad se puede contar
con inequal, rspread glcurve, descogini, inequerr, kdensity, akdensity, changemean,
entre otros. Sin embargo, consideramos que este ejercicio constituye un punto de
inicio, de gran utilidad para quienes se incorporan al anlisis de la desigualdad y
mercados de trabajo. 243

Aboites_PL15_16.indd 243 12/2/14 11:49 AM


10 Nicholas P. Sisto
Ismael Aguilar Barajas
Laura Maribel Colima Valadez

Aboites_PL15_16.indd 244 12/2/14 11:49 AM


D
isparidad
regional en
el acceso al
servicio de agua
entubada
en Mxico,
1980-20101

245

! Introduccin

L
os servicios pblicos bsicos tales como agua potable, al-
cantarillado, electricidad, recoleccin de basura, pavimen-
tacin y alumbrado pblico, promueven el bienestar tanto
individual como colectivo. Por ende, la provisin de estos ser-
vicios representa una tarea esencial del Estado. El caso del agua
potable es de particular inters ya que desde 2012 ha adquirido
carcter de derecho fundamental, con la adicin de un prrafo a
la Constitucin Poltica de los Estados Unidos Mexicanos, el cual
estipula que toda persona tiene derecho al acceso, disposicin y
saneamiento de agua para consumo personal y domstico en for-
ma suficiente, salubre, aceptable y asequible (DOF, 2012).

El acceso al agua potable (en particular, al servicio de agua entubada) ha mejorado


de manera notable en Mxico durante las ltimas dcadas. La Figura 1 ilustra la
evolucin del dficit en el acceso a este servicio con dos indicadores distintos.2 El
primer indicador es el porcentaje de las viviendas que no cuentan con el servicio
de agua entubada con respecto al nmero total de viviendas.3 El segundo indicador
reporta simplemente el nmero de viviendas que no cuentan con el servicio.

1 Este trabajo deriva en parte de una tesis de maestra, vase Colima Valadez (2012).
2 Clculos propios con base en los datos de los censos y conteos de poblacin y viviendas del INEGI;
el primer conteo intercensal del pas se llev a cabo en 1995, por lo tanto no se dispone de datos
para 1985.
3 Se refiere a las viviendas particulares habitadas segn la terminologa de los censos y conteos de
poblacin y viviendas del INEGI.

Aboites_PL15_16.indd 245 12/2/14 11:49 AM


Figura 1. Dficit en el acceso al agua entubada en Mxico, 1980-2010
Manejo de las bases de datos y la construccin

(% del total de viviendas sin acceso y millones de viviendas sin acceso)

28.4%
de indicadores socioeconmicos

19.8%

14.3% 14.7%

11.4%

8.0%

3.4 3.2 2.8 3.2 2.7 2.2


0 0

1980 1985 1990 1995 2000 2005 2010

246 Viviendas sin agua (%) Viviendas sin agua (millones)

Fuente: Elaboracin propia con datos de los censos y conteos del INEGI.

Como se puede apreciar, durante el periodo 1980-2010 se logr una gran expansin
en la provisin del agua entubada: en 1980, 28% de las viviendas del pas no contaba
con el servicio, mientras que para 2010 esta tasa se haba reducido a 8%. Este incon-
trovertible logro de poltica pblica resulta an ms significativo al considerar que
la tasa de viviendas sin el servicio ha sido un verdadero blanco mvil por el fuerte
crecimiento del parque habitacional nacional: entre 1980 y 2010, el nmero total de
viviendas pas de 12.1 a 28.1 millones de unidades.

No obstante, la misma Figura 1 tambin revela la dimensin del reto vigente para
alcanzar la universalidad en el acceso al servicio de agua entubada: en 2010, ms
de 2.2 millones de viviendas todava no contaban con el servicio. Adems, llama la
atencin la gran disparidad en el acceso al servicio de agua entubada entre las enti-
dades federativas. Por ejemplo, en 2010 el estado de Veracruz presentaba un dficit
de 18.6% versus 1.5% en el estado de Coahuila.

Este trabajo se enfoca en la disparidad en el acceso al agua entubada entre las en-
tidades federativas y regiones de Mxico. Concretamente, buscamos caracterizar
cmo ha evolucionado el dficit en el acceso a este servicio en las entidades fe-
derativas y regiones del pas entre 1980 y 2010, utilizando un amplio conjunto de
mtodos empricos.

El resto del trabajo se organiza de la siguiente manera. La segunda apartado em-


pieza con una definicin y discusin de la medida del dficit en el acceso al agua
entubada empleada aqu, as como la presentacin de algunas estadsticas bsicas
(mnimo, promedio y mximo) que describen cmo ha evolucionado este dficit
en las entidades federativas a travs del tiempo. Luego se abordan en secuencia
una serie de preguntas especficas en torno a esta evolucin: se ha propiciado la

Aboites_PL15_16.indd 246 12/2/14 11:49 AM


convergencia, es decir una reduccin de la disparidad entre las entidades federati-
vas?; cul ha sido el impacto sobre la desigualdad entre las entidades federativas,

Disparidad regional en el acceso al servicio


segn las mtricas de la curva de Lorenz y el coeficiente de Gini?; se ha presentado

de agua entubada en Mxico, 1980-2010


una estructura regional, en trminos de agrupaciones de entidades federativas?;
las entidades federativas con peor (o mejor) desempeo histrico en relacin con
las dems, han persistido en esta posicin?; y finalmente, cules fueron los facto-
res asociados con la evolucin del dficit en el acceso al agua entubada? El tercer
apartado explica y discute la estructura metodolgica del apartado anterior. Expone,
entre otros asuntos, cmo a partir de algunas preguntas formuladas con antela-
cin al anlisis sistemtico de los datos permite el desarrollo progresivo de nuevas
preguntas. Finalmente, la cuarta y ltima seccin concluye con un resumen y una
interpretacin de los resultados obtenidos, as como la formulacin de propuestas
para futuras investigaciones.

! Mtodos y resultados