Está en la página 1de 11

TEMA 7

LAS FUENTES ESTADSTICAS

1. UNA INVESTIGACIN BASADA EN LAS ESTADSTICAS OFICIALES

Un ejemplo del empleo de estadsticas oficiales como fuentes de material emprico es


El suicidio (1897) de mile Durkheim (1858-1917), considerada como la primera
investigacin de la Sociologa. Gracias a ellas, Durkheim pudo analizar la relacin
suicidio-religin, al observar que el suicidio est mucho ms difundido en los pases
protestantes que en los catlicos, lo que atribuy al mayor individualismo de la religin
protestante, concluyendo que el suicidio vara en sentido inverso al grado de
integracin de la sociedad religiosa. Igualmente, analiz la relacin suicidio-factor
familiar, al observar que el estado de casado disminua a alrededor de la mitad el
peligro de suicidio, lo que atribuy a la accin no de la sociedad conyugal, sino de la
sociedad familiar, concluyendo que el suicidio vara en sentido inverso al grado de
integracin de la sociedad familiar. Por ltimo, analiz la relacin suicidio-factor
poltico, al observar que todas las manifestaciones de agitacin poltica comportaban
una disminucin de la tasa de suicidios, lo que atribuy a que las grandes
conmociones sociales avivan los sentimientos colectivos y conectando las
actividades a un mismo fin determinan una integracin ms fuerte de la sociedad,
concluyendo que el suicidio vara en sentido inverso al grado de integracin de la
sociedad poltica. Su corolario a todo ello fue que el suicidio vara en sentido inverso
al grado de integracin de los grupos sociales a los que pertenece el individuo.

Como se observa, las fuentes estadsticas oficiales pueden constituir una base emprica
muy importante y producir resultados muy convincentes. De hecho, se puede afirmar
que la Sociologa emprica naci en Europa a partir de los datos aportados por las
estadsticas oficiales. Slo a partir de los aos 30, con el desarrollo de la investigacin
social en EEUU, que por entonces careca de bases estadsticas oficiales, comenz a
utilizarse la encuesta por muestreo, que en la posguerra fue el modelo dominante.

2. LAS ESTADSTICAS OFICIALES


El trmino estadstica deriva de Estado y fue introducido por el italiano Gerolamo
Ghilini (1589) para definir la ciencia que describe los Estados, evolucionando hacia
la disciplina que tiene por objeto la descripcin cuantitativa de las caractersticas
importantes de una nacin. Sin embargo, a mediados del s. XVII el desarrollo del
clculo de probabilidades propici que la estadstica se consolidase como una
rama autnoma de las matemticas, pasando a describir a la ciencia de lo
colectivo, es decir, constituyendo un mtodo cientfico para el anlisis cuantitativo de
los fenmenos colectivos.

En la actualidad la estadstica admite dos acepciones:

a) La estadstica como ciencia, en tanto ciencia que estudia los fenmenos


colectivos con mtodos matemticos basados en el clculo de probabilidades.

b) La estadstica como dato, en tanto recogida de datos que tiene como


propsito dar una visin de conjunto de determinados hechos o fenmenos.

Nosotros emplearemos el trmino estadstica en su segunda acepcin, es decir, en


tanto dato estadstico. En general, los datos estadsticos se diferencian de los datos
obtenidos por otros medios (encuestas por muestreo, investigacin) en cuatro
aspectos: la produccin, la unidad de anlisis, el contenido y el tamao del registro.

a) La produccin de los datos

Las fuentes estadsticas oficiales son recolecciones de datos efectuadas casi en


su totalidad por la administracin pblica, lo cual se remonta a Sumeria (4000 a.
C.) y ms tarde a Asiria, Babilonia, Egipto, China, Grecia y Roma. Se debe
distinguir:

a. Estadsticas burocrticas (o recogida indirecta), cuyos datos son generados


por la actividad administrativa: demogrficas, judiciales, sanitarias

b. Estadsticas cognoscitivas (o recogida directa), cuyos datos son recogidos


expresamente con la finalidad de conocer un determinado fenmeno
social. Se trata de una tradicin tpica europea, desconocida incluso en
EEUU. Su ejemplo ms notable son los censos, elaborados para conocer las
caractersticas de la poblacin; los primeros datan de 1801 (Inglaterra,
Francia) y en Espaa de 1857, aunque el Padrn de Calle-Hita se remota a
1708.

El empleo de datos estadsticos oficiales supone un gran ahorro econmico en la


recogida de datos, pero presenta el inconveniente de que existen datos sociales
que escapan a cualquier acto administrativo (estructura familiar, inmigracin
ilegal, delitos no denunciados). Por ello, en la actualidad los institutos
nacionales de estadstica realizan una serie de investigaciones por muestreo ad
hoc sobre sectores especficos, dirigidas a estudiar determinados aspectos de la
sociedad.

Por otra parte, las nuevas posibilidades informticas permiten una conexin cada
vez mayor entre los distintos archivos administrativos existentes, lo que augura un
aumento del material de origen administrativo con fines estadsticos.

b) La unidad de anlisis

En primer lugar, conviene distinguir entre datos individuales y datos agregados,


los cuales derivan de una operacin de recuento de datos individuales. As,
mientras que las encuestas por muestreo tienen como unidad de anlisis el
individuo a travs de datos individuales, las estadsticas oficiales tienen por
unidad de anlisis el territorio a travs de datos agregados.

En general, los datos agregados pueden referenciar a cualquier colectivo


(empresa, sindicato, escuela) y en origen la informacin se recoge siempre sobre
individuos (unidad de registro); sin embargo, en las estadsticas oficiales los datos
slo estn disponibles de modo agregado (unidad de anlisis) y siempre
referenciando a un territorio (distrito, municipio, provincia): tasa de divorcios,
porcentaje de votos al partido X, total de entradas de cine vendidas Existen
cuatro explicaciones: (1) la informacin puede haber sido recogida de forma
individual, pero haber sido registrada slo de modo agregado por
confidencialidad (elecciones); (2) la informacin puede haber sido recogida de
forma individual, pero los datos se registran slo de forma agregada (estadsticas
demogrficas); (3) la informacin puede haber sido recogida y registrada de
forma individual, pero el dato se hace pblico slo de forma agregada por
exigencias organizativas (censos); (4) la informacin es registrada slo de modo
agregado (ventas de coches).

En cualquier caso, la reciente revolucin informtica est propiciando que las


estadsticas oficiales sean ms manejables y empiecen a estar disponibles
tambin en forma de registros individuales. La ventaja de los datos agregados es
que se pueden consultar de forma inmediata, mientras que los individuales
necesitan una elaboracin que requiere conocimientos tcnicos.
c) El contenido de los datos

Los registros administrativos refieren nicamente a acciones y comportamientos,


es decir, a estados de hecho o datos factuales (nacimiento, matrimonio,
compra, ingreso hospitalario, matrcula escolar), excluyendo toda opinin,
actitud o motivacin. Ello se explica tanto porque un gestor estatal no puede
permitirse invadir la esfera privada con la misma desenvoltura que puede
permitrselo una entidad privada, como del hecho de que las estadsticas
oficiales se realizan sobre muestras de grandes dimensiones, invirtiendo ms en la
representatividad que en la profundizacin de las motivaciones; incluso las
encuestas ad hoc con fines cognoscitivos (censos) y los estudios sobre
problemticas sociales especficas se limitan a preguntar datos de hecho, sin
abordar las motivaciones.

d) El tamao del registro

Se debe distinguir entre el registro exhaustivo (total) y el registro muestral


(parcial). El tradicional dato estadstico consiste en un registro exhaustivo sobre
toda la poblacin de un territorio determinado (censo, muertes, nacimientos,
enfermos en lista de espera, procedimientos judiciales abiertos). Las ventajas
de un registro exhaustivo es que permite analizar en grados menores de
disgregacin territorial y que es absolutamente necesario para conocer las
caractersticas reales de la poblacin; por ello, la finalidad de los censos
decenales es adquirir las informaciones de stock de la nacin, recogiendo las
informaciones de flujo para las estadsticas corrientes.

Por el contrario, las ventajas de un registro muestral son: (1) reduccin de costes,
(2) reduccin del tiempo de recogida y de elaboracin de los datos, (3)
reduccin de la carga organizativa, y (4) mayor posibilidad de profundizacin y
de calidad del registro. En la actualidad, las investigaciones ad hoc de los
institutos nacionales de estadstica se realizan generalmente sobre muestras,
aunque casi siempre sobre muestras de grandes dimensiones ( 10.000 casos,
frente a 1000-2000 de los estudios privados). Ello se debe a que la motivacin
principal de las estadsticas oficiales es de carcter descriptivo respecto a la
distribucin territorial nacional, siempre con el objetivo de obtener estimaciones
fiables de los fenmenos estudiados a escala nacional y subnacional. As, dado
que Espaa cuenta con 17 comunidades autnomas, un estudio fiable de unos
1000 casos por comunidad alcanza con facilidad un total de 20.000 casos para
la muestra nacional.
3. LAS ESTADSTICAS OFICIALES EN ESPAA Y EN EL EXTRANJERO

La produccin, revisin, mantenimiento y distribucin de los datos recogidos a travs


de entes oficiales es muy variable y dispersa, variando en la naturaleza de los datos
recogidos, en el grado de centralizacin o dispersin de la recogida, en las agencias
implicadas (locales, regionales, nacionales), en la cobertura geogrfica...

a) Agencias oficiales

En Espaa el Instituto Nacional de Estadstica (INE), creado en 1945 y adscrito al


Ministerio de Economa, es el organismo encargado por la Ley de Funcin
Estadstica Pblica (1989) de coordinar los servicios estadsticos de la
administracin. Entre sus funciones estn la ejecucin del Plan Estadstico
Nacional (PEN), la propuesta de normas sobre temas estadsticos, las relaciones
en materia estadstica con organismos internacionales especializados y la
coordinacin con las oficinas estadsticas de las Comunidades autnomas.

La mayora de datos del INE estn disponibles en soporte magntico y una parte
importante en Internet. Su banco de datos tradicional para la difusin de series
temporales es el Tempus, aunque algunas de ellas son de acceso restringido
debido al modo reservado de desagregacin de los datos; actualmente se
encuentra integrado en la base de datos Inebase, disponible en Internet, la
cual recoge datos tanto del INE como de todo el sistema estadstico nacional:
contabilidad nacional, ndices de precios al consumo, estadsticas varias
(muertes, produccin editorial, migraciones), encuesta de poblacin activa
(EPA)...

Otros ministerios u organismos que tambin producen datos estadsticos son:

Banco de Espaa. Estadsticas con informacin financiera y monetaria:


indicadores econmicos, cuentas financieras, contabilidad nacional,
convergencia Espaa-UE...

Ministerio de Educacin y Ciencia. Proporciona datos relativos a cultura:


estadsticas educativas, gasto pblico en educacin.... as como la
publicacin del anuario Estadstica de la enseanza en Espaa. El grado
de desagregacin de sus datos suele ser la Comunidad autnoma.

Ministerio de Trabajo y Asuntos Sociales. Proporciona datos en materia


laboral: estadsticas de accidentes laborales, convenios colectivos, huelgas,
regulaciones de empleo, permisos de trabajo a extranjeros... Algunos
organismos dependientes tambin publican sus propias estadsticas:
Instituto de la Mujer, Instituto de la Juventud, INEM, INSERSO...

Comunidades autnomas. La Ley de Funcin Estadstica Pblica les


transfiere competencias en materias de estadstica, poseyendo institutos u
oficinas que proporcionan todo tipo de datos relativos a la Comunidad.
Destacan los ndices anuarios estadsticos, con informacin a nivel
infraprovincial.

Corporaciones locales y ayuntamientos. Las principales ciudades espaolas


tambin disponen de oficinas de estadstica, as como de pgina Web.

Unin Europea. La Oficina Estadstica de la UE (EUROSTAT) recoge datos


producidos por las agencias nacionales y los armoniza para que puedan
ser utilizados de forma global. Tambin ofrece cooperacin tcnica con
pases de fuera de la UE. Entre sus datos estn la economa, industria,
energa, poblacin y condiciones sociales, medioambiente, transporte,
investigacin...

Organismos internacionales. Por ejemplo, el Banco Interamericano de


Desarrollo (BID) o la Comisin Econmica de las Naciones Unidas para
Amrica Latina y el Caribe (CEPAL), que en la Base regional de datos de
coyuntura recoge datos socioeconmicos de 8 pases de Amrica Latina.

b) Distribucin de datos a travs de entes oficiales

La actual proliferacin de programas de cobertura sistemtica realizados por un


amplio grupo de unidades gubernamentales producen una abundancia de
estadsticas que, en ocasiones, pueden llegar a ser incoherentes. La integracin y
seleccin de estadsticas por reas temticas se puede encontrar en una serie
de publicaciones de referencia:

Fuentes Estadsticas (INE, desde 1994). Revista mensual (convenio INE-


Eurostat-Universidad de Madrid) sobre las estadsticas oficiales que se
realizan en Espaa y en Europa. Cada nmero consiste en un tema
monogrfico.

Anuario Estadstico de Espaa (INE, desde 1858). Proporciona informacin


estadstica general, buscando ofrecer una visin cuantitativa de la realidad
econmica, demogrfica y social.

Espaa en cifras (INE). Publicacin anual que resume los datos ms


relevantes y actuales de Espaa y las CCAA, dando una visin general
sobre su realidad social y econmica.

Boletn mensual de estadstica (INE). Presenta un conjunto de informacin


sobre aspectos demogrficos, sociales y econmicos de Espaa,
aportando desgloses regionales y comparaciones con otros pases,
incluyendo descripciones metodolgicas de apoyo a los datos numricos.

Cifras INE (INE). Boletn monogrfico de noticias estadsticas sobre los


indicadores coyunturales econmicos o sociales ms recientes.

Revista estadstica espaola (INE, desde 1958). Difusin de las


investigaciones espaolas en materia de estadstica.

Anuarios de El Pas y El Mundo (desde 1982 y 1993). Ambos diarios


publican anuarios con estadsticas muy diversas, nacionales e
internacionales.

Publicaciones de la CEPAL. La CEPAL publica varias publicaciones sobre


estadsticas de Amrica Latina, como el Anuario estadstico de Amrica
Latina y el Caribe y el Estudio econmico de Amrica Latina y el Caribe.

Las nuevas potencialidades del formato electrnico en los datos han propiciado
la aparicin de aplicaciones interactivas para asistir a los usuarios en la seleccin
de las series estadsticas disponibles, as como en la posibilidad de realizar los
anlisis univariados o bivariados.

c) Metadatos

Se conoce por metadatos a la informacin sobre las caractersticas de los datos


estadsticos: fuentes, cobertura, modalidad y fechas de recogida, cualificacin y
nmero de entrevistadores Tradicionalmente, cada estadstica estaba
acompaada de un texto explicativo que permita al investigador entenderla de
inmediato; sin embargo, la fuerte demanda de datos actual ha propiciado una
avalancha de estadsticas de todo tipo en Internet carentes de unos estndares
bien definidos que las ordenen y hagan comprensibles, al punto que estadsticas
aparentemente sencillas pueden ser malinterpretadas. En ese sentido, el Dubln
Core Metadata Initiative (DCMI) y la Data Documentation Initiative (DDI)
constituyen esfuerzos por establecen estndares mnimos para caracterizar los
metadatos, los cuales deben incluir necesariamente la siguiente informacin:
descripcin, fuentes, ttulos, cobertura, ente productor, fecha, sujeto y tipo de
datos.

d) Unidades geogrficas

Los datos estadsticos se proporcionan para un determinado mbito territorial;


para evitar inconsistencias territoriales entre estadsticas, el INE cre el Inventario
de operaciones estadsticas de la Administracin General del Estado (IOE) como
instrumento para coordinar los distintos organismos oficiales productores de
estadstica. El IOE establece los distintos rangos de desagregacin de los datos
estadsticos que se producen en Espaa, ordenndolos en: nacional,
autonmico, provincial, municipal o inferior y otros. Los municipios espaoles se
dividen en distritos municipales, y stos a su vez en secciones censales (
electorales), que se emplean para todos los trabajos encomendados por el INE
con una divisin inframunicipal. Segn la Ley Electoral, una seccin electoral es
un rea geogrfica con lmites bien definidos que debe tener entre 500-2000
electores, existiendo en toda Espaa unas 32.000.

e) Estndares y clasificaciones

Las estadsticas oficiales deben proporcionar la mayor consistencia posible para


cada dato que registran. La evaluacin de dicha consistencia se realiza
mediante los metadatos y las referencias geogrficas que las acompaan, as
como por las categoras empleadas en la tabulacin de los datos.

En general, las categoras vienen definidas socialmente (p. e., atribuir a un


muerto la categora de suicidio o de asesinato); sin embargo, existen
categoras ms abstractas cuya catalogacin no est exenta de ambigedad:
ocupado, desempleado, clase social Para ello, las agencias oficiales
establecen estndares para clasificar los hechos sociales buscando imponer una
definicin consistente de cada categora. En Espaa el INE ha elaborado
clasificaciones estadsticas en consonancia con las clasificaciones
internacionales reunidas en el CD denominado Gestin de Clasificaciones
Estadsticas (GESCLA-97), entre las que se encuentran: Clasificacin nacional
de actividades econmicas (CNAE-93), Clasificacin nacional de
ocupaciones (CON-94), Clasificacin nacional de ecuacin (CNED-2000)

Aunque las clasificaciones estadsticas limitan el grado de discrecionalidad en la


interpretacin de los hechos sociales, resulta obvio que las definiciones
evolucionan y cambian con el tiempo, siendo inevitable cierto grado de
inconsistencia. Incluso en algunos casos las agencias nacionales son incapaces
de imponer un estndar, debido tanto a la ausencia de consenso interno en
ellas, como a la falta de acuerdo entre quienes recogen los datos y quienes los
producen; as, cuanto mayor es el grado de descentralizacin en la
investigacin, mayor posibilidad de existencia de idiosincrasias locales en la
recogida de los datos.

f) Distribucin no gubernamental
Al margen de los datos distribuidos por las agencias gubernamentales, tambin
proliferan los datos aportados directamente por los productores, destacando por
su calidad los archivos acadmicos de datos. Entre ellos se encuentran:

Inter-university Consortium for Political and Social Research (ICPSR,


Universidad de Michigan, EEUU, 1962). Mantenido por sus miembros sin
nimo de lucro, unos 400 de universidades y centros de investigacin de
todo el mundo, es probablemente el mayor archivo de datos del mundo.
Proporciona cursos de formacin en tcnicas de anlisis cuantitativo,
materiales para la enseanza, archivos de base combinados, reproduccin
de artculos, libros o tesis y anlisis on-line de bases de datos especficos.

Economic and Social Research Council (ESRC, Universidad de Essex, Reino


Unido, 1967). Almacena la mayor coleccin de datos en ciencias sociales y
humanidades del Reino Unido.

NESSTAR. Basado en datos y metadatos de la Data Documentation


Inititative (DDI), constituye un consorcio que incluye archivos del Reino
Unido, Dinamarca, Noruega y otros 5 socios.

Resource Centre for Access to Data on Europe (RCADE). Proporciona


datos estadsticos procedentes de EUROSTAT, UNESCO o la OIT.

g) Datos agregados y microdatos

Una de las caractersticas de las estadsticas oficiales son sus datos agregados,
resumen de un rea geogrfica en particular. Sin embargo, la reciente aparicin
de las encuestas en la recogida de estadsticas oficiales, as como de la
publicacin de muestras de microdatos provenientes de censos nacionales, ha
abierto la posibilidad de utilizar los datos de forma individual.

Por otra parte, las estadsticas agregadas, particularmente aquellas que


provienen de censos, estn a menudo disponibles para rangos de agregacin
muy pequeos. Ello permite realizar investigaciones comparativas entre las
caractersticas contextuales de un rea (con alto grado de pobreza, con
elevada criminalidad, con elevada segregacin tnica) y datos individuales, lo
que permite investigar la influencia de las caractersticas del entorno en los
comportamientos individuales.

Los investigadores pueden aprovechar la flexibilidad de los microdatos mediante


las fuentes de microdatos del INE, en EEUU mediante los IPUMS (Microdatos
integrados de uso pblico), que son microdatos seleccionados a partir de
registros individuales de personas y hogares inscritos en los censos, o en los IPUMS
Internacional, microdatos censales de 21 pases codificados y armonizados para
que sean equivalentes en el mayor nmero de categoras.

4. EL ESTUDIO DE LAS ESTRUCTURAS SOCIALES

Las fuentes estadsticas oficiales constituyen una extraordinaria oportunidad para la


investigacin social, pues proporcionan una ingente masa de datos que abarcan
todos los sectores de la vida social, acompaando al individuo a lo largo de toda su
existencia. Son especialmente esenciales en el estudio de cuatro sectores:

a) Estudios de la estructura de la sociedad: demografa, fenmenos migratorios,


distribucin del voto, el empleo, estructura de clase, movilidad social, mercado
del trabajo, organizacin empresarial, estructura familiar, asistencia social

b) Estudios de las demarcaciones territoriales: anlisis comparativos entre reas


territoriales (entre regiones, comunidades, reas metropolitanas) sobre tasas de
criminalidad, de empleo, electorales, economa, religin

c) Estudios comparados entre naciones. La creciente coordinacin entre los


institutos centrales de estadstica de los pases favorece la creciente integracin
y capacidad de contraste entre las fuentes estadsticas de las diversas naciones.

d) Estudios longitudinales. Las fuentes estadsticas oficiales permiten tanto el estudio


de las dinmicas temporales de las sociedades actuales, como la reconstruccin
de la estructura y las relaciones sociales de las sociedades pasadas.

Sin embargo, las fuentes estadsticas oficiales tambin cuentan con limitaciones, entre
las que destacan tres:

1. El problema de los indicadores (errores de validez y de indicacin). La naturaleza


de los datos puede no satisfacer las exigencias del investigador, pues quizs los
indicadores disponibles posean una parte de indicacin muy reducida
respecto al concepto que se desea operacionalizar (p. e., usar las ventas de
revistas religiosas o la tasa de abortos como indicadores del sentido religioso de
una poblacin).

2. El problema de la limitacin a variables fcticas. Las estadsticas oficiales se


limitan a datos objetivos y conductuales, lo que permite un buen nmero de
investigaciones, pero excluye las motivaciones y actitudes (p. e., saber por qu la
gente no va a votar requerir un estudio ad hoc).

El problema de la falacia ecolgica. Las estadsticas oficiales, basadas en datos


agregados respecto a un rea geogrfica, son inadecuados para el anlisis de los
comportamientos individuales. As, si bien se puede afirmar que existe una correlacin
entre el porcentaje de obreros y el porcentaje de votos a la izquierda (correlacin
ecolgica), ello no debe conducir a la conclusin de que los obreros votan a la
izquierda (falacia ecolgica).

También podría gustarte