Está en la página 1de 104

Estadstica

aplicada a la
investigacin en
cultura
Salvador Carrasco Arroyo
Vicente Coll Serrano
Francis Marco-Serrano
Pau Rausell Kster
Luis Vila Losada
PID_00173351
FUOC PID_00173351 Estadstica aplicada a la investigacin en cultura

Ninguna parte de esta publicacin, incluido el diseo general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningn medio, sea ste elctrico,
qumico, mecnico, ptico, grabacin, fotocopia, o cualquier otro, sin la previa autorizacin escrita
de los titulares del copyright.
FUOC PID_00173351 Estadstica aplicada a la investigacin en cultura

ndice

1. La cultura desde la aproximacin estadstica............................ 5


1.1. La armonizacin estadstica de algunas variables
macroeconmicas de la cultura .................................................. 6
1.2. La definicin de cultura desde el marco estadstico ................... 9
1.3. Estadsticas culturales en Espaa ................................................ 10
1.3.1. El sistema de presentacin de informacin del
Ministerio de Cultura .................................................... 12
1.4. El valor econmico de la cultura en Espaa ............................... 13
1.5. Los observatorios de cultura ....................................................... 14
1.6. Estadsticas culturales en Europa ................................................ 15

2. Nmeros ndices aplicados a la cultura....................................... 17


2.1. Caracterizacin de los nmeros ndices ..................................... 18
2.2. Cambio de base y enlace ............................................................ 21
2.3. Actualizacin de magnitudes de valor ........................................ 22

3. Anlisis de series temporales en cultura..................................... 24


3.1. Descomposicin de series temporales ......................................... 25
3.2. Evaluacin de componentes tendenciales .................................. 27
3.3. Evaluacin de la estacionalidad. Desestacionalizacin de
series ............................................................................................ 32

4. Los indicadores culturales y la evaluacin de las polticas..... 34


4.1. Qu es un indicador ................................................................... 35
4.2. Las tcnicas de elaboracin de indicadores ................................ 36
4.3. Ejemplo: El sistema de indicadores culturales de la FEMP .......... 41
4.4. Ejemplo: La evaluacin de la cooperacin cultural espaola
al desarrollo ................................................................................. 46
4.5. Consideraciones finales ............................................................... 48

5. Clculos de probabilidad y modelos de inferencia


estadstica............................................................................................. 50
5.1. Modelos de probabilidad. Prediccin de necesidades de
formacin en los gestores culturales ........................................... 50
5.2. Encuestas y muestreo sobre realidades culturales ....................... 54
5.3. Contrastacin de hiptesis. Usos del tiempo y consumos
culturales ..................................................................................... 58
5.4. Anlisis de la varianza (ANOVA). Turistas culturales .................. 61

6. Anlisis mltiple de datos............................................................... 63


6.1. Anlisis de regresin ................................................................... 63
6.2. Regresin lineal simple ............................................................... 64
FUOC PID_00173351 Estadstica aplicada a la investigacin en cultura

6.2.1. Especificacin del modelo ............................................. 65


6.2.2. Mtodo de ajuste: mnimos cuadrados ordinarios ........ 66
6.2.3. Calidad del ajuste: medidas de variacin y
coeficiente de determinacin ........................................ 68
6.2.4. Inferencia sobre los parmetros del modelo .................. 71
6.3. Regresin lineal mltiple ............................................................ 76
6.3.1. Especificacin del modelo ............................................. 77
6.3.2. Estimacin del modelo .................................................. 78
6.3.3. Calidad del ajuste: medidas de variacin y
coeficiente de determinacin ........................................ 80
6.3.4. Estimacin de la varianza de los estimadores. Error
tpico de estimacin ...................................................... 83
6.3.5. Estimacin de la varianza de los coeficientes de
regresin ......................................................................... 83
6.3.6. Inferencia de los parmetros del modelo de
regresin mltiple. Prueba t de los coeficientes ............ 84
6.3.7. Intervalos de confianza para los coeficientes de
regresin ......................................................................... 86

7. Anlisis factorial. Culto-tipos y otras clasificaciones


culturales.............................................................................................. 88
7.1. Anlisis factorial .......................................................................... 88
7.2. Anlisis clster ............................................................................ 91
7.2.1. Medida de disimilaridad ................................................ 93
7.2.2. Formacin de grupos ..................................................... 95
7.2.3. Eleccin del nmero de grupos o conglomerados ......... 99

Bibliografa................................................................................................. 103
FUOC PID_00173351 5 Estadstica aplicada a la investigacin en cultura

1. La cultura desde la aproximacin estadstica

Por qu aplicar tcnicas estadsticas en el anlisis de los fenmenos cultura-


les? No existe el riesgo de tratar de cuantificar realidades que son difcilmen-
te cuantificables? Para qu comparar la dimensin cultural de territorios y
realidades distintas si la misma definicin de cultura es un valor cultural?

Es cierto que un sistema de indicadores y estadsticas culturales debe servira


larealidadsocialycultural del territorio sobre el que se asienta, y, en este
sentido, resulta difcil estandarizar la medicin de la cultura de forma global.
Es evidente que no es lo mismo medir la cultura en el norte que en el sur,
ni en zonas urbanas que en metropolitanas. Los valores, las necesidades, las
expectativas, los recursos y un largo etctera son diferentes. Sin embargo, esta
evidencia no nos puede hacer ceder en el convencimiento de que requerimos
de sistemas ms o menos homogneos que permitan la comparabilidad y nos
sean tiles para comprobar y, en consecuencia, mejorar la eficiencia de los
procesos y la eficacia de los impactos.

"Contar" tambin permite a los ciudadanos expresarvaloraciones, otorgar-


les consistencia lgica, ordenar y centrar los debates sociales, aportar informa-
cin para posicionarse como ciudadano. Medir puede explicitar las preferen-
cias frente a los valores sin la necesidad de "intrpretes" y expertos, por lo que
otorga autonoma a los ciudadanos y aporta transparencia a los modelos de
polticas culturales. Y a todo ello puede contribuir con bastante eficiencia una
aproximacin estadstica a la realidad cultural.

No defendemos un cuantitativismo extremo relacionado con la produccin


de bienes, servicios y actividades culturales y consideramos que "contar" no es
solo un ejercicio tcnico. Hay que utilizar tiempo y recursos para determinar
qu es lo que hay que contar. Y determinar qu contar ya implica posiciona-
mientos valorativos.

Los indicadores y su conformacin nunca son neutrales, y hay que te-


ner en cuenta que lo ms fcil de contar no siempre es los ms relevante
desde el punto de vista del inters social. Se requiere de los "expertos"
que se esfuercen no solo en la estandarizacin de las tcnicas sino tam-
bin en su adaptacin imaginativa y creativa a las necesidades de los
territorios. Las tcnicas han de ser claras, transparentes y comprensibles
y deben estar al servicio de la comunidad sobre la que se formulan.
FUOC PID_00173351 6 Estadstica aplicada a la investigacin en cultura

La funcin de las estadsticas en cultura es nutrir los argumentos para tomar


decisiones pblicas y privadas de una ms elevada calidad tcnica y una mayor
dimensin democrtica.

En el caso de la dimensin pblica, ninguna estadstica, por muy rigu-


rosa y acertada que sea, puede sustituir el debate social. Las cifras nun-
ca son concluyentes. Aparentemente, los indicadores dan una solucin
tcnica a decisiones que han de ser colectivas y fruto del debate social,
ya que tienen implicaciones asignativas, distributivas y de bienestar so-
cial y calidad de vida.

En un primer momento podemos generar indicadores y estadsticas que se


apoyan principalmente en los aspectos econmicos del impacto de la cultura
sobre el desarrollo, sobre el empleo, as como sus efectos multiplicadores y de
arrastre sobre otros sectores y su contribucin al incremento y redistribucin
de la riqueza.

Tambin resulta necesario evaluar la gestin de las instituciones/organizacio-


nes por medio de la medicin sistemtica de los planes, programas y proyectos
en materia cultural, comparando sus resultados con los deseados con miras a
mejorar los estndares de desempeo de las instituciones y agentes implicados.

Una vez hayamos avanzado en las cuestiones bsicas es preciso abordar nuevas
dimensiones que nos permitan analizar las mltiples facetas de la cultura des-
de una perspectiva integral. Y dichas dimensiones tienen que incluir aspectos
ms difcilmente mensurables, como la diversidad cultural, la vitalidad cultu-
ral, la capacidad creativa de una colectividad, la construccin de la identidad
cultural y la participacin o el acceso a la cultura.

La cuestin ser cmo construir consensos con cierta pretensin de generali-


dad para cuantificar, con el necesario rigor tcnico y la adecuada sensibilidad
social, cada una de dichas dimensiones y, si es as, de dnde obtener los datos
relevantes.

1.1. La armonizacin estadstica de algunas variables


macroeconmicas de la cultura

No cabe ninguna duda de que, en los pases occidentales y en algunos en vas


de desarrollo, la participacin del PIBcultural es cada vez mayor y presenta
unas cifras nada desdeables.

La cultura es un sector de demanda creciente. Los datos demuestran con con-


tundencia que la demanda de bienes y servicios culturales resulta creciente
en los espacios de crecimiento econmico. Las razones estructurales que ex-
plican este fenmeno estn relacionadas con tendencias a largo plazo que van
FUOC PID_00173351 7 Estadstica aplicada a la investigacin en cultura

a persistir en el futuro. As, el incremento de la formacin, la consideracin


de la cultura como un bien superior lo que implica que, a mayores niveles
de renta, mayor demanda, el incremento del tiempo de ocio y los cambios
en la estructuras demogrficas y sociales, as como la implantacin de las tec-
nologas de la informacin y la comunicacin que permiten nuevos modelos
de produccin, distribucin y consumo cultural, apuntan al hecho de que
la cultura es, y continuar siendo, un sector emergente y que la mayora de
los productos y servicios culturales se encuentran lejos de la consideracin
de productos maduros. En consecuencia, resulta una estrategia relativamente
inteligente apostar por la especializacin territorial en un sector que muestra
claramente su capacidad de crecimiento.

Desde el punto de vista analtico, el problema radica en determinar qu


actividades econmicas podemos considerar como culturales, y ello con
un elevado grado de consenso que permita las comparaciones a escala
internacional.

Desde hace apenas un par de dcadas se ha intensificado notablemente el in-


ters por establecer y considerar la importancia de las actividades culturales
en las economas nacionales, as como por armonizar los sistemas contables
para que dichos clculos permitan la comparacin.

A partir de 1995 se plante en diversos foros internacionales (Pars, junio de


1995; Madrid, octubre de 1995; y Urbino, mayo de 1996) la necesidad de dis-
poner de estadsticas culturales en el marco de la Unin Europea (UE), por
lo que finalmente surgi claramente una peticin de los Estados miembros a
las instituciones comunitarias para que se empezara a trabajar en este mbito.
Como consecuencia de estas reuniones de expertos nacionales en estadsticas
culturales, el Consejo adopt, el 20 de noviembre de 1995, una resolucin so-
bre la promocin de las estadsticas sobre la cultura y su relacin con el creci-
miento econmico.

As, en 1997 se cre el GrupodeLiderazgo(LEG)sobreestadsticascultu-


rales, que redact un documento de sntesis en el ao 2000 (Eurostat, 2000).
Despus de dicho informe, se confi a un grupo de trabajo de Eurostat el man-
dato de continuar las actividades del grupo de expertos en estrecha coopera-
cin con los Estados miembros. La estructura operativa del LEG se dise de
tal forma que una de sus tareas se orient a las cuestiones metodolgicas fun-
damentales, mientras que otra parte del trabajo consisti en el desarrollo de
campos temticos. Los principales objetivos del grupo de expertos fueron:

1) disear el mapa, los objetivos y el alcance de las estadsticas culturales;


FUOC PID_00173351 8 Estadstica aplicada a la investigacin en cultura

2) adaptar las clasificaciones internacionales a las necesidades especficas de


las estadsticas de los bienes culturales;

3) examinar y desarrollar las fuentes de datos existentes;

4) producir datos e indicadores que permitieran la representacin de la situa-


cin en los distintos pases.

El punto de partida de dichos trabajos puede ubicarse en la propuesta del Mar-


codeEstadsticasCulturalesdelaUNESCO de 1986, cuya revisin se aprob
en el 2009.

La OCDE, en el documento International Measurement of the Economic and Social Importance


of Culture, publicado en el 2006, considera que "aceptando que no existe un marco ope-
rativo para la medicin comparativa internacional del sector de la cultura, el documento
explora las posibilidades de la utilizacin de una aproximacin de los datos econmicos
de la cultura a partir del Sistema de Cuentas Nacionales (SCN).

El SCN tiene la ventaja de presentar el conjunto de la economa en un marco nico y


coherente. Sin embargo, la falta de detalle en las normas de clasificacin para el sector
de la cultura (identificadas por el grupo de expertos y otros) significa que las diversas
medidas, de fcil acceso para otros sectores, requieren complejas estimaciones y ejercicios
de imputacin para examinar el sector de la cultura."

La gran fortaleza de basar los clculos del valor econmico de la cultura en


sistemas de contabilidad nacional radica en que, en dichos sistemas, toda la
actividad econmica se clasifica por un nico propsito principal y registradas
en un nico y solo lugar de las cuentas.

A pesar de algunas dificultades, parece bastante claro que las propuestas


internacionales sobre el clculo del valor econmico se articulan alrede-
dor de los sistemas de contabilidad nacional y los trabajos que quedan
pendientes se centran en la identificacin, armonizacin y homogeni-
zacin de las clasificaciones internacionales sobre actividades y produc-
tos culturales.

Son especialmente sensibles a estas tendencias algunos pases de Amrica Lati-


na. Muchas de las diferentes iniciativas para medir la cultura y el mapa cultural
y las industrias de los derechos de autor se han desarrollado en Amrica Latina
en los ltimos diez aos, no solo en el mbito local y el nacional, sino tam-
bin en el subregional (por ejemplo, Mercosur, Grupo Andino y CONACUL-
TA). Los datos estadsticos y los indicadores han alcanzado un avanzado nivel
de detalle y sofisticacin en algunos casos (como Colombia y Chile), aunque
en algunos otros pases, como los de Centroamrica, son muy deficientes.
FUOC PID_00173351 9 Estadstica aplicada a la investigacin en cultura

Las aportaciones realizadas en el seno del ConvenioAndrsBello han permi-


tido que empiecen a utilizarse ciertas metodologas comunes, y, aunque los
resultados no son plenamente comparables, se han posibilitado ciertas medi-
das que poco a poco van ajustndose.

Sistemas de informacin cultural en Amrica Latina

Actualmente, la Organizacin de los Estados Americanos (OEA) y la Organizacin de


Estados Iberoamericanos estn tratando de establecer sistemas de informacin cultural
(SIC) en Amrica Latina a partir de compartir experiencias y aproximaciones entre los
pases de la regin. Sin embargo, an no se ha identificado un conjunto comn de indi-
cadores bsicos y, cuando estos se utilizan, tienden a ser muy descriptivos y genricos.

1.2. La definicin de cultura desde el marco estadstico

Muy recientemente, la divisin de estadsticas culturales de la UNESCO, des-


pus de largos aos de discusin, ha definido en el documento Marco de es-
tadsticas culturales de la Unesco cules son los sectores culturales y qu fases
de los procesos econmicos cabe considerar para calcular su dimensin en las
economas de los territorios. Esta propuesta de la UNESCO, que surge de un
largo proceso de discusin entre diferentes organismos y expertos internacio-
nales, est llamada a convertirse en el texto de referencia para la armonizacin
de las estadsticas culturales a escala global.

Ciclo cultural
FUOC PID_00173351 10 Estadstica aplicada a la investigacin en cultura

Marco para los dominios de estadsticas culturales

Dominios culturales Dominios relacionados

A. Patrimonio B. Presentaciones C. Artes D. Libros y E. Medios F. Diseo y G. Turismo H. Deportes y


cultural y artsticas y visuales y prensa audiovisuales e servicios recreacin
natural celebraciones artesanas interactivos creativos Viajes
Libros contratados y Deportes
Museos Artes escnicas Bellas artes Peridicos Filmes y vdeos Modas servicios
(tambin Msica Fotografa y revistas Radio y Diseo grfico tursticos Acondicionamiento
virtuales) Festivales, Artesanas Otros televisin (tambin Diseo interior Hospitalidad fsico y bienestar
Sitios festividades y materiales transmisin en Paisajismo y hospedaje Parques de
arqueolgicos ferias impresos tiempo real Servicios entretenimiento y
e histricos Bibliotecas [streaming]) arquitectnicos temticos
Paisajes (tambin Creacin de Servicios de Juegos de azar
culturales virtuales) archivos sonoros publicidad
Patrimonio Ferias de en Internet
natural libros (podcasting)
Juegos de vdeo
(tambin en lnea)

Patrimonio cultural inmaterial (tradiciones y expresiones Patrimonio cultural


orales, rituales, lenguas, prcticas sociales) inmaterial

Educacin/Capacitacin Educacin y capacitacin

Archivstica y preservacin Archivstica y preservacin

Equipamiento y materiales
Equipamiento y materiales de apoyo de apoyo

1.3. Estadsticas culturales en Espaa

La produccin de las estadsticas oficiales en cultura se refleja anualmente en


el rea correspondiente de los programas anuales del Plan estadstico nacio-
nal. La difusin de los principales resultados disponibles en el rea cultural
se integra en el Anuario de estadsticas culturales elaborado por la Divisin de
Estadstica del Ministerio de Cultura. Las estadsticas de cultura disponibles
en Espaa son:

Archivos (50003).

Bibliotecas (30403).

Bibliotecas pblicas del Estado (50023).

Cinematografa: produccin, exhibicin, distribucin y fomento (50061).

Cuenta satlite de la cultura (50052). En proceso Edicin espaola de


libros con ISBN (50026).

Edicin espaola de msica con ISMN (50050).

Espaol (bienes muebles e inmuebles) (50001).


FUOC PID_00173351 11 Estadstica aplicada a la investigacin en cultura

Estadsticas de financiacin y gasto pblico en cultura (41050).

Explotacin estadstica de la base de datos de proteccin del patrimonio


histrico.

Explotacin estadstica de la base de datos de recursos musicales y de la


danza (entidades, profesionales y estrenos) (50041).

Explotacin estadstica de las bases de datos de recursos de las artes esc-


nicas (50044).

Explotacin estadstica del Registro General de la Propiedad Intelectual


(50053).

Hbitos y prcticas culturales en Espaa (41021). En proceso Museos y


colecciones museogrficas (50004).

Produccin editorial de libros (30401).

Otras estadsticas que recogen parcialmente informacin relevante en el cam-


po cultural son:

Encuesta de empleo del tiempo 2002-2003 (N. IOE 30447).

Encuesta de poblacin activa (N. IOE 30308).

Directorio central de empresas (N. IOE 30201).

Encuesta industrial de empresas (N. IOE 30048).

Encuesta anual de servicios (N. IOE 30177).

Encuesta de presupuestos familiares (N. IOE 30458).

Estadstica de comercio extracomunitario (N. IOE 32023).

Estadstica de productos en el sector servicios.

Estadstica de liquidaciones de los presupuestos de las entidades locales.

Balanza de pagos (Banco de Espaa).

Movimientos tursticos de los espaoles (FAMILITUR) (N. IOE 16023).

Movimientos tursticos en fronteras (FRONTUR) (N. IOE 16028).


FUOC PID_00173351 12 Estadstica aplicada a la investigacin en cultura

Encuesta de gasto turstico (EGATUR) (N. IOE 16029).

Estadstica de las enseanzas no universitarias.

Estadstica de la enseanza universitaria.

Estadstica de la formacin ocupacional.

ndice de precios al consumo.

Encuesta de condiciones de vida.

Encuesta sobre la participacin de la poblacin adulta en las actividades Enlace de inters


de aprendizaje.
La mayora de las estadsticas
culturales en Espaa son ac-
cesibles desde la pgina web
del INE y, en algunos casos,
1.3.1. El sistema de presentacin de informacin del Ministerio es posible acceder a los mi-
crodatos.
de Cultura

El Ministerio de Cultura pone a disposicin de los ciudadanos unas herramien-


tas de recopilacin y presentacin de estadsticas culturales que resultan bas-
tante intuitivas y sencillas, incluso para usuarios no expertos. El sistema se
denomina CulturaBase y da opcin de elegir entre magnitudes transversales
(que afectan a diversos sectores culturales) y sectoriales.

La lgica es siempre la misma y el mecanismo consiste en seleccionar el tema


que nos interese para entrar en una interfaz que habitualmente nos permite
seleccionar aos y CC. AA.

Ejemplo

Podis ver un ejemplo en la siguiente figura sobre empresas culturales.


FUOC PID_00173351 13 Estadstica aplicada a la investigacin en cultura

Una notable ventaja del sistema es que nos permite descargar los datos en formato Excel
para poder manipularlos en funcin de nuestros intereses.

Esta utilidad otorga un elevado grado de versatilidad a las bases de datos del ministerio.

1.4. El valor econmico de la cultura en Espaa

En el caso espaol contamos desde el ao 2000 con aproximaciones "oficiales"


al valor econmico de la cultura, elaboradas por tcnicos del Ministerio de
Cultura en colaboracin con Ezequiel Uriel, de la Universidad de Valencia.

Desde finales del 2009 ya contamos con una publicacin que habla especfi-
camente de la cuenta satlite de la cultura en Espaa y avanza resultados del
perodo 2000-2007.

Estamos hablando de un conjunto de actividades que para el ao 2007 lti-


mo ao al que llegan las cuentas suponen el 3% del PIB para las actividades
culturales y el 3,8% para el conjunto de las actividades vinculadas a la propie-
dad intelectual. Para hacerse una idea de lo que significa esa dimensin, pode-
mos decir que, para ese mismo ao, supona un tamao similar, en trminos
econmicos, al del sector primario (agricultura, ganadera y pesca).

Estadsticas regionales

La contabilidad regional es ms escasa y solo algunas CC. AA. cuentan con publicaciones
ocasionales que hacen referencia a la dimensin econmica de la cultura.

Otras experiencias de contabilidad regional del valor econmico de la cultura

Territorio Perododedispo- Ttulodeldocumento


nibilidaddedatos

Andaluca (2009) 2005 Cuenta satlite de la cultura


en Andaluca

Murcia (2008) 2000-2005 El valor econmico de la cul-


tura en la Regin de Murcia

Catalua (2009) 2000-2005 Les indstries culturals

Galicia (2009) Diversos perodos O sistema produtivo da cultu-


segn variables ra en Galicia, unha visin eco-
nmica
FUOC PID_00173351 14 Estadstica aplicada a la investigacin en cultura

Territorio Perododedispo- Ttulodeldocumento


nibilidaddedatos

Isla de Gran Canaria 2000-2005 El valor econmico de la cul-


tura en la isla de Gran Cana-
ria (no publicado)

1.5. Los observatorios de cultura

Otra institucin que proporciona informacin ms o menos cuantitativa so- Lectura recomendada
bre la cultura es la de los observatorios de cultura. Estos empiezan a surgir
Para saber ms sobre obser-
aproximadamente a finales de los aos ochenta y encuentran durante los no- vatorios de la cultura podis
venta y hasta la actualidad su mayor expansin y consolidacin. En su origen, leer el documento Kultura 07.
Observatorio Vasco de la Cultu-
estos entes nacen con la voluntad de sistematizar las fuentes de informacin ra.
y desarrollar nuevas investigaciones y anlisis sobre polticas culturales, as
como de favorecer el desarrollo cultural. Actualmente son muchos y de muy
diversa ndole los organismos que se denominan observatorios culturales o se
les considera como tales por alguna de las tareas que realizan. Las razones que
explican esta variedad en la tipologa de observatorios culturales son mlti-
ples: su naturaleza, funciones y mbito de accin; los rganos que los consti-
tuyen, los y las profesionales que los componen, as como los agentes que se
encuentran en el origen de su formacin. Existen, hoy en da, algunas bases de
datos en las que se puede encontrar una extensa recopilacin de organismos
que se dedican a la observacin cultural.

Algunos referentes nacionales e internacionales destacan por su recopilacin


extensa y exhaustiva; sin embargo, en cada una de estas bases de datos encon-
tramos diferencias en las clasificaciones y tipologas elegidas para presentar los
numerosos observatorios culturales. Este hecho evidencia lo difcil que es la
labor de realizar una clasificacin depurada de todos los organismos que rea-
lizan tareas propias de los observatorios culturales. Se pueden distinguir tres
tipos de observatorios culturales:

1)Centrosdeinvestigacinyorganismosinternacionales: organismos in-


dependientes de las administraciones pblicas, con vocacin de anlisis y es-
tudio de la realidad cultural. Los centros de investigacin incluidos en esta
categora se caracterizan, en la mayora de los casos, por tener una dimen-
sin internacional, tanto en su mbito de estudio como en sus componentes
y miembros. En este sentido resaltan por favorecer la creacin de redes de co-
nocimiento y el intercambio de informacin. Por ello, las funciones de obser-
vatorio cultural acostumbran a ser una de las mltiples tareas que realizan,
entre las que normalmente tambin destaca la divulgacin de la cultura.

2)Organismosregionalesonacionales: organizaciones vinculadas al estudio


de la realidad cultural de un territorio, que en la mayora de los casos provie-
nen de la iniciativa de un gobierno regional o nacional. Estos organismos sue-
FUOC PID_00173351 15 Estadstica aplicada a la investigacin en cultura

len dedicarse a analizar una zona geogrfica delimitada y tienen como objeti-
vo contribuir a la definicin, desarrollo y evaluacin de las polticas culturales
implementadas por los mismos organismos pblicos de los que dependen.

3)Centrosuniversitarios: departamentos de universidades especializados en Enlace de inters


la investigacin y observacin de las polticas culturales y de la realidad cul-
En el Portal Iberoamericano
tural. Estos departamentos terminan vinculados en muchos casos a iniciativas de Gestin Cultural podis
regionales o nacionales de anlisis de las polticas culturales del territorio. encontrar el listado ms
completo y geolocalizado de
observatorios culturales.
1.6. Estadsticas culturales en Europa

Eurostat la oficina estadstica europea cuenta con numerosos datos sobre


cultura, aunque su usabilidad deja bastante que desear y requiere algunos co-
nocimientos avanzados. Por ello, una manera de aproximarse a la informacin
sobre cultura en el mbito europeo es recurrir a la publicacin sinttica de Eu-
rostat, de octubre del 2007, Cultural statistics. Dicha publicacin se basa en la Web del Portal Iberoamericano de Gestin
Cultural
definicin pragmtica de la cultura en general, de acuerdo con el trabajo del
Grupo de Liderazgo (LEG) sobre estadsticas culturales, que sigue bsicamente
las recomendaciones de la UNESCO.

En Cultural statistics se presentan los datos relacionados con la cultura que se


encuentran actualmente disponibles en Europa a partir de encuestas armoni-
zadas y colecciones de datos, as como informacin adicional de otras fuentes
de datos (principalmente la UNESCO y el Eurobarmetro).

En el mbito de la dimensin econmica de la cultura cabe destacar el trabajo


titulado The Economy of culture in Europe, que realiz en el 2006 la consultora
KEA por encargo de la Comisin Europea.

Por otra parte, el Consejo de Europa, en colaboracin con ERICARTS, elabora


el COMPENDIUM. Cultural Policies and Trends in Europe, donde se provee infor-
macin estadstica (entre otros tipos de informacin) sobre los aspectos que
tienen que ver con las polticas culturales nacionales y se ofrecen algunas he-
rramientas que permiten aproximaciones comparativas, como, por ejemplo,
las que se ofrecen en la siguiente tabla.

Porcentaje de la distribucin del gasto pblico en cultura por niveles de gobierno en distintos
pases europeos

Pas Ao Gobierno Gobiernoregio- Gobiernolo-


central nal/provincial cal/municipal

Alemania 2003 13,40% 43,40% 43,20%

Espaa 2004 15,80% 28% 56,30%

Polonia 2006 19,60% 48% 32,28%

Suiza 2002 25,30% 36,20% 38,50%

Fuente: Consejo de Europa/ERICARTS, Compendium of Cultural Policies and Trends in Europe (9. edicin), 2008
FUOC PID_00173351 16 Estadstica aplicada a la investigacin en cultura

Pas Ao Gobierno Gobiernoregio- Gobiernolo-


central nal/provincial cal/municipal

Holanda 2004 29% 8% 63%

Gran Bretaa 2003/04 34,10% N/A 65,90%

Austria 2005 34,66% 34,36% 30,99%

Noruega 2005 38,60% 5,40% 56%

Canad 2003/04 45,40% 28,60% 26,00%

Suecia 2005 48% 10% 42%

Francia 2002 51% 12% 36%

Italia 2000 52,20% 14,60% 33,20%

Eslovaquia 2006 53,50% 16,30% 30,20%

Finlandia 2005 57,20% N/A 42,80%

Dinamarca 2005 62,50% 3,60% 33,90%

Estonia 2005 62,60% 1,80% 35,60%

Fuente: Consejo de Europa/ERICARTS, Compendium of Cultural Policies and Trends in Europe (9. edicin), 2008
FUOC PID_00173351 17 Estadstica aplicada a la investigacin en cultura

2. Nmeros ndices aplicados a la cultura

La actividad cultural se caracteriza, en trminos sociales, por su dinamismo y


propensin al cambio. La evolucin de las magnitudes del mbito de la cultura
refleja, en trminos estadsticos, esta caracterstica fundamental de las activi-
dades culturales. As, por ejemplo, cuando se inauguran nuevos equipamien-
tos o instalaciones, cuando se destinan recursos financieros o humanos adi-
cionales a actividades de naturaleza cultural o cuando se programan nuevos
eventos y actividades, las cifras y los datos referidos a la cultura evolucionan
proporcionando informacin adicional. En este apartado y los siguientes tra-
taremos los mtodos para hacer un mejor uso de la informacin estadstica
referida al mbito de la cultura, que se obtiene de magnitudes o variables que
se observan a lo largo de perodos ms o menos prolongados de tiempo.

Definimos una serie temporal como un conjunto de datos estadsticos


referidos a una magnitud que han sido recopilados, observados o regis-
trados a intervalos regulares y ordenados de tiempo. La principal carac-
terstica de los datos temporales es la no independencia estadstica de
las observaciones, debido a que las observaciones corresponden todas
a una misma magnitud referida a un mismo mbito en instantes o pe-
rodos sucesivos de tiempo cronolgico.

Los nmeros ndices son medidas estadsticas que, por construccin,


sirven para comparar una misma magnitud en dos situaciones, una de
las cuales se toma como referencia o base de comparacin. Aunque la
comparacin puede establecerse en el espacio (por ejemplo, entre reas,
pases, regiones), lo ms frecuente es que se establezca en el tiempo, en
trminos de fechas o de perodos para uno o varios mbitos espaciales.

Hay que tener en cuenta que el valor elegido como trmino de comparacin,
base o referencia, no debe ser un valor atpico, sino encontrarse en el campo
de variacin habitual de la magnitud en cuestin. As, por ejemplo, resulta po-
sible conocer y analizar la evolucin del nmero de asientos en los teatros de
una poblacin, valorar el incremento del presupuesto destinado a actividades
culturales por un gobierno local en una legislatura, o saber cul ha sido la evo-
lucin del volumen de negocio de las industrias creativas en un rea concreta,
entre otras muchas magnitudes o variables vinculadas a la actividad cultural.
FUOC PID_00173351 18 Estadstica aplicada a la investigacin en cultura

En general, la comparacin estadstica entre dos magnitudes cualesquie-


ra se establece por cociente. Al cociente entre dos magnitudes se le de-
nomina razn o ratio. As, la ratio entre el valor de una magnitud X y
el de una magnitud Y en el momento del tiempo t se expresara como

Ratio (t) = X(t)/Y(t)

Ejemplo de ratio

Si X(t) mide el valor aadido bruto de la industria del diseo en cierto pas e Y(t) expre-
sa el nmero de trabajadores ocupados en dicha industria en ese pas, la ratio X(t)/Y(t)
proporciona informacin sobre la productividad aparente per cpita de la industria del
diseo en el pas.

La proporcin es un tipo especial de ratio que se define como el cocien-


te entre un sumando cualquiera de una magnitud agregada y el valor
de la suma total de dicha magnitud agregada.

1.1

Ejemplo de proporcin

Si Xi(t) expresa el valor aadido de la industria del diseo en un pas y iXi(t) expresa
el valor aadido de todas las industrias creativas, la proporcin Xi(t)/iXi(t) brinda infor-
macin sobre el peso relativo del diseo con respecto a la industria creativa del pas.

La tasadevariacin es el cociente entre el incremento o variacin de


una magnitud variable y un valor de la misma magnitud que se elige
como base de la comparacin.

1.2

Ejemplo de tasa de variacin


Expresin en porcentaje
Si X(t) expresa el presupuesto destinado a cultura por un ayuntamiento en el ao t, la tasa
de variacin X(t) X(t 1)/X(t 1) indica cunto ha crecido o decrecido el presupuesto Con el fin de facilitar la com-
de cultura en el ao t con relacin al presupuesto de cultura del ao anterior de dicho paracin, las ratios, proporcio-
nes y tasas de variacin se ex-
ayuntamiento.
presan, por lo general, en tr-
minos de porcentajes.
2.1. Caracterizacin de los nmeros ndices

En funcin de su cobertura, esto es, de la naturaleza de la magnitud o magnitu-


des a que se refieren, los nmeros ndices se clasifican en simples y complejos.
Esta clasificacin determina la forma en que los ndices se definen y calculan.
FUOC PID_00173351 19 Estadstica aplicada a la investigacin en cultura

Los nmerosndicessimples son aquellos que vienen referidos a una


sola variable o medida cuya definicin permanece estable a lo largo del
tiempo aunque vare en magnitud. As, el valor del ndice simple de
una variable X en un momento del tiempo t expresado con respecto al
valor de la misma en un perodo de referencia o base (t = 0) se expresa
habitualmente como:

1.3

Ejemplo sobre el nmero de personas ocupadas en industrias creativas

La tabla siguiente muestra la evolucin del nmero de personas ocupadas en las industrias
creativas (segunda columna) y del conocimiento en la provincia de Barcelona entre 1993
y el 2005, as como el nmero ndice simple de esta magnitud expresado en base 1993
(tercera columna).

Ao Ocupados ndicebase1993

1993 113.003 100,0

1994 111.819 99,0

1995 101.310 89,7

1996 109.546 96,9

1997 115.073 101,8

1998 111.104 98,3

1999 123.037 108,9

2000 117.709 104,2

2001 118.923 105,2

2002 106.539 94,3

2003 104.325 92,3

2004 87.493 77,4

2005 88.817 78,6

Obviamente, el valor de cualquier nmero ndice simple correspondiente al perodo re-


ferencia o base es siempre igual a cien.

1.4

Los nmerosndicescomplejos son aquellos que sintetizan en un solo


nmero la informacin de varias magnitudes o variables.
FUOC PID_00173351 20 Estadstica aplicada a la investigacin en cultura

Los ndices complejos, a su vez, pueden clasificarse en no ponderados o pon-


derados, segn otorguen la misma importancia o no a las distintas variables
que los integran.

Los ndices no ponderados se pueden obtener por media agregativa


(Bradstreet-Dtot) cuando las unidades de medida son homogneas.

1.5

En caso contrario, se pueden calcular a travs de una media aritmtica


de ndices simples (Sauerbek).

IS0 (t) = (1/n) i [I0(t)]i 100 = (1/n) i [(Xi (t) / Xi (0)] 100

Ejemplo de ndices complejos

La tabla siguiente muestra el valor aadido de tres sectores de la industria creativa en


Barcelona desde 1993 al 2005 (columnas segunda, tercera y cuarta) y los correspondientes
ndices complejos calculados como media agregativa (columna quinta) y como media
aritmtica de ndices simples (ltima columna).

Ao Diseo Publicidad Cine,v- ndiceBrads- ndiceSauer-


deo,msica treet-Dtot beckbase1993
base1993

1993 1.705.390 562.958 12.006 100,0 100,0

1994 1.707.051 698.771 9.910 105,9 102,3

1995 1.692.985 481.815 7.198 95,7 81,6

1996 1.784.744 559.859 10.178 103,3 96,3

1997 1.982.126 594.632 10.100 113,4 102,0

1998 2.005.622 736.278 8.404 120,6 106,1

1999 2.402.987 612.927 10.498 132,7 112,4

2000 2.162.921 777.396 27.392 130,1 164,4

2001 2.257.772 724.834 22.929 131,8 150,7

2002 2.162.299 776.634 37.666 130,5 192,8

2003 2.219.374 966.475 29.651 141,0 182,9

2004 1.985.339 743.497 29.387 121,0 164,4

2005 1.837.534 937.220 26.747 122,9 165,7


FUOC PID_00173351 21 Estadstica aplicada a la investigacin en cultura

Los nmeros ndices ponderados se caracterizan por que asignan a cada


variable una ponderacin o peso que refleja la relevancia de su aporta-
cin a la medida que sintetiza la evolucin temporal del conjunto de
variables a que se refiere el propio ndice.

La eleccin de las ponderaciones ms adecuadas es tarea delicada y cada tipo


de ndice se caracteriza por el criterio que utiliza para determinar las ponde-
raciones que incorpora. As, por ejemplo, los ndices de Laspeyres se caracte-
rizan por utilizar ponderaciones del perodo base, mientras que los ndices de
Paasche utilizan ponderaciones del perodo corriente.

2.2. Cambio de base y enlace

En la elaboracin y uso de ndices surgen una serie de problemas prcticos


que hay que resolver. En el caso de los ndices simples, las variables estn de-
terminadas, pero cuando se utilizan ndices complejos que tratan de sinteti-
zar un conjunto de magnitudes en una sola hay que plantearse el problema
de la seleccin. Lo ms habitual es tomar una subpoblacin integrada por los
productos que se consideren ms representativos. A continuacin habr que
definir las calidades de los productos, el lugar y tiempo del estudio y el pe-
rodo que se elige como base. Es importante que el perodo de referencia sea
normal. Cuando las variables presentan fuertes variaciones, parece recomen-
dable tomar como base un perodo relativamente dilatado de tiempo. La base
debe estar relativamente prxima al momento en que se calcula y utiliza los
ndices para que no pierda representatividad. Ello obliga a cambiar de base
con relativa frecuencia para evitar la obsolescencia del nmero ndice como
instrumento de comparacin.

En ndices simples, el cambio de base se realiza aplicando una regla de pro-


porcionalidad. En ndices complejos, el cambio de base es considerablemente
ms problemtico porque, en general, implica tambin una renovacin de la
cobertura del ndice, esto es, de los componentes que engloba y de las pon-
deraciones que intervienen. Ello obliga a enlazar, mediante reglas de propor-
cionalidad complejas, la serie antigua y la nueva para poder seguir realizando
comparaciones intertemporales.

Ejemplo

La tabla siguiente muestra el nmero ndice del ejemplo sobre el nmero de personas
ocupadas en las industrias creativas del subapartado 2.1 expresado en base 1993 (segunda
columna) y el correspondiente valor del ndice calculado en base 2000 (tercera columna).

Ao ndicebase1993 ndicebase2000

1993 100,0 96,0

1994 99,0 95,0

1995 89,7 86,1


FUOC PID_00173351 22 Estadstica aplicada a la investigacin en cultura

Ao ndicebase1993 ndicebase2000

1996 96,9 93,1

1997 101,8 97,8

1998 98,3 94,4

1999 108,9 104,5

2000 104,2 100,0

2001 105,2 101,0

2002 94,3 90,5

2003 92,3 88,6

2004 77,4 74,3

2005 78,6 75,5

2.3. Actualizacin de magnitudes de valor

Una de las principales aplicaciones de los nmeros ndices es eliminar el efec-


to que los cambios en los precios de los bienes tienen sobre las magnitudes
de valor expresadas en unidades monetarias. Es bien sabido que el valor del
dinero vara con el tiempo por diversas causas, entre las que destacan las va-
riaciones de los precios, es decir, por efecto de la inflacin.

Para convertir series expresadas en valores monetarios en series de va-


lores reales hay que dividir por un ndice de precios. Esta operacin se
denomina deflacin.

Con series calculadas en valores reales se puede analizar la verdadera evolu-


cin del valor que expresa la magnitud sin la distorsin que induce la ilusin
monetaria.

Valor corriente en t = pt qt Valor a precios base en t = p0 qt

De esta forma se elimina cualquier variacin del valor que sea atribuible a los
precios. La deflacin exige el uso de un ndice de precios Paasche, aunque
en la prctica se utiliza el Laspeyres (IPC) por su menor coste de elaboracin.
Tambin son de uso frecuente los ndices de precios implcitos (deflactores)
que se deducen de la contabilidad nacional (y que son Paasche).

Ejemplo

La tabla muestra la evolucin de la cifra de negocios de la industria creativa entre 1993 y


el 2005 expresada en valores corrientes (segunda columna) en la provincia de Barcelona.
Utilizando el deflactor apropiado, que en este caso sera un ndice de precios de Paasche
representativo de los productos que genera la industria creativa (tercera columna), es po-
FUOC PID_00173351 23 Estadstica aplicada a la investigacin en cultura

sible calcular la evolucin del valor de la cifra de negocios a precios constantes, corres-
pondientes al perodo base (cuarta columna).

Ao Valorcorriente Deflactor Valorenpre-


ciosdelaobase

1993 8.865.086 100,00 8.865.086

1994 9.993.758 101,51 9.844.780

1995 11.887.100 115,79 10.265.897

1996 13.475.790 119,24 11.301.580

1997 15.529.015 121,77 12.752.890

1998 16.041.797 125,21 12.812.380

1999 18.057.194 126,99 14.219.813

2000 19.411.843 127,80 15.188.835

2001 21.096.096 129,16 16.333.732

2002 19.119.015 131,52 14.536.685

2003 19.686.814 134,54 14.633.192

2004 17.876.451 135,92 13.151.908

2005 19.676.665 140,62 13.992.299


FUOC PID_00173351 24 Estadstica aplicada a la investigacin en cultura

3. Anlisis de series temporales en cultura

Una serie temporal es un conjunto de datos estadsticos referidos a una mag-


nitud de inters que han sido recopilados, observados o registrados en distin-
tas fechas o perodos de tiempo y se presentan ordenados cronolgicamente.
En general, las observaciones se realizan a intervalos regulares de tiempo, lo
que da lugar a series anuales, semestrales, trimestrales, semanales o diarias. En
el mbito de la cultura, las series temporales de inters pueden estar referidas a
mltiples aspectos de la realidad cultural, como, por ejemplo, la evolucin del
nmero de asistentes a diversos tipos de actividades culturales, la de los pre-
supuestos pblicos destinados a cultura, la del nmero de personas ocupadas
en la industria creativa, la del nmero de bienes declarados de inters cultural,
la variacin del valor aadido generado por la actividad cultural, etc.

La principal caracterstica de los datos de una serie temporal es la no inde-


pendencia estadstica de las observaciones, puesto que la serie cuantifica una
misma magnitud a lo largo del tiempo y cada dato sigue a los precedentes y
antecede a los siguientes. Si, por ejemplo, consideramos la serie "presupuesto
destinado al rea de cultura" de un ayuntamiento, resulta evidente que el va-
lor de la serie en un ao concreto est relacionado con el valor de la serie en
los aos anteriores. En trminos estadsticos, la dependencia de un valor de la
serie con respecto a las observaciones anteriores de la misma serie se denomi-
na autocorrelacin. As, las series de datos temporales suelen estar autocorre-
lacionadas y, en consecuencia, los mtodos de anlisis estadstico para series
temporales se caracterizan por tomar en consideracin el orden cronolgico
de las observaciones.

El primer paso en el anlisis de una serie temporal consiste generalmente en


la inspeccin visual de su representacin grfica. As, es posible obtener una
visin de conjunto de las caractersticas predominantes de la serie, tales como
la direccin de su evolucin a largo plazo (creciente, decreciente u oscilante),
las regularidades cclicas o estacionales, la presencia de observaciones atpicas,
los cambios estructurales o las discontinuidades, etc. En el mbito de la cultu-
ra, esta representacin suele realizarse tanto en trminos de niveles (valores
observados para la magnitud en cada momento del tiempo) como de incre-
mentos (tasas de variacin con respecto a valores anteriores).

Ejemplo

El grfico siguiente muestra la evolucin del nmero de personas ocupadas en las indus-
trias creativas y del conocimiento en el rea metropolitana de Valencia desde el primer
trimestre de 1993 hasta el segundo trimestre del 2009.
FUOC PID_00173351 25 Estadstica aplicada a la investigacin en cultura

En trminos generales, el anlisis de series temporales puede responder a tres


categoras de objetivos:

1) Describir la evolucin de una magnitud en el pasado.


2) Construir un modelo adecuado para dicha evolucin.
3) Predecir la evolucin futura de la magnitud.

Evidentemente, para construir un modelo adecuado hay que conocer la evo-


lucin pasada de la magnitud, esto es, la realidad observada que se pretende
modelizar, y para predecir la evolucin futura de la serie es necesario construir
algn tipo de modelo que pueda ser proyectado o extrapolado hacia el futuro.
Por tanto, estos tres tipos de objetivos son jerrquicos y estn estrechamente
vinculados entre s en trminos de los procedimientos estadsticos que impli-
can.

3.1. Descomposicin de series temporales

Es frecuente concebir los movimientos que presenta la evolucin de una serie


temporal que capta la evolucin de una magnitud de inters como la resultan-
te de la composicin de cuatro efectos o fuerzas denominadas, con carcter
general, tendencia, ciclo, estacionalidad y componenteirregular. Por defi-
nicin, estas cuatro fuerzas o componentes son magnitudes no observables;
no obstante, se supone que su integracin determina la evolucin que muestra
la serie temporal observada y cuantificada.

Yt = g (Tt; Ct; St; It)


FUOC PID_00173351 26 Estadstica aplicada a la investigacin en cultura

La nocin de componentes inobservables de una serie temporal tiene una larga


tradicin en el anlisis estadstico, aunque presenta varios problemas de orden
metodolgico. Los principales son cmo determinar adecuadamente el signi-
ficado preciso de cada una de las componentes y cmo formular el mecanismo
mediante el cual se combinan para generar los valores observados de la serie.

Tendencia es la direccin general de evolucin de largo plazo, o movi-


miento secular, de la serie observada.

La tendencia tambin se puede definir como la direccin de los cambios a largo


plazo en el valor promedio de la magnitud a lo largo del tiempo.

Ciclo es cualquier movimiento recurrente de periodicidad superior al


ao natural.

Una serie temporal puede presentar varias componentes cclicas simultnea-


mente. En muchas ocasiones, las dificultades conceptuales y tcnicas para
identificar las componentes cclicas determinan que estas no puedan ser sepa-
radas adecuadamente de la tendencia, de manera que con frecuencia se con-
sidera una nica componente ciclotendencia que capte el resultado de ambos
tipos de influjos, evolucin secular y patrn cclico supraanual.

Estacionalidad es cualquier movimiento recurrente de periodicidad in-


ferior al ao con una influencia caracterstica para cada serie.

Una serie puede presentar distintos efectos estacionales dependiendo de su


periodicidad. En funcin de la frecuencia de las observaciones puede conside-
rarse la presencia de componentes estacionales semestrales, trimestrales, men-
suales, semanales y diarios.

La componenteirregular engloba las variaciones residuales de la serie


observada debidas a factores imprevisibles, los cuales, a su vez, pueden
influir solo en una serie concreta o en un conjunto de series referidas
a un mismo fenmeno.

Segn sea el comportamiento de la serie analizada, es posible asumir distintos


esquemas de integracin de componentes.
FUOC PID_00173351 27 Estadstica aplicada a la investigacin en cultura

Los esquemas de integracin de componentes ms utilizados son el es-


quemamultiplicativo:

Yt = Tt Ct St + It

y, en menor proporcin, el esquemaaditivo:

Yt = Tt + Ct + St + It

Para elegir el esquema de integracin ms apropiado para una serie en parti-


cular se procede a observar las variaciones del nivel de la serie con relacin a
su media global: si las variaciones presentan una tendencia creciente (o decre-
ciente) en el tiempo, se utiliza el esquema multiplicativo; en caso contrario,
cuando las variaciones del nivel con respecto a su media son errticas, se uti-
liza el esquema aditivo.

Evidentemente, la definicin de las distintas componentes es fundamental-


mente emprica, esto es, la evaluacin de una componente depende de cmo
se definan el resto de ellas. Debe quedar claro que las componentes son en
s mismas inobservables, pero es posible "estimarlas" o "evaluarlas" utilizando
distintos tipos de tcnicas y diferentes conjuntos de hiptesis de comporta-
miento. Con frecuencia, sin embargo, no es posible o conveniente separar la
componente tendencial de la cclica, por lo que habitualmente se asume la
presencia de una componente ciclotendencia, una o ms componentes esta-
cionales y una componente irregular.

El anlisis clsico de series temporales mediante descomposicin consiste, en


una primera etapa, en describir las pautas de regularidad que sigue cada com-
ponente. Si estas pautas son estables en el tiempo, se podrn proyectar en el
futuro mediante extrapolacin para obtener predicciones tanto de la evolu-
cin de las componentes como, mediante el esquema de integracin, de la
propia serie temporal.

Por definicin, solo las componentes no irregulares son previsibles, de ah que


el inters se haya centrado en la tendencia (o ciclotendencia) y, en menor me-
dida y solo para series de alta frecuencia, en algunos patrones de estacionali-
dad.

3.2. Evaluacin de componentes tendenciales

Como las componentes son en s mismas inobservables, deben ser evaluadas


o estimadas a partir de las observaciones. La estimacin se realiza bajo un
conjunto de hiptesis de comportamiento que debe reflejar tanto la definicin
de las propias componentes como las pautas de evolucin que se les suponen.
FUOC PID_00173351 28 Estadstica aplicada a la investigacin en cultura

Hay que destacar que la evaluacin de cada componente siempre depende de


cmo se definan las dems. En general, se considera que la componente ms
relevante es la tendencia, debido a su carcter de permanencia. Existen diver-
sos tipos de procedimientos para evaluar la tendencia de una serie temporal:

1)Grficos. La observacin del grfico de la serie permite evaluar visualmente


la tendencia a partir de su propia definicin: es la direccin de evolucin de
largo plazo. Este procedimiento tiene el inconveniente de ser subjetivo y poco
preciso, pues no permite estimar los valores de la componente tendencial ni
realizar predicciones explcitas para el valor de la serie. No obstante, el anlisis
de una serie temporal se inicia siempre con la observacin de su representacin
grfica tanto en niveles como en incrementos o tasas de variacin.

2)Mediasmviles. Los mtodos de medias mviles consisten en promediar


cada valor de la serie con algunas de las observaciones que le preceden y le
siguen. De esta forma se eliminan las variaciones accidentales, y la serie resul-
tante, con un perfil ms suave que la original, se identifica con la componente
tendencial (o ciclotendencial) de la serie.

Para aplicarlos, se toma un cierto perodo de tiempo que comprenda varias


observaciones consecutivas que se promedian por media aritmtica. El pero-
do es constante en amplitud y se desplaza a lo largo del tiempo, de ah la de-
nominacin de media mvil.

La amplitud del perodo depende de la periodicidad de las observaciones. Con


datos anuales, el perodo suele ser impar (3-5 aos). Para series de mayor fre-
cuencia se recomienda tomar medias mviles de perodo anual (4 para series
trimestrales, 12 para series mensuales). Cuando el perodo de la media mvil
es par resulta necesario centrar el resultado para que coincida con el tiempo a
que corresponde cada observacin original, efecto que se consigue tomando
una nueva media mvil de perodo 2. La idea es sustituir cada valor original
por el correspondiente promedio mvil. El resultado es una nueva serie de va-
lores que refleja la tendencia subyacente de la serie original.

Ejemplo del mtodo de medias mviles

El grfico muestra la evolucin de la serie temporal del nmero de ocupados en la indus-


tria del conocimiento en el rea metropolitana de Valencia por trimestres y la tendencia
evaluada por media mvil de tamao anual centrada.
FUOC PID_00173351 29 Estadstica aplicada a la investigacin en cultura

En general, la evaluacin de tendencia por medias mviles no permite realizar


predicciones porque no proporciona una funcin de variable temporal que sea
extrapolable para momentos o perodos de tiempo futuro. Adems, la natura-
leza del procedimiento determina que se pierdan observaciones al principio
y al final de la serie.

3)Alisadoexponencial. Es un mtodo de estimacin de la tendencia que se


basa en una hiptesis muy concreta: el valor de la tendencia en un perodo
es la media ponderada de la observacin correspondiente a ese perodo y de
todas las observaciones que la preceden, esto es, del historial de evolucin de la
propia magnitud. Dado que parece razonable que el pasado remoto tenga una
influencia menor en el presente que el pasado reciente, se impone un sistema
de ponderaciones que decrecen exponencialmente hacia el primer momento
en que la serie ha sido observada.

El alisado exponencial se puede entender como una media mvil especial. Al


calcular una media mvil, los valores que intervienen tienen ponderacin 1/k
(siendo k el nmero de observaciones que intervienen en la media mvil) y
los que no intervienen tienen ponderacin cero. En el alisado exponencial se
asigna ponderacin cero a los valores posteriores a la observacin corriente,
correspondiente al momento del tiempo en que se realiza el alisado, y una
ponderacin exponencialmente decreciente a los valores previos.
FUOC PID_00173351 30 Estadstica aplicada a la investigacin en cultura

Para aplicar el alisado exponencial partimos de una constante de alisado, un Constante de alisado
valor comprendido entre cero y uno que se elige de manera subjetiva. En ge-
Aunque la constante de alisado
neral, el valor suavizado correspondiente a un perodo t se define como es un valor que se elige de ma-
nera subjetiva, existen distintos
criterios objetivizables, como,
Tt = a Yt + (1 a) Tt 1 por ejemplo, el de los mnimos
cuadrados ordinarios.

Sustituyendo reiteradamente hacia atrs, se llega a la frmula que expresa el


valor alisado o suavizado en funcin de las observaciones en forma de prome-
dio ponderado con ponderaciones exponencialmente decrecientes:

2 t1
Tt = a Yt + a (1 a) Yt 1 + a (1 a) Y t 2 + ... + (1 a) Y1

Evidentemente, cuanto mayor sea la constante a, mayor ponderacin recibi-


rn las observaciones recientes y menor las ms antiguas. En cualquier caso,
con series suficientemente largas alisadas con un valor razonable de la cons-
tante los valores mas antiguos tendrn escasa incidencia en el valor suavizado
para un perodo cualquiera t.

Este mtodo permite predecir el valor de la tendencia de la serie con un perodo


de adelanto.

Mtodo de alisado exponencial

El grfico muestra la evolucin de la serie temporal del nmero de ocupados en la indus-


tria del conocimiento en el rea metropolitana de Valencia por trimestres y la tendencia
evaluada mediante alisado exponencial con constante de alisado igual a 0,5.

4)Mtodosanalticos. La tendencia se formula mediante una funcin mate-


mtica que expresa el valor de la serie en funcin del tiempo. Naturalmente,
distintas funciones generan distintas evaluaciones de la componente tenden-
FUOC PID_00173351 31 Estadstica aplicada a la investigacin en cultura

cial. Se supone que la serie temporal consta de ciclotendencia, componente


estacional y componente irregular y que existe una relacin de dependencia
unilateral que puede ser explicitada como:

Yt = Tt + St + It = f(t) + et

La funcin f(t) se elige de manera que se ajuste o describa lo mejor posible la


tendencia Tt de la serie observada. Las funciones ms utilizadas son las lineales,
las parablicas y las exponenciales. Seleccionado el tipo de funcin a utilizar
(seleccionado a partir de la inspeccin visual del grfico de la serie), la curva
se ajusta a los datos (generalmente anualizados, porque se trata de evaluar
la direccin dominante de evolucin a largo plazo) por mnimos cuadrados
ordinarios. El valor de la tendencia en un momento del tiempo se identifica
con el valor de la funcin ajustada en ese momento.

Ejemplo de mtodo analtico

El grfico muestra la evolucin de la serie temporal del nmero de ocupados en la indus-


tria del conocimiento en el rea metropolitana de Valencia, expresada como promedio
anual, y la lnea de tendencia evaluada mediante regresin lineal minimocuadrtica.

Los mtodos analticos de estimacin de la tendencia permiten elaborar pre-


dicciones para el valor de la tendencia extrapolando la funcin f(t) para va-
lores de t correspondientes a perodos futuros de tiempo. El grado de ajuste
de la funcin y la estabilidad temporal de la relacin determinan, a priori, la
calidad de las predicciones obtenidas.
FUOC PID_00173351 32 Estadstica aplicada a la investigacin en cultura

3.3. Evaluacin de la estacionalidad. Desestacionalizacin de


series

La componente estacional est integrada por las oscilaciones a corto plazo, con
perodo ms o menos regular y de duracin inferior al ao natural. Evidente-
mente, solo tiene sentido hablar de estacionalidad en series con periodicidad
semestral, cuatrimestral, trimestral, mensual, semanal o diaria.

Hay diversas tcnicas que permiten evaluar las pautas de regularidad que pre-
senta la componente estacional en una serie observada. Prcticamente, todas
ellas tienen la misma filosofa: la componente estacional aparece al eliminar
del valor observado de la serie el resto de componentes.

Si el esquema de integracin es multiplicativo, la componente estacio-


nal se identifica dividiendo el valor observado de la serie entre el corres-
pondiente valor del componente ciclotendencia:

St = (Yt It) / Tt

Si el esquema de integracin es aditivo, la componente estacional es


evaluada por diferencia:

St = Yt (Tt + It)

Por esta razn, la evaluacin de la componente estacional depende de cul sea


el esquema de integracin que se haya supuesto y del mtodo empleado para
extraer la componente tendencia o ciclotendencia.

Tambin hay que tener en cuenta si se considera que la pauta estacional es es-
table o es, por el contrario, evolutiva. En el primer caso es factible la construc-
cin de ndices de variacin estacional (esquema multiplicativo) o de efectos
estacionales (esquema aditivo). En el segundo, la evaluacin de la estacionali-
dad se realiza mediante funciones analticas que tratan de captar las pautas de
evolucin de la influencia estacional sobre el valor de la serie.

La desestacionalizacin consiste en descontar el efecto estacional de los valores


observados de la serie temporal. Una vez evaluada la componente estacional,
para eliminarla es necesario considerar el esquema de integracin que se ha
aceptado para la serie temporal.
FUOC PID_00173351 33 Estadstica aplicada a la investigacin en cultura

Bajo esquema multiplicativo, el influjo de la variacin estacional sobre


el valor observado de la serie temporal se elimina por cociente:

Serie desestacionalizada = Yt/St = Tt + It

Bajo esquema aditivo, la componente estacional se descuenta por dife-


rencia:

Serie desestacionalizada = Yt St = Tt + It

En ambos casos, la serie, una vez desestacionalizada, contiene solamente la


tendencia o ciclotendencia adems de las variaciones irregulares de la magni-
tud original, habiendo sido eliminados los movimientos recurrentes de perio-
dicidad inferior al ao.
FUOC PID_00173351 34 Estadstica aplicada a la investigacin en cultura

4. Los indicadores culturales y la evaluacin de las


polticas

El reconocimiento de la cultura como factor clave de desarrollo econmico,


social y territorial se ha plasmado, en los ltimos tiempos, en un creciente
compromiso de las instituciones por la incorporacin de la cultura como ins-
trumento de lucha contra la pobreza y la exclusin social. En este contexto, la
evaluacin se inserta en el marco terico del anlisis de las polticas pblicas
en la medida en que persigue producir informacin relevante para la toma
de decisiones poltico-administrativas, es decir, informacin til que permita
resolver problemas concretos.

Un sistema de indicadores culturales (SIC) debera entenderse como la parte


del sistema general de informacin que proporciona informacin til, fiable,
consistente y apropiada sobre el sector de la cultura en sus diferentes mbitos
territoriales (local, estatal e internacional) para todos los agentes implicados
en ella. De esta manera, los SIC debemos integrarlos en un sistema complejo
de informacin-comunicacin que responda a la necesidad de contar con in-
formacin accesible pblicamente, sistematizada y generada de manera regu-
lar para, en primer lugar, elaborar los indicadores que nos permitan realizar
diagnsticos, en segundo lugar, evaluar las polticas culturales, y, finalmente,
orientar la toma de decisiones en el mbito de la cultura de los agentes tanto
pblicos como privados o del tercer sector.

Sin embargo, la falta de informacin en el mbito de la cultura dificulta la con-


secucin de los objetivos planteados, la evaluacin pormenorizada del funcio-
namiento del sector y la actuacin de los agentes que lo componen. Uno de
los principales problemas es la adecuacin de la informacin existente y su
transformacin en datos analizables. Existe mucha informacin en el entorno
cultural, pero la mayor parte de ella no es exportable a datos ni susceptible,
en consecuencia, de convertirse en indicadores vlidos. La confeccin de los
indicadores culturales pasa por disponer de una gran cantidad de datos vlidos
que, bajo una estructura piramidal, permitan formular, a travs de su anlisis,
los pertinentes indicadores operativos, de gestin y estratgicos para la des-
cripcin y el seguimiento de la realidad cultural, as como para la evaluacin
de los procesos de gestin cultural llevados a trmino por agentes pblicos o
privados.
FUOC PID_00173351 35 Estadstica aplicada a la investigacin en cultura

4.1. Qu es un indicador

Un indicador es la manifestacin generalmente numrica del anlisis de


un proceso de identificacin y medicin de una informacin del sector
a travs de un algoritmo ms o menos sofisticado, que facilita el acceso
de la informacin a diferentes grupos de usuarios, permitiendo trans-
formar la informacin en accin.

Por otra parte, como sealan J. M. Miguel y E. Sevilla-Guzmn (1973), un in-


dicador es la conversin de una variable terica obtenida tras la observacin
de un fenmeno en una variable prctica tras aplicar mediciones empricas.
Para Gallopin (1996), los indicadores son representaciones operativas de un
atributo de un sistema, las cuales se definen en trminos de un procedimiento
de medida u observacin determinado. Un indicador es sinnimo de indicio,
de evocacin, de signo, o sea, deber reflejar adecuadamente la naturaleza, pe-
culiaridades y nexos de los procesos que se originan en una actividad cultural.

La distincin entre indicador y dato estadstico estriba en que el indica-


dor tiene siempre un referente, desde un marco conceptual a una pol-
tica cultural que se desea medir, y un significado que constata hechos,
comportamientos y formas de vida pasadas y presentes.

Ejemplo

As, la variable "nmero de edificios catalogados de inters cultural" se convierte en dato


y, a la vez, en un indicador directo que evoca determinados comportamientos culturales
y sociales en un mbito espacial y temporal.

Las funciones bsicas de un indicador son simplificacin, cuantificacin y co-


municacin. Los indicadores deben reducir la dimensionalidad observada, me-
dir cuantitativamente el fenmeno observado y, por ultimo, transmitir la in-
formacin referente al objeto de estudio (OCDE, 1997).

Existen muchos mtodos mediante los cuales podemos obtener los datos ne-
cesarios:

Primero, podemos buscar datos ya recogidos o publicados por fuentes


gubernamentales, institucionales, empresariales o individuales, haciendo
distincin entre la recogida de datos primarios y su compilacin en tablas
que dan lugar a los datos secundarios. Por ejemplo, el nmero de entradas
vendidas para la audicin de un concierto de msica clsica, el importe de
las inversiones en equipamientos culturales en un determinado territorio
o el nmero de galeras de arte, etc.

En segundo lugar, podemos disear experimentos para obtener los datos


necesarios. Por ejemplo, un estudio para probar la eficacia de una deter-
FUOC PID_00173351 36 Estadstica aplicada a la investigacin en cultura

minada poltica de promocin cultural basada en el control de los agentes


implicados.

En tercer lugar, podemos hacer observaciones de comportamientos, actitu-


des u opiniones de los individuos implicados por medio de diferentes tc-
nicas, como las dinmicas de grupo, la lluvia de ideas o el mtodo Delphi.

Finalmente, podemos obtener datos mediante encuestas.

Ejemplos de indicadores

Existen diversos tipos de indicadores. Por ejemplo, indicadores bsicos de oferta, de de-
manda o de empleo que nos describan informacin bsica cuantitativa sobre determi-
nados sectores o subsectores culturales. Indicadores de evaluacin del desempeo como
herramientas que proporcionan informacin cuantitativa respecto al logro, resultado o
grado de cumplimiento de las acciones pblicas. En este caso, los indicadores de gestin
representan instrumentos para medir la eficiencia y la efectividad en el sector cultural.
Los indicadores estratgicos tienen como fin desarrollar estrategias que hagan ms efi-
cientes las acciones pblicas para que ayuden al cumplimento de los objetivos planteados
y permitan medir el impacto de las polticas propuestas.

4.2. Las tcnicas de elaboracin de indicadores

Para llevar a trmino la elaboracin de los indicadores debemos utilizar la es-


tadstica como herramienta. As, el panorama metodolgico existente abarca
diferentes procesos para su clculo, desde el ms simple e intuitivo al ms
complejo. Una clasificacin de estas tcnicas podra ser la siguiente:
FUOC PID_00173351 37 Estadstica aplicada a la investigacin en cultura

1)Valorabsoluto. Es el valor numrico representado matemticamente por Sumatorio


una magnitud Xt, donde el subndice expresa el momento en el tiempo en el
Una variante del valor absoluto
que se recoge la informacin. Representa un valor numrico procedente de sera el obtenido mediante la
utilizacin del sumatorio. Por
una variable cuantitativa. ejemplo, recaudacin total por
visitantes de los museos en el
momento t. Tomando la agre-
Ejemplo de valor absoluto gacin de la clasificacin de
museos existentes (i).
Un ejemplo de valor absoluto es el nmero de visitantes a los museos etnogrficos en
el tercer trimestre del ao.

2)Razn. Es uno de los indicadores ms utilizados. Es el cociente entre dos


cantidades cualesquiera. Podemos distinguir dos tipos de razones:

a)Proporcin. Es un tipo particular de razn: el cociente entre un sumando


cualquiera y la suma total. Por ejemplo, la proporcin de conciertos de msica
clsica celebrados segn provincia o territorio respecto al total nacional.

b)Porcentaje. Si la proporcin se multiplica por cien se denomina porcentaje.

Un indicador muy utilizado es la razn entre una caracterstica (valor absolu-


to) y el total de poblacin del territorio. Esta razn nos permite obtener un
indicador relativo independiente del nivel poblacional (P) o la dimensin en-
tre dos territorios a analizar. Por ejemplo, el equipamiento medio de las infra-
estructuras culturales (i) por cada 10.000 habitantes en el momento t.

Ejemplo de razn

Un ejemplo de razn podra ser la presin sobre el patrimonio cultural: nmero de turistas
(Xt) que visitan diariamente el conjunto de bienes patrimoniales (N) de un territorio,
considerando unidad o bien patrimonial la especificada por el gobierno local.

3) Estadsticos descriptivos. Proporcionan valores absolutos (magnitudes)


que representan caractersticas de una variable. Los ms empleados son las me-
didas de posicin (media, mediana, moda) y las medidas de dispersin (cuan-
tiles, varianza, desviaciones, coeficientes de variacin, etc.).

Ejemplo de estadstico descriptivo

Un caso de estadstico descriptivo es el precio medio de la entrada para un teatro de la


pera. En este caso deberamos obtener la media ponderada basndonos en el precio (Xp)
y el nmero de butacas (Xq) para cada una de las zonas (i) en que est dividida la sala del
teatro. El resultado tendr como unidad de medida el precio.

4)Tasadevariacin. Es una herramienta que permite la comparacin de una


magnitud en dos perodos de tiempo. La tasa de variacin es absoluta (VA) si
pretende analizar la variacin que sufre la variable X en el perodo de tiempo
t (Xt) respecto al perodo anterior (Xt 1).
FUOC PID_00173351 38 Estadstica aplicada a la investigacin en cultura

La tasa de variacin absoluta depende de las unidades de medida de la variable Algunas tasas de variacin
o serie. Si disponemos de series de datos, la tasa de variacin absoluta positiva
Un ejemplo de tasa de varia-
o negativa permite vislumbrar la tendencia en el perodo analizado. cin es la variacin en trmi-
nos absolutos del precio medio
de las entradas para un teatro
El inconveniente ms importante que representa la variacin absoluta es la de la pera (la magnitud base
se ha calculado por medio del
dimensionalidad. Ello se resuelve con la incorporacin de la relatividad a par- estadstico: media ponderada).
Otro ejemplo sera la tasa de
tir del cociente o razn para obtener lo que denominamos tasa de variacin variacin absoluta del nme-
relativa, que podremos expresar en proporcin o porcentaje y donde el pero- ro de pelculas exhibidas en las
salas de cine entre dos aos
do de anlisis nos permitir mostrar la tasa como interanual o intertrimestral. consecutivos.
Es el caso, por ejemplo, de la tasa de variacin interanual del presupuesto en
cultura.
Ved tambin

5)ndices. Es una medida estadstica que sirve para comparar una magnitud Los ndices se tratan en el
apartado 2 de este mdulo.
en dos situaciones, una de las cuales se toma como referencia. Podemos dis-
tinguir entre:

a)ndicessimples. Son los que se refieren a una nica magnitud. Por tanto,
miden la variacin en tanto por uno entre el dato de referencia o base y el
dato actual. Suelen utilizarse, cuando disponemos de una serie de datos a lo
largo del tiempo, con la intencin de estudiar la variacin de magnitudes ge-
neralmente relacionadas con el precio, la cantidad o el valor.

Ejemplo de ndice simple

El ndice de inversin en miles de dlares en equipamientos culturales tomando como


referencia el ao es un ejemplo.

b) ndices complejos. Estos ndices estn ms vinculados al estudio de las ndice de Bradstreet-Dtot
variaciones de magnitudes que representan grupos de bienes o servicios. Su
Existen otros tipos de ndices
confeccin se realiza mediante la utilizacin de operadores estadsticos como en los que se utiliza la media
la media (en todas sus variantes), por ejemplo, un ndice complejo sobre la agregativa. El ndice de Brads-
treet-Dtot se define como el
oferta cultural en las artes escnicas. Este indicador reflejara (en funcin de cociente entre la media arit-
mtica de los valores de las
la definicin operacional de sus componentes) la variacin de la oferta media magnitudes simples en el pe-
rodo t y la media aritmtica
del nmero de funciones en teatro, danza y lrica. Para su obtencin habra de dichos valores en el perodo
que obtener los ndices simples de los tres subsectores, donde cada subsector base.

i tendra un ndice simple.

6)Indicadoressintticos. Son un algoritmo asociado a una macromagnitud


fundamentada tericamente. Su elaboracin se basa en la seleccin de un con-
junto de indicadores bsicos (parciales) representativos de la macromagnitud
elegida. Por ejemplo, el ndice de desarrollo humano (IDH) elaborado por el
PNUD de la ONU.

Podemos distinguir tres tcnicas:

a) Coeficiente de correlacin, regresin.


b) Regresin mltiple.
c) Tcnicas factoriales multivariantes.
FUOC PID_00173351 39 Estadstica aplicada a la investigacin en cultura

La metodologa de su clculo se basa en el anlisis de las correlaciones exis-


tentes entre los indicadores parciales o en metodologas centradas en la regre-
sin mltiple y en modelos economtricos. Los tres mtodos ms utilizados
para su construccin son el anlisis de componentes principales, el anlisis
de la distancia y la agregacin de conjuntos difusos. El objetivo principal, co-
mo aparece en los textos clsicos de anlisis multivariante, es la obtencin de
una nueva variable sinttica como combinacin de un conjunto de variables.
Se persigue el conocimiento colectivo del conjunto de esas variables interre-
lacionadas. Su interpretacin es difcil y est vinculada a la interpretacin y
definicin del valor terico de la macromagnitud (variable sinttica).

Para buscar la idoneidad de cada uno de los indicadores/variables que consti-


tuyen el sistema se debe contemplar si cumplen o no determinadas caracters-
ticas, requisitos y criterios, como son:

Relevancia. Deben tener la capacidad de representar y captar aspectos cua-


litativos o cuantitativos de las realidades que pretenden medir o sistema-
tizar, llegando a expresar lo que se busca medir.

Utilidad. Que posibiliten el diagnstico del estado de las polticas cultura-


les, su demanda y su impacto social, previendo escenarios futuros y con-
tribuyendo a la formulacin y diseo de estrategias para el desarrollo cul-
tural.

Eficiencia. Deben optimizar los recursos disponibles para obtener los ob-
jetivos planteados teniendo en cuenta el principio del coste econmico.
Es decir, debe existir una proporcionalidad de los costos incurridos entre
la medicin de una caracterstica o variable observada sobre un fenmeno
y los beneficios provenientes de la relevancia y utilidad de los datos y, en
consecuencia, de la informacin obtenida.

Precisin. Deben medir y reflejar fielmente la magnitud que queremos


analizar, para lo cual debe existir una buena definicin operacional. Es
decir, buena definicin de la caracterstica observada en el fenmeno, de
las unidades de escala de medicin, nmero y seleccin de las muestras,
clculo de las estimaciones, errores permisibles, etc.

Perdurabilidad. Que perduren, subsistan a lo largo del tiempo. Para poder


proyectar o predecir, se necesitan al menos tres mediciones consecutivas
(una cada ao, durante un perodo de tres aos seguidos).

Periodicidad. Deben realizarse con periodicidad sistemtica, fijando la fre-


cuencia de recogida de la informacin.

Fiabilidad. Sensibles al cambio. Cualquier cambio en los indicadores de-


ber reflejar un cambio en sus componentes y, en consecuencia, una va-
FUOC PID_00173351 40 Estadstica aplicada a la investigacin en cultura

riacin en el comportamiento del fenmeno observado del que se ha rea-


lizado la medicin.

Compatibilidad. Deben ser compatibles con otros indicadores en mbitos


tanto espaciales como temporales, as como sobre la unidad de producto o
servicio, del costo, etc. La homogeneidad del indicador permitir la com-
paracin y la interpretacin de los posibles cambios de situacin produ-
cidos. Lo que implica la armonizacin de los componentes del indicador
e incluso del algoritmo. Comparando el mismo indicador para el mismo
grupo en varios momentos se podr evaluar la evolucin producida.

Comprensibilidad. Deben estar presentados de manera clara, fcilmente


inteligible e interpretable. Los indicadores deben ser transparentes e inte-
ligibles para quienes hayan de usarlos y, adicionalmente, para los no es-
pecialistas. Lo que no significa que las tcnicas de elaboracin tengan que
ser necesariamente simples.

Oportunidad. Deben construirse en el momento oportuno dependiendo


del tipo de indicadores de que se trate y de la necesidad de su uso.

En la tabla siguiente podemos encontrar una ficha que sintetiza los atributos
que cabe destacar de un indicador.

Denominacindelindicador: equipamiento medio de las infraestructuras culturales por cada 10.000 habitantes

Componentes: Unidaddemedida: n. de espa- Fuente: Descripcin: Nmero de espacios


Xi cios Consejera de Cultura culturales del grupo i

P habitantes Censo de poblacin del Poblacin total de habitantes


INE

Tipodeindicador: Grado: bsico


indicador de equipamiento

Funcindelindicador: permite observar las dotaciones de infraestructuras culturales en un mbito territorial especfico (local, nacio-
nal, etc.) y realizar comparaciones entre diferentes momentos del tiempo y en mbito territoriales diferentes.

Periodicidad: anual Procedimiento: recogida de las fuentes de informacin el lti-


mo trimestre de cada ao, con la ltima actualizacin del pa-
drn de habitantes que se realiza anualmente.

Frmula:

1.6

Metodologa: la variable nmero de espacios culturales por grupo implica una catalogacin de los grupos de equipamientos (i). Por
ejemplo:
1) nmero de espacios de formacin,
2) nmero de espacios escnicos,
3) nmero de espacios expositivos,
4) nmero de espacios de convivencia e intercambio cultural,
5) nmero de recursos patrimoniales.
(i = 1...5)
FUOC PID_00173351 41 Estadstica aplicada a la investigacin en cultura

Unidaddemedidadelindicador: espacios por cada 10.000 habs.

Evaluacin: Datoestndar: Meta:


datoreal:

En los siguientes subapartados presentamos en sntesis dos sistemas de eva-


luacin de polticas culturales basados en la utilizacin de indicadores: el sis-
tema de indicadores culturales locales auspiciado por la Federacin Espaola
de Municipios y Provincias (FEMP) y la evaluacin de la cooperacin cultural
espaola al desarrollo, auspiciado por la Agencia Espaola de Cooperacin In-
ternacional para el Desarrollo.

4.3. Ejemplo: El sistema de indicadores culturales de la FEMP

El sistema de indicadores para la evaluacin de las polticas culturales locales


(SICLO) se construye a partir del documento de la FEMP titulado Gua para la
autoevaluacin de las polticas culturales locales, que fue elaborado por el grupo
de trabajo de la Comisin de Cultura de la Federacin Espaola de Municipios
y Provincias en el marco de la Agenda 21 de la cultura. Dicho documento in-
cluye la motivacin, los objetivos, el diseo y los contenidos que se propusie-
ron inicialmente para el sistema. La propuesta planteada contiene numerosos
elementos encaminados a impulsar el avance hacia el logro de ciertos obje-
tivos generales que se contemplan en la motivacin y diseo del SICLO. Se
trata, en este sentido, de una propuesta slidamente fundamentada y con un
elevado potencial, puesto que el sistema de indicadores que esboza responde
con amplitud al objetivo genrico de construir una primera base lgica y me-
todolgica para la orientacin, reflexin y mejora de la realidad cultural local
mediante las polticas culturales de los gobiernos locales.

La gua se ha desarrollado, como todo trabajo de investigacin, a partir de una


reflexin profunda sobre sus objetivos y una revisin de la literatura que ha
permitido centrar las teoras y marcos contextuales sobre los que gravitar la
estructura metodolgica del presente trabajo. En este sentido, encontramos
que hubiera sido interesante partir, sobre todo, del marco base de las estads-
ticas culturales de la UNESCO y del informe del Leadership Group on Cultural
Statistics de 2002. En nuestra opinin, esta visin hubiera resuelto los proble-
mas mencionados en la gua sobre cmo determinar los mbitos, categorizar
los sectores y estructurar las funciones del sector cultural; sin embargo, se opta
por adaptar al mbito local esa categorizacin a partir del Study on the economy
of Culture in Europe, preparado por la Comisin Europea de Cultura, que realiza
una aproximacin a los informes mencionados.

La gua concreta el enfoque emprico en funcin de la naturaleza, propsito


y objetivos que se persiguen hacia un sistema de indicadores contextualizado
en la Agenda 21 de la cultura. El esfuerzo intelectual de adaptar esta visin
terica a la gestin y la prctica cultural desarrollada en los gobiernos locales
es, actualmente, una tarea en progreso. No obstante, el sistema de indicado-
FUOC PID_00173351 42 Estadstica aplicada a la investigacin en cultura

res delimita muy claramente cules son las reas que se reconocen como de
atencin prioritaria y contiene numerosos elementos pertinentes que, una vez
implementados, podrn favorecer la reflexin y el debate sobre el volumen y
la calidad de la informacin cultural con que cuentan los gobiernos locales
para hacer frente a los retos actuales y futuros de su desempeo. El debate
debe formularse tambin en cuanto a la oportunidad o necesidad de asignar
los recursos humanos y materiales necesarios para organizar y mantener un
sistema amplio de recopilacin de informacin que permita construir los ins-
trumentos imprescindibles con el fin de evaluar, en ltimo trmino, la efecti-
vidad de acciones culturales especficas con relacin a sus propios objetivos
y poner de manifiesto las exigencias de mejora en el diseo y aplicacin de
las polticas culturales locales. En este contexto, la Agenda 21 de la cultura
expresa una serie de compromisos consensuados y priorizados por las ciuda-
des y los gobiernos locales y representa, por tanto, una declaracin de los de-
rechos culturales de los ciudadanos en el mbito local. En consecuencia, las
reas de cultura de los gobiernos locales deben considerarla como orientacin
de sus polticas, programas y acciones culturales, puesto que la Agenda 21 de
la cultura delimita las reas prioritarias sobre las que centrar la propuesta del
sistema de indicadores. La propuesta contempla una seleccin de temas que
aspira a incluir los aspectos ms relevantes de la Agenda 21 de la cultura desde
el punto de vista de las polticas culturales locales:

a) y b)Laculturacomofactordedesarrolloeconmico,socialyurbano/te-
rritorial. La cultura como factor de desarrollo, en el sentido ms amplio del
trmino, es la cuestin central que genricamente origina y articula el siste-
ma de indicadores propuesto y hacia la que se orientan los restantes mbitos
temticos considerados. El valor social de la actividad cultural responde a su
funcin como elemento de promocin del desarrollo social y econmico de
las sociedades y, especialmente en su vertiente local, tambin del desarrollo
territorial. Segn la propuesta, el SICLO aspira a proporcionar informacin so-
bre la trayectoria pasada, situacin presente y evolucin previsible de la con-
tribucin de la cultura al desarrollo econmico, social y urbano/territorial en
el mbito local. Al mismo tiempo, se considera relevante definir y cuantificar,
en su caso, cules son los rendimientos, en trminos de desarrollo del tejido
cultural local, que se derivan de la inversin en cultura, puesto que dichos
rendimientos garantizarn la sostenibilidad futura del propio sistema cultural
local.

c)Transversalidaddelacultura. La percepcin de que la cultura influye en


otras polticas locales no relacionadas directamente con la poltica cultural se
ha afianzado en el entorno local, debido, fundamentalmente, a la implanta-
cin de frmulas de desarrollo local sostenible, a la importancia estratgica del
cambio cultural y a la consideracin de la cultura como instrumento para la
proyeccin exterior de los territorios, instituciones y organizaciones. El SICLO
pretende extraer y recopilar informacin sobre la transversalidad de la cultura
desde diversas perspectivas y en distintos mbitos. Se aspira a cuantificar la
presencia de la cultura en el discurso global de la entidad local, en sus polticas
FUOC PID_00173351 43 Estadstica aplicada a la investigacin en cultura

estructurales (social, econmica y urbanstica) y en ciertas reas afines (mujer,


juventud, participacin ciudadana, deportes, turismo) considerando, simult-
neamente, los niveles de transversalidad conceptual, de gestin y organizativa.

d)Accesoalacultura. El SICLO pretende aportar informacin sobre el volu-


men y la naturaleza de las intervenciones encaminadas a favorecer la equidad
en el acceso a la oferta cultural pblica por parte de todos los ciudadanos y,
particularmente, sobre el grado de efectividad de dichas intervenciones. En es-
te sentido, se propone evaluar el alcance de las polticas en trminos del grado
de desactivacin o reduccin de las barreras, sean estas de ndole pecuniaria,
de informacin, de socializacin, psicolgica, fsica, cronolgica, de confort o
de ausencia de predisposicin al hecho cultural, que puedan dificultar el ac-
ceso de la ciudadana a la oferta cultural local.

e)Culturayparticipacinciudadana. Este mbito est estrechamente rela-


cionado con el anterior, en el sentido de que las condiciones de accesibilidad
delimitan, a su vez, las posibilidades de participacin de los ciudadanos en
dos dimensiones principales, como usuarios de servicios culturales locales y
como configuradores de la oferta cultural local. El SICLO aspira a proporcionar
orientacin e informacin sobre el grado de aplicacin y, en especial, sobre
la efectividad de las acciones de los gobiernos locales dirigidas a incorporar al
mayor nmero posible de personas a la vida cultural local en las dos vertientes
anteriormente enunciadas. Para ello, se pretende evaluar la situacin actual y
la evolucin futura tanto de los niveles de utilizacin de los servicios culturales
y de asistencia a las actividades culturales como, especialmente, de la implica-
cin y participacin activa de los ciudadanos, individual o colectivamente, en
la definicin, configuracin y gestin de la actividad cultural local.

f)Memoria,innovacineidentidad. Este mbito temtico considera, en un


contexto crecientemente globalizado, las relaciones entre la memoria colecti-
va local y la creacin contempornea en el proceso de construccin dinmica
de la identidad local. Concretamente, el SICLO se orienta hacia el anlisis y
la obtencin de informacin sobre la situacin del patrimonio cultural, tan-
to en sus aspectos tangibles como intangibles, entendido como la concrecin
del proceso de recuperacin y proyeccin de la memoria colectiva. De forma
anloga, el SICLO tambin se propone recabar informacin para el anlisis de
la vitalidad de la creacin cultural endgena y su difusin, puesto que se trata
de un elemento clave que interviene en la construccin de la identidad local.

As, la Gua para la autoevaluacin de las polticas culturales locales establece que
el sistema de indicadores ha sido concebido como un instrumento prctico,
manejable y selectivo, elaborado especficamente para los gobiernos locales y
dirigido prioritariamente a los responsables y tcnicos de sus respectivas reas
de cultura, quienes deben ser los agentes principales tanto en su implementa-
cin como en la interpretacin y utilizacin que, en el futuro, se pueda hacer
de la informacin proporcionada por el sistema.
FUOC PID_00173351 44 Estadstica aplicada a la investigacin en cultura

Una caracterstica sobresaliente de la gua es el planteamiento de una catego-


rizacin previa de los indicadores en funcin del criterio de esfuerzo necesario
para la obtencin de cada uno de ellos con relacin al rendimiento o utilidad
que, previsiblemente, puede llegar a proporcionar. As, los indicadores, tanto
los de naturaleza cualitativa como los cuantitativos, aparecen clasificados en
tres niveles:

Nivel I: bsico.
Nivel II: avanzado.
Nivel III: ptimo.

Esta categorizacin resulta de gran ayuda en la tarea, todava en curso, de vol-


car el sistema de indicadores esbozado en diversos instrumentos tangibles, co-
mo cuestionarios, plantillas, hojas de clculo, recursos web, etc., que permi-
tan iniciar efectivamente las funciones de recopilacin de informacin sobre
la realidad cultural local y sobre el influjo que ejercen en ella las polticas cul-
turales locales. La informacin emergente del SICLO resultar efectiva en la
medida en que el marco conceptual que da origen a la propuesta sea efecti-
vamente comprendido, compartido y asumido como propio por los responsa-
bles de las polticas culturales locales en sus respectivos mbitos de actividad
y en la medida en que la filosofa inspiradora de dicho marco pueda reflejarse
fielmente en los instrumentos operativos que habr que construir, someter a
contraste y verificar antes de proceder a la recopilacin sistemtica de infor-
macin mediante la utilizacin del SICLO.

La gua explicita en su introduccin que el conjunto de indicadores resultan-


tes es un primer paso dentro del proceso que conducir a cumplir con los ob-
jetivos; que no ha sido preparado para su aplicacin inmediata sobre todas
las entidades pblicas locales, sino que ser necesario emprender protocolos
de diseo, testado, reformulacin y contraste, as como elaborar sistemas de
monitorizacin, protocolos informticos de recogida de datos y una gua prc-
tica de implementacin que facilite la formacin del personal encargado de
aplicar, mantener y utilizar el sistema. Todas estas tareas debern ser aborda-
das antes de que el instrumento propuesto pueda ser aplicado con carcter
universal y continuado en las diversas entidades pblicas locales con ciertas
garantas de que la informacin que proporciona resulte verdaderamente va-
liosa, y potencialmente til, para los responsables de los gobiernos locales y
para la sociedad en general.

Algunos indicadores incluidos en SICLO-FEMP

CuestionariocualitativoparaelmbitotemticoA"Laculturacomofactordedesa-
rrollosocial,econmicoyterritorial"

AQ1. Se reconoce expresamente en el gobierno local el potencial de contribucin de la


cultura a los objetivos de las polticas locales de desarrollo

a) social ( )
b) econmico ( )
c) urbano/territorial ( )
FUOC PID_00173351 45 Estadstica aplicada a la investigacin en cultura

Valorar desde 1 (ausencia total de reconocimiento) hasta 5 (existencia de una estrategia


coordinada)

AQ2. Se plantean explcitamente objetivos de carcter cultural en las polticas locales

a) social ( )
b) econmico ( )
c) urbano/territorial ( )

Valorar desde 1 (ausencia total de objetivos) hasta 5 (amplia multiplicidad de objetivos)

AQ3. Las polticas culturales del gobierno local se dirigen expresamente a lograr objetivos
de desarrollo

a) social ( )
b) econmico ( )
c) urbano/territorial ( )

Valorar desde 1 (ausencia total de objetivos) hasta 5 (amplia multiplicidad de objetivos)

AQ4. En qu medida se considera como objetivo explcito de la poltica cultural local

a) El desarrollo productivo y econmico local ( )


b) La creacin de empleo local partir de iniciativas culturales ( )
c) La sensibilizacin de la sociedad hacia ciertos problemas sociales ( )
d) La integracin de diversos grupos sociales en la vida cultural local ( )
e) La generacin de nueva(s) centralidad(es) ( )
f) La significacin del espacio pblico como espacio "de todos" ( )
g) La regeneracin de zonas urbanas deprimidas ( )
h) La construccin de la identidad y sentido de pertenencia ( )
i) La proyeccin exterior de la ciudad ( )

Valorar cada tem desde 1 (muy poco) hasta 5 (en gran medida)

CuestionariocuantitativoparaelmbitotemticoB"Laculturacomofactordedesa-
rrollodeltejidoculturallocal"

BN1. Nmero de empresas ligadas a la conservacin, formacin, creacin, produc-


cin/prestacin, distribucin/comercializacin, difusin/comunicacin, consultora y
gestin de bienes o servicios culturales radicados en el mbito local.

BN2. Nmero de profesionales ligados a la conservacin, formacin, creacin, produc-


cin/prestacin, distribucin/comercializacin, difusin/comunicacin, consultora y de
bienes o servicios culturales radicados en el mbito local.

BN3. Nmero de establecimientos comerciales de bienes culturales (libro, disco, vdeo,


arte, antigedades, artesana, etc.) contabilizados en el mbito local.

BN4. Nmero de personas empleadas en empresas y comercios culturales, as como pro-


fesionales independientes dedicados a la actividad cultural en el mbito local.

BN5. Nmero de personas que trabajan en la actividad cultural (programacin cultural,


difusin, equipamientos, etc.) por cuenta directa del gobierno local.

BN6. Presupuesto de gasto anual del gobierno local en cultura (programas y acciones
culturales, externalizacin de la gestin de servicios culturales, etc.).

BN7. Presupuesto de inversin anual del gobierno local en cultura (equipamientos e in-
fraestructuras culturales).

BN8. Presupuesto de gasto anual que el rea de cultura del gobierno local destina a pro-
gramas y medidas directas de apoyo o fomento del tejido cultural local.

BN9. Presupuesto de inversin anual que el rea de cultura del gobierno local destina a
medidas directas de apoyo o fomento del tejido cultural local.
FUOC PID_00173351 46 Estadstica aplicada a la investigacin en cultura

4.4. Ejemplo: La evaluacin de la cooperacin cultural espaola


al desarrollo

El actual III Plan Director de la Cooperacin Espaola (PD) apuesta por una
mayor coherencia de sus polticas sectoriales, la armonizacin entre pases so-
cios y el alineamiento con las polticas pblicas comprometidas en los proce-
sos de desarrollo. Su estrategia pretende conciliar, unir y aprovechar el poten-
cial de las sinergias de la cultura y la cooperacin con los objetivos de desarro-
llo. El PD y su estrategia sectorial en cultura y desarrollo como expresin de
poltica pblica requiere mecanismos de programacin, previsibilidad y medi-
cin del impacto de su poltica que permitan incorporar las lecciones apren-
didas para la toma de decisiones futuras. La estrategia de cultura y desarrollo
como documento de estrategia sectorial (DES) es el segundo nivel en el ciclo
de planificacin despus del PD y desarrolla conceptualmente las prioridades
del sector de cultura y desarrollo definidas en l. Los DES estn concebidos en
su elaboracin con una proyeccin a largo plazo con el fin de retroalimentar
los procesos de la estrategia sectorial y ofrecer orientaciones precisas y buenas
prcticas que permitan mejorar los objetivos de la cooperacin cultural.

La cooperacin espaola y su estrategia no estn exentas de operar con los ins-


trumentos que la sociedad civil utiliza en los mbitos econmicos y sociales.
Las estrategias tienen sus mecanismos, y la cooperacin se sirve de los mismos
para llegar a los objetivos planteados. Uno de esos mecanismos es el anlisis
del desempeo de la cooperacin. As lo refleja su estrategia, donde estable-
ce que los dos criterios principales que se persiguen a travs del seguimiento
y evaluacin del desempeo de la cooperacin es la bsqueda de coherencia
interna y externa. La coherencia interna se conceptualiza como la accin de
resolver la interrelacin existente entre un problema y su solucin. Por otra
parte, la coherencia externa indica la cohesin de la estrategia a evaluar con
otras polticas de pases socios, instituciones y organismos de mbito nacio-
nal e internacional con los que pueden tener sinergias o complementariedad
en sus polticas. La medicin de la coherencia interna y de la actuacin de
la cooperacin y la consecucin de los objetivos planificados son el objetivo
tcnico con respecto al cual se establecen los mecanismos de obtencin de las
variables que permitirn conformar un sistema de indicadores.

La aproximacin a la creacin de indicadores para la estrategia de cultura y


desarrollo se instrumenta en dos fases. En la primera se determinan los aspec-
tos metodolgicos y tcnicos que teorizan y consensan los resultados que
se obtendrn posteriormente. El objetivo prioritario en esta fase es mostrar la
lgica de la intervencin a partir de la confluencia de los modelos de evalua-
cin CIPP y la lgica vertical del instrumento del marco lgico. A partir de la
confluencia de ambos enfoques se genera un paralelismo de sus respectivos
elementos que conduce a clasificar las variables segn el nivel en que se siten
en el ciclo del proyecto. En la segunda fase se procede a construir un listado
de variables para cada una de las lneas estratgicas de cultura y desarrollo.
La metodologa utilizada a partir del axioma PD/DES trata de asignar a cada
FUOC PID_00173351 47 Estadstica aplicada a la investigacin en cultura

una de las actuaciones prioritarias por lnea estratgica los mecanismos de de-
teccin de las variables implicadas para la consecucin del objetivo especfi-
co esperado como resultado o propsito del proyecto. En esta segunda fase se
evidencia cmo, a partir del rbol de objetivos del DES y utilizando la lgica
vertical, se llega a obtener un listado de variables vinculadas a la estrategia del
desarrollo que permitir en el futuro profundizar en la obtencin de indica-
dores de seguimiento y evaluacin del desempeo.

Algunos indicadores incluidos en la evaluacin de la cooperacin cultural


espaola al desarrollo de AECID

Lnea estratgica 5: Patrimonio cultural

1) [Variacin porcentual del] Nmero de actores que participaron en las acciones enca-
minadas a apoyar las tareas de identificacin, inventariado y estudio de los elementos
patrimoniales, buscando el uso y los aportes econmicos, sociales y culturales que los
mismos puedan generar en las sociedades... realizadas en un ao, respecto de los que
participaron el ao anterior, por tipologa de agente.

2) [Variacin porcentual del] Presupuesto destinado a las acciones encaminadas a apo-


yar las tareas de identificacin, inventariado y estudio de los elementos patrimoniales,
buscando el uso y los aportes econmicos, sociales y culturales que los mismos puedan
generar en las sociedades... realizadas en un ao, respecto del destinado a las realizadas
el ao anterior, por tipologa de entidad financiera.

3) [Variacin porcentual del] Nmero de acciones encaminadas a apoyar las tareas de


identificacin, inventariado y estudio de los elementos patrimoniales, buscando el uso
y los aportes econmicos, sociales y culturales que los mismos puedan generar en las
sociedades... realizadas en un ao respecto de las del ao anterior, por categora de pas.

4) [Variacin porcentual del] Nmero de beneficiarios/as de las acciones encaminadas


a apoyar las tareas de identificacin, inventariado y estudio de los elementos patrimo-
niales, buscando el uso y los aportes econmicos, sociales y culturales que los mismos
puedan generar en las sociedades... realizadas en un ao, respecto de los/as habidos/as
el ao anterior, por categora de pas.

5) [Variacin porcentual del] Nmero de lugares de exhibicin y presentacin pblica de


elementos patrimoniales (museos, ecomuseos, itinerarios, etc.) existentes en un territorio
donde se han llevado a cabo acciones encaminadas a apoyar las tareas de identificacin,
inventariado y estudio de los elementos patrimoniales, buscando el uso y los aportes
econmicos, sociales y culturales que los mismos puedan generar en las sociedades, al
final del perodo de un plan director, respecto al perodo anterior.

6) [Variacin porcentual del] Nmero de referencias en Internet en buscadores de ele-


mentos patrimoniales de un territorio donde se han llevado a cabo acciones encamina-
das a apoyar las tareas de identificacin, inventariado y estudio de los elementos patri-
moniales, al final del perodo de un plan director, respecto al perodo anterior.

7) [Variacin porcentual del] Nmero de asociaciones o colectivos para la defensa, apoyo,


proteccin y puesta en valor del patrimonio local registrados en un territorio donde se
han llevado a cabo acciones encaminadas a apoyar las tareas de identificacin, inventa-
riado y estudio de los elementos patrimoniales, al final del perodo de un plan director,
respecto al perodo anterior.

8) [Variacin porcentual del] Nmero de instrumentos de reflexin, debate a travs de


Internet (pginas web, foros, blogs) en torno a temas relacionados con el patrimonio en
un territorio donde se hayan llevado a cabo acciones encaminadas a apoyar las tareas de
identificacin, inventariado y estudio de los elementos patrimoniales, al final del perodo
de un plan director, respecto al perodo anterior.

9) [Variacin porcentual del] Nmero de monumentos nacionales declarados por tipo y


categora (monumentos histricos, zonas tpicas, santuarios de la naturaleza, etc.).

10) [Variacin porcentual del] Nmero de solicitudes de declaracin de monumentos


nacionales recibidas, segn tipo de monumento.

11) [Variacin porcentual del] Nmero de zonas arqueolgicas.


FUOC PID_00173351 48 Estadstica aplicada a la investigacin en cultura

12) [Variacin porcentual del] Nmero de centros de desarrollo indgena.

13) [Variacin porcentual del] Nmero de iglesias.

14) [Variacin porcentual del] Nmero de monumentos histricos y federales.

15) [Variacin porcentual del] Nmero de museos segn tipo de coleccin.

16) [Variacin porcentual del] Nmero de exposiciones en museos, por tipo de museo,
segn tipo de exposicin.

17) [Variacin porcentual del] Nmero de actores que participaron en las acciones enca-
minadas a lograr una participacin directa de la ciudadana y las comunidades locales
en los programas de conservacin del patrimonio y la memoria colectiva, estableciendo
una lista de las mejores prcticas para las polticas de patrimonio realizadas en un ao,
respecto de los que participaron el ao anterior, por tipologa de agente.

18) [Variacin porcentual del] Presupuesto destinado a las acciones encaminadas a lograr
una participacin directa de la ciudadana y las comunidades locales en los programas
de conservacin del patrimonio y la memoria colectiva, estableciendo una lista de las
mejores prcticas para las polticas de patrimonio realizadas en un ao, respecto del des-
tinado a las realizadas el ao anterior, por tipologa de entidad financiera.

19) [Variacin porcentual del] Nmero de acciones encaminadas a lograr una participa-
cin directa de la ciudadana y las comunidades locales en los programas de conservacin
del patrimonio y la memoria colectiva, estableciendo una lista de las mejores prcticas
para las polticas de patrimonio, realizadas en un ao, respecto de las del ao anterior,
por categora de pas.

20) [Variacin porcentual del] Nmero de beneficiarios/as de las acciones encaminadas


a lograr una participacin directa de la ciudadana y las comunidades locales en los pro-
gramas de conservacin del patrimonio y la memoria colectiva, estableciendo una lista
de las mejores prcticas para las polticas de patrimonio, realizadas en un ao, respecto
de los/as habidos/as el ao anterior, por categora de pas.

4.5. Consideraciones finales

No cabe duda de que el seguimiento y evaluacin de las actividades y polticas


culturales es tarea compleja debido a razones diversas. En primer lugar, porque
se trata de cultura y, por tanto, de indicadores vinculados al sector cultural, lo
cual implica falta de informacin, falta de homogeneidad en la informacin
existente, falta de consenso en el procedimiento de obtencin de los datos y
procedimientos que conducen a metadatos que no permiten la comparacin
entre fenmenos observados y fomentan la dispersin terica en la construc-
cin de indicadores. En segundo lugar, aflora la dificultad de acceso a la infor-
macin. Los agentes implicados, ya sean gobiernos locales, como en el caso
del sistema de FEMP, ya pases socios, en el caso de AECID, encuentran grandes
dificultades para alcanzar mecanismos adecuados de obtencin de informa-
cin, lo que hace recomendable la utilizacin de registros administrativos co-
mo fuentes estadsticas de carcter prioritario. En tercer lugar, surgen dificul-
tades debidas a la propia dinmica compleja existente en los procesos de pla-
nificacin estratgica en materia de cultura y desarrollo. Sin embargo, el tra-
yecto ya est iniciado. Se ha procedido a justificar la lgica de las intervencio-
nes que vinculan los objetivos a las variables/indicadores de ambos proyectos.
Se han incorporado y justificado en cada caso los modelos de evaluacin que
mejor se aproximan a los modelos de produccin, se ha estructurado un mo-
delo metodolgico capaz de generar las variables vinculadas a las actuaciones
prioritarias de cada una de las lneas estratgicas de actuacin y se ha esbozado
la obtencin de variables efecto e impacto. Quedan pendientes la definicin
FUOC PID_00173351 49 Estadstica aplicada a la investigacin en cultura

de indicadores de evaluacin, los procedimientos de validacin estadstica y


la construccin de indicadores. Tambin quedan pendientes la reduccin del
nmero de indicadores, la construccin de indicadores compuestos y comple-
jos que disminuyan la dimensin de los fenmenos que se desea observar y la
conjuncin y cohesin de los indicadores en sendos sistemas de indicadores
de evaluacin para la toma de decisiones en las polticas pblicas.
FUOC PID_00173351 50 Estadstica aplicada a la investigacin en cultura

5. Clculos de probabilidad y modelos de inferencia


estadstica

5.1. Modelos de probabilidad. Prediccin de necesidades de


formacin en los gestores culturales

En el anlisis de los fenmenos socioculturales la labor del investigador es en Ved tambin


muchos casos la de obtener una serie de datos sobre una poblacin o universo.
El muestreo se estudia en el
Tales datos son la representacin de las mediciones de las caractersticas cuan- subapartado 5.2 de este m-
titativas o cualitativas de los individuos de dicha poblacin. En el caso de que dulo.

tengamos acceso a toda la poblacin, la estadstica descriptiva nos permitir


realizar todo el anlisis necesario de la realidad bajo escrutinio; sin embargo,
cuando por diversos motivos no podamos acceder a la totalidad de la pobla-
cin, sino solo a una parte de esta, deberemos recurrir a la metodologa del
muestreo. En este ltimo caso estaremos hablando de estadstica inferencial.

La estadstica inferencial permitir, a partir de una serie de supuestos sobre


la distribucin de probabilidad de la poblacin y de la recoleccin de datos
muestrales, la estimacin de los parmetros y caractersticas investigados (por
ejemplo, edad media de los visitantes a los museos, asistencia media al teatro,
variabilidad de la renta disponible de los lectores asiduos, etc.).

Ejemplo

La labor de gestin cultural se encuentra en una vorgine de cambio y continua transfor-


macin. Por consiguiente, las competencias, conocimientos y habilidades de los gestores
culturales deben estar tambin en continua actualizacin. De este modo, el anlisis de las
necesidades de formacin de los gestores culturales constituye una importante vertien-
te del anlisis sociocultural. Ahora bien, sera muy ardua la tarea de realizar tal anlisis
basndonos en los datos de todos los gestores culturales de un pas o regin, por lo que
tenemos que recurrir a la estadstica inferencial para, a partir del anlisis de una muestra
de gestores, extrapolar las conclusiones a todo el colectivo.

En primer lugar, necesitaremos definir el concepto de variable aleatoria.

Una variablealeatoria es una funcin matemtica que asigna un n-


mero real a cada resultado posible de un experimento aleatorio. Dicho
de otro modo, la variable aleatoria expresa las distintas representaciones
numricas que puede tomar una caracterstica poblacional, con una de-
terminada probabilidad de ocurrencia para cada resultado posible. Las
variables aleatorias pueden ser discretas (toman valores contables) o
continuas (pueden tomar cualquier valor en un intervalo real).
FUOC PID_00173351 51 Estadstica aplicada a la investigacin en cultura

Ejemplos de variables continua y discreta

En el anlisis de la formacin de los gestores culturales, la edad es una variable discreta (p.
ej., la probabilidad de que la edad del gestor sea de 37 aos es del 64%), mientras que su
renta disponible es una variable continua (p. ej., la probabilidad de que su renta disponi-
ble sea inferior a 30.000 /ao es del 87%). Por otra parte, ntese que si aceptamos edades
intermedias, p. ej., 37 aos y medio (37,5), la variable "edad" se considerara entonces
una variable continua; a su vez, si la variable "renta disponible" estuviese circunscrita a
niveles (p. ej., 10.000, 20.000, 30.000...), la estaramos considerando como discreta.

Suma de probabilidades
Cada variable aleatoria tendr un comportamiento definido por lo que
denominamos distribucindeprobabilidad: funcin matemtica que La suma de probabilidades es
1. Por ejemplo, S tiene una
nos permite calcular todos los pares resultado-probabilidad [f(xi) = P (X = probabilidad del 60%; No
tiene una probabilidad del
xi)] (p. ej., edad = 37 aos, probabilidad = 64%); toda probabilidad para 40%; el total es 60% + 40% =
100%).
cualquier resultado especfico tomar valores entre 0 y 1 (0% y 100%),
siendo la suma de todas las probabilidades de todos los resultados ex-
cluyentes igual a 1.

Ejemplo de funcin
Adems, para cada variable aleatoria tendremos tambin la funcinde de distribucin de
probabilidad
distribucin de probabilidad: funcin matemtica que nos permite
calcular la probabilidad acumulada hasta un valor determinado [F(a) Renta disponible = 30.000 /
ao, probabilidad acumulada
= P(X a)]; en las variables continuas, esta se denomina funcin de = 87%, es decir, la probabili-
densidad. dad de que la renta disponible
de un gestor cultural sea igual
o inferior a esta cantidad.

Finalmente, tenemos los dos parmetros ms notables de la distribucin: la


media y la varianza. La media, tambin denominada valor esperado, nos da
informacin sobre la tendencia central de los datos, resumiendo en un nico
valor representativo de la poblacin los posibles valores de la variable aleatoria
que pondera atendiendo a las correspondientes probabilidades de ocurrencia.

Media = E(X)

La varianza nos ofrece informacin sobre la dispersin de la poblacin en


torno a la media; este parmetro se mide en unidades diferentes de la media;
mientras que la primera se mide en las mismas unidades que la variable alea-
toria a la que se asocia (p. ej., la edad se mide en aos), la segunda se mide en
dichas unidades al cuadrado (p. ej., la varianza de la edad se mide en edad2,
esto es, edad al cuadrado). Para subsanar esta situacin, se suele calcular la raz
cuadrada de la varianza, obteniendo lo que denominamos desviacin tpica.

1.7
FUOC PID_00173351 52 Estadstica aplicada a la investigacin en cultura

Ejemplo

En un estudio sobre las necesidades formativas de los gestores culturales de la Regin de


Murcia, realizado por Rausell y otros (2009), la variable edad de los gestores culturales se
calcul como valor = 40,92 aos, con una dispersin de = 9,49 (y varianza 2 = 9,492
= 90,06); por tanto, la edad media de los gestores culturales de Murcia es de 41 aos,
encontrndose la mayora de ellos entre los 31 (40,92 9,49) y los 50 (40,92 + 9,49) aos.

De entre las diferentes distribuciones que la teora estadstica nos brinda, la


que mayor repercusin y uso tiene es la distribucin normal; se trata de una
distribucin de probabilidad continua a la que se ajustan muchas variables
aleatorias. A la representacin grfica de su funcin de densidad se la conoce
comnmente como campana de Gauss (grficamente, la probabilidad acumu-
lada en cada punto es el rea que queda por debajo de la curva).

Fuente: http://es.wikipedia.org/wiki/Archivo:Standard_deviation_diagram_%28decimal_comma%29.svg

Analticamente, representamos la distribucin normal mediante los dos par-


metros que la determinan, su media y su varianza.

X ~ N(, )

La distribucin normal presenta una serie de propiedades, como su simetra


respecto al punto medio, que coincide con la media; los puntos de inflexin
(cambios en la pendiente de la curva) coinciden en su parte anterior con el
resultado de restar la desviacin tpica a la media ( ), y en su parte posterior
con el de sumar dicha desviacin a la media ( + ). Entre estos dos puntos
se sita aproximadamente el 68,2% de la probabilidad, estando el 95,44% de
esta entre los puntos ( 2) y ( + 2).

Por otra parte, aunque hablemos de una distribucin normal, en realidad exis-
ten infinitas distribuciones, por lo que para simplificar el uso de la familia de
distribuciones normales se suele emplear la que denominamos distribucin
normal tipificada. La caracterstica de esta distribucin normal es que su me-
dia es 0 y su varianza, la unidad; podemos convertir cualquier distribucin
normal en una distribucin normal tipificada restndole a la variable aleatoria
normal su media y dividiendo el resultado por la desviacin tpica. De este
modo, analticamente:
FUOC PID_00173351 53 Estadstica aplicada a la investigacin en cultura

Z = (X )/ ~ N(0, 1)

Esta operacin nos ofrece la posibilidad de conocer y emplear una nica dis-
tribucin normal para realizar los clculos necesarios para determinar las pro-
babilidades asociadas a las ocurrencias de determinados eventos sobre las va-
riables aleatorias analizadas en nuestras investigaciones.

Ejemplo

La variable aleatoria "edad de los gestores culturales" sigue una distribucin normal de
media 41 y desviacin tpica 9 Edad~N(41,9); para simplificar los clculos de probabi-
lidad deberamos utilizar una distribucin normal tipificada (Edad 41)/9~N(0,1).

En la realizacin de los clculos de probabilidad en una distribucin normal


existe una expresin matemtica para la funcin de densidad; sin embargo,
esta no es operativa a nuestros efectos, por lo que en la prctica se utiliza una
tabla que proporciona para una variable aleatoria normal tipificada la proba-
bilidad acumulada asociada a que dicha variable tome un valor igual a un de-
terminado valor a (este valor es, en realidad, P(Xa)). A continuacin mostra-
mos el extracto de una tabla de probabilidades (en la fuente se puede acceder
a la tabla completa).

Z 0,00 1,00 2,00 3,00 4,00

0,00 0, 500 000 0, 841 344 0, 977 249 0, 998 650 0, 999 968

0,01 0, 503 989 0, 843 752 0, 977 784 0, 998 693 0, 999 969

0,02 0, 507 978 0, 846 135 0, 978 308 0, 998 736 0, 999 970

0,03 0, 511 966 0, 848 494 0, 978 821 0, 998 777 0, 999 972

0,04 0, 515 953 0, 850 830 0, 979 324 0, 998 817 0, 999 973

0,05 0, 519 938 0, 853 140 0, 979 817 0, 998 855 0, 999 974

... ... ... ... ... ...

Fuente: Wikibooks

Para utilizar la tabla hay que conocer las reglas de uso:

1) La tabla se emplea con variables tipificadas, por lo que previamente a su


uso deberemos tipificar la variable analizada.

2) El encabezado de columna de la tabla representa la parte entera del valor,


mientras que el encabezado de fila, la parte decimal. La casilla que une fila
y columna contiene el valor de la probabilidad acumulada para ese valor de-
terminado.
FUOC PID_00173351 54 Estadstica aplicada a la investigacin en cultura

3) La tabla solo muestra los valores positivos de la variable, para valores nega-
tivos deberemos obtener el valor para el mdulo (valor positivo) y restarlo a la
unidad. Esta operacin puede realizarse gracias a las propiedades de la funcin
de densidad y de la distribucin normal.

Actividad

A partir del estudio de Rausell y otros (2009) sabemos que los gestores culturales de Murcia
cursan anualmente en media 446,39 horas de formacin en reas vinculadas a la gestin
cultural, siendo la desviacin tpica de esta variable 559,49 horas. Suponiendo que la
variable "horas de formacin anual en gestin cultural" siga una distribucin normal,
obtened la probabilidad de que un gestor cultural de Murcia haya cursado 250 horas de
este tipo de formacin.

Solucionario

Los pasos que tenis que seguir son los siguientes:

Tipificar la variable: (250 446,39)/559,49 = 0,35 (negativo)

Buscar en las tablas la probabilidad para 0,35 = 0, 636 830 (la encontramos en la tabla
completa, segn fuente, en la columna 1, fila 36).

Aplicar la correccin: 1 0,636830 = 0,3631

Por tanto, la probabilidad de que un gestor cultural de la Regin de Murcia haya


cursado 250 horas anuales de formacin en gestin cultural es del 36,31%.

5.2. Encuestas y muestreo sobre realidades culturales

Cuando nos enfrentamos al anlisis de una realidad social, como puede serlo
cualquiera relativa al mbito de la cultura (consumo, produccin, distribucin
y/o financiacin), el primer escollo con que nos encontramos es el problema
del tamao de nuestro objeto de estudio (p. ej., nmero de lectores, artistas,
empresas de las industrias culturales, etc.); en muchos casos, tener acceso a
los datos de todo nuestro universo/poblacin de anlisis es del todo inviable,
hacindose necesario recurrir a una muestra representativa del colectivo a es-
tudiar. De hecho, la obtencin de un censo que nos facilite todos los datos
existentes presenta otros muchos inconvenientes, tal como se recoge en Escu-
der y Murgui (1995):

Existe la necesidad de disponer de un directorio actualizado que identifi-


que y localice cada una de las unidades que conforman la poblacin.

Los presupuestos suelen ser limitados, por lo que si el censo es muy amplio,
el coste excedera en mucho nuestras posibilidades econmicas.

El trabajo de campo puede extenderse mucho en el tiempo si la poblacin


es elevada.

Hay dificultades en la formacin y control de los agentes que realizan el


trabajo de campo; cuanto mayor es el nmero de unidades que conforman
FUOC PID_00173351 55 Estadstica aplicada a la investigacin en cultura

la poblacin, ms aumenta la necesidad de agentes de campo, lo que mul-


tiplica tales dificultades.

La no respuesta impedir obtener la totalidad de los datos de la poblacin.

La gestin administrativa, el procesamiento y la grabacin digital de los


datos crecen exponencialmente con el tamao de la poblacin.

Por consiguiente, el muestreo es una opcin ms que adecuada para la obten-


cin de anlisis y conclusiones sobre una poblacin determinada, tanto por
sus ventajas tcnicas como econmicas y temporales, respecto a lo que supon-
dra un analisis censal.

El proceso de muestreo pasa por ser capaz de obtener lo que denomina-


mos una muestra representativa, esto es, un subconjunto de la pobla-
cin que presenta la misma estructura que esta y cuyas caractersticas
estadsticas reflejan fielmente las de la poblacin.

Ejemplo de muestreo

Durante los aos 2007 y 2008, el rea de Investigacin en Economa Aplicada a la Cul-
tura, de la Universidad de Valencia, desarroll un estudio econmico-financiero sobre el
sector artesano de artistas falleros de la ciudad de Valencia. Con tal propsito se elabor
una encuesta y se escogi la muestra de artistas falleros, de modo que los valores conta-
bles (p. ej., ingresos, costes de materiales, gastos financieros, etc.) que se fueran a obtener
del cuestionario remitido a los talleres artesanos tuvieran unos valores estadsticos en
media y desviacin tpica representativos del censo gremial. De este modo, en lugar de
tener que obtener los datos de los 190 artesanos agremiados en activo, solo tuvimos que
centrarnos en la obtencin de los datos de 73 de estos.

El proceso de muestreo se establece en tres etapas:

1)Seleccindelamuestra. Por lo general, se suele trabajar con la denomina-


da muestra aleatoria simple, en la que el proceso de eleccin de las unidades
que componen la muestra se realiza de forma completamente aleatoria y se-
cuencial y cada unidad tiene la misma probabilidad de ser seleccionada. Sin
embargo, dado que el azar no es garanta de representatividad, suele recurrir-
se a otro tipo de mtodo, denominado muestreo aleatorio estratificado, con-
sistente en la seleccin de submuestras, cada una representativa de cada uno
de los estratos que conforman la poblacin (p. ej., franjas etarias, por sexo,
por renta familiar disponible, etc.); dentro de cada submuestra las unidades
son seleccionadas aleatoriamente. Este mtodo permite que la muestra sea an
ms fiel a las caractersticas y estructura poblacionales.

2)Observacindelasvariablesdeinterssobrecadaunadelasunidades
seleccionadas. La obtencin de estos datos es lo que se denomina trabajo
de campo, y se puede realizar mediante cuestionario aplicado personalmente,
por va telefnica, postal o, ms comnmente ahora, por medios telemticos
FUOC PID_00173351 56 Estadstica aplicada a la investigacin en cultura

(Internet); en algunos casos, tales datos se podrn obtener incluso de registros


oficiales (p. ej., datos contables a travs del Registro Mercantil), directorios y
censos estadsticos u otras fuentes estadsticas varias.

3)Inferencia. Consiste en analizar las caractersticas poblacionales (p. ej., me-


dia y desviacin tpica) a partir de las calculadas sobre nuestros datos mues-
trales.

Ejemplo de muestreo

Siguiendo con el anlisis realizado al sector artesano de artistas falleros de la ciudad de


Valencia, en la primera fase se seleccionaron 100 talleres de forma aleatoria, consideran-
do dos estratos basados en la facturacin (talleres pequeos, talleres grandes), aunque,
dado que la tasa de respuesta fue del 73% (durante el trabajo de campo es frecuente que
esto suceda), durante la segunda fase solo obtuvimos datos para una muestra de 73 ta-
lleres. Con estos datos, fue posible estimar que los ingresos medios de cada taller eran
de 73.556 (26.336 para talleres pequeos, 115.724 para talleres grandes), de donde
estimamos que los ingresos totales para los 190 agremiados en activo eran de [73.556
190 = 13.975.584 .]

Obviamente, uno podra pensar que este no es un proceso exento de proble-


mas e incertidumbres. Sin embargo, hemos de considerar que durante todo el
proceso de diseo muestral se intenta contener y controlar dichas situaciones.
En primer lugar, hemos de tener en cuenta que existe lo que denominamos
error muestral, tambin denominado error de estimacin, o precisin.

Bsicamente, el error muestral es la variacin que pueda existir en la


variable estimada al calcularla mediante nuestra muestra seleccionada
y otras muestras que se podran haber escogido. Este error puede con-
trolarse, de alguna forma, mediante el recurso a muestras de mayor ta-
mao, las cuales reducen este fenmeno de variabilidad, aunque incre-
mentando el coste del estudio.

Por otra parte, tenemos que considerar el nivel de confianza de la estimacin,


que nos determina un rango de acierto de que la variable muestral se aproxime
al valor poblacional; a mayor nivel de confianza, menor error aleatorio (no
confundir con el error muestral) o nivel de significacin, que mide la proba-
bilidad de fallar en la estimacin dentro de un determinado rango.

Finalmente, hay que tener en cuenta que en muchas ocasiones desconocere-


mos la variabilidad real (varianza) de la variable analizada, por lo que tendre-
mos que calcular una muestra piloto y utilizar, ya sea su varianza como esti-
macin de la poblacional, ya la varianza estimada en estudios previos que co-
nozcamos, o realizar una hiptesis a priori sobre qu valor mximo pueda to-
mar la varianza; en el caso de que la variable a analizar sea del tipo S/No (p. ej.,
asistencia al teatro en el ltimo ao) la variabilidad se asimila a la tasa de pre-
valencia, pudiendo asumir la hiptesis de una tasa mxima (luego p = q = 0,5).
FUOC PID_00173351 57 Estadstica aplicada a la investigacin en cultura

De este modo, tras haber realizado todas estas asunciones, podremos


calcular el tamao muestral a partir de la siguiente frmula, en el caso
de variables continuas:

1.8

o la siguiente, en el caso de variables del tipo S/No:

1.9

donde n es el tamao de la muestra; N, el tamao de la poblacin; e, el


error muestral; y Za, el valor correspondiente a la distribucin normal
para el nivel de significacin (a) escogido (habitualmente: a = 5%, con-
fianza = 95% Za = 1,96; a = 1%, confianza = 99% Za = 2,57).

Ejemplo
Enlace recomendado
A modo de ejemplo, vamos a emplear la encuesta de hbitos y prcticas culturales en
Espaa 2006-2007, realizada por el Ministerio de Cultura en colaboracin con el Instituto Para ms informacin, po-
Nacional de Estadstica (INE). Esta encuesta da continuidad a la previa de 2002-2003, a dis consultar el enlace si-
la vez que ampla sus objetivos para profundizar en nuevos aspectos. Segn se obtiene guiente:
del apartado metodolgico de la encuesta, sus objetivos son la obtencin de una serie http://www.mcu.es/esta-
de "indicadores relativos al inters de los espaoles en los distintos sectores del mbito disticas/MC/EHC/2006/
cultural, de la frecuencia e intensidad con que se realizan estas actividades o del hbito Metodologia.html
adquirido respecto a las mismas".

A partir de la ficha tcnica de la encuesta, podemos obtener que el diseo muestral se ha


realizado mediante un "muestreo bietpico con estratificacin de unidades de primera
etapa, considerando cada comunidad autnoma una poblacin independiente". En la
primera etapa, las unidades consideradas son las secciones censales (los estratos quedan
conformados dentro de cada comunidad autnoma segn el tamao del municipio al
que pertenezca la seccin censal), y, en la segunda etapa, la poblacin de 15 aos en
adelante. Este mtodo de muestreo combina el muestreo aleatorio simple con el muestreo
aleatorio estratificado. Por razones didcticas, nos centraremos en la segunda etapa, la
cual se establece como muestreo aleatorio simple (en realidad, mediante procedimiento
de muestreo sistemtico con arranque aleatorio) a partir del padrn de habitantes, una
vez se ha determinado el nmero de secciones censales por comunidad autnoma.

Los tamaos muestrales para las CC. AA. se han escogido basndose en un nivel de con-
fianza de 95% (nivel de significacin del 5%), con un error de estimacin predeterminado
a priori (ver tabla), y considerando p = q = 0,5, resultando en una muestra total de 16.408
encuestas. El trabajo de campo se realiz mediante entrevistas personales, recogiendo no
solo datos relativos a los hbitos y prcticas culturales, sino tambin datos sociodemogr-
ficos (sexo, edad, nivel de estudios, etc.) y datos relativos a la disponibilidad de equipa-
mientos culturales (ordenador, equipos de sonido) y el inters en actividades culturales.

Las tablas de los resultados se pueden obtener desde la pgina web del Ministerio de
Cultura.

Actividad

Estableced vuestra propia estadstica de hbitos y prcticas culturales para vuestro muni-
cipio mediante muestreo aleatorio simple. Como ayuda os presentamos el ejemplo de
Vila-real, que tiene 42.658 habitantes mayores de 15 aos (INE, 2009).

Nivel de significacin = 5%
Error de estimacin = 10%
p = q = 50%
Tamao muestral ~ 96 individuos de edad 15+
Trabajo de campo
FUOC PID_00173351 58 Estadstica aplicada a la investigacin en cultura

Clculo de las medias y varianzas muestrales


Presentacin de los resultados

5.3. Contrastacin de hiptesis. Usos del tiempo y consumos


culturales

Siguiendo con nuestra labor de investigadores o, si fuera el caso, incluso de me- Ejemplo
ros espectadores-lectores de las estadsticas culturales, en ciertas ocasiones ser
Cuando tengamos acceso a
muy interesante realizar contrastaciones de afirmaciones vertidas por colegas, los resultados de la encuesta
medios de comunicacin, organismos pblicos, o incluso de nuestras propias de usos del tiempo 2009-2010
del INE "podramos" contras-
intuiciones. En trminos estadsticos, es lo que denominamos contraste de hi- tar la hiptesis de que la media
de visionado de TV por parte
ptesis: procedimiento estadstico basado en los modelos de probabilidad y de los espaoles no ha varia-
do respecto a los datos de la
los datos muestrales, que se utiliza con fines (re)probatorios de una hiptesis. misma encuesta para el pero-
Obviamente, dado que ya sabemos que en estadstica inferencial asignamos do 2002-2003 (casi 3 horas;
INE, 2004), con una confianza
probabilidades, ninguna hiptesis ser en realidad aceptada o rechazada taxa- del 95%. Por el momento, con
los datos de la encuesta dispo-
tivamente, teniendo que tener en consideracin el concepto probabilstico de nible hasta el momento, po-
contraste inferencial. dramos contrastar que la me-
dia de dedicacin a estudios es
menor de 45 minutos, con un
Encuesta de usos del tiempo nivel de significacin del 5%.

La encuesta de usos del tiempo 2002-2003 es una encuesta no peridica que se basa en
los diarios de actividades recogidos en casi 24.000 hogares para los miembros de 10 y ms
aos. Se recoge informacin primaria sobre el tiempo dedicado al trabajo no remunerado
(cuidados personales, estudios, voluntariado, etc.), la distribucin de las tareas del hogar
y la participacin en actividades de ocio y cultura. La muestra total es de 46.774 personas,
y, adems de los microdatos, el INE facilita tablas elaboradas que indican el porcentaje
de personas que realizan cada actividad y la duracin media diaria.

En el ejemplo anterior presentamos dos tipos de hiptesis; en una de ellas


contrastamos una media y en la otra, la igualdad de la media de dos mues-
tras diferentes. En ambos casos, el trmino probabilstico se ha incluido en
forma de confianza (95%) o de significacin (5%), aspectos ambos que son
complementarios (0,95 = 1 0,5). Por tanto, estamos viendo cmo el proceso
de contraste de hiptesis est formado por diversas piezas y que pueden existir
diferentes tipos de contrastes: contrastes para una poblacin y contrastes para
dos poblaciones.

Al respecto de los componentes de un contraste, en primer lugar ten-


dremos lo que denominamos hiptesis nula (H0: hiptesis que conside-
ramos como cierta); la hiptesis alternativa (H1) ser aquella que toma-
mos como opuesta. Si se acepta la hiptesis nula, implica que se rechaza
la alternativa, y viceversa. En ambos casos nos enfrentamos a dos tipos
de errores derivados de la decisin tomada (aceptar/rechazar):

Error tipo I () rechazar H0 cuando esta sea la correcta.

Error tipo II () aceptar H0 cuando esta sea la incorrecta.


FUOC PID_00173351 59 Estadstica aplicada a la investigacin en cultura

Dado que estamos realizando la toma de decisiones basndonos en datos Ejemplo


muestrales (suponemos que no tenemos acceso a los de las poblaciones, que
Mediante la encuesta de usos
son los reales y ciertos, con probabilidad 100%), nunca estaremos seguros de del tiempo 2002-2003 quere-
haber incurrido o no en un error; adems, no podemos controlar ambos erro- mos contrastar que el tiempo
que dedican hombres y muje-
res al mismo tiempo (tratar de reducir uno incrementa el otro). Sin embargo, res a la lectura es de media el
mismo (H0: igualdad de me-
s sabemos que, por lo general, es ms grave rechazar algo cierto que aceptar dias, H1: no igualdad). Si he-
algo incorrecto; por tanto, tenderemos a intentar que el error tipo I sea mni- mos escogido un nivel de sig-
nificacin del 1%, la probabi-
mo. El valor de este error coincide con el nivel de significacin del contraste, lidad de acierto cuando la hi-
ptesis de igualdad sea la co-
siendo entonces la probabilidad de aceptar la hiptesis nula cuando sea esta rrecta ser igual a 100% 1%
= 99%.
la correcta igual a 1 .

Ahora bien, para poder tomar una decisin informada y con base estadstica
necesitaremos una regla de decisin o test, partiendo del denominado estads-
tico de contraste. Dicha regla deber construirse atendiendo al tipo de hip-
tesis a formular.

1)Contrasteparaunapoblacin. Hiptesis sobre el valor de la media:

Definicin de las hiptesis H0: = k; H1: k

Fijacin del nivel de significacin

Clculo del estadstico de contraste

x es la media muestral; k, el valor de la media a contrastar; , la desviacin


tpica poblacional (si la muestra es elevada, puede utilizarse como aproxi-
macin el valor muestral); n, el tamao muestral; z sigue una distribucin
N[0, 1].

Obtener el valor de tablas para el estadstico de contraste p-value.

Aplicar la regla siguiente: si < (2 p-value) aceptar H0; o rechazar, si no.

Actividad

Podemos aceptar la hiptesis de que en Espaa la media de tiempo dedicado a ver TV


es de 3 horas diarias?

Soluci

Supongamos que de la encuesta de usos del tiempo 2002-2003 extraemos una


muestra de 85 personas (n), cuya media es de 2 horas y 45 minutos (x = 2,75
horas); supongamos que = 0,50 (media hora ms, o menos, de TV), y que fijamos
el nivel de significacin en el 1% (0,01).

El valor en tablas es = 1 0,991802 = 0,008198 (p-value).

El doble de este valor es 0,016396.


FUOC PID_00173351 60 Estadstica aplicada a la investigacin en cultura

La regla de decisin nos indica que tenemos que aceptar la hiptesis (0,01 <
0,016396). Por tanto, podemos asegurar con un 99% de confianza que en Espaa
se ve una media diaria de 3 horas. Ntese, sin embargo, que la decisin sera recha-
zar la hiptesis nula si hubisemos elegido un nivel de significacin del 5% (0,05 >
0,016396).

2)Contrasteparadospoblaciones. Hiptesis de igualdad de medias:

Disponemos de dos muestras independientes 1 y 2 (distintos individuos)

Definicin de las hiptesis H0: 1 = 2; H1: 1 2

Fijacin del nivel de significacin

Clculo del estadstico de contraste

xi es la media muestral de cada muestra (1, 2); S2i, la varianza muestral de


cada muestra (1, 2); ni, el tamao muestral de cada muestra (1, 2); t sigue
una distribucin t-Student, con min[n1 1, n2 1] grados de libertad.

Obtener el valor de tablas para el estadstico de contraste p-value. Enlace recomendado

Podis consultar las tablas de


Aplicar la regla siguiente: si < (2 p-value) aceptar H0; o rechazar, si no. la distribucin t-Student en
Wikibooks.
Actividad

Podemos aceptar la hiptesis de que en Espaa los hombres dedican al estudio el mismo
tiempo que las mujeres?

Solucin

Supongamos que de la encuesta de usos del tiempo 2002-2003 extraemos una


muestra de 40 hombres (nH) y 31 mujeres (nM), las horas medias de estudio son
xH = 0,75 y xM = 0,80; supongamos que SH = 0,10 y SM = 0,05.

Los grados de libertad son min[40 1, 31 1] = 30.

El valor en tablas es 1 0,995 = 0,005 (p-value).

El doble de este valor es 0,01.

La regla de decisin nos indica que aceptaremos la hiptesis de que en Espaa hom-
bres y mujeres dedican en media el mismo tiempo diario al estudio, siempre que
consideremos un nivel de significatividad igual o menor al 1% (0,01 0,01); a valores
de menor confianza (mayor significatividad), deberemos rechazar la hiptesis nula.

Otros contrastes de hiptesis

Finalmente, cabe resear que hay muchos ms contrastes de hiptesis que los dos ex-
puestos en este subapartado. Puede establecerse toda una gama de tests, desde el equi-
valente a (H0: = k) pero para casos en que desconocemos el valor de la varianza pobla-
cional y no podemos estimarla, tests en los que no evaluamos la media en trminos de
igualdad de un valor sino de desigualdad, como (H0: < k) o (H0: > k), tests en los
FUOC PID_00173351 61 Estadstica aplicada a la investigacin en cultura

que el parmetro a evaluar es la varianza (H0: 2 = v), (H0: 2 < v), o (H0: 2 > v), tests de
igualdad de proporciones, tests de igualdad de medias con varianzas desconocidas, etc.
Y estos son solo en lo que se refiere a la familia de los tests paramtricos, en los que s
conocamos la distribucin y la regla de decisin se aplicaba sobre uno o varios parme-
tros. En cambio, existe una serie de tests no paramtricos, en los que desconocemos la
distribucin probabilstica o existen dudas sobre esta; en este tipo de tests, las hiptesis
versan sobre el modelo de probabilidad que ha generado los datos: test de chi-cuadrado,
test de Kolmogrov-Smirnov, test de Rachas, etc.

5.4. Anlisis de la varianza (ANOVA). Turistas culturales

En algunas ocasiones, dispondremos de una serie de datos cuya hiptesis a Festival VEO
contrastar puede resultar demasiado complicada por su naturaleza, sin contar
Depende la valoracin de la
las dificultades con que nos podemos encontrar en cuanto a clculo. Por ejem- calidad de la programacin
plo, cuando queremos establecer una regla de decisin para determinar si una por parte de los asistentes a un
festival de artes escnicas de
determinada variable se ve afectada por el efecto de otras variables, o cuando sus caractersticas sociodemo-
grficas y/o su perfil de consu-
queremos realizar una comparacin de medias para ms de dos muestras. mo cultural? Es lo que un equi-
po de investigacin de la Uni-
versidad de Valencia quera sa-
Aunque existe un modelo simple, one-way ANOVA, que permite contrastar el ber referente al Festival VEO.

efecto de una variable sobre otra, en este subapartado nos centraremos en la


aplicacin que busca explicar la variacin de una variable dependiente (varia-
ble explicada Y) por medio de las variaciones de dos variables independientes
(variables explicativas X1 y X2), de tipo categrico, discretas; la contrastacin
del efecto de dos variables sobre una tercera. Esta aplicacin se denomina two-
way ANOVA, o ANOVA de dos factores. La hiptesis nula de la metodologa de
contraste de hiptesis es la independencia de la variable explicada frente a las
explicativas, esto es, que la variacin de estas ltimas no afecta a la primera.

Esta metodologa guarda similitudes con el modelo lineal de regresin. De he-


cho, deben cumplirse las condiciones de normalidad de las variables, varian-
zas iguales, y los errores distribuidos segn una normal con media 0 son inde-
pendientes y homocedsticos (varianza constante).

Y=++++

donde es la media de Y; , el efecto de la primera variable independiente; ,


el efecto de la segunda; , el efecto interaccin; y , el error aleatorio.

Esto es, la variable explicada depende de su media, de la variacin en


las variables independientes y de la variacin causada por la interaccin
entre estas dos, as como de la variacin provocada por un error aleato-
rio. A este modelo lo denominamos coninteraccin, mientras que, si
no existe tal efecto, hablamos de un modelo aditivo o sininteraccin.
De este modo, la hiptesis contrastada realmente es que ni la variacin
de las variables afecta a la variable dependiente, ni existen efectos in-
teraccin.
FUOC PID_00173351 62 Estadstica aplicada a la investigacin en cultura

Ejemplo

En la investigacin enfocada al pblico del Festival VEO se program una encuesta en la


que se recogan, entre otras, una variable de percepcin de la calidad del Festival (varia-
ble dependiente), una variable que recoga el nivel de estudios y otra que categorizaba el
motivo de la asistencia al Festival (dos variables independientes, discretas y categricas).
Un two-way ANOVA nos permite establecer las relaciones entre la motivacin y el nivel de
estudios para con la percepcin de calidad del Festival. Por otra parte, sera conveniente
utilizar un modelo con interaccin, dado que tenemos indicios para establecer la hip-
tesis de que motivacin y estudios podran interactuar entre s.

Luego, recapitulando, tenemos dos variables categricas cuyo efecto sobre una
tercera dependiente queremos contrastar. Para poder realizar el test, hemos de
recurrir a la descomposicin de la varianza total en las varianzas de cada una
de las variables independientes, la varianza provocada por la interaccin de
ambas de estas variables y la varianza del trmino de error; es a partir de esta
expresin que calculamos los estadsticos de contraste, uno para cada variable
independiente y un tercero para los efectos interaccin; dichos estadsticos
estn distribudos segn una F-Snedecor con grados de libertad (k 1, n k),
siendo k el nmero de categoras de la variable. Este tipo de contrastes suelen
realizarse valindose de software estadstico, el cual calcula los estadsticos y
nos facilita los p-values.

Ejemplo

En Lee y otros (2004) se analiza la satisfaccin de los asistentes a la 2000 World Culture
Expo (Corea del Sur) basndose en su posible conexin con las diferentes motivaciones
de visita (I: cultural y familiar, II: mltiples motivaciones, III: escapada, IV: buscadores de
eventos) y su nacionalidad (nacional o extranjero). Para ello se emplea un ANOVA de dos
factores; el clculo de los estadsticos de contraste y de los p-values se realiza mediante
una aplicacin informtica, mostrndose los resultados a continuacin:

Variable F p-value
Motivacin 16,479 <0,001
Nacionalidad 79,073 <0,001
Interaccin 1,824 >0,05

Luego, como se desprende de los datos en la tabla, para cualquier nivel de significatividad
(los p-values son muy prximos a 0), las variables motivacin y nacionalidad presentan
efectos sobre la satisfaccin. Sin embargo, para niveles de significatividad convencionales
(5% o menores), no puede aceptarse la hiptesis sobre la existencia de efectos interaccin
entre la motivacin y la nacionalidad (p-value mayor del 5%); esto podra indicar que la
satisfaccin para cada tipo de motivacin sigue el mismo patrn, independientemente
de que el visitante sea nacional o extranjero.
FUOC PID_00173351 63 Estadstica aplicada a la investigacin en cultura

6. Anlisis mltiple de datos

6.1. Anlisis de regresin

Cuando estudiamos conjuntamente dos variables, podemos encontrarnos con


las siguientes situaciones extremas:

1) no existe ninguna relacin entre las variables objeto de estudio (las variables
son independientes),

2) existe una relacin perfecta entre las mismas (dependencia matemtica o


funcional).

Ahora bien, entre estos dos polos opuestos es posible identificar multitud de
situaciones en las que las variables con las que estamos trabajando, por ejem-
plo el nivel de consumo de las familias y su renta, presentan un cierto grado
de relacin de dependencia entre ellas sin que esta sea de tipo funcional. En
estas situaciones se dice que la dependencia es estadstica.

Una manera de describir la relacin entre dos variables de naturaleza cuan-


titativa consiste en dibujar el diagrama de dispersin del conjunto de datos
(xi, yi) a analizar. Cuando observamos un diagrama de dispersin, como los
que se muestran en la figura siguiente, debemos tratar de dar respuesta a tres
preguntas:

1) observamos algn tipo de funcin que permita relacionar las variables X


e Y?;

2) suponiendo el caso ms sencillo, que la relacin de dependencia entre X


e Y es de tipo lineal, es la nube de puntos ascendente (por trmino medio,
cuanto mayor/menor es X, mayor/menor es Y) o, por el contrario, descendente
(cuanto mayor/menor es X, menor/mayor es Y, en media)?;

3) y siguiendo con el caso lineal, se ajusta mucho o poco la nube de puntos


a una recta?
FUOC PID_00173351 64 Estadstica aplicada a la investigacin en cultura

La teora de la correlacin estudia la intensidad o fortaleza de la relacin de Ved tambin


dependencia entre dos variables y, por tanto, nos da respuesta a las preguntas
En el subapartado 6.2 vamos
segunda y tercera formuladas anteriormente. La teora de la regresin, a la que a exponer los conceptos bsi-
vamos a dedicar este apartado, nos permite pasar de la dependencia estadstica cos implicados en la regresin
lineal simple y en el subaparta-
que observamos en el diagrama de dispersin (respuesta a la primera pregunta) do 6.3 se extendern estos pa-
ra abordar el estudio de la re-
a la dependencia funcional dada por una lnea de regresin. gresin lineal mltiple.

6.2. Regresin lineal simple

En la siguiente tabla estn disponibles los datos relativos a la tasa de lectura y


la tasa de licenciados de las 17 comunidades autnomas.

Datos de tasa de lectura (variable Y) y porcentaje de licenciados (variable X)

Comunidadautnoma Tasadelectura(Y) Porcentajelicenciados(X)

Andaluca 36 6,2

Aragn 40,7 7,5

Asturias 40,8 5,9

Baleares 41,3 4,4

Canarias 42,2 6,6

Cantabria 38,4 5,3

Castilla y Len 38,5 6,5

Castilla-La Mancha 35 4,7

Catalua 43,5 8,3

Comunidad Valenciana 38,3 7,4

Extremadura 32,8 4,2

Galicia 36,3 6,2

Madrid 50,8 14,1

Murcia 39,7 6,4

Navarra 41,2 8,9

Pas Vasco 41,6 9,9

La Rioja 40,7 6,6

(1)
Para examinar la relacin entre estas variables dibujamos el diagrama de dis- Puede consultarse Etxeberria
(2007, 97-9101).
persin que podis ver en la figura siguiente. A partir de la nube de puntos
obtenidos podemos observar, en primer lugar, que hay un punto que aparece
totalmente separado del resto y podra tratarse de un outlier. Los valores extre-
mos deben ser analizados cuidadosamente por su efecto en los resultados1. En
este caso, dado que el punto que se encuentra alejado del resto corresponde
a la Comunidad de Madrid y los valores introducidos son correctos, se ha op-
tado por mantener esta observacin en el anlisis. En segundo lugar, tambin
FUOC PID_00173351 65 Estadstica aplicada a la investigacin en cultura

se observa que, cuanto mayor es el porcentaje de licenciados (Y), mayor es la


tasa de lectura (X). En tercer lugar, podemos asumir una relacin de tipo lineal
entre la tasa de lectura y el porcentaje de licenciados.

Diagrama de dispersin: tasa de lectura y porcentaje de licenciados

El anlisis de regresin nos permitir obtener la mejor recta que se ajuste a


nuestros datos. Sin embargo, antes de avanzar es necesario destacar el hecho
de que los resultados que obtengamos a partir de la regresin solo son un
resumen de la informacin contenida en el conjunto de los datos analizados
y no demuestran que el aumento/disminucin de la variable explicativa (o
independiente) sea la causa del aumento/disminucin de la variable explicada
(o dependiente). En este contexto, una variable independiente puede influir
en una variable dependiente por tres motivos:

1) Por casualidad.

2) Por la existencia de otra variable que ha sido omitida en el anlisis.

3) Porque efectivamente existe una relacin causal (relacin causa-efecto) con


base terica, de forma que los resultados de la regresin tienen un ajuste lineal.

6.2.1. Especificacin del modelo

Si asumimos que la funcin que mejor se adapta a nuestra nube de pun-


tos es una recta, podemos escribir el modeloderegresinsimplepo-
blacional de la siguiente manera:

1.10

donde:

Yi: valor de la variable dependiente de la observacin i;

: ordenada en el origen o intercepto (representa el valor medio de Y


cuando X es cero);
FUOC PID_00173351 66 Estadstica aplicada a la investigacin en cultura

: coeficiente de regresin (es la pendiente de la recta y representa el


cambio esperado en Y cuando X cambia en una unidad);

Xi: valor de la variable independiente de la observacin i;

i: error que se comete (en el ajuste) para la observacin i al no conside-


rar otros factores que pueden influir en Y. Es una variable aleatoria que
se supone sigue una distribucin normal con media 0 y varianza 2.

6.2.2. Mtodo de ajuste: mnimos cuadrados ordinarios

(2)
En la gran mayora de las situaciones prcticas no contamos con los datos Ms detalles en Esteban y otros
(2005)
poblacionales sino con datos correspondientes a una muestra. Por tanto, es
necesario estimar los parmetros desconocidos y de la recta de regresin
poblacional, que denotaremos por a y b. Si tenemos una muestra formada por
n observaciones, los valores de a y b, de acuerdo con el mtodo de mnimos
cuadrados, sern aquellos que minimicen la suma de los cuadrados de los erro-
res2 (podis ver la figura siguiente).

Recta ajustada y errores

Es decir, tenemos que minimizar:

1.11

Los valores de a y b que minimizan la SCE son los llamados estimadores m-


nimo-cuadrticos de los parmetros poblacionales y , y se obtienen al dife-
renciar la ecuacin respecto de a y b e igualar cada derivada parcial a cero. Se
obtienen, de esta forma, las denominadas ecuaciones normales, que vienen
dadas por:

1.12
FUOC PID_00173351 67 Estadstica aplicada a la investigacin en cultura

Resolviendo, se obtienen los siguientes valores de a y b:

1.13

La recta de regresin muestral o estimada obtenida puede escribirse de la si-


guiente manera:

1.14

que puede utilizarse para generar una prediccin o pronstico de, y para, un
valor dado de x.

Ejemplo

Con respecto a los datos de la tabla del subapartado 6.2, se muestran en la tabla siguiente
los clculos necesarios para obtener la recta de regresin de la tasa de lectura en funcin
del porcentaje de licenciados.

Valores calculados para obtener los coeficientes de la regresin lineal

Comunidadau- yi xi xi
2 xiyi
tnoma

Andaluca 36 6,2 38,44 223,2

Aragn 40,7 7,5 56,25 305,25

Asturias 40,8 5,9 34,81 240,72

Baleares 41,3 4,4 19,36 181,72

Canarias 42,2 6,6 43,56 278,52

Cantabria 38,4 5,3 28,09 203,52

Castilla y Len 38,5 6,5 42,25 250,25

Castilla-La Man- 35 4,7 22,09 164,5


cha

Catalua 43,5 8,3 68,89 361,05

Com. Valenciana 38,3 7,4 54,76 283,42

Extremadura 32,8 4,2 17,64 137,76

Galicia 36,3 6,2 38,44 225,06

Madrid 50,8 14,1 198,81 716,28

Murcia 39,7 6,4 40,96 254,08

Navarra 41,2 8,9 79,21 366,68

Pas Vasco 41,6 9,9 98,01 411,84


FUOC PID_00173351 68 Estadstica aplicada a la investigacin en cultura

Comunidadau- yi xi xi
2 xiyi
tnoma

La Rioja 40,7 6,6 43,56 268,62

Sumas 677,8 119,1 925,13 4.872,47

Utilizando la opcin regresin de la herramienta de anlisis de datos de la hoja de clculo


Excel, los resultados que se obtienen se facilitan en la figura siguiente, en la que destacan
los que han sido estudiados hasta el momento.

Salida Excel de los coeficientes de regresin y SCE

El coeficiente de regresin b indica que, por cada incremento unitario de X, se estima que
el valor medio de Y se incremente en b unidades, es decir, por cada punto porcentual de
incremento del nmero de licenciados se estima que la tasa de lectura se incremente en
1,365 puntos porcentuales aproximadamente. La ordenada en el origen (intercepcin) es
la constante de la regresin e indica el valor medio de Y cuando X es cero. En nuestro
caso, para un porcentaje de licenciados del 0% se estima que la tasa de lectura se site en
torno al 30,31%. Debemos ser cautelosos a la hora de interpretar los valores de a y b. Los
resultados de la regresin solo pueden utilizarse dentro del rango de valores observados
en nuestra muestra. As, en nuestro ejemplo el porcentaje de licenciados se mueve en el
rango 4,2-14,1, por lo que no tiene sentido alguno la interpretacin del intercepto.

No deberamos interpretar los valores de a y b fuera del rango de datos.

6.2.3. Calidad del ajuste: medidas de variacin y coeficiente de


determinacin

El objetivo fundamental de la teora de la regresin es poder expresar una va-


riable en funcin de otra y hacer uso de dicha funcin para realizar pronsti-
cos. Por tanto, cualquier pronstico debera ir acompaado de un estudio de la
fiabilidad que aquel merece. En este sentido, resulta obvio que, cuanto mejor
sea el ajuste, mayor ser la fiabilidad del pronstico efectuado a partir de l.
En este subapartado vamos a aprender a evaluar la calidad del ajuste realiza-
do mediante el estudio de diversas medidas de variacin y del coeficiente de
determinacin.
FUOC PID_00173351 69 Estadstica aplicada a la investigacin en cultura

(3)
Para ver la demostracin puede
3
Una propiedad importante del ajuste mnimo-cuadrtico es que la va- consultarse Esteban y otros (2005).

rianza que mide la variabilidad de Y observada puede descomponerse


en la suma de la varianza de Y ( ) explicada por la regresin ( )y

la varianza residual ( ) que mide las desviaciones entre los valores ob-
servados y ajustados.

Es decir, sabemos que , de manera que la relacin entre estas varianzas


puede escribirse as:

1.15

o, alternativamente, puede expresarse en forma de suma de cuadrados (vase


la figura siguiente):

1.16

(4)
donde4: Puede comprobarse fcilmente
que e (comprobad los
resultados que aparecen en la ta-
bla que sigue a continuacin).
SCT es la suma de cuadrados total: ;

SCR es la suma de los cuadrados de la regresin: ;

SCE es la suma de los cuadrados de los errores: .

Descomposicin de la varianza de Y

De acuerdo con la ecuacin , cuanto mayor es SCR menor es SCE y, por tan-
to, mejor se ajusta la recta de regresin al conjunto de datos observados. El
inconveniente de utilizar estos indicadores es que las varianzas dependen de
las unidades de medida, por lo que es necesario buscar otro indicador que no
FUOC PID_00173351 70 Estadstica aplicada a la investigacin en cultura

presente esta desventaja. Para ello, y considerando la ecuacin , puede tomar-


se como medida del grado de ajuste la proporcin de la varianza de Y que se
explica por la regresin. Esta medida se denomina coeficientededetermina-
cin y se denota por R2.

1.17

que tambin puede expresarse como:

1.18

El coeficiente de determinacin es adimensional y toma valores entre 0 y 1.


Suele interpretarse como el porcentaje de variabilidad de Y que se puede ex-
plicar por su dependencia lineal con la variable X. Cuanto mayor sea el coefi-
ciente de determinacin, mejor ser el ajuste efectuado.

Ejemplo

Veamos cmo llevar a la prctica los clculos anteriores con nuestro ejemplo. En las co-
lumnas 2 a 4 de la tabla siguiente se muestran los valores observados (yi), los valores pro-
nosticados o predichos ( ) de acuerdo con la regresin obtenida y los errores (ei). En las
siguientes tres columnas (columnas 5 a 7) se han calculado las desviaciones cuadrticas
de cada valor respecto a su media. En la penltima fila de la tabla se muestra la suma de
los valores obtenidos y en la ltima las medias de los valores observados y pronosticados
(ntese que coinciden: ) y de los errores ( ).

Valores observados y valores calculados (pronsticos, errores...) para obtener la suma de los
cuadrados, coeficiente de determinacin

yi ei

Andaluca 36 38,770 2,770 14,981 1,211 7,674 38,44 0,649

Aragn 40,7 40,545 0,155 0,688 0,455 0,024 56,25 0,244

Asturias 40,8 38,361 2,439 0,864 2,280 5,951 34,81 1,223

Baleares 41,3 36,312 4,988 2,043 12,660 24,875 19,36 6,791

Canarias 42,2 39,316 2,884 5,426 0,307 8,315 43,56 0,165

Cantabria 38,4 37,541 0,859 2,163 5,425 0,737 28,09 2,910

Castilla y 38,5 39,180 0,680 1,879 0,477 0,462 42,25 0,256


Len

Castilla-La 35 36,722 1,722 23,723 9,913 2,966 22,09 5,317


Mancha

Catalua 43,5 41,638 1,862 13,173 3,122 3,469 68,89 1,675

Com. Valen- 38,3 40,409 2,109 2,467 0,290 4,447 54,76 0,155
ciana

Extremadura 32,8 36,039 3,239 49,993 14,678 10,494 17,64 7,873


FUOC PID_00173351 71 Estadstica aplicada a la investigacin en cultura

yi ei

Galicia 36,3 38,770 2,470 12,749 1,211 6,102 38,44 0,649

Madrid 50,8 49,557 1,243 119,452 93,826 1,545 198,81 50,327

Murcia 39,7 39,043 0,657 0,029 0,684 0,431 40,96 0,367

Navarra 41,2 42,457 1,257 1,767 6,689 1,580 79,21 3,588

Pas Vasco 41,6 43,822 2,222 2,991 15,616 4,938 98,01 8,376

La Rioja 40,7 39,316 1,384 0,688 0,307 1,914 43,56 0,165

Sumas 677,8 677,8 0 255,075 169,151 85,924 925,13 90,729

Media 39,871 39,871 0

A partir de los clculos reflejados en la tabla, podemos obtener la suma de los cuadrados:

1.19

1.20

1.21

Los clculos realizados anteriormente coinciden con las salidas ofrecidas por Excel en el
anlisis de regresin, como puede comprobarse en la figura siguiente, en la que se han
destacado los resultados a considerar.

2
Salida Excel de SCT, SCR, SCE y R

6.2.4. Inferencia sobre los parmetros del modelo

(5)
Hasta el momento, a partir de una muestra hemos obtenido estimaciones de Ms detalles en Uriel y otros
(1990).
los parmetros poblacionales, de manera que es de prever que estos cambien si
cambia la muestra. En consecuencia, debemos calcular los intervalos de con-
fianza de los estimadores de los coeficientes y para las predicciones obtenidas
FUOC PID_00173351 72 Estadstica aplicada a la investigacin en cultura

a partir de ellos. Sin embargo, para poder hacer inferencias acerca de los par-
metros de la poblacin, el modelo de regresin debe cumplir unos supuestos
bsicos5:

Linealidad: la relacin entre las variables debe ser es lineal.

Independencia de los errores, es decir, .

La esperanza matemtica de los errores debe ser cero: .

Los errores son homocedsticos, es decir, deben tener la misma varianza:


.

Los errores deben distribuirse segn una normal: .

Estimacin de la varianza de los errores

Cuanto mayor sea la variabilidad del error aleatorio (2), mayores sern
los errores en las estimaciones de los parmetros poblacionales del mo-
delo ( y ) y el error de pronstico cuando utilizamos para predecir y
2
dado un valor de x. Como en la prctica es desconocido, usaremos los
datos muestrales para estimar su valor. As, un estimador de la varianza
del error poblacional es la varianza residual.

1.22

La raz cuadrada de la expresin es el denominado error tpico.

Ejemplo

Vamos a obtener el error tpico en nuestro ejemplo. En la columna 7 de la tabla


del subapartado anterior se han calculado los residuos al cuadrado, de forma que

. Por tanto,

(error tpico)

El error tpico de estimacin mide el error que cometemos cuando utilizamos la ecuacin
de regresin mnimo-cuadrtica para estimar la variable Y (tasa de lectura). Atendiendo a
las hiptesis bsicas del modelo, la distribucin de los errores debe distribuirse normal-
mente. Por tanto, es de esperar que aproximadamente el 68% de los errores (ver columna
4 de la tabla) se encuentren dentro del intervalo 2,393 y en torno al 95% se situar
dentro del intervalo 2 2,393 = 4,786.
FUOC PID_00173351 73 Estadstica aplicada a la investigacin en cultura

Prueba t e intervalos de confianza para y

(6)
Partiendo de la ecuacin puede demostrarse6 que: Vase Canavos (1992, captulo
13).

1.23

y que las varianzas de los estimadores, Var(a) y Var(b), son:

1.24

2
Pero, dado que es desconocido, utilizaremos su estimador ( ), por tanto,
utilizaremos como estimadores de las varianzas de los coeficientes:

1.25

Las desviaciones tpicas de las anteriores expresiones son los denominados


errores tpicos de los coeficientes de regresin. Vamos a calcularlos en nuestro
ejemplo.

Ejemplo

Sabemos que n = 17, , y, a partir de los clculos mostrados en la tabla del subapar-

tado 6.2.3, que y . Por tanto, sustituyendo en la expresin :

1.26

Con lo que los errores tpicos (desviaciones tpicas) de los coeficientes resultan ser:

En la figura siguiente se han destacado los anteriores resultados y el error tpico de esti-
macin proporcionados por Excel en su anlisis. Como puede comprobarse, los resulta-
dos coinciden.
FUOC PID_00173351 74 Estadstica aplicada a la investigacin en cultura

Salida Excel del error tpico de estimacin y de los errores tpicos de los coeficientes

La distribucin muestral del estimador de la pendiente (b) ser una distribu-

cin normal con media y varianza , puesto que b es una

combinacin lineal de variables aleatorias normalmente distribuidas. De ma-


nera anloga, y por esta misma razn, la distribucin muestral de a tambin

es una normal con media y varianza .

Prueba t para los coeficientes de regresin

Recordemos que nuestro modelo lineal viene dado por:

1.27

Si la variable Y est relacionada linealmente con la variable independiente X,


la pendiente tiene que ser distinta de cero. Las hiptesis nula y alternativa
son:

H0: = 0 (no hay relacin lineal)

H1: 0 (existe relacin lineal)

Bajo la hiptesis nula, el estadstico

1.28

De manera que, para un nivel de significacin () dado, se rechazar H0 si


.
FUOC PID_00173351 75 Estadstica aplicada a la investigacin en cultura

Anlogamente, podemos contrastar la significatividad de la constante de la


regresin (el intercepto). Las hiptesis nula y alternativa en este caso son:

H0: = 0

H1: 0

Bajo la hiptesis nula, el estadstico

1.29

Rechazndose la hiptesis nula para un nivel de significacin dado.

Ejemplo

En nuestro ejemplo, vamos a contrastar si la relacin lineal entre la tasa de lectura y


el porcentaje de licenciados es significativa para un nivel de significacin del 5%. La
hiptesis nula y alternativa es:

H0: = 0 (no hay relacin lineal)

H1: 0 (existe relacin lineal)

Sabemos que b = 1,365 y Sb = 0,251, por tanto, el estadstico t es:

1.30

Para un nivel de significacin de = 0,05, los valores crticos de una t con 15 grados de li-
bertad son 2,1314 y 2,1314. Como , podemos rechazar H0. Si usa-
mos el p-valor, rechazamos H0 porque el p-valor es aproximadamente 0, concretamente el
p-valor = 0,000069103 (figura siguiente), y es menor que el nivel de significacin = 0,05.

Por tanto, podemos concluir que existe una relacin lineal estadsticamente significativa
entre la tasa de lectura y el porcentaje de licenciados.

Intervalosdeconfianzaparaloscoeficientesderegresin

Alternativamente a la prueba t, podemos construir el siguiente intervalo de confianza


del 100(1 )% para .

1.31

Si el intervalo obtenido no contiene el valor cero es razonable concluir que es diferente


de cero y, por tanto, las variables Y y X estn relacionadas linealmente.

Del mismo modo, podemos tambin construir un intervalo de confianza del 100(1 )%
para :

1.32

A partir de la expresin , el intervalo de confianza para b sera:

1.33

Por tanto, el intervalo de confianza obtenido es: 0,8300 1,8999 (los resultados son
aproximados por los decimales). Es decir, estimamos con una confianza del 95% que la
pendiente de la regresin poblacional se encuentra entre 0,8300 y 1,8999. Adems, como
estos valores se encuentran por encima de 0, podemos concluir que existe una relacin
FUOC PID_00173351 76 Estadstica aplicada a la investigacin en cultura

lineal significativa entre las variables analizadas. El intervalo obtenido indica que, por
cada incremento de un 1% en el porcentaje de licenciados, se estima que la tasa media
anual de lectura se incremente entre el 0,83% y el 1,8999%.

De manera anloga procederamos con la constante de la regresin. Sin embargo, no va-


mos a contrastar la hiptesis y calcular el intervalo de confianza para el intercepto, por-
que en nuestro caso este coeficiente no tiene sentido, ya que el valor cero no se encuentra
dentro del rango de valores que toma el porcentaje de licenciados. En cualquier caso,
se han destacado en la figura siguiente los resultados de Excel para los dos coeficientes
de regresin.

Intervalos de confianza y estadstico t de los coeficientes

6.3. Regresin lineal mltiple

Una vez hemos tratado los aspectos bsicos de la regresin lineal simple, la re-
gresin lineal mltiple no es ms que una extensin. Ahora, la variable Y pue-
de depender de ms de una variable independiente. Consideremos el ejemplo
que venimos desarrollando. Hasta el momento, hemos intentado explicar el
comportamiento de la tasa de lectura en funcin del porcentaje de licencia-
dos. Para ilustrar el procedimiento de la regresin lineal mltiple vamos a in-
troducir en el modelo una nueva variable explicativa: el porcentaje de pobla-
cin que ve frecuentemente televisin. Los datos disponibles se muestran en
la tabla siguiente.

Datos de tasa de lectura (variable Y) y porcentaje de licenciados (variable X)

Comunidad Tasade Porcentaje Porcentaje


autnoma lectura(Y) licenciados(X2) poblacinaudiencia
televisin(X3)

Andaluca 36 6,2 91,8

Aragn 40,7 7,5 90,5

Asturias 40,8 5,9 89,1

Baleares 41,3 4,4 84,4

Canarias 42,2 6,6 84,9

Cantabria 38,4 5,3 86,1

Castilla y Len 38,5 6,5 89,3

Castilla-La Mancha 35 4,7 90,4

Catalua 43,5 8,3 87,7


FUOC PID_00173351 77 Estadstica aplicada a la investigacin en cultura

Comunidad Tasade Porcentaje Porcentaje


autnoma lectura(Y) licenciados(X2) poblacinaudiencia
televisin(X3)

Comunidad Valencia- 38,3 7,4 87,9


na

Extremadura 32,8 4,2 93,3

Galicia 36,3 6,2 87,9

Madrid 50,8 14,1 86,9

Murcia 39,7 6,4 86,8

Navarra 41,2 8,9 87,2

Pas Vasco 41,6 9,9 87,9

La Rioja 40,7 6,6 88,2

6.3.1. Especificacin del modelo

Si pretendemos explicar la variable Y a partir de k 1 variables explicativas


(variables X), el modelo de regresin lineal mltiple lo podemos escribir:

1.34

De esta forma, si tenemos una muestra de tamao n, tendremos el siguiente


sistema de ecuaciones:

1.35

que podemos expresar en notacin matricial de la siguiente manera:

1.36

donde:

1.37
FUOC PID_00173351 78 Estadstica aplicada a la investigacin en cultura

Ahora, Y es un vector n 1; X, una matriz n k; , un vector k 1 de parmetros


desconocidos; y , que recordemos que son los errores aleatorios asociados con
Y, un vector n 1.

(7)
El coeficiente 1 es el valor esperado de la variable Y cuando las variables ex- En la mayora de las aplicaciones
7
prcticas este parmetro no tiene
plicativas toman el valor cero . sentido.

Los coeficientes 2, 3..., k indican el incremento esperado en Y cuando se Lectura recomendada


incrementa, respectivamente, la variable X2, X3..., Xk en una unidad, perma-
En la obra de Gujarati (1997)
neciendo el resto de variables independientes constantes. En la medida en que pueden consultarse extensio-
nes del modelo de regresin
las variables explicativas del modelo estn relacionadas linealmente entre s, lineal mltiple.
resultar ms complicado determinar la contribucin marginal de cada una
de ellas a la variacin de la variable dependiente (existencia de multicolinea-
lidad).

Por tanto, en nuestra aplicacin, si queremos explicar la tasa de lectura (Y) a


partir de las variables explicativas: porcentaje de licenciados (X2) y porcentaje
de poblacin con televisin (X3), el modelo de regresin mltiple a estimar
ser:

1.38

donde:

1.39

6.3.2. Estimacin del modelo

El modelo de regresin estimado, que predice la variable dependiente en


funcin de k 1 variables independientes o explicativas, ser:

1.40

donde B es el vector k 1 de estimadores mnimo-cuadrticos: b1, b2, b3,..., bk.

El error de ajuste, como ya es conocido, ser la diferencia entre el valor obser-


vado y el valor pronosticado, es decir:

1.41

que en notacin matricial podemos expresar como:


FUOC PID_00173351 79 Estadstica aplicada a la investigacin en cultura

1.42

As pues, la suma de cuadrados de los residuos, que vamos a denominar E,


vendr dada por:

1.43

Los estimadores mnimo-cuadrticos de los parmetros poblacionales se


obtendrn al derivar E respecto de B e igualando cada derivada parcial a
cero. Obtendremos as las denominadas ecuaciones normales del hiper-
plano, que son similares a las obtenidas en la regresin simple (ecuacin
2), solo que ahora las vamos a expresar en forma matricial:

1.44

Por tanto, la expresin para calcular los coeficientes estimados de la


regresin ser:

1.45

Ejemplo

Vamos a calcular, utilizando Excel, los coeficientes de regresin en nuestro ejemplo uti-
lizando la expresin . Para ello, a partir de la tabla sabemos que:

1.46

La traspuesta de X es:

1.47

Ahora realizamos el producto XX' y seguidamente calculamos su inversa, que multipli-


caremos por X'. Los resultados son:
FUOC PID_00173351 80 Estadstica aplicada a la investigacin en cultura

1.48

y es:

Finalmente, si multiplicamos la matriz anterior por la matriz Y obtendremos el vector


de coeficientes B:

1.49

Con lo que el modelo estimado es:

1.50

Estos mismos resultados son los que nos proporciona la opcin regresin de la herra-
mienta anlisis de datos en Excel. En la figura siguiente se han destacado los valores de
los coeficientes de regresin en la salida de Excel.

Salida Excel de los coeficientes de regresin mltiple

Por tanto, incrementar en una unidad (1%) el porcentaje de licenciados producir un


incremento de aproximadamente 1,21 unidades (1,21%) en la tasa de lectura, siempre
que el porcentaje de poblacin se mantenga constante. Adems, si se mantiene fijo el
porcentaje de licenciados, un aumento de una unidad, un punto porcentual, del porcen-
taje de poblacin con audiencia de televisin producir una reduccin esperada de la tasa
de lectura de 0,72 unidades (0,72 puntos porcentuales).

6.3.3. Calidad del ajuste: medidas de variacin y coeficiente de


determinacin

Como tambin vimos en la regresin lineal simple, la medida de la calidad del


ajuste dado por el coeficiente de determinacin se basa en la descomposicin
de la varianza total de la variable dependiente en la varianza explicada por la
regresin (varianza de los valores pronosticados) y la varianza de los errores.
FUOC PID_00173351 81 Estadstica aplicada a la investigacin en cultura

1.51

El coeficiente de determinacin lo hemos definido como el porcentaje


de la varianza total que es explicada por la regresin, es decir:

1.52

Sin embargo, cuando aadimos nuevas variables explicativas a nuestro


modelo, la suma de cuadrados SCR aumenta, aumentando por tanto
el R2 aunque la variable que hemos introducido no sea relevante. Para
evitar este problema, se calcula el denominado coeficiente de determi-
nacin corregido, que se denota por y es:

1.53

Si el ajuste es perfecto, el coeficiente de determinacin corregido toma el va-


lor 1, pero, a diferencia del coeficiente de determinacin, no est acotado in-
feriormente, es decir, que si el ajuste es muy malo el puede tomar valores
negativos. Adems, el puede utilizarse para comparar modelos de regresin
que tienen distinto nmero de variables explicativas, de manera que si la di-
ferencia entre R2 y es importante nos estara indicando que hemos intro-
ducido en el modelo de regresin mltiple variables independientes que no
son importantes.

Ejemplo

A partir de los datos proporcionados en la tabla que mostramos al inicio del subapartado
6.3 y conocido que el modelo de regresin estimado es , pode-
mos determinar los valores pronosticados y los residuos de cada observacin (columnas
2 y 3 en la tabla siguiente), as como los cuadrados de las desviaciones respecto a la media
de los valores observados, de los predichos y de los errores (columnas 3, 4 y 5 en la tabla).

Valores para obtener la suma de cuadrados y el coeficiente de determinacin

Comunidad ei
autnoma

Andaluca 36,340 0,340 14,981 12,468 0,115

Aragn 38,850 1,850 0,688 1,042 3,424

Asturias 37,922 2,878 0,864 3,798 8,284

Baleares 39,493 1,807 2,043 0,143 3,266

Canarias 41,795 0,405 5,426 3,704 0,164

Cantabria 39,357 0,957 2,163 0,264 0,916

Castilla y 38,504 0,004 1,879 1,868 0,000


Len
FUOC PID_00173351 82 Estadstica aplicada a la investigacin en cultura

Comunidad ei
autnoma

Castilla-La 35,533 0,533 23,723 18,816 0,284


Mancha

Catalua 41,835 1,665 13,173 3,860 2,771

Com. Valen- 40,602 2,302 2,467 0,535 5,299


ciana

Extremadura 32,838 0,038 49,993 49,453 0,001

Galicia 39,150 2,850 12,749 0,520 8,120

Madrid 49,431 1,369 119,452 91,406 1,874

Murcia 40,184 0,484 0,029 0,098 0,234

Navarra 42,922 1,722 1,767 9,309 2,964

Pas Vasco 43,628 2,028 2,991 14,115 4,111

La Rioja 39,418 1,282 0,688 0,205 1,645

Sumas 677,800 0 255,075 211,603 43,472

Medias 39,871 0

A partir de los clculos reflejados en la tabla anterior, podemos obtener la suma de cua-
drados:

1.54

1.55

1.56

pudiendo comprobar que SCT = SCR + SCE.

El coeficiente de determinacin ser:

1.57

que indica que, en este ejemplo concreto (en una determinada muestra), el 82,96% de
la variabilidad de la tasa de lectura se explica por la relacin lineal con el porcentaje de
licenciados y el porcentaje de poblacin con audiencia de televisin.

El coeficiente de determinacin corregido lo calculamos a travs de la expresin . En


nuestro ejemplo:

1.58

La interpretacin de este resultado es similar a la de R2, solo que el coeficiente de deter-


minacin corregido tiene en cuenta tanto el tamao de nuestro conjunto de datos (n)
como el nmero de variables independientes consideradas en el modelo de regresin.
FUOC PID_00173351 83 Estadstica aplicada a la investigacin en cultura

Las correspondientes salidas de Excel se muestran en la siguiente figura.

2
Salida Excel de SCT, SCR, SCE, R y R corregido

6.3.4. Estimacin de la varianza de los estimadores. Error tpico


de estimacin

(8)
Si se cumplen las hiptesis bsicas del modelo8, podemos obtener un estima- Canavos (1992, captulos 13 y
14).
dor no sesgado de la varianza del error, que es:

1.59

La raz cuadrada de la anterior varianza es el error tpico y mide la dispersin


de la parte aleatoria del modelo que hemos especificado, es decir, es el error
que cometemos cuando empleamos la ecuacin de regresin para explicar y/
o predecir la variable Y.

6.3.5. Estimacin de la varianza de los coeficientes de regresin

Tambin bajo el cumplimiento de las hiptesis bsicas del modelo, el vector


de estimadores B se distribuye como una normal multivariante con vector de

medias y matriz de varianzas-covarianzas .

1.60

2
Por tanto, como (varianza de los errores) es desconocida, utilizando su es-
timador obtenemos un estimador de la matriz de varianzas-covarianzas de los
estimadores:

1.61

De manera que la varianza de un coeficiente individual bi vendr dado por:


FUOC PID_00173351 84 Estadstica aplicada a la investigacin en cultura

1.62

donde cii es el elemento ii-simo de la diagonal principal de la matriz . Observacin

Recordemos que las races cua-


Ejemplo dradas de los estimadores de
las varianzas son los errores t-
Los errores tpicos, de estimacin y de los coeficientes de regresin en nuestro ejemplo picos de los coeficientes de re-
se destacan en la figura siguiente. gresin.

Salida Excel del error tpico de estimacin y de los errores tpicos de los coeficientes

Vamos a ver cmo se han calculado. El error de estimacin se obtiene a partir de la ex-
presin :

1.63

Con lo que el error de estimacin es: .

Los errores tpicos de los coeficientes los calcularemos a partir de la expresin y sabiendo

que

1.64

1.65

1.66

6.3.6. Inferencia de los parmetros del modelo de regresin


mltiple. Prueba t de los coeficientes

Nuestro modelo lineal mltiple viene dado por:

1.67
FUOC PID_00173351 85 Estadstica aplicada a la investigacin en cultura

Para contrastar la significatividad de los parmetros, es decir, para determinar


si la variable Xi tiene un efecto significativo sobre la variable Y, permanecien-
do constante el efecto de las restantes variables, establecemos la siguiente hi-
ptesis nula y alternativa:

H0: i = 0

H1: i 0

Bajo la hiptesis nula, el estadstico

1.68

Tal y como hemos formulado las hiptesis, el contraste es bilateral (o de 2 co-


las), por lo que para un nivel de significacin dado rechazaremos H0 si
o , en cuyo caso podremos concluir que el coeficiente i es estadsti-
camente significativo.

Ejemplo

Vamos a contrastar la significatividad de los coeficientes 2 y 3. Para contrastar si el


porcentaje de licenciados tiene un efecto significativo sobre la tasa de lectura, teniendo
en cuenta el porcentaje de poblacin que ve frecuentemente televisin, las hiptesis que
planteamos son:

H0: 2 = 0

H1: 2 0

El estadstico de contraste es:

Para un nivel de significacin dado de , los valores crticos de una t con 14 grados
de libertad son 2,1147 y 2,1447. Por tanto, como rechazamos H0;
es decir, el porcentaje de licenciados tiene un efecto positivo y estadsticamente signi-
ficativo sobre la tasa de lectura, teniendo en cuenta el porcentaje de poblacin que ve
frecuentemente televisin.

De manera anloga, para contrastar si el porcentaje de poblacin que ve frecuentemente


televisin es significativamente distinto de cero y, por tanto, tiene un efecto significativo
sobre la tasa de lectura, teniendo en cuenta el porcentaje de licenciados, las hiptesis
que planteamos son:

H0: 3 = 0

H1: 3 0

El estadstico T toma el valor:

1.69

De nuevo, como , podemos concluir que el porcentaje de po-


blacin que ve frecuentemente televisin tiene un efecto negativo y estadsticamente
significativo sobre la tasa de lectura, considerando el porcentaje de licenciados.
FUOC PID_00173351 86 Estadstica aplicada a la investigacin en cultura

A las mismas conclusiones podramos haber llegado utilizando los p-valores, que son un
resultado que podemos encontrar en la salida de Excel (figura del subapartado siguiente).
Por ejemplo, el p-valor asociado a 2 es 0,0000171, que es menor que , por lo que
podemos rechazar la hiptesis nula de que no hay relacin lineal entre el porcentaje de
licenciados y la tasa de lectura, considerando el porcentaje de poblacin que ve frecuen-
temente televisin.

6.3.7. Intervalos de confianza para los coeficientes de regresin

Alternativamente a la prueba t, podemos construir el siguiente intervalo de


confianza del 100(1 )% para i.

1.70

Si el intervalo obtenido no contiene el valor cero es razonable concluir que


i es diferente de cero y, por tanto, las variables Y y X estn relacionadas li-
nealmente.

Ejemplo

Para un nivel de confianza del 95%, en nuestro ejemplo el intervalo para 2 lo calcula-
remos como:

1.71

Por tanto, , es decir, teniendo en cuenta el efecto del porcentaje de


poblacin que ve frecuentemente televisin, el efecto estimado de un incremento del
1% en el porcentaje de licenciados es un incremento de la tasa de lectura de entre el
0,8034% y el 1,6171%.

Anlogamente, el intervalo de confianza para 3 lo podemos construir as:

1.72

1.73

El resultado obtenido indica que, considerando el efecto del porcentaje de licenciados,


el efecto estimado de un incremento de un 1% en el porcentaje de poblacin que ve fre-
cuentemente televisin es una reduccin de la tasa media de lectura de entre el 0,3027%
y el 1,1383%.

En la figura siguiente se destacan los resultados obtenidos anteriormente en la salida de


Excel.
FUOC PID_00173351 87 Estadstica aplicada a la investigacin en cultura

Salida Excel de los intervalos de confianza y del estadstico t de los coeficientes


FUOC PID_00173351 88 Estadstica aplicada a la investigacin en cultura

7. Anlisis factorial. Culto-tipos y otras clasificaciones


culturales

7.1. Anlisis factorial

Aunque parezca extrao, en algunas ocasiones dispondremos de una ingente


cantidad de variables y registros que dificultarn su anlisis. Es el claro ejemplo
de que un exceso de informacin puede ser contraproducente... o no.

Ejemplo

Un estudio realizado sobre la ciudad de Ganda (Rausell y otros, 2004) revel que su ciu-
dadana poda ser clasificada atendiendo a las caractersticas de la funcin de demanda
cultural en 8 segmentos o culto-tipos diferenciados. Los datos fueron recabados median-
te encuesta por muestreo; el cuestionario constaba de 58 variables. El universo era la po-
blacin residente mayor de 15 aos; la seleccin de la muestra se realiz por muestreo
aleatorio simple, con una confianza del 95,5%, P = Q = 50%, y un error muestral de 4,6%.

Mediante el uso del anlisis factorial, se consiguieron agrupar las caractersticas sobre
inters y consumo cultural declarado en un nmero menor de factores, a partir de cuyo
valor y del anlisis de su estructura se identificaron los distintos culto-tipos:

1)Entusiastas: alto inters, bajo consumo, mujeres, nivel variado de renta y formacin.

2)Jvenescinfilos: baja edad media, duplican la asistencia media al cine y en consumo


de DVD, msica moderna.

3)Lectores: inters y prctica de la cultura escrita, ligera mayora de hombres, mediana


edad.

4) Cultos omnvoros: niveles de consumo ms altos en la mayora de los consumos


culturales.

5)Msicos: grupo transversal con especial inters por la msica, una proporcin elevada
practica la msica.

6)Demandantesdeformacin: mujeres con bajo inters por la cultura, pero con un


elevado inters por la formacin artstica.

7)Indiferentes.

8)Refractarios.
FUOC PID_00173351 89 Estadstica aplicada a la investigacin en cultura

El anlisis factorial es una metodologa que busca resumir la informa-


cin contenida en una matriz de datos (n. de variables n. de regis-
tros: m n), obteniendo como resultado un menor nmero de variables
sintticas, que denominamos factores. Estas nuevas variables se cons-
truyen mediante combinacin lineal de las variables originales, mini-
mizando la prdida de informacin. Es ms, los factores estn altamen-
te correlacionados con las variables originales a partir de las que se han
conformado, pero no correlacionan entre s. Por tanto, podemos decir
que el anlisis factorial es un mtodo de reduccin de datos empleado
para explicar la variabilidad de las variables originales a partir de un
nmero menor (factores).

Factor j Xij = ai1 Z1j + ... + aik Zkj

donde Z son los valores tipificados de las variables (dato muestral, al


que se le resta la media de la muestra; al resultado se le divide por la
desviacin tpica).

Las fases del proceso son:

1)Clculodelamatrizdecorrelaciones. Deberamos observar altas correla- Test de esfericidad de


ciones significativas entre las variables. Adems, es conveniente realizar dos Barlett

tests clave: el test de esfericidad de Barlett y el test de Kaiser-Meyer-Olkin El test de esfericidad de Barlett
(KMO). contrasta la hiptesis de que la
matriz de correlaciones es una
matriz identidad, esto es, que
no existe correlacin alguna; el
2) Seleccin de factores. El primer factor recoge el mayor porcentaje de la p-value de este test debe ser lo
ms cercano a 0,00.
variabilidad original, el segundo la mayor proporcin de la variabilidad res-
tante, y as sucesivamente. Escogemos tantos factores como sea conveniente
para perder el mnimo de variabilidad explicada. Por lo general, suele aplicarse Test de Kaiser-Meyer-Olkin
la regla de Kaiser, consistente en retener solo aquellos factores cuyos valores
El test de Kaiser-Meyer-Olkin
propios sean mayores que la unidad. El valor propio se obtiene como la suma mide la idoneidad de los datos
de los cuadrados de los pesos de cada columna de la matriz factorial; la divi- para el anlisis factorial; valores
entre 0,9 y 1 son ideales, entre
sin del valor propio entre el nmero de variables indica el porcentaje de la 0,8 y 0,9 son buenos, siendo
aceptables valores entre 0,7 y
varianza total que explica este factor. 0,8.

3)Anlisisdelamatrizfactorial. Muestra las correlaciones entre variables


originales y los factores, denominadas coeficientes factoriales o pesos (aik).

4)Interpretacindelosfactores. Nos permite determinar qu expresa o re-


presenta cada factor, otorgndole una denominacin; en esta fase es muy im-
portante el conocimiento del investigador (y cierto arte) para "bautizar" cada
factor. Para que un factor sea interpretable, es necesario que los coeficientes
factoriales sean cercanos a la unidad, cada variable debera tener coeficientes
altos en un nico factor, y no deberamos encontrar factores con coeficientes
similares. Es recomendable, por tanto, trabajar con matrices factoriales rota-
FUOC PID_00173351 90 Estadstica aplicada a la investigacin en cultura

das, tcnica que intenta aproximar al mximo los ejes de coordenadas (facto-
riales) a las variables que los representan; generalmente se aplica el tipo de
rotacin VARIMAX.

5)Clculodelosfactoresapartirdelaexpresinanterior.

Ejemplo

En Marco-Serrano y otros (2002) se dispona de una serie de variables relativas a un mo-


delo tentativo de generacin de derechos de autor. Para simplificar el anlisis se necesi-
taba reducir el nmero de variables originales (15). Mediante el anlisis factorial se con-
sigui reducir el set de variables a solo dos factores: inputs de demanda cultural e inputs
de oferta cultural, quedando un tercer factor que fue rechazado por su escasa representa-
tividad y aportacin de informacin.

El anlisis factorial puede clasificarse en dos tipos:

1)Anlisisfactorialexploratorio. Parte de la hiptesis a priori de la existen-


cia de determinados factores, aunque estos se desconocen; mediante este tipo
de anlisis se trata de descubrir relaciones de correlacin entre las variables
originales.

2)Anlisisfactorialconfirmatorio. Parte de la hiptesis de que existe una


serie de factores latentes, cuya conformacin es a partir de la combinacin
de las variables preexistentes basndose en una teora existente, esto es, se
propone a priori el modelo de generacin de datos.

Ejemplo

En Marco-Serrano y otros (2002) se practic un anlisis exploratorio. A partir de los estu-


dios sobre economa, sociedad y cultura se tiene cierta percepcin de cmo las diferentes
variables (variables relativas a fenmenos culturales, variables relativas a equipamientos
culturales, capital humano, renta, etc.) pueden agruparse para conformar los factores,
pero no existe un modelo terico establecido.

A continuacin se muestra la matriz factorial, en realidad cuatro de ellas, que representan


cuatro modelos diferentes; en gris se muestran los coeficientes factoriales que permiten
interpretar y calcular los factores. Adems, podemos comprobar cmo son satisfactorios
los tests de Barlett (p-value = 0,000) y de KMO (valores entre 0,7 y 0,9). Las ltimas filas
corresponden al porcentaje de variabilidad explicado por los factores escogidos (p. ej., el
modelo all sectors permite explicar un 86,98% con solo 3 factores.

Matrices factoriales: tests KMO y Barlett, y porcentaje de informacin acumulada por los
componentes*,**

Variables Todos los mbitos (red.) Artes escnicas Musical Audiovisual

PC11 PC21 PC31 PCI12 PC22 PC13 PC23 PC14 PC24

RFCESC 0,860 0,000 0,239 0,868 0,000

REPESC 0,948 0,000 0,119 0,949 0,000

ESPESC 0,952 -0,158 -0,218 0,958 -0,130

RECMUS 0,866 0,112 0,304 0,891 0,000

REPMUS 0,855 0,128 0,316 0,881 0,000

* PCij = componente principal i del modelo j.


** Los espacios en blanco indican que las variables no han sido incluidas en el modelo.
Fuente: Marco-Serrano y otros (2002)
FUOC PID_00173351 91 Estadstica aplicada a la investigacin en cultura

Variables Todos los mbitos (red.) Artes escnicas Musical Audiovisual

PC11 PC21 PC31 PCI12 PC22 PC13 PC23 PC14 PC24

ESPMUS 0,958 -0,153 -0,200 0,951 -0,160

SM 0,855 -0,224 -0,331 0,886 -0,176 0,852 -0,213 0,877 -0,178

CINES 0,938 0,000 0,000 0,963 0,000

BUTACAS 0,930 0,000 0,000 0,961 0,000

ESPCINE 0,958 -0,153 -0,200 0,955 -0,133

TVL 0,474 0,000 0,638 0,500 0,000

M2COMMIN 0,990 0,000 0,000 0,987 0,000 0,979 0,000 0,984 0,000

RESTBAR 0,980 0,000 0,000 0,974 0,000 0,972 0,000 0,979 0,000

CAPHUM 0,319 0,713 -0,330 0,341 0,752 0,353 0,737 0,354 0,752

RFD 0,180 0,837 0,000 0,199 0,842 0,215 0,837 0,201 0,838

KMOBar- 0,883 0,829 0,796 0,853


lettSig. 0,000 0,000 0,000 0,000

%Ac. 70,93 9,17 6,88 67,94 16,63 65,96 16,60 65,28 14,77

86,98 84,57 82,56 80,05

* PCij = componente principal i del modelo j.


** Los espacios en blanco indican que las variables no han sido incluidas en el modelo.
Fuente: Marco-Serrano y otros (2002)

Ntese que, en el ejemplo anterior, el mtodo de clculo es en realidad un


anlisis de componentes principales (ACP). El anlisis factorial y el ACP son
dos metodologas relacionadas, pudiendo llegar a confundir el ACP como una
etapa del anlisis factorial.

En suma, la mayor diferencia entre ambos es el objetivo ltimo; a pesar de


que ambos buscan maximizar la varianza explicada con el mnimo de factores
posibles, el anlisis factorial va un poco ms lejos que el ACP al diferenciar
entre varianza comn (en la que se centra para hallar las comunalidades) y
varianza nica. De este modo, podemos considerar que el objetivo del anlisis
factorial es ms amplio.

7.2. Anlisis clster

El anlisis cluster, tambin denominado anlisis de conglomerados, es una


tcnica de anlisis multivariante cuyo objetivo consiste en, a partir de una
muestra de n individuos sobre los que se han observado una serie de caracte-
rsticas (variables), agrupar los individuos en distintos grupos, de manera que
FUOC PID_00173351 92 Estadstica aplicada a la investigacin en cultura

los elementos que integran cada grupo sean lo ms homogneos posible res-
pecto de las variables que los caracterizan y, a la vez, que los grupos obtenidos
sean lo ms heterogneos posible en relacin con las variables observadas.

Partimos de una matriz de datos (o matriz de informacin) donde aij representa


el valor de la variable j en el individuo i.

Matriz de datos de una muestra

Individuo X1 X2 ... Xk

1 a11 a12 ... a1k

2 a21 a22 ... a2k

... ... ... ... ...

an1 an2 ... ank

El procedimiento de aplicacin de esta tcnica consiste, en primer lugar, en


medir la similitud para lo que se pueden utilizar medidas de correlacin, dis-
tancia o asociacin, en segundo lugar, debemos establecer el mtodo a seguir
para formar los grupos y, en tercer lugar, debemos decidir finalmente en cun-
tos grupos queremos agrupar nuestras observaciones.

Ejemplo de anlisis cluster

Vamos a suponer que disponemos de una pequea muestra de 10 individuos a los que
hemos preguntado acerca de las siguientes dos caractersticas culturales de su viaje a una
determinada ciudad:

X1: Mi visita a la ciudad es una manera de divertirme y escapar de la rutina diaria.

X2: Estoy especialmente interesado/a en saber ms cosas de la cultura de la ciudad.

Las respuestas obtenidas son las que se reflejan en la tabla siguiente

Matriz de datos de una muestra

Individuo X1 X2

1 5 3

2 4 2

3 5 3

4 3 4

5 5 2

6 4 3

7 2 5

8 3 5

9 2 5

10 3 4
FUOC PID_00173351 93 Estadstica aplicada a la investigacin en cultura

Como se ha comentado, el proceso de clasificacin consistir, a grandes rasgos,


en la obtencin de una medida de homogeneidad (disimilaridad, distancia,
etc.) entre los individuos y, posteriormente, la aplicacin de un mtodo de
clasificacin para ir confeccionando los distintos grupos.

7.2.1. Medida de disimilaridad

Existe una gran cantidad de medidas de homogeneidad, disimilaridad o dis-


tancia, aunque no hay ninguna regla que nos permita designar una disimila-
ridad como la ms adecuada para todos los anlisis que podamos plantear.
Adems, tambin hay que considerar la naturaleza de las variables con las que
estemos trabajando (cuantitativas o cualitativas).

Aplicaciones de las
Las medidas distancia ms comunes para determinar la disimilaridad medidas distancia
entre dos individuos son:
Las medidas distancia son las
que habitualmente se utilizan
en problemas de economa.
1.74

1.75

1.76

Ejemplo

Vamos a calcular estas distancias para los individuos 1 y 2 a partir de los datos de que
disponemos (tabla del ejemplo anterior).

1.77

1.78

1.79

Utilizando el paquete estadstico SPSS, podemos obtener fcilmente las matri-


ces de distancia. Para ello, seleccionamos analizar > clasificar > conglomerados
jerrquicos..., tal como se muestra en la figura siguiente.
FUOC PID_00173351 94 Estadstica aplicada a la investigacin en cultura

Anlisis cluster con SPSS

A continuacin, tal como se ve en la figura siguiente, seleccionamos las varia-


bles X1 y X2 y hacemos clic en el botn "mtodo" para establecer la medida
de disimilaridad. En funcin del tipo de variable considerada en el anlisis
mtrica, de recuento o binaria, las medidas de distancia o asociacin son
unas u otras.

Medidas de disimilaridad con SPSS

Para variables cuantitativas, las medidas disponibles en SPSS son distancia eu-
cldea, distancia eucldea al cuadrado, distancia bloque, distancia de Cheby-
chev, distancia de Minkowski, distancia personalizada, coseno y correlacin de
Pearson. Estas dos ltimas son medidas de similaridad. De todas estas medidas,
la ms utilizada (por defecto en el SPSS) es la distancia eucldea al cuadrado.

En la ventana de SPSS "anlisis de conglomerados jerrquicos" (a la izquierda


de la figura anterior), pulsando en el botn "estadsticos" podemos activar las
casillas de "historial de conglomeracin" y "matriz de distancias" para que estos
resultados aparezcan en las salidas del anlisis cluster.

Ejemplo

Para los datos de nuestro ejemplo, la matriz de distancia eucldea es la siguiente:


FUOC PID_00173351 95 Estadstica aplicada a la investigacin en cultura

Salida SPSS: matriz de distancias. Distancia eucldea al cuadrado

Caso 1 2 3 4 5 6 7 8 9 10

1 ,000 2,000 ,000 5,000 1,000 1,000 13,000 8,000 13,000 5,000

2 2,000 ,000 2,000 5,000 1,000 1,000 13,000 10,000 13,000 5,000

3 ,000 2,000 ,000 5,000 1,000 1,000 13,000 8,000 13,000 5,000

4 5,000 5,000 5,000 ,000 8,000 2,000 2,000 1,000 2,000 ,000

5 1,000 1,000 1,000 8,000 ,000 2,000 18,000 13,000 18,000 8,000

6 1,000 1,000 1,000 2,000 2,000 ,000 8,000 5,000 8,000 2,000

7 13,000 13,000 13,000 2,000 18,000 8,000 ,000 1,000 ,000 2,000

8 8,000 10,000 8,000 1,000 13,000 5,000 1,000 ,000 1,000 1,000

9 13,000 13,000 13,000 2,000 18,000 8,000 ,000 1,000 ,000 2,000

10 5,000 5,000 5,000 ,000 8,000 2,000 2,000 1,000 2,000 ,000

Esta es una matriz de disimilaridades

Observaciones

A la hora de calcular las distancias en la matriz de distancias debemos considerar, por


un lado, la posible existencia de variables que estn altamente correlacionadas y, por
otro, si las variables estn expresadas en distintas unidades de medida es conveniente
estandarizar o tipificar los datos para eliminar el efecto de escala.

7.2.2. Formacin de grupos

Una vez obtenida la matriz de distancias, que es una matriz de disimilarida-


des, el siguiente paso en el anlisis cluster consiste en formar los grupos. Para
ello, debemos aplicar un mtodo que, partiendo de la matriz de distancias, es-
tablezca la composicin de los grupos. Los mtodos de agrupacin pueden ser:

Jerrquicos o no jerrquicos.
Aglomerativos (asociativos o aumentativos) o disociativos (diminutivos).

Nosotros vamos a centrarnos en el mtodo jerrquico aglomerativo, de forma


que en un primer momento cada individuo forma un grupo y, sucesivamente,
vamos fusionando grupos que se encuentran cercanos entre s. El mtodo je-
rrquico divisivo sera lo contrario: en el punto de partida, todos los casos for-
maran un solo grupo, que iramos dividiendo sucesivamente en grupos ms
pequeos. Por ltimo, en los mtodos no jerrquicos se establece a priori el
nmero de grupos y los individuos se van asignando a cada grupo.

Dentro de los mtodos jerrquicos aglomerativos, podemos recurrir a distin-


tos procedimientos o mtodos de conglomeracin. En la siguiente figura se
muestra el listado de mtodos que estn disponibles en SPSS.
FUOC PID_00173351 96 Estadstica aplicada a la investigacin en cultura

Mtodos jerrquicos de conglomeracin con SPSS

Vamos a describir brevemente estos mtodos:

1) Vinculacin intergrupos. Se calcula la distancia entre dos grupos como Ventajas de la vinculacin
distancia media entre todos los pares de observaciones que pueden formarse intergrupos

tomando un miembro de un grupo y otro miembro de otro grupo. El mtodo de vinculacin in-
tergrupos tiene la ventaja de
que utiliza informacin de to-
dos lo pares de puntos en cada
1.80 decisin. Es el mtodo que uti-
liza por defecto SPSS.

1.81

Ejemplo de aplicacin del mtodo de vinculacin intergrupos

Veamos con nuestro ejemplo cmo se aplica este mtodo. En la tabla siguiente se mues-
tra el historial de conglomeracin que proporciona SPSS para el mtodo de vinculacin
intergrupos basado en la distancia eucldea al cuadrado (vase la tabla del subapartado
7.2.1).

Historial de conglomeracin. Mtodo de vinculacin intergrupos

Etapa Conglomerado Coefi- Etapa en la que el Prxima


que se combina cientes conglomerado apa- etapa
rece por primera vez

Conglo- Conglo- Conglo- Conglo-


merado1 merado2 merado1 merado2

1 4 10 ,000 0 0 4

2 7 9 ,000 0 0 8

3 1 3 ,000 0 0 5

4 4 8 1,000 1 0 8
FUOC PID_00173351 97 Estadstica aplicada a la investigacin en cultura

Etapa Conglomerado Coefi- Etapa en la que el Prxima


que se combina cientes conglomerado apa- etapa
rece por primera vez

Conglo- Conglo- Conglo- Conglo-


merado1 merado2 merado1 merado2

5 1 6 1,000 3 0 7

6 2 5 1,000 0 0 7

7 1 2 1,500 5 6 9

8 4 7 1,667 4 2 9

9 1 4 8,960 7 8 0

En la columna "conglomerado que se combina" encontramos los casos o individuos que


se combinan para formar los grupos. La columna "coeficientes" hace referencia a la dis-
tancia entre los grupos.

As, en la primera etapa, el conglomerado 1 est formado por el individuo 4 y el conglo-


merado 2 por el 10, y su distancia es de 0 (calculada en base a la distancia eucldea al
cuadrado, segn la tabla del subapartado 7.2.1). El grupo resultante de la fusin de estos
dos individuos se denota por SPSS con el nombre del individuo del conglomerado 1, es
decir, el 4. Por tanto, en la cuarta etapa se fusionan el conglomerado 4 (que est formado
por los individuos 4 y 10 fusionados de la primera etapa) y el conglomerado 2 por el
individuo 8.

Vamos a calcular ahora la distancia (coeficiente) del conglomerado que se forma en la


octava etapa. Si observamos detenidamente el historial de conglomeracin, el grupo 4
est formado por los casos 4, 8 y 10, mientras que el grupo 7 est integrado por los
individuos 7 y 9 (unidos en la segunda etapa). Por tanto, la distancia se calcular de la
siguiente forma:

1.82

1.83

2)Vinculacinintragrupos. Se basa en minimizar la distancia media entre


todos los casos del cluster resultante.

1.84

1.85

Ejemplo de aplicacin del mtodo de vinculacin intragrupos

Historial de conglomeracin. Mtodo de vinculacin intragrupos

Etapa Conglomerado Coefi- Etapa en la que el Prxima


que se combina cientes conglomerado apa- etapa
rece por primera vez

Conglo- Conglo- Conglo- Conglo-


merado1 merado2 merado1 merado2

1 4 10 ,000 0 0 4
FUOC PID_00173351 98 Estadstica aplicada a la investigacin en cultura

Etapa Conglomerado Coefi- Etapa en la que el Prxima


que se combina cientes conglomerado apa- etapa
rece por primera vez

Conglo- Conglo- Conglo- Conglo-


merado1 merado2 merado1 merado2

2 7 9 ,000 0 0 7

3 1 3 ,000 0 0 5

4 4 8 ,667 1 0 7

5 1 6 ,667 3 0 6

6 1 5 1,000 5 0 8

7 4 7 1,200 4 2 9

8 1 2 1,200 6 0 9

9 1 4 5,511 8 7 0

Consideremos, por ejemplo, la etapa 5 en la que se fusionan los grupos 1 (formado por
los individuos 1 y 3 unidos en la etapa 3) y 6. En este caso la distancia es:

1.86

1.87

Se forma el grupo (1,3,6) porque la distancia que se obtiene de 0,667 es la mnima dis-
tancia de todas las que se calculan en esta etapa, en la que tambin se compara el grupo
(1,3) con los grupos (4,8,10) y (7,9) generados en etapas anteriores.

3)Vecinomscercano. El primer conglomerado est formado por los indi-


viduos ms prximos. A continuacin, volvemos a medir las distancias, pero
cuando se mide la distancia entre el grupo formado y un individuo se toma la
distancia mnima de los individuos del grupo al nuevo individuo. Al evaluar
las distancias obtenidas y buscar la distancia mnima puede que al grupo for-
mado en la etapa anterior se le aada un nuevo individuo o que se forme un
nuevo grupo de dos observaciones.

4) Vecino ms lejano. Este mtodo es similar al anterior. Se parte de unir


los dos casos con la distancia ms prxima. En la segunda etapa se calculan
nuevamente las distancias, pero se toma la distancia mxima de los individuos
del grupo formado al nuevo individuo.

5)Agrupacindecentroides. Se basa en el clculo del centroide de cada grupo


como la media de dicho grupo. A partir de ellas, la distancia entre dos grupos es
la distancia entre sus centroides. En este mtodo se parte de considerar los dos
individuos que se encuentran ms cerca, de manera que el grupo que forman
se sustituye por la observacin promedio (centroide). Se recalcula la matriz
FUOC PID_00173351 99 Estadstica aplicada a la investigacin en cultura

de distancias y se vuelven a unir los dos individuos que se encuentran ms


prximos. El proceso concluye cuando todos los individuos son asignados a
un solo conglomerado.

Debe considerarse que cuando se fusionan dos grupos, el centroide del nue-
vo grupo es una media ponderada de los centroides de los grupos fusionados,
donde los pesos de ponderacin son los tamaos de los conglomerados res-
pectivos. Por tanto, el tamao de los grupos influye en el centroide del nuevo
grupo, que se acercar ms al grupo de mayor tamao.

La principal ventaja del mtodo de agrupacin de centroides es que es menos


sensible a los valores atpicos que otros mtodos.

6)Agrupacindemedianas. Este procedimiento es similar al anterior, pero Observacin


ahora se calcula un centroide no ponderado a partir de los grupos que fusio-
Los mtodos centroide, de la
nan. Por tanto, cuando se unen grupos pequeos con grupos grandes, todos mediana y de Ward requieren
ellos tienen el mismo efecto en la caracterizacin del conglomerado resultante. el uso de la distancia eucldea
al cuadrado como criterio. Los
otros cuatro pueden utilizar
cualquier medida de proximi-
7.2.3. Eleccin del nmero de grupos o conglomerados dad.

Para decidir acerca del nmero de grupos a considerar en nuestro anlisis, po-
demos utilizar la representacin grfica que resume el historial de agrupacin
y que se conoce con el nombre de dendograma.

Para obtener el dendograma en SPSS, en la ventana "anlisis de conglomerados


jerrquico" (imagen izquierda de la figura del subapartado 7.3.1) debemos se-
leccionar la opcin "grficos" y activar la casilla de verificacin de dendograma
y seleccionar la orientacin del grfico, como se muestra en la figura siguiente.
FUOC PID_00173351 100 Estadstica aplicada a la investigacin en cultura

Dendograma con SPSS

Ejemplo

En la figura siguiente se muestra el dendograma de nuestro ejemplo, utilizando como


mtodo de agrupacin la vinculacin intergrupos y como medida de disimilaridad la
distancia eucldea al cuadrado (probablemente la ms recomendable).

Dendograma que utiliza la vinculacin intergrupos


FUOC PID_00173351 101 Estadstica aplicada a la investigacin en cultura

Como puede observarse en el dendograma, el punto de partida del anlisis


jerrquico aglomerativo consiste en considerar cada individuo como un grupo
y que todos se van agrupando hasta que forman un nico grupo. En el proceso
de agrupacin, vamos agrupando individuos que cada vez son ms diferentes.
Por tanto, la pregunta que nos debemos hacer es: cuntos grupos vamos a
considerar?

Ejemplo

En este sencillo ejemplo que estamos desarrollando, la respuesta a la pregunta anterior es


sencilla, vamos a considerar dos grupos. Como puede verse en el historial de agrupacin
(primera tabla del subapartado 7.2.2), en la etapa 8 se fusionan individuos que distan
1,667 unidades, dando lugar a dos grupos. El primero estar formado por los individuos
4, 7, 8, 9 y 10, que son los individuos que presentan valores altos en la variable X2 y bajos
en X1, este grupo de visitantes lo podramos denominar de turismo cultural, y el segundo
grupo estara formado por los individuos 1, 2, 3, 5 y 6, individuos que, al contrario que
los del grupo anterior, muestran valores altos en X1 y bajos en X2, por lo que podramos
clasificarlos en el grupo de turismo hednico.
FUOC PID_00173351 103 Estadstica aplicada a la investigacin en cultura

Bibliografa
Canavos, C. (1992). Probabilidad y estadstica. Aplicaciones y mtodos. Madrid: McGraw-Hill.

Carrasco Arroyo, S. (2006, diciembre). "Medir la cultura: una tarea inacabada". Perifrica
(n. 7). Cdiz: Universidad de Cdiz.

Carrasco, S. (1999). Los sistemas culturales locales en la Comunidad Valenciana: Una aplicacin
desde el anlisis de componentes principales. Tesis doctoral presentada en el Departamento de
Economa Aplicada de la Universidad de Valencia.

Carrasco, S.; Rausell, P. (2001). "La provisin de cultura en Espaa desde una perspectiva
del anlisis regional". ICE (n. 792).

Castellanos Ribot, A. (2005). Asistencia tcnica para la elaboracin de un diagnstico y una


metodologa para disear indicadores culturales en los pases centroamericanos. [Informe en lnea].
UNESCO. [Recuperado el 17 de junio del 2011.]

<http://sic.conaculta.gob.mx>

Escuder, R.; Murgui, S. (1995). Estadstica Aplicada. Economa y Ciencias Sociales. Valencia:
Tirant lo Blanch.

Esteban, J. (coord.) (2005). Estadstica descriptiva y nociones de probabilidad. Madrid: Thom-


son.

Etxeberria, J. (2007). Regresin mltiple (2. ed.). Madrid: La Muralla.

Gujarati, D. (2003). Econometra (4. ed.). Madrid: McGraw-Hill.

INE (2004). Encuesta de empleo del tiempo 2002-2003. Resultados definitivos. Nota de prensa
de 1 de julio del 2004, Madrid.

INE (2007). "Encuesta de Empleo del Tiempo. Qu hacemos y durante cunto tiempo". Cifras
INE. Boletn informativo (n. 4, 2007). Madrid: Instituto Nacional de Estadstica.

Juan, A.; Sedano, M.; Vila, A. (2002). "Distribuciones muestrales". Proyecto e-Math. Barce-
lona: UOC.

Juan, A.; Sedano, M.; Vila, A.; Lpez, A. (2003). "Contraste de Hiptesis de Dos Pobla-
ciones". Proyecto e-Math. Barcelona: UOC.

Juan, A.; Sedano, M.; Vila, A.; Martnez, J. F.; Lpez, A. (2003). "Modelos de Probabi-
lidad". Proyecto e-Math. Barcelona: UOC.

Lee, C.; Lee, Y.; Wicks, B. E. (2004). "Segmentation of Festival Motivation by Nationality
and Satisfaction". Tourism Management (25 -1).

Marco-Serrano, F.; Rausell-Kster, P.; Carrasco-Arroyo, S. (2002). Analysis of the aut-


hors' rights collection frontier using PCA-MDEA: An application to the Valencia region. Pes-
quisa Operacional (22 -2).

Mariscal, J. L. (2006). "Formacin y capacitacin de los gestores culturales". Apertura (n. 4).

Ministerio de Cultura (2008). Encuesta de Hbitos y Prcticas Culturales en Espaa


2006-2007. Madrid.

OCDE (1997). Better understanding our cities. The role of urban indicators. Pars: OCDE.

Rausell, P.; Abeledo, R.; Cabaes, F.; Marco, F.; Montagut, J. (2009). El Sector Profe-
sional de la Cultura en la Regin de Murcia. Caractersticas de la Gestin Cultural y la Deteccin
de las Necesidades Formativas del Sector Profesional de la Gestin Cultural en la Regin de Murcia.
Murcia: Murcia Cultural, S.A.

Rausell, P.; Sanchs, N.; Martnez, J.; Asuaga, C.; Boluda, A.; Carrasco, S.; Mayor,
R. (2004). Diagnosi de la realitat dels sectors culturals de Gandia. Valencia: Universidad de Va-
lencia.

Terrdez, M. (2002). "Anlisis de componentes principales". Proyecto e-Math. Barcelona:


UOC.
FUOC PID_00173351 104 Estadstica aplicada a la investigacin en cultura

Terrdez, M. (2003). "Anlisis de la varianza (ANOVA)". Proyecto e-Math. Barcelona: UOC.

Uriel, E.; Contreras, D.; Molt, M. L. (1990). Econometra. El modelo lineal. Madrid: AC.

Vila, A.; Sedano, M.; Juan, A.; Lpez, A. (2003). "Contrastes de hiptesis de 1 poblacin".
Proyecto e-Math. Barcelona: UOC.

También podría gustarte