Documentos de Académico
Documentos de Profesional
Documentos de Cultura
aplicada a la
investigacin en
cultura
Salvador Carrasco Arroyo
Vicente Coll Serrano
Francis Marco-Serrano
Pau Rausell Kster
Luis Vila Losada
PID_00173351
FUOC PID_00173351 Estadstica aplicada a la investigacin en cultura
Ninguna parte de esta publicacin, incluido el diseo general y la cubierta, puede ser copiada,
reproducida, almacenada o transmitida de ninguna forma, ni por ningn medio, sea ste elctrico,
qumico, mecnico, ptico, grabacin, fotocopia, o cualquier otro, sin la previa autorizacin escrita
de los titulares del copyright.
FUOC PID_00173351 Estadstica aplicada a la investigacin en cultura
ndice
Bibliografa................................................................................................. 103
FUOC PID_00173351 5 Estadstica aplicada a la investigacin en cultura
Una vez hayamos avanzado en las cuestiones bsicas es preciso abordar nuevas
dimensiones que nos permitan analizar las mltiples facetas de la cultura des-
de una perspectiva integral. Y dichas dimensiones tienen que incluir aspectos
ms difcilmente mensurables, como la diversidad cultural, la vitalidad cultu-
ral, la capacidad creativa de una colectividad, la construccin de la identidad
cultural y la participacin o el acceso a la cultura.
Ciclo cultural
FUOC PID_00173351 10 Estadstica aplicada a la investigacin en cultura
Equipamiento y materiales
Equipamiento y materiales de apoyo de apoyo
Archivos (50003).
Bibliotecas (30403).
Ejemplo
Una notable ventaja del sistema es que nos permite descargar los datos en formato Excel
para poder manipularlos en funcin de nuestros intereses.
Esta utilidad otorga un elevado grado de versatilidad a las bases de datos del ministerio.
Desde finales del 2009 ya contamos con una publicacin que habla especfi-
camente de la cuenta satlite de la cultura en Espaa y avanza resultados del
perodo 2000-2007.
Estadsticas regionales
La contabilidad regional es ms escasa y solo algunas CC. AA. cuentan con publicaciones
ocasionales que hacen referencia a la dimensin econmica de la cultura.
Otra institucin que proporciona informacin ms o menos cuantitativa so- Lectura recomendada
bre la cultura es la de los observatorios de cultura. Estos empiezan a surgir
Para saber ms sobre obser-
aproximadamente a finales de los aos ochenta y encuentran durante los no- vatorios de la cultura podis
venta y hasta la actualidad su mayor expansin y consolidacin. En su origen, leer el documento Kultura 07.
Observatorio Vasco de la Cultu-
estos entes nacen con la voluntad de sistematizar las fuentes de informacin ra.
y desarrollar nuevas investigaciones y anlisis sobre polticas culturales, as
como de favorecer el desarrollo cultural. Actualmente son muchos y de muy
diversa ndole los organismos que se denominan observatorios culturales o se
les considera como tales por alguna de las tareas que realizan. Las razones que
explican esta variedad en la tipologa de observatorios culturales son mlti-
ples: su naturaleza, funciones y mbito de accin; los rganos que los consti-
tuyen, los y las profesionales que los componen, as como los agentes que se
encuentran en el origen de su formacin. Existen, hoy en da, algunas bases de
datos en las que se puede encontrar una extensa recopilacin de organismos
que se dedican a la observacin cultural.
len dedicarse a analizar una zona geogrfica delimitada y tienen como objeti-
vo contribuir a la definicin, desarrollo y evaluacin de las polticas culturales
implementadas por los mismos organismos pblicos de los que dependen.
Porcentaje de la distribucin del gasto pblico en cultura por niveles de gobierno en distintos
pases europeos
Fuente: Consejo de Europa/ERICARTS, Compendium of Cultural Policies and Trends in Europe (9. edicin), 2008
FUOC PID_00173351 16 Estadstica aplicada a la investigacin en cultura
Fuente: Consejo de Europa/ERICARTS, Compendium of Cultural Policies and Trends in Europe (9. edicin), 2008
FUOC PID_00173351 17 Estadstica aplicada a la investigacin en cultura
Hay que tener en cuenta que el valor elegido como trmino de comparacin,
base o referencia, no debe ser un valor atpico, sino encontrarse en el campo
de variacin habitual de la magnitud en cuestin. As, por ejemplo, resulta po-
sible conocer y analizar la evolucin del nmero de asientos en los teatros de
una poblacin, valorar el incremento del presupuesto destinado a actividades
culturales por un gobierno local en una legislatura, o saber cul ha sido la evo-
lucin del volumen de negocio de las industrias creativas en un rea concreta,
entre otras muchas magnitudes o variables vinculadas a la actividad cultural.
FUOC PID_00173351 18 Estadstica aplicada a la investigacin en cultura
Ejemplo de ratio
Si X(t) mide el valor aadido bruto de la industria del diseo en cierto pas e Y(t) expre-
sa el nmero de trabajadores ocupados en dicha industria en ese pas, la ratio X(t)/Y(t)
proporciona informacin sobre la productividad aparente per cpita de la industria del
diseo en el pas.
1.1
Ejemplo de proporcin
Si Xi(t) expresa el valor aadido de la industria del diseo en un pas y iXi(t) expresa
el valor aadido de todas las industrias creativas, la proporcin Xi(t)/iXi(t) brinda infor-
macin sobre el peso relativo del diseo con respecto a la industria creativa del pas.
1.2
1.3
La tabla siguiente muestra la evolucin del nmero de personas ocupadas en las industrias
creativas (segunda columna) y del conocimiento en la provincia de Barcelona entre 1993
y el 2005, as como el nmero ndice simple de esta magnitud expresado en base 1993
(tercera columna).
Ao Ocupados ndicebase1993
1.4
1.5
IS0 (t) = (1/n) i [I0(t)]i 100 = (1/n) i [(Xi (t) / Xi (0)] 100
Ejemplo
La tabla siguiente muestra el nmero ndice del ejemplo sobre el nmero de personas
ocupadas en las industrias creativas del subapartado 2.1 expresado en base 1993 (segunda
columna) y el correspondiente valor del ndice calculado en base 2000 (tercera columna).
Ao ndicebase1993 ndicebase2000
Ao ndicebase1993 ndicebase2000
De esta forma se elimina cualquier variacin del valor que sea atribuible a los
precios. La deflacin exige el uso de un ndice de precios Paasche, aunque
en la prctica se utiliza el Laspeyres (IPC) por su menor coste de elaboracin.
Tambin son de uso frecuente los ndices de precios implcitos (deflactores)
que se deducen de la contabilidad nacional (y que son Paasche).
Ejemplo
sible calcular la evolucin del valor de la cifra de negocios a precios constantes, corres-
pondientes al perodo base (cuarta columna).
Ejemplo
El grfico siguiente muestra la evolucin del nmero de personas ocupadas en las indus-
trias creativas y del conocimiento en el rea metropolitana de Valencia desde el primer
trimestre de 1993 hasta el segundo trimestre del 2009.
FUOC PID_00173351 25 Estadstica aplicada a la investigacin en cultura
Yt = Tt Ct St + It
Yt = Tt + Ct + St + It
Para aplicar el alisado exponencial partimos de una constante de alisado, un Constante de alisado
valor comprendido entre cero y uno que se elige de manera subjetiva. En ge-
Aunque la constante de alisado
neral, el valor suavizado correspondiente a un perodo t se define como es un valor que se elige de ma-
nera subjetiva, existen distintos
criterios objetivizables, como,
Tt = a Yt + (1 a) Tt 1 por ejemplo, el de los mnimos
cuadrados ordinarios.
2 t1
Tt = a Yt + a (1 a) Yt 1 + a (1 a) Y t 2 + ... + (1 a) Y1
Yt = Tt + St + It = f(t) + et
La componente estacional est integrada por las oscilaciones a corto plazo, con
perodo ms o menos regular y de duracin inferior al ao natural. Evidente-
mente, solo tiene sentido hablar de estacionalidad en series con periodicidad
semestral, cuatrimestral, trimestral, mensual, semanal o diaria.
Hay diversas tcnicas que permiten evaluar las pautas de regularidad que pre-
senta la componente estacional en una serie observada. Prcticamente, todas
ellas tienen la misma filosofa: la componente estacional aparece al eliminar
del valor observado de la serie el resto de componentes.
St = (Yt It) / Tt
St = Yt (Tt + It)
Tambin hay que tener en cuenta si se considera que la pauta estacional es es-
table o es, por el contrario, evolutiva. En el primer caso es factible la construc-
cin de ndices de variacin estacional (esquema multiplicativo) o de efectos
estacionales (esquema aditivo). En el segundo, la evaluacin de la estacionali-
dad se realiza mediante funciones analticas que tratan de captar las pautas de
evolucin de la influencia estacional sobre el valor de la serie.
Serie desestacionalizada = Yt St = Tt + It
4.1. Qu es un indicador
Ejemplo
Existen muchos mtodos mediante los cuales podemos obtener los datos ne-
cesarios:
Ejemplos de indicadores
Existen diversos tipos de indicadores. Por ejemplo, indicadores bsicos de oferta, de de-
manda o de empleo que nos describan informacin bsica cuantitativa sobre determi-
nados sectores o subsectores culturales. Indicadores de evaluacin del desempeo como
herramientas que proporcionan informacin cuantitativa respecto al logro, resultado o
grado de cumplimiento de las acciones pblicas. En este caso, los indicadores de gestin
representan instrumentos para medir la eficiencia y la efectividad en el sector cultural.
Los indicadores estratgicos tienen como fin desarrollar estrategias que hagan ms efi-
cientes las acciones pblicas para que ayuden al cumplimento de los objetivos planteados
y permitan medir el impacto de las polticas propuestas.
Ejemplo de razn
Un ejemplo de razn podra ser la presin sobre el patrimonio cultural: nmero de turistas
(Xt) que visitan diariamente el conjunto de bienes patrimoniales (N) de un territorio,
considerando unidad o bien patrimonial la especificada por el gobierno local.
La tasa de variacin absoluta depende de las unidades de medida de la variable Algunas tasas de variacin
o serie. Si disponemos de series de datos, la tasa de variacin absoluta positiva
Un ejemplo de tasa de varia-
o negativa permite vislumbrar la tendencia en el perodo analizado. cin es la variacin en trmi-
nos absolutos del precio medio
de las entradas para un teatro
El inconveniente ms importante que representa la variacin absoluta es la de la pera (la magnitud base
se ha calculado por medio del
dimensionalidad. Ello se resuelve con la incorporacin de la relatividad a par- estadstico: media ponderada).
Otro ejemplo sera la tasa de
tir del cociente o razn para obtener lo que denominamos tasa de variacin variacin absoluta del nme-
relativa, que podremos expresar en proporcin o porcentaje y donde el pero- ro de pelculas exhibidas en las
salas de cine entre dos aos
do de anlisis nos permitir mostrar la tasa como interanual o intertrimestral. consecutivos.
Es el caso, por ejemplo, de la tasa de variacin interanual del presupuesto en
cultura.
Ved tambin
5)ndices. Es una medida estadstica que sirve para comparar una magnitud Los ndices se tratan en el
apartado 2 de este mdulo.
en dos situaciones, una de las cuales se toma como referencia. Podemos dis-
tinguir entre:
a)ndicessimples. Son los que se refieren a una nica magnitud. Por tanto,
miden la variacin en tanto por uno entre el dato de referencia o base y el
dato actual. Suelen utilizarse, cuando disponemos de una serie de datos a lo
largo del tiempo, con la intencin de estudiar la variacin de magnitudes ge-
neralmente relacionadas con el precio, la cantidad o el valor.
b) ndices complejos. Estos ndices estn ms vinculados al estudio de las ndice de Bradstreet-Dtot
variaciones de magnitudes que representan grupos de bienes o servicios. Su
Existen otros tipos de ndices
confeccin se realiza mediante la utilizacin de operadores estadsticos como en los que se utiliza la media
la media (en todas sus variantes), por ejemplo, un ndice complejo sobre la agregativa. El ndice de Brads-
treet-Dtot se define como el
oferta cultural en las artes escnicas. Este indicador reflejara (en funcin de cociente entre la media arit-
mtica de los valores de las
la definicin operacional de sus componentes) la variacin de la oferta media magnitudes simples en el pe-
rodo t y la media aritmtica
del nmero de funciones en teatro, danza y lrica. Para su obtencin habra de dichos valores en el perodo
que obtener los ndices simples de los tres subsectores, donde cada subsector base.
Eficiencia. Deben optimizar los recursos disponibles para obtener los ob-
jetivos planteados teniendo en cuenta el principio del coste econmico.
Es decir, debe existir una proporcionalidad de los costos incurridos entre
la medicin de una caracterstica o variable observada sobre un fenmeno
y los beneficios provenientes de la relevancia y utilidad de los datos y, en
consecuencia, de la informacin obtenida.
En la tabla siguiente podemos encontrar una ficha que sintetiza los atributos
que cabe destacar de un indicador.
Denominacindelindicador: equipamiento medio de las infraestructuras culturales por cada 10.000 habitantes
Funcindelindicador: permite observar las dotaciones de infraestructuras culturales en un mbito territorial especfico (local, nacio-
nal, etc.) y realizar comparaciones entre diferentes momentos del tiempo y en mbito territoriales diferentes.
Frmula:
1.6
Metodologa: la variable nmero de espacios culturales por grupo implica una catalogacin de los grupos de equipamientos (i). Por
ejemplo:
1) nmero de espacios de formacin,
2) nmero de espacios escnicos,
3) nmero de espacios expositivos,
4) nmero de espacios de convivencia e intercambio cultural,
5) nmero de recursos patrimoniales.
(i = 1...5)
FUOC PID_00173351 41 Estadstica aplicada a la investigacin en cultura
res delimita muy claramente cules son las reas que se reconocen como de
atencin prioritaria y contiene numerosos elementos pertinentes que, una vez
implementados, podrn favorecer la reflexin y el debate sobre el volumen y
la calidad de la informacin cultural con que cuentan los gobiernos locales
para hacer frente a los retos actuales y futuros de su desempeo. El debate
debe formularse tambin en cuanto a la oportunidad o necesidad de asignar
los recursos humanos y materiales necesarios para organizar y mantener un
sistema amplio de recopilacin de informacin que permita construir los ins-
trumentos imprescindibles con el fin de evaluar, en ltimo trmino, la efecti-
vidad de acciones culturales especficas con relacin a sus propios objetivos
y poner de manifiesto las exigencias de mejora en el diseo y aplicacin de
las polticas culturales locales. En este contexto, la Agenda 21 de la cultura
expresa una serie de compromisos consensuados y priorizados por las ciuda-
des y los gobiernos locales y representa, por tanto, una declaracin de los de-
rechos culturales de los ciudadanos en el mbito local. En consecuencia, las
reas de cultura de los gobiernos locales deben considerarla como orientacin
de sus polticas, programas y acciones culturales, puesto que la Agenda 21 de
la cultura delimita las reas prioritarias sobre las que centrar la propuesta del
sistema de indicadores. La propuesta contempla una seleccin de temas que
aspira a incluir los aspectos ms relevantes de la Agenda 21 de la cultura desde
el punto de vista de las polticas culturales locales:
a) y b)Laculturacomofactordedesarrolloeconmico,socialyurbano/te-
rritorial. La cultura como factor de desarrollo, en el sentido ms amplio del
trmino, es la cuestin central que genricamente origina y articula el siste-
ma de indicadores propuesto y hacia la que se orientan los restantes mbitos
temticos considerados. El valor social de la actividad cultural responde a su
funcin como elemento de promocin del desarrollo social y econmico de
las sociedades y, especialmente en su vertiente local, tambin del desarrollo
territorial. Segn la propuesta, el SICLO aspira a proporcionar informacin so-
bre la trayectoria pasada, situacin presente y evolucin previsible de la con-
tribucin de la cultura al desarrollo econmico, social y urbano/territorial en
el mbito local. Al mismo tiempo, se considera relevante definir y cuantificar,
en su caso, cules son los rendimientos, en trminos de desarrollo del tejido
cultural local, que se derivan de la inversin en cultura, puesto que dichos
rendimientos garantizarn la sostenibilidad futura del propio sistema cultural
local.
As, la Gua para la autoevaluacin de las polticas culturales locales establece que
el sistema de indicadores ha sido concebido como un instrumento prctico,
manejable y selectivo, elaborado especficamente para los gobiernos locales y
dirigido prioritariamente a los responsables y tcnicos de sus respectivas reas
de cultura, quienes deben ser los agentes principales tanto en su implementa-
cin como en la interpretacin y utilizacin que, en el futuro, se pueda hacer
de la informacin proporcionada por el sistema.
FUOC PID_00173351 44 Estadstica aplicada a la investigacin en cultura
Nivel I: bsico.
Nivel II: avanzado.
Nivel III: ptimo.
CuestionariocualitativoparaelmbitotemticoA"Laculturacomofactordedesa-
rrollosocial,econmicoyterritorial"
a) social ( )
b) econmico ( )
c) urbano/territorial ( )
FUOC PID_00173351 45 Estadstica aplicada a la investigacin en cultura
a) social ( )
b) econmico ( )
c) urbano/territorial ( )
AQ3. Las polticas culturales del gobierno local se dirigen expresamente a lograr objetivos
de desarrollo
a) social ( )
b) econmico ( )
c) urbano/territorial ( )
Valorar cada tem desde 1 (muy poco) hasta 5 (en gran medida)
CuestionariocuantitativoparaelmbitotemticoB"Laculturacomofactordedesa-
rrollodeltejidoculturallocal"
BN6. Presupuesto de gasto anual del gobierno local en cultura (programas y acciones
culturales, externalizacin de la gestin de servicios culturales, etc.).
BN7. Presupuesto de inversin anual del gobierno local en cultura (equipamientos e in-
fraestructuras culturales).
BN8. Presupuesto de gasto anual que el rea de cultura del gobierno local destina a pro-
gramas y medidas directas de apoyo o fomento del tejido cultural local.
BN9. Presupuesto de inversin anual que el rea de cultura del gobierno local destina a
medidas directas de apoyo o fomento del tejido cultural local.
FUOC PID_00173351 46 Estadstica aplicada a la investigacin en cultura
El actual III Plan Director de la Cooperacin Espaola (PD) apuesta por una
mayor coherencia de sus polticas sectoriales, la armonizacin entre pases so-
cios y el alineamiento con las polticas pblicas comprometidas en los proce-
sos de desarrollo. Su estrategia pretende conciliar, unir y aprovechar el poten-
cial de las sinergias de la cultura y la cooperacin con los objetivos de desarro-
llo. El PD y su estrategia sectorial en cultura y desarrollo como expresin de
poltica pblica requiere mecanismos de programacin, previsibilidad y medi-
cin del impacto de su poltica que permitan incorporar las lecciones apren-
didas para la toma de decisiones futuras. La estrategia de cultura y desarrollo
como documento de estrategia sectorial (DES) es el segundo nivel en el ciclo
de planificacin despus del PD y desarrolla conceptualmente las prioridades
del sector de cultura y desarrollo definidas en l. Los DES estn concebidos en
su elaboracin con una proyeccin a largo plazo con el fin de retroalimentar
los procesos de la estrategia sectorial y ofrecer orientaciones precisas y buenas
prcticas que permitan mejorar los objetivos de la cooperacin cultural.
una de las actuaciones prioritarias por lnea estratgica los mecanismos de de-
teccin de las variables implicadas para la consecucin del objetivo especfi-
co esperado como resultado o propsito del proyecto. En esta segunda fase se
evidencia cmo, a partir del rbol de objetivos del DES y utilizando la lgica
vertical, se llega a obtener un listado de variables vinculadas a la estrategia del
desarrollo que permitir en el futuro profundizar en la obtencin de indica-
dores de seguimiento y evaluacin del desempeo.
1) [Variacin porcentual del] Nmero de actores que participaron en las acciones enca-
minadas a apoyar las tareas de identificacin, inventariado y estudio de los elementos
patrimoniales, buscando el uso y los aportes econmicos, sociales y culturales que los
mismos puedan generar en las sociedades... realizadas en un ao, respecto de los que
participaron el ao anterior, por tipologa de agente.
16) [Variacin porcentual del] Nmero de exposiciones en museos, por tipo de museo,
segn tipo de exposicin.
17) [Variacin porcentual del] Nmero de actores que participaron en las acciones enca-
minadas a lograr una participacin directa de la ciudadana y las comunidades locales
en los programas de conservacin del patrimonio y la memoria colectiva, estableciendo
una lista de las mejores prcticas para las polticas de patrimonio realizadas en un ao,
respecto de los que participaron el ao anterior, por tipologa de agente.
18) [Variacin porcentual del] Presupuesto destinado a las acciones encaminadas a lograr
una participacin directa de la ciudadana y las comunidades locales en los programas
de conservacin del patrimonio y la memoria colectiva, estableciendo una lista de las
mejores prcticas para las polticas de patrimonio realizadas en un ao, respecto del des-
tinado a las realizadas el ao anterior, por tipologa de entidad financiera.
19) [Variacin porcentual del] Nmero de acciones encaminadas a lograr una participa-
cin directa de la ciudadana y las comunidades locales en los programas de conservacin
del patrimonio y la memoria colectiva, estableciendo una lista de las mejores prcticas
para las polticas de patrimonio, realizadas en un ao, respecto de las del ao anterior,
por categora de pas.
Ejemplo
En el anlisis de la formacin de los gestores culturales, la edad es una variable discreta (p.
ej., la probabilidad de que la edad del gestor sea de 37 aos es del 64%), mientras que su
renta disponible es una variable continua (p. ej., la probabilidad de que su renta disponi-
ble sea inferior a 30.000 /ao es del 87%). Por otra parte, ntese que si aceptamos edades
intermedias, p. ej., 37 aos y medio (37,5), la variable "edad" se considerara entonces
una variable continua; a su vez, si la variable "renta disponible" estuviese circunscrita a
niveles (p. ej., 10.000, 20.000, 30.000...), la estaramos considerando como discreta.
Suma de probabilidades
Cada variable aleatoria tendr un comportamiento definido por lo que
denominamos distribucindeprobabilidad: funcin matemtica que La suma de probabilidades es
1. Por ejemplo, S tiene una
nos permite calcular todos los pares resultado-probabilidad [f(xi) = P (X = probabilidad del 60%; No
tiene una probabilidad del
xi)] (p. ej., edad = 37 aos, probabilidad = 64%); toda probabilidad para 40%; el total es 60% + 40% =
100%).
cualquier resultado especfico tomar valores entre 0 y 1 (0% y 100%),
siendo la suma de todas las probabilidades de todos los resultados ex-
cluyentes igual a 1.
Ejemplo de funcin
Adems, para cada variable aleatoria tendremos tambin la funcinde de distribucin de
probabilidad
distribucin de probabilidad: funcin matemtica que nos permite
calcular la probabilidad acumulada hasta un valor determinado [F(a) Renta disponible = 30.000 /
ao, probabilidad acumulada
= P(X a)]; en las variables continuas, esta se denomina funcin de = 87%, es decir, la probabili-
densidad. dad de que la renta disponible
de un gestor cultural sea igual
o inferior a esta cantidad.
Media = E(X)
1.7
FUOC PID_00173351 52 Estadstica aplicada a la investigacin en cultura
Ejemplo
Fuente: http://es.wikipedia.org/wiki/Archivo:Standard_deviation_diagram_%28decimal_comma%29.svg
X ~ N(, )
Por otra parte, aunque hablemos de una distribucin normal, en realidad exis-
ten infinitas distribuciones, por lo que para simplificar el uso de la familia de
distribuciones normales se suele emplear la que denominamos distribucin
normal tipificada. La caracterstica de esta distribucin normal es que su me-
dia es 0 y su varianza, la unidad; podemos convertir cualquier distribucin
normal en una distribucin normal tipificada restndole a la variable aleatoria
normal su media y dividiendo el resultado por la desviacin tpica. De este
modo, analticamente:
FUOC PID_00173351 53 Estadstica aplicada a la investigacin en cultura
Z = (X )/ ~ N(0, 1)
Esta operacin nos ofrece la posibilidad de conocer y emplear una nica dis-
tribucin normal para realizar los clculos necesarios para determinar las pro-
babilidades asociadas a las ocurrencias de determinados eventos sobre las va-
riables aleatorias analizadas en nuestras investigaciones.
Ejemplo
La variable aleatoria "edad de los gestores culturales" sigue una distribucin normal de
media 41 y desviacin tpica 9 Edad~N(41,9); para simplificar los clculos de probabi-
lidad deberamos utilizar una distribucin normal tipificada (Edad 41)/9~N(0,1).
0,00 0, 500 000 0, 841 344 0, 977 249 0, 998 650 0, 999 968
0,01 0, 503 989 0, 843 752 0, 977 784 0, 998 693 0, 999 969
0,02 0, 507 978 0, 846 135 0, 978 308 0, 998 736 0, 999 970
0,03 0, 511 966 0, 848 494 0, 978 821 0, 998 777 0, 999 972
0,04 0, 515 953 0, 850 830 0, 979 324 0, 998 817 0, 999 973
0,05 0, 519 938 0, 853 140 0, 979 817 0, 998 855 0, 999 974
Fuente: Wikibooks
3) La tabla solo muestra los valores positivos de la variable, para valores nega-
tivos deberemos obtener el valor para el mdulo (valor positivo) y restarlo a la
unidad. Esta operacin puede realizarse gracias a las propiedades de la funcin
de densidad y de la distribucin normal.
Actividad
A partir del estudio de Rausell y otros (2009) sabemos que los gestores culturales de Murcia
cursan anualmente en media 446,39 horas de formacin en reas vinculadas a la gestin
cultural, siendo la desviacin tpica de esta variable 559,49 horas. Suponiendo que la
variable "horas de formacin anual en gestin cultural" siga una distribucin normal,
obtened la probabilidad de que un gestor cultural de Murcia haya cursado 250 horas de
este tipo de formacin.
Solucionario
Buscar en las tablas la probabilidad para 0,35 = 0, 636 830 (la encontramos en la tabla
completa, segn fuente, en la columna 1, fila 36).
Cuando nos enfrentamos al anlisis de una realidad social, como puede serlo
cualquiera relativa al mbito de la cultura (consumo, produccin, distribucin
y/o financiacin), el primer escollo con que nos encontramos es el problema
del tamao de nuestro objeto de estudio (p. ej., nmero de lectores, artistas,
empresas de las industrias culturales, etc.); en muchos casos, tener acceso a
los datos de todo nuestro universo/poblacin de anlisis es del todo inviable,
hacindose necesario recurrir a una muestra representativa del colectivo a es-
tudiar. De hecho, la obtencin de un censo que nos facilite todos los datos
existentes presenta otros muchos inconvenientes, tal como se recoge en Escu-
der y Murgui (1995):
Los presupuestos suelen ser limitados, por lo que si el censo es muy amplio,
el coste excedera en mucho nuestras posibilidades econmicas.
Ejemplo de muestreo
Durante los aos 2007 y 2008, el rea de Investigacin en Economa Aplicada a la Cul-
tura, de la Universidad de Valencia, desarroll un estudio econmico-financiero sobre el
sector artesano de artistas falleros de la ciudad de Valencia. Con tal propsito se elabor
una encuesta y se escogi la muestra de artistas falleros, de modo que los valores conta-
bles (p. ej., ingresos, costes de materiales, gastos financieros, etc.) que se fueran a obtener
del cuestionario remitido a los talleres artesanos tuvieran unos valores estadsticos en
media y desviacin tpica representativos del censo gremial. De este modo, en lugar de
tener que obtener los datos de los 190 artesanos agremiados en activo, solo tuvimos que
centrarnos en la obtencin de los datos de 73 de estos.
2)Observacindelasvariablesdeinterssobrecadaunadelasunidades
seleccionadas. La obtencin de estos datos es lo que se denomina trabajo
de campo, y se puede realizar mediante cuestionario aplicado personalmente,
por va telefnica, postal o, ms comnmente ahora, por medios telemticos
FUOC PID_00173351 56 Estadstica aplicada a la investigacin en cultura
Ejemplo de muestreo
1.8
1.9
Ejemplo
Enlace recomendado
A modo de ejemplo, vamos a emplear la encuesta de hbitos y prcticas culturales en
Espaa 2006-2007, realizada por el Ministerio de Cultura en colaboracin con el Instituto Para ms informacin, po-
Nacional de Estadstica (INE). Esta encuesta da continuidad a la previa de 2002-2003, a dis consultar el enlace si-
la vez que ampla sus objetivos para profundizar en nuevos aspectos. Segn se obtiene guiente:
del apartado metodolgico de la encuesta, sus objetivos son la obtencin de una serie http://www.mcu.es/esta-
de "indicadores relativos al inters de los espaoles en los distintos sectores del mbito disticas/MC/EHC/2006/
cultural, de la frecuencia e intensidad con que se realizan estas actividades o del hbito Metodologia.html
adquirido respecto a las mismas".
Los tamaos muestrales para las CC. AA. se han escogido basndose en un nivel de con-
fianza de 95% (nivel de significacin del 5%), con un error de estimacin predeterminado
a priori (ver tabla), y considerando p = q = 0,5, resultando en una muestra total de 16.408
encuestas. El trabajo de campo se realiz mediante entrevistas personales, recogiendo no
solo datos relativos a los hbitos y prcticas culturales, sino tambin datos sociodemogr-
ficos (sexo, edad, nivel de estudios, etc.) y datos relativos a la disponibilidad de equipa-
mientos culturales (ordenador, equipos de sonido) y el inters en actividades culturales.
Las tablas de los resultados se pueden obtener desde la pgina web del Ministerio de
Cultura.
Actividad
Estableced vuestra propia estadstica de hbitos y prcticas culturales para vuestro muni-
cipio mediante muestreo aleatorio simple. Como ayuda os presentamos el ejemplo de
Vila-real, que tiene 42.658 habitantes mayores de 15 aos (INE, 2009).
Nivel de significacin = 5%
Error de estimacin = 10%
p = q = 50%
Tamao muestral ~ 96 individuos de edad 15+
Trabajo de campo
FUOC PID_00173351 58 Estadstica aplicada a la investigacin en cultura
Siguiendo con nuestra labor de investigadores o, si fuera el caso, incluso de me- Ejemplo
ros espectadores-lectores de las estadsticas culturales, en ciertas ocasiones ser
Cuando tengamos acceso a
muy interesante realizar contrastaciones de afirmaciones vertidas por colegas, los resultados de la encuesta
medios de comunicacin, organismos pblicos, o incluso de nuestras propias de usos del tiempo 2009-2010
del INE "podramos" contras-
intuiciones. En trminos estadsticos, es lo que denominamos contraste de hi- tar la hiptesis de que la media
de visionado de TV por parte
ptesis: procedimiento estadstico basado en los modelos de probabilidad y de los espaoles no ha varia-
do respecto a los datos de la
los datos muestrales, que se utiliza con fines (re)probatorios de una hiptesis. misma encuesta para el pero-
Obviamente, dado que ya sabemos que en estadstica inferencial asignamos do 2002-2003 (casi 3 horas;
INE, 2004), con una confianza
probabilidades, ninguna hiptesis ser en realidad aceptada o rechazada taxa- del 95%. Por el momento, con
los datos de la encuesta dispo-
tivamente, teniendo que tener en consideracin el concepto probabilstico de nible hasta el momento, po-
contraste inferencial. dramos contrastar que la me-
dia de dedicacin a estudios es
menor de 45 minutos, con un
Encuesta de usos del tiempo nivel de significacin del 5%.
La encuesta de usos del tiempo 2002-2003 es una encuesta no peridica que se basa en
los diarios de actividades recogidos en casi 24.000 hogares para los miembros de 10 y ms
aos. Se recoge informacin primaria sobre el tiempo dedicado al trabajo no remunerado
(cuidados personales, estudios, voluntariado, etc.), la distribucin de las tareas del hogar
y la participacin en actividades de ocio y cultura. La muestra total es de 46.774 personas,
y, adems de los microdatos, el INE facilita tablas elaboradas que indican el porcentaje
de personas que realizan cada actividad y la duracin media diaria.
Ahora bien, para poder tomar una decisin informada y con base estadstica
necesitaremos una regla de decisin o test, partiendo del denominado estads-
tico de contraste. Dicha regla deber construirse atendiendo al tipo de hip-
tesis a formular.
Actividad
Soluci
La regla de decisin nos indica que tenemos que aceptar la hiptesis (0,01 <
0,016396). Por tanto, podemos asegurar con un 99% de confianza que en Espaa
se ve una media diaria de 3 horas. Ntese, sin embargo, que la decisin sera recha-
zar la hiptesis nula si hubisemos elegido un nivel de significacin del 5% (0,05 >
0,016396).
Podemos aceptar la hiptesis de que en Espaa los hombres dedican al estudio el mismo
tiempo que las mujeres?
Solucin
La regla de decisin nos indica que aceptaremos la hiptesis de que en Espaa hom-
bres y mujeres dedican en media el mismo tiempo diario al estudio, siempre que
consideremos un nivel de significatividad igual o menor al 1% (0,01 0,01); a valores
de menor confianza (mayor significatividad), deberemos rechazar la hiptesis nula.
Finalmente, cabe resear que hay muchos ms contrastes de hiptesis que los dos ex-
puestos en este subapartado. Puede establecerse toda una gama de tests, desde el equi-
valente a (H0: = k) pero para casos en que desconocemos el valor de la varianza pobla-
cional y no podemos estimarla, tests en los que no evaluamos la media en trminos de
igualdad de un valor sino de desigualdad, como (H0: < k) o (H0: > k), tests en los
FUOC PID_00173351 61 Estadstica aplicada a la investigacin en cultura
que el parmetro a evaluar es la varianza (H0: 2 = v), (H0: 2 < v), o (H0: 2 > v), tests de
igualdad de proporciones, tests de igualdad de medias con varianzas desconocidas, etc.
Y estos son solo en lo que se refiere a la familia de los tests paramtricos, en los que s
conocamos la distribucin y la regla de decisin se aplicaba sobre uno o varios parme-
tros. En cambio, existe una serie de tests no paramtricos, en los que desconocemos la
distribucin probabilstica o existen dudas sobre esta; en este tipo de tests, las hiptesis
versan sobre el modelo de probabilidad que ha generado los datos: test de chi-cuadrado,
test de Kolmogrov-Smirnov, test de Rachas, etc.
En algunas ocasiones, dispondremos de una serie de datos cuya hiptesis a Festival VEO
contrastar puede resultar demasiado complicada por su naturaleza, sin contar
Depende la valoracin de la
las dificultades con que nos podemos encontrar en cuanto a clculo. Por ejem- calidad de la programacin
plo, cuando queremos establecer una regla de decisin para determinar si una por parte de los asistentes a un
festival de artes escnicas de
determinada variable se ve afectada por el efecto de otras variables, o cuando sus caractersticas sociodemo-
grficas y/o su perfil de consu-
queremos realizar una comparacin de medias para ms de dos muestras. mo cultural? Es lo que un equi-
po de investigacin de la Uni-
versidad de Valencia quera sa-
Aunque existe un modelo simple, one-way ANOVA, que permite contrastar el ber referente al Festival VEO.
Y=++++
Ejemplo
Luego, recapitulando, tenemos dos variables categricas cuyo efecto sobre una
tercera dependiente queremos contrastar. Para poder realizar el test, hemos de
recurrir a la descomposicin de la varianza total en las varianzas de cada una
de las variables independientes, la varianza provocada por la interaccin de
ambas de estas variables y la varianza del trmino de error; es a partir de esta
expresin que calculamos los estadsticos de contraste, uno para cada variable
independiente y un tercero para los efectos interaccin; dichos estadsticos
estn distribudos segn una F-Snedecor con grados de libertad (k 1, n k),
siendo k el nmero de categoras de la variable. Este tipo de contrastes suelen
realizarse valindose de software estadstico, el cual calcula los estadsticos y
nos facilita los p-values.
Ejemplo
En Lee y otros (2004) se analiza la satisfaccin de los asistentes a la 2000 World Culture
Expo (Corea del Sur) basndose en su posible conexin con las diferentes motivaciones
de visita (I: cultural y familiar, II: mltiples motivaciones, III: escapada, IV: buscadores de
eventos) y su nacionalidad (nacional o extranjero). Para ello se emplea un ANOVA de dos
factores; el clculo de los estadsticos de contraste y de los p-values se realiza mediante
una aplicacin informtica, mostrndose los resultados a continuacin:
Variable F p-value
Motivacin 16,479 <0,001
Nacionalidad 79,073 <0,001
Interaccin 1,824 >0,05
Luego, como se desprende de los datos en la tabla, para cualquier nivel de significatividad
(los p-values son muy prximos a 0), las variables motivacin y nacionalidad presentan
efectos sobre la satisfaccin. Sin embargo, para niveles de significatividad convencionales
(5% o menores), no puede aceptarse la hiptesis sobre la existencia de efectos interaccin
entre la motivacin y la nacionalidad (p-value mayor del 5%); esto podra indicar que la
satisfaccin para cada tipo de motivacin sigue el mismo patrn, independientemente
de que el visitante sea nacional o extranjero.
FUOC PID_00173351 63 Estadstica aplicada a la investigacin en cultura
1) no existe ninguna relacin entre las variables objeto de estudio (las variables
son independientes),
Ahora bien, entre estos dos polos opuestos es posible identificar multitud de
situaciones en las que las variables con las que estamos trabajando, por ejem-
plo el nivel de consumo de las familias y su renta, presentan un cierto grado
de relacin de dependencia entre ellas sin que esta sea de tipo funcional. En
estas situaciones se dice que la dependencia es estadstica.
Andaluca 36 6,2
(1)
Para examinar la relacin entre estas variables dibujamos el diagrama de dis- Puede consultarse Etxeberria
(2007, 97-9101).
persin que podis ver en la figura siguiente. A partir de la nube de puntos
obtenidos podemos observar, en primer lugar, que hay un punto que aparece
totalmente separado del resto y podra tratarse de un outlier. Los valores extre-
mos deben ser analizados cuidadosamente por su efecto en los resultados1. En
este caso, dado que el punto que se encuentra alejado del resto corresponde
a la Comunidad de Madrid y los valores introducidos son correctos, se ha op-
tado por mantener esta observacin en el anlisis. En segundo lugar, tambin
FUOC PID_00173351 65 Estadstica aplicada a la investigacin en cultura
1) Por casualidad.
1.10
donde:
(2)
En la gran mayora de las situaciones prcticas no contamos con los datos Ms detalles en Esteban y otros
(2005)
poblacionales sino con datos correspondientes a una muestra. Por tanto, es
necesario estimar los parmetros desconocidos y de la recta de regresin
poblacional, que denotaremos por a y b. Si tenemos una muestra formada por
n observaciones, los valores de a y b, de acuerdo con el mtodo de mnimos
cuadrados, sern aquellos que minimicen la suma de los cuadrados de los erro-
res2 (podis ver la figura siguiente).
1.11
1.12
FUOC PID_00173351 67 Estadstica aplicada a la investigacin en cultura
1.13
1.14
que puede utilizarse para generar una prediccin o pronstico de, y para, un
valor dado de x.
Ejemplo
Con respecto a los datos de la tabla del subapartado 6.2, se muestran en la tabla siguiente
los clculos necesarios para obtener la recta de regresin de la tasa de lectura en funcin
del porcentaje de licenciados.
Comunidadau- yi xi xi
2 xiyi
tnoma
Comunidadau- yi xi xi
2 xiyi
tnoma
El coeficiente de regresin b indica que, por cada incremento unitario de X, se estima que
el valor medio de Y se incremente en b unidades, es decir, por cada punto porcentual de
incremento del nmero de licenciados se estima que la tasa de lectura se incremente en
1,365 puntos porcentuales aproximadamente. La ordenada en el origen (intercepcin) es
la constante de la regresin e indica el valor medio de Y cuando X es cero. En nuestro
caso, para un porcentaje de licenciados del 0% se estima que la tasa de lectura se site en
torno al 30,31%. Debemos ser cautelosos a la hora de interpretar los valores de a y b. Los
resultados de la regresin solo pueden utilizarse dentro del rango de valores observados
en nuestra muestra. As, en nuestro ejemplo el porcentaje de licenciados se mueve en el
rango 4,2-14,1, por lo que no tiene sentido alguno la interpretacin del intercepto.
(3)
Para ver la demostracin puede
3
Una propiedad importante del ajuste mnimo-cuadrtico es que la va- consultarse Esteban y otros (2005).
la varianza residual ( ) que mide las desviaciones entre los valores ob-
servados y ajustados.
1.15
1.16
(4)
donde4: Puede comprobarse fcilmente
que e (comprobad los
resultados que aparecen en la ta-
bla que sigue a continuacin).
SCT es la suma de cuadrados total: ;
Descomposicin de la varianza de Y
De acuerdo con la ecuacin , cuanto mayor es SCR menor es SCE y, por tan-
to, mejor se ajusta la recta de regresin al conjunto de datos observados. El
inconveniente de utilizar estos indicadores es que las varianzas dependen de
las unidades de medida, por lo que es necesario buscar otro indicador que no
FUOC PID_00173351 70 Estadstica aplicada a la investigacin en cultura
1.17
1.18
Ejemplo
Veamos cmo llevar a la prctica los clculos anteriores con nuestro ejemplo. En las co-
lumnas 2 a 4 de la tabla siguiente se muestran los valores observados (yi), los valores pro-
nosticados o predichos ( ) de acuerdo con la regresin obtenida y los errores (ei). En las
siguientes tres columnas (columnas 5 a 7) se han calculado las desviaciones cuadrticas
de cada valor respecto a su media. En la penltima fila de la tabla se muestra la suma de
los valores obtenidos y en la ltima las medias de los valores observados y pronosticados
(ntese que coinciden: ) y de los errores ( ).
Valores observados y valores calculados (pronsticos, errores...) para obtener la suma de los
cuadrados, coeficiente de determinacin
yi ei
Com. Valen- 38,3 40,409 2,109 2,467 0,290 4,447 54,76 0,155
ciana
yi ei
Pas Vasco 41,6 43,822 2,222 2,991 15,616 4,938 98,01 8,376
A partir de los clculos reflejados en la tabla, podemos obtener la suma de los cuadrados:
1.19
1.20
1.21
Los clculos realizados anteriormente coinciden con las salidas ofrecidas por Excel en el
anlisis de regresin, como puede comprobarse en la figura siguiente, en la que se han
destacado los resultados a considerar.
2
Salida Excel de SCT, SCR, SCE y R
(5)
Hasta el momento, a partir de una muestra hemos obtenido estimaciones de Ms detalles en Uriel y otros
(1990).
los parmetros poblacionales, de manera que es de prever que estos cambien si
cambia la muestra. En consecuencia, debemos calcular los intervalos de con-
fianza de los estimadores de los coeficientes y para las predicciones obtenidas
FUOC PID_00173351 72 Estadstica aplicada a la investigacin en cultura
a partir de ellos. Sin embargo, para poder hacer inferencias acerca de los par-
metros de la poblacin, el modelo de regresin debe cumplir unos supuestos
bsicos5:
Cuanto mayor sea la variabilidad del error aleatorio (2), mayores sern
los errores en las estimaciones de los parmetros poblacionales del mo-
delo ( y ) y el error de pronstico cuando utilizamos para predecir y
2
dado un valor de x. Como en la prctica es desconocido, usaremos los
datos muestrales para estimar su valor. As, un estimador de la varianza
del error poblacional es la varianza residual.
1.22
Ejemplo
. Por tanto,
(error tpico)
El error tpico de estimacin mide el error que cometemos cuando utilizamos la ecuacin
de regresin mnimo-cuadrtica para estimar la variable Y (tasa de lectura). Atendiendo a
las hiptesis bsicas del modelo, la distribucin de los errores debe distribuirse normal-
mente. Por tanto, es de esperar que aproximadamente el 68% de los errores (ver columna
4 de la tabla) se encuentren dentro del intervalo 2,393 y en torno al 95% se situar
dentro del intervalo 2 2,393 = 4,786.
FUOC PID_00173351 73 Estadstica aplicada a la investigacin en cultura
(6)
Partiendo de la ecuacin puede demostrarse6 que: Vase Canavos (1992, captulo
13).
1.23
1.24
2
Pero, dado que es desconocido, utilizaremos su estimador ( ), por tanto,
utilizaremos como estimadores de las varianzas de los coeficientes:
1.25
Ejemplo
Sabemos que n = 17, , y, a partir de los clculos mostrados en la tabla del subapar-
1.26
Con lo que los errores tpicos (desviaciones tpicas) de los coeficientes resultan ser:
En la figura siguiente se han destacado los anteriores resultados y el error tpico de esti-
macin proporcionados por Excel en su anlisis. Como puede comprobarse, los resulta-
dos coinciden.
FUOC PID_00173351 74 Estadstica aplicada a la investigacin en cultura
Salida Excel del error tpico de estimacin y de los errores tpicos de los coeficientes
1.27
1.28
H0: = 0
H1: 0
1.29
Ejemplo
1.30
Para un nivel de significacin de = 0,05, los valores crticos de una t con 15 grados de li-
bertad son 2,1314 y 2,1314. Como , podemos rechazar H0. Si usa-
mos el p-valor, rechazamos H0 porque el p-valor es aproximadamente 0, concretamente el
p-valor = 0,000069103 (figura siguiente), y es menor que el nivel de significacin = 0,05.
Por tanto, podemos concluir que existe una relacin lineal estadsticamente significativa
entre la tasa de lectura y el porcentaje de licenciados.
Intervalosdeconfianzaparaloscoeficientesderegresin
1.31
Del mismo modo, podemos tambin construir un intervalo de confianza del 100(1 )%
para :
1.32
1.33
Por tanto, el intervalo de confianza obtenido es: 0,8300 1,8999 (los resultados son
aproximados por los decimales). Es decir, estimamos con una confianza del 95% que la
pendiente de la regresin poblacional se encuentra entre 0,8300 y 1,8999. Adems, como
estos valores se encuentran por encima de 0, podemos concluir que existe una relacin
FUOC PID_00173351 76 Estadstica aplicada a la investigacin en cultura
lineal significativa entre las variables analizadas. El intervalo obtenido indica que, por
cada incremento de un 1% en el porcentaje de licenciados, se estima que la tasa media
anual de lectura se incremente entre el 0,83% y el 1,8999%.
Una vez hemos tratado los aspectos bsicos de la regresin lineal simple, la re-
gresin lineal mltiple no es ms que una extensin. Ahora, la variable Y pue-
de depender de ms de una variable independiente. Consideremos el ejemplo
que venimos desarrollando. Hasta el momento, hemos intentado explicar el
comportamiento de la tasa de lectura en funcin del porcentaje de licencia-
dos. Para ilustrar el procedimiento de la regresin lineal mltiple vamos a in-
troducir en el modelo una nueva variable explicativa: el porcentaje de pobla-
cin que ve frecuentemente televisin. Los datos disponibles se muestran en
la tabla siguiente.
1.34
1.35
1.36
donde:
1.37
FUOC PID_00173351 78 Estadstica aplicada a la investigacin en cultura
(7)
El coeficiente 1 es el valor esperado de la variable Y cuando las variables ex- En la mayora de las aplicaciones
7
prcticas este parmetro no tiene
plicativas toman el valor cero . sentido.
1.38
donde:
1.39
1.40
1.41
1.42
1.43
1.44
1.45
Ejemplo
Vamos a calcular, utilizando Excel, los coeficientes de regresin en nuestro ejemplo uti-
lizando la expresin . Para ello, a partir de la tabla sabemos que:
1.46
La traspuesta de X es:
1.47
1.48
y es:
1.49
1.50
Estos mismos resultados son los que nos proporciona la opcin regresin de la herra-
mienta anlisis de datos en Excel. En la figura siguiente se han destacado los valores de
los coeficientes de regresin en la salida de Excel.
1.51
1.52
1.53
Ejemplo
A partir de los datos proporcionados en la tabla que mostramos al inicio del subapartado
6.3 y conocido que el modelo de regresin estimado es , pode-
mos determinar los valores pronosticados y los residuos de cada observacin (columnas
2 y 3 en la tabla siguiente), as como los cuadrados de las desviaciones respecto a la media
de los valores observados, de los predichos y de los errores (columnas 3, 4 y 5 en la tabla).
Comunidad ei
autnoma
Comunidad ei
autnoma
Medias 39,871 0
A partir de los clculos reflejados en la tabla anterior, podemos obtener la suma de cua-
drados:
1.54
1.55
1.56
1.57
que indica que, en este ejemplo concreto (en una determinada muestra), el 82,96% de
la variabilidad de la tasa de lectura se explica por la relacin lineal con el porcentaje de
licenciados y el porcentaje de poblacin con audiencia de televisin.
1.58
2
Salida Excel de SCT, SCR, SCE, R y R corregido
(8)
Si se cumplen las hiptesis bsicas del modelo8, podemos obtener un estima- Canavos (1992, captulos 13 y
14).
dor no sesgado de la varianza del error, que es:
1.59
1.60
2
Por tanto, como (varianza de los errores) es desconocida, utilizando su es-
timador obtenemos un estimador de la matriz de varianzas-covarianzas de los
estimadores:
1.61
1.62
Salida Excel del error tpico de estimacin y de los errores tpicos de los coeficientes
Vamos a ver cmo se han calculado. El error de estimacin se obtiene a partir de la ex-
presin :
1.63
Los errores tpicos de los coeficientes los calcularemos a partir de la expresin y sabiendo
que
1.64
1.65
1.66
1.67
FUOC PID_00173351 85 Estadstica aplicada a la investigacin en cultura
H0: i = 0
H1: i 0
1.68
Ejemplo
H0: 2 = 0
H1: 2 0
Para un nivel de significacin dado de , los valores crticos de una t con 14 grados
de libertad son 2,1147 y 2,1447. Por tanto, como rechazamos H0;
es decir, el porcentaje de licenciados tiene un efecto positivo y estadsticamente signi-
ficativo sobre la tasa de lectura, teniendo en cuenta el porcentaje de poblacin que ve
frecuentemente televisin.
H0: 3 = 0
H1: 3 0
1.69
A las mismas conclusiones podramos haber llegado utilizando los p-valores, que son un
resultado que podemos encontrar en la salida de Excel (figura del subapartado siguiente).
Por ejemplo, el p-valor asociado a 2 es 0,0000171, que es menor que , por lo que
podemos rechazar la hiptesis nula de que no hay relacin lineal entre el porcentaje de
licenciados y la tasa de lectura, considerando el porcentaje de poblacin que ve frecuen-
temente televisin.
1.70
Ejemplo
Para un nivel de confianza del 95%, en nuestro ejemplo el intervalo para 2 lo calcula-
remos como:
1.71
1.72
1.73
Ejemplo
Un estudio realizado sobre la ciudad de Ganda (Rausell y otros, 2004) revel que su ciu-
dadana poda ser clasificada atendiendo a las caractersticas de la funcin de demanda
cultural en 8 segmentos o culto-tipos diferenciados. Los datos fueron recabados median-
te encuesta por muestreo; el cuestionario constaba de 58 variables. El universo era la po-
blacin residente mayor de 15 aos; la seleccin de la muestra se realiz por muestreo
aleatorio simple, con una confianza del 95,5%, P = Q = 50%, y un error muestral de 4,6%.
Mediante el uso del anlisis factorial, se consiguieron agrupar las caractersticas sobre
inters y consumo cultural declarado en un nmero menor de factores, a partir de cuyo
valor y del anlisis de su estructura se identificaron los distintos culto-tipos:
1)Entusiastas: alto inters, bajo consumo, mujeres, nivel variado de renta y formacin.
5)Msicos: grupo transversal con especial inters por la msica, una proporcin elevada
practica la msica.
7)Indiferentes.
8)Refractarios.
FUOC PID_00173351 89 Estadstica aplicada a la investigacin en cultura
tests clave: el test de esfericidad de Barlett y el test de Kaiser-Meyer-Olkin El test de esfericidad de Barlett
(KMO). contrasta la hiptesis de que la
matriz de correlaciones es una
matriz identidad, esto es, que
no existe correlacin alguna; el
2) Seleccin de factores. El primer factor recoge el mayor porcentaje de la p-value de este test debe ser lo
ms cercano a 0,00.
variabilidad original, el segundo la mayor proporcin de la variabilidad res-
tante, y as sucesivamente. Escogemos tantos factores como sea conveniente
para perder el mnimo de variabilidad explicada. Por lo general, suele aplicarse Test de Kaiser-Meyer-Olkin
la regla de Kaiser, consistente en retener solo aquellos factores cuyos valores
El test de Kaiser-Meyer-Olkin
propios sean mayores que la unidad. El valor propio se obtiene como la suma mide la idoneidad de los datos
de los cuadrados de los pesos de cada columna de la matriz factorial; la divi- para el anlisis factorial; valores
entre 0,9 y 1 son ideales, entre
sin del valor propio entre el nmero de variables indica el porcentaje de la 0,8 y 0,9 son buenos, siendo
aceptables valores entre 0,7 y
varianza total que explica este factor. 0,8.
das, tcnica que intenta aproximar al mximo los ejes de coordenadas (facto-
riales) a las variables que los representan; generalmente se aplica el tipo de
rotacin VARIMAX.
5)Clculodelosfactoresapartirdelaexpresinanterior.
Ejemplo
Ejemplo
Matrices factoriales: tests KMO y Barlett, y porcentaje de informacin acumulada por los
componentes*,**
M2COMMIN 0,990 0,000 0,000 0,987 0,000 0,979 0,000 0,984 0,000
RESTBAR 0,980 0,000 0,000 0,974 0,000 0,972 0,000 0,979 0,000
CAPHUM 0,319 0,713 -0,330 0,341 0,752 0,353 0,737 0,354 0,752
RFD 0,180 0,837 0,000 0,199 0,842 0,215 0,837 0,201 0,838
%Ac. 70,93 9,17 6,88 67,94 16,63 65,96 16,60 65,28 14,77
los elementos que integran cada grupo sean lo ms homogneos posible res-
pecto de las variables que los caracterizan y, a la vez, que los grupos obtenidos
sean lo ms heterogneos posible en relacin con las variables observadas.
Individuo X1 X2 ... Xk
Vamos a suponer que disponemos de una pequea muestra de 10 individuos a los que
hemos preguntado acerca de las siguientes dos caractersticas culturales de su viaje a una
determinada ciudad:
Individuo X1 X2
1 5 3
2 4 2
3 5 3
4 3 4
5 5 2
6 4 3
7 2 5
8 3 5
9 2 5
10 3 4
FUOC PID_00173351 93 Estadstica aplicada a la investigacin en cultura
Aplicaciones de las
Las medidas distancia ms comunes para determinar la disimilaridad medidas distancia
entre dos individuos son:
Las medidas distancia son las
que habitualmente se utilizan
en problemas de economa.
1.74
1.75
1.76
Ejemplo
Vamos a calcular estas distancias para los individuos 1 y 2 a partir de los datos de que
disponemos (tabla del ejemplo anterior).
1.77
1.78
1.79
Para variables cuantitativas, las medidas disponibles en SPSS son distancia eu-
cldea, distancia eucldea al cuadrado, distancia bloque, distancia de Cheby-
chev, distancia de Minkowski, distancia personalizada, coseno y correlacin de
Pearson. Estas dos ltimas son medidas de similaridad. De todas estas medidas,
la ms utilizada (por defecto en el SPSS) es la distancia eucldea al cuadrado.
Ejemplo
Caso 1 2 3 4 5 6 7 8 9 10
1 ,000 2,000 ,000 5,000 1,000 1,000 13,000 8,000 13,000 5,000
2 2,000 ,000 2,000 5,000 1,000 1,000 13,000 10,000 13,000 5,000
3 ,000 2,000 ,000 5,000 1,000 1,000 13,000 8,000 13,000 5,000
4 5,000 5,000 5,000 ,000 8,000 2,000 2,000 1,000 2,000 ,000
5 1,000 1,000 1,000 8,000 ,000 2,000 18,000 13,000 18,000 8,000
6 1,000 1,000 1,000 2,000 2,000 ,000 8,000 5,000 8,000 2,000
7 13,000 13,000 13,000 2,000 18,000 8,000 ,000 1,000 ,000 2,000
8 8,000 10,000 8,000 1,000 13,000 5,000 1,000 ,000 1,000 1,000
9 13,000 13,000 13,000 2,000 18,000 8,000 ,000 1,000 ,000 2,000
10 5,000 5,000 5,000 ,000 8,000 2,000 2,000 1,000 2,000 ,000
Observaciones
Jerrquicos o no jerrquicos.
Aglomerativos (asociativos o aumentativos) o disociativos (diminutivos).
1) Vinculacin intergrupos. Se calcula la distancia entre dos grupos como Ventajas de la vinculacin
distancia media entre todos los pares de observaciones que pueden formarse intergrupos
tomando un miembro de un grupo y otro miembro de otro grupo. El mtodo de vinculacin in-
tergrupos tiene la ventaja de
que utiliza informacin de to-
dos lo pares de puntos en cada
1.80 decisin. Es el mtodo que uti-
liza por defecto SPSS.
1.81
Veamos con nuestro ejemplo cmo se aplica este mtodo. En la tabla siguiente se mues-
tra el historial de conglomeracin que proporciona SPSS para el mtodo de vinculacin
intergrupos basado en la distancia eucldea al cuadrado (vase la tabla del subapartado
7.2.1).
1 4 10 ,000 0 0 4
2 7 9 ,000 0 0 8
3 1 3 ,000 0 0 5
4 4 8 1,000 1 0 8
FUOC PID_00173351 97 Estadstica aplicada a la investigacin en cultura
5 1 6 1,000 3 0 7
6 2 5 1,000 0 0 7
7 1 2 1,500 5 6 9
8 4 7 1,667 4 2 9
9 1 4 8,960 7 8 0
1.82
1.83
1.84
1.85
1 4 10 ,000 0 0 4
FUOC PID_00173351 98 Estadstica aplicada a la investigacin en cultura
2 7 9 ,000 0 0 7
3 1 3 ,000 0 0 5
4 4 8 ,667 1 0 7
5 1 6 ,667 3 0 6
6 1 5 1,000 5 0 8
7 4 7 1,200 4 2 9
8 1 2 1,200 6 0 9
9 1 4 5,511 8 7 0
Consideremos, por ejemplo, la etapa 5 en la que se fusionan los grupos 1 (formado por
los individuos 1 y 3 unidos en la etapa 3) y 6. En este caso la distancia es:
1.86
1.87
Se forma el grupo (1,3,6) porque la distancia que se obtiene de 0,667 es la mnima dis-
tancia de todas las que se calculan en esta etapa, en la que tambin se compara el grupo
(1,3) con los grupos (4,8,10) y (7,9) generados en etapas anteriores.
Debe considerarse que cuando se fusionan dos grupos, el centroide del nue-
vo grupo es una media ponderada de los centroides de los grupos fusionados,
donde los pesos de ponderacin son los tamaos de los conglomerados res-
pectivos. Por tanto, el tamao de los grupos influye en el centroide del nuevo
grupo, que se acercar ms al grupo de mayor tamao.
Para decidir acerca del nmero de grupos a considerar en nuestro anlisis, po-
demos utilizar la representacin grfica que resume el historial de agrupacin
y que se conoce con el nombre de dendograma.
Ejemplo
Ejemplo
Bibliografa
Canavos, C. (1992). Probabilidad y estadstica. Aplicaciones y mtodos. Madrid: McGraw-Hill.
Carrasco Arroyo, S. (2006, diciembre). "Medir la cultura: una tarea inacabada". Perifrica
(n. 7). Cdiz: Universidad de Cdiz.
Carrasco, S. (1999). Los sistemas culturales locales en la Comunidad Valenciana: Una aplicacin
desde el anlisis de componentes principales. Tesis doctoral presentada en el Departamento de
Economa Aplicada de la Universidad de Valencia.
Carrasco, S.; Rausell, P. (2001). "La provisin de cultura en Espaa desde una perspectiva
del anlisis regional". ICE (n. 792).
<http://sic.conaculta.gob.mx>
Escuder, R.; Murgui, S. (1995). Estadstica Aplicada. Economa y Ciencias Sociales. Valencia:
Tirant lo Blanch.
INE (2004). Encuesta de empleo del tiempo 2002-2003. Resultados definitivos. Nota de prensa
de 1 de julio del 2004, Madrid.
INE (2007). "Encuesta de Empleo del Tiempo. Qu hacemos y durante cunto tiempo". Cifras
INE. Boletn informativo (n. 4, 2007). Madrid: Instituto Nacional de Estadstica.
Juan, A.; Sedano, M.; Vila, A. (2002). "Distribuciones muestrales". Proyecto e-Math. Barce-
lona: UOC.
Juan, A.; Sedano, M.; Vila, A.; Lpez, A. (2003). "Contraste de Hiptesis de Dos Pobla-
ciones". Proyecto e-Math. Barcelona: UOC.
Juan, A.; Sedano, M.; Vila, A.; Martnez, J. F.; Lpez, A. (2003). "Modelos de Probabi-
lidad". Proyecto e-Math. Barcelona: UOC.
Lee, C.; Lee, Y.; Wicks, B. E. (2004). "Segmentation of Festival Motivation by Nationality
and Satisfaction". Tourism Management (25 -1).
Mariscal, J. L. (2006). "Formacin y capacitacin de los gestores culturales". Apertura (n. 4).
OCDE (1997). Better understanding our cities. The role of urban indicators. Pars: OCDE.
Rausell, P.; Abeledo, R.; Cabaes, F.; Marco, F.; Montagut, J. (2009). El Sector Profe-
sional de la Cultura en la Regin de Murcia. Caractersticas de la Gestin Cultural y la Deteccin
de las Necesidades Formativas del Sector Profesional de la Gestin Cultural en la Regin de Murcia.
Murcia: Murcia Cultural, S.A.
Rausell, P.; Sanchs, N.; Martnez, J.; Asuaga, C.; Boluda, A.; Carrasco, S.; Mayor,
R. (2004). Diagnosi de la realitat dels sectors culturals de Gandia. Valencia: Universidad de Va-
lencia.
Uriel, E.; Contreras, D.; Molt, M. L. (1990). Econometra. El modelo lineal. Madrid: AC.
Vila, A.; Sedano, M.; Juan, A.; Lpez, A. (2003). "Contrastes de hiptesis de 1 poblacin".
Proyecto e-Math. Barcelona: UOC.