Está en la página 1de 33

C

CCU
UUR
RRS
SSO
OO D
DDE
EE I
IIN
NNT
TTR
RRO
OOD
DDU
UUC
CCC
CCI
II
N
NN y
yy M
MMA
AAN
NNE
EEJ
JJO
OO
B
BB
S
SSI
IIC
CCO
OO D
DDE
EEL
LL S
SSP
PPS
SSS
SS
S
SSE
EES
SSI
II
N
NN I
II:
::
T
TT
c
ccn
nni
iic
cca
aas
ss d
dde
ee A
AAn
nn
l
lli
iis
ssi
iis
ss M
MMu
uul
llt
tti
iiv
vva
aar
rri
iia
aan
nnt
tte
ee.
.. C
CCl
lla
aas
ssi
iif
ffi
iic
cca
aac
cci
ii
n
nn,
,,
d
dde
ees
ssc
ccr
rri
iip
ppc
cci
ii
n
nn y
yy d
ddi
iis
ssp
ppo
oon
nni
iib
bbi
iil
lli
iid
dda
aad
dd e
een
nn S
SSP
PPS
SSS
SS
DETERMINACIN
DEL PROBLEMA
OBTENCIN
DE INFORMACIN
ANLISIS
INFORME
F.SECUNDARIAS
F.PRIMARIAS
- SOPORTE IMPRESO
- SOPORTE MAGNTICO
- UNIVERSO
- PRETEST Y TRABAJO DE CAMPO
- CODIFICACIN Y TABULACIN
- CONTROL
- MUESTREO
- CUESTIONARIO
MULTIVARIANTE
SIMPLE
- ESTADSTICA DESCRIPTIVA
- ANLISIS DE CORRELACIN: Numrica,
ordinal o categrica
- NMEROS NDICES
- GRFICOS Y TABLAS
- ANLISIS DE INTERDEPENDENCIA:
- ANLISIS DE DEPENDENCIA: Anova, Ancova, Manova y Mancova. Anlisis de Regresin.
Anlisis Discriminante. Correlacin Canvnica
- Entre variables: Anlisis Factorial. Componentes principales
- Entre sujetos: Anlisis Cluster. Anlisis Multidimensional No-Mtrico. Anlisis Conjunto
ESQUEMA DE OBTENCIN Y ANLISIS DE DATOS
DE DIRECCIN
TCNICO
ESQUEMA DE CLASIFICACIN DE
TCNICAS DE ANLISIS MULTIVARIANTE
ANLISIS DE DEPENDENCIA:
TABLAS DE CONTINEGENCIA.
ANOVA, ANCOVA, MANOVA, MANCOVA.
ANLISIS DE REGRESIN.
ANLISIS DISCRIMINANTE LOGIT - PROBIT.
CORRELACIN CANNICA.
ANLISIS DE INTERDEPENDENCIA.
ENTRE VARIABLES:
COMPONENTES PRINCIPALES.
ANLISIS FACTORIAL.
ANLISIS CONJUNTO.
ENTRE SUJETOS:
CLUSTER O ANLISIS DE GRUPOS.
ANLISIS MULTIDIMENSIONAL NO MTRICO.
EXTENSIN DE TCNICAS DE ANLISIS
MULTIVARIANTE
VICENS OTERO, J. Estudios de mercado en la empresa
espaola. Instituto de Prediccin Econmica L. R. Klein.
Documento 96/4. Julio 1996.
Resultados para 300 empresas con cifras de ventas superiores a 250 mill. Pts.
UTILIZACIN DE LOS DISTINTOS TIPOS DE ANLISIS
SI
(Porcentaje)
NO
(Porcentaje)
TOTAL
(Porcentaje)
ANLISIS ESTADSTICO
SIMPLE 20.8% 79.2% 100%
ANLISIS ESTADSTICO MULTIVARIANTE
8.2% 91.8% 100%
UTILIZACIN DE PROGRAMAS DE
ORDENADOR PARA EL ANLISIS 29.8% 70.2% 100%
MTODOS DE ANLISIS REALIZADOS EN 1994
(Porcentaje)
SI HA REALIZADO
ANLISIS ESTADSTICO
MULTIVARIANTE
NO HA
REALIZADO
PERSONAL
PROPIO
CONSUL-
TORA
EXTERNA
PERSONAL
INTERNO Y
EXTERNO
TOTAL
ANLISIS DE LA
VARIANZA 88.6% 4.2% 4.8% 2.4% 100%
ANLISIS DE LA
COVARIANZA 94.5% 1.8% 3.7% 0.0% 100%
ANLISIS DISCRIMIANTE
93.3% 1.2% 4.9% 0.6% 100%
CORRELACIN
CANNICA 98.8% 0.0% 1.2% 0.0% 100%
ANLISIS
FACTORIAL 85.4% 2.5% 9.1% 3.0% 100%
ANLISIS DE REGRESIN
89.1% 5.5% 4.2% 1.2% 100%
CLUSTER O
ANLISIS DE GRUPO 87.2% 4.2% 7.4% 1.2% 100%
ESCALAS MULTI-
DIMENSIONALES 95.1% 2.5% 1.2% 1.2% 100%
ANLISIS
CONJUNTO 93.9% 3.0% 2.5% 0.6% 100%
FACTORES, VARIABLES Y
ESCALAS DE MEDIDA
TIPOLOGA:
Variables Continuas y Discretas
Variable Temporal, Transversal y Panel Data
......etc
ESCALAS DE MEDIDA:
Nominal (Factor)
Identifica la pertenencia de un elemento
sujeto u objeto a un grupo u otro, a
niveles generalmente mutuamente
excluyentes. Permite la distincin entre
elementos pero no su ordenacin.
Ordinal
Identifica a cada elemento en una
posicin de escala respecto a los otros.
Intervalo
Identifica la posicin ordinal de cada
elemento y permite adems medir las
distancias entre unos y otros utilizando
una escala de medida subjetiva.
Razn
Permite medir las distancias entre
elementos utilizando una escala de
objetiva y, por lo tanto, posibilita la
utilizacin de razones o ratios
comparativos.
CONDICIONA LA HERRAMIENTA DE ANLISIS Y, POR
TANTO, LA CALIDAD DE LOS RESULTADOS
ES CONDICIONADA POR LOS OBJETIVOS
EXPERIMENTALES, LOS RECURSOS DISPONIBLES, Y
LA DIFICULTAD DE PERCEPCIN EXPERIMENTAL.
TABLAS DE CONTINGENCIA
C APROPIADAS CUANDO......
Se desea organizar informacin relativa a ms de un factor, explorar la
relacin de dependencia o independencia entre los factores y eventualmente
medir el grado de asociacin entre los mismos. As mismo, apropiadas
cuando se desea medir el grado de concordancia entre clasificaciones
factoriales de objetos o sujetos.
EJEMPLO 1 (Organizacin bifactorial): Cmputo sencillo de
validez de Test Diagnsticos.
Punto de partida: Se ordenan en una tabla de dos dimensiones los
resultados de un test diagnstico para 100 pacientes (50
enfermos - 50 sanos) segn los resultados positivos y
negativos. La informacin contenida en las distintas
celdas, debidamente relativizada, nos permitir
determinar la sensibilidad del Test (Prob. Diagnstico
correcto para un enfermo), su especificidad Prob.
Diagnstico correcto para un NO enfermo) y sus valores
predictivos positivo (Prob. Enfermedad ante test
Positivo) y negativo (Prob. NO Enfermedad ante test
Negativo)
EJEMPLO 2 (Relacin entre dos factores): Relacin entre el
riesgo de infeccin por virus la hepatitis B del personal sanitario
y la manipulacin de sangre o material biolgico.
Punto de partida: Se realiza un estudio serolgico en 50 voluntarios del
grupo de mayor riesgo y 100 del grupo de menor riesgo.
Suponiendo que la muestra es suficientemente
representativa se observar la dependencia entre el
puesto de trabajo y el riesgo de infeccin heptica.
EJEMPLO 3 (Factores multinivel): Relacin entre el intervalo
de edad infantil y el padecimiento del sarampin, rubola y
parotiditis como paso previo al estudio de la escolarizacin como
factor de riesgo en la transmisin de estas enfermedades
infeccionas.
Punto de partida: Se toman los datos de la edad de 265 nios
clasificndolos por intervalos en cuatro grupos (Menores
de cuatro aos, entre 4 y 5 aos, entre 6 y 7 aos y
mayores de siete aos). As mismo, se estudia su
situacin inmunolgica detectndose la presencia o
ausencia de anticuerpos frente a cada uno de esos virus.
EJEMPLO 4 (Anlisis de concordancia): Homogeneidad de
criterios en la hospitalizacin entre dos centros diferentes
Punto de partida: Se selecciona una muestra experimental de 50 pacientes
que sern atendidos, con los mismos sntomas, por
facultativos de dos centros diferentes. Para cada paciente
se anota la decisin de hospitalizacin SI - NO en cada
uno de los dos centros.
: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - RESUMIR - TABLAS DE CONTINGENCIA
FACTOR 1
FACTOR 2
Medidas para el estudio de la
correlacin, dependencia y
asociacin entre factores
Control de la informacin a
mostrar en las casillas interiores
de la tabla y marginales de filas
y columnas.
ANLISIS DE LA VARIANZA
C APROPIADO CUANDO......
Se desea analizar si los distintos niveles de un determinado factor inciden
en los valores de una variable cuantitativa. Si se emplean como
explicativos dos o ms factores hablamos de una ANOVA multifactorial y,
en ese caso, cobrarn inters los efectos de los niveles de cada uno de los
factores y los efectos de las interacciones entre los niveles de los factores.
Algunas variantes de esta tcnica son especialmente atractivas para casos
experimentales concretos, en especial el ANCOVA.
EJEMPLO 1 (Anova Unifactorial - Experimento de
homogeneidad de datos pareados): Eficacia de un tratamiento
antitaquicrdico
Punto de partida: Se realiza un experimento con 50 pacientes tomando las
pulsaciones por minuto antes y despus de la
administracin del medicamento.
EJEMPLO 2 (Anova Unifactorial sobre grupos diferentes):
Relacin entre la localizacin del Cncer Gstrico en el nmero
de monocitos del enfermo.
Punto de partida: Se toman 50 enfermos de cncer gstrico dividios en tres
grupos: 15 con carcinoma en fundus, 15 con carcinoma
en curvatura y 20 con carcinoma en ploro. Al efectuar
un hemograma se realiza un recuento monocitario.
EJEMPLO 3 (Anova con dos factores): Independencia,
sinergismo o antagonismo del consumo de Haschis y la Cocana.
Punto de partida: Se dispone de una muestra de 100 individuos de los
cuales, un 25% no son consumidores de ninguna de las
dos drogas, otro 25% son consumidores exclusivos de
cocana, un 25% exclusivos de Haschis y un 25% de
ambas drogas simultneamente. En condiciones
experimentales de homogeneidad adecuada se toman las
pulsaciones por minuto a estos 100 individuos. El
anlisis no slo permitir diferenciar la variabilidad
"biolgica" de la debida al consumo individual de cada
droga sino tambin de la debida a la interaccin de
ambas drogas.
: PROCEDIMIENTO SPPS
MEN (Anova Unifactorial):
ESTADSTICA - COMPARAR MEDIAS - ANOVA DE UN FACTOR
MEN (ANOVA Multifactorial):
ESTADSTICA - MODELO LINEAL GENERAL - COMPONENTES DE LA VARIANZA
VARIABLES A
EXPLICAR
FACTOR EXPLICATIVO
Contrastes de existencia de
tendencia en la endgena y
contrastes "t" de significacin
para los niveles del factor.
Pruebas a posteriori para
determinar qu medias difieren
en el caso en que el ANOVA
resulte significativo.
Test de homogeneidad de
varianzas, presencia de estadsticos
descriptivos y tratamiento de los
valores perdidos.
ANLISIS DE REGRESIN
C APROPIADO CUANDO......
SIEMPRE que la calidad de los datos lo permita para el anlisis de
dependencia univariante o multivariante. Su precisin, refinamiento y
potencia de anlisis es muy superior a las de otras tcnicas de anlisis de
dependencia, permitiendo la realizacin de ejercicios de simulacin y
prediccin. Como contrapartida, sus virtudes slo pueden explotarse
asumiendo una complejidad que puede llegar a ser muy acusada, de modo
que su aplicacin exige un importante compromiso de recursos tcnicos.
VARIANTES BSICAS (Recogidas en SPSS)
Modelo Bsico de Regresin Lineal por MCO
Aproximacin clsica adecuada para relaciones lineales entre variables
exgenas y endgena en las que cabe asumir un nico sentido de la
causalidad y el estricto cumplimiento de las Hiptesis Bsicas tanto
estructurales como referidas a la perturbacin aleatoria (especialmente la
homocedasticidad y ausencia de autocorrelacin residual).
Regresin no lineal (RNL - NLR)
Aproximacin genrica para aquellos casos en los que no puede suponerse
linealidad en la relacin entre exgenas y endgena. Orientado en el SPSS
a la prediccin simple de series temporales.
Estimacin ponderada (MCP - WLS)
Estimacin especfica para ajustar relaciones de dependencia en las que se
viole la condicin de varianza constante para la variable endgena en la
poblacin objeto de estudio. El mtodo afina el resultado de una estimacin
clsica ponderando en mayor medida las observaciones ms precisas.
Estimacin en dos etapas (MC2E - 2SLS)
Una de las muchas aproximacin especficas para aquellos casos en los que
los errores del modelo aparecen correlacionados con alguna exgena, por
ejemplo, cuando la relacin de causalidad no se da exclusivamente desde
las exgenas a la endgena, sospechndose la existencia de un efecto de
retroalimentacin en sentido inverso.
EJEMPLO 1 (Regresin lineal bsica multivariante): presin
arterial en la poblacin fumadora.
Punto de partida: Sobre una muestra de 500 fumadores habituales mayores
de 50 aos se desea establecer la relacin entre la presin
arterial y algunas de sus caractersticas bsicas y
hbitos: edad, peso, nmero de aos con el hbito de
fumar y nmero de cigarrillos diarios promedio en los
ltimos 5 aos. Todas las variables pueden medirse en
escalas de razn.
EJEMPLO 2 (Regresin univariante no lineal): Prediccin de
la extensin de la infeccin por VIH.
Punto de partida: Utilizando el censo espaol de casos de infeccin VIH se
determina el nmero de casos por mil habitantes
ocurridos desde 1980. La evolucin de la enfermedad
ser, con seguridad, no lineal, lo que impedir el ajuste
de un modelo bsico de regresin. Un ajuste de tipo
logstico permitir realizar una mejor prediccin para el
perodo 2001 2005.
EJEMPLO 3 (Regresin univariante por estimacin
ponderada): Relacin entre la edad de los trabajadores y la
duracin de las bajas por enfermedad.
Punto de partida: Utilizando estadsticas de una mutualidad laboral, se
desea establecer la relacin entre la edad de los
trabajadores y el total de das de anuales que solicitan
por baja de enfermedad. La relacin positiva es
previsible, pero para estimar de forma precisa el valor
del parmetro debe observarse el hecho de que, a mayor
edad, la varianza de la endgena crece como
consecuencia de la aparicin progresiva de un mayor
espectro de enfermedades de distinta gravedad y, por lo
tanto, de distinto perodo de baja.
EJEMPLO 4 (Regresin por estimacin con variables
instrumentales): Demanda de un determinado producto
farmacutico .
Punto de partida: Una empresa farmacutica est interesada en medir los
factores que han impulsado los cambios en las ventas de
un novedoso producto sin competencia a lo largo de los
ltimos tres aos. Para ello dispone de datos mensuales
de ventas, precio medio, promocin y publicidad entre
facultativos e incidencia de la enfermedad en el
segmento poblacional de inters. La estimacin simple
de los parmetros estara sesgada, especialmente para el
parmetro de la incidencia, en cuanto que las ventas del
producto farmacetico pueden funcionar como
explicativa para la incidencia de la misma.
: PROCEDIMIENTO SPPS
MEN (Regresin Lineal MCO y Regresin MCP - WLS):
ESTADSTICA - REGRESIN - LINEAL
Mtodo para la
inclusin selectiva
de las variables
exgenas
VARIABLES
EXPLICATIVAS
VARIABLE A
EXPLICAR
Posibilidad de
limitar el anlisis a
un conjunto de casos
segn el valor de
una variable
Seleccin mtodo
de Mnimos
Cuadrados
Ponderados (WLS)
Intervalos de confianza para los coeficientes,
matriz de varianzas y covarianzas,
correlaciones parciales y semiparciales, test
multicolinealidad, Durbin Watson.
: PROCEDIMIENTO SPPS
MEN (Regresin Curvilnea):
ESTADSTICA - REGRESIN - ESTIMACIN CURVILNEA
: PROCEDIMIENTO SPPS
MEN (Regresin genrica NO Lineal):
ESTADSTICA - REGRESIN - NO LINEAL
VARIABLES A
PREDECIR
VARIABLES
PREDICTORA
TIEMPO
Tipo de modelo de
ajuste curvilneo.
Variable para
etiquetar cada
punto.
VARIABLES A
EXPLICAR
EXPRESIN
NO LINEAL
DEL MODELO
La sintaxis de la expresin no lineal del se
escribir utilizando variables dependientes
(cuadro superior), el cuadro operativo
bsico y las funciones prediseadas.
ANLISIS DISCRIMINANTE - ANLISIS LOGIT -
ANLISIS PROBIT
C APROPIADOS CUANDO......
En trminos generales, todas estas tcnicas permiten explicar el valor de un
factor utilizando la informacin de variables explicativas cuantitativas. En
el campo de la medicina, resulta especialmente atractivo para la diagnosis y
para la determinacin del nivel de estmulo efectivo en los tratamientos.
VARIANTES BSICAS (Recogidas en SPSS)
Anlisis DISCRIMINANTE
Aunque todos estos anlisis son en realidad anlisis discriminantes, el
SPSS denomina especficamente A. Discriminante al caso en el que se
utiliza una aproximacin no probabilstica apoyada en clculos sobre la
variacin intragrupal y entregrupal observada. El factor a explicar
representa generalmente el grupo de pertenencia de una serie de
individuos. El anlisis discriminante utilizar la informacin de un
conjunto de variables observadas para esos sujetos u objetos a fin de
construir unas funciones discriminantes (basadas en simples
combinaciones lineales de las variables predictoras), capaces de explicar
esa pertenencia a uno u otro grupo (ADD) y de construir un modelo
predictivo (ADP) para pronosticar el grupo de pertenencia de un caso a
partir de las caractersticas observadas de cada caso. Si bien no se reduce
slo al caso dicotmico para la endgena requiere que las variables
explicativas sean continuas.
Modelos LOGIT - PROBIT
El modelo LOGIT es en realidad un tipo especfico de regresin en el que
la variable endgena es dicotmica mientras que las explicativas pueden
ser continuas o categricas. El contexto es similar al descrito en el cuadro
anterior para el anlisis discriminante, pero ahora el anlisis suele enfocarse
a aquellos casos en los que la variable endgena puede interpretarse en
trminos de probabilidad y el objetivo es cuantificar la relacin entre las
caractersticas individuales de los individuos y esa probabilidad. Los
coeficientes de regresin logstica, aunque difciles de interpretar, pueden
utilizarse para estimar la razn de las ventajas relativas de cada variable
independiente del modelo. La regresin logstica es aplicable a un rango
ms amplio de situaciones de investigacin que el anlisis discriminante.
La regresin PROBIT, muy similar a la empleada en el LOGIT, suele
utilizarse en aquellos casos en los que se sospecha que una respuesta
dicotmica est influida por el nivel de alguna o algunas variables
explicativas. El procedimiento, permitir estimar muy fcilmente la
intensidad necesaria para que un estmulo llegue a inducir una determinada
proporcin de respuestas.
EJEMPLO 1 (Anlisis Discriminante): Seleccin de la cartera
de clientes solventes de una Aseguradora Mdica.
Punto de partida: Una aseguradora analiza su cartera de 2500 clientes
distinguiendo a aquellos que han hecho frente a sus
cuotas con regularidad de aquellos que no lo han hecho.
Adicionalmente, revisa para cada uno de los 2500
clientes algunas variables que se sospecha pueden estar
en relacin directa con la solvencia: edad, renta mensual,
antigedad del contrato, nmero de hijos.
Estas cinco variables permitirn elaborar un mximo de
cuatro funciones discriminantes que ayuden a
caracterizar a cada uno de los grupos. Adems, si el valor
predictivo de las mismas es elevado podrn utilizarse
para elaborar la conveniencia de admitir a un nuevo
solicitante o rechazar su solicitud como asegurado.
EJEMPLO 2 (Anlisis LOGI T): Factores de riesgo para el
desarrollo de aterosclerosis.
Punto de partida: Apoyndonos en el diseo de una amplia muestra de
historiales mdicos se desea establecer la importancia de
cada uno de los factores de riesgo en el desarrollo de la
aterosclerosis. Para cada uno de los individuos que
constituyen la muestra, se dispone de informacin para
un perodo determinado acerca de variables referidas a:
tabaquismo, dieta (en especial niveles sricos medios de
colesterol), edad, sexo, tensin arterial, consumo de
alcohol, sedentarismo y antecedentes genticos. El ajuste
de una funcin LOGIT permitir determinar cmo incide
cada uno de estos factores en la probabilidad de
desarrollo de la enfermedad a fin de orientar la poltica
preventiva, elaborndose adems un instrumento
medidor del riesgo de padecimiento.
EJEMPLO 3 (Anlisis PROBI T): Determinacin de la dosis
de respuesta adecuada a un frmaco.
Punto de partida: Apoyndonos en un diseo experimental se administra
un determinado medicamento a 60 individuos divididos
en 20 grupos de 3 personas. A cada grupo se le
administra una cantidad en mmg diferente desde 11
(primer grupo) a 30 (ltimo grupo) y se anota su
reaccin despus de un tiempo de 1 hora calificndose el
resultado en cada individuo como POSITIVO o
NEGATIVO. El ajuste de una funcin PROBIT
permitir determinar la dosis ms adecuada para
provocar una reaccin positiva al medicamento.
: PROCEDIMIENTO SPPS
MEN (DI SCRI MI NANTE):
ESTADSTICA - CLASIFICAR DISCRIMINANTE
: PROCEDIMIENTO SPPS
MEN (ANLI SI S PROBI T):
ESTADSTICA - REGRESIN - PROBIT
FACTOR DE
AGRUPACIN A
EXPLICAR
VARIABLES
DISCRIMINANTES
Estadsticos descriptivos de las variables independientes
segn los diferentes grupos. Coeficientes de la funcin de
clasificacin de Fisher y descomposicin de Matrices de
Varianzas y Covarianzas.
Controla cmo
usar para la
clasificacin de
individuos el
resultado obtenido
en las funciones
discriminantes, en
especial para fines
predictivos.
Variable que contiene,
para cada nivel de
exposicin (casos) el
% de reacciones
positivas a ese nivel
de estimulacin.
Variable que contiene,
para cada nivel de
exposicin (casos) el
nmero de sujetos
expuestos a ese nivel
de estimulacin.
Variable o
variables
predictoras, esto
es, variables de
estmulos.
Permite obtener una prueba de
paralelismo (todos los niveles del
factor tiene pendiente comn ) y
controlar algunos aspectos de la
estimacin de los parmetros.
CORRELACIN CANNICA
C APROPIADA CUANDO......
Se desea abordar el estudio de un fenmeno de causalidad entre dos
fenmenos que vienen representadas, tanto el causado como el explicativo,
por un conjunto de variables, y no se desea restringir el modo en que cada
una de las variables explicativas incide en cada una de las explicadas.
EJEMPLO 1 (Anlisis Correlacin Cannica): Determinacin
de la relacin entre el nivel de desarrollo econmico y el nivel de
desarrollo sanitario de un conjunto de pases.
Punto de partida: Un estudio planteado a nivel internacional desea
establecer la relacin entre el nivel de renta y nivel de
desarrollo sanitario en un conjunto de pases. El analista
dispone de 25 variables homogneas del nivel de
desarrollo sanitario de cada pas (gasto farmacutico de
distintos tipos, instalaciones hospitalarias por 1000 hb de
distintos tipos, mdicos por 1000 hb de distintas
especialidades, ....). As mismo dispone de otras 25
variables relativas al desarrollo econmico (PIB real por
Hb, tasa de actividad, tasa de paro, capacidad de
eneudamiento.....). Mediante un anlisis de correlacin
cannica el analista puede construir un modelo de
causalidad entre ambos conjuntos de variables sin
necesidad de especificar el detalle del modelo de
casualidad para cada par de variables.
ANLISIS DE COMPONENTES PRINCIPALES
C APROPIADO CUANDO......
Se desea reducir las dimensiones de un conjunto de variables sin prdida
excesiva de informacin. El mtodo de componentes principales permitir
generar combinaciones lineales de las variables originales de modo que las
nuevas variables contengan gran parte de la informacin original. Su coste
debe valorarse en trminos de interpretabilidad de esos componentes.
Aunque no es infrecuente su confusin con el anlisis factorial existen
importantes diferencias conceptuales; en todo caso, la relacin provendra
del hecho de que la tcnica de componentes principales es uno de los
mtodos de extraccin factorial ms utilizados.
EJEMPLO 1 (Anlisis de Componentes Principales):
Determinacin de la relacin entre la esperanza de vida media y
el nivel de desarrollo econmico y sanitario de un conjunto de
pases.
Punto de partida: Un estudio planteado a nivel internacional desea
establecer la relacin entre la esperanza de vida media de
un conjunto de pases y su nivel de renta y desarrollo
sanitario. El analista dispone de 25 variables
homogneas del nivel de desarrollo sanitario de cada pas
(gasto farmacutico de distintos tipos, instalaciones
hospitalarias por 1000 hb de distintos tipos, mdicos por
1000 hb de distintas especialidades, ....). As mismo
dispone de otras 25 variables relativas al desarrollo
econmico (PIB real por Hb, tasa de actividad, tasa de
paro, capacidad de eneudamiento.....). Mediante un
anlisis de componentes principales el analista puede
reducir el conjunto inicial de 50 variables a unos cuantos
Componentes Principales, aprovechando las posibles
redundancias existentes en datos referidos a cuestiones
similares.
ANLISIS FACTORIAL
C APROPIADO CUANDO......
Se desea obtener una medicin de una serie de factores de naturaleza
inobservables, aprovechando para ello la dependencia o relacin comn de
un conjunto de variables en torno a estos factores. El anlisis requiere datos
expresados en variables de intervalo.
EJEMPLO 1 (Anlisis Factorial): Aproximacin de la
capacidad de abstraccin, la capacidad de clculo y la memoria
de los alumnos universitarios.
Punto de partida: Partiendo de los expedientes de ms de 10.000 alumnos
de se extraen las notas correspondientes a 15 materias en
las que las proporciones de capacidad de clculo,
capacidad de abstraccin y memoria intervienen de en
distintas proporciones. Observando las presencia o
ausencia de correlaciones entre las distintas notas
(comunalidad) pueden identificarse los mecanismos de
causalidad en las calificaciones. Un anlisis detallado de
la composicin factorial revelar que los mimos se
corresponden con la capacidad de abstraccin, capacidad
de clculo y memoria. Las denominadas "puntuaciones
factoriales" permitirn medir, a partir de las notas
iniciales, las tres capacidades comentadas tanto en los
elementos que componen la muestra como en nuevos
elementos.
EJEMPLO 2 (Ayuda SPSS) (Anlisis Factorial): Qu
actitudes subyacentes hacen que las personas respondan a las
preguntas de una encuesta poltica de la manera en que lo
hacen?
Punto de partida: Examinando las correlaciones entre los elementos de la
encuesta se deduce que hay una superposicin
significativa entre los diversos subgrupos de elementos
(las preguntas sobre los impuestos tienden a estar
correlacionadas entre s, las preguntas sobre temas
militares tambin estn correlacionadas entre s...., y as
sucesivamente). Con el anlisis factorial, se puede
investigar el nmero de factores subyacentes y, en
muchos casos, se puede identificar lo que los factores
representan conceptualmente. Adicionalmente, se pueden
calcular las puntuaciones factoriales para cada
encuestado, que pueden utilizarse en anlisis
subsiguientes. Por ejemplo, es posible construir un
modelo de regresin logstica para predecir el
comportamiento de voto basndose en las puntuaciones
factoriales.
: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - REDUCCIN DE DATOS - FACTORIAL
El anlisis factorial implica, generalmente el desarrollo de tres etapas: Anlisis
Preliminar de viabilidad, Extraccin Factorial y Rotacin factorial. El SPSS ofrece
una gran flexibilidad para afrontar cada una de estas tres etapas.
Ofrece varios mtodos
de rotacin tanto
ortogonales como
oblicuos.
Facilitan el anlisis
preliminar de las
variables y sus
correlaciones de
cara a anticipar la
viabilidad del
anlisis.
Conjunto de
variables
fundamental, a
partir para las que se
desea encontrar
factores subyacentes
comunes.
Posibilidad de limitar
el anlisis a un
nmero limitado de
casos segn una
variable de seleccin.
Permite obtener y
guardar el valor de los
factores a partir de las
variables originales
Permite especificar el
mtodo de extraccin,
el nmero de factores
a extraer as como las
iteraciones mximas a
considerar en la
extraccin.
ANLISIS CONJUNTO
C APROPIADO CUANDO......
Se desea establecer en que medida los distintos atributos de un objeto
inciden en su seleccin preferente por parte de un conjunto de individuos.
El anlisis conjunto intentar aproximarse a la estructura subyacente de
seleccin determinando la importancia relativa de cada atributo as como la
combinacin de los mismos que resulte ms atractiva.
EJEMPLO 1 (Anlisis Conjunto): Diseo de un nuevo
producto farmacutico.
Punto de partida: Un laboratorio farmacutico desea lanzar al mercado un
nuevo analgsico de tipo genrico. Su experiencia en el
mercado le ha permitido identificar una serie de variables
que condicionan la preferencia por una u otra marca
como: precio, formato de presentacin (grageas, sobres,
...), sabor del preparado, rapidez de accin, cantidad de
contenido, tipo de publicidad asociada (facultativo,
medios comunicacin,..). El anlisis conjunto permitir
ordenar de modo relativo cada uno de esos atributos,
para ponderar su importancia relativa en la seleccin del
producto y establecer la combinacin ptima para el
nuevo producto.
ANLISIS CLUSTER
C APROPIADO CUANDO......
Se desea aprovechar la informacin relativa a un conjunto de variables para
clasificar a un grupo amplio de sujetos y objetos en subgrupos de mxima
homogeneidad intergrupal y mayor heterogeneidad entregrupal. El anlisis
cluster no debe confundirse con el discriminante, ya que ese ltimo tiene
por objeto explicar una clasificacin establecida a priori mientras que el
anlisis cluster intenta, precisamente, generar esa clasificacin a partir de
un nico grupo global.
EJEMPLO 1 (Anlisis Cluster): Anlisis geogrfico de los
perfiles de sanitarios de la poblacin.
Punto de partida: A fin de planificar convenientemente la poltica
preventiva, desde el Ministerio de Sanidad de un
determinado pas se plantea la necesidad de dibujar el
"mapa sanitario", dividiendo el total del territorio en
zonas de caractersticas sanitarias homogneas, no
necesariamente similares a las divisiones poltico
administrativas. Se sospecha que una diferenciacin de
este tipo puede tener sentido en la medida en que algunos
de los factores de riesgo ms importantes tienen relacin
con la distribucin geogrfica: factores demogrficos,
factores ambientales (clima, calidad del agua,...),
dietticos culturales entre otros. As pues, se recopila
informacin relativa a la incidencia de un conjunto de
enfermedades frecuentes como: enfermedades
cardiovasculares (cardiopatas coronarias y accidentes
cerebro - vasculares), distintos tipos de cncer (mama,
colon y recto, pulmn, cervix y endometrio..),
enfermedades de transmisin area (gripe, legionelosis,
tuberculosis...), enfermedades de transmisin entrica
(botulismo, diarreas vricas, salmonelosis, shigelosis,
colera., poliomielitis, hepatitis A...), enfermedades
transmitidas por contacto (ttanos, brucelosis,
toxoplasmosis...) y enfermedades de transmisin sexual
(sida, sfilis, ...) La utilizacin de todos estos indicadores
dividir a la poblacin total en grupos homogneos desde
el punto de vista sanitario. Determinar la viabilidad
geogrfica de esta agrupacin ser un paso posterior en
el anlisis.
: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - CLASIFICAR - CONGLOMERADOS JERRQUICOS
El SPSS ofrece la
posibilidad de aplicar
la metodologa
CLUSTER a
variables, en lugar de
objetos o sujetos.
Conjunto de
variables utilizadas
para la segmentacin
Variable que
etiquetar cada
individuo u objeto a
clasificar.
El anlisis Cluster viene condicionado sensiblemente
por el mtodo de aglomeracin utilizado, la medida de
distancia empleada. El SPSS ofrece una amplia
variedad de mtodos.
Permite elaborar el
clsico Dendograma o
grfico de agrupacin
secuencial de los
objetos analizados.
Guarda el grupo de
pertenencia de objetos
ANLISIS MULTIDIMENSIONAL NO MTRICO
C APROPIADO CUANDO......
Se desea comprender la estructura subyacente a de un conjunto de medidas
de similitud o distancia entre objetos o sujetos. Para ello se asignan las
observaciones disponibles de esos sujetos u objetos a posiciones especficas
en un espacio conceptual (normalmente de dos o tres dimensiones) de
modo que las distancias entre los puntos en el espacio concuerden al
mximo con las disimilaridades observadas. En muchos casos, las
dimensiones de este espacio conceptual son interpretables y se pueden
utilizar para comprender mejor los datos. El escalamiento multidimensional
puede tambin aplicarse a valoraciones subjetivas de disimilaridad entre
objetos o conceptos.
: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - ESCALAS - ESCALAMIENTO MULTIDIMENSIONAL
Permite controlar el
nivel de media, la
condicionalidad, las
dimensiones y el
mtodo de
escalamiento.
Conjunto de
matrices de variables
a partir de las cuales
se calcularn las
distancias entre
objetos o sujetos
para explicar sus
similaridades
Normalmente, los datos de partida son matrices que reflejan la similitud o
diferencia percibida entre los objetos o sujetos que ocupan cada fila y columna
(los datos son distancias). No obstante, si no se han creado las matrices a partir
de las variables en bruto, el SPSS las crea conforme a una medida de distancia
elegida por el usuario (crear distancias a partir de datos).
BIBLIOGRAFA
I. BIBLIOGRAFA GENERAL
BERSTEIN, I. (1998): Applied Multivariate Analysis Aplications Academic Press.
Inc. New York.
BISQUERA ALZINA, R. (1989): Introduccin conceptual al anlisis multivariable:
un enfoque informtico con los paquetes SPSS-X, BMDP, LISREL y SPAD. Vol. 1,
PPU, S.A.
COOLEY, W. y LOHNES, P. (1971): Multivariate Data Analysis. New York: John
Wiley Cop.
CUADRAS, C.M. (1991): Mtodos de Anlisis Multivariante. Barcelona: PPU (2
edicin).
DANIEL PEA SANCHES DE RIVERA. (1989): Estadstica modelos y mtodos, 1.
Fundamentos. Alianza Editorial.
DILLON y GOLDSTEIN. (1984): Multivariate Analysis. Methods and applications.
John Wiley & Sons.
FERRN ARANAZ, M. (1996): SPSS para Windows, Programacin y Anlisis
Estadstico. McGraw-Hill Interamericana, Madrid.
FLURY, B., RIEDWYL, H. (1988): Multivariate statistics: a practical approach.
Chapman and Hall.
HAIR, ANDERSON, TATHAM Y BLACK (1998): Multivariate Data Analysis.
Fifth Edition, Prentice-Hall, New Jersey.
HAIR, J.F.et al (1999): Anlisis Multivariante. 5 edicin, Prentice-Hall Iberia,
Madrid.
JOHNSON R. (1994): Applied multivariate statistical analysis. Madison, thurd. de.
pp. 459-491.
RICHARD A. JOHNSON, DEAN W. WICHERN. (1981): Applied multivariate
statistical analysis. Pretince-Hall.
RICHARD A. JOHNSON, DEAN W. WICHERN. (1992): Applied Multivariate
statistical anlysis. Third edition, Prentice-Hall International, Inc.
SNCHEZ CARRIN, J.J. (1995): Manual de Anlisis de Datos. Alianza Editorial.
URIEL, E. (1985): Anlisis de datos: Series temporales y anlisis multivariante.
Editorial AC, Coleccin plan nuevo, Madrid.
URIEL, E. (1995): Anlisis de datos: Series temporales y anlisis multivariante.
Editorial AC.
VICNS OTERO, J. (1997): Obtencin y Anlisis de datos. Facultad de Econmicas
UAM.
WILLIAM, R. DILLON and MATTHEW GOLDSTEIN. (1984): Multivariate
Analysis. Methodos and Applications.
II. BIBLIOGRAFA ESPECFICA POR TEMAS
II.1.- TABULACIN CRUZADA
BISHOP, Y.M.M.; FIENBERG, S.E. Y HOLLAND, P.W. (1977): Discrete
Multivariante Analysis. Theory and Practice. MIT PRESS, Cambridge,
Massachusetts.
EVERITT, B. (1977): The analysis of Contingency Tables. London Chapman and
Hall.
FIENBERG, S.E. (1987): The analysis of cross-classified categorical data.
Cambridge, Mass.: M.I.T. Press.
GOKHALE, D.V. (1978): The information in contingency tables. New York: M.
Dekker.
GOKHALE, D.V. y KULLBACK, S. (1978): The information in contingency tables
Statistics: Textbooks and monographs. Vol 3. De. Owen. Minton y Pratt, Nueva York.
HABERMAN, S.J. (1978): Analysis of qualitative data. Introductors topics and New
developments. New York. Academic Press.
MAXWELL, A.E. (1971): Analysing qualitative data. Harmondsworth: Penguin
Books, 1970.
OBRIEN, L.G. (1989): The statistical anlysis of contingency table designs.
Newcastle Upon Tyne: Newcastle University.
RUZ-MAYA, L. (1990): Metodologa Estadstica para el Anlisis de Datos
Cualitativos. Centro de estudios Sociolgicos. Madrid.
SNCHEZ CARRIN, J.J. (1984): Anlisis de tablas de contingencia. Coleccin
monografas n 105. CIS.
SPSS. Crosstabulation and measures of association, Cap. 10, Statistics Guide.
UPTON, GRAHAM, J.G. (1978): The analysis of cross-tabulated data. John Wiley
Cop.
II.2.- ANLISIS DE LA VARIANZA. ANLISIS DE LA COVARIANZA.
COCHRAN, W.G. (1976): Analysis of Covariance: Its nature and uses. Biometrics,
Vol. 13.
ELLEN R. GIRDEN. (1992): ANOVA. Repeated Measures. SAGE University
Paper.
GIRDEN, E. (1992): Anova: repeated measures. Newbury Park, 1992-VI.
INVERSEN, G.R. y NORPORTH, H. Analysis of Variance. Quantitative
Applications in the Social Sciences N 1. A Sage University Paper Series.
RUZ-MAYA. (1986): Mtodos Estadsticos de Investigacin. I.N.E.
RUPERT G. MILLER, JR. (1985): Beyond ANOVA, basics of applied statistics.
John Wiley & Sons.
WILDT, A.R. y ATHOLA, O. (1978) Analysis of Covariance. Quantitative
Applications in the Social Sciences. A Sage University Paper Series.
II.3.- ANLISIS DISCRIMINANTE.
CUADRAS, ABELLANO. (1973): Anlisis Estadstico Multivariante.
Representacin Cannica de Funciones. Resumen de tsis. V.A. Barcelona.
PETER A. LACHEMBRUCH. (1975): Discriminant analysis. Hoguer Press.
VISAUTA VINACUA, B. (1997): SPSS para Windows. McGraw-Hill.
WILLIAM R. KLECKA. (1976): Discriminant analysis. Series: Quantitative
Applications in the Social Sciencies.
II.4.- MODELOS DE ELECCIN DISCRETA: LOGIT Y PROBIT.
ANDERSON, SIMON P.; ANDRE; THISSE, JACQUES FRANCOIS. (1992):
Discrete choice theory of product differentiation. Cambridge and London: MIT Press,
pag. XVIII, 423.
BESANKO D., PERRY M.K. and SPADY R.H. (1990): The logical model of
monopolistic competition: brand diversity. The Journal of Industrial Econmics, Vol.
38, n 4 June.
GRACIA DIEZ, M. (1988): Modelos con variable dependiente cualitativa y de
variacin limitada. Cuadernos econmicos, ICE, nmero 39, 1988/2.
GRACIA DEZ, M. (1991): A Qualitative Analysis of Unemployment in Spain.
Universidad Complutense de Madrid, pag. 159-73.
JOHNSTON, J. (1989): Mtodos de econometra. Ed. Vicens Vives, Barcelona.
JUDGE G. (1980): The theory and practice of econometrics. Jhon Wiley and sons,
New York.
LEHRER, EVELYN L. (1992): The impact of Children on Married Womens Labor
Supply: Black-White Differentials Revisited. Journal of Human Resources; 27 (3),
pag. 422-44.
Micro TSP, Users Manual. (1986) Mc Graw Hill.
MILLN J.A., RUIZ P. (1987): Modelos logit de adopcin de innovaciones en
invernaderos de Almera. Investigacin agraria, 2 (2).
NOREEN, E. (1988): An empirical comparison of probit and OLS Regression
hypothesis tests. Journal of accounting research. Vol. 26, N 1 Spring, USA.
NOVALES, A. (1988): Econometra. McGraw Hill, Madrid.
RODRGUEZ GUTIERREZ, CSAR. (1992): La adquisicin de capital humano: Un
modelo terico y su contrastacin. Investigaciones Econmicas. 16 (2). Pg. 305-16.
TIM FUTING LIAO. (1988): Interpreting probability model. Logit, Probit and other
generalizad Linear Models. Series: Cuantitative Applications in the Social Sciences. A
Sage University papers series.
VICNS, J. (1995): Modelos con variables cualitativas dicotmicas. (Nov. 1995).
Instituto L.R.Klein.
II.5.- CORRELACIN CANNICA.
LEVINE. (1977): Canonical Analysis and Factor Composition. Beverly Hills: Sage
Publications. Sage University Papers.
II.6.- COMPONENTES PRINCIPALES Y ANLISIS FACTORIAL.
APARICIO PREZ F. (1988): La difcil realizacin de un anlisis de componentes
principales mediante los programas estadsticos ms difundidos en el mercado.
Estadstica espaola, Vol. 30, n 117, Madrid.
BATISTA FOQUET Y MARTNEZ ARIAS. (1989): Anlisis multivariante. Anlisis
en componentes principales. Coleccin ESADE. Editorial Hispano Europea, S.A.
pp.49-54.
HARMAN, HARRY. (1976): Modern factor analysis. Chicago University Press.
HARMAN, HARRY. (1980): Anlisis Factorial Moderno. Editorial Salts.
HOTTELING, H. (1993): Analysis of a Complex of Statistical Variables into
Principal Components. J. Educ. Psycology, n 24.
JRESKOG, K.G., KLOVAN, J.E., REYMENT, R.A. (1976): Geological Factor
Analysis. Elsevier Scient. Pub. Co.
KIM JAE-ON y MUELLER, CHARLES. (1978): Factor analysis, Statistical Methods
and Practical Issues. Sage University Paper.
KIM JAE-ON y MUELLER, CHARLES. (1978): Introduction to factor analysis.
Sage University Paper.
MARTN REYES, G. (1978): Algunos mtodos multivariantes y sus apllicaciones en
economa. Cuadernos de CC. Econmicas y Empresariales, n 2, Universidad de
Mlaga.
NARVAIZA SOLS, J.L. (1981): El anlisis Factorial: Exposicin Grfica e
Intuitiva. Boletn de Estudios Econmicos, n 36 (113), Deusto, 1981, 259-285.
PEARSON, K. (1901): On Lines and Planes of Closest Fit to Systems of Points in
Space. Phil. Magasine, Ser. 6, 2.
SPEARMAN, C. (1904): General Intelligence Objetively Determined and Measured.
American Journal of Psycology, n 15.
THURSTONE, L.L. (1931): Multiple Factor Analysis. Psychol. Rev., n 38, 1931,
406.
II.7.- ANLISIS CLUSTER.
ALDENDERFER, M.S. Y R.K. BLASHFIELD. (1984): Cluster Analysis. A Sage
University Paper, Series: Quantitative Aplications in the Social Sciences. N 07-044.
ANDERBERG, M.R. (1973): Cluster Analysis for Applications. Academic Press,
New York.
BOGGIS, J.G. y J. HELD. (1971): Cluster Analysis. A New Tool in Electricity.
Journal of the Market Research Society (England), 13. Abril, 1971, pp. 49-68.
DAY, N.E. y R.M. HEELER. (1971): Using Cluster Analysis to Improve Marketing
Experiments. Journal of Marketing Research, 8. Agosto, 1971, pp. 340-47.
EVERITT, B.S. (1978): Graphical Techniques for Multivariate Data. London:
Heineman Educational.
EVERITT, B.S. (1993): Cluster Analysis. Tercera Edicin. Edward Arnold. A
division of Hodder & Stoughton.
JAIN, A.K. y R.C. DUBES. (1988): Algorithms for Clustering Data Prentice Hall,
Englewood Clidd, N.J. USA.
JAMBU, M. (1983): Cluster Anlysis and Date Analysis. Amsterdam: North-Holland.
JARDINE, N. y R. SIBSON. (1971): Mathematical Taxonomy, John Wiley & Sons,
Chichester.
RAO, C.R. (1952): Advanced Statistical Methods in Biometrics Research. John
Wiley & Sons, New York.
ROMESBURG, H.CH. (1984): Cluster Analysis for Research. Belmont, Calif:
Lifetime Learning Publications.
TRYON, R.C.- DANIEL, E.B. (1970): Cluster Analysis. MC. Graw Book
Company. N.Y.
SOKAL, R.R. y P.H.A. SNEATH. (1973): Numerical Taxonomy. W.H. Freeman &
Co. San Francisco.
WARD, Jr. J.H.; HOOK, M.R. (1963): Aplication of Hierachical Grouping Procedure
to a Problem of Grouping Profiles. Educ and Psychology Measurement 23, n 1 Pgs.
69-82.
II.8.- ANLISIS CONJUNTO.
GIL LUEZAS,C. (1985): Una aplicacin del anlisis conjunto a la segmentacin de
mercado: la segmentacin componencial. Investigacin y Marketing.
GREEN, P.E. and YORAM WIND. (1975): New away to measure consumers
judgements. Harward Business Review (Julu-August 1975).
GREEN, P.E. and V. SRINIVASAN. (1978): Conjoint analysis in consumer research:
issues and outlook. Journal of consumer research. (September 1978).
GREEN, P.E. (1990): Conjoint Analysis in Marketing: new development With
Implications for Research an Practice. Journal of Marketing, Octubre 1990.
HELSEN, K., SHANDLER, B. Y GREEN, P. (1988): Conjoint Internal Validity
Under Alternative Profile Presentations. Journal of Consumer Research, Vol. 5.
KRIEGER A. Y GREEN, P. (1990): Segmenying Markets With Conjoint Analysis.
Journal of Marketing. Vol. 55.
MARTN DVILA, M. (1987): Como diagnosticar lo que los consumidores desean
realmente: El anlisis conjunto. (Marzo 1987).
MGICA GRIJALBA, J.A. (1989): Los modelos multiatributo en marketing. El
anlisis conjunto. IPMARK (n 324/16-28 Febrero 1989).
MGICA GRIJALBA, J.M. (1989): El anlisis conjunto. IPMARK. n 324.
MGICA GRIJALBA, J.M. (1989): El anlisis conjunto (y II). Alternativas,
problemas y limitaciones. IPMARK (n 326/16-31 Febrero 1989).
RIVERO, P. Y FERNNDEZ, R. (1993): Anlisis de variables cualitativas: Modelos
LOGIT y PROBIT, Universidad Autnoma de Madrid.
VARELA GONZLEZ, J.A. (1985): El anlisis conjunto, una tcnica al servicio de
la investigacin comercial. Economa y Empresa.
WITTINK, D. Y CATTIN, P. (1981): Alternative Estimation Methods for Conjoint
Analysis: A Monte Carlo Study. Journal of Marketing Research, Vol XVIII.

También podría gustarte