Está en la página 1de 33

C

O
EJJO
NE
AN
MA
N yy M
N
CII
CC
UC
DU
OD
CURSO DE INTRO
BSIC
PSSSS
L SSP
EL
DE
OD
CO

SE
N II::
N
ESSII
T
Cllaassiiffiiccaacciinn,,
Muullttiivvaarriiaannttee.. C
Tccnicas de Anlisis M
descripcin y ddiissppoonniibbiilliiddaadd eenn SSPPSSSS

ESQUEMA DE OBTENCIN Y ANLISIS DE DATOS

DETERMINACIN
DEL PROBLEMA

F.SECUNDARIAS
- SOPORTE IMPRESO
- SOPORTE MAGNTICO

OBTENCIN
DE INFORMACIN

F.PRIMARIAS
- UNIVERSO
- CUESTIONARIO
- MUESTREO
- PRETEST Y TRABAJO DE CAMPO
- CONTROL
- CODIFICACIN Y TABULACIN

ANLISIS

SIMPLE
- ESTADSTICA DESCRIPTIVA
- ANLISIS DE CORRELACIN: Numrica,
ordinal o categrica
- NMEROS NDICES

MULTIVARIANTE

- GRFICOS Y TABLAS

- ANLISIS DE DEPENDENCIA: Anova, Ancova, Manova y Mancova. Anlisis de Regresin.


Anlisis Discriminante. Correlacin Canvnica
- ANLISIS DE INTERDEPENDENCIA:
- Entre variables: Anlisis Factorial. Componentes principales
- Entre sujetos: Anlisis Cluster. Anlisis Multidimensional No-Mtrico. Anlisis Conjunto

TCNICO
INFORME
DE DIRECCIN

ESQUEMA DE CLASIFICACIN DE
TCNICAS DE ANLISIS MULTIVARIANTE
ANLISIS DE DEPENDENCIA:
TABLAS DE CONTINEGENCIA.
ANOVA, ANCOVA, MANOVA, MANCOVA.
ANLISIS DE REGRESIN.
ANLISIS DISCRIMINANTE LOGIT - PROBIT.
CORRELACIN CANNICA.

ANLISIS DE INTERDEPENDENCIA.
ENTRE VARIABLES:
COMPONENTES PRINCIPALES.
ANLISIS FACTORIAL.
ANLISIS CONJUNTO.

ENTRE SUJETOS:
CLUSTER O ANLISIS DE GRUPOS.
ANLISIS MULTIDIMENSIONAL NO MTRICO.

EXTENSIN DE TCNICAS DE ANLISIS


MULTIVARIANTE
VICENS OTERO, J. Estudios de mercado en la empresa
espaola. Instituto de Prediccin Econmica L. R. Klein.
Documento 96/4. Julio 1996.
Resultados para 300 empresas con cifras de ventas superiores a 250 mill. Pts.
UTILIZACIN DE LOS DISTINTOS TIPOS DE ANLISIS

ANLISIS ESTADSTICO
SIMPLE
ANLISIS ESTADSTICO MULTIVARIANTE
UTILIZACIN DE PROGRAMAS DE
ORDENADOR PARA EL ANLISIS

SI
(Porcentaje)

NO
(Porcentaje)

TOTAL
(Porcentaje)

20.8%

79.2%

100%

8.2%

91.8%

100%

29.8%

70.2%

100%

MTODOS DE ANLISIS REALIZADOS EN 1994


(Porcentaje)

ANLISIS ESTADSTICO
NO HA
MULTIVARIANTE
REALIZADO

SI HA REALIZADO
PERSONAL
PROPIO

CONSULTORA
EXTERNA

PERSONAL
INTERNO Y
EXTERNO

TOTAL

ANLISIS DE LA
VARIANZA

88.6%

4.2%

4.8%

2.4%

100%

ANLISIS DE LA
COVARIANZA

94.5%

1.8%

3.7%

0.0%

100%

93.3%

1.2%

4.9%

0.6%

100%

CORRELACIN
CANNICA

98.8%

0.0%

1.2%

0.0%

100%

ANLISIS
FACTORIAL

85.4%

2.5%

9.1%

3.0%

100%

89.1%

5.5%

4.2%

1.2%

100%

CLUSTER O
ANLISIS DE GRUPO

87.2%

4.2%

7.4%

1.2%

100%

ESCALAS MULTIDIMENSIONALES

95.1%

2.5%

1.2%

1.2%

100%

ANLISIS
CONJUNTO

93.9%

3.0%

2.5%

0.6%

100%

ANLISIS DISCRIMIANTE

ANLISIS DE REGRESIN

FACTORES, VARIABLES Y
ESCALAS DE MEDIDA
TIPOLOGA:
Variables Continuas y Discretas
Variable Temporal, Transversal y Panel Data
......etc
ESCALAS DE MEDIDA:
Nominal (Factor)

Ordinal
Intervalo

Razn

Identifica la pertenencia de un elemento


sujeto u objeto a un grupo u otro, a
niveles
generalmente
mutuamente
excluyentes. Permite la distincin entre
elementos pero no su ordenacin.
Identifica a cada elemento en una
posicin de escala respecto a los otros.
Identifica la posicin ordinal de cada
elemento y permite adems medir las
distancias entre unos y otros utilizando
una escala de medida subjetiva.
Permite medir las distancias entre
elementos utilizando una escala de
objetiva y, por lo tanto, posibilita la
utilizacin
de
razones
o
ratios
comparativos.

CONDICIONA LA HERRAMIENTA DE ANLISIS Y, POR


TANTO, LA CALIDAD DE LOS RESULTADOS

ES

CONDICIONADA
POR
LOS
OBJETIVOS
EXPERIMENTALES, LOS RECURSOS DISPONIBLES, Y
LA DIFICULTAD DE PERCEPCIN EXPERIMENTAL.

TABLAS DE CONTINGENCIA
C APROPIADAS CUANDO......
Se desea organizar informacin relativa a ms de un factor, explorar la
relacin de dependencia o independencia entre los factores y eventualmente
medir el grado de asociacin entre los mismos. As mismo, apropiadas
cuando se desea medir el grado de concordancia entre clasificaciones
factoriales de objetos o sujetos.

1 EJEMPLO 1 (Organizacin bifactorial): Cmputo sencillo de


validez de Test Diagnsticos.
Punto de partida: Se ordenan en una tabla de dos dimensiones los
resultados de un test diagnstico para 100 pacientes (50
enfermos - 50 sanos) segn los resultados positivos y
negativos. La informacin contenida en las distintas
celdas, debidamente relativizada, nos permitir
determinar la sensibilidad del Test (Prob. Diagnstico
correcto para un enfermo), su especificidad Prob.
Diagnstico correcto para un NO enfermo) y sus valores
predictivos positivo (Prob. Enfermedad ante test
Positivo) y negativo (Prob. NO Enfermedad ante test
Negativo)

1 EJEMPLO 2 (Relacin entre dos factores): Relacin entre el


riesgo de infeccin por virus la hepatitis B del personal sanitario
y la manipulacin de sangre o material biolgico.
Punto de partida: Se realiza un estudio serolgico en 50 voluntarios del
grupo de mayor riesgo y 100 del grupo de menor riesgo.
Suponiendo que la muestra es suficientemente
representativa se observar la dependencia entre el
puesto de trabajo y el riesgo de infeccin heptica.

1 EJEMPLO 3 (Factores multinivel): Relacin entre el intervalo


de edad infantil y el padecimiento del sarampin, rubola y
parotiditis como paso previo al estudio de la escolarizacin como
factor de riesgo en la transmisin de estas enfermedades
infeccionas.
Punto de partida: Se toman los datos de la edad de 265 nios
clasificndolos por intervalos en cuatro grupos (Menores
de cuatro aos, entre 4 y 5 aos, entre 6 y 7 aos y
mayores de siete aos). As mismo, se estudia su
situacin inmunolgica detectndose la presencia o
ausencia de anticuerpos frente a cada uno de esos virus.

1 EJEMPLO 4 (Anlisis de concordancia): Homogeneidad de


criterios en la hospitalizacin entre dos centros diferentes
Punto de partida: Se selecciona una muestra experimental de 50 pacientes
que sern atendidos, con los mismos sntomas, por
facultativos de dos centros diferentes. Para cada paciente
se anota la decisin de hospitalizacin SI - NO en cada
uno de los dos centros.

: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - RESUMIR - TABLAS DE CONTINGENCIA
FACTOR 1
FACTOR 2
Medidas para el estudio de la
correlacin,
dependencia
y
asociacin entre factores
Control de la informacin a
mostrar en las casillas interiores
de la tabla y marginales de filas
y columnas.

ANLISIS DE LA VARIANZA

C APROPIADO CUANDO......
Se desea analizar si los distintos niveles de un determinado factor inciden
en los valores de una variable cuantitativa. Si se emplean como
explicativos dos o ms factores hablamos de una ANOVA multifactorial y,
en ese caso, cobrarn inters los efectos de los niveles de cada uno de los
factores y los efectos de las interacciones entre los niveles de los factores.
Algunas variantes de esta tcnica son especialmente atractivas para casos
experimentales concretos, en especial el ANCOVA.

1 EJEMPLO 1 (Anova Unifactorial - Experimento de


homogeneidad de datos pareados): Eficacia de un tratamiento
antitaquicrdico
Punto de partida: Se realiza un experimento con 50 pacientes tomando las
pulsaciones por minuto antes y despus de la
administracin del medicamento.

1 EJEMPLO 2 (Anova Unifactorial sobre grupos diferentes):


Relacin entre la localizacin del Cncer Gstrico en el nmero
de monocitos del enfermo.
Punto de partida: Se toman 50 enfermos de cncer gstrico dividios en tres
grupos: 15 con carcinoma en fundus, 15 con carcinoma
en curvatura y 20 con carcinoma en ploro. Al efectuar
un hemograma se realiza un recuento monocitario.

1 EJEMPLO 3 (Anova con dos factores): Independencia,


sinergismo o antagonismo del consumo de Haschis y la Cocana.
Punto de partida: Se dispone de una muestra de 100 individuos de los
cuales, un 25% no son consumidores de ninguna de las
dos drogas, otro 25% son consumidores exclusivos de
cocana, un 25% exclusivos de Haschis y un 25% de
ambas drogas simultneamente. En condiciones
experimentales de homogeneidad adecuada se toman las
pulsaciones por minuto a estos 100 individuos. El
anlisis no slo permitir diferenciar la variabilidad
"biolgica" de la debida al consumo individual de cada
droga sino tambin de la debida a la interaccin de
ambas drogas.

: PROCEDIMIENTO SPPS
MEN (Anova Unifactorial):
ESTADSTICA - COMPARAR MEDIAS - ANOVA DE UN FACTOR
MEN (ANOVA Multifactorial):
ESTADSTICA - MODELO LINEAL GENERAL - COMPONENTES DE LA VARIANZA
VARIABLES A
EXPLICAR
FACTOR EXPLICATIVO

Contrastes de existencia de
tendencia en la endgena y
contrastes "t" de significacin
para los niveles del factor.
Pruebas a posteriori para
determinar qu medias difieren
en el caso en que el ANOVA
resulte significativo.

Test
de
homogeneidad
de
varianzas, presencia de estadsticos
descriptivos y tratamiento de los
valores perdidos.

ANLISIS DE REGRESIN

C APROPIADO CUANDO......
SIEMPRE que la calidad de los datos lo permita para el anlisis de
dependencia univariante o multivariante. Su precisin, refinamiento y
potencia de anlisis es muy superior a las de otras tcnicas de anlisis de
dependencia, permitiendo la realizacin de ejercicios de simulacin y
prediccin. Como contrapartida, sus virtudes slo pueden explotarse
asumiendo una complejidad que puede llegar a ser muy acusada, de modo
que su aplicacin exige un importante compromiso de recursos tcnicos.

4 VARIANTES BSICAS (Recogidas en SPSS)


Modelo Bsico de Regresin Lineal por MCO
Aproximacin clsica adecuada para relaciones lineales entre variables
exgenas y endgena en las que cabe asumir un nico sentido de la
causalidad y el estricto cumplimiento de las Hiptesis Bsicas tanto
estructurales como referidas a la perturbacin aleatoria (especialmente la
homocedasticidad y ausencia de autocorrelacin residual).
Regresin no lineal (RNL - NLR)
Aproximacin genrica para aquellos casos en los que no puede suponerse
linealidad en la relacin entre exgenas y endgena. Orientado en el SPSS
a la prediccin simple de series temporales.
Estimacin ponderada (MCP - WLS)
Estimacin especfica para ajustar relaciones de dependencia en las que se
viole la condicin de varianza constante para la variable endgena en la
poblacin objeto de estudio. El mtodo afina el resultado de una estimacin
clsica ponderando en mayor medida las observaciones ms precisas.
Estimacin en dos etapas (MC2E - 2SLS)
Una de las muchas aproximacin especficas para aquellos casos en los que
los errores del modelo aparecen correlacionados con alguna exgena, por
ejemplo, cuando la relacin de causalidad no se da exclusivamente desde
las exgenas a la endgena, sospechndose la existencia de un efecto de
retroalimentacin en sentido inverso.

1 EJEMPLO 1 (Regresin lineal bsica multivariante): presin


arterial en la poblacin fumadora.
Punto de partida: Sobre una muestra de 500 fumadores habituales mayores
de 50 aos se desea establecer la relacin entre la presin
arterial y algunas de sus caractersticas bsicas y
hbitos: edad, peso, nmero de aos con el hbito de
fumar y nmero de cigarrillos diarios promedio en los
ltimos 5 aos. Todas las variables pueden medirse en
escalas de razn.

1 EJEMPLO 2 (Regresin univariante no lineal): Prediccin de


la extensin de la infeccin por VIH.
Punto de partida: Utilizando el censo espaol de casos de infeccin VIH se
determina el nmero de casos por mil habitantes
ocurridos desde 1980. La evolucin de la enfermedad
ser, con seguridad, no lineal, lo que impedir el ajuste
de un modelo bsico de regresin. Un ajuste de tipo
logstico permitir realizar una mejor prediccin para el
perodo 2001 2005.

1 EJEMPLO

3 (Regresin univariante por estimacin


ponderada): Relacin entre la edad de los trabajadores y la
duracin de las bajas por enfermedad.
Punto de partida: Utilizando estadsticas de una mutualidad laboral, se
desea establecer la relacin entre la edad de los
trabajadores y el total de das de anuales que solicitan
por baja de enfermedad. La relacin positiva es
previsible, pero para estimar de forma precisa el valor
del parmetro debe observarse el hecho de que, a mayor
edad, la varianza de la endgena crece como
consecuencia de la aparicin progresiva de un mayor
espectro de enfermedades de distinta gravedad y, por lo
tanto, de distinto perodo de baja.

1 EJEMPLO 4 (Regresin por estimacin con variables


instrumentales): Demanda de un determinado producto
farmacutico .
Punto de partida: Una empresa farmacutica est interesada en medir los
factores que han impulsado los cambios en las ventas de
un novedoso producto sin competencia a lo largo de los
ltimos tres aos. Para ello dispone de datos mensuales
de ventas, precio medio, promocin y publicidad entre
facultativos e incidencia de la enfermedad en el
segmento poblacional de inters. La estimacin simple
de los parmetros estara sesgada, especialmente para el
parmetro de la incidencia, en cuanto que las ventas del
producto farmacetico pueden funcionar como
explicativa para la incidencia de la misma.

: PROCEDIMIENTO SPPS
MEN (Regresin Lineal MCO y Regresin MCP - WLS):
ESTADSTICA - REGRESIN - LINEAL
VARIABLE A
EXPLICAR
VARIABLES
EXPLICATIVAS
Mtodo para la
inclusin selectiva
de las variables
exgenas
Posibilidad
de
limitar el anlisis a
un conjunto de casos
segn el valor de
una variable
Seleccin mtodo
de Mnimos
Cuadrados
Ponderados (WLS)

Intervalos de confianza para los coeficientes,


matriz
de
varianzas
y
covarianzas,
correlaciones parciales y semiparciales, test
multicolinealidad, Durbin Watson.

: PROCEDIMIENTO SPPS
MEN (Regresin Curvilnea):
ESTADSTICA - REGRESIN - ESTIMACIN CURVILNEA
VARIABLES A
PREDECIR
VARIABLES
PREDICTORA
TIEMPO
Variable
etiquetar
punto.

para
cada

Tipo de modelo de
ajuste curvilneo.

: PROCEDIMIENTO SPPS
MEN (Regresin genrica NO Lineal):
ESTADSTICA - REGRESIN - NO LINEAL
VARIABLES A
EXPLICAR
EXPRESIN
NO LINEAL
DEL MODELO

La sintaxis de la expresin no lineal del se


escribir utilizando variables dependientes
(cuadro superior), el cuadro operativo
bsico y las funciones prediseadas.

ANLISIS DISCRIMINANTE - ANLISIS LOGIT ANLISIS PROBIT

C APROPIADOS CUANDO......
En trminos generales, todas estas tcnicas permiten explicar el valor de un
factor utilizando la informacin de variables explicativas cuantitativas. En
el campo de la medicina, resulta especialmente atractivo para la diagnosis y
para la determinacin del nivel de estmulo efectivo en los tratamientos.

4 VARIANTES BSICAS (Recogidas en SPSS)


Anlisis DISCRIMINANTE
Aunque todos estos anlisis son en realidad anlisis discriminantes, el
SPSS denomina especficamente A. Discriminante al caso en el que se
utiliza una aproximacin no probabilstica apoyada en clculos sobre la
variacin intragrupal y entregrupal observada. El factor a explicar
representa generalmente el grupo de pertenencia de una serie de
individuos. El anlisis discriminante utilizar la informacin de un
conjunto de variables observadas para esos sujetos u objetos a fin de
construir unas funciones discriminantes (basadas en simples
combinaciones lineales de las variables predictoras), capaces de explicar
esa pertenencia a uno u otro grupo (ADD) y de construir un modelo
predictivo (ADP) para pronosticar el grupo de pertenencia de un caso a
partir de las caractersticas observadas de cada caso. Si bien no se reduce
slo al caso dicotmico para la endgena requiere que las variables
explicativas sean continuas.

Modelos LOGIT - PROBIT


El modelo LOGIT es en realidad un tipo especfico de regresin en el que
la variable endgena es dicotmica mientras que las explicativas pueden
ser continuas o categricas. El contexto es similar al descrito en el cuadro
anterior para el anlisis discriminante, pero ahora el anlisis suele enfocarse
a aquellos casos en los que la variable endgena puede interpretarse en
trminos de probabilidad y el objetivo es cuantificar la relacin entre las
caractersticas individuales de los individuos y esa probabilidad. Los
coeficientes de regresin logstica, aunque difciles de interpretar, pueden
utilizarse para estimar la razn de las ventajas relativas de cada variable
independiente del modelo. La regresin logstica es aplicable a un rango
ms amplio de situaciones de investigacin que el anlisis discriminante.
La regresin PROBIT, muy similar a la empleada en el LOGIT, suele
utilizarse en aquellos casos en los que se sospecha que una respuesta
dicotmica est influida por el nivel de alguna o algunas variables
explicativas. El procedimiento, permitir estimar muy fcilmente la
intensidad necesaria para que un estmulo llegue a inducir una determinada
proporcin de respuestas.

1 EJEMPLO 1 (Anlisis Discriminante): Seleccin de la cartera


de clientes solventes de una Aseguradora Mdica.
Punto de partida: Una aseguradora analiza su cartera de 2500 clientes
distinguiendo a aquellos que han hecho frente a sus
cuotas con regularidad de aquellos que no lo han hecho.
Adicionalmente, revisa para cada uno de los 2500
clientes algunas variables que se sospecha pueden estar
en relacin directa con la solvencia: edad, renta mensual,
antigedad del contrato, nmero de hijos.
Estas cinco variables permitirn elaborar un mximo de
cuatro funciones discriminantes que ayuden a
caracterizar a cada uno de los grupos. Adems, si el valor
predictivo de las mismas es elevado podrn utilizarse
para elaborar la conveniencia de admitir a un nuevo
solicitante o rechazar su solicitud como asegurado.

1 EJEMPLO 2 (Anlisis LOGIT): Factores de riesgo para el


desarrollo de aterosclerosis.
Punto de partida: Apoyndonos en el diseo de una amplia muestra de
historiales mdicos se desea establecer la importancia de
cada uno de los factores de riesgo en el desarrollo de la
aterosclerosis. Para cada uno de los individuos que
constituyen la muestra, se dispone de informacin para
un perodo determinado acerca de variables referidas a:
tabaquismo, dieta (en especial niveles sricos medios de
colesterol), edad, sexo, tensin arterial, consumo de
alcohol, sedentarismo y antecedentes genticos. El ajuste
de una funcin LOGIT permitir determinar cmo incide
cada uno de estos factores en la probabilidad de
desarrollo de la enfermedad a fin de orientar la poltica
preventiva, elaborndose adems un instrumento
medidor del riesgo de padecimiento.

1 EJEMPLO 3 (Anlisis PROBIT): Determinacin de la dosis


de respuesta adecuada a un frmaco.
Punto de partida: Apoyndonos en un diseo experimental se administra
un determinado medicamento a 60 individuos divididos
en 20 grupos de 3 personas. A cada grupo se le
administra una cantidad en mmg diferente desde 11
(primer grupo) a 30 (ltimo grupo) y se anota su
reaccin despus de un tiempo de 1 hora calificndose el
resultado en cada individuo como POSITIVO o
NEGATIVO. El ajuste de una funcin PROBIT
permitir determinar la dosis ms adecuada para
provocar una reaccin positiva al medicamento.

: PROCEDIMIENTO SPPS
MEN (DISCRIMINANTE):
ESTADSTICA - CLASIFICAR DISCRIMINANTE
FACTOR DE
AGRUPACIN A
EXPLICAR
VARIABLES
DISCRIMINANTES

Estadsticos descriptivos de las variables independientes


segn los diferentes grupos. Coeficientes de la funcin de
clasificacin de Fisher y descomposicin de Matrices de
Varianzas y Covarianzas.

Controla
cmo
usar
para
la
clasificacin
de
individuos
el
resultado obtenido
en las funciones
discriminantes, en
especial para fines
predictivos.

: PROCEDIMIENTO SPPS
MEN (ANLISIS PROBIT):
ESTADSTICA - REGRESIN - PROBIT
Variable que contiene,
para cada nivel de
exposicin (casos) el
%
de
reacciones
positivas a ese nivel
de estimulacin.
Variable que contiene,
para cada nivel de
exposicin (casos) el
nmero de sujetos
expuestos a ese nivel
de estimulacin.

Permite obtener una prueba de


paralelismo (todos los niveles del
factor tiene pendiente comn ) y
controlar algunos aspectos de la
estimacin de los parmetros.

Variable
o
variables
predictoras, esto
es, variables de
estmulos.

CORRELACIN CANNICA

C APROPIADA CUANDO......
Se desea abordar el estudio de un fenmeno de causalidad entre dos
fenmenos que vienen representadas, tanto el causado como el explicativo,
por un conjunto de variables, y no se desea restringir el modo en que cada
una de las variables explicativas incide en cada una de las explicadas.

1 EJEMPLO 1 (Anlisis Correlacin Cannica): Determinacin


de la relacin entre el nivel de desarrollo econmico y el nivel de
desarrollo sanitario de un conjunto de pases.
Punto de partida: Un estudio planteado a nivel internacional desea
establecer la relacin entre el nivel de renta y nivel de
desarrollo sanitario en un conjunto de pases. El analista
dispone de 25 variables homogneas del nivel de
desarrollo sanitario de cada pas (gasto farmacutico de
distintos tipos, instalaciones hospitalarias por 1000 hb de
distintos tipos, mdicos por 1000 hb de distintas
especialidades, ....). As mismo dispone de otras 25
variables relativas al desarrollo econmico (PIB real por
Hb, tasa de actividad, tasa de paro, capacidad de
eneudamiento.....). Mediante un anlisis de correlacin
cannica el analista puede construir un modelo de
causalidad entre ambos conjuntos de variables sin
necesidad de especificar el detalle del modelo de
casualidad para cada par de variables.

ANLISIS DE COMPONENTES PRINCIPALES

C APROPIADO CUANDO......
Se desea reducir las dimensiones de un conjunto de variables sin prdida
excesiva de informacin. El mtodo de componentes principales permitir
generar combinaciones lineales de las variables originales de modo que las
nuevas variables contengan gran parte de la informacin original. Su coste
debe valorarse en trminos de interpretabilidad de esos componentes.
Aunque no es infrecuente su confusin con el anlisis factorial existen
importantes diferencias conceptuales; en todo caso, la relacin provendra
del hecho de que la tcnica de componentes principales es uno de los
mtodos de extraccin factorial ms utilizados.

1 EJEMPLO 1 (Anlisis de Componentes Principales):


Determinacin de la relacin entre la esperanza de vida media y
el nivel de desarrollo econmico y sanitario de un conjunto de
pases.
Punto de partida: Un estudio planteado a nivel internacional desea
establecer la relacin entre la esperanza de vida media de
un conjunto de pases y su nivel de renta y desarrollo
sanitario. El analista dispone de 25 variables
homogneas del nivel de desarrollo sanitario de cada pas
(gasto farmacutico de distintos tipos, instalaciones
hospitalarias por 1000 hb de distintos tipos, mdicos por
1000 hb de distintas especialidades, ....). As mismo
dispone de otras 25 variables relativas al desarrollo
econmico (PIB real por Hb, tasa de actividad, tasa de
paro, capacidad de eneudamiento.....). Mediante un
anlisis de componentes principales el analista puede
reducir el conjunto inicial de 50 variables a unos cuantos
Componentes Principales, aprovechando las posibles
redundancias existentes en datos referidos a cuestiones
similares.

ANLISIS FACTORIAL

C APROPIADO CUANDO......
Se desea obtener una medicin de una serie de factores de naturaleza
inobservables, aprovechando para ello la dependencia o relacin comn de
un conjunto de variables en torno a estos factores. El anlisis requiere datos
expresados en variables de intervalo.

1 EJEMPLO 1 (Anlisis Factorial): Aproximacin de la


capacidad de abstraccin, la capacidad de clculo y la memoria
de los alumnos universitarios.
Punto de partida: Partiendo de los expedientes de ms de 10.000 alumnos
de se extraen las notas correspondientes a 15 materias en
las que las proporciones de capacidad de clculo,
capacidad de abstraccin y memoria intervienen de en
distintas proporciones. Observando las presencia o
ausencia de correlaciones entre las distintas notas
(comunalidad) pueden identificarse los mecanismos de
causalidad en las calificaciones. Un anlisis detallado de
la composicin factorial revelar que los mimos se
corresponden con la capacidad de abstraccin, capacidad
de clculo y memoria. Las denominadas "puntuaciones
factoriales" permitirn medir, a partir de las notas
iniciales, las tres capacidades comentadas tanto en los
elementos que componen la muestra como en nuevos
elementos.

1 EJEMPLO 2 (Ayuda SPSS) (Anlisis Factorial): Qu


actitudes subyacentes hacen que las personas respondan a las
preguntas de una encuesta poltica de la manera en que lo
hacen?
Punto de partida: Examinando las correlaciones entre los elementos de la
encuesta se deduce que hay una superposicin
significativa entre los diversos subgrupos de elementos
(las preguntas sobre los impuestos tienden a estar
correlacionadas entre s, las preguntas sobre temas
militares tambin estn correlacionadas entre s...., y as
sucesivamente). Con el anlisis factorial, se puede
investigar el nmero de factores subyacentes y, en
muchos casos, se puede identificar lo que los factores
representan conceptualmente. Adicionalmente, se pueden
calcular las puntuaciones factoriales para cada
encuestado, que pueden utilizarse en anlisis
subsiguientes. Por ejemplo, es posible construir un
modelo de regresin logstica para predecir el
comportamiento de voto basndose en las puntuaciones
factoriales.

: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - REDUCCIN DE DATOS - FACTORIAL
El anlisis factorial implica, generalmente el desarrollo de tres etapas: Anlisis
Preliminar de viabilidad, Extraccin Factorial y Rotacin factorial. El SPSS ofrece
una gran flexibilidad para afrontar cada una de estas tres etapas.
Conjunto
de
variables
fundamental,
a
partir para las que se
desea
encontrar
factores subyacentes
comunes.
Posibilidad de limitar
el anlisis a un
nmero limitado de
casos
segn
una
variable de seleccin.

Facilitan el anlisis
preliminar de las
variables
y
sus
correlaciones
de
cara a anticipar la
viabilidad
del
anlisis.

Permite especificar el
mtodo de extraccin,
el nmero de factores
a extraer as como las
iteraciones mximas a
considerar
en
la
extraccin.

Ofrece varios mtodos


de rotacin tanto
ortogonales como
oblicuos.
Permite obtener y
guardar el valor de los
factores a partir de las
variables originales

ANLISIS CONJUNTO

C APROPIADO CUANDO......
Se desea establecer en que medida los distintos atributos de un objeto
inciden en su seleccin preferente por parte de un conjunto de individuos.
El anlisis conjunto intentar aproximarse a la estructura subyacente de
seleccin determinando la importancia relativa de cada atributo as como la
combinacin de los mismos que resulte ms atractiva.

1 EJEMPLO 1 (Anlisis Conjunto): Diseo de un nuevo


producto farmacutico.
Punto de partida: Un laboratorio farmacutico desea lanzar al mercado un
nuevo analgsico de tipo genrico. Su experiencia en el
mercado le ha permitido identificar una serie de variables
que condicionan la preferencia por una u otra marca
como: precio, formato de presentacin (grageas, sobres,
...), sabor del preparado, rapidez de accin, cantidad de
contenido, tipo de publicidad asociada (facultativo,
medios comunicacin,..). El anlisis conjunto permitir
ordenar de modo relativo cada uno de esos atributos,
para ponderar su importancia relativa en la seleccin del
producto y establecer la combinacin ptima para el
nuevo producto.

ANLISIS CLUSTER

C APROPIADO CUANDO......
Se desea aprovechar la informacin relativa a un conjunto de variables para
clasificar a un grupo amplio de sujetos y objetos en subgrupos de mxima
homogeneidad intergrupal y mayor heterogeneidad entregrupal. El anlisis
cluster no debe confundirse con el discriminante, ya que ese ltimo tiene
por objeto explicar una clasificacin establecida a priori mientras que el
anlisis cluster intenta, precisamente, generar esa clasificacin a partir de
un nico grupo global.

1 EJEMPLO 1 (Anlisis Cluster): Anlisis geogrfico de los


perfiles de sanitarios de la poblacin.
Punto de partida: A fin de planificar convenientemente la poltica
preventiva, desde el Ministerio de Sanidad de un
determinado pas se plantea la necesidad de dibujar el
"mapa sanitario", dividiendo el total del territorio en
zonas de caractersticas sanitarias homogneas, no
necesariamente similares a las divisiones poltico
administrativas. Se sospecha que una diferenciacin de
este tipo puede tener sentido en la medida en que algunos
de los factores de riesgo ms importantes tienen relacin
con la distribucin geogrfica: factores demogrficos,
factores ambientales (clima, calidad del agua,...),
dietticos culturales entre otros. As pues, se recopila
informacin relativa a la incidencia de un conjunto de
enfermedades
frecuentes
como:
enfermedades
cardiovasculares (cardiopatas coronarias y accidentes
cerebro - vasculares), distintos tipos de cncer (mama,
colon y recto, pulmn, cervix y endometrio..),
enfermedades de transmisin area (gripe, legionelosis,
tuberculosis...), enfermedades de transmisin entrica
(botulismo, diarreas vricas, salmonelosis, shigelosis,
colera., poliomielitis, hepatitis A...), enfermedades
transmitidas por contacto (ttanos, brucelosis,
toxoplasmosis...) y enfermedades de transmisin sexual
(sida, sfilis, ...) La utilizacin de todos estos indicadores
dividir a la poblacin total en grupos homogneos desde
el punto de vista sanitario. Determinar la viabilidad
geogrfica de esta agrupacin ser un paso posterior en
el anlisis.

: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - CLASIFICAR - CONGLOMERADOS JERRQUICOS
Conjunto
de
variables utilizadas
para la segmentacin
Variable
que
etiquetar
cada
individuo u objeto a
clasificar.

Guarda el grupo de
pertenencia de objetos
Permite elaborar el
clsico Dendograma o
grfico de agrupacin
secuencial de los
objetos analizados.

El SPSS ofrece la
posibilidad de aplicar
la metodologa
CLUSTER a
variables, en lugar de
objetos o sujetos.

El anlisis Cluster viene condicionado sensiblemente


por el mtodo de aglomeracin utilizado, la medida de
distancia empleada. El SPSS ofrece una amplia
variedad de mtodos.

ANLISIS MULTIDIMENSIONAL NO MTRICO

C APROPIADO CUANDO......
Se desea comprender la estructura subyacente a de un conjunto de medidas
de similitud o distancia entre objetos o sujetos. Para ello se asignan las
observaciones disponibles de esos sujetos u objetos a posiciones especficas
en un espacio conceptual (normalmente de dos o tres dimensiones) de
modo que las distancias entre los puntos en el espacio concuerden al
mximo con las disimilaridades observadas. En muchos casos, las
dimensiones de este espacio conceptual son interpretables y se pueden
utilizar para comprender mejor los datos. El escalamiento multidimensional
puede tambin aplicarse a valoraciones subjetivas de disimilaridad entre
objetos o conceptos.

: PROCEDIMIENTO SPPS
MEN:
ESTADSTICA - ESCALAS - ESCALAMIENTO MULTIDIMENSIONAL
Conjunto
de
matrices de variables
a partir de las cuales
se calcularn las
distancias
entre
objetos o sujetos
para explicar sus
similaridades
Permite controlar
nivel de media,
condicionalidad,
dimensiones
y
mtodo
escalamiento.

Normalmente, los datos de partida son matrices que reflejan la similitud o


diferencia percibida entre los objetos o sujetos que ocupan cada fila y columna
(los datos son distancias). No obstante, si no se han creado las matrices a partir
de las variables en bruto, el SPSS las crea conforme a una medida de distancia
elegida por el usuario (crear distancias a partir de datos).

el
la
las
el
de

BIBLIOGRAFA
I. BIBLIOGRAFA GENERAL

BERSTEIN, I. (1998): Applied Multivariate Analysis Aplications Academic Press.


Inc. New York.

BISQUERA ALZINA, R. (1989): Introduccin conceptual al anlisis multivariable:


un enfoque informtico con los paquetes SPSS-X, BMDP, LISREL y SPAD. Vol. 1,
PPU, S.A.

COOLEY, W. y LOHNES, P. (1971): Multivariate Data Analysis. New York: John


Wiley Cop.

CUADRAS, C.M. (1991): Mtodos de Anlisis Multivariante. Barcelona: PPU (2


edicin).

DANIEL PEA SANCHES DE RIVERA. (1989): Estadstica modelos y mtodos, 1.


Fundamentos. Alianza Editorial.

DILLON y GOLDSTEIN. (1984): Multivariate Analysis. Methods and applications.


John Wiley & Sons.

FERRN ARANAZ, M. (1996): SPSS para Windows, Programacin y Anlisis


Estadstico. McGraw-Hill Interamericana, Madrid.

FLURY, B., RIEDWYL, H. (1988): Multivariate statistics: a practical approach.


Chapman and Hall.

HAIR, ANDERSON, TATHAM Y BLACK (1998): Multivariate Data Analysis.


Fifth Edition, Prentice-Hall, New Jersey.

HAIR, J.F.et al (1999): Anlisis Multivariante. 5 edicin, Prentice-Hall Iberia,


Madrid.

JOHNSON R. (1994): Applied multivariate statistical analysis. Madison, thurd. de.


pp. 459-491.

RICHARD A. JOHNSON, DEAN W. WICHERN. (1981): Applied multivariate


statistical analysis. Pretince-Hall.

RICHARD A. JOHNSON, DEAN W. WICHERN. (1992): Applied Multivariate


statistical anlysis. Third edition, Prentice-Hall International, Inc.

SNCHEZ CARRIN, J.J. (1995): Manual de Anlisis de Datos. Alianza Editorial.

URIEL, E. (1985): Anlisis de datos: Series temporales y anlisis multivariante.


Editorial AC, Coleccin plan nuevo, Madrid.

URIEL, E. (1995): Anlisis de datos: Series temporales y anlisis multivariante.


Editorial AC.

VICNS OTERO, J. (1997): Obtencin y Anlisis de datos. Facultad de Econmicas


UAM.

WILLIAM, R. DILLON and MATTHEW GOLDSTEIN. (1984): Multivariate


Analysis. Methodos and Applications.

II. BIBLIOGRAFA ESPECFICA POR TEMAS


II.1.- TABULACIN CRUZADA

BISHOP, Y.M.M.; FIENBERG, S.E. Y HOLLAND, P.W. (1977): Discrete


Multivariante

Analysis.

Theory

and

Practice.

MIT

PRESS,

Cambridge,

Massachusetts.

EVERITT, B. (1977): The analysis of Contingency Tables. London Chapman and


Hall.

FIENBERG, S.E. (1987): The analysis of cross-classified categorical data.


Cambridge, Mass.: M.I.T. Press.

GOKHALE, D.V. (1978): The information in contingency tables. New York: M.


Dekker.

GOKHALE, D.V. y KULLBACK, S. (1978): The information in contingency tables


Statistics: Textbooks and monographs. Vol 3. De. Owen. Minton y Pratt, Nueva York.

HABERMAN, S.J. (1978): Analysis of qualitative data. Introductors topics and New
developments. New York. Academic Press.

MAXWELL, A.E. (1971): Analysing qualitative data. Harmondsworth: Penguin


Books, 1970.

OBRIEN, L.G. (1989): The statistical anlysis of contingency table designs.


Newcastle Upon Tyne: Newcastle University.

RUZ-MAYA, L. (1990): Metodologa Estadstica para el Anlisis de Datos


Cualitativos. Centro de estudios Sociolgicos. Madrid.

SNCHEZ CARRIN, J.J. (1984): Anlisis de tablas de contingencia. Coleccin


monografas n 105. CIS.

SPSS. Crosstabulation and measures of association, Cap. 10, Statistics Guide.

UPTON, GRAHAM, J.G. (1978): The analysis of cross-tabulated data. John Wiley
Cop.

II.2.- ANLISIS DE LA VARIANZA. ANLISIS DE LA COVARIANZA.

COCHRAN, W.G. (1976): Analysis of Covariance: Its nature and uses. Biometrics,
Vol. 13.

ELLEN R. GIRDEN. (1992): ANOVA. Repeated Measures. SAGE University


Paper.

GIRDEN, E. (1992): Anova: repeated measures. Newbury Park, 1992-VI.

INVERSEN, G.R. y NORPORTH, H. Analysis of Variance. Quantitative


Applications in the Social Sciences N 1. A Sage University Paper Series.

RUZ-MAYA. (1986): Mtodos Estadsticos de Investigacin. I.N.E.

RUPERT G. MILLER, JR. (1985): Beyond ANOVA, basics of applied statistics.


John Wiley & Sons.

WILDT, A.R. y ATHOLA, O. (1978) Analysis of Covariance. Quantitative


Applications in the Social Sciences. A Sage University Paper Series.

II.3.- ANLISIS DISCRIMINANTE.

CUADRAS,

ABELLANO.

(1973):

Anlisis

Estadstico

Multivariante.

Representacin Cannica de Funciones. Resumen de tsis. V.A. Barcelona.

PETER A. LACHEMBRUCH. (1975): Discriminant analysis. Hoguer Press.

VISAUTA VINACUA, B. (1997): SPSS para Windows. McGraw-Hill.

WILLIAM R. KLECKA. (1976): Discriminant analysis. Series: Quantitative


Applications in the Social Sciencies.

II.4.- MODELOS DE ELECCIN DISCRETA: LOGIT Y PROBIT.

ANDERSON, SIMON P.; ANDRE; THISSE, JACQUES FRANCOIS. (1992):


Discrete choice theory of product differentiation. Cambridge and London: MIT Press,
pag. XVIII, 423.

BESANKO D., PERRY M.K. and SPADY R.H. (1990): The logical model of
monopolistic competition: brand diversity. The Journal of Industrial Econmics, Vol.
38, n 4 June.

GRACIA DIEZ, M. (1988): Modelos con variable dependiente cualitativa y de


variacin limitada. Cuadernos econmicos, ICE, nmero 39, 1988/2.

GRACIA DEZ, M. (1991): A Qualitative Analysis of Unemployment in Spain.


Universidad Complutense de Madrid, pag. 159-73.

JOHNSTON, J. (1989): Mtodos de econometra. Ed. Vicens Vives, Barcelona.

JUDGE G. (1980): The theory and practice of econometrics. Jhon Wiley and sons,
New York.

LEHRER, EVELYN L. (1992): The impact of Children on Married Womens Labor


Supply: Black-White Differentials Revisited. Journal of Human Resources; 27 (3),
pag. 422-44.

Micro TSP, Users Manual. (1986) Mc Graw Hill.

MILLN J.A., RUIZ P. (1987): Modelos logit de adopcin de innovaciones en


invernaderos de Almera. Investigacin agraria, 2 (2).

NOREEN, E. (1988): An empirical comparison of probit and OLS Regression


hypothesis tests. Journal of accounting research. Vol. 26, N 1 Spring, USA.

NOVALES, A. (1988): Econometra. McGraw Hill, Madrid.

RODRGUEZ GUTIERREZ, CSAR. (1992): La adquisicin de capital humano: Un


modelo terico y su contrastacin. Investigaciones Econmicas. 16 (2). Pg. 305-16.

TIM FUTING LIAO. (1988): Interpreting probability model. Logit, Probit and other
generalizad Linear Models. Series: Cuantitative Applications in the Social Sciences. A
Sage University papers series.

VICNS, J. (1995): Modelos con variables cualitativas dicotmicas. (Nov. 1995).


Instituto L.R.Klein.

II.5.- CORRELACIN CANNICA.

LEVINE. (1977): Canonical Analysis and Factor Composition. Beverly Hills: Sage
Publications. Sage University Papers.

II.6.- COMPONENTES PRINCIPALES Y ANLISIS FACTORIAL.

APARICIO PREZ F. (1988): La difcil realizacin de un anlisis de componentes


principales mediante los programas estadsticos ms difundidos en el mercado.
Estadstica espaola, Vol. 30, n 117, Madrid.

BATISTA FOQUET Y MARTNEZ ARIAS. (1989): Anlisis multivariante. Anlisis


en componentes principales. Coleccin ESADE. Editorial Hispano Europea, S.A.
pp.49-54.

HARMAN, HARRY. (1976): Modern factor analysis. Chicago University Press.

HARMAN, HARRY. (1980): Anlisis Factorial Moderno. Editorial Salts.

HOTTELING, H. (1993): Analysis of a Complex of Statistical Variables into


Principal Components. J. Educ. Psycology, n 24.

JRESKOG, K.G., KLOVAN, J.E., REYMENT, R.A. (1976): Geological Factor


Analysis. Elsevier Scient. Pub. Co.

KIM JAE-ON y MUELLER, CHARLES. (1978): Factor analysis, Statistical Methods


and Practical Issues. Sage University Paper.

KIM JAE-ON y MUELLER, CHARLES. (1978): Introduction to factor analysis.


Sage University Paper.

MARTN REYES, G. (1978): Algunos mtodos multivariantes y sus apllicaciones en


economa. Cuadernos de CC. Econmicas y Empresariales, n 2, Universidad de
Mlaga.

NARVAIZA SOLS, J.L. (1981): El anlisis Factorial: Exposicin Grfica e


Intuitiva. Boletn de Estudios Econmicos, n 36 (113), Deusto, 1981, 259-285.

PEARSON, K. (1901): On Lines and Planes of Closest Fit to Systems of Points in


Space. Phil. Magasine, Ser. 6, 2.

SPEARMAN, C. (1904): General Intelligence Objetively Determined and Measured.


American Journal of Psycology, n 15.

THURSTONE, L.L. (1931): Multiple Factor Analysis. Psychol. Rev., n 38, 1931,
406.

II.7.- ANLISIS CLUSTER.

ALDENDERFER, M.S. Y R.K. BLASHFIELD. (1984): Cluster Analysis. A Sage


University Paper, Series: Quantitative Aplications in the Social Sciences. N 07-044.

ANDERBERG, M.R. (1973): Cluster Analysis for Applications. Academic Press,


New York.

BOGGIS, J.G. y J. HELD. (1971): Cluster Analysis. A New Tool in Electricity.


Journal of the Market Research Society (England), 13. Abril, 1971, pp. 49-68.

DAY, N.E. y R.M. HEELER. (1971): Using Cluster Analysis to Improve Marketing
Experiments. Journal of Marketing Research, 8. Agosto, 1971, pp. 340-47.

EVERITT, B.S. (1978): Graphical Techniques for Multivariate Data. London:


Heineman Educational.

EVERITT, B.S. (1993): Cluster Analysis. Tercera Edicin. Edward Arnold. A


division of Hodder & Stoughton.

JAIN, A.K. y R.C. DUBES. (1988): Algorithms for Clustering Data Prentice Hall,
Englewood Clidd, N.J. USA.

JAMBU, M. (1983): Cluster Anlysis and Date Analysis. Amsterdam: North-Holland.

JARDINE, N. y R. SIBSON. (1971): Mathematical Taxonomy, John Wiley & Sons,


Chichester.

RAO, C.R. (1952): Advanced Statistical Methods in Biometrics Research. John


Wiley & Sons, New York.

ROMESBURG, H.CH. (1984): Cluster Analysis for Research. Belmont, Calif:


Lifetime Learning Publications.

TRYON, R.C.- DANIEL, E.B. (1970):


Company. N.Y.

Cluster Analysis. MC. Graw Book

SOKAL, R.R. y P.H.A. SNEATH. (1973): Numerical Taxonomy. W.H. Freeman &
Co. San Francisco.

WARD, Jr. J.H.; HOOK, M.R. (1963): Aplication of Hierachical Grouping Procedure
to a Problem of Grouping Profiles. Educ and Psychology Measurement 23, n 1 Pgs.
69-82.

II.8.- ANLISIS CONJUNTO.

GIL LUEZAS,C. (1985): Una aplicacin del anlisis conjunto a la segmentacin de


mercado: la segmentacin componencial. Investigacin y Marketing.

GREEN, P.E. and YORAM WIND. (1975): New away to measure consumers
judgements. Harward Business Review (Julu-August 1975).

GREEN, P.E. and V. SRINIVASAN. (1978): Conjoint analysis in consumer research:


issues and outlook. Journal of consumer research. (September 1978).

GREEN, P.E. (1990): Conjoint Analysis in Marketing: new development With


Implications for Research an Practice. Journal of Marketing, Octubre 1990.

HELSEN, K., SHANDLER, B. Y GREEN, P. (1988): Conjoint Internal Validity


Under Alternative Profile Presentations. Journal of Consumer Research, Vol. 5.

KRIEGER A. Y GREEN, P. (1990): Segmenying Markets With Conjoint Analysis.


Journal of Marketing. Vol. 55.

MARTN DVILA, M. (1987): Como diagnosticar lo que los consumidores desean


realmente: El anlisis conjunto. (Marzo 1987).

MGICA GRIJALBA, J.A. (1989): Los modelos multiatributo en marketing. El


anlisis conjunto. IPMARK (n 324/16-28 Febrero 1989).

MGICA GRIJALBA, J.M. (1989): El anlisis conjunto. IPMARK.

MGICA GRIJALBA, J.M. (1989): El anlisis conjunto (y II). Alternativas,

n 324.

problemas y limitaciones. IPMARK (n 326/16-31 Febrero 1989).

RIVERO, P. Y FERNNDEZ, R. (1993): Anlisis de variables cualitativas: Modelos


LOGIT y PROBIT, Universidad Autnoma de Madrid.

VARELA GONZLEZ, J.A. (1985): El anlisis conjunto, una tcnica al servicio de


la investigacin comercial. Economa y Empresa.

WITTINK, D. Y CATTIN, P. (1981): Alternative Estimation Methods for Conjoint


Analysis: A Monte Carlo Study. Journal of Marketing Research, Vol XVIII.