Está en la página 1de 33

C O JO EJ NE AN MA yM Ny N I CI CC UC DU OD CURSO DE INTRO BSIC S SS PS SP LS EL DE OD CO

SE I:: NI N I SI ES T n,, n cii ac ca fiic siif as Clla e.. C ntte an riia ar va ullttiiv Mu cnicas de Anlisis M c T descripcin y d S SS PS SP nS en de ad da biilliid niib on po sp diis

ESQUEMA DE OBTENCIN Y ANLISIS DE DATOS

DETERMINACIN DEL PROBLEMA

F.SECUNDARIAS
- SOPORTE IMPRESO - SOPORTE MAGNTICO

OBTENCIN DE INFORMACIN

F.PRIMARIAS
- UNIVERSO - CUESTIONARIO - MUESTREO - PRETEST Y TRABAJO DE CAMPO - CONTROL - CODIFICACIN Y TABULACIN

ANLISIS

SIMPLE
- ESTADSTICA DESCRIPTIVA - ANLISIS DE CORRELACIN: Numrica, ordinal o categrica - NMEROS NDICES

MULTIVARIANTE

- GRFICOS Y TABLAS

- ANLISIS DE DEPENDENCIA: Anova, Ancova, Manova y Mancova. Anlisis de Regresin. Anlisis Discriminante. Correlacin Canvnica - ANLISIS DE INTERDEPENDENCIA: - Entre variables: Anlisis Factorial. Componentes principales - Entre sujetos: Anlisis Cluster. Anlisis Multidimensional No-Mtrico. Anlisis Conjunto

TCNICO INFORME DE DIRECCIN

ESQUEMA DE CLASIFICACIN DE TCNICAS DE ANLISIS MULTIVARIANTE


ANLISIS DE DEPENDENCIA:
TABLAS DE CONTINEGENCIA. ANOVA, ANCOVA, MANOVA, MANCOVA. ANLISIS DE REGRESIN. ANLISIS DISCRIMINANTE LOGIT - PROBIT.
CORRELACIN CANNICA.

ANLISIS DE INTERDEPENDENCIA.
ENTRE VARIABLES:
COMPONENTES PRINCIPALES. ANLISIS FACTORIAL. ANLISIS CONJUNTO.

ENTRE SUJETOS:
CLUSTER O ANLISIS DE GRUPOS. ANLISIS MULTIDIMENSIONAL NO MTRICO.

EXTENSIN DE TCNICAS DE ANLISIS MULTIVARIANTE


VICENS OTERO, J. Estudios de mercado en la empresa espaola. Instituto de Prediccin Econmica L. R. Klein. Documento 96/4. Julio 1996.
Resultados para 300 empresas con cifras de ventas superiores a 250 mill. Pts.
UTILIZACIN DE LOS DISTINTOS TIPOS DE ANLISIS SI (Porcentaje) ANLISIS ESTADSTICO SIMPLE ANLISIS ESTADSTICO MULTIVARIANTE UTILIZACIN DE PROGRAMAS DE ORDENADOR PARA EL ANLISIS 20.8% 8.2% 29.8% NO (Porcentaje) 79.2% 91.8% 70.2% TOTAL (Porcentaje) 100% 100% 100%

MTODOS DE ANLISIS REALIZADOS EN 1994 (Porcentaje)

ANLISIS ESTADSTICO NO HA MULTIVARIANTE REALIZADO


ANLISIS DE LA VARIANZA ANLISIS DE LA COVARIANZA ANLISIS DISCRIMIANTE 93.3% CORRELACIN CANNICA ANLISIS FACTORIAL ANLISIS DE REGRESIN 89.1% CLUSTER O ANLISIS DE GRUPO ESCALAS MULTIDIMENSIONALES ANLISIS CONJUNTO 87.2% 95.1% 93.9% 98.8% 85.4%

SI HA REALIZADO
PERSONAL PROPIO CONSULTORA EXTERNA PERSONAL INTERNO Y EXTERNO

TOTAL

88.6% 94.5%

4.2% 1.8% 1.2% 0.0% 2.5% 5.5% 4.2% 2.5% 3.0%

4.8% 3.7% 4.9% 1.2% 9.1% 4.2% 7.4% 1.2% 2.5%

2.4% 0.0% 0.6% 0.0% 3.0% 1.2% 1.2% 1.2% 0.6%

100% 100% 100% 100% 100% 100% 100% 100% 100%

FACTORES, VARIABLES Y ESCALAS DE MEDIDA


TIPOLOGA:
Variables Continuas y Discretas Variable Temporal, Transversal y Panel Data ......etc ESCALAS DE MEDIDA: Nominal (Factor)
Identifica la pertenencia de un elemento sujeto u objeto a un grupo u otro, a niveles generalmente mutuamente excluyentes. Permite la distincin entre elementos pero no su ordenacin. Identifica a cada elemento en una posicin de escala respecto a los otros. Identifica la posicin ordinal de cada elemento y permite adems medir las distancias entre unos y otros utilizando una escala de medida subjetiva. Permite medir las distancias entre elementos utilizando una escala de objetiva y, por lo tanto, posibilita la utilizacin de razones o ratios comparativos.

Ordinal Intervalo

Razn

CONDICIONA LA HERRAMIENTA DE ANLISIS Y, POR


TANTO, LA CALIDAD DE LOS RESULTADOS

ES

CONDICIONADA POR LOS OBJETIVOS EXPERIMENTALES, LOS RECURSOS DISPONIBLES, Y LA DIFICULTAD DE PERCEPCIN EXPERIMENTAL.

TABLAS DE CONTINGENCIA C APROPIADAS CUANDO......


Se desea organizar informacin relativa a ms de un factor, explorar la relacin de dependencia o independencia entre los factores y eventualmente medir el grado de asociacin entre los mismos. As mismo, apropiadas cuando se desea medir el grado de concordancia entre clasificaciones factoriales de objetos o sujetos.

1 EJEMPLO 1 (Organizacin bifactorial): Cmputo sencillo de


validez de Test Diagnsticos. Punto de partida: Se ordenan en una tabla de dos dimensiones los resultados de un test diagnstico para 100 pacientes (50 enfermos - 50 sanos) segn los resultados positivos y negativos. La informacin contenida en las distintas celdas, debidamente relativizada, nos permitir determinar la sensibilidad del Test (Prob. Diagnstico correcto para un enfermo), su especificidad Prob. Diagnstico correcto para un NO enfermo) y sus valores predictivos positivo (Prob. Enfermedad ante test Positivo) y negativo (Prob. NO Enfermedad ante test Negativo)

1 EJEMPLO 2 (Relacin entre dos factores): Relacin entre el


riesgo de infeccin por virus la hepatitis B del personal sanitario y la manipulacin de sangre o material biolgico. Punto de partida: Se realiza un estudio serolgico en 50 voluntarios del grupo de mayor riesgo y 100 del grupo de menor riesgo. Suponiendo que la muestra es suficientemente representativa se observar la dependencia entre el puesto de trabajo y el riesgo de infeccin heptica.

1 EJEMPLO 3 (Factores multinivel): Relacin entre el intervalo


de edad infantil y el padecimiento del sarampin, rubola y parotiditis como paso previo al estudio de la escolarizacin como factor de riesgo en la transmisin de estas enfermedades infeccionas. Punto de partida: Se toman los datos de la edad de 265 nios clasificndolos por intervalos en cuatro grupos (Menores de cuatro aos, entre 4 y 5 aos, entre 6 y 7 aos y mayores de siete aos). As mismo, se estudia su situacin inmunolgica detectndose la presencia o ausencia de anticuerpos frente a cada uno de esos virus.

1 EJEMPLO 4 (Anlisis de concordancia): Homogeneidad de


criterios en la hospitalizacin entre dos centros diferentes Punto de partida: Se selecciona una muestra experimental de 50 pacientes que sern atendidos, con los mismos sntomas, por facultativos de dos centros diferentes. Para cada paciente se anota la decisin de hospitalizacin SI - NO en cada uno de los dos centros.

: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - RESUMIR - TABLAS DE CONTINGENCIA
FACTOR 1 FACTOR 2 Medidas para el estudio de la correlacin, dependencia y asociacin entre factores Control de la informacin a mostrar en las casillas interiores de la tabla y marginales de filas y columnas.

ANLISIS DE LA VARIANZA

C APROPIADO CUANDO......
Se desea analizar si los distintos niveles de un determinado factor inciden en los valores de una variable cuantitativa. Si se emplean como explicativos dos o ms factores hablamos de una ANOVA multifactorial y, en ese caso, cobrarn inters los efectos de los niveles de cada uno de los factores y los efectos de las interacciones entre los niveles de los factores. Algunas variantes de esta tcnica son especialmente atractivas para casos experimentales concretos, en especial el ANCOVA.

1 EJEMPLO 1 (Anova Unifactorial - Experimento de


homogeneidad de datos pareados): Eficacia de un tratamiento antitaquicrdico Punto de partida: Se realiza un experimento con 50 pacientes tomando las pulsaciones por minuto antes y despus de la administracin del medicamento.

1 EJEMPLO 2 (Anova Unifactorial sobre grupos diferentes):


Relacin entre la localizacin del Cncer Gstrico en el nmero de monocitos del enfermo. Punto de partida: Se toman 50 enfermos de cncer gstrico dividios en tres grupos: 15 con carcinoma en fundus, 15 con carcinoma en curvatura y 20 con carcinoma en ploro. Al efectuar un hemograma se realiza un recuento monocitario.

1 EJEMPLO 3 (Anova con dos factores): Independencia,


sinergismo o antagonismo del consumo de Haschis y la Cocana. Punto de partida: Se dispone de una muestra de 100 individuos de los cuales, un 25% no son consumidores de ninguna de las dos drogas, otro 25% son consumidores exclusivos de cocana, un 25% exclusivos de Haschis y un 25% de ambas drogas simultneamente. En condiciones experimentales de homogeneidad adecuada se toman las pulsaciones por minuto a estos 100 individuos. El anlisis no slo permitir diferenciar la variabilidad "biolgica" de la debida al consumo individual de cada droga sino tambin de la debida a la interaccin de ambas drogas.

: PROCEDIMIENTO SPPS
MEN (Anova Unifactorial): ESTADSTICA - COMPARAR MEDIAS - ANOVA DE UN FACTOR MEN (ANOVA Multifactorial): ESTADSTICA - MODELO LINEAL GENERAL - COMPONENTES DE LA VARIANZA
VARIABLES A EXPLICAR FACTOR EXPLICATIVO

Contrastes de existencia de tendencia en la endgena y contrastes "t" de significacin para los niveles del factor. Pruebas a posteriori para determinar qu medias difieren en el caso en que el ANOVA resulte significativo. Test de homogeneidad de varianzas, presencia de estadsticos descriptivos y tratamiento de los valores perdidos.

ANLISIS DE REGRESIN

C APROPIADO CUANDO......
SIEMPRE que la calidad de los datos lo permita para el anlisis de dependencia univariante o multivariante. Su precisin, refinamiento y potencia de anlisis es muy superior a las de otras tcnicas de anlisis de dependencia, permitiendo la realizacin de ejercicios de simulacin y prediccin. Como contrapartida, sus virtudes slo pueden explotarse asumiendo una complejidad que puede llegar a ser muy acusada, de modo que su aplicacin exige un importante compromiso de recursos tcnicos.

4 VARIANTES BSICAS (Recogidas en SPSS)


Modelo Bsico de Regresin Lineal por MCO Aproximacin clsica adecuada para relaciones lineales entre variables exgenas y endgena en las que cabe asumir un nico sentido de la causalidad y el estricto cumplimiento de las Hiptesis Bsicas tanto estructurales como referidas a la perturbacin aleatoria (especialmente la homocedasticidad y ausencia de autocorrelacin residual). Regresin no lineal (RNL - NLR) Aproximacin genrica para aquellos casos en los que no puede suponerse linealidad en la relacin entre exgenas y endgena. Orientado en el SPSS a la prediccin simple de series temporales. Estimacin ponderada (MCP - WLS) Estimacin especfica para ajustar relaciones de dependencia en las que se viole la condicin de varianza constante para la variable endgena en la poblacin objeto de estudio. El mtodo afina el resultado de una estimacin clsica ponderando en mayor medida las observaciones ms precisas. Estimacin en dos etapas (MC2E - 2SLS) Una de las muchas aproximacin especficas para aquellos casos en los que los errores del modelo aparecen correlacionados con alguna exgena, por ejemplo, cuando la relacin de causalidad no se da exclusivamente desde las exgenas a la endgena, sospechndose la existencia de un efecto de retroalimentacin en sentido inverso.

1 EJEMPLO 1 (Regresin lineal bsica multivariante): presin


arterial en la poblacin fumadora. Punto de partida: Sobre una muestra de 500 fumadores habituales mayores de 50 aos se desea establecer la relacin entre la presin arterial y algunas de sus caractersticas bsicas y hbitos: edad, peso, nmero de aos con el hbito de fumar y nmero de cigarrillos diarios promedio en los ltimos 5 aos. Todas las variables pueden medirse en escalas de razn.

1 EJEMPLO 2 (Regresin univariante no lineal): Prediccin de


la extensin de la infeccin por VIH. Punto de partida: Utilizando el censo espaol de casos de infeccin VIH se determina el nmero de casos por mil habitantes ocurridos desde 1980. La evolucin de la enfermedad ser, con seguridad, no lineal, lo que impedir el ajuste de un modelo bsico de regresin. Un ajuste de tipo logstico permitir realizar una mejor prediccin para el perodo 2001 2005. 3 (Regresin univariante por estimacin ponderada): Relacin entre la edad de los trabajadores y la duracin de las bajas por enfermedad. Punto de partida: Utilizando estadsticas de una mutualidad laboral, se desea establecer la relacin entre la edad de los trabajadores y el total de das de anuales que solicitan por baja de enfermedad. La relacin positiva es previsible, pero para estimar de forma precisa el valor del parmetro debe observarse el hecho de que, a mayor edad, la varianza de la endgena crece como consecuencia de la aparicin progresiva de un mayor espectro de enfermedades de distinta gravedad y, por lo tanto, de distinto perodo de baja.

1 EJEMPLO

1 EJEMPLO 4 (Regresin por estimacin con variables


instrumentales): Demanda de un determinado producto farmacutico . Punto de partida: Una empresa farmacutica est interesada en medir los factores que han impulsado los cambios en las ventas de un novedoso producto sin competencia a lo largo de los ltimos tres aos. Para ello dispone de datos mensuales de ventas, precio medio, promocin y publicidad entre facultativos e incidencia de la enfermedad en el segmento poblacional de inters. La estimacin simple de los parmetros estara sesgada, especialmente para el parmetro de la incidencia, en cuanto que las ventas del producto farmacetico pueden funcionar como explicativa para la incidencia de la misma.

: PROCEDIMIENTO SPPS
MEN (Regresin Lineal MCO y Regresin MCP - WLS): ESTADSTICA - REGRESIN - LINEAL
VARIABLE A EXPLICAR VARIABLES EXPLICATIVAS Mtodo para la inclusin selectiva de las variables exgenas Posibilidad de limitar el anlisis a un conjunto de casos segn el valor de una variable Seleccin mtodo de Mnimos Cuadrados Ponderados (WLS) Intervalos de confianza para los coeficientes, matriz de varianzas y covarianzas, correlaciones parciales y semiparciales, test multicolinealidad, Durbin Watson.

: PROCEDIMIENTO SPPS
MEN (Regresin Curvilnea): ESTADSTICA - REGRESIN - ESTIMACIN CURVILNEA
VARIABLES A PREDECIR VARIABLES PREDICTORA TIEMPO Variable etiquetar punto. para cada

Tipo de modelo de ajuste curvilneo.

: PROCEDIMIENTO SPPS
MEN (Regresin genrica NO Lineal): ESTADSTICA - REGRESIN - NO LINEAL
VARIABLES A EXPLICAR EXPRESIN NO LINEAL DEL MODELO

La sintaxis de la expresin no lineal del se escribir utilizando variables dependientes (cuadro superior), el cuadro operativo bsico y las funciones prediseadas.

ANLISIS DISCRIMINANTE - ANLISIS LOGIT ANLISIS PROBIT

C APROPIADOS CUANDO......
En trminos generales, todas estas tcnicas permiten explicar el valor de un factor utilizando la informacin de variables explicativas cuantitativas. En el campo de la medicina, resulta especialmente atractivo para la diagnosis y para la determinacin del nivel de estmulo efectivo en los tratamientos.

4 VARIANTES BSICAS (Recogidas en SPSS)


Anlisis DISCRIMINANTE Aunque todos estos anlisis son en realidad anlisis discriminantes, el SPSS denomina especficamente A. Discriminante al caso en el que se utiliza una aproximacin no probabilstica apoyada en clculos sobre la variacin intragrupal y entregrupal observada. El factor a explicar representa generalmente el grupo de pertenencia de una serie de individuos. El anlisis discriminante utilizar la informacin de un conjunto de variables observadas para esos sujetos u objetos a fin de construir unas funciones discriminantes (basadas en simples combinaciones lineales de las variables predictoras), capaces de explicar esa pertenencia a uno u otro grupo (ADD) y de construir un modelo predictivo (ADP) para pronosticar el grupo de pertenencia de un caso a partir de las caractersticas observadas de cada caso. Si bien no se reduce slo al caso dicotmico para la endgena requiere que las variables explicativas sean continuas.

Modelos LOGIT - PROBIT El modelo LOGIT es en realidad un tipo especfico de regresin en el que la variable endgena es dicotmica mientras que las explicativas pueden ser continuas o categricas. El contexto es similar al descrito en el cuadro anterior para el anlisis discriminante, pero ahora el anlisis suele enfocarse a aquellos casos en los que la variable endgena puede interpretarse en trminos de probabilidad y el objetivo es cuantificar la relacin entre las caractersticas individuales de los individuos y esa probabilidad. Los coeficientes de regresin logstica, aunque difciles de interpretar, pueden utilizarse para estimar la razn de las ventajas relativas de cada variable independiente del modelo. La regresin logstica es aplicable a un rango ms amplio de situaciones de investigacin que el anlisis discriminante. La regresin PROBIT, muy similar a la empleada en el LOGIT, suele utilizarse en aquellos casos en los que se sospecha que una respuesta dicotmica est influida por el nivel de alguna o algunas variables explicativas. El procedimiento, permitir estimar muy fcilmente la intensidad necesaria para que un estmulo llegue a inducir una determinada proporcin de respuestas.

1 EJEMPLO 1 (Anlisis Discriminante): Seleccin de la cartera


de clientes solventes de una Aseguradora Mdica. Punto de partida: Una aseguradora analiza su cartera de 2500 clientes distinguiendo a aquellos que han hecho frente a sus cuotas con regularidad de aquellos que no lo han hecho. Adicionalmente, revisa para cada uno de los 2500 clientes algunas variables que se sospecha pueden estar en relacin directa con la solvencia: edad, renta mensual, antigedad del contrato, nmero de hijos. Estas cinco variables permitirn elaborar un mximo de cuatro funciones discriminantes que ayuden a caracterizar a cada uno de los grupos. Adems, si el valor predictivo de las mismas es elevado podrn utilizarse para elaborar la conveniencia de admitir a un nuevo solicitante o rechazar su solicitud como asegurado.

1 EJEMPLO 2 (Anlisis LOGIT): Factores de riesgo para el


desarrollo de aterosclerosis. Punto de partida: Apoyndonos en el diseo de una amplia muestra de historiales mdicos se desea establecer la importancia de cada uno de los factores de riesgo en el desarrollo de la aterosclerosis. Para cada uno de los individuos que constituyen la muestra, se dispone de informacin para un perodo determinado acerca de variables referidas a: tabaquismo, dieta (en especial niveles sricos medios de colesterol), edad, sexo, tensin arterial, consumo de alcohol, sedentarismo y antecedentes genticos. El ajuste de una funcin LOGIT permitir determinar cmo incide cada uno de estos factores en la probabilidad de desarrollo de la enfermedad a fin de orientar la poltica preventiva, elaborndose adems un instrumento medidor del riesgo de padecimiento.

1 EJEMPLO 3 (Anlisis PROBIT): Determinacin de la dosis


de respuesta adecuada a un frmaco. Punto de partida: Apoyndonos en un diseo experimental se administra un determinado medicamento a 60 individuos divididos en 20 grupos de 3 personas. A cada grupo se le administra una cantidad en mmg diferente desde 11 (primer grupo) a 30 (ltimo grupo) y se anota su reaccin despus de un tiempo de 1 hora calificndose el resultado en cada individuo como POSITIVO o NEGATIVO. El ajuste de una funcin PROBIT permitir determinar la dosis ms adecuada para provocar una reaccin positiva al medicamento.

: PROCEDIMIENTO SPPS
MEN (DISCRIMINANTE): ESTADSTICA - CLASIFICAR DISCRIMINANTE
FACTOR DE AGRUPACIN A EXPLICAR
VARIABLES DISCRIMINANTES

Estadsticos descriptivos de las variables independientes segn los diferentes grupos. Coeficientes de la funcin de clasificacin de Fisher y descomposicin de Matrices de Varianzas y Covarianzas.

Controla cmo usar para la clasificacin de individuos el resultado obtenido en las funciones discriminantes, en especial para fines predictivos.

: PROCEDIMIENTO SPPS
MEN (ANLISIS PROBIT): ESTADSTICA - REGRESIN - PROBIT
Variable que contiene, para cada nivel de exposicin (casos) el % de reacciones positivas a ese nivel de estimulacin. Variable que contiene, para cada nivel de exposicin (casos) el nmero de sujetos expuestos a ese nivel de estimulacin. Variable o variables predictoras, esto es, variables de estmulos.

Permite obtener una prueba de paralelismo (todos los niveles del factor tiene pendiente comn ) y controlar algunos aspectos de la estimacin de los parmetros.

CORRELACIN CANNICA

C APROPIADA CUANDO......
Se desea abordar el estudio de un fenmeno de causalidad entre dos fenmenos que vienen representadas, tanto el causado como el explicativo, por un conjunto de variables, y no se desea restringir el modo en que cada una de las variables explicativas incide en cada una de las explicadas.

1 EJEMPLO 1 (Anlisis Correlacin Cannica): Determinacin


de la relacin entre el nivel de desarrollo econmico y el nivel de desarrollo sanitario de un conjunto de pases. Punto de partida: Un estudio planteado a nivel internacional desea establecer la relacin entre el nivel de renta y nivel de desarrollo sanitario en un conjunto de pases. El analista dispone de 25 variables homogneas del nivel de desarrollo sanitario de cada pas (gasto farmacutico de distintos tipos, instalaciones hospitalarias por 1000 hb de distintos tipos, mdicos por 1000 hb de distintas especialidades, ....). As mismo dispone de otras 25 variables relativas al desarrollo econmico (PIB real por Hb, tasa de actividad, tasa de paro, capacidad de eneudamiento.....). Mediante un anlisis de correlacin cannica el analista puede construir un modelo de causalidad entre ambos conjuntos de variables sin necesidad de especificar el detalle del modelo de casualidad para cada par de variables.

ANLISIS DE COMPONENTES PRINCIPALES

C APROPIADO CUANDO......
Se desea reducir las dimensiones de un conjunto de variables sin prdida excesiva de informacin. El mtodo de componentes principales permitir generar combinaciones lineales de las variables originales de modo que las nuevas variables contengan gran parte de la informacin original. Su coste debe valorarse en trminos de interpretabilidad de esos componentes. Aunque no es infrecuente su confusin con el anlisis factorial existen importantes diferencias conceptuales; en todo caso, la relacin provendra del hecho de que la tcnica de componentes principales es uno de los mtodos de extraccin factorial ms utilizados.

1 EJEMPLO 1 (Anlisis de Componentes Principales):


Determinacin de la relacin entre la esperanza de vida media y el nivel de desarrollo econmico y sanitario de un conjunto de pases. Punto de partida: Un estudio planteado a nivel internacional desea establecer la relacin entre la esperanza de vida media de un conjunto de pases y su nivel de renta y desarrollo sanitario. El analista dispone de 25 variables homogneas del nivel de desarrollo sanitario de cada pas (gasto farmacutico de distintos tipos, instalaciones hospitalarias por 1000 hb de distintos tipos, mdicos por 1000 hb de distintas especialidades, ....). As mismo dispone de otras 25 variables relativas al desarrollo econmico (PIB real por Hb, tasa de actividad, tasa de paro, capacidad de eneudamiento.....). Mediante un anlisis de componentes principales el analista puede reducir el conjunto inicial de 50 variables a unos cuantos Componentes Principales, aprovechando las posibles redundancias existentes en datos referidos a cuestiones similares.

ANLISIS FACTORIAL

C APROPIADO CUANDO......
Se desea obtener una medicin de una serie de factores de naturaleza inobservables, aprovechando para ello la dependencia o relacin comn de un conjunto de variables en torno a estos factores. El anlisis requiere datos expresados en variables de intervalo.

1 EJEMPLO 1 (Anlisis Factorial): Aproximacin de la


capacidad de abstraccin, la capacidad de clculo y la memoria de los alumnos universitarios. Punto de partida: Partiendo de los expedientes de ms de 10.000 alumnos de se extraen las notas correspondientes a 15 materias en las que las proporciones de capacidad de clculo, capacidad de abstraccin y memoria intervienen de en distintas proporciones. Observando las presencia o ausencia de correlaciones entre las distintas notas (comunalidad) pueden identificarse los mecanismos de causalidad en las calificaciones. Un anlisis detallado de la composicin factorial revelar que los mimos se corresponden con la capacidad de abstraccin, capacidad de clculo y memoria. Las denominadas "puntuaciones factoriales" permitirn medir, a partir de las notas iniciales, las tres capacidades comentadas tanto en los elementos que componen la muestra como en nuevos elementos.

1 EJEMPLO 2 (Ayuda SPSS) (Anlisis Factorial): Qu


actitudes subyacentes hacen que las personas respondan a las preguntas de una encuesta poltica de la manera en que lo hacen? Punto de partida: Examinando las correlaciones entre los elementos de la encuesta se deduce que hay una superposicin significativa entre los diversos subgrupos de elementos (las preguntas sobre los impuestos tienden a estar correlacionadas entre s, las preguntas sobre temas militares tambin estn correlacionadas entre s...., y as sucesivamente). Con el anlisis factorial, se puede investigar el nmero de factores subyacentes y, en muchos casos, se puede identificar lo que los factores representan conceptualmente. Adicionalmente, se pueden calcular las puntuaciones factoriales para cada encuestado, que pueden utilizarse en anlisis subsiguientes. Por ejemplo, es posible construir un modelo de regresin logstica para predecir el comportamiento de voto basndose en las puntuaciones factoriales.

: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - REDUCCIN DE DATOS - FACTORIAL El anlisis factorial implica, generalmente el desarrollo de tres etapas: Anlisis Preliminar de viabilidad, Extraccin Factorial y Rotacin factorial. El SPSS ofrece una gran flexibilidad para afrontar cada una de estas tres etapas.
Conjunto de variables fundamental, a partir para las que se desea encontrar factores subyacentes comunes. Posibilidad de limitar el anlisis a un nmero limitado de casos segn una variable de seleccin. Ofrece varios mtodos de rotacin tanto ortogonales como oblicuos. Permite obtener y guardar el valor de los factores a partir de las variables originales

Facilitan el anlisis preliminar de las variables y sus correlaciones de cara a anticipar la viabilidad del anlisis.

Permite especificar el mtodo de extraccin, el nmero de factores a extraer as como las iteraciones mximas a considerar en la extraccin.

ANLISIS CONJUNTO

C APROPIADO CUANDO......
Se desea establecer en que medida los distintos atributos de un objeto inciden en su seleccin preferente por parte de un conjunto de individuos. El anlisis conjunto intentar aproximarse a la estructura subyacente de seleccin determinando la importancia relativa de cada atributo as como la combinacin de los mismos que resulte ms atractiva.

1 EJEMPLO 1 (Anlisis Conjunto): Diseo de un nuevo


producto farmacutico. Punto de partida: Un laboratorio farmacutico desea lanzar al mercado un nuevo analgsico de tipo genrico. Su experiencia en el mercado le ha permitido identificar una serie de variables que condicionan la preferencia por una u otra marca como: precio, formato de presentacin (grageas, sobres, ...), sabor del preparado, rapidez de accin, cantidad de contenido, tipo de publicidad asociada (facultativo, medios comunicacin,..). El anlisis conjunto permitir ordenar de modo relativo cada uno de esos atributos, para ponderar su importancia relativa en la seleccin del producto y establecer la combinacin ptima para el nuevo producto.

ANLISIS CLUSTER

C APROPIADO CUANDO......
Se desea aprovechar la informacin relativa a un conjunto de variables para clasificar a un grupo amplio de sujetos y objetos en subgrupos de mxima homogeneidad intergrupal y mayor heterogeneidad entregrupal. El anlisis cluster no debe confundirse con el discriminante, ya que ese ltimo tiene por objeto explicar una clasificacin establecida a priori mientras que el anlisis cluster intenta, precisamente, generar esa clasificacin a partir de un nico grupo global.

1 EJEMPLO 1 (Anlisis Cluster): Anlisis geogrfico de los


perfiles de sanitarios de la poblacin. Punto de partida: A fin de planificar convenientemente la poltica preventiva, desde el Ministerio de Sanidad de un determinado pas se plantea la necesidad de dibujar el "mapa sanitario", dividiendo el total del territorio en zonas de caractersticas sanitarias homogneas, no necesariamente similares a las divisiones poltico administrativas. Se sospecha que una diferenciacin de este tipo puede tener sentido en la medida en que algunos de los factores de riesgo ms importantes tienen relacin con la distribucin geogrfica: factores demogrficos, factores ambientales (clima, calidad del agua,...), dietticos culturales entre otros. As pues, se recopila informacin relativa a la incidencia de un conjunto de enfermedades frecuentes como: enfermedades cardiovasculares (cardiopatas coronarias y accidentes cerebro - vasculares), distintos tipos de cncer (mama, colon y recto, pulmn, cervix y endometrio..), enfermedades de transmisin area (gripe, legionelosis, tuberculosis...), enfermedades de transmisin entrica (botulismo, diarreas vricas, salmonelosis, shigelosis, colera., poliomielitis, hepatitis A...), enfermedades transmitidas por contacto (ttanos, brucelosis, toxoplasmosis...) y enfermedades de transmisin sexual (sida, sfilis, ...) La utilizacin de todos estos indicadores dividir a la poblacin total en grupos homogneos desde el punto de vista sanitario. Determinar la viabilidad geogrfica de esta agrupacin ser un paso posterior en el anlisis.

: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - CLASIFICAR - CONGLOMERADOS JERRQUICOS
Conjunto de variables utilizadas para la segmentacin Variable que etiquetar cada individuo u objeto a clasificar. El SPSS ofrece la posibilidad de aplicar la metodologa CLUSTER a variables, en lugar de objetos o sujetos.

Guarda el grupo de pertenencia de objetos Permite elaborar el clsico Dendograma o grfico de agrupacin secuencial de los objetos analizados.

El anlisis Cluster viene condicionado sensiblemente por el mtodo de aglomeracin utilizado, la medida de distancia empleada. El SPSS ofrece una amplia variedad de mtodos.

ANLISIS MULTIDIMENSIONAL NO MTRICO

C APROPIADO CUANDO......
Se desea comprender la estructura subyacente a de un conjunto de medidas de similitud o distancia entre objetos o sujetos. Para ello se asignan las observaciones disponibles de esos sujetos u objetos a posiciones especficas en un espacio conceptual (normalmente de dos o tres dimensiones) de modo que las distancias entre los puntos en el espacio concuerden al mximo con las disimilaridades observadas. En muchos casos, las dimensiones de este espacio conceptual son interpretables y se pueden utilizar para comprender mejor los datos. El escalamiento multidimensional puede tambin aplicarse a valoraciones subjetivas de disimilaridad entre objetos o conceptos.

: PROCEDIMIENTO SPPS
MEN: ESTADSTICA - ESCALAS - ESCALAMIENTO MULTIDIMENSIONAL
Conjunto de matrices de variables a partir de las cuales se calcularn las distancias entre objetos o sujetos para explicar sus similaridades Permite controlar nivel de media, condicionalidad, dimensiones y mtodo escalamiento. el la las el de

Normalmente, los datos de partida son matrices que reflejan la similitud o diferencia percibida entre los objetos o sujetos que ocupan cada fila y columna (los datos son distancias). No obstante, si no se han creado las matrices a partir de las variables en bruto, el SPSS las crea conforme a una medida de distancia elegida por el usuario (crear distancias a partir de datos).

BIBLIOGRAFA
I. BIBLIOGRAFA GENERAL

BERSTEIN, I. (1998): Applied Multivariate Analysis Aplications Academic Press. Inc. New York. BISQUERA ALZINA, R. (1989): Introduccin conceptual al anlisis multivariable: un enfoque informtico con los paquetes SPSS-X, BMDP, LISREL y SPAD. Vol. 1, PPU, S.A.

COOLEY, W. y LOHNES, P. (1971): Multivariate Data Analysis. New York: John Wiley Cop. CUADRAS, C.M. (1991): Mtodos de Anlisis Multivariante. Barcelona: PPU (2 edicin). DANIEL PEA SANCHES DE RIVERA. (1989): Estadstica modelos y mtodos, 1. Fundamentos. Alianza Editorial. DILLON y GOLDSTEIN. (1984): Multivariate Analysis. Methods and applications. John Wiley & Sons. FERRN ARANAZ, M. (1996): SPSS para Windows, Programacin y Anlisis Estadstico. McGraw-Hill Interamericana, Madrid. FLURY, B., RIEDWYL, H. (1988): Multivariate statistics: a practical approach. Chapman and Hall. HAIR, ANDERSON, TATHAM Y BLACK (1998): Multivariate Data Analysis. Fifth Edition, Prentice-Hall, New Jersey. HAIR, J.F.et al (1999): Anlisis Multivariante. 5 edicin, Prentice-Hall Iberia, Madrid. JOHNSON R. (1994): Applied multivariate statistical analysis. Madison, thurd. de. pp. 459-491. RICHARD A. JOHNSON, DEAN W. WICHERN. (1981): Applied multivariate statistical analysis. Pretince-Hall. RICHARD A. JOHNSON, DEAN W. WICHERN. (1992): Applied Multivariate statistical anlysis. Third edition, Prentice-Hall International, Inc. SNCHEZ CARRIN, J.J. (1995): Manual de Anlisis de Datos. Alianza Editorial. URIEL, E. (1985): Anlisis de datos: Series temporales y anlisis multivariante. Editorial AC, Coleccin plan nuevo, Madrid. URIEL, E. (1995): Anlisis de datos: Series temporales y anlisis multivariante. Editorial AC.

VICNS OTERO, J. (1997): Obtencin y Anlisis de datos. Facultad de Econmicas UAM. WILLIAM, R. DILLON and MATTHEW GOLDSTEIN. (1984): Multivariate Analysis. Methodos and Applications.

II. BIBLIOGRAFA ESPECFICA POR TEMAS


II.1.- TABULACIN CRUZADA

BISHOP, Y.M.M.; FIENBERG, S.E. Y HOLLAND, P.W. (1977): Discrete Multivariante Massachusetts. Analysis. Theory and Practice. MIT PRESS, Cambridge,

EVERITT, B. (1977): The analysis of Contingency Tables. London Chapman and Hall. FIENBERG, S.E. (1987): The analysis of cross-classified categorical data. Cambridge, Mass.: M.I.T. Press. GOKHALE, D.V. (1978): The information in contingency tables. New York: M. Dekker. GOKHALE, D.V. y KULLBACK, S. (1978): The information in contingency tables Statistics: Textbooks and monographs. Vol 3. De. Owen. Minton y Pratt, Nueva York. HABERMAN, S.J. (1978): Analysis of qualitative data. Introductors topics and New developments. New York. Academic Press. MAXWELL, A.E. (1971): Analysing qualitative data. Harmondsworth: Penguin Books, 1970. OBRIEN, L.G. (1989): The statistical anlysis of contingency table designs. Newcastle Upon Tyne: Newcastle University. RUZ-MAYA, L. (1990): Metodologa Estadstica para el Anlisis de Datos Cualitativos. Centro de estudios Sociolgicos. Madrid. SNCHEZ CARRIN, J.J. (1984): Anlisis de tablas de contingencia. Coleccin monografas n 105. CIS. SPSS. Crosstabulation and measures of association, Cap. 10, Statistics Guide. UPTON, GRAHAM, J.G. (1978): The analysis of cross-tabulated data. John Wiley Cop.

II.2.- ANLISIS DE LA VARIANZA. ANLISIS DE LA COVARIANZA.

COCHRAN, W.G. (1976): Analysis of Covariance: Its nature and uses. Biometrics, Vol. 13.

ELLEN R. GIRDEN. (1992): ANOVA. Repeated Measures. SAGE University Paper. GIRDEN, E. (1992): Anova: repeated measures. Newbury Park, 1992-VI. INVERSEN, G.R. y NORPORTH, H. Analysis of Variance. Quantitative Applications in the Social Sciences N 1. A Sage University Paper Series. RUZ-MAYA. (1986): Mtodos Estadsticos de Investigacin. I.N.E. RUPERT G. MILLER, JR. (1985): Beyond ANOVA, basics of applied statistics. John Wiley & Sons. WILDT, A.R. y ATHOLA, O. (1978) Analysis of Covariance. Quantitative Applications in the Social Sciences. A Sage University Paper Series.

II.3.- ANLISIS DISCRIMINANTE.

CUADRAS,

ABELLANO.

(1973):

Anlisis

Estadstico

Multivariante.

Representacin Cannica de Funciones. Resumen de tsis. V.A. Barcelona. PETER A. LACHEMBRUCH. (1975): Discriminant analysis. Hoguer Press. VISAUTA VINACUA, B. (1997): SPSS para Windows. McGraw-Hill. WILLIAM R. KLECKA. (1976): Discriminant analysis. Series: Quantitative Applications in the Social Sciencies.

II.4.- MODELOS DE ELECCIN DISCRETA: LOGIT Y PROBIT.

ANDERSON, SIMON P.; ANDRE; THISSE, JACQUES FRANCOIS. (1992): Discrete choice theory of product differentiation. Cambridge and London: MIT Press, pag. XVIII, 423.

BESANKO D., PERRY M.K. and SPADY R.H. (1990): The logical model of monopolistic competition: brand diversity. The Journal of Industrial Econmics, Vol. 38, n 4 June.

GRACIA DIEZ, M. (1988): Modelos con variable dependiente cualitativa y de variacin limitada. Cuadernos econmicos, ICE, nmero 39, 1988/2. GRACIA DEZ, M. (1991): A Qualitative Analysis of Unemployment in Spain. Universidad Complutense de Madrid, pag. 159-73. JOHNSTON, J. (1989): Mtodos de econometra. Ed. Vicens Vives, Barcelona. JUDGE G. (1980): The theory and practice of econometrics. Jhon Wiley and sons, New York. LEHRER, EVELYN L. (1992): The impact of Children on Married Womens Labor Supply: Black-White Differentials Revisited. Journal of Human Resources; 27 (3), pag. 422-44.

Micro TSP, Users Manual. (1986) Mc Graw Hill. MILLN J.A., RUIZ P. (1987): Modelos logit de adopcin de innovaciones en invernaderos de Almera. Investigacin agraria, 2 (2). NOREEN, E. (1988): An empirical comparison of probit and OLS Regression hypothesis tests. Journal of accounting research. Vol. 26, N 1 Spring, USA. NOVALES, A. (1988): Econometra. McGraw Hill, Madrid. RODRGUEZ GUTIERREZ, CSAR. (1992): La adquisicin de capital humano: Un modelo terico y su contrastacin. Investigaciones Econmicas. 16 (2). Pg. 305-16. TIM FUTING LIAO. (1988): Interpreting probability model. Logit, Probit and other generalizad Linear Models. Series: Cuantitative Applications in the Social Sciences. A Sage University papers series.

VICNS, J. (1995): Modelos con variables cualitativas dicotmicas. (Nov. 1995). Instituto L.R.Klein.

II.5.- CORRELACIN CANNICA.

LEVINE. (1977): Canonical Analysis and Factor Composition. Beverly Hills: Sage Publications. Sage University Papers.

II.6.- COMPONENTES PRINCIPALES Y ANLISIS FACTORIAL.

APARICIO PREZ F. (1988): La difcil realizacin de un anlisis de componentes principales mediante los programas estadsticos ms difundidos en el mercado. Estadstica espaola, Vol. 30, n 117, Madrid.

BATISTA FOQUET Y MARTNEZ ARIAS. (1989): Anlisis multivariante. Anlisis en componentes principales. Coleccin ESADE. Editorial Hispano Europea, S.A. pp.49-54.

HARMAN, HARRY. (1976): Modern factor analysis. Chicago University Press. HARMAN, HARRY. (1980): Anlisis Factorial Moderno. Editorial Salts. HOTTELING, H. (1993): Analysis of a Complex of Statistical Variables into Principal Components. J. Educ. Psycology, n 24. JRESKOG, K.G., KLOVAN, J.E., REYMENT, R.A. (1976): Geological Factor Analysis. Elsevier Scient. Pub. Co. KIM JAE-ON y MUELLER, CHARLES. (1978): Factor analysis, Statistical Methods and Practical Issues. Sage University Paper. KIM JAE-ON y MUELLER, CHARLES. (1978): Introduction to factor analysis. Sage University Paper.

MARTN REYES, G. (1978): Algunos mtodos multivariantes y sus apllicaciones en economa. Cuadernos de CC. Econmicas y Empresariales, n 2, Universidad de Mlaga.

NARVAIZA SOLS, J.L. (1981): El anlisis Factorial: Exposicin Grfica e Intuitiva. Boletn de Estudios Econmicos, n 36 (113), Deusto, 1981, 259-285. PEARSON, K. (1901): On Lines and Planes of Closest Fit to Systems of Points in Space. Phil. Magasine, Ser. 6, 2. SPEARMAN, C. (1904): General Intelligence Objetively Determined and Measured. American Journal of Psycology, n 15. THURSTONE, L.L. (1931): Multiple Factor Analysis. Psychol. Rev., n 38, 1931, 406.

II.7.- ANLISIS CLUSTER.

ALDENDERFER, M.S. Y R.K. BLASHFIELD. (1984): Cluster Analysis. A Sage University Paper, Series: Quantitative Aplications in the Social Sciences. N 07-044. ANDERBERG, M.R. (1973): Cluster Analysis for Applications. Academic Press, New York. BOGGIS, J.G. y J. HELD. (1971): Cluster Analysis. A New Tool in Electricity. Journal of the Market Research Society (England), 13. Abril, 1971, pp. 49-68. DAY, N.E. y R.M. HEELER. (1971): Using Cluster Analysis to Improve Marketing Experiments. Journal of Marketing Research, 8. Agosto, 1971, pp. 340-47. EVERITT, B.S. (1978): Graphical Techniques for Multivariate Data. London: Heineman Educational. EVERITT, B.S. (1993): Cluster Analysis. Tercera Edicin. Edward Arnold. A division of Hodder & Stoughton. JAIN, A.K. y R.C. DUBES. (1988): Algorithms for Clustering Data Prentice Hall, Englewood Clidd, N.J. USA. JAMBU, M. (1983): Cluster Anlysis and Date Analysis. Amsterdam: North-Holland. JARDINE, N. y R. SIBSON. (1971): Mathematical Taxonomy, John Wiley & Sons, Chichester. RAO, C.R. (1952): Advanced Statistical Methods in Biometrics Research. John Wiley & Sons, New York. ROMESBURG, H.CH. (1984): Cluster Analysis for Research. Belmont, Calif: Lifetime Learning Publications. TRYON, R.C.- DANIEL, E.B. (1970): Company. N.Y. Cluster Analysis. MC. Graw Book

SOKAL, R.R. y P.H.A. SNEATH. (1973): Numerical Taxonomy. W.H. Freeman & Co. San Francisco. WARD, Jr. J.H.; HOOK, M.R. (1963): Aplication of Hierachical Grouping Procedure to a Problem of Grouping Profiles. Educ and Psychology Measurement 23, n 1 Pgs. 69-82.

II.8.- ANLISIS CONJUNTO.

GIL LUEZAS,C. (1985): Una aplicacin del anlisis conjunto a la segmentacin de mercado: la segmentacin componencial. Investigacin y Marketing. GREEN, P.E. and YORAM WIND. (1975): New away to measure consumers judgements. Harward Business Review (Julu-August 1975). GREEN, P.E. and V. SRINIVASAN. (1978): Conjoint analysis in consumer research: issues and outlook. Journal of consumer research. (September 1978). GREEN, P.E. (1990): Conjoint Analysis in Marketing: new development With Implications for Research an Practice. Journal of Marketing, Octubre 1990. HELSEN, K., SHANDLER, B. Y GREEN, P. (1988): Conjoint Internal Validity Under Alternative Profile Presentations. Journal of Consumer Research, Vol. 5. KRIEGER A. Y GREEN, P. (1990): Segmenying Markets With Conjoint Analysis. Journal of Marketing. Vol. 55. MARTN DVILA, M. (1987): Como diagnosticar lo que los consumidores desean realmente: El anlisis conjunto. (Marzo 1987). MGICA GRIJALBA, J.A. (1989): Los modelos multiatributo en marketing. El anlisis conjunto. IPMARK (n 324/16-28 Febrero 1989). MGICA GRIJALBA, J.M. (1989): El anlisis conjunto. IPMARK. n 324.

MGICA GRIJALBA, J.M. (1989): El anlisis conjunto (y II). Alternativas, problemas y limitaciones. IPMARK (n 326/16-31 Febrero 1989). RIVERO, P. Y FERNNDEZ, R. (1993): Anlisis de variables cualitativas: Modelos LOGIT y PROBIT, Universidad Autnoma de Madrid. VARELA GONZLEZ, J.A. (1985): El anlisis conjunto, una tcnica al servicio de la investigacin comercial. Economa y Empresa. WITTINK, D. Y CATTIN, P. (1981): Alternative Estimation Methods for Conjoint Analysis: A Monte Carlo Study. Journal of Marketing Research, Vol XVIII.

También podría gustarte