Está en la página 1de 27

TEMA I

CONTEXTUALIZACIÓN Y REVISIÓN GENERAL


DE LAS TÉCNICAS MULTIVARIANTES
LECTURA OBLIGATORIA

Algunas cuestiones previas. En Rial, A. y Varela, J. (2008). Estadística


Práctica para la Investigación en Ciencias de la Salud. Coruña:
Netbiblo. Páginas 3-11.

Introducción al Análisis Multivariante. En Rial, A. y Varela, J. (2008).


Estadística Práctica para la Investigación en Ciencias de la Salud.
Coruña: Netbiblo. Páginas 189-199.

Modelos Multivariantes 2
ALGUNOS CONCEPTOS PREVIOS

 Tipos de Variables y Niveles de medida


 Proceso de datos y Análisis de datos
 Estadística y niveles de análisis
 Validez Interna, Externa y Ecológica
 Error Tipo I () y Error Tipo II ()
 Significación estadística y significación práctica
 Contraste estadístico
 Supuestos para el análisis de datos
 Pruebas paramétricas y no paramétricas
 Matriz (tipos de matrices)
 Correlación y covarianza
 Coeficientes de correlación
 Regresión Modelos Multivariantes 3
EL ANÁLISIS ESTADÍSTICO

La ESTADÍSTICA como un cuadro de herramientas. 3


niveles de análisis:
 Nivel 1: UNIVARIADO. Resumir e ilustrar la información contenida
en una matriz de datos

 Nivel 2: BIVARIADO. Contrastar hipótesis, comparar el


comportamiento de dos o más grupos o analizar la relación entre
pares de variables

 Nivel 3: MULTIVARIANTE. Elaborar modelos, ecuaciones o


funciones que permitan explicar unas variables a partir de otras o
identificar variables latentes para resumir la información
Modelos Multivariantes 4
La selección de la Prueba Estadística

¿Qué queremos hacer? ¿en qué Nivel de Análisis nos


situamos?
 Nivel 1: UNIVARIADO. Estadísticos descriptivos: índices de tendencia
central, de variabilidad, de distribución, posición, etc.

 Nivel 2: BIVARIADO. Contrastes paramétricos vs. no paramétricos,


análisis de correlaciones.

 Nivel 3: MULTIVARIANTE. Técnicas multivariantes de Dependencia


(Regresión Lineal, Regresión Logística, Discriminante, Anova,
Manova..) y de Interdependencia (Factorial, Correspondencias,
Cluster,...)
Modelos Multivariantes 5
Importancia de lo MULTIVARIANTE

Nadie duda de que el comportamiento humano y el comportamiento


de los grupos o de las organizaciones, es algo complejo y sobre el
que confluyen multitud de factores.

Los científicos sociales son conscientes de que gran parte de los


fenómenos se explican por la intervención de múltiples variables.

Los investigadores necesitan herramientas estadísticas adecuadas


para comprobar cómo distintas variables se combinan a la hora de
explicar los comportamientos objeto de estudio.

 La mejor forma de representar el conocimiento que poseemos de la


realidad y de las leyes que la rigen es la elaboración de modelos.
Modelos Multivariantes 6
ANÁLISIS MULTIVARIANTE

Surge como una forma de hacer asimilable al entendimiento humano gran


cantidad de datos que hay en la realidad, sintetizando los aspectos más
relevantes y perdiendo el mínimo de información posible.

Útil porque permite descubrir estructuras, establecer relaciones o contrastar


hipótesis globales, reflejando los mecanismos que actúan para determinar la
conducta humana de una manera más adecuada, ya que está
multideterminada.

KENDALL lo define como “una extensión del análisis univariable y bivariable


al análisis simultáneo de más de dos variables en un muestreo de
observaciones”. Es una definición meramente instrumental, ya que no recoge
el enfoque de la MODELIZACIÓN ESTADÍSTICA. ¿OTRAS?

Modelos Multivariantes 7
MODELOS

¿Qué es un MODELO?. Una representación formal,


estructurada, concisa y clara de la realidad, que permite recoger
y explicar sus propiedades y las leyes que la rigen, posibilitando
la realización de predicciones.

Modelos matemáticos. Son formulaciones matemáticas de una


situación, que permiten hacer predicciones en torno a la
distribución de los acontecimientos.

Los MODELOS ESTADÍSTICOS son un tipo concreto de modelos


matemáticos elaborados a partir de los datos de una muestra.
Tienen un componente de inferencia.
Modelos Multivariantes 8
MODELOS ESTADÍSTICOS

 Los Modelos Estadísticos contienen una parte sistemática


(S) y una parte aleatoria (A).
 La combinación de ambos componentes debe ser capaz
de reproducir el objeto de interés científico (Y).
 Aunque existen multitud de formas de vincular los dos
elementos de un modelo estadístico, la primera tentativa y
la más recurrida, por su simplicidad, es la forma lineal,
sumando ambos componentes:

Y SA
Modelos Multivariantes 9
MODELOS ESTADÍSTICOS

La parte aleatoria se suele denominar término de error y


acostumbra a representarse por la letra E. La parte sistemática S
suele incluir más de un elemento y, por ello, es frecuente que se
desglose en varios componentes sistemáticos, que representen
el efecto simultáneo de diversas variables. En consecuencia el
modelo puede expresarse del siguiente modo:
Y  f (X )  E
donde f (X) representa una combinación lineal de las variables
explicativas, por ejemplo, f(X) = 1 X1 + 2 X2, siendo 1 y 2
coeficientes que representan el peso, efecto o importancia
relativa de cada variable explicativa.
Modelos Multivariantes 10
En definitiva...
El investigador debe recurrir a un modelo concreto, de la complejidad
necesaria, para adaptarse al fenómeno real que pretende explicar.

La estrategia habitual, cuando el problema de investigación es


relativamente simple, es la de intentar explicarlo a través de un
modelo lineal. De no ser posible, para no encorsetar la realidad, se
recurre a un nivel mayor de complejidad en la formulación
matemática.

La determinación del modelo no es una cuestión irrelevante, sino tal


vez el mayor reto en el desarrollo de la investigación.

Además, el investigador debe optar siempre por el modelo más simple


y parsimonioso de los plausibles.
Modelos Multivariantes 11
ANÁLISIS MULTIVARIANTE

RAZONES DE LA EXPANSIÓN
1.Necesidades de investigación. La complejidad de los fenómenos
sociales requiere un tratamiento de datos multidimensional

2.Utilidad en numerosos campos

3.El desarrollo de la informática y los ordenadores. Posibilidad de realizar


cálculos complejos en pocos segundos

4.Abundante bibliografía aplicada (artículos, manuales y series


monográficas)

5.Proliferación de la investigación de mercados y los estudios de opinión


Modelos Multivariantes 12
ANÁLISIS MULTIVARIANTE

PELIGROS y PROBLEMAS:

 Olvido de la teoría
 Fácil estimación y difícil interpretación
 Incluir demasiadas variables (en contra de la parsimonia)
 Incumplimento de Supuestos
 Casos anómalos
 Tamaño muestral (arma de doble filo)
 Relevancia conceptual ≠ significación estadística

Modelos Multivariantes 13
TÉCNICAS MULTIVARIANTES
CONFUSIÓN TERMINOLÓGICA. Conceptos relacionados:
– Modelos, métodos, técnicas y análisis
– Multivariantes, multivariables, multivariados

Herramientas estadísticas que permiten analizar un conjunto de


variables de manera simultánea y poner a prueba distintos
modelos para explicar las relaciones entre ellas.

Muy diversas
– Regresión Lineal, Análisis Discriminante, Regresión logística, Análisis de
Varianza, Análisis Conjunto, Análisis de Supervivencia, Análisis de
Estructuras de Covarianza (Ecuaciones Estructurales), …
– Análisis Factorial, Análisis de Correspondencias, Análisis de
Conglomerados, Escalamiento Multidimensional, Análisis Log-Linear, …
Modelos Multivariantes 14
CLASIFICACIÓN
I.N. SHETH, 2 grandes preguntas:
 ¿Son unas variables dependientes de otras?
 ¿Cuáles son las propiedades de los datos?

2 grandes tipos:
Métodos de Dependencia: Regresión, Discriminante, Análisis
de Varianza, Análisis Conjunto
Métodos de Interdependencia :Cluster, Factorial,
Correspondencias, Escalamiento

Métodos métricos vs. no métricos

Modelos Multivariantes 15
Todas las técnicas
Multivariantes

NO ¿Algunas de las SÍ
variables son
dependientes de
otras?

Reciben el nombre de Reciben el nombre de


Métodos de Métodos de
Interdependencia Dependencia

 No se designa ninguna variable como si se  Se especifican una o más variables


hubiesen pronosticado mediante otras como si se hubiesen pronosticado (VD)
variables. Todas son tomadas como un mediante un conjunto de VI.
conjunto que interesa al investigador.
 Análisis de Regresión, Análisis
 Análisis Factorial, Análisis de Conjunto, Análisis Discriminante,
Conglomerados, Escalamiento Análisis de Varianza
Modelos Multivariantes 16
Multidimensional
REGRESIÓN LINEAL
OBJETIVO: Explicar o predecir una variable Criterio a partir de
una o varias variables predictoras
Y’ = a + b1X1 + b2X2 +…+ bnXn
EJEMPLO: Predecir las ventas a partir de la inversión en
publicidad, nº de tiendas, descuento aplicado, etc.

CONDICIÓN: Predictores y Criterio cuantitativos


 Simple o Múltiple
 Caso especial: predictores categóricos (Regresión con variables
ficticias: DUMMY)

Modelos Multivariantes 17
ANÁLISIS DISCRIMINANTE
OBJETIVO: Identificar funciones capaces de separar dos o más grupos
de individuos según sus puntuaciones en una serie de variables, con el fin
de localizar las variables que contribuyen en mayor grado a discriminar a
los sujetos de los diferentes grupos establecidos a priori. Técnica de
clasificación.
Y1 = X1 + X2 + X3 + ... + Xn
(no métrica) (métricas)
Obtener una función discriminante del tipo
Zjk = a + W1X1+ W2X2 + ... + WjXk

EJEMPLO: Predecir el voto a partir de los ingresos económicos, la edad…

CONDICIÓN: Predictores cuantitativos y Criterio categórico

 Simple o Múltiple (según el criterio sea dicotómico ó politómico)


Modelos Multivariantes 18
REGRESIÓN LOGÍSTICA
OBJETIVO: Pronosticar o explicar la pertenencia de los sujetos a un grupo,
a partir de sus puntuaciones en una serie de variables independientes o
predictores (similar al discriminante). Estimar la probabilidad de que se de
un evento.

EJEMPLO: Predecir si un alumno va a aprobar o no en función de las horas


de estudio, frecuencia de asistencia a clase, estatus socioeconómico

CONDICIÓN: VI métricas o no métricas y VD categórica

 Permite trabajar con predictores cualitativos y/o categóricos

 Logística Binaria y Multinomial

Modelos Multivariantes 19
ANÁLISIS CONJUNTO
OBJETIVO: Entender cómo conforman los individuos sus preferencias hacia
los objetos, estimando la importancia relativa que le conceden a cada uno
de los atributos o características de éste.

EJEMPLO: Explicar las preferencias de las amas de casa hacia las


diferentes opciones de LECHE

CONDICIÓN: VI categórica (atributos) y VD ordinal

 Muy utilizado en Marketing (diseño de nuevos productos, test de envases,


elasticidad del precio, Identificación del producto ideal, segmentación de
mercados, simulaciones, etc.)

Modelos Multivariantes 20
ANÁLISIS DE SUPERVIVENCIA
OBJETIVO: Predecir o modelizar el tiempo que transcurre hasta que ocurre
un evento, el RIESGO de…

EJEMPLO: Conocer la probabilidad de supervivencia de un grupo de


pacientes de una determinada patología en función del tratamiento
recibido, edad, etc.

CONDICIÓN (3 variables diferentes):

DE RESPUESTA: Tiempo de registro o seguimiento (cuantitativa)


DE CENSURA: Si ha ocurrido o no el evento (dicotómica)
EXPLICATIVAS: cuantitativa o cualitativa (Edad, Tratamiento, …)

Modelos Multivariantes 21
ANÁLISIS DE VARIANZA

OBJETIVO: Determinar e qué medida una VD está influenciada por una o


varias VI. Comprobar si existe un efecto significativo de un “Tratamiento”

EJEMPLO: Comprobar si existe un efecto significativo del consumo de


alcohol sobre el rendimiento atencional

CONDICIÓN: VI categórica (factores) y VD cuantitativa

 Ideal para experimentos


 Una o varias VÍAS (VI): ONEWAY ó ANOVA (Diseños factoriales)
 MANOVA (Análisis Multivariante de la Varianza: varias VD)

Modelos Multivariantes 22
ANÁLISIS FACTORIAL

OBJETIVO: Reducción de datos. A partir de la relación entre variables


observadas identificar FACTORES o variables latentes

EJEMPLO: Agrupar ítems de una escala y etiquetarlos bajo una misma


dimensión o factor de evaluación

CONDICIÓN: Variables cuantitativas

 Exploratorio (AFE): Componentes Principales


 Confirmatorio (AFC): LISREL, AMOS

Modelos Multivariantes 23
ANÁLISIS DE
CORRESPONDENCIAS
OBJETIVO: Reducción de datos. A partir de la relación entre variables
observadas identificar DIMENSIONES o variables latentes

EJEMPLO: Obtener un Mapa de Posicionamiento de los países turísticos


europeos, identificando las dimensiones subyacentes

CONDICIÓN: Variables cualitativas

 Un subtipo de Análisis Factorial, ideal para tablas de asociación (recogida


de datos rápida)
 Muy utilizado en Marketing

Modelos Multivariantes 24
ANÁLISIS DE
CONGLOMERADOS

OBJETIVO: Identificar grupos grupos homogéneos de sujetos u objetos a


partir de su puntuación en una serie de variables.

EJEMPLO: identificar segmentos de jóvenes en función de sus hábitos de


consumo

CONDICIÓN: Variables medidas en la misma escala

 También llamado Cluster Analysis


 Técnica de Clasificación
 Los grupos no son conocidos a priori

Modelos Multivariantes 25
ESCALAMIENTO
MULTIDIMENSIONAL

OBJETIVO: Utilizar las proximidades entre objetos para realizar una


representación espacial de los mismos, identificando las dimensiones
subyacentes

EJEMPLO: Representación espacial del mercado de la cerveza en Galicia

CONDICIÓN: Gran versatilidad en la recogida de datos (distintos tipos de


tareas)

 Gran Utilidad en MKT e investigación social

Modelos Multivariantes 26
OTRAS TÉCNICAS

Correlación Canónica: Analizar relaciones entre un grupo de variables


predictoras y un grupo de variables criterio.

Modelos de Ecuaciones Estructurales o de Estructuras de Covarianza:


Permite comprobar en qué medida un modelo teórico se ajusta a los datos
empíricos (Path Analysis). Programas estadísticos: LISREL y AMOS

Modelos Log-Lineales: Permite poner a pruebas modelos que postulan


distinto tipo de relaciones entre dos o más variables categóricas (Incluyen
los modelos LOGIT, PROBIT, etc.)

Modelos Multivariantes 27

También podría gustarte