Está en la página 1de 148

2023 - I

Técnicas
estadísticas
multivariantes
Sesión
4
Dra. Mónica Ysela Saenz Tolay
TEMARIO
Técnicas
multivariadas
Creación de
nuevas
Técnicas variables
dirigidas por
Métodos variables /
multivariados por individuos

2023 - I
Clasificación de países

2023 - I
En la actualidad, los investigadores manejan datos de
variables múltiples.

Se define el concepto de Unidad Experimental (UE)


INTRODUCCIÓN como cualquier objeto o elemento que mide o evalúa.

Ejemplos de UEs: personas, animales, campos,


terrenos, compañías, árboles, granos de trigo, países.

Se obtienen datos de variables múltiples cuando se mide o


evalúa más de un atributo o característica de cada UE.

2023 - I
MÉTODOS MULTIVARIADOS – Inicio
❑En 1904, Charles Spearman en su intento por medir la
inteligencia (a través de un conjunto de habilidades y
conocimientos), en términos de un factor general (factor g) y
un factor específico (s) propio de cada test, dio lugar a la
Teoría Factorial de la Inteligencia.

❑En 1938, Louis Leon Thurstone propuso su teoría de la


inteligencia de múltiples factores: fluidez de palabras, factor
verbal, factor numérico, razonamiento inductivo, memoria,
visualización espacial y velocidad de percepción.

2023 - I
Individuo, sujeto
u objeto de
investigación

Son técnicas estadísticas que analizan X1, X2, X3, X4, X5 , … Xp variables
en simultáneo
2023 - I
MÉTODOS MULTIVARIADOS

❑Objetivo primario: Resumir grandes cantidades de datos por medio de


pocos parámetros → Subyace: “Simplificación”.

❑Aplicado también para encontrar relaciones entre:

a) Las variables respuesta

b) Las unidades experimentales

c) Tanto las variables respuesta como las unidades experimentales

2023 - I
MÉTODOS MULTIVARIADOS
❑Aplicado también para encontrar relaciones entre:

En exámenes de lectura, ortografía, aritmética y


ciencias → “inteligencia global”
a) Las variables respuesta

Contenido nutricional de cereales: gramos de grasa,


b) Las unidades experimentales proteína, carbohidratos y sodio en cada producto.

c) Tanto las variables respuesta como las unidades experimentales

2023 - I
• Definir el problema de Investigación
• Objetivos; diseño e hipótesis
1° fase • Técnica Multivariante a utilizar.

• Desarrollo del Proyecto de Análisis


2° fase

• Evaluación de los supuestos de la Técnica Multivariante


3° fase

FASES PRINCIPALES DE • Estimación del modelo Multivariante.


UNA INVESTIGACIÓN 4° fase • Valoración del Ajuste del Modelo.

MULTIVARIANTE

• Interpretación de los valores Teóricos


5° fase

• Validación del Modelo Multivariante


6° fase

2023 - I
Análisis Multivariado
Análisis inicial de datos

Antes de comenzar con el análisis multivariado, es esencial realizar un examen exhaustivo


de los datos.

La detección de problemas ocultos en las matrices de datos supondrá un gran avance en la


consecución de resultados lógicos y consistentes.

Es fundamental inspeccionar:

▪ Analizar si es relevante para el


análisis, obtener los datos
Análisis de datos ausentes perdidos.
(missing values) ▪ Determinar si la información que
falta puede ser completada.
▪ Sustituir los datos por valores
estimados.
2023 - I
Datos perdidos o Valores faltantes

Son aquellos que no constan debido a cualquier acontecimiento, como por ejemplo errores
en la transcripción de los datos o la ausencia de disposición a responder a ciertas
cuestiones de una encuesta.
Los datos pueden faltar de manera aleatoria o no aleatoria.

TRATAMIENTO

▪ De casos completos o eliminación por lista.


▪ Selección por variables.
❖ Sustitución por la media.
▪ Métodos de imputación. ❖ Sustitución por constante.
❖ Por regresión

2023 - I
Métodos de imputación
▪Sustitución por la media.
Sustituye el valor ausente por la Media de los valores válidos.

Desventajas:
✓ Dificulta la estimación de la Varianza.
✓ Distorsiona la verdadera distribución de la variable,
✓ Distorsiona la correlación entre variables dado que añade valores constantes.

▪Sustitución por constante.


Sustituye los valores ausentes por constantes cuyo valor viene determinado por razones
teóricas o relacionadas con la investigación previa.

Presenta los mismos inconvenientes que la sustitución por la Media, y solo debe ser utilizado si
hay razones para suponer que es más adecuado que el método de la media.

Estimar los valores ausentes mediante Análisis de Regresión.


▪Por regresión. Inconvenientes:
- Incrementa artificialmente las relaciones entre variables.
- Hace que se subestime la Varianza de las distribuciones.
- Asume que las variables con datos ausentes tienen relación de alta magnitud con las
otras variables.

2023 - I
Datos perdidos o valores faltantes- Ejemplo

El siguiente conjunto de datos consta de tres variables y diez casos:

El conjunto es incompleto porque en la variable 1 faltan los datos


de los casos 5 y 8.
En la variable 2 faltan los datos de los casos 1, 5, 7 y 9.
En la variable 3 faltan los datos de los casos 3, 7 y 9.

Estadísticos descriptivos (Medias) obtenidos excluyendo los casos


incompletos (selección por lista):

2023 - I
Datos perdidos o valores faltantes- Ejemplo

El siguiente conjunto de datos consta de tres variables y diez casos:

Casos excluidos por variables (por parejas):

La Media de la variable 1 obtenida con los datos de la variable 1 que tienen


pareja en la variable 2 es 5.2.

2023 - I
Datos perdidos o valores faltantes- Ejemplo

El siguiente conjunto de datos consta de tres variables y diez casos:

Por sustitución de la media de valores completos en cada


variable:

2023 - I
Datos perdidos o valores faltantes- Ejemplo

El siguiente conjunto de datos consta de tres variables y diez casos:

Por regresión estimando los valores ausentes en base a su


relación con otras variables:

Finalmente, es el
especialista el que debe
decidir el valor estimado
que “mejor” reemplace al
dato perdido.

2023 - I
Tabla de datos

2023 - I
¿Cuáles son los pasos para la aplicación de las
técnicas multivariantes?
1 2 3 4 5 6 7 8

1: Elección de la UE
2: Elección de la variables
3: Construcción de una MBD
4: Cálculo de un coeficiente de similitud para cada par posible de UE
5: Construcción de una matriz de similitud
6: Aplicación de una técnica multivariante
7: Identificación de patrones
8: Inferencia acerca de las UE

2023 - I
2023 - I
Variables: Proceso Productivo de miel, azúcar y alcohol
¿Podemos identificar algunas Variables?

Miel:
X1: % de azúcar
X2: Densidad
X3: Cantidad de minerales
X4: Cantidad de antranilato de metilo (Aroma)

Azúcar:
X1: % de sacarosa
X2: % de humedad
X3: % de azucares volubles
X4: % de polarización
Alcohol:
X1: % de etanol
X2: % de dióxido de azufre
Vector: (X1, X2, X3, …, Xn) X3: % de acido acético

2023 - I
Técnicas dirigidas por las variables y dirigidas por los individuos.

Por las variables Por los individuos


Relaciones entre las variables Relaciones entre las unidades
respuesta experimentales
Matrices de correlación Análisis discriminante

Análisis de componentes principales Análisis de agrupación

Análisis multivariado de la varianza


Análisis por factores
(MANOVA)

Análisis de regresión

Análisis de correlación canónica

2023 - I
Creación de nuevas Variables

❖Es frecuente la utilidad de crear nuevas variables para


cada unidad experimental, para compararse entre sí con
más facilidad.
❖Estas nuevas variables deben poseer propiedades
deseables.
❖Algunas técnicas empleadas son:
- A. Componentes Principales
- A. Por Factores
- A. Correlación Canónica
- A. Discriminante Canónico
- A. Variables Canónicas

2023 - I
Técnicas Multivariadas – Panorama General
❖PCA - Análisis de Componentes Principales: Criba los datos de variables múltiples,
creando nuevas variables “Componentes Principales”. Detecta outliers.

❖FA – Análisis por Factores: Crea nuevas variables que no están correlacionadas entre sí.
Las variables en un mismo subconjunto con alta correlación, las variables en
subconjuntos diferentes deben tener baja correlación.

❖DA – Análisis Discriminante: Clasifica a los individuos en 2 o más poblaciones definidas


de manera única. Establece reglas para clasificar en un solo grupo, con un alto grado de
certeza.

❖CDA – Análisis Discriminante Canónico: se crean nuevas variables para hacer más
sencillas las reglas de clasificación de los individuos.

2023 - I
Técnicas Multivariadas – Panorama General
❖CA – Análisis por Agrupación: Clasifica individuos pero sin saber con anterioridad de
dónde surgen las observaciones (exploratorio).

❖MANOVA – Análisis Multivariado de la Varianza: Generalización del análisis univariado


de la varianza (ANOVA). Objeciones: poblaciones diferentes en algunas variables pero
en otras no, a más variables analizadas mayor error tipo I. Recomendable: poblaciones
diferentes sobre un número grande variables respuesta.

❖CVA – Análisis de Variables Canónicas: Se crean nuevas variables en conjunción con el


MANOVA.

❖CCA – Análisis de Correlación Canónica: Generalización de la correlación múltiple. Se


divide a las variables respuesta en 2 grupos. La asignación de la variable a cada grupo
debe ser por su naturaleza. Se espera identificar si la variable de un grupo puede
predecir a las del otro grupo.
2023 - I
Lista cruzada de métodos multivariados y tipos de problemas.
Técnica Multivariada
Tipo de problema
PCA FA DA CDA CA MANOVA CVA CCA
Exploración de la
A veces Indudablemente Nunca Nunca Nunca Nunca Rara vez A veces
relación entre variables
Cribado de datos Indudablemente A veces Nunca Nunca A veces Nunca Nunca Nunca
Creación de nuevas
Lo hace Lo hace No lo hace Lo hace No lo hace No lo hace Lo hace Lo hace
variables
Predicción de ser
No lo hace No lo hace Lo hace Lo hace Lo hace No lo hace No lo hace No lo hace
miembro de un grupo
Comparación de medias
Posiblemente Posiblemente Rara vez Rara vez No lo hace Lo hace Lo hace No lo hace
grupales
Comparación de grupos
Posiblemente Posiblemente Nunca Nunca Nunca Nunca Nunca Indudablemente
de variables
Verificación de
Indudablemente Posiblemente Nunca Nunca Indudablemente Nunca Nunca Nunca
agrupamientos
Reducción de la
Indudablemente Indudablemente Nunca Indudablemente Nunca Nunca Indudablemente Indudablemente
dimensionalidad
Creación de variables
No es probable Por lo común Nunca Posiblemente Nunca Nunca Posiblemente No es probable
significativas

2023 - I
Clasificación de técnicas Multivariantes:
• Las variables a evaluar están divididas en dos grupos las variables dependiente s
Métodos de y las variables independientes.
• El objetivo de los métodos de dependencia consiste en determinar si el conjunto
dependencia de variables independientes afecta al conjunto de variables dependientes y de
qué forma.

• Estos métodos no distinguen entre variables dependientes e


Métodos de independientes
interdependencia • Su objetivo consiste en identificar qué variables están relacionadas,
cómo lo están y por qué

Métodos • Aquí las variables están divididas en dos grupos el de las variables dependientes y el de
las independientes.
• El objetivo de estos métodos es analizar, no sólo como las variables independientes

estructurales afectan a las variables dependientes, sino también cómo están relacionadas las variables
de los dos grupos entre si

2023 - I
Clasificación de técnicas Multivariantes:

2023 - I
El tipo de relación que está
siendo examinadas es de:

CLASIFICACIÓN DE LAS
TÉCNICAS
MULTIVARIANTES

Dependencia Interdependencia.
La estructura de la
relación es entre:

Variables. Casos. Objetos.


Varias Variables una Variable Componentes Principales Análisis Clúster Escalamiento
dependientes dependiente Análisis Factorial
multidimensional.
Modelos loglineal.
Análisis de
Correspondencias
Métricas.
Manova.
Correlación Métrica. No métrica.
Canónica. Regresión Múltiple. Análisis Discriminante.
Análisis de supervivencia. Modelos de Regresión Logística.
Análisis Conjunto.

2023 - I
Evaluación de supuestos multivariantes

Prueba de Normalidad • Debe cumplir para todas las variables en estudio.


multivariante • La prueba de Mardia (Kurtosis y Asimetría Multivariante)

• Examina si las relaciones entre las variables en el estudio son


Prueba de Linealidad lineales. Caso contrario, se debe conseguir la linealidad.
de las variables • Utiliza la Prueba de Esfericidad de Bartlett (Matriz de correlaciones
de Pearson).

• Busca una dispersión por igual de las variables en estudio.


Homocedasticidad • Se utiliza la Prueba de Box. También puede ayudar a evaluar
este supuesto el diagrama de cajas y bigote.

2023 - I
Análisis gráficos de datos multivariantes

Gráfico de cajas y bigotes


Grafico de dispersión por pares
Gráfico de caras de Chernoff
Gráfico de curvas de Andrews

2023 - I
Análisis discriminante

2023 - I
Análisis discriminante
Objetivos:

1. Separación o discriminación entre grupos, tratando de


encontrar sus diferencias entre dos o más grupos a través de
una función discriminante (generalmente lineal) de las
variables de identificación.
2. Predicción o asignación de un objeto o individuo
(inferencia).

Variables:
Variable dependiente: categórica (puede ser dummy)
Variable Independientes: Cuantitativas (deben cumplir
normalidad multivariante)
33
2023 - I
Análisis discriminante

Se cuenta con una tabla de datos de dimensiones nxp con n el número


de individuos ubicados en las filas y p el número de variables ubicadas
en las columnas.

Se trata de reducir la dimensión


de esta tabla en las columnas, de
tal manera que al proyectar la
nube de puntos en el espacio, los
individuos del mismo grupo se
encuentren cerca entre si y los de
grupos diferentes estén lo más
separado posible.

34
2023 - I
Análisis discriminante

La puntuación discriminante para el i-ésimo individuo en la


función discriminante será

𝑑𝑠𝑖 = 𝐵𝑠1 𝑋𝑖1 + ⋯ + 𝐵𝑠𝑝 𝑋𝑖𝑝 + 𝐵𝑠0

Con base en estas puntuaciones discriminantes se clasifica el individuo i (del cual


se sabe de antemano a que grupo pertenece). El porcentaje de correctamente
clasificado será un índice de efectividad de las funciones discriminantes.

Para ello se tratará de elegir unas funciones tales que no sólo clasifiquen
correctamente a los clientes activos sino que garanticen que un cliente potencial,
sea adecuadamente clasificado.

35
2023 - I
Análisis discriminante

Lambda de Wilks.

Mide las desviaciones de cada grupo respecto a las desviaciones totales.


Si su valor es pequeño o tiende a cero, indica que los grupos son
diferentes y por lo tanto las variables seleccionadas discriminan
adecuadamente los grupos.

36
2023 - I
Ruta: Analizar- clasificar- Análisis discriminante

2023 - I
La variable dependiente se
pasa a la casilla variable de
agrupación

2023 - I
2023 - I
Click , para activar los
estadísticos que queremos
reportar

2023 - I
2023 - I
Resultados AD

Sig <0.05 , indica que


se Rechaza Ho , por
lo tanto los grupos
son diferentes en
cada una de la
variables

Desde el punto de vista práctico, la


Ho: Los grupos son iguales comparación de grupos (tanto la Prueba de
H1: Los grupos son diferentes Box como la de Wilks) solo se utiliza para
saber si se puede realizar el análisis
2023 - I discriminante
Verificar que los valores
deben estar cercanos
entre sí

Sig > 0.05 , indica


que se Aceptar Ho

El resultado de la prueba hace que no se rechace la


igualdad de matrices de varianzas‐covarianzas,
dado que Sig = 0,849 > 0,05, concluyendo que los
dos grupos tienen la misma matriz de
Ho: Las matrices de covarianzas poblacionales son
varianzas‐covarianzas (no hay un grupo más
iguales variable que otro). Se acepta la hipótesis nula
H1: Las matrices de covarianzas poblacionales son
diferentes
2023 - I
Podemos determinar que
la función 1 , con una auto
valor de 1.716 , explica el
100% de la variabilidad

Cuanto más cerca de 0 se


encuentre lamda mayor es
el poder discriminante de
las variables consideradas,
y cuanto más cerca de 1
menor es el poder
discriminante.

La variable con mayor valor , Así la variable


indica que tiene mayor Patrimonio_Neto tiene una
importancia o poder al influencia mucho mayor que
definir a que grupo la variable Deuda_Pendiente
pertenece

2023 - I
Estadística de clasificación

D ‐ C = 1,036 x X1 ‐ 0,932 x X2 ‐ 3,524

F I= 0,777 Patrimonio_Neto + 1,296 Deuda_Pendiente ‐ 5,876


F II = 1,813 Patrimonio_Neto + 0,364 Deuda_Pendiente ‐ 9,396

2023 - I
Se observa que las probabilidades de
pertenencia al propio grupos son elevadas
excepto en el cliente cumplidor 13, que se
clasifica erróneamente en el grupo de los
fallidos y que por añadidura tiene una
probabilidad muy baja de pertenencia (0,1367)
al grupo de los cumplidores.
2023 - I
Análisis varianza – manova

El Análisis Multivariado de Varianza (MANOVA) es una extensión del


ANOVA

Si bien solo tratamos con una variable dependiente en ANOVA,


MANOVA representa múltiples variables dependientes a la vez

Quiere saber si hay diferencias medias entre grupos en múltiples DV;


es adecuado para evaluar DV relacionados, por ejemplo, evaluar la
depresión, la ansiedad y el estrés en grupos de una sola vez

48
2023 - I
Análisis varianza – manova - mancova
Objetivos:

1. Comparar o evaluar diferencias entre grupos, tratando de


encontrar sus diferencias entre dos o más grupos

Variables:

Variable dependiente: Cuantitativas de nivel intervalar o de


razón.
Variable Independientes: Categórica ( La asignación y
selección de los grupos debe ser aleatoria)
49
2023 - I
Ejemplo

Interesa saber si el método utilizado en un proceso


afecta calificación de uso y calidad. Para probar esto, se
reclutó a una muestra de participantes y se asignó al
azar cada método. Luego se consultó a cada participante
que califique la facilidad de uso y la calidad.

2023 - I
Calilificación Calificación de
Método Planta de fácil uso calidad
Método 1 Planta A 5 6
Método 1 Planta A 6 5
Método 1 Planta A 5 6
Método 1 Planta A 6 7
Método 1 Planta A 6 8
Método 1 Planta A 5 6
Método 1 Planta A 4 5
Método 1 Planta A 3 4
Método 1 Planta A 4 5
Método 1 Planta A 5 4
Método 1 Planta A 4 5
Método 1 Planta A 3 4
Método 2 Planta A 6 7
Método 2 Planta A 7 6 Verificar archivo
Método 2 Planta A 8 5 completo en Excel
… … … ..

2023 - I
SUPUESTOS

Debe verificarse los siguientes supuestos antes del análisis:


▪ Normalidad (Shapiro Wilk)
▪ Valores atípicos univariados (diagramas de caja)
▪ Valores atípicos multivariados (distancias de Mahalanobis)
▪ Multicolinealidad (Correlación)
▪ Linealidad (diagrama de dispersión)
▪ Homogeneidad de matrices de varianza-covarianza (Box’s M)

Puede cumplir con otros criterios antes o durante la recopilación de datos, como la
independencia de las observaciones (cada participante solo puede participar en el estudio una
vez) y garantizar un tamaño de muestra adecuado en cada celda (a través de un análisis de
poder)

52
2023 - I
1. Normalidad

2023 - I
2. Valores atípicos univariados
La suposición de valores atípicos univariados se puede probar mediante la inspección de
diagramas de caja.

Marcar aquí

2023 - I
2. Valores atípicos univariados
Observamos valores atípicos

Se debe verificar el
motivo o descartar

Observamos valores atípicos

2023 - I
3. Valores atípicos multivariados
Esta suposición se puede probar a través de las distancias de Mahalanobis

2023 - I
3. Valores atípicos multivariados
Aqui se ingresa al contrario em
independientes colocamos
Calificación de fácil uso y
calificación de calidad

Elegimos
Mahalanobis
3. Valores atípicos multivariados
Según las Estadísticas de Residuos, El valor
Máximo de la Distancia de Mahalanobis =
8.629

Este valor es más alto que el valor de chi-


cuadrado en df = 2, α = .05, que es 5.991

Esto indica que si hay valores atípicos


multivariados

*Para los análisis se consulta el valor crítico en la tabla Chi-Square; df = número


de variables dependientes, en este caso son 2 variables dependientes
2023 - I
4. Multicolinealidad
La suposición de multicolinealidad se puede comprobar mediante un
análisis de correlación

En la tabla de Correlaciones, las variables


dependientes están correlacionados pero no
demasiado fuertes, r <0.7

Por lo tanto, no hay violación de la


multicolinealidad.

2023 - I
5. Linealidad Pasamos las variables
dependientes a cada
Esta suposición se puede probar usando diagramas de dispersión. eje

2023 - I
5. Linealidad

En el archivo de salida, haga doble


clic en el diagrama de dispersión para
abrir el editor de gráficos
Haga clic en Elementos -> Ajustar
línea en subgrupos
Asegúrese de que 'Lineal' esté
seleccionado como Método de ajuste

Si las líneas son aproximadamente


rectas, concluimos que se cumple el
supuesto de linealidad.

2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)

MANOVA también se lleva a cabo utilizando estos pasos

2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)

2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)

Para satisfacer esta suposición, el valor M de Box debe ser no


significativo(Sig > 0.05)

En este caso indica que el supuesto no ha sido violado

2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)

En este caso indica que el


supuesto no ha sido violado
Sig>0.05

2023 - I
Finally… MANOVA

Mirando la Lambda de Willks, F(2,59) = 15,871 p < .001.


Hay una diferencia estadísticamente significativa en la calificación de uso y calificación de la calidad entre los
tipos de métodos.

2023 - I
Análisis de correspondencias

67
2023 - I
ANÁLISIS DE CORRESPONDENCIA

Es una técnica multivariante de interdependencia que se utiliza para


examinar gráficamente las relaciones entre dos conjuntos de variables o
categorías, generalmente con valores absolutos en un espacio bidimensional,
denominado mapa perceptual.

Se basan en la asociación entre objetos y un conjunto de características


descriptivas o atributos, especificados por el investigador.

Por ejemplo: En investigación de mercados, se puede estar interesado en


relacionar por un lado los productos, las empresas, las marcas y en el otro
lado suele ser los atributos , las características.

2023 - I
Análisis de correspondencia

Objetivo:

Analiza relaciones entre variables categóricas y trabaja con las


frecuencias o matrices de valores absolutos.
Analizar las semejanzas y diferencias entre las categorías de una misma
variable.
Analizar la relación de semejanzas y diferencias entre las categorías de las
distintas variables incluidas en el análisis

Variables:

Variables : Categóricas (nominal, ordinal)

69
2023 - I
Análisis de correspondencia

Si se relaciona 2 variables Correspondencia


categóricas
simple

Si se relaciona más de 2 variables Correspondencia


categóricas múltiple.

Estudios de preferencias de consumo en Investigación de Mercados.

Estudios que buscan tipologías de individuos respecto a variables cualitativas (comportamiento de


especies en biología, patrones de enfermedades en medicina, perfiles psicológicos, etc.).

Estudios de posicionamiento de empresas a partir de las preferencias de consumidores.

70
2023 - I
Ejemplo 1. Atributos
Correspondencia simple
Facilida
Rapidez de Informaci Trato del Condicione d de
Empresas Precios Marcas entrega ón personal s de pago acceso
En un estudio sobre el mercado E1 16 6 20 11 28 21 21
de material eléctrico, se E2 17 15 20 13 25 21 21
entrevistó a una muestra de E3 18 18 23 12 25 20 21
E4 19 17 21 17 22 24 23
clientes de nueve empresas, con E5 16 27 29 20 30 27 26
el fin de determinar el E6 45 20 20 16 26 22 15
posicionamiento de dichas E7 15 2 18 15 24 18 16
empresas con respecto a siete E8 19 14 19 10 22 21 18
E9 18 53 25 44 26 24 21
atributos. Cada cliente tuvo que
asociar a cada atributo a una o
más empresas

2023 - I
Desarrollo del ejemplo 1 (Correspondencia simple) en SPSS

Ingresamos el
código y luego
el nombre de
la categoría

Ingresamos a
vista de
variables ,
para asignar
sus nombres

72
2023 - I
2023 - I
Click en
definir rango.,
ingresamos 1
y 9 por ser 9
empresas

2023 - I
2023 - I
Resultados AC

2023 - I
La proporción de la La D2 explica el 27.5% de
inercia, es la cantidad de la información, las 2
información contenida primeras dimensiones
en cada dimensión explican el 91.3% de la
información total

Mide la importancia de En resumen si son independientes


cada dimensión. A mayor habrá poca inercia y si son
inercia en las 2 primeras dependientes (están relacionadas)
dimensiones, representa habrá mucha inercia, es decir, mucha
mejor similitudes y dispersión
diferencias en las variables
2023 - I
La Inercia:
Es el estadístico que mide la dispersión de la nube de puntos. La inercia es el
promedio de las distancias de los distintos puntos a su centro de gravedad,
estando cada distancia ponderada por la masa del punto correspondiente.

La inercia total es igual al cociente entre el estadístico Chi-cuadrado de la tabla,


y el total de las observaciones.

Es decir, si las variables son muy dependientes, tanto las filas como las columnas
serán distintas entre sí, mientras que si son independientes serán parecidas

2023 - I
Refleja el grado en que el atributo ha influido
a la formación de la dimensión.
En este caso la marca es el atributo más
importante para la dimensión 1 y el precio
para la dimensión 2

Los atributos que tienen mejor inercia, juegan


un rol importante en la explicación de cada
dimensión.
2023 - I
Proximidad entre dos
atributos, quiere decir
que tienen perfiles
parecidos, están
fuertemente
intercorrelacionados.

Ejemplo

Trato de personal y
condiciones de pago.

Empresa 1 y 7, en este
caso podría
interpretarse que
tienen las mismas
fortalezas y
debilidadades.
Proximidad entre dos
atributos y empresas,
existe una fuerte
asociación

Ejemplo

La empresa 9 y el
atributo marca o la
empresa 6 y el
atributo precio.
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF

La siguiente tabla muestra el contenido nutricional de los productos más


conocidos de la marca de Hamburgesas McDonalds ®
(fuente: https://www.zonadiet.com/tablas/mcdonalds.htm)
Tabla 1: Contenido nutricional de productos McDonalds®

2023 - I
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF

2023 - I
Publicaciones en Scopus que se asocien con términos de
ingeniería y multivariado

2023 - I
Artículo: https://www.scielo.org.mx/pdf/tca/v9n5/2007-2422-tca-9-05-33.pdf
Muestreo utilizado: https://www.ub.edu/fem/docs/protocols/fem_%20prot_cast_2012.pdf

2023 - I
ANÁLISIS FACTORIAL
▪ Técnica que consiste en resumir la información contenida en una matriz
de datos con V variables.
▪ En el A. F. se identifican un reducido número de factores F, siendo el
número de factores menor que el número de variables.
▪ Los factores “F” representan a las variables originales, con una pérdida
mínima de información.

2023 - I
2023 - I
TIPOS DE ANALISIS FACTORIAL

EXPLORATORIO CONFIRMATORIO
En el análisis de tipo
Se caracteriza porque no se confirmatorio, los factores
conoce apriori el número de Análisis Factorial están fijados a priori,
factores, y es en la aplicación utilizándose contrastaciones
empírica donde se determina empíricas para su
este número. corroboración.
A.F. A.F.
Exploratorio Confirmatorio

A.F. de
A.F. Clásico Componentes
Principales

2023 - I
Variables Variables
No Observables/
Observables originales
Factores Latentes

• El análisis factorial es una técnica multivariante de reducción de X1


datos, que sirve para encontrar grupos homogéneos de
variables, a partir de un conjunto de variables. F1
X2
• Esos grupos homogéneos se forman con las variables que más
se correlacionan entre sí, y procurando, que estos grupos sean
independientes entre sí. X3
• El análisis factorial es, por tanto, una técnica de reducción de la
dimensionalidad de los datos.
X4
• Su propósito último consiste en buscar el numero mínimo de
dimensiones capaces de explicar el máximo de información F2
contenida en los datos. X5

• En este análisis todas las variables del análisis cumplen el


mismo papel, es decir, todas son independientes en el sentido X6
de que no existe a priori una dependencia conceptual de una
variable sobre otra.
2023 - I
Variables observadas

X1 X2 X3 X4 X5 X1 X1 X1 X1 X1

Uso de la matriz de correlaciones

F1 F1 F1

2023 - I
APLICACIONES
• Marketing: Factores asociados de clientes cuando van a comprar un coche
• Marketing: Características asociadas a las marcas de pastas de dientes
• Ciencias Sociales:
Actitudes: Escalas de Likert
Opiniones: Escala de Likert
Conductas: Escala de Likert
Emociones: Escala de Likert
• Educación: Factores asociados a la resistencia de docentes a innovaciones tecnológicas.
• Psicología:
Factores asociados al grado de inteligencia de una persona.
Factores asociados a la personalidad de una persona?
• Economía:
Factores asociados al desarrollo de un país
Ratios financieros a tener en cuenta a la hora de evaluar la labor desarrolla por una empresa

2023 - I
APLICACIONES

2023 - I
APLICACIONES

2023 - I
APLICACIONES

Validación Psicométrica

Validación de constructo

2023 - I
PASOS EN EL ANALISIS FACTORIAL

1.Examen de la matriz de correlaciones de todas las variables (conocida


habitualmente como matriz R).
2.Extracción de los factores necesarios para representar los datos.
3.Rotación de los factores con objeto de facilitar su interpretación.
Representación gráfica.
4.Calcular las puntuaciones factoriales de cada individuo .

2023 - I
1° PASO: Examen de la matriz de correlaciones
Requisito : Las variables deben estar altamente correlacionadas. Los
métodos que pueden utilizarse son:

✓ El determinante de la matriz de correlaciones:


✓ Test de Esfericidad de Bartlett:
✓ Índice KMO de Káiser-Meyer-Olkin
✓ Correlación Anti-imagen.
✓ Correlación Múltiple

2023 - I
✓ El determinante de la matriz de correlaciones:
• Un determinante muy bajo indicará altas intercorrelaciones entre las variables, pero no debe
ser cero, pues esto indicaría que algunas de las variables son linealmente dependientes.

✓ Test de Esfericidad de Bartlett:



Ho: R = I Ausencia de correlación significativa entre las variables
Ho: | R| = 1.

• La formula correspondiente asume la siguiente expresión:

Donde:
n =tamaño muestral.
p =número de variables.
gl = p ( p-1)/2 Ln=logaritmo neperiano.
R =matriz de correlaciones.

2023 - I
✓ Indice KMO de Kaiser-Meyer-Olkin:

Valores bajos del índice KMO desaconsejan la utilización de Análisis Factorial. Como baremo para
interpretar el índice KMO podría tomarse según Kaiser:

o.9 <= KMO <= 1 muy bueno


0.8 <= KMO < 0.9 meritorio
0.7 <= KMO < 0.8 mediano
0.6 <= KMO < 0.7 mediocre
0.5 <= KMO < 0.6 bajo
Donde: rij= correlación simple.
KMO < 0.5 inaceptable
aij= correlación parcial.
✓ Correlación Anti-imagen:
Es el negativo del coeficiente de correlación parcial. Si existe factores comunes, esperamos que los
coeficientes de correlación parcial sean pequeños, para que sea razonable la aplicación del Análisis Factorial.

2023 - I
✓ Medida de Adecuación de la muestra (MSA): Valores bajos desaconsejan el uso del
análisis factorial.

✓ Correlación Múltiple: Deberá ser alto, sobre todo si la técnica a utilizar es un análisis
factorial.

2023 - I
2023 - I
ANÁLISIS CLUSTER JERÁRQUICO Y NO JERÁRQUICO
• Método multivariado cuyo propósito es el
de agrupar objetos o individuos, de tal
manera que los objetos que se clasifican y
pertenecen a un grupo o cluster son muy
similares (homogeneidad dentro del grupo
o cluster), mientras que son muy disímiles
aquellos objetos que pertenecen a grupos
diferentes (heterogeneidad entre grupos o
cluster).

2023 - I
ANÁLISIS CLÚSTER
Las distancias
Las distancias son maximizadas
son minimizadas Inter-cluster
Intra-cluster

2023 - I
Características del Análisis clúster
El AC, es un método de interdependencia y como una técnica
exploratoria

El AC, se utiliza para agrupar unidades elementales y también


para agrupar variables

El AC, utiliza métricas e índices de similitud como una medida de


distancia.

2023 - I
Requisitos del Análisis clúster

Que las variables


Ausencia de No correlación Número de
no estén medidas
valores atípicos entre las variables no muy
en unidades
(outliers). variables. elevado.
diferentes.

2023 - I
Clasificación de las técnicas Clúster

Clustering
algorithms

Basado en Clúster Basado en Basado en


….
particiones jerárquico densidad modelos

2023 - I
... Introducción: Tipos de Distancia
Variabilidad y distancias
• Distancias de Minkowsky

• Distancia euclídea

• Distancia euclídea ponderada

• Distancia de Mahalanobis

• Distancia promedio

2023 - I
2023 - I
ESCALAMIENTO MULTIDIMENSIONAL

2023 - I
2023 - I
2023 - I
Matrices a ingresar (estímulos)
• Matriz de similaridad: percepción sobre las similitudes de los objetos.
• Matriz de distancia: Mediciones de atributos que se toman en la comparación de objetos.
• Matriz de correlaciones: Cuando se trata de encontrar similitud entre variables

Tipos de Escalamiento Multidimensional Clásicos

2023 - I
2023 - I
Medidas de bondad de ajuste

2023 - I
2023 - I
ANÁLISIS DISCRIMINANTE

2023 - I
Es una técnica que nos permite identificar qué características o variables diferencian a dos
o más grupos, cuantas son necesarias para alcanzar una mejor clasificación y ayudarnos a
generar una función discriminante más eficiente y precisa para clasificar una nueva
observación.

Análisis Discriminante de dos grupos:


• Técnica de análisis discriminante en la que la variable de criterio
tiene dos categorías.

Análisis Discriminante múltiple:


• Técnica de análisis discriminante en la que la variable de criterio
abarca tres o más categorías.

2023 - I
2023 - I
Similitudes y diferencias entre el ANOVA, la regresión y el análisis discriminante:

Análisis
ANOVA Regresión
Discriminante

SIMILITUDES

Número de Variables dependientes Una Una Una

Número de variables independientes Múltiples Múltiples Múltiples

DIFERENCIAS

Naturaleza de la variable dependiente Métrica Métrica Categórica

Naturaleza de la variable independiente Categórica Métrica Métrica

2023 - I
Pruebas preliminares

2023 - I
Pruebas preliminares

2023 - I
Pruebas preliminares

2023 - I
2023 - I
Esquema metodológico del ADL

2023 - I
Se consideran los datos recogidos sobre 32 cráneos en el Tibet.

T1: Modelo discriminante


D2=f(x1,x2,x3,x4,x5)

T2: Modelo discriminante

X: Longitud, Anchura, Altura, A.cara,Anchocara?

2023 - I
D1: Plataneros
D2:Traileros
ASALTOS Y ROBOS EN EEUU
D3:Mocheros
Asalto X1:Participant X2: Horario X3: Tiempo X4: Tipo Y
D4: Raperos
es
1 1

2 1 Modelo discriminante

3 1
D1=f(x1,x2,x3,x4)
4 2 D2=f(x1,x2,x3,x4)
D3=f(x1,x2,x3,x4)
5 2
D4=f(x1,x2,x3,x4)
6 2

7 3

8 3
Nuevo asalto
9 4

10 4 x1,x2,x3,x4,x5

2023 - I
ANÁLISIS CONJUNTO

2023 - I
Análisis conjunto
Supongamos un escenario, en el que un especialista en marketing de productos evalúa el impacto de las
características individuales en la participación de mercado estimada o los ingresos por ventas.

2023 - I
Objetivos prácticos del análisis conjunto

2023 - I
Análisis conjunto
Es un método descomposicional que
El Análisis Conjunto es una técnica
estima la estructura de las preferencias
estadística de la dependencia utilizada
de un consumidor (por ejemplo:
para analizar la relación lineal o no lineal
mediante utilidades parciales,
entre una variable dependiente (o
ponderaciones de importancia, puntos
endógena) generalmente ordinal (aunque
ideales, etc.), una vez obtenidas sus
también puede ser métrica) y varias
evaluaciones globales de un conjunto de
variables independientes (o exógenas) no
alternativas preespecificadas en términos
métricas.
de niveles de diferentes atributos.

El Análisis Conjunto constituye una


técnica multivariante sencilla, potente y
flexible para evaluar y analizar las
preferencias manifiestas de los
consumidores por productos y servicios.
La base conceptual para medir las
preferencias de los sujetos es la utilidad.

2023 - I
Conceptos fundamentales

2023 - I
Usos del análisis conjunto

2023 - I
Áreas de aplicación del análisis conjunto

2023 - I
Etapas del análisis conjunto

2023 - I
Creación de estímulos

2023 - I
Creación de estímulos, y utilidades

2023 - I
2023 - I
2023 - I
2023 - I
Resultados en R

2023 - I
Resultados en R

2023 - I
Análisis canónico
El análisis de correlación canónica puede verse como una extensión lógica de un análisis de regresión múltiple. Recordemos que el
análisis de regresión múltiple implica una única variable de pendiente métrica y varias variables métricas independientes.

Mientras que la regresión múltiple implica una única variable dependiente, la correlación canónica implica múltiples
variables dependientes.

El principio subyacente es desarrollar una combinación lineal de cada conjunto de variables (tanto independientes como
dependientes) para maximizar la correlación entre los dos conjuntos.

El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que
proporcione la correlación única máxima entre el conjunto de variables dependientes y el conjunto de variables independientes.

2023 - I
Ejemplo:
• 1°relacionadas con el ejercicio y la salud.
• Por un lado, se tienen variables asociadas al ejercicio, observaciones como la velocidad de subida en un
escalador, la rapidez con la que se puede correr una determinada distancia, la cantidad de peso levantado
en el press de banca, el número de flexiones por minuto, etc. Por otro lado, hay variables que intentan
medir la salud general, como la presión arterial, los niveles de colesterol, los niveles de glucosa, el índice
de masa corporal, etc. Se miden dos tipos de variables y las relaciones entre las variables de ejercicio y las
variables de salud son de interés.
• 2° Considere las variables que se miden sobre la salud ambiental y las toxinas ambientales.
• Se pueden medir una serie de variables de salud ambiental como las frecuencias de las especies sensibles,
la diversidad de las especies, la biomasa total, la productividad del medio ambiente, etc. y se mide un
segundo conjunto de variables sobre las toxinas ambientales, como las concentraciones de metales
pesados, pesticidas, dioxinas, etc.
• 3°Considere un grupo de representantes de ventas,
• sobre los que hemos registrado varias variables de rendimiento de ventas junto con varias medidas de
aptitud intelectual y creativa. Es posible que queramos explorar las relaciones entre las variables de
rendimiento de ventas y las variables de aptitud.

2023 - I
2023 - I
2023 - I
Simuladores para Ingeniería y Arquitectura

https://www.ucv.edu.pe/noticias/ucv-adquiere-simuladores-para-estudiantes-de-ingenieria-y-arquitectura/
https://www.youtube.com/watch?v=YJK3ndNSwo8&t=48s

2023 - I
Muchas gracias
2023 - I

También podría gustarte