Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Técnicas
estadísticas
multivariantes
Sesión
4
Dra. Mónica Ysela Saenz Tolay
TEMARIO
Técnicas
multivariadas
Creación de
nuevas
Técnicas variables
dirigidas por
Métodos variables /
multivariados por individuos
2023 - I
Clasificación de países
2023 - I
En la actualidad, los investigadores manejan datos de
variables múltiples.
2023 - I
MÉTODOS MULTIVARIADOS – Inicio
❑En 1904, Charles Spearman en su intento por medir la
inteligencia (a través de un conjunto de habilidades y
conocimientos), en términos de un factor general (factor g) y
un factor específico (s) propio de cada test, dio lugar a la
Teoría Factorial de la Inteligencia.
2023 - I
Individuo, sujeto
u objeto de
investigación
Son técnicas estadísticas que analizan X1, X2, X3, X4, X5 , … Xp variables
en simultáneo
2023 - I
MÉTODOS MULTIVARIADOS
2023 - I
MÉTODOS MULTIVARIADOS
❑Aplicado también para encontrar relaciones entre:
2023 - I
• Definir el problema de Investigación
• Objetivos; diseño e hipótesis
1° fase • Técnica Multivariante a utilizar.
MULTIVARIANTE
2023 - I
Análisis Multivariado
Análisis inicial de datos
Es fundamental inspeccionar:
Son aquellos que no constan debido a cualquier acontecimiento, como por ejemplo errores
en la transcripción de los datos o la ausencia de disposición a responder a ciertas
cuestiones de una encuesta.
Los datos pueden faltar de manera aleatoria o no aleatoria.
TRATAMIENTO
2023 - I
Métodos de imputación
▪Sustitución por la media.
Sustituye el valor ausente por la Media de los valores válidos.
Desventajas:
✓ Dificulta la estimación de la Varianza.
✓ Distorsiona la verdadera distribución de la variable,
✓ Distorsiona la correlación entre variables dado que añade valores constantes.
Presenta los mismos inconvenientes que la sustitución por la Media, y solo debe ser utilizado si
hay razones para suponer que es más adecuado que el método de la media.
2023 - I
Datos perdidos o valores faltantes- Ejemplo
2023 - I
Datos perdidos o valores faltantes- Ejemplo
2023 - I
Datos perdidos o valores faltantes- Ejemplo
2023 - I
Datos perdidos o valores faltantes- Ejemplo
Finalmente, es el
especialista el que debe
decidir el valor estimado
que “mejor” reemplace al
dato perdido.
2023 - I
Tabla de datos
2023 - I
¿Cuáles son los pasos para la aplicación de las
técnicas multivariantes?
1 2 3 4 5 6 7 8
1: Elección de la UE
2: Elección de la variables
3: Construcción de una MBD
4: Cálculo de un coeficiente de similitud para cada par posible de UE
5: Construcción de una matriz de similitud
6: Aplicación de una técnica multivariante
7: Identificación de patrones
8: Inferencia acerca de las UE
2023 - I
2023 - I
Variables: Proceso Productivo de miel, azúcar y alcohol
¿Podemos identificar algunas Variables?
Miel:
X1: % de azúcar
X2: Densidad
X3: Cantidad de minerales
X4: Cantidad de antranilato de metilo (Aroma)
Azúcar:
X1: % de sacarosa
X2: % de humedad
X3: % de azucares volubles
X4: % de polarización
Alcohol:
X1: % de etanol
X2: % de dióxido de azufre
Vector: (X1, X2, X3, …, Xn) X3: % de acido acético
2023 - I
Técnicas dirigidas por las variables y dirigidas por los individuos.
Análisis de regresión
2023 - I
Creación de nuevas Variables
2023 - I
Técnicas Multivariadas – Panorama General
❖PCA - Análisis de Componentes Principales: Criba los datos de variables múltiples,
creando nuevas variables “Componentes Principales”. Detecta outliers.
❖FA – Análisis por Factores: Crea nuevas variables que no están correlacionadas entre sí.
Las variables en un mismo subconjunto con alta correlación, las variables en
subconjuntos diferentes deben tener baja correlación.
❖CDA – Análisis Discriminante Canónico: se crean nuevas variables para hacer más
sencillas las reglas de clasificación de los individuos.
2023 - I
Técnicas Multivariadas – Panorama General
❖CA – Análisis por Agrupación: Clasifica individuos pero sin saber con anterioridad de
dónde surgen las observaciones (exploratorio).
2023 - I
Clasificación de técnicas Multivariantes:
• Las variables a evaluar están divididas en dos grupos las variables dependiente s
Métodos de y las variables independientes.
• El objetivo de los métodos de dependencia consiste en determinar si el conjunto
dependencia de variables independientes afecta al conjunto de variables dependientes y de
qué forma.
Métodos • Aquí las variables están divididas en dos grupos el de las variables dependientes y el de
las independientes.
• El objetivo de estos métodos es analizar, no sólo como las variables independientes
estructurales afectan a las variables dependientes, sino también cómo están relacionadas las variables
de los dos grupos entre si
2023 - I
Clasificación de técnicas Multivariantes:
2023 - I
El tipo de relación que está
siendo examinadas es de:
CLASIFICACIÓN DE LAS
TÉCNICAS
MULTIVARIANTES
Dependencia Interdependencia.
La estructura de la
relación es entre:
2023 - I
Evaluación de supuestos multivariantes
2023 - I
Análisis gráficos de datos multivariantes
2023 - I
Análisis discriminante
2023 - I
Análisis discriminante
Objetivos:
Variables:
Variable dependiente: categórica (puede ser dummy)
Variable Independientes: Cuantitativas (deben cumplir
normalidad multivariante)
33
2023 - I
Análisis discriminante
34
2023 - I
Análisis discriminante
Para ello se tratará de elegir unas funciones tales que no sólo clasifiquen
correctamente a los clientes activos sino que garanticen que un cliente potencial,
sea adecuadamente clasificado.
35
2023 - I
Análisis discriminante
Lambda de Wilks.
36
2023 - I
Ruta: Analizar- clasificar- Análisis discriminante
2023 - I
La variable dependiente se
pasa a la casilla variable de
agrupación
2023 - I
2023 - I
Click , para activar los
estadísticos que queremos
reportar
2023 - I
2023 - I
Resultados AD
2023 - I
Estadística de clasificación
2023 - I
Se observa que las probabilidades de
pertenencia al propio grupos son elevadas
excepto en el cliente cumplidor 13, que se
clasifica erróneamente en el grupo de los
fallidos y que por añadidura tiene una
probabilidad muy baja de pertenencia (0,1367)
al grupo de los cumplidores.
2023 - I
Análisis varianza – manova
48
2023 - I
Análisis varianza – manova - mancova
Objetivos:
Variables:
2023 - I
Calilificación Calificación de
Método Planta de fácil uso calidad
Método 1 Planta A 5 6
Método 1 Planta A 6 5
Método 1 Planta A 5 6
Método 1 Planta A 6 7
Método 1 Planta A 6 8
Método 1 Planta A 5 6
Método 1 Planta A 4 5
Método 1 Planta A 3 4
Método 1 Planta A 4 5
Método 1 Planta A 5 4
Método 1 Planta A 4 5
Método 1 Planta A 3 4
Método 2 Planta A 6 7
Método 2 Planta A 7 6 Verificar archivo
Método 2 Planta A 8 5 completo en Excel
… … … ..
2023 - I
SUPUESTOS
Puede cumplir con otros criterios antes o durante la recopilación de datos, como la
independencia de las observaciones (cada participante solo puede participar en el estudio una
vez) y garantizar un tamaño de muestra adecuado en cada celda (a través de un análisis de
poder)
52
2023 - I
1. Normalidad
2023 - I
2. Valores atípicos univariados
La suposición de valores atípicos univariados se puede probar mediante la inspección de
diagramas de caja.
Marcar aquí
2023 - I
2. Valores atípicos univariados
Observamos valores atípicos
Se debe verificar el
motivo o descartar
2023 - I
3. Valores atípicos multivariados
Esta suposición se puede probar a través de las distancias de Mahalanobis
2023 - I
3. Valores atípicos multivariados
Aqui se ingresa al contrario em
independientes colocamos
Calificación de fácil uso y
calificación de calidad
Elegimos
Mahalanobis
3. Valores atípicos multivariados
Según las Estadísticas de Residuos, El valor
Máximo de la Distancia de Mahalanobis =
8.629
2023 - I
5. Linealidad Pasamos las variables
dependientes a cada
Esta suposición se puede probar usando diagramas de dispersión. eje
2023 - I
5. Linealidad
2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)
2023 - I
6. Homogeneidad de matrices de varianza-covarianza (Box’s M)
2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)
2023 - I
6. Homogeneidad de matrices de varianza-
covarianza (Box’s M)
2023 - I
Finally… MANOVA
2023 - I
Análisis de correspondencias
67
2023 - I
ANÁLISIS DE CORRESPONDENCIA
2023 - I
Análisis de correspondencia
Objetivo:
Variables:
69
2023 - I
Análisis de correspondencia
70
2023 - I
Ejemplo 1. Atributos
Correspondencia simple
Facilida
Rapidez de Informaci Trato del Condicione d de
Empresas Precios Marcas entrega ón personal s de pago acceso
En un estudio sobre el mercado E1 16 6 20 11 28 21 21
de material eléctrico, se E2 17 15 20 13 25 21 21
entrevistó a una muestra de E3 18 18 23 12 25 20 21
E4 19 17 21 17 22 24 23
clientes de nueve empresas, con E5 16 27 29 20 30 27 26
el fin de determinar el E6 45 20 20 16 26 22 15
posicionamiento de dichas E7 15 2 18 15 24 18 16
empresas con respecto a siete E8 19 14 19 10 22 21 18
E9 18 53 25 44 26 24 21
atributos. Cada cliente tuvo que
asociar a cada atributo a una o
más empresas
2023 - I
Desarrollo del ejemplo 1 (Correspondencia simple) en SPSS
Ingresamos el
código y luego
el nombre de
la categoría
Ingresamos a
vista de
variables ,
para asignar
sus nombres
72
2023 - I
2023 - I
Click en
definir rango.,
ingresamos 1
y 9 por ser 9
empresas
2023 - I
2023 - I
Resultados AC
2023 - I
La proporción de la La D2 explica el 27.5% de
inercia, es la cantidad de la información, las 2
información contenida primeras dimensiones
en cada dimensión explican el 91.3% de la
información total
Es decir, si las variables son muy dependientes, tanto las filas como las columnas
serán distintas entre sí, mientras que si son independientes serán parecidas
2023 - I
Refleja el grado en que el atributo ha influido
a la formación de la dimensión.
En este caso la marca es el atributo más
importante para la dimensión 1 y el precio
para la dimensión 2
Ejemplo
Trato de personal y
condiciones de pago.
Empresa 1 y 7, en este
caso podría
interpretarse que
tienen las mismas
fortalezas y
debilidadades.
Proximidad entre dos
atributos y empresas,
existe una fuerte
asociación
Ejemplo
La empresa 9 y el
atributo marca o la
empresa 6 y el
atributo precio.
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF
2023 - I
ANÁLISIS GRÁFICO DE DATOS
MULTIVARIADOS CON R:
CARITAS DE CHERNOFF
2023 - I
Publicaciones en Scopus que se asocien con términos de
ingeniería y multivariado
2023 - I
Artículo: https://www.scielo.org.mx/pdf/tca/v9n5/2007-2422-tca-9-05-33.pdf
Muestreo utilizado: https://www.ub.edu/fem/docs/protocols/fem_%20prot_cast_2012.pdf
2023 - I
ANÁLISIS FACTORIAL
▪ Técnica que consiste en resumir la información contenida en una matriz
de datos con V variables.
▪ En el A. F. se identifican un reducido número de factores F, siendo el
número de factores menor que el número de variables.
▪ Los factores “F” representan a las variables originales, con una pérdida
mínima de información.
2023 - I
2023 - I
TIPOS DE ANALISIS FACTORIAL
EXPLORATORIO CONFIRMATORIO
En el análisis de tipo
Se caracteriza porque no se confirmatorio, los factores
conoce apriori el número de Análisis Factorial están fijados a priori,
factores, y es en la aplicación utilizándose contrastaciones
empírica donde se determina empíricas para su
este número. corroboración.
A.F. A.F.
Exploratorio Confirmatorio
A.F. de
A.F. Clásico Componentes
Principales
2023 - I
Variables Variables
No Observables/
Observables originales
Factores Latentes
X1 X2 X3 X4 X5 X1 X1 X1 X1 X1
F1 F1 F1
2023 - I
APLICACIONES
• Marketing: Factores asociados de clientes cuando van a comprar un coche
• Marketing: Características asociadas a las marcas de pastas de dientes
• Ciencias Sociales:
Actitudes: Escalas de Likert
Opiniones: Escala de Likert
Conductas: Escala de Likert
Emociones: Escala de Likert
• Educación: Factores asociados a la resistencia de docentes a innovaciones tecnológicas.
• Psicología:
Factores asociados al grado de inteligencia de una persona.
Factores asociados a la personalidad de una persona?
• Economía:
Factores asociados al desarrollo de un país
Ratios financieros a tener en cuenta a la hora de evaluar la labor desarrolla por una empresa
2023 - I
APLICACIONES
2023 - I
APLICACIONES
2023 - I
APLICACIONES
Validación Psicométrica
Validación de constructo
2023 - I
PASOS EN EL ANALISIS FACTORIAL
2023 - I
1° PASO: Examen de la matriz de correlaciones
Requisito : Las variables deben estar altamente correlacionadas. Los
métodos que pueden utilizarse son:
2023 - I
✓ El determinante de la matriz de correlaciones:
• Un determinante muy bajo indicará altas intercorrelaciones entre las variables, pero no debe
ser cero, pues esto indicaría que algunas de las variables son linealmente dependientes.
Donde:
n =tamaño muestral.
p =número de variables.
gl = p ( p-1)/2 Ln=logaritmo neperiano.
R =matriz de correlaciones.
2023 - I
✓ Indice KMO de Kaiser-Meyer-Olkin:
Valores bajos del índice KMO desaconsejan la utilización de Análisis Factorial. Como baremo para
interpretar el índice KMO podría tomarse según Kaiser:
2023 - I
✓ Medida de Adecuación de la muestra (MSA): Valores bajos desaconsejan el uso del
análisis factorial.
✓ Correlación Múltiple: Deberá ser alto, sobre todo si la técnica a utilizar es un análisis
factorial.
2023 - I
2023 - I
ANÁLISIS CLUSTER JERÁRQUICO Y NO JERÁRQUICO
• Método multivariado cuyo propósito es el
de agrupar objetos o individuos, de tal
manera que los objetos que se clasifican y
pertenecen a un grupo o cluster son muy
similares (homogeneidad dentro del grupo
o cluster), mientras que son muy disímiles
aquellos objetos que pertenecen a grupos
diferentes (heterogeneidad entre grupos o
cluster).
2023 - I
ANÁLISIS CLÚSTER
Las distancias
Las distancias son maximizadas
son minimizadas Inter-cluster
Intra-cluster
2023 - I
Características del Análisis clúster
El AC, es un método de interdependencia y como una técnica
exploratoria
2023 - I
Requisitos del Análisis clúster
2023 - I
Clasificación de las técnicas Clúster
Clustering
algorithms
2023 - I
... Introducción: Tipos de Distancia
Variabilidad y distancias
• Distancias de Minkowsky
• Distancia euclídea
• Distancia de Mahalanobis
• Distancia promedio
2023 - I
2023 - I
ESCALAMIENTO MULTIDIMENSIONAL
2023 - I
2023 - I
2023 - I
Matrices a ingresar (estímulos)
• Matriz de similaridad: percepción sobre las similitudes de los objetos.
• Matriz de distancia: Mediciones de atributos que se toman en la comparación de objetos.
• Matriz de correlaciones: Cuando se trata de encontrar similitud entre variables
2023 - I
2023 - I
Medidas de bondad de ajuste
2023 - I
2023 - I
ANÁLISIS DISCRIMINANTE
2023 - I
Es una técnica que nos permite identificar qué características o variables diferencian a dos
o más grupos, cuantas son necesarias para alcanzar una mejor clasificación y ayudarnos a
generar una función discriminante más eficiente y precisa para clasificar una nueva
observación.
2023 - I
2023 - I
Similitudes y diferencias entre el ANOVA, la regresión y el análisis discriminante:
Análisis
ANOVA Regresión
Discriminante
SIMILITUDES
DIFERENCIAS
2023 - I
Pruebas preliminares
2023 - I
Pruebas preliminares
2023 - I
Pruebas preliminares
2023 - I
2023 - I
Esquema metodológico del ADL
2023 - I
Se consideran los datos recogidos sobre 32 cráneos en el Tibet.
2023 - I
D1: Plataneros
D2:Traileros
ASALTOS Y ROBOS EN EEUU
D3:Mocheros
Asalto X1:Participant X2: Horario X3: Tiempo X4: Tipo Y
D4: Raperos
es
1 1
2 1 Modelo discriminante
3 1
D1=f(x1,x2,x3,x4)
4 2 D2=f(x1,x2,x3,x4)
D3=f(x1,x2,x3,x4)
5 2
D4=f(x1,x2,x3,x4)
6 2
7 3
8 3
Nuevo asalto
9 4
10 4 x1,x2,x3,x4,x5
2023 - I
ANÁLISIS CONJUNTO
2023 - I
Análisis conjunto
Supongamos un escenario, en el que un especialista en marketing de productos evalúa el impacto de las
características individuales en la participación de mercado estimada o los ingresos por ventas.
2023 - I
Objetivos prácticos del análisis conjunto
2023 - I
Análisis conjunto
Es un método descomposicional que
El Análisis Conjunto es una técnica
estima la estructura de las preferencias
estadística de la dependencia utilizada
de un consumidor (por ejemplo:
para analizar la relación lineal o no lineal
mediante utilidades parciales,
entre una variable dependiente (o
ponderaciones de importancia, puntos
endógena) generalmente ordinal (aunque
ideales, etc.), una vez obtenidas sus
también puede ser métrica) y varias
evaluaciones globales de un conjunto de
variables independientes (o exógenas) no
alternativas preespecificadas en términos
métricas.
de niveles de diferentes atributos.
2023 - I
Conceptos fundamentales
2023 - I
Usos del análisis conjunto
2023 - I
Áreas de aplicación del análisis conjunto
2023 - I
Etapas del análisis conjunto
2023 - I
Creación de estímulos
2023 - I
Creación de estímulos, y utilidades
2023 - I
2023 - I
2023 - I
2023 - I
Resultados en R
2023 - I
Resultados en R
2023 - I
Análisis canónico
El análisis de correlación canónica puede verse como una extensión lógica de un análisis de regresión múltiple. Recordemos que el
análisis de regresión múltiple implica una única variable de pendiente métrica y varias variables métricas independientes.
Mientras que la regresión múltiple implica una única variable dependiente, la correlación canónica implica múltiples
variables dependientes.
El principio subyacente es desarrollar una combinación lineal de cada conjunto de variables (tanto independientes como
dependientes) para maximizar la correlación entre los dos conjuntos.
El procedimiento implica obtener un conjunto de ponderaciones para las variables dependientes e independientes que
proporcione la correlación única máxima entre el conjunto de variables dependientes y el conjunto de variables independientes.
2023 - I
Ejemplo:
• 1°relacionadas con el ejercicio y la salud.
• Por un lado, se tienen variables asociadas al ejercicio, observaciones como la velocidad de subida en un
escalador, la rapidez con la que se puede correr una determinada distancia, la cantidad de peso levantado
en el press de banca, el número de flexiones por minuto, etc. Por otro lado, hay variables que intentan
medir la salud general, como la presión arterial, los niveles de colesterol, los niveles de glucosa, el índice
de masa corporal, etc. Se miden dos tipos de variables y las relaciones entre las variables de ejercicio y las
variables de salud son de interés.
• 2° Considere las variables que se miden sobre la salud ambiental y las toxinas ambientales.
• Se pueden medir una serie de variables de salud ambiental como las frecuencias de las especies sensibles,
la diversidad de las especies, la biomasa total, la productividad del medio ambiente, etc. y se mide un
segundo conjunto de variables sobre las toxinas ambientales, como las concentraciones de metales
pesados, pesticidas, dioxinas, etc.
• 3°Considere un grupo de representantes de ventas,
• sobre los que hemos registrado varias variables de rendimiento de ventas junto con varias medidas de
aptitud intelectual y creativa. Es posible que queramos explorar las relaciones entre las variables de
rendimiento de ventas y las variables de aptitud.
2023 - I
2023 - I
2023 - I
Simuladores para Ingeniería y Arquitectura
https://www.ucv.edu.pe/noticias/ucv-adquiere-simuladores-para-estudiantes-de-ingenieria-y-arquitectura/
https://www.youtube.com/watch?v=YJK3ndNSwo8&t=48s
2023 - I
Muchas gracias
2023 - I