Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Definición
Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de
datos multivariantes en el sentido de que hay varias variables medidas para cada individuo u
objeto estudiado.
Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo
información que los métodos estadísticos univariados y bivariados son incapaces de conseguir.
Son todas aquellas técnicas estadísticas que simultáneamente analizan múltiples resultados en
los individuos u objetos bajo investigación.
Para que un análisis se considere multivariado todas las variables deben ser aleatorias y
relacionadas de tal manera que el efecto que producen no pueda ser interpretado de manera
individual.
2. Objetivos
El propósito del análisis multivariado, o también conocido como multivariante, es medir,
explicar y predecir el grado de relación que existe entre la variación (combinación lineal
ponderada de las variables).
El carácter multivariante del análisis descansa no solo en el número de variables sino en las
múltiples combinaciones existentes entre las variables.
Puede sintetizarse en dos:
Proporcionar métodos cuya finalidad es el estudio de conjuntos de datos multivariantes
que el análisis estadístico uni y bidimensional no pueden conseguir.
Ayudar al analista o investigador a tomar decisiones óptimas en el contexto en el que se
encuentre teniendo en cuenta la información disponible por el conjunto de datos
analizados.
Observando el diagrama de dispersión (que sirve para graficar la relación entre dos variables),
a simple vista parece existir una relación positiva entre ambas variables: conforme aumenta el
porcentaje de alcohol, también aumenta el número de calorías.
¿Cómo podríamos describir los datos que acabamos de proponer? Podríamos decir simplemente
que el aumento del porcentaje de alcohol va acompañado de un aumento en el número de
calorías; pero esto, aunque es correcto, es poco específico. Lo ideal sería analizar mediante una
línea recta que se obtiene mediante una función matemática simple:
5. Regresión Múltiple
Utilizando el análisis de regresión lineal, podemos utilizar MAS de una variable independiente,
esto se denomina regresión múltiple. Pero en el análisis de regresión múltiple, la ecuación de
regresión ya no define una recta en el plano, sino un HIPERPLANO en un espacio
multidimensional.
Imaginemos un análisis de regresión con “salario” como variables dependientes y “salini”
(salario inicial) y “expprev” (experiencia previa) como variables independientes. La Siguiente
figura muestra el diagrama de dispersión de salario sobre salini y expprev, y el plano de
regresión en un espacio tridimensional.
Con una variable dependiente y dos independientes, necesitamos tres ejes para poder
representar el correspondiente diagrama de dispersión. Y si en lugar de dos variables
independientes utilizáramos tres, sería necesario un espacio de cuatro dimensiones para poder
construir el diagrama de dispersión, etc.
Por tanto, con más de una variable independiente, la representación gráfica de las relaciones
presentes en un modelo de regresión resulta poco intuitiva, muy complicada y nada útil. Es más
fácil y practico partir de la ecuación del modelo de regresión lineal:
De acuerdo con este modelo o ecuación, la variable dependiente (Y) se interpreta como una
combinación lineal de un conjunto de K variables independientes (Xk), cada una de las cuales
va acompañada de un coeficiente (βk) que indica el peso relativo de esa variable en la ecuación.
La ecuación incluye además una constante (β0) y un componente aleatorio (los residuos: ε) que
recoge todo lo que las variables independientes no son capaces de explicar.
6. Regresión Logística