Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TÉCNICAS
É MULTIVARIANTES
1. Introducción
2 Clasificación de las técnicas
2.
3. Etapas de análisis
4. Supuestos básicos
5. Valores p
perdidos y anómalos
introducción
D fi i ió
Definición.
- Conjunto de métodos estadísticos cuya finalidad es analizar
simultáneamente
i ltá t conjuntos
j t d datos
de d t multivariantes:
lti i t h
hay
varias variables medidas para cada caso.
- Permiten un mejor entendimiento del fenómeno objeto de
estudio, obteniendo información que los métodos univariantes
y bivariantes son incapaces
p de conseguir.
g
Objetivos.
Objetivos
- Proporcionar métodos para estudiar datos multivariantes
que el análisis estadístico uni y bidimensional es incapaz de
conseguir.
- Ayudar al investigador a tomar decisiones óptimas en el
contexto en el que se encuentre teniendo en cuenta la
información disponible por el conjunto de datos analizado.
clasificación
3 grupos:
- Métodos de dependencia
- Métodos de interdependencia
- Métodos estructurales
Métodos de dependencia:
- Suponen que las variables analizadas están divididas en dos
grupos: las variables dependientes y las variables
independientes.
independientes
- El objetivo consiste en determinar si el conjunto de variables
independientes afecta al conjunto de variables
dependientes y de qué forma.
clasificación
Mét d de
Métodos d interdependencia:
i t d d i
- No distinguen entre variables dependientes e independientes
y su objetivo
bj ti consiste
i t en identificar
id tifi quéé variables
i bl están
tá
relacionadas, cómo lo están y por qué.
Métodos estructurales:
- Suponen que las variables están divididas en dos grupos: el
de las variables dependientes y el de las independientes.
- El objetivo es analizar como las variables independientes
afectan a las variables dependientes y las relaciones de
las variables de los dos grupos entre sí.
sí
Regresión clasificación
Supervivencia
Métrica
MANOVA
Correlación canónica
Dependencia
Discriminante
No métrica Regresión logística
C j i t
Conjoint
Componentes
Co po e tes p
principales
c pa es
Factorial
Métrica Cluster
Escalas multidimensionales
Interdependencia
C
Correspondencias
d i
Modelos log-lineales
No métrica
Cluster
Escalas multidimensionales
Modelos estructurales
clasificación
¿La
L investigación
i ti ió responded a un problema
bl de
d dependencia
d d i
entre variables o de interdependencia de las mismas?
Si es un p
problema de dependencias,
p ,
¿cuántas variables dependientes existen?
clasificación
Análisis de dependencias
varias una
relaciones relación
independencia independencia
no métrica métrica
R
Regresión
ió lineal
li l múltiple:
últi l
- Relación entre 1 variable dependiente métrica y varias
variables
i bl independientes
i d di t métricas
ét i o no métricas.
ét i
- Análisis
A áli i discriminante.
di i i t Proporciona
P i reglas
l ded clasificación
l ifi ió
óptimas de nuevas observaciones de las que se desconoce
su ggrupo
p de p procedencia basándose en la información
proporcionada los valores que en ella toman las variables
independientes.
((Y1, Y2, Y3, .... Ym) Å ((X1, X2, X3, .... Xm) correlación canónica
- Por ejemplo:
- Determinar si existe o no relación entre el resultado neto y la
producción de contaminantes de una explotación con la
p , dimensión e inversión inicial. Corr. canónica
superficie,
- Determinar la misma relación pero con el género del ganadero
y el tipo de explotación (intensivo, extensivo) MANOVA
clasificación
E
Ecuaciones
i estructurales:
t t l
- Varias relaciones: estructuras de la covarianza y análisis
factorial confirmatorio
A áli i de
Análisis d interdependencia.
i t d d i
- Las variables no se pueden separar en dependientes e
i d
independientes.
di t
Análisis de interdependencias
Relación Relación Relación
entre entre entre
variables casos objetos
j
Métricas No métricas
A áli i de
Análisis d componentes
t principales.
i i l
- Técnica de reducción de datos.
- Objetivo: construir combinaciones lineales de las variables
iniciales que expliquen la mayor parte de la información
contenida en esas variables.
variables
- Esas combinaciones se denominan Componentes
Principales están incorrelacionados y cada componente
Principales,
sucesivo explica menos varianza.
A áli i de
Análisis d correspondencias.
d i
- Permite visualizar gráficamente tablas de contingencia.
- Por ejemplo: Si existe relación entre la formación del
ganadero y el tipo de gestión
- Formación: sin formación, primaria, bachillerato,
universidad, formación profesional, módulos, escuela
de capataces o sus combinaciones
- Tipo de gestión: ninguna, asesor fiscal, veterinario
clínico
clínico, agrónomo
agrónomo, veterinario asesor o sus
combinaciones
clasificación
A áli i de
Análisis d escalamiento
l i t multidimensional.
ltidi i l
- Permite aflorar los criterios que utilizan los individuos para
considerar
id que distintos
di ti t objetos
bj t son parecidosid o
distintos.
- Por ejemplo: Estudios de preferencia del jamón curado
clasificación
A áli i de
Análisis d conglomerados
l d (cluster).
( l t )
- A diferencia del factorial que agrupa variables, pretende
agrupar observaciones.
b i
- De tal modo que las observaciones dentro de los grupos
sean parecidas respecto a las variables utilizadas para
agrupar.
- Y que las observaciones entre los grupos sean lo más
diferentes posibles respecto a las mismas variables.
Por ejemplo:
Analizar la gestión de los sectores ecológicos
C di i
Condiciones d aplicabilidad.
de li bilid d
- Normalidad
- Homocedasticidad
- Linealidad
- Independencia
supuestos básicos
H
Homoscedasticidad
d ti id d (univariante):
( i i t )
- Contraste de Levene (hipótesis nula: la varianza de la
variable
i bl X es igual
i l en todos
t d los
l niveles
i l que forma
f l variable
la i bl
Z)
Homoscedasticidad (multivariante):
- Contraste M de Box
- Es muy sensible (se recomienda que p<0,001)
- Es necesaria normalidad multivariante para el contraste
supuestos básicos
Por ejemplo:
- Estudiar
E t di sii los
l ganaderos
d son conscientes
i t d que la
de l
producción intensiva perjudica el medio ambiente
- O por ell contrario,
t i l
los ganaderos
d i t
intensivos
i l son
lo
porque no son conscientes de esto
- Si esto es así,
así los ganaderos intensivos estarían
significativamente más en desacuerdo con la afirmación
que los extensivos
q
supuestos básicos
Por ejemplo:
- E t es un problema
Esto bl d análisis
de áli i discriminante:
di i i t
- Una variable dependiente no métrica (intensivo o
extensivo)
t i )
- Varias variables independientes métricas:
- Y1: Opinión (1 a 5): la g.intensiva perjudica el m.
ambiente
- Y2: Opinión (1 a 5): no permitir g.intensiva en
espacios protegidos y naturales
- Y3: Opinión (1 a 5): reducir ayudas a g.intensiva U.E.
- Y4: Opinión (1 a 5): debe informarse más sobre los
efectos de la g. Intensiva a la opinión pública
supuestos básicos
Por ejemplo:
- Debe
D b comprobarse
b l hipótesis
la hi ót i nula,
l que lal matriz
t i de
d
varianzas-covarianzas de las variables Y es la misma para los
niveles de X (intensivo-extensivo).
( )
- Contraste M de Box.
supuestos básicos
Linealidad:
- Fundamental en todas las técnicas que se centren en el
análisis de las matrices de correlaciones o de covarianzas
- Porque el coeficiente de correlación de Pearson sólo puede
captar relaciones lineales
- Para la regresión lineal múltiple se analizan los residuos
- Para el resto de los casos: g
gráficos de dispersión
p
bivariante
- Por ejemplo:
consumo inc. Peso inc. Diám. Digest
Consumo MS ((kg/animal)
g ) 1 0,87
, 0,91
, -0,66
,
Incremento de Peso 0,87 1 0,79 0,81
Incremento de Diámetro 0 91
0,91 0 79
0,79 1 0 92
0,92
Digestibilidad MS (%) -0,66 0,81 0,92 1
supuestos básicos
Consumo
40
10 10
20
0 0 0
0 20 40 60 0 20 40 60 0 20 40 60
40
40 40
30
I Peso
Inc P
30 30
20
20 20
10
10 10
0
0 0
0 20 40 60
0 20 40 60 0 20 40 60
100 40
40
80 30
30
60
Inc Diam 40
20
20
10
20
10
0
0 0
0 20 40 60
0 20 40 60 0 20 40 60
100 40 40
Diges 80
60
30
20
30
20
40
10 10
20
0 0 0
0 20 40 60 0 20 40 60 0 20 40 60
supuestos básicos
I d
Independencia:
d i
- Los valores que toman las variables en un caso no están
i fl id por los
influidos l valores
l que toman
t en otro
t caso
- Si no se está seguro de esto, habría que incrementar el
nivel de significación de los contrastes 10 veces (de
p<0,05 a p<0,005)
- La independencia se asegura en el diseño experimental