Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Metodos Cuantitativos PDF
Metodos Cuantitativos PDF
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
ANALISIS EXPLORATORIO DE
DATOS MULTIVARIADOS
Métodos Cuantitativos
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
El Vector de Medias
X1 x2
X2
x
.
X= .
(px1) .
x1
Xp
X= 1
n
i xi = 1 X 1
n
t
1 X.i
Xi =
n
xri =
n
r
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Matriz Varianza-Covarianza
sij = 1
n
i xir xrj - xi xj
s =
1
n
r ( xr - Xr )( xr - Xr )t
t
s =
1 X HX “H” se conoce como
matriz central
n
H = I - 1 11
t
n
Resultado
Mostrar que S es semidefinida positiva y H es simétrica e
idempotente
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
xt1
xt2
t
X X = x1 x2 . . . xn . = x1xt1 + x2xt2 + ... + xnxtn
.
xtn
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Teorema
Teorema
Distancia
Sean P y Q dos puntos que representan medidas
x e y respecto a dos objetos. Una función real
valorada d(P,Q) es una función distancia si tiene las
siguientes propiedades:
Métrica
Una distancia es una MÉTRICA si cumple:
IV) Definición d(P,Q) = 0, si P = Q
V) Desigualdad Triangular d(P,R) + d(R,Q) d(P,Q)
Ultra Métrica
Una distancia es una ULTRAMÉTRICA si cumple:
VI) d(P,Q) ≤ máx { d(P,X) , d(X,Q) }
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Distancias para
Datos Cuantitativos
a) Distancia Euclidea
b) Distancia Estadística
c) Distancia de Mahalanobis
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
a) Distancia Euclidea
La distancia más corta entre dos puntos P=(x1, x2, ..., xn) y Q=(y1, y2, ..., yn)
está definido por:
Dada X (nxp) una matriz de datos con filas x’1, x’2, …, x’n, entonces, la
distancia Euclidea entre los puntos (objetos) x’i y x’j es dij, donde:
p
d2ij = (xik – xjk ) 2 = xi - xj
2
k=1
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Propiedades Adicionales
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
b) Distancia Estadística
Es un concepto de distancia que además de incluir la variabilidad
también incorpora la presencia de correlación
C / s22 S11>S22
P
x1
-C / s11 o C / s11
-C / s22
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Si hacemos:
x1 2 x22
d(O,P) = +
s11 s22
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Si x1 no varía independientemente de x2
x1
x
2
La variabilidad de x1 es
x2 diferente a la de x2 y,
además, ambas están
correlacionados
x1
2 x 2
x1 2
d(O,P) = +
s11 s22
donde;
X1 = x1 cos + x2 sen
X2 = - x1 sen + x2 cos
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
La distancia estadística más corta entre dos puntos P=(x1, x2, ..., xn) y
Q=(y1, y2, ..., yn) está definido por:
a12(x1 - y1) (x2 - y2) + a13(x1 - y1) (x3 - y3) + ... +ap-1,p (xp-1 - yp-1) (xp - yp)
Q
P x1
o
b) Distancia de Mahalanobis
D2ij = ( xi – xj )’ S-1 ( xi – xj )
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
tal que,
1 Si i=j
t
ei ej =
0 si i = j
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
Descomposición Espectral
t t
A = 1 e1 e1 + 2 e2 e2 + … + k ek ekt
Dr. Luis Huamanchumo de la Cuba
FSM71 ‐ ESTADÍSTICA MULTIVARIADA
1. GEOMETRÍA DE LA MUESTRA Y MUESTREO MULTIVARIADO
RESULTADOS
(continuación)
Si A es una matriz kxk definida positiva con descomposición
espectral:
A = 1 e1 e1 = PP
t t