Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1 - 1 (Versión 1)
Tema 1 - 1 (Versión 1)
Curso 2022-23
⎜
⎟
⎜ ⋮ ⋮ ⋱ ⋮ ⎟
⎝ ⎠
xn1 xn2 ⋯ xnq
Métrico
Intervalo: Variables numéricas donde hay diferencias iguales entre los
puntos de la escala, pero no hay no hay una posición fija del cero.
(Ejemplo: Temperatura medida en ºC y ºF)
Otro problema: Puede dar lugar a estimaciones sesgadas a menos que los
datos que falten sean completamente al azar.
Una posible solución: La imputación múltiple, que "rellena" los valores que
faltan de forma sólida
(tiene en cuenta la incertidumbre adicional que esto
induce) Se buscan individuos semejantes y se rellena con la media de ellos
Directrices para los análisis
multivariantes y la interpretación
Conoce los datos (Análisis descriptivo).
Atención
Claridad
Reciprocidad
Clustering: agrupa los objetos para que cada uno sea similar a los demás
objetos del grupo y diferente de los objetos de los otros grupos.
Medidas de resumen para datos
multivariantes: El vector de medias
Para un conjunto de datos multivariantes con q variables X1 , … , Xq y n
unidades muestrales, el vector de medias poblacional, μ, es:
t
μ = (μ1 , … , μq ) ,
⎜
σ21 σ22 ⋯ σ2q ⎟
⎜
⎟
⎜
⎟
⎜
⎟
⎜ ⋮ ⋮ ⋱ ⋮ ⎟
⎝ ⎠
σq1 σq2 ⋯ σqq
−1/2 −1/2
R = D SD ,
j = 1, … , q .