Documentos de Académico
Documentos de Profesional
Documentos de Cultura
simblicos
Anlisis multidimensional
de datos (AMD)
Anlisis multidimensional clsico: se estudian
conjuntos de objetos individuales
representados por elementos atmicos de
datos.
Anlisis multidimensional
de datos
Describir cualquier situacin, por ejemplo, las
caractersticas fsicas de una persona, la situacin poltica
en un pas, las propiedades de una imagen, el
rendimiento de un proceso, el anlisis de una obra de
arte, requiere tener en cuenta simultneamente varias
variables. Para describir las caractersticas fsicas de una
persona podemos utilizar variables como su estatura, su
peso, la longitud de sus brazos y de sus piernas, etc. Para
describir la situacin poltica de un pas, variables como
la existencia o no de un rgimen democrtico, el grado
de participacin poltica de los ciudadanos, el nmero de
partidos y sus afiliados, etc. El anlisis de datos
multivariantes tienen por objeto el estudio de varias
variables evaluadas en unidades de anlisis de una
poblacin. Pretende los siguientes objetivos:
DESCRIPCIN DE DATOS
MULTIVARIANTES
La informacin de partida para los mtodos estudiados puede
ser de varios tipos.
La ms habitual es una tabla donde aparecen los valores de p
variables observadas sobre n elementos. Las variables pueden
ser cuantitativas, cuando su valor se exprese numricamente,
como la edad de una persona, su estatura o su renta, o
cualitativas, cuando su valor sea un atributo o categora,
como el gnero, el color de los ojos o el municipio de
nacimiento. Las variables cuantitativas pueden a su vez
clasificarse en continuas o de intervalo, cuando pueden tomar
cualquier valor real en un intervalo, como la estatura, o
discretas, cuando slo toman
valores enteros, como el nmero de hermanos. Las variables
cualitativas pueden clasificarse en binarias, cuando toman
nicamente dos valores posibles, como el gnero (mujer,
hombre) o generales, cuando toman muchos valores posibles,
como el municipio de residencia.
Ejemplo
En 100 estudiantes de una universidad medimos la edad, el gnero (1 mujer,
0 hombre), la calificacin media, el municipio de residencia (que se codifica
en 4 categoras en funcin del tamao) y el curso ms alto en que se
encuentra matriculado. Los datos iniciales se representan en una tabla de
100 filas, cada una de ellas correspondiente a los datos de un estudiante. La
tabla tendr 5 columnas, cada una de ellas conteniendo los valores de una de
las 5 variables definidas. De estas 5 variables 3 son cuantitativas, una binaria
(el gnero) y otra cualitativa general (municipio de residencia, que tomar los
valores 1, 2, 3, y 4). Alternativamente podramos codificar el municipio de
residencia con tres variables binarias, y entonces, la matriz de datos tendr n
=100 filas y p = 7 columnas correspondientes a las tres cuantitativas, el
gnero, y las tres variables binarias adicionales para describir el tamao del
municipio de residencia.
Ejemplo
En 400 puntos de una ciudad instalamos controles
que proporcionan cada hora las medidas de 30
variables ambientales y de contaminacin
atmosfrica en dicho punto. Cada hora tendremos
una matriz de datos con 400 filas, los puntos de
observacin, y 30 columnas, las 30 variables
observadas.
Objeto simblico
Modo de representacin de
datos complejos.
Surge de analizar diferentes
bases de datos
Datos y objetos
simblicos
Tradicionalmente se
representan las UA como
entidades simples y las
variables adoptando un valor
o categora en cada individuo
Ejemplo:
La variable y: tiempo dedicado a la prctica
de deporte.
Evaluada como el nmero de minutos
dedicados a la prctica del deporte por da
Un objeto simblico
puede describir:
Un grupo
Una clase de entidades
EDAD
PROFESIN
OS1
{Mujer 0,33
Varn 0,67}
[25,57]
{Profesionales
0,35, personal
directivo 0,25,
jefes administ.
0,4}
OS2
[mujer 0,50
Varn 0,50}
[18.42]
{comerciantesvendedores
0,55;
administrativos
0,45}
Diagrama de Diday
P()
P()
y
E
D
h
Y:
Asocia a cualquier w de su descripcin
D: conjunto de descripcin de subconjunto de
Ejemplo
Diagrama de Kiviatt