Documentos de Académico
Documentos de Profesional
Documentos de Cultura
9/26/2014
Caras de Chernoff
Resúmen.......................................................................................................................................... 1
Entrada de Datos ............................................................................................................................. 2
Resúmen Análisis............................................................................................................................ 3
Caras de Chernoff ........................................................................................................................... 4
Opciones Análisis ........................................................................................................................... 5
Esculpir ........................................................................................................................................... 8
Resúmen
Las Caras de Chernoff ofrecen un método de visualización multivariado dibujando caras
caricaturescas en donde las diferentes características son graduadas de acuerdo a los valores de
diferentes variables cuantitativas. Estas fueron desarrolladas por Herman Chernoff y descritas
por primera vez en el artículo titulado “El uso de Caras para la Representación de Puntos en un
espacio gráfico k-Dimensional”, publicado en Journal of the American Statistical Association,
Junio 1973, Vol. 68, No. 342, pp. 361-368. Aunque aún se debate su efectividad como un
método para identificar grupos de casos, estas representan una novedosa alternativa con otras
técnicas de visualización multivariable más convencionales.
Marca Modelo
MPG Peso Torque Caballos Capacidad Cilindros
Autopista de Fuerza Motor lts
Acura Integra 31 2705 102 140 1.8 4
Acura Legend 25 3560 115 200 3.2 6
Audi 90 26 3375 102 172 2.8 6
Audi 100 26 3405 106 172 2.8 6
BMW 535i 30 3640 109 208 3.5 4
Buick Century 31 2880 105 110 2.2 4
Buick LeSabre 28 3470 111 170 3.8 6
Buick Roadmaster 25 4105 116 180 5.7 6
Buick Riviera 27 3495 108 170 3.8 6
Cadillac DeVille 25 3620 114 200 4.9 8
Cadillac Seville 25 3935 111 295 4.6 8
Chevrolet Cavalier 36 2490 101 110 2.2 4
Chevrolet Corsica 34 2785 103 110 2.2 4
Chevrolet Camaro 28 3240 101 160 3.4 6
Chevrolet Lumina 29 3195 108 110 2.2 4
Chevrolet Lumina_APV 23 3715 110 170 3.8 6
Chevrolet Astro 20 4025 111 165 4.3 6
Chevrolet Caprice 26 3910 116 170 5.0 8
Entrada de Datos
Los datos a ser analizados consisten de 2 o más columnas numéricas y una columna opcional con
los identificadores de los grupos:
Código Grupos: columna opcional con los niveles a usar como identificador de los grupos
de casos.
Etiquetas Glifos: una columna opcional con las etiquetas correspondientes a cada fila. Si
no se especifica, los numeros de las filas se usarán como etiquetas.
Como ejemplo, se seleccionaron 6 variables. El tipo de vehículo sera usado para identificar los
casos. El operador JUXTAPOSE coloca dos columnas una al lado de la otra, para que cada
vehículo pueda etiquetarse tanto con la marca como con el modelo. El seleccionar la expresión
“Domestic = 0” especifica que solo autos manufacturados fuera de los EUA deben ser incluídos.
Resúmen Análisis
El Resúmen del Análisis muestra el número de filas con datos completos y el resúmen estadístico
para esas filas:
Existen 44 filas que cumplen el criterio de selección y que contienen datos para todas las
variables. La salida también muestra que características de la cara serán graduadas a cada una de
las variables.
Caras de Chernoff
El gráfico abajo muestra una cara para cada observación de los datos seleccionados:
Type
Compact
Midsize
Small
Sporty
Van
Acura Integra Acura Legend Audi 90 Audi 100 BMW 535i Geo Metro Geo Storm
Honda Prelude Honda Civic Honda Accord Hyundai Excel Hyundai Elantra Hyundai Scoupe Hyundai Sonata
Infiniti Q45 Lexus ES300 Lexus SC300 Mazda 323 Mazda Protege Mazda 626 Mazda MPV
Mercedes-Benz 190E Mercedes-Benz 300E Mitsubishi Mirage Mitsubishi Diamante Nissan Sentra Nissan Altima Nissan Quest
Nissan Maxima Saab 900 Subaru Justy Subaru Loyale Subaru Legacy Suzuki Swift Toyota Tercel
Toyota Celica Toyota Camry Toyota Previa Volkswagen Fox Volkswagen Eurovan Volkswagen Passat Volkswagen Corrado
El color de la cara indica el tipo de vehículo. En este gráfico se puede indentificar vehículos con
atributos similares (tal como el Nissan Quest y el Volkswagen Eurovan) y también encontrar
valores atípicos (como el Infiniti Q45).
Opciones Análisis
El recuadro de diálogo Opciones de Análisis selecciona las características de la cara que se usará
para representar cada variable:
Las caras se dibujan creando dos elipses solapadas, una mayor que la otra. Los puntos que la
elipse intersecta se les conoce como esquinas de la cara. A cada cara se le asigna una boca,
nariz, dos ojos y dos cejas.
X min x
h (1)
max x min x
donde minx y maxx son los valores mínimos y máximos observados de la variable X. Los
detalles de cada característica se describen a continuación:
2. Angulo base horizontal de la esquina: el ángulo basado en una línea horizontal que
va de O a P. El ángulo se define de tal forma que el valor 0.5 representa una
situación donde las esquinas de las caras se alinean con el centro de la nariz.
4. Excentricidad de la cara superior: relacionada al radio de longitud del eje mayor con
respecto al eje menor. h es graduado de tal forma que el valor de 0.5 representa un
círculo. Valores de h menores a 0.5 corresponden a elipses cuyo eje vertical es mayor
que el eje horizontal. Valores de h mayores a 0.5 corresponden a elipses cuyo eje
horizontal es más largo que el eje vertical.
10. Posición Vertical de los ojos: la posición de los ojos. h =0 posiciona los ojos a una
altura igual al centro de la nariz, mientras que h = 1 posiciona los ojos hasta arriba de
la cara.
11. Separación de los ojos: la distancia entre el centro de los ojos, donde, h = 1
corresponde a la mitad del ancho máximo de la cara.
12. Inclinación de los ojos: la cantidad que los ojos se inclinan. Si h = 0.5, los ojos no
tienen inclinación. Para valores de < 0.5, los ojos se inclinan hacia un lado. Para
valores de h > 0.5, los ojos se inclinan hacia el otro lado.
13. Excentricidad de los ojos: relacionado : relacionada al radio de longitud del eje mayor
con respecto a la elipse formando cada ojo a la forma del eje menor. h esta graduada
para que el valor de 0.5 represente un círculo. Valores de h menores a 0.5
corresponden a elipses cuyo eje vertical es mayor que el eje horizontal. Valores de h
mayores a 0.5 corresponden a elipses cuyo eje horizontal es mayor que el eje vertical.
15. Posición de las pupilas: la posición de las pupilas en los ojos, donde h = 0.5 pone las
pupilas en el centro de los ojos.
16. Posición Vertical de las cejas: la posición de las cejas, donde h =0 posiciona las
cejas a la altrua del centro de la nariz, mientras que h = 1 posiciona las cejas hasta
arriba de la cara.
17. Inclinación de las cejas: la cantidad con que las cejas se inclinan, Si h = 0.5, las cejas
no se inclinan. Para valores de h < 0.5, las cejas se inclinan hacia un lado . Para
valores de h > 0.5, las cejas se inclinan hacia el otro lado.
Esculpir
El recuadro de diálogo de los Glifos Cerradura muestran como las caras se esculpen cuando se
hacen diferentes combinaciones de las variables:
1. Todo el mínimo – todas las variables se definen con sus valores mínimos observados.
2. Todo bajo – todas las variables se definen a la mitad de los valores mínimos y el rango
medio.
3. Todo neutral – todas las variables se definen en su rango medio.
4. Todo arriba – todas las variables se definen a la mitad de los valores máximos y el rango
medio.
5. Todo el máximo – todas las variables se definen con sus valores máximos observados.