Está en la página 1de 28

ANÁLISIS DISCRIMINANTE

ANÁLISIS DISCRIMINANTE
 PROPÓSITO BÁSICO
 ESTIMAR LA RELACIÓN ENTRE UNA ÚNICA
VARIABLE DEPENDIENTE NO MÉTRICA
(CATEGÓRICA) Y UN CONJUNTO DE
VARIABLES INDEPENDIENTES MÉTRICAS, EN
FORMA GENERAL
Y1 = X1 + X2 + X3 +......+ Xn
ANÁLISIS DISCRIMINANTE
 OBJETIVO GENERAL
 IDENTIFICAR EL GRUPO AL CUAL UN
OBJETO PERTENECE, TOMANDO COMO
PUNTO DE PARTIDA UNA COLECCIÓN
DE OBJETOS PREVIAMENTE
CLASIFICADOS CORRECTAMENTE
DEFINICIONES BÁSICAS
 FUNCIÓN DISCRIMINANTE
 COMBINACIÓN LINEAL DE DOS O MAS
VARIABLES INDEPENDIENTES QUE MEJOR
DISCRIMINE ENTRE LOS GRUPOS DEFINIDOS
A PRIORI. EXISTIRA UNA FUNCIÓN
DISCRIMINANTE MENOS QUE EL NUMERO DE
GRUPOS EXISTENTE
Zjk = a + W1X1k + W2X2k + .... + WnXnk
DEFINICIONES BÁSICAS
 FUNCIÓN DISCRIMINANTE LINEAL DE
FISHER
 TAMBIEN LLAMADA FUNCIÓN DE
CLASIFICACIÓN, DEFINE UN MÉTODO DE
CLASIFICACIÓN A PARTIR DE UNA FUNCIÓN
POR GRUPO, CALCULÁNDOSE
PUNTUACIONES PARA CADA OBJETO Y
CLASIFICANDOLO EN EL GRUPO CUYA
FUNCIÓN DE LA MAYOR PUNTUACIÓN
DEFINICIONES BÁSICAS
 PUNTUACIÓN Z DISCRIMINANTE
 ESEL RESULTADO DE LA APLICACIÓN DE LA
FUNCIÓN DISCRIMINANTE A CADA
INDIVIDUO EN EL ANÁLISIS
 CENTROIDE
 ESEL PROMEDIO DE LAS PUNTUACIONES
DISCRIMINANTES PARA TODOS LOS
INDIVIDUOS DENTRO DE UN GRUPO
PARTICULAR
DEFINICIONES BÁSICAS
 CONTRASTE ESTADÍSTICO
 RESULTA DE COMPARAR LAS DISTRIBUCIONES DE
LAS PUNTUACIONES DISCRIMINANTES DE LOS
GRUPOS. A MAYOR SOLAPAMIENTO DE ELLAS, PEOR
DISCRIMINA LA FUNCIÓN.

A B
OBJETIVOS DEL ANÁLISIS
DISCRIMINANTE
 DETERMINAR SI EXISTEN DIFERENCIAS
ESTADÍSTICAMENTE SIGNIFICATIVAS ENTRE LOS
PERFILES DE LAS PUNTUACIONES MEDIAS SOBRE UN
CONJUNTO DE VARIABLES DE DOS O MAS GRUPOS
DEFINIDOS A PRIORI
 DETERMINAR CUAL DE LAS VARIABLES
INDEPENDIENTES CUANTIFICA MEJOR LAS
DIFERENCIAS
 ESTABLECER PROCEDIMIENTOS PARA CLASIFICAR
OBJETOS DENTRO DE LOS GRUPOS
DISEÑO DE LA INVESTIGACIÓN
 SELECCIÓN DE LAS VARIABLES DEPENDIENTE E
INDEPENDIENTES
 LA VARIABLE DEPENDIENTE ES NO METRICA, LAS
INDEPENDIENTES SON MÉTRICAS
 EL NUMERO DE GRUPOS PUEDEN SER DOS O MAS.
DEBEN SER MUTUAMENTE EXCLUYENTES Y
EXHAUSTIVOS
 ELEGIR LAS VARIABLES INDEPENDIENTES
BASANDOSE EN ESTUDIOS ANTERIORES, EN
MODELOS TEÓRICOS O EL CONOCIMIENTO LÓGICO
INTUITIVO DEL INVESTIGADOR
DISEÑO DE LA INVESTIGACIÓN
 TAMAÑO MUESTRAL
 DEBE CONSIDERARSE EL NÚMERO DE VARIABLES
INDEPENDIENTES
 SE SUGIEREN 20 OBSERVACIONES POR VARIABLE.
TAMAÑO MÍNIMO CINCO OBSERVACIONES POR
VARIABLE
 SE DEBE CONSIDERAR EL TAMAÑO MUESTRAL DE
CADA GRUPO. SE SUGIERE 20 OBSERVACIONES POR
GRUPO. COMO MÍNIMO EL TAMAÑO DEL GRUPO
MAS PEQUEÑO DEBE SER MAYOR QUE EL NÚMERO
DE VARIABLES
SUPUESTOS DEL ANÁLISIS
DISCRIMINANTE
 NORMALIDAD
 NORMALIDAD MULTIVARIANTE DE LAS VARIABLES
INDEPENDIENTES
 SI NO SE CUMPLE PROBAR CON REGRESIÓN LOGÍSTICA
 HOMOGENEIDAD DE LAS MATRICES DE COVARIANZA
 MATRICES DE COVARIANZAS DISTINTAS CAUSAN
SOBRECLASIFICACIÓN EN AQUELLOS GRUPOS CON MATRICES
MAS GRANDES
 INCREMENTAR EL TAMAÑO MUESTRAL
 USAR FUNCIONES CUADRÁTICAS
 LINEALIDAD
 LOS EFECTOS NO LINEALES NO SON DETECTADOS
CASOS ATÍPICOS
 TIENEN GRAN EFECTO EN LA
PRECISIÓN CLASIFICATORIA DEL
ANÁLISIS DISCRIMINANTE. SE
ACONSEJA SU DETECCIÓN Y
ELIMINACIÓN DE SER NECESARIO
ESTIMACIÓN DEL MODELO
DISCRIMINANTE
 MÉTODO DE CÁLCULO
 ESTIMACIÓN SIMULTANEA
 ESTIMACIÓN POR ETAPAS o PASO A PASO
Niveles de la
variable
independiente
Variables Not in the Analysis
Variables in the Analysis
Min. Wilks'
Wilks' Step Tolerance Tolerance F to Enter Lambda
Step Tolerance F to Remove Lambda 0 Consumo (l/100Km) 1.000 1.000 88.094 .684
1 Cilindrada en cc Cilindrada en cc 1.000 1.000 139.486 .577
1.000 139.486
Potencia (CV) 1.000 1.000 60.165 .760
2 Cilindrada en cc .218 85.182 .760 Peso total (kg) 1.000 1.000 111.755 .630
Potencia (CV) .218 19.035 .577 Aceleración 0 a 100
1.000 1.000 15.076 .927
3 Cilindrada en cc km/h (segundos)
.169 94.312 .753
Año del modelo 1.000 1.000 8.826 .956
Potencia (CV) .210 12.455 .536 Número de cilindros 1.000 1.000 109.099 .636
cilindr=4 | cilindr=6 cilindr=4 | cilindr=6
.292 8.377 .525 1.000 1.000 49.889 .792
(FILTRO) (FILTRO)
1 Consumo (l/100Km) .318 .318 5.232 .562
4 Cilindrada en cc .168 95.574 .724
Potencia (CV) .218 .218 19.035 .525
Potencia (CV) .204 10.160 .506 Peso total (kg) .191 .191 5.300 .562
cilindr=4 | cilindr=6 Aceleración 0 a 100
.291 8.626 .503 .713 .713 5.648 .561
(FILTRO) km/h (segundos)
Año del modelo .852 .852 11.031 .546
Año del modelo .831 8.605 .503
Número de cilindros .150 .150 1.303 .573
5 Cilindrada en cc .102 53.752 .594 cilindr=4 | cilindr=6
.304 .304 14.814 .536
Potencia (CV) .198 10.234 .487 (FILTRO)
2 Consumo (l/100Km) .291 .182 5.505 .510
cilindr=4 | cilindr=6
.289 8.538 .483 Peso total (kg) .187 .127 5.435 .510
(FILTRO)
Aceleración 0 a 100
Año del modelo .511 .156 1.071 .522
.803 10.856 .489 km/h (segundos)
Peso total (kg) .180 7.461 .481 Año del modelo .832 .213 8.355 .503
Número de cilindros .149 .090 2.010 .519
cilindr=4 | cilindr=6
.292 .169 8.377 .503
(FILTRO)
3 Consumo (l/100Km) .291 .144 5.284 .489
Peso total (kg) .186 .106 5.239 .489
Aceleración 0 a 100
.507 .154 1.131 .500
km/h (segundos)
Año del modelo .831 .168 8.605 .481
Número de cilindros .116 .090 .487 .501
4 Consumo (l/100Km) .225 .142 3.503 .472
Peso total (kg) .180 .102 7.461 .462

Metodo paso a paso Aceleración 0 a 100


km/h (segundos)
.507 .151 1.221 .478
Número de cilindros .116 .089 .536 .479
5 Consumo (l/100Km) .163 .102 2.974 .455
Aceleración 0 a 100
.399 .101 .200 .462
km/h (segundos)
Número de cilindros .112 .073 1.425 .459
ESTIMACIÓN DEL MODELO
DISCRIMINANTE
SIGNIFICACIÓN ESTADÍSTICA: Se utiliza después de obtener la
función discriminante con el fin de valorarla
 LAMBDA DE WILKS
 Compara si los grupos son de algún modo diferentes. Cuanto mayor
es la dispersión entre los grupos, mas pequeño es el valor de
lambda y mayor la significación. Debe mientras mas baja mejor, si
da significativa significa que los centroides entre los grupos difieren

Wilks' Lambda

Wilks'
Test of Function(s) Lambda Chi-square df Sig. Significativo, existen
1 through 2 .462 292.387 10 .000
2 .932 26.730 4 .000
diferencia entre los
grupos
INTERPETACIÓN DE LOS RESULTADOS

 PONDERACIONES
DISCRIMINANTES
ESTANDARIZADAS:
 ESTUDIAR EL SIGNO: Standardized Canonical Discriminant Function Coefficients
relación inversa (-), Function

relación directa (+) Cilindrada en cc


1
2.013
2
1.353
Potencia (CV) -.696 .492
 ESTUDIAR LA MAGNITUD: Peso total (kg) -.026 -1.762

mientras mas grande la VI, Año del modelo


cilindr=4 | cilindr=6
.183 .865

contribuye mas a la (FILTRO)


.545 -.034

capacidad discriminante de
la función que las
pequeñas
INTERPETACIÓN DE LOS RESULTADOS

CARGAS DISCRIMINANTES Structure Matrix

Function
 CORRELACIONES DE Cilindrada en cc
1
.849*
2
-.101
ESTRUCTURA: Miden la Peso total (kg) .754* -.358
Número de cilindros a .743* -.123
correlación entre cada VI Consumo (l/100Km) a .595* -.438

y la función discriminante Potencia (CV)


cilindr=4 | cilindr=6
.557* -.088

-.508* .029
y representan la (FILTRO)
Aceleración 0 a 100
contribución de cada
a -.252* -.187
km/h (segundos)
Año del modelo -.129 .634*
variable a la función. Se Pooled within-groups correlations between discriminating

consideran mejores que variables and standardized canonical discriminant functions


Variables ordered by absolute size of correlation within function.

las ponderaciones *. Largest absolute correlation between each variable and


any discriminant function
estandarizadas. a. This variable not used in the analysis.
INTERPETACIÓN DE LOS RESULTADOS

Functions at Group Centroids


UBICACIÓN DE LOS Function
CENTROIDES País de origen
EE.UU.
1 2
.760 -.003
 Permite identificar las Europa -1.353 -.473
Japón -1.301 .421
contribuciones de las Unstandardized canonical discriminant
funciones a la functions evaluated at group means

discriminacion entre
los grupos de la VD.
La funcion 2
La funcion 1 discrimina
discrimina entreEuropa
entre EU y y Jap ubica
Europa-Jap. en el centro
a EU
Classification Resultsa

Predicted Group Membership


País de origen EE.UU. Europa Japón Total
Original Count EE.UU. 213 13 23 249
Europa 5 40 23 68
Japón 7 21 47 75
% EE.UU. 85.5 5.2 9.2 100.0
Europa 7.4 58.8 33.8 100.0
Japón 9.3 28.0 62.7 100.0
a. 76.5% of original grouped cases correctly classified.

La diagonal muestra el porcentaje de


datos correctamente predichos
Classification Function Coefficients

País de origen
EE.UU. Europa Japón
Cilindrada en cc .011 .007 .008
Potencia (CV) .472 .509 .521
Peso total (kg) -.003 .001 -.006
Año del modelo 7.575 7.355 7.572
cilindr=4 | cilindr=6
42.170 39.293 39.288
(FILTRO)
(Constant) -347.312 -326.303 -340.087 Se sustituyen los
Fisher's linear discriminant functions valores en cada una
de las funciones, se
ubica el sujeto en la de
mayor puntaje.
VALIDACIÓN DE LOS
RESULTADOS
 DIVIDIR LA MUESTRA TOTAL EN DOS PARTES, UNA PARA ESTIMAR
EL MODELO Y OTRA PARA MEDIR LA PRECISIÓN CLASIFICADORA
 DIVIDIR ALEATORIAMENTE LA MUESTRA VARIAS VECES Y
CALCULAR UN PROMEDIO DE LA PRECISIÓN CLASIFICADORA
 MÉTODO U: TOMAR K-1 MUESTRAS OBVIANDO UNA
OBSERVACIÓN, ESTIMAR EL MODELO Y CLASIFICAR LAS
OBSERVACIONES PARA MEDIR LA PRECISIÓN
 MÉTODO JACKNIFE: IGUAL QUE EL ANTERIOR PERO SE CENTRA
EN LA ESTABILIDAD DE LOS COEFICIENTES DISCRIMINANTES

También podría gustarte