Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis Discriminante
Análisis Discriminante
ANÁLISIS DISCRIMINANTE
PROPÓSITO BÁSICO
ESTIMAR LA RELACIÓN ENTRE UNA ÚNICA
VARIABLE DEPENDIENTE NO MÉTRICA
(CATEGÓRICA) Y UN CONJUNTO DE
VARIABLES INDEPENDIENTES MÉTRICAS, EN
FORMA GENERAL
Y1 = X1 + X2 + X3 +......+ Xn
ANÁLISIS DISCRIMINANTE
OBJETIVO GENERAL
IDENTIFICAR EL GRUPO AL CUAL UN
OBJETO PERTENECE, TOMANDO COMO
PUNTO DE PARTIDA UNA COLECCIÓN
DE OBJETOS PREVIAMENTE
CLASIFICADOS CORRECTAMENTE
DEFINICIONES BÁSICAS
FUNCIÓN DISCRIMINANTE
COMBINACIÓN LINEAL DE DOS O MAS
VARIABLES INDEPENDIENTES QUE MEJOR
DISCRIMINE ENTRE LOS GRUPOS DEFINIDOS
A PRIORI. EXISTIRA UNA FUNCIÓN
DISCRIMINANTE MENOS QUE EL NUMERO DE
GRUPOS EXISTENTE
Zjk = a + W1X1k + W2X2k + .... + WnXnk
DEFINICIONES BÁSICAS
FUNCIÓN DISCRIMINANTE LINEAL DE
FISHER
TAMBIEN LLAMADA FUNCIÓN DE
CLASIFICACIÓN, DEFINE UN MÉTODO DE
CLASIFICACIÓN A PARTIR DE UNA FUNCIÓN
POR GRUPO, CALCULÁNDOSE
PUNTUACIONES PARA CADA OBJETO Y
CLASIFICANDOLO EN EL GRUPO CUYA
FUNCIÓN DE LA MAYOR PUNTUACIÓN
DEFINICIONES BÁSICAS
PUNTUACIÓN Z DISCRIMINANTE
ESEL RESULTADO DE LA APLICACIÓN DE LA
FUNCIÓN DISCRIMINANTE A CADA
INDIVIDUO EN EL ANÁLISIS
CENTROIDE
ESEL PROMEDIO DE LAS PUNTUACIONES
DISCRIMINANTES PARA TODOS LOS
INDIVIDUOS DENTRO DE UN GRUPO
PARTICULAR
DEFINICIONES BÁSICAS
CONTRASTE ESTADÍSTICO
RESULTA DE COMPARAR LAS DISTRIBUCIONES DE
LAS PUNTUACIONES DISCRIMINANTES DE LOS
GRUPOS. A MAYOR SOLAPAMIENTO DE ELLAS, PEOR
DISCRIMINA LA FUNCIÓN.
A B
OBJETIVOS DEL ANÁLISIS
DISCRIMINANTE
DETERMINAR SI EXISTEN DIFERENCIAS
ESTADÍSTICAMENTE SIGNIFICATIVAS ENTRE LOS
PERFILES DE LAS PUNTUACIONES MEDIAS SOBRE UN
CONJUNTO DE VARIABLES DE DOS O MAS GRUPOS
DEFINIDOS A PRIORI
DETERMINAR CUAL DE LAS VARIABLES
INDEPENDIENTES CUANTIFICA MEJOR LAS
DIFERENCIAS
ESTABLECER PROCEDIMIENTOS PARA CLASIFICAR
OBJETOS DENTRO DE LOS GRUPOS
DISEÑO DE LA INVESTIGACIÓN
SELECCIÓN DE LAS VARIABLES DEPENDIENTE E
INDEPENDIENTES
LA VARIABLE DEPENDIENTE ES NO METRICA, LAS
INDEPENDIENTES SON MÉTRICAS
EL NUMERO DE GRUPOS PUEDEN SER DOS O MAS.
DEBEN SER MUTUAMENTE EXCLUYENTES Y
EXHAUSTIVOS
ELEGIR LAS VARIABLES INDEPENDIENTES
BASANDOSE EN ESTUDIOS ANTERIORES, EN
MODELOS TEÓRICOS O EL CONOCIMIENTO LÓGICO
INTUITIVO DEL INVESTIGADOR
DISEÑO DE LA INVESTIGACIÓN
TAMAÑO MUESTRAL
DEBE CONSIDERARSE EL NÚMERO DE VARIABLES
INDEPENDIENTES
SE SUGIEREN 20 OBSERVACIONES POR VARIABLE.
TAMAÑO MÍNIMO CINCO OBSERVACIONES POR
VARIABLE
SE DEBE CONSIDERAR EL TAMAÑO MUESTRAL DE
CADA GRUPO. SE SUGIERE 20 OBSERVACIONES POR
GRUPO. COMO MÍNIMO EL TAMAÑO DEL GRUPO
MAS PEQUEÑO DEBE SER MAYOR QUE EL NÚMERO
DE VARIABLES
SUPUESTOS DEL ANÁLISIS
DISCRIMINANTE
NORMALIDAD
NORMALIDAD MULTIVARIANTE DE LAS VARIABLES
INDEPENDIENTES
SI NO SE CUMPLE PROBAR CON REGRESIÓN LOGÍSTICA
HOMOGENEIDAD DE LAS MATRICES DE COVARIANZA
MATRICES DE COVARIANZAS DISTINTAS CAUSAN
SOBRECLASIFICACIÓN EN AQUELLOS GRUPOS CON MATRICES
MAS GRANDES
INCREMENTAR EL TAMAÑO MUESTRAL
USAR FUNCIONES CUADRÁTICAS
LINEALIDAD
LOS EFECTOS NO LINEALES NO SON DETECTADOS
CASOS ATÍPICOS
TIENEN GRAN EFECTO EN LA
PRECISIÓN CLASIFICATORIA DEL
ANÁLISIS DISCRIMINANTE. SE
ACONSEJA SU DETECCIÓN Y
ELIMINACIÓN DE SER NECESARIO
ESTIMACIÓN DEL MODELO
DISCRIMINANTE
MÉTODO DE CÁLCULO
ESTIMACIÓN SIMULTANEA
ESTIMACIÓN POR ETAPAS o PASO A PASO
Niveles de la
variable
independiente
Variables Not in the Analysis
Variables in the Analysis
Min. Wilks'
Wilks' Step Tolerance Tolerance F to Enter Lambda
Step Tolerance F to Remove Lambda 0 Consumo (l/100Km) 1.000 1.000 88.094 .684
1 Cilindrada en cc Cilindrada en cc 1.000 1.000 139.486 .577
1.000 139.486
Potencia (CV) 1.000 1.000 60.165 .760
2 Cilindrada en cc .218 85.182 .760 Peso total (kg) 1.000 1.000 111.755 .630
Potencia (CV) .218 19.035 .577 Aceleración 0 a 100
1.000 1.000 15.076 .927
3 Cilindrada en cc km/h (segundos)
.169 94.312 .753
Año del modelo 1.000 1.000 8.826 .956
Potencia (CV) .210 12.455 .536 Número de cilindros 1.000 1.000 109.099 .636
cilindr=4 | cilindr=6 cilindr=4 | cilindr=6
.292 8.377 .525 1.000 1.000 49.889 .792
(FILTRO) (FILTRO)
1 Consumo (l/100Km) .318 .318 5.232 .562
4 Cilindrada en cc .168 95.574 .724
Potencia (CV) .218 .218 19.035 .525
Potencia (CV) .204 10.160 .506 Peso total (kg) .191 .191 5.300 .562
cilindr=4 | cilindr=6 Aceleración 0 a 100
.291 8.626 .503 .713 .713 5.648 .561
(FILTRO) km/h (segundos)
Año del modelo .852 .852 11.031 .546
Año del modelo .831 8.605 .503
Número de cilindros .150 .150 1.303 .573
5 Cilindrada en cc .102 53.752 .594 cilindr=4 | cilindr=6
.304 .304 14.814 .536
Potencia (CV) .198 10.234 .487 (FILTRO)
2 Consumo (l/100Km) .291 .182 5.505 .510
cilindr=4 | cilindr=6
.289 8.538 .483 Peso total (kg) .187 .127 5.435 .510
(FILTRO)
Aceleración 0 a 100
Año del modelo .511 .156 1.071 .522
.803 10.856 .489 km/h (segundos)
Peso total (kg) .180 7.461 .481 Año del modelo .832 .213 8.355 .503
Número de cilindros .149 .090 2.010 .519
cilindr=4 | cilindr=6
.292 .169 8.377 .503
(FILTRO)
3 Consumo (l/100Km) .291 .144 5.284 .489
Peso total (kg) .186 .106 5.239 .489
Aceleración 0 a 100
.507 .154 1.131 .500
km/h (segundos)
Año del modelo .831 .168 8.605 .481
Número de cilindros .116 .090 .487 .501
4 Consumo (l/100Km) .225 .142 3.503 .472
Peso total (kg) .180 .102 7.461 .462
Wilks' Lambda
Wilks'
Test of Function(s) Lambda Chi-square df Sig. Significativo, existen
1 through 2 .462 292.387 10 .000
2 .932 26.730 4 .000
diferencia entre los
grupos
INTERPETACIÓN DE LOS RESULTADOS
PONDERACIONES
DISCRIMINANTES
ESTANDARIZADAS:
ESTUDIAR EL SIGNO: Standardized Canonical Discriminant Function Coefficients
relación inversa (-), Function
capacidad discriminante de
la función que las
pequeñas
INTERPETACIÓN DE LOS RESULTADOS
Function
CORRELACIONES DE Cilindrada en cc
1
.849*
2
-.101
ESTRUCTURA: Miden la Peso total (kg) .754* -.358
Número de cilindros a .743* -.123
correlación entre cada VI Consumo (l/100Km) a .595* -.438
-.508* .029
y representan la (FILTRO)
Aceleración 0 a 100
contribución de cada
a -.252* -.187
km/h (segundos)
Año del modelo -.129 .634*
variable a la función. Se Pooled within-groups correlations between discriminating
discriminacion entre
los grupos de la VD.
La funcion 2
La funcion 1 discrimina
discrimina entreEuropa
entre EU y y Jap ubica
Europa-Jap. en el centro
a EU
Classification Resultsa
País de origen
EE.UU. Europa Japón
Cilindrada en cc .011 .007 .008
Potencia (CV) .472 .509 .521
Peso total (kg) -.003 .001 -.006
Año del modelo 7.575 7.355 7.572
cilindr=4 | cilindr=6
42.170 39.293 39.288
(FILTRO)
(Constant) -347.312 -326.303 -340.087 Se sustituyen los
Fisher's linear discriminant functions valores en cada una
de las funciones, se
ubica el sujeto en la de
mayor puntaje.
VALIDACIÓN DE LOS
RESULTADOS
DIVIDIR LA MUESTRA TOTAL EN DOS PARTES, UNA PARA ESTIMAR
EL MODELO Y OTRA PARA MEDIR LA PRECISIÓN CLASIFICADORA
DIVIDIR ALEATORIAMENTE LA MUESTRA VARIAS VECES Y
CALCULAR UN PROMEDIO DE LA PRECISIÓN CLASIFICADORA
MÉTODO U: TOMAR K-1 MUESTRAS OBVIANDO UNA
OBSERVACIÓN, ESTIMAR EL MODELO Y CLASIFICAR LAS
OBSERVACIONES PARA MEDIR LA PRECISIÓN
MÉTODO JACKNIFE: IGUAL QUE EL ANTERIOR PERO SE CENTRA
EN LA ESTABILIDAD DE LOS COEFICIENTES DISCRIMINANTES