Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EVALUACIÓN ACTIVIDAD 4
ANÁLISIS DISCRIMINANTE
Test normalidad:
Test--royston
En el test el valor p es pequeño, por lo tanto, existe evidencia significativa para rechazar la
hipótesis nula. La muestra no proviene de una población con distribución normal
multivariada.
0.4
0.2
x1
-0.2 0.0
x1
-0.6
-0.6
5
0.0
4
-0.8 -0.6 -0.4 -0.2
x3
x2
2
1
0.6
0.4
0.2
x1
-0.2 0.0
-0.6
0.8
0.6
x4
0.4
0.2
variables (x1,x2) y (x1,x3) están separados de forma marcada, no asi los pares de variables (x 1,x4).
b) Usando los pares de observación n1 = 21 (x1, x2) para empresas en quiebra y los pares de
observaciones n2 = 25 (x1, x2) para empresas no en bancarrota, calcule los vectores de muestra
Sol:
Promedio y Covarianzas de las Empresas en quiebra
Variables para realizar el análisis:
x1: CF/TD (Flujo de caja/total efectivo).
x2: NI/TA (Ingreso neto/activos totales).
Vector de medias
1: -0.06809524 2: -0.1885714.
Covarianza
x1 x2
x1 0.04406619 0.03209214
x2 0.03209214 0.09507286
1: 0.2153846 2: 0.04307692
Covarianza
x1 x2
x1 0.047051000 0.008507167
x2 0.008507167 0.002375667
C) Utilizando los resultados en b y suponiendo que ambas muestras aleatorias son de
poblaciones normales bivariadas, construya la regla de clasificación (11-29) con p1 = p2 y
c (1 | 2) = c (2 | 1).
Clasificación
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
[36] 2 2 2 2 2 2 2 2 2 2 2
-0.4
-0.6
-0.8
x1: CF/TD
d) Evalúe el rendimiento de la regla de clasificación desarrollada en c) calculando la tasa
de error aparente (APER) de (11-34) y la tasa de error real esperada E (AER) de (11-36).
función discriminante lineal de la muestra de Fisher en (11-19). Use esta función para
Solución:
x1 x2
x1 0.04776511 0.02015032
x2 0.02015032 0.04672549
Su<-(21*S1+25*S2)/(21+25-2) # 2x2
Su
Su.inv<-solve(Su)
ta<-t(x1-x2)
ta
a<-(ta)%*%Su.inv
[,1]
- 4.698152 x1 - 2.931571 x2
-
Las predicciones y clasificación de la variable x1 y x2 resultaron:
Clase predicha
Clase real 1 2
1 11 10
2 3 22
e) Repita las partes b-e usando los pares de observación (x1, x3) y (x1, x4). ¿Algunas
variables parecen ser mejores clasificadores que otras? Explique