Documentos de Académico
Documentos de Profesional
Documentos de Cultura
de Cádiz
C
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
A
B
Análisis Discriminante
Análisis Discriminante
Análisis Discriminante
j p caso n =2 y p =2
Ejemplo:
Consideremos individuos pertenecientes a dos poblaciones (rojos y azules)
para los que están medidos 2 variables. De acuerdo con lo anteriormente
explicado la función discriminante lineal dividirá al plano en dos semiplanos.
semiplanos
Se construye con los criterios ya señalados, de tal forma que la probabilidad
de asignar un nuevo individuo a la población correcta tenga la máxima
probabilidad
F ( w) z d1 x1 d 2 x2
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Ejemplo: caso n =2 y p =2
F ( w) z d1 x1 d 2 x2
w es de P si F(w)> F(M)
w es de P1 si F(w)< F(M)
P
2
M M2 ? 2
M 1
2 P
1
M
2 M
M
1
z d1 x1 d 2 x2
F(M)
Análisis Discriminante
F ( w) z d1 x1 d 2 x2 .... d p x p
¿C las
¿Con l 10 variables
i bl consideradas
id d podríamos
dí clasificar
l ifi un país
í en Europeo
E SI/NO?
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Diagrama de Dispersión
40 EUROPEO SI/NO
0
1
30
Tasa Suicidios
20
10
0
0 2 4 6 8 10
Renta (X 10000,0)
Diagrama de Dispersión
15 EUROPEO SI/NO
0
1
12
Ga 6
0
0 3 6 9 12 15
Camas Hospitalarias
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Función discriminante
Ce t o des
Centroides
F (M ) = 2,33842 M = centroide grupo
0 0
países no europeos
Análisis Discriminante
p
Capacidad predictiva
p de las variables
Hemos supuesto hasta ahora que las variables que deben intervenir en el
modelo del Análisis Discriminante están determinadas de antemano. En la
práctica
á seleccionaremos el menor número
ú posible de variables que tengan
la mayor capacidad de discriminación.
P
Procedimientos:
di i t
Diagrama de Dispersión
18 EUROPEO SI/NO
0
1
15
Consumo Petrolleo
12
0
0 3 6 9 12 15
Gasto Social Mayores
Diagrama de Dispersión
EUROPEO SI/NO
0
1
(X 1000,0)
6
5
n CO2
Emision 4
3
2
1
18
0 15
12
9
0 3 6
6 3
9 12 15 0Consumo Petroleo
Gasto Social Mayores
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
Estimación de la p
probabilidad de asignación
g correcta
Extraer
x
Reasignar
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Añadiríamos en la base de datos una nueva fila con los valores de las 10
Variables p
para un nuevo individuo (país),
(p ), dejando
j en blanco la variable
Europeo Si/No. Ejecutaríamos de nuevo el análisis discriminante y el
modelo predeciría si un país es europeo o no
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
Pie
40
63
38
Diagrama de dispersión 53
Sexo
36
0
1
43 34
46 150 160 170 180 190
44 150 160 170 180 190
42 Estatura Estatura
Pie
40
38
36 93
83
34 73
63
150160170 53
18019043 Peso
Estatura
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
j p 1: Fichero Medifis
Ejemplo
La función de discriminación F es
Coeficientes de Función
-0,0881421*Estatura - 0,00587257*Peso + 0,650276*Pie
Discriminante para Sexo +0,134223*Lbrazo
+0 134223*Lbrazo + 0,123645*Aespalda
0 123645*Aespalda - 0,202388*Dcraneo
0 202388*Dcraneo +
0,101001*Drt -18,3945
Coeficientes No Estandarizados
-------------------------------
1 Grupos de Centroides para Sexo F(M0)=-1,58073
Estatura -0,0881421 F(M1)=1,97591
Peso -0,00587257 -------------------------------
Pie 0,650276 1
Lbrazo 0,134223 0 -1,58073
1 1,97591
Aespalda 0,123645 F (M 0 ) F (M 1 )
Dcraneo -0,202388 ------------------------------- F (M ) 0,19759
Drt 0,101001 2
CONSTANTE -18,3945
------------------------------- Tabla de Clasificación
Actual Grupo Pronosticados Sexo
Sexo Tamaño 0 1
Asignación de nuevo individuo w: --------------------------------------------------------
Sustitución de los valores observados en 0 15 15
(100,00%)
0
( 0,00%)
la función discriminante.
discriminante 1 12 0 12
( 0,00%) (100,00%)
w es varón (1) si F(w)> 0,19759 --------------------------------------------------------
w es mujer (0) si F(w)< 0,19759 Porcentaje de casos correctamente clasificados: 100,00%
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
Análisis Discriminante
Long petalo
o
versicolor
6
Long sepalo virginica
Anch sepalo
4
Long petalo
Anch petalo 2
Anch sepalo
versicolor versicolor
8
ong petalo
0 3,6
3,2 2,4
2,8
4,3 5,3 6,3 7,3 2 2,4 2
8,3 Anch sepalo
Long sepalo 4,3 5,3 6,3 7,3 8,3
Long sepalo
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
-1,2
-3,2
32
-8 -4 0 4 8 12
Función 1
Métodos Estadísticos Multivariantes Facultad de CC. Sociales y Comunicación U. de Cádiz
Análisis Discriminante
Análisis Discriminante
Ejemplo 2: Fichero Flores Iris (Opción: eliminación progresiva/ selección hacia atrás)