Está en la página 1de 59

Análisis Discriminante

Dos problemas principales de clasificación


• Discriminación (clasificación supervisada)
• Agrupamiento (Cluster Analysis)
(clasificación no supervisada)
El problema estadístico de
discriminación
• Dadas dos poblaciones de elementos con
distribución conocida clasificar un nuevo
elemento en una de las dos poblaciones
Ejemplos
Clasificar:
• Restos de un cráneo como homínido o no
• Un solicitante de un crédito como solvente
o no
• Un paciente con cáncer o no
• Una obra de arte al autor A o B.
• Diseño de máquinas de clasificación (para
cartas, billetes,monedas, etc.)
Datos habituales

Elemento 1 Elemento 1

Matriz de datos
Elemento n2
Elemento n1
Grupo A Grupo B
Análisis de genes
Identificación de rasgos

.23 ….

Matriz Identificar
Rostro(pauta)

Clasificar como conocido o no


Problemas de clasificación

A
?
4
100 euros?

1000 dracmas?
Planteamiento general
Costes
Caso particular: Poblaciones normales
Tomando logaritmos, obtenemos la clasificación en P2
Interpretación de la regla: Simplificando lo que es común en
ambos miembros quedan solo términos lineales en x
Probab. de error y a posteriori
Interpretación
Clasificar en B
B

Clasificar en A

A
Fisher
Clasificar en población B

Clasificar en A

A
Enfoque de Fisher
Varios grupos
ejemplo
Discriminación cuadrática
Clasificación logística
Problemas del modelo lineal

• No hay garantía de que las probabilidades


estén entre cero y uno, pueden tomar
valores negativos o mayores que uno.
• Es heterocedástico.

Si estimamos el modelo lineal con variable de


clasificación –1 +1 se obtiene la función
lineal discriminante.
Otros enfoques:

• Redes neuronales
• Métodos no paramétricos
• Máquinas de vector soporte
redes neuronales
Aproximar la función

mediante
Máquinas de vector soporte

También podría gustarte