Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
CLASIFICACIÓN – PARTE II
2
RANDOM FOREST
3
RANDOM FOREST
• ¿Nos basta tomar un árbol de decisión?
• ¿Existirá sobreajuste?
4
RANDOM FOREST
5
RANDOM FOREST
• Características
• Se generan n árboles
6
RANDOM FOREST
• El resultado termina
siendo una “votación” de
los resultados que arroja
cada árbol.
• La predicción corresponde
a la clasificación más
votada entre los árboles
del bosque.
7
RANDOM FOREST
Ventajas Desventajas
8
ADABOOST
• Otra estrategia para mejorar los resultados del modelo.
9
REDES NEURONALES
• ¿Y si el modelo fuese
capaz de aprender
basado en una
experiencia anterior?
10
REDES NEURONALES
• Las redes neuronales están compuestas por:
• Nodos o neurona
Excitatoria o inhibidora
11
REDES NEURONALES
12
PERCEPTRON
13
ENTRENANDO AL PERCEPTRON
14
OBJETIVOS
• Mejorar su capacidad de generalización
15
APRENDIZAJE
• Supervisado
• Necesita datos preclasificados
• Formar los datos de entrenamiento y de test.
• No Supervisado
• No necesitan preclasificados
SOBREAJUSTE
16
CARACTERÍSTICAS
• Can learn directly from data.
• They exhibit good learning ability –better than other AI approaches
• Can learn from noisy or corrupted data
• Parallel information processing
• Computationally fast once trained
• Robustness to partial failure of the network
• Useful where data are available and difficult to acquire symbolic
knowledge
• Drawback of NN
• knowledge captured by a NN through learning (in weights –real numbers) is not in a
familiar form for human beings, e.g. if-then rules (NNs are black box structures).
• Over fitting issues.
17
MINERÍA DE DATOS
18