Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ML Metodos de Validacion
ML Metodos de Validacion
VALIDACION
¿Como se verifica que el modelo haya aprendido?
Existe una ligera pérdida de eficiencia debido a que no se usa el total de las
muestras, pero si el conjunto de muestras es lo suficientemente grande no hay
problema.
Entrenamiento y prueba
Train y test
M1
M2
M3
Conjunto de
aprendizaje M4
M5
M6
M7
M8
Conjunto de
M9
Recuperación
M10
Notas adicionales:
5 20%
10 10%
100 1%
200 .5%
1000 .1%
Entrenamiento y prueba - Ejemplo
Suponga la base de datos de iris plant:
150 Muestras,
Experimento 4:
Porc. error: 0 %
Versicolor 0 Clasificados como Setosa
Porc. eficiencia: 100% 10 Clasificados como Versicolor
0 Clasificados como Virginica
1 76.66 23.33
2 86.66 13.33
3 93,33 6.66
4 100 0
5 96.66 3.33
❖ Validación cruzada:
➢ El error estimado es disperso
➢ Intervalo de confianza demasiado grande
❖ Bootstrap
➢ Genera limites de confianza mas cercana
➢ Taza de error optimista, esto es, reducida
➢ Preferible cuando el conjunto de datos sea pequeño
Un conjunto aleatorio de tamaño n se toma del conjunto original con reemplazo
para formar los subconjuntos de aprendizaje y prueba. Seleccionar con reemplazo
significa que, por ejemplo, que algunas muestras serán omitidas. También
algunos de las muestras aparecerán mas de una vez en los conjuntos
Esto nos da un estimado de error para cada conjunto. El promedio de error entre
todas estas es usado para indicar el error del clasificador.
Se definen N experimentos y para cada experimento los subconjuntos de
aprendizaje y recuperación
REFERENCIAS