Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Data
Computadora Programa
Output
Algunas definiciones
• Los ejemplos que el sistema usa para aprender se
llaman datos de entrenamiento (o training set).
• Cada ejemplo de entrenamiento se denomina
instancia de entrenamiento (training instance) o
muestra (sample).
• El ratio de instancias correctamente clasificadas es
una medida de rendimiento que se llama precisión
(accuracy) y se usa a menudo en tareas de
clasificación.
¿Porqué usar
aprendizaje automático?
¿Cómo construir un filtro de SPAM
utilizando técnicas tradicionales?
• Observe el aspecto típico del correo no deseado. Note
que algunas palabras o frases (como "tarjeta de
crédito", "gratis“, etc) aparecer mucho en el Asunto.
También note algunos otros patrones en el nombre del
remitente, el cuerpo del correo electrónico, etc.
• Escriba un algoritmo de detección para cada uno de los
patrones que se ha notado, y el programa marcará los
correos electrónicos como correo no deseado si se
detectan varios de estos patrones.
• Probar el programa y repetir los pasos anteriores hasta
que sea lo suficientemente bueno.
Filtro de Spam: Enfoque
tradicional
Filtro de Spam: Enfoque con ML
• Como el problema no es trivial, el programa
probablemente se convertirá en una larga lista de
reglas complejas, bastante difícil de mantener.