Foundations
Qué es Machine Learning
• Usa los datos de prueba (testing) para ver como encaja el algoritmo
estadístico o matemático con los datos.
• Probar los resultados del modelo con el set de test (Testing datasets)
• Realizar pruebas con varios algoritmos para determinar cuál presenta mejores
resultados.
• Precisos y estables
• Aprendizaje Supervisado.
• Se le muestran los datos al algoritmo (datos – label)
• Aprendizaje no supervisado
• Se le muestran los datos sin label
• La maquina crea las reglas e identifica patrones.
• Crea los labels.
• Se necesitan muchos datos para que el algoritmo haga observaciones por si
mismo.
• Semisupervisado
• Tutor y datos.
Aprendizaje Supervisado
Fuente:https://developers.google.com/machine-learning/crash-course/regularization-for-sparsity/l1-regularization?hl=es-419
Tasa de aprendizaje
• La tasa de aprendizaje afecta la velocidad a la que el algoritmo alcanza (se converge en) las
ponderaciones óptimas.
• Son las actualizaciones de las ponderaciones del modelo por cada ejemplo de datos que
encuentre.
• Una tasa de aprendizaje demasiado elevada podría impedir que las ponderaciones alcancen
la solución óptima.
• Un valor demasiado pequeño hace que el algoritmo requiera muchos pases para alcanzar las
ponderaciones óptimas.
Ruido
• Mayor complejidad hace el modelo más flexible peor más difícil de manejar.
• De la probabilidad de ocurrencia de la
variable de salida.
Árboles de decisión
Salir al parque
Si No
9 5
𝑐 Entropía(salir) = Entropía(5,9)
= Entropía (0.36,0.64)
𝐸 ( 𝑆 )=∑ − 𝑝𝑖 𝑙𝑜𝑔 2 𝑃𝑖
𝑖=1
= (0.36log0.36- 0.64log0.64
= 0.94
• La ganancia de información
consiste en un decremento de
la entropía del sistema.
K-nearest neighbor
Peso
• Necesita mucho poder de computación, por lo que
es difícil correrlo con grandes datasets.
• Distancia Canberra: Versión ponderada de las distancia del taxista. Se usa para comparar
listas rankeadas. La distancia no varía ante cambios de escala.
K-means clustering (No supervisado)
Peso
• Los centroides se colocan de manera
aleatoria y se van moviendo según la
cantidad de datos mal clasificados. La Altura
distancia se puede reducir.
Redes bayes Naive