Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Examen Final
Examen Final
Unsupervised Learning
Supervised Learning
Es un tipo de machine learning donde el algoritmo esta entrenado en datos etiquetados, esto
quiere decir que los datos de entrada son usados para entrenar se combinan con las etiquetas
de salidas, el objetivo es aprender un mapeo de los datos de entrada a la salida correcta.
Reinforcement Learning
Lo podemos evitar buscando el menor grado del modelo que calze mejor a los datos, esto nos
ahorraría dinero y menor tiempo de análisis.
Por lo general el conjunto de entrenamiento suele estar en el rango de 70-80% del conjunto
total, y el conjunto de validación entre 10-15% y por ultimo conjunto de prueba esta en el
rango 10-20%.
Error absoluto medio: esto calcula el promedio de las diferencias absolutas entre predicción y
valores reales.
Error cuadrático medio: calcula el promedio de las diferencias cuadráticas entre predicciones y
los valores reales.
Raíz del error cuadratico medio: es la raíz cuadrada del error cuadratico medio
Error porcentual absoluto medio: calcula el promedio de los errores porcentuales absolutos
entre predicciones y valores reales
9. ¿Cuáles son las aplicaciones del aprendizaje automático supervisado en las empresas
modernas?
La regresión se utilizara cuando para las variables de salida tipo continua, en cambio para la
clasificación son de tipo discreto
Los arboles de aprendizaje son modelos muy usados para métodos de conjuntos. Los
apéndices fuertes compuestos de multiples arboles pueden llamarse bosque, el enfoque
bosque aleatorio es un método bagging donde los aroles profundos se combinan para producir
una salida con una varianza baja
El sesgo es la simplificación que realiza un modelo con respecto a la realidad, el sesgo alto
tiende a hacer suposiciones, un modelo con sesgo alto puede subestimar o sobreestimar
sistemáticamente la verdadera relación entre las variables.
Sesgo y varaianza bajos: el modelo se ajusta bien a los datos de entrenamiento y generaliza
bien los nuevos datos
Sesgo bajo y varianza alta: el modelo puede ajustarse demasiado a los datos de entrenamiento
y no generalizar bien a nuevos datos.
Sesgo alto y varianza baja: el modelo es demasiado simple y no se ajusta bien a los datos de
entrenamiento ni generaliza bien a los nuevos datos
Es una técnica utilizada para evaluar el rendimiento de un modelo estadístico y garantizar que
sea capaz de generalizar bien los datos no vistos, el propósito es proporcionar una estimación
mas precisa del rendimiento del modelo.
Entender el negocio: comprender la declaración del problema y comprender bien los datos y
obtener información de los expertos.
Limpieza de datos: aquí tendremos que mirar la datos y modificar según sea necesario sin
alterar su proposito
20. Para que sirve la data de validación luego del entrenamiento. Explicar en detalle.