Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Elaborado por:
Grupo:
202016908_28
Tutor:
Javier Leonardo Pineda Uribe
la cantidad de casos positivos que fueron clasificados correctamente como positivos por el
de clasificación para identificar con precisión las instancias positivas de una clase en un
conjunto de datos.
Verdaderos negativos
la cantidad de casos negativos que fueron clasificados correctamente como negativos por el
de clasificación para identificar con precisión las instancias negativas de una clase en un
conjunto de datos.
Falsos positivos
de casos negativos que fueron incorrectamente clasificados como positivos por el modelo
de clasificación; los FP son un tipo de error que puede cometer un modelo de clasificación,
costosas.
falsos negativos
Los Falsos Negativos (FN) son un término que se utiliza en el contexto de la matriz
cantidad de casos positivos que fueron incorrectamente clasificados como negativos por el
modelo de clasificación; los FN son un tipo de error que puede cometer un modelo de
proporción de predicciones positivas hechas por el modelo que son realmente correctas, se
En esta fórmula:
• Los Verdaderos Positivos (VP) son los casos positivos que fueron clasificados
• Los Falsos Positivos (FP) son los casos negativos que fueron incorrectamente
una métrica de evaluación de modelos de clasificación que mide la capacidad del modelo
para identificar correctamente todos los casos positivos en un conjunto de datos, se calcula
En esta fórmula:
• Los Verdaderos Positivos (VP) son los casos positivos que fueron clasificados
• Los Falsos Negativos (FN) son los casos positivos que fueron incorrectamente
la precisión y el recall en una sola métrica para proporcionar una medida más completa del
2 ∙ 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 ∙ 𝑅𝑒𝑐𝑎𝑙𝑙
𝐹1 𝑆𝑐𝑜𝑟𝑒 =
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙
de las predicciones positivas son realmente correctas) y el recall (cuántos de los casos
problemas de clasificación donde hay un desequilibrio entre las clases o cuando los Falsos
una métrica de evaluación de modelos de clasificación que mide la capacidad del modelo
para identificar correctamente todos los casos negativos en un conjunto de datos. Se calcula
En esta fórmula:
• Los Verdaderos Negativos (VN) son los casos negativos que fueron clasificados
• Los Falsos Positivos (FP) son los casos negativos que fueron incorrectamente
la tasa de verdaderos positivos (TPR) frente a la tasa de falsos positivos (FPR) en un rango
de umbrales de clasificación.
𝑆𝑆𝑅
𝑅2 = 1 −
𝑆𝑆𝑇
Donde:
diferencias entre los valores reales de la variable dependiente y las predicciones del
• SST (Suma de Cuadrados Total) es la suma de los cuadrados de las diferencias entre
de los datos.
En algunos casos extremos, R-cuadrado puede tener un valor menor que cero también,
lo que significa que los valores predichos del modelo funcionan peor que solo tomando la
el modelo, lo que lo hace útil para comparar modelos con diferentes números de predictores
siguiente:
2 (1 − 𝑅2 ) ∙ (𝑛 − 1)
𝑅𝑎𝑗𝑢𝑠𝑡𝑎𝑑𝑜 =1−
𝑛−𝑝−1
Donde:
• R² es el R cuadrado convencional.
modelo estadístico, el objetivo principal del MLE es encontrar los valores de los parámetros
análisis de series temporales, los AIC proporcionan una forma de seleccionar el modelo que
mejor se ajusta a los datos observados mientras penaliza la complejidad del modelo, el AIC
𝐴𝐼𝐶 = −2 ∗ ln(𝐿) + 2 ∗ 𝑘
Donde:
muestra se divide por igual, tiene una entropía de 1, el cálculo de la entropía se realiza de la
característica particular.
resultantes.
significa que reduce la entropía y hace que los subconjuntos resultantes sean más puros.
Esto se utiliza para construir árboles de decisión que pueden clasificar datos de manera
efectiva.
Ganancia de información
1. Se calcula la entropía del nodo padre antes de la división, que mide la impureza en
ese nodo.
𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 𝑑𝑒 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑐𝑖ó𝑛 =
menor sea el valor del Índice de Gini, más puro o homogéneo se considera el conjunto de
el nodo. Esto implica calcular la suma ponderada de las impurezas de las clases
característica específica.
subconjuntos resultantes.
división.