Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apellidos:
Cédula:
Correo electrónico institucional:
Nota: el archivo de Word que van a cargar en la plataforma con la solución del taller debe ir
nombrado de la siguiente manera: cédula_1er apellido_2do apellido
1 (30ptos).
Objetivo general de Minería de Datos:
Segmentar los estudiantes xxxxxxxxxxxxxxxx que presentaron la prueba Saber Pro por medio de
sus variables xxxxxxxxxxxx para mejorar su rendimiento académico en la prueba 2024.
2 (15ptos). (análisis).
Cuadro descripción de variables que va a utilizar en la segmentación (análisis).
3 (30ptos). (análisis).
Estadística descriptiva de las variables que va a utilizar en la segmentación (análisis).
4 (15ptos). (análisis).
Selección del número de grupos óptimos para la segmentación K=(?), tres métodos: Suma de
cuadrados del error SSE (codo), Segmentación jerárquica (dendograma), DBSCAN.
4.1 Suma de cuadrados del error SSE (codo)
4.2 Coeficiente de Silueta
4.3 Segmentación jerárquica (dendograma)
4.4 DBSCAN
5 (30ptos).
Carnetización de los segmentos / Perfil de los segmentos / Target de los segmentos
La redacción de las características debe ser totalmente cuantitativas y no cualitativas.
6 (30ptos). (análisis).
Estrategias que van a dar respuesta al “para” del objetivo general de MD (Para = mejorar su
rendimiento académico en la prueba 2024), estas estrategias deben salir de las características
encontradas en cada segmento ósea que el sustento de las estrategias son las características
encontradas en cada segmento.
https://docs.google.com/spreadsheets/d/1rlcGtYhWPhwb5fozp8gdF-0lopP46Oy3/
edit#gid=291520888
Nodos Segmentación:
Excel Reader
Row Filter
Column Filter
Category To Number
GroupBy
Normalizer
SimpleKMeans (3.7)
k-Means
Denormalizer
Excel Writer
Color Manager
Data Explorer
Scatter Matrix (local)
Scatter Plot (local)
Pie chart (local)
Silhouette Coefficient
Numeric Distances
DBSCAN