Está en la página 1de 3

Nombres:

Apellidos:
Cédula:
Correo electrónico institucional:

Nota: el archivo de Word que van a cargar en la plataforma con la solución del taller debe ir
nombrado de la siguiente manera: cédula_1er apellido_2do apellido

Taller Análisis de Segmentación / Análisis Clúster


Base de datos: Prueba Saber Pro

1 (30ptos).
Objetivo general de Minería de Datos:
Segmentar los estudiantes xxxxxxxxxxxxxxxx que presentaron la prueba Saber Pro por medio de
sus variables xxxxxxxxxxxx para mejorar su rendimiento académico en la prueba 2024.

Objetivos específicos de Minería de Datos:


 Caracterizar los grupos encontrados por medio de estadística descriptiva para entender el
perfil del estudiante en cada segmento.
 Entregar estrategias que mejoren el rendimiento académico en la prueba 2024.

2 (15ptos). (análisis).
Cuadro descripción de variables que va a utilizar en la segmentación (análisis).

3 (30ptos). (análisis).
Estadística descriptiva de las variables que va a utilizar en la segmentación (análisis).

4 (15ptos). (análisis).
Selección del número de grupos óptimos para la segmentación K=(?), tres métodos: Suma de
cuadrados del error SSE (codo), Segmentación jerárquica (dendograma), DBSCAN.
4.1 Suma de cuadrados del error SSE (codo)
4.2 Coeficiente de Silueta
4.3 Segmentación jerárquica (dendograma)
4.4 DBSCAN

5 (30ptos).
Carnetización de los segmentos / Perfil de los segmentos / Target de los segmentos
La redacción de las características debe ser totalmente cuantitativas y no cualitativas.

Clúster 0 Clúster 1 Clúster 2 Clúster “n”……….


Nombre del Nombre del Nombre del Nombre del
segmento segmento segmento segmento
Caracterización del Caracterización del Caracterización del Caracterización del
segmento segmento segmento segmento
X X X X
X X X X
X X X X
X X X X
X X X X
X X X X

6 (30ptos). (análisis).
Estrategias que van a dar respuesta al “para” del objetivo general de MD (Para = mejorar su
rendimiento académico en la prueba 2024), estas estrategias deben salir de las características
encontradas en cada segmento ósea que el sustento de las estrategias son las características
encontradas en cada segmento.

Estrategia Análisis estrategia


Estrategia Clúster 0 (nombre clúster):
X
X
Estrategia Clúster 1 (nombre clúster):
X
X
Estrategia Clúster 2 (nombre clúster):
X
X
Estrategia Clúster 3 (nombre clúster):
X
X

https://docs.google.com/spreadsheets/d/1rlcGtYhWPhwb5fozp8gdF-0lopP46Oy3/
edit#gid=291520888

Nodos Segmentación:

Excel Reader
Row Filter
Column Filter
Category To Number
GroupBy
Normalizer
SimpleKMeans (3.7)
k-Means

Denormalizer
Excel Writer

ROC Curve (local)


Silhouette Coefficient

Color Manager
Data Explorer
Scatter Matrix (local)
Scatter Plot (local)
Pie chart (local)
Silhouette Coefficient

Optimized K-Means (Silhouette Coefficient)


https://hub.knime.com/knime/spaces/Examples/latest/00_Components/Automation/
Optimized%20K-Means%20(Silhouette%20Coefficient)~XCtuVNVeuqHSQkqk

Distance Matrix Calculate


Hierarchical Cluster View
Hierarchical Clustering (DistMatrix)

Hierarchical Cluster Assigner


Hierarchical Clustering

Hierarchical Clustering and Heatmap

Numeric Distances
DBSCAN

También podría gustarte