Está en la página 1de 6

APRENDIZAJE NO SUPERVSADO CON RAPIDMINNER

Anny Yojaxy Blanco Ruiz

Cristian Joel Martinez Ortega

Sergio Andres Valderrama Vera

Universidad de Pamplona

Facultad de ingenieras y arquitectura

Ingeniería en Sistemas

Ciencia de los Datos

Villa del Rosario

2023
Paso 1.

Primero se debe importar la data en “Select the cells to import” con el fin de elegir las
celdas o columnas específicas de un conjunto de datos que se desea cargar en el entorno de
RapidMiner.

Paso 2.
Despues se ordenan las columnas según la apertura, presión y temperatura con la data
anteriormente cargada.

Paso 3.

En este paso el “Select task” es una funcionalidad que permite definir y configurar la
tarea que se realizara en el flujo de trabajo de minería de datos, entre ellos encontramos:
Clasificación, regresión, agrupación, análisis de series temporales, asociación, test mining,
detección de anomalías, selección de características, entre otros. En este caso se seleccionó
clusters con el fin de realizar un análisis y minería de datos

Paso 4.
Una vez se prepara la data con la opción seleccinada, se debe seleccionar las entradas,
específicamente esta función permite seleccionar y filtrar las columnas o atributos de un
conjunto de datos.

Paso 5.

Se selecciona el tipo de modelo, en este caso hay dos: El algoritmo K-Means es una
técnica de clustering que se utiliza en RapidMiner para agrupar datos en clústeres con
características similares y el algoritmo X-means el cual es una extensión del algoritmo K-Means
utilizado para el agrupamiento de datos. Mientras que K-Means requiere que se especifique de
antemano el número de grupos (clusters), X-Means es una versión más flexible que busca
automáticamente determinar el número óptimo de clusters en función de la estructura de los
datos.
Paso 6.

Finalmente, se verán los resultados de dicho algoritmo aplicado a la data importada. Se


puede visualizar de diferentes formas como lo vendría siendo un Heat Map, Cluster Tree, entte
otros. Tambien se puede visualizar el valor mínimo, máximo, promedio y la desviación estándar
de cada columna como se puede visualizar en la siguiente imagen
Además de esto, se puede observar la correlación de estos datos.

También podría gustarte