Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Rapiminner Anny Sergio Cristian
Rapiminner Anny Sergio Cristian
Universidad de Pamplona
Ingeniería en Sistemas
2023
Paso 1.
Primero se debe importar la data en “Select the cells to import” con el fin de elegir las
celdas o columnas específicas de un conjunto de datos que se desea cargar en el entorno de
RapidMiner.
Paso 2.
Despues se ordenan las columnas según la apertura, presión y temperatura con la data
anteriormente cargada.
Paso 3.
En este paso el “Select task” es una funcionalidad que permite definir y configurar la
tarea que se realizara en el flujo de trabajo de minería de datos, entre ellos encontramos:
Clasificación, regresión, agrupación, análisis de series temporales, asociación, test mining,
detección de anomalías, selección de características, entre otros. En este caso se seleccionó
clusters con el fin de realizar un análisis y minería de datos
Paso 4.
Una vez se prepara la data con la opción seleccinada, se debe seleccionar las entradas,
específicamente esta función permite seleccionar y filtrar las columnas o atributos de un
conjunto de datos.
Paso 5.
Se selecciona el tipo de modelo, en este caso hay dos: El algoritmo K-Means es una
técnica de clustering que se utiliza en RapidMiner para agrupar datos en clústeres con
características similares y el algoritmo X-means el cual es una extensión del algoritmo K-Means
utilizado para el agrupamiento de datos. Mientras que K-Means requiere que se especifique de
antemano el número de grupos (clusters), X-Means es una versión más flexible que busca
automáticamente determinar el número óptimo de clusters en función de la estructura de los
datos.
Paso 6.