Está en la página 1de 17

Temario

• Proceso de Mineria de Datos


• Tratamiento de Datos con RapidMiner

Minería de Datos (Sesión 2)


Curso taller en computadora preparado como apoyo a buenas
practicas profesionales y actualización en la materia de Auditoria
Forense.

Lic. Jose L. Ticona Caba

1
Minería de Datos
Repaso: Proceso de Minería de Datos

LEER DATOS

PASARLOS A UN
PROCESO DE
VALIDACION

ENTRENAR AL MODELO

EVALUAR EL MODELO

OBTENER RESULTADOS

Lic. Jose L. Ticona Caba


Tratamiento de datos con RapidMiner
Tipos de Atributos

Lic. Jose L. Ticona Caba


Tipos de Atributos

Atributos regulares

Num_ope PK Estado_label Regional Cod_agencia Agencia


1 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
2 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
3 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
4 CUMPLIMIENTO DEPARTAMENTO A 60610 AGENCIA E
5 CUMPLIMIENTO DEPARTAMENTO A 60110 AGENCIA H
6 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
7 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
8 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
9 CUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
10 CUMPLIMIENTO DEPARTAMENTO A 60410 AGENCIA M
11 INCUMPLIMIENTO DEPARTAMENTO A 60210 AGENCIA F
12 INCUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
13 INCUMPLIMIENTO DEPARTAMENTO A 60310 AGENCIA L
14 INCUMPLIMIENTO Lic. Jose L. TiconaACaba
DEPARTAMENTO 60410 AGENCIA M
Ejemplo

Adicionar Data

Dirigirse a la sección de
repositorio en la parte izquierda
y hacer clic en Add Data.

Lic. Jose L. Ticona Caba


Ejemplo

Importar Data

Importar data desde un archivo


Excel, CSV, SAS o Access o
desde una base de datos del
sistema.

Para este caso elegimos My


Computer.

Lic. Jose L. Ticona Caba


Ejemplo

Ubicar el archivo de importación


Se efectúa la búsqueda del
archivo a importar y se hace clic
en next.

Lic. Jose L. Ticona Caba


Ejemplo

Selección de celdas para importación

Sheet: seleccionar la pestaña


del archivo a importar.
Cell range: de que fila a que fila
se efectuara la importación.
Select All: efectuar una
selección de todo:
Define Header row: Define la
fila la cual será el encabezado.

Para este caso hacemos clic en


next.
Lic. Jose L. Ticona Caba
Ejemplo

Formato de columnas

Se puede dar formato a la fecha


y remplazar valores en posibles
errores de los datos.

Para este caso hacemos clic en


next.

Lic. Jose L. Ticona Caba


Ejemplo

¿Dónde se van a almacenar los datos?

Guardamos la data en el
repositorio local de Rapid
Miner, también verificamos el
nombre con el cual se va
guardar.

Posteriormente hacemos clic en


finish.

Lic. Jose L. Ticona Caba


Ejemplo

Resultados de importación - VISUALIZACIÓN DE LA DATA

Podemos tener toda la


visualización de toda la data
para efectuar el análisis de
datos.

Lic. Jose L. Ticona Caba


Ejemplo

Resultados de importación - ESTADÍSTICAS

Los resultados de importación


muestran:
Name: el nombre de la columna
o atributo:
Type: el tipo de atributo,
numérico, categorico, entero.
Missing: numero de valores
perdidos.
Estadísticas: como el valor
mínimo o máximo o el conteo
de atributos categóricos.
Además muestra un promedio
estadístico por cada atributo.

Lic. Jose L. Ticona Caba


Ejemplo

Resultados de importación - ESTADÍSTICAS

Los resultados de importación


muestran:
Statistics: la herramienta
también permite ver un grafico
de barras por atributo,
haciendo clic en el atributo.

Filter: en la parte superior se


pueden efectuar filtros de
determinados atributos para
observaciones especificas en el
caso de tener mas de 10
atributos.

Lic. Jose L. Ticona Caba


Ejemplo

Resultados de importación – GRÁFICOS DE ANÁLISIS

La herramienta para el análisis de


datos permite observar multiples
percepciones del comportamiento
de los datos.
Como:
Dispersiones multiples y matriz
Dispersiones en 3D.
burbujas,
Paralelos y Series.
Encuestas,
Bloques, histogramas.
Paretos, tortas.
Barras apiladas,
cuartiles.
superficies en 3D.
Lic. Jose L. Ticona Caba
GRACIAS
Gestiona tus riesgos, gestiona tu empresa.

Lic. Jose L. Ticona Caba


jticonacaba@gmail.com

También podría gustarte