Adrian Vasquez Control 02

Cargado por

Tran Sistor

0% encontró este documento útil (0 votos)

14 vistas4 páginas

Título original

Adrian_Vasquez_Control_02

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

14 vistas4 páginas

Adrian Vasquez Control 02

Cargado por

Tran Sistor

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 4

Buscar dentro del documento

Control Semana 2

Adrián Vásquez Parra

HERRAMIENTAS DE BUSINESS INTELLIGENCE

Instituto IACC
28-06-2020
Proceso de minería de datos.

Una organización dedicada a la venta de productos ferreteros, desea analizar

información que se encuentra en distintas bases de datos para obtener antecedentes
relevantes que permitan mejorar las ventas. Para ello el equipo de tecnología decide
realizar un proceso de unificación de los datos, comenzando con la limpieza, integración
y transformación de los datos. De acuerdo al caso presentado responda las siguientes
preguntas:
¿Cuáles son los métodos para limpiar los datos que se encuentran en las distintas
fuentes?
Los datos que normalmente se utilizan en sistemas informáticos y/o en forma
cotidiana algunas veces presentan inconsistencias o simplemente carecen de
información que podría ser relevante. El proceso de limpieza de datos consiste en
algunos métodos o formas de completar esa información faltante y según el contenido
de la semana permite “suavizar el ruido”, para ello se recurrirá a los diferentes métodos
que se explicaran brevemente a continuación:
Ignorar la tupla: Cuando la clasificación no encuentra la clase dentro de la tupla la
ignora completamente. No recomendable ya que si faltan muchas tuplas los resultados
no serán fidedignos o confiables.
Rellenar el Valor manualmente: Poco practico ya que si es mucha la información
faltante tomara mucho tiempo completar o rellenar dichos valores.
Usar constante global para rellenar: Si falta algún valor se puede reemplazar
automáticamente por un identificador o etiqueta como “N/A”, “desconocido”, “#”, etc. Si
bien se presenta como una opción viable en muchos casos, no es recomendable ya que
el programa de minería de datos puede considerar como “interesante” que este
elemento se repita muchas veces desviando la atención de los datos o información que
si puede ser relevante.
Usar el atributo para rellenar el valor faltante: en este caso se puede usar un valor
promedio del resto de los datos para completar el valor faltante.
Usar el atributo para todos los elementos que cumplan una clase: a diferencia del
anterior acá se usara una media relacionada a la clase a la cual pertenecen, por ejemplo
si falta el gasto en viajes en una tupla donde se puede clasificar por nivel de ingreso, se
promediara según su clasificación, por lo tanto no será el mismo valor para los de rango
alto que los que están en rangos mas bajos.
Utilizar el valor mas probable: Mediante la regresión lineal y herramientas basadas en
un árbol de decisión se puede predecir el dato faltante. Este método es el mas utilizado
ya que se utilizan los datos actuales para predecir los faltantes.

¿Cuál es el principal problema que se produce en la integración de los datos?

La integración de datos combina información de diferentes fuentes en un almacén de
datos coherente, esto puede llevar a conflictos en los valores por eso es necesario el
proceso de resolución de datos y allí radica su importancia.

¿Qué incluye el proceso de transformación de los datos?

Este proceso consiste en consolidar o convertir los datos en formas apropiadas para el
proceso de minería, en donde encontraremos los siguientes:
Suavizante: proceso para eliminar el ruido de los datos.
Agregación: donde se aplican operaciones de resumen o agregación de datos.
Generalización de los datos: cuando se encuentran datos de bajo nivel o primitivos
suelen sustituirse por datos de nivel superior a través de las jerarquías conceptuales.
Normalización: cuando los datos atributos se escalan para caer dentro de un rango
especificado.
Construcción característica donde nuevos atributos se construyen a partir de un
conjunto dado para facilitar el proceso de minería.
REFERENCIAS
IACC (2015), Introducción a la Inteligencia de negocios. Parte 2. Herramientas de
Business Intelligence. Semana 2

También podría gustarte

Adrian Vasquez Control 03 HDM
Documento5 páginas
Adrian Vasquez Control 03 HDM
Tran Sistor
Aún no hay calificaciones
Función de La JVM o Máquina Virtual de JAVA
Documento2 páginas
Función de La JVM o Máquina Virtual de JAVA
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 03
Documento6 páginas
Adrian Vasquez Control 03
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 03 HDM
Documento5 páginas
Adrian Vasquez Control 03 HDM
Tran Sistor
Aún no hay calificaciones
Malla
Documento1 página
Malla
Tran Sistor
Aún no hay calificaciones
Debe Respaldar La Confiabilidad de Usar El Software
Documento1 página
Debe Respaldar La Confiabilidad de Usar El Software
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 01
Documento4 páginas
Adrian Vasquez Control 01
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 03
Documento7 páginas
Adrian Vasquez Control 03
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 05
Documento2 páginas
Adrian Vasquez Control 05
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 02
Documento4 páginas
Adrian Vasquez Control 02
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 04 ABD
Documento5 páginas
Adrian Vasquez Control 04 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 04
Documento4 páginas
Adrian Vasquez Control 04
Tran Sistor
Aún no hay calificaciones
Abuelos de Luis
Documento4 páginas
Abuelos de Luis
Tran Sistor
Aún no hay calificaciones
Demostraciones matemáticas y lógica proposicional
Documento3 páginas
Demostraciones matemáticas y lógica proposicional
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 03 ABD
Documento5 páginas
Adrian Vasquez Control 03 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 01
Documento5 páginas
Adrian Vasquez Control 01
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 05 ABD
Documento3 páginas
Adrian Vasquez Control 05 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 02 ABD
Documento5 páginas
Adrian Vasquez Control 02 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 05 ABD
Documento3 páginas
Adrian Vasquez Control 05 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 06 ABD
Documento5 páginas
Adrian Vasquez Control 06 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 06 ABD
Documento5 páginas
Adrian Vasquez Control 06 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 02 ABD
Documento5 páginas
Adrian Vasquez Control 02 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 04 ABD
Documento5 páginas
Adrian Vasquez Control 04 ABD
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Final
Documento9 páginas
Adrian Vasquez Final
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 08
Documento8 páginas
Adrian Vasquez Control 08
Tran Sistor
Aún no hay calificaciones
Wa0001
Documento1 página
Wa0001
Tran Sistor
Aún no hay calificaciones
Adrian Vasquez Control 03 ABD
Documento5 páginas
Adrian Vasquez Control 03 ABD
Tran Sistor
Aún no hay calificaciones
Metalcon Manual de Construccion
Documento32 páginas
Metalcon Manual de Construccion
David Marcelo Celis Garrido
90% (10)
Manual Zenit 122 en Espanol Texto
Documento27 páginas
Manual Zenit 122 en Espanol Texto
Rodrigo Muñoz Mitev
0% (1)
Diccionario-Grupo 7
Documento23 páginas
Diccionario-Grupo 7
Patrick Coronel Ramirez
Aún no hay calificaciones
Trabajo de Titulación Quito y Sanchez
Documento87 páginas
Trabajo de Titulación Quito y Sanchez
Marti Tapia
Aún no hay calificaciones
Leccion 2
Documento12 páginas
Leccion 2
MARQUEZ RIVERA CHRISTIAN GABRIEL
Aún no hay calificaciones
Módulo 4 - Actividad Evaluativa
Documento3 páginas
Módulo 4 - Actividad Evaluativa
Junreymon Rey
100% (1)
Plan Pruebas
Documento8 páginas
Plan Pruebas
Giancarlo Aguado
Aún no hay calificaciones
Probemos Mas Funciones
Documento7 páginas
Probemos Mas Funciones
Jorge Eduardo Walter
Aún no hay calificaciones
Lista Doble Enlazada
Documento12 páginas
Lista Doble Enlazada
Symon Lopez
Aún no hay calificaciones
Guía - Uso - Plataforma - Csi Bridge - Nov22
Documento9 páginas
Guía - Uso - Plataforma - Csi Bridge - Nov22
AdmonMelendezing SAS
Aún no hay calificaciones
Registro PDF
Documento1 página
Registro PDF
hugo hernandez
Aún no hay calificaciones
Sap MM
Documento106 páginas
Sap MM
EscualoEscualido
Aún no hay calificaciones
Guía de Estudio Del Examen de Conocimientos: 1. Introducción
Documento5 páginas
Guía de Estudio Del Examen de Conocimientos: 1. Introducción
Alex Paz
Aún no hay calificaciones
CMP - Español PDF
Documento44 páginas
CMP - Español PDF
Alex Johan Mancilla Corredor
Aún no hay calificaciones
Caso Practico de Admin y Direc de Empresas
Documento9 páginas
Caso Practico de Admin y Direc de Empresas
daniel arenas
Aún no hay calificaciones
IUE - Gestion Innovación Financiera y Tecnologica - Huber Acevedo
Documento64 páginas
IUE - Gestion Innovación Financiera y Tecnologica - Huber Acevedo
Yuliana Marcela Gil Vasco
Aún no hay calificaciones
Proforma
Documento7 páginas
Proforma
Valeìn Guerr Saúl Alex
Aún no hay calificaciones
Trato Digno - Circular 008
Documento31 páginas
Trato Digno - Circular 008
Brigith Giraldo
Aún no hay calificaciones
CRM - TDR Consultoria-Modelo
Documento9 páginas
CRM - TDR Consultoria-Modelo
JoseMa Zubieta
Aún no hay calificaciones
Presentación XCCVX
Documento7 páginas
Presentación XCCVX
Gisra •
Aún no hay calificaciones
Instalación Monitor Golden Gate
Documento11 páginas
Instalación Monitor Golden Gate
jorgedocumentacion
Aún no hay calificaciones
Desarrollo de Liderazgo
Documento8 páginas
Desarrollo de Liderazgo
lcar197702
Aún no hay calificaciones
08 LP Video Vigilancia IP Dahua Agosto 23-08-22
Documento35 páginas
08 LP Video Vigilancia IP Dahua Agosto 23-08-22
GUEAS ELECTRONIC SAC
Aún no hay calificaciones
Evidencia de Aprendizaje Semana 1
Documento4 páginas
Evidencia de Aprendizaje Semana 1
CarlosCortes
Aún no hay calificaciones
Corel Draw x3 Graphics Suite - (Manual en Español)
Documento522 páginas
Corel Draw x3 Graphics Suite - (Manual en Español)
cmartincau
88% (17)
Laboratorio #1
Documento9 páginas
Laboratorio #1
marielly garcia mendoza
Aún no hay calificaciones
Diseño de pruebas técnicas
Documento39 páginas
Diseño de pruebas técnicas
ana
Aún no hay calificaciones
Base conocimiento introducción
Documento438 páginas
Base conocimiento introducción
Descon
Aún no hay calificaciones
Data Driven
Documento4 páginas
Data Driven
Diego Uriel
Aún no hay calificaciones
Caso PESTEL
Documento6 páginas
Caso PESTEL
gregorio vargas alonso
Aún no hay calificaciones
M2 - Prueba Teórica
Documento2 páginas
M2 - Prueba Teórica
Eric Juger Sanhueza
100% (5)
Br40 Manu Es FR en It v29
Documento64 páginas
Br40 Manu Es FR en It v29
Brahim Latito
Aún no hay calificaciones