Está en la página 1de 3

TALLER INTELIGENCIA DE NEGOCIOS – MINERIA DE DATOS

Yonny Gaona Cardona 191532

De acuerdo con las clases sobre minería de datos enviadas al chat, vamos a responder las
siguientes preguntas.

1. De acuerdo con lo entendido en las clases enviadas, defina que es minería de datos y que
es lo que se busca con este proceso.

La minería de datos es el proceso en el cual se utilizan los datos almacenados para


realizar un estudio y análisis de los mismo, por ejemplo, en que situaciones o
circunstancias se obtienen, y cuando se elevan o disminuye la obtención de los mismos, y
luego se realizan las probabilidades y estadísticas, para llegar a una conclusión que será
aplicada en la empresa.

2. Realizar una búsqueda que nos permita tener un ejemplo donde se pudiera aplicar la
minería de datos en:
a. Comercio y banca. Segmentación de clientes, previsión de ventas, análisis de
riesgo.
b. Medicina y Farmacia. Diagnóstico de enfermedades y la efectividad de los
tratamientos.
c. Seguridad y detección de fraude. Reconocimiento facial, identificaciones
biométricas, accesos a redes no permitidos, etc.
d. Recuperación de información no numérica. Minería de texto, minería web,
búsqueda e identificación de imagen, video, voz y texto de bases de datos
multimedia.
e. Astronomía. Identificación de nuevas estrellas y galaxias.
f. Geología, minería, agricultura y pesca. Identificación de áreas de uso para distintos
cultivos o de pesca o de explotación minera en bases de datos de imágenes de
satélites.
g. Ciencias Ambientales. Identificación de modelos de funcionamiento de
ecosistemas naturales y/o artificiales para mejorar su observación, gestión y/o
control.
h. Ciencias Sociales. Estudio de los flujos de la opinión pública. Planificación de
ciudades: identificar barrios con conflicto en función de valores sociodemográficos,
etc.

3. Cuál es la relación de la inteligencia artificial y la minería de datos. Explicar la clasificación


de las técnicas de minería de datos.

El Data Mining se basa en Inteligencia Artificial (IA), Machine Learning y estadística


computacional para analizar enormes bases de datos (Big Data) sin relación aparente.
Explicado de forma sencilla, se crean algoritmos que entran en los grandes lagos de
datos e indagan hasta encontrar los patrones, gracias a la IA. Una vez los localizan,
además de mostrar los resultados de la búsqueda, aprenden de ellos (Machine Learning)

Las redes neuronales: Se trata de un paradigma de aprendizaje y de un procesamiento


automatizado que se encuentra inspirado en la manera que funciona el sistema nervioso
de los animales. Es un sistema que permite interconectar las neuronas en una red (red
neuronal) que presta colaboración para la producción de estímulos de salida.

Los árboles de decisión: Se trata de un modelo de predicción que se utiliza en el campo


de la inteligencia artificial a partir de una base de datos en donde se construyen los
diagramas de construcciones lógicas. Es un sistema similar a la predicción que está
basado en reglas que sirven para la representación de una serie de condiciones que se
presentan de manera sucesiva en la resolución de problemas.

Los modelos estadísticos: Se trata de una expresión simbólica en forma de igualdad que
es empleada en los diseños experimentales y en la regresión, con la intención de
identificar los factores que modifican la variable de respuesta

El agrupamiento: Consiste en la agrupación de una serie de vectores según


determinados criterios que habitualmente son a distancia. Se trata de la disposición de
los vectores de entrada de manera que estén más cercanos a los que tengan
características comunes.

4. Buscar tres artículos científicos donde se allá realizado una investigación alrededor de la
Minería de Datos.

1) Alves, F. B., & Lima, D. A. (2018). Uso de la clasificación para el análisis y la minería
de datos en la herramienta de enseñanza-aprendizaje Google Classroom. Nuevas
Ideas en Informática Educativa, 4, 589-594.

2) Carrascal, A. I. O., & Giraldo, J. J. (2019). Minería de datos educativos: Análisis del
desempeño de estudiantes de ingeniería en las pruebas SABER-PRO. Revista
Politécnica, 15(29), 128-140.

3) Cajo, B. G. H. (2018). Minería de datos en los Sistemas de Gestión de Aprendizaje


en la Educación Universitaria. Campus Virtuales, 7(2), 115-128.

5. Un trabajo de minería de datos costa de varias partes. ¿Cuáles son? Y explicar cada una de
ellas.

Determinación de los objetivos. Trata de la delimitación de los objetivos que el cliente


desea bajo la orientación del especialista en minería de datos.

Preprocesamiento de los datos. Se refiere a la selección, la limpieza, el enriquecimiento,


la reducción y la transformación de las bases de datos. Esta etapa consume generalmente
alrededor del setenta por ciento del tiempo total de un proyecto de minería de datos.

Determinación del modelo. Se comienza realizando unos análisis estadísticos de los


datos, y después se lleva a cabo una visualización gráfica de los mismos para tener una
primera aproximación. Según los objetivos planteados y la tarea que debe llevarse a cabo,
pueden utilizarse algoritmos desarrollados en diferentes áreas de la Inteligencia Artificial.

Análisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja
con los obtenidos por los análisis estadísticos y de visualización gráfica. El cliente
determina si son novedosos y si le aportan un nuevo conocimiento que le permita
considerar sus decisiones.

6. Realizar un cuadro comparativo para las siguientes herramientas de minería de datos.

Software Algoritmos SO Características


WEKA KNN, TREE, RANDOM FOREST, WINDOWS SE INTEGRA CON R. PUEDE
SVM, LINEAR REGRESSION, MACOS REALIZAR MINERÍA DE TEXTO
LOGISTIC REGRESSION, NAIVE LINUX Y ANÁLISIS DE SERIES DE
BAYES, ADABOOST, NEURAL TIEMPO. SE PUEDEN CARGAR
NETWORKS, STOCHASTIC PAQUETES ADICIONALES. API
GRADIENT, CLUESTERING, DE JAVA
ASSOCIATION RULES, PCA
ORANGE KNN, TREE, RANDOM FOREST, WINDOWS AMPLIAS OPCIONES DE
SVM, LINEAR REGRESSION, MACOS PREPROCESADO Y
LOGISTIC REGRESSION, NAIVE LINUX VISUALIZACIÓN. SE INTEGRA
BAYES, ADABOOST, NEURAL CON PYTHON. MÚLTIPLES
NETWORKS, STOCHASTIC OPCIONES ADICIONALES,
GRADIENT, CLUSTERING, COMO ANÁLISIS DE TEXTO,
ASSOCIATION RULES, PCA. BIOINFORMÁTICA Y ANÁLISIS
DE SERIES DE TIEMPO.
RAPIDMINER NAIVE BAYES, GLM, LR, DEEP WINDOWS INCLUYE MINERÍA DE TEXTO.
LEARNING, DECISION TREE, MACOS MUCHOS PROCESOS
RANDOM FOREST, GRADIENT LINUX AUTOMATIZADOS. PUEDE
BOOSTED TREES, SVM, VINCULARSE A RAPIDMINER
CLUSTER, ASSOCIATION SERVER Y HADOOP (BIG
RULES DATA). MÚLTIPLES
EXTENSIONES DISPONIBLES
KNIME NAIVE BAYES, GLM, LR, DEEP WINDOWS TIENE EXTENSIONES PARA BIG
LEARNING, DECISION TREE, MACOS DATA, BIOINFORMÁTICA,
RANDOM FOREST, GRADIENT LINUX MINERÍA DE IMAGEN.
BOOSTED TREES, SVM, INTEGRACIONES CON
CLUSTER, ASSOCIATION, APRENDIZAJE PROFUNDO,
NEURAL NETWORKS, LINEAR SPARK, PYTHON Y TABLEAU.
REGRESSION, LOGISTIC
REGRESSION,PCA

7. Realizar la descarga de WEKA para instalarse en su pc.

También podría gustarte