Está en la página 1de 11

Descubrimiento De Conocimiento De Base De

Datos (KDD)

Integrantes:
 Ronald chasipanta
 Nathaly Chavez
 Gisela Hinojosa
RECONOCIMIENTOS DE
PATRONES

La data mining o también llamada minería de datos es una rama interdisciplinaria de la


informática que utiliza métodos estadísticos y matemáticos para extraer patrones,
correlaciones o tendencias de desarrollo de un conjunto de datos.

De esta forma, la información extraída se transforma posteriormente en una


estructura comprensible para su uso. A su vez, la minería de datos es el paso de
análisis dentro de un proceso llamado "Knowledge Discovery in Databases" o
"Descubrimiento de conocimiento en bases de datos".
Métodos de data mining
La minería de datos emplea diferentes métodos de análisis, dependiendo de la base de datos y
la información solicitada.

Seguimiento de patrones
Una de las técnicas más básicas en data mining es el reconocimiento de patrones en conjuntos
de datos. Esta técnica puede revelar repeticiones, regularidades y, especialmente, desviaciones
notorias en los conjuntos de datos.
la Inteligencia Artificial
La inteligencia artificial (IA) es un campo de la informática que se enfoca en crear sistemas
que puedan realizar tareas que normalmente requieren inteligencia humana, como el
aprendizaje, el razonamiento y la percepción.

Clasificación de datos de entrada para la detección y


clasificación de objetos, y la detección de defectos

El reconocimiento de patrones es un proceso que consiste en utilizar algoritmos informáticos


para clasificar datos de entrada en objetos, clases o categorías, en base a sus características
principales o elementos constantes. El reconocimiento de patrones tiene aplicación en visión
artificial, segmentación de imágenes, detección de objetos, procesamiento de datos de radar,
reconocimiento de voz, clasificación de texto y mucho más.
 El cambio de paradigma motorizado por la revolución del tratamiento de grandes
volúmenes de datos (big data) y los métodos matemáticos implementados en el modelo de
aprendizaje automático (Machine Learning) permiten nuevos modos de producción en la
captura y análisis de datos para producir información digital es un factor relevante.
Este modelo resultante puede tener distintas aplicaciones:
 Modelos descriptivos
 Modelos predictivos
 Base de reglas:
Bases de Datos

Una base de datos es una recopilación organizada de información o datos estructurados, que
normalmente se almacena de forma electrónica en un sistema informático.

Tipos de bases de datos

• Bases de datos relacionales


• Bases de datos orientadas a objetos
• Bases de datos distribuidas
• Bases de datos NoSQL
• Bases de datos orientadas a grafos
• Bases de datos en la nube
Visualización de datos

 Como todo proceso, la minería de datos también se lleva a cabo en distintas fases, y como sucede en la
minería tradicional, también existen varias técnicas de extracción (en nuestro caso, para extraer esa
información considerada relevante para el negocio y mostrarla de un modo comprensible).

 Los pasos que incluye cualquier proceso de data mining empiezan con una selección de los datos a
tratar en función de variables de predicción y cálculo, es decir, de un conjunto de variables objetivas y
otro de variables independientes: las primeras son las que guían la elección en función de los objetivos
que se persiguen con el análisis, y las segundas determinan de qué modo se llevará a cabo el proceso.
Visualización de datos

 La visualización de datos y, en concreto, el uso de las herramientas que cumplen este


cometido es fundamental para agilizar el proceso y ahorrar tiempo y esfuerzos a los expertos
que deben determinar, con la máxima rapidez y eficiencia, si los modelos obtenidos se
ajustan con lo esperado. En esa comparativa entre modelos y su evaluación para determinar si
son lo suficientemente satisfactorios es donde entran en juego las herramientas de
visualización de datos, que simplifican y agilizan la tarea de los expertos permitiendo
optimizar el proceso del data mining, reduciendo el tiempo empleado para llevarlo a cabo y
minimizando los riesgos asociados a una mala interpretación de los resultados obtenidos.
SISTEMA PARA EL APOYO A LA TOMA DE DESICIONES

Un sistema de apoyo a la toma de decisiones (DSS, por sus siglas en inglés) es un sistema
informático que ayuda a los encargados de tomar decisiones utilizando datos y modelos para
resolver problemas no estructurados.
Estos sistemas son útiles en la toma de decisiones y en la inteligencia empresarial (Business
Intelligence), ya que permiten realizar el análisis de las diferentes variables de negocio para
apoyar el proceso de toma de decisiones de los directivos.
El proceso kdd es interactivo e iterativo, involucra numerosos pasos con la intervención del
usuario en la toma de muchas decisiones. Se resume en las siguientes etapas:
Selección, Preprocesamiento/limpieza, Transformación/reducción, Minería de datos (data
mining), Interpretación/evaluación.
Algunas características y funciones clave de los sistemas de apoyo a la toma de decisiones incluyen:
 Ofrecer ayuda en todas las fases del proceso de toma de decisiones, como inteligencia, diseño,
selección e implementación, así como en una variedad de procesos y estilos de toma de decisiones
 Ser adaptable por el usuario en el tiempo para lidiar con condiciones cambiantes
 Generar aprendizaje, dando como resultado nuevas demandas y refinamiento de la aplicación, que
a su vez da como resultado un aprendizaje adicional
 Utilizar bases de conocimiento compuestas de fuentes de datos externas, bases de datos de
conocimiento, bases de datos de trabajo, almacenes de datos y meta-bases de datos, modelos
matemáticos y otros
Recuperación de informacion

La recuperación de información en el contexto del descubrimiento de conocimiento en bases de


datos se refiere a la capacidad de obtener datos relevantes a partir de grandes volúmenes de
información no estructurada. Este proceso es fundamental para identificar patrones, tendencias y
conocimientos útiles que puedan ser utilizados para la toma de decisiones.
La recuperación de información en bases de datos de texto es especialmente relevante en el
contexto de las tecnologías de la información y las comunicaciones, donde ha surgido un
almacenamiento no estructurado de información, como texto libre, imágenes, audio y video.

También podría gustarte