Está en la página 1de 5

“Año de la lucha contra la corrupción e impunidad”

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS


CENTRO DE INFORMÁTICA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

MINERÍA DE DATOS

Docente: Ing. Miguel Ángel Chalco Flores


Asignatura: Nuevas tecnologías
Elaborado por:
Apaza Pérez, Gladis
Aula: 201

Lima – Perú
2019
INTRODUCCIÓN

La minería de datos, también llamada exploración de datos, es una de las principales


herramientas en el campo de las ciencias de la computación que consiste en llevar a
cabo el proceso de descubrir conocimiento fundamental de grandes proporciones de
información en la base de datos, el data warehousing o el groupware empleando
herramientas o programas de gestión del conocimiento; sean estos, la inteligencia
artificial, aprendizaje automático, estadística y sistemas de bases de datos.

Es necesario, por tanto, destacar la importancia de la relación con estas disciplinas,


anteriormente mencionadas, pues nos permite la confiabilidad y aumento de la velocidad
en la transmisión de datos en una amplia variedad de dominios del conocimiento. Para
ello, quien llevará a cabo el proceso mayor será el descubrimiento de conocimiento en
bases de datos (knowledge discovery in databases, KDD), cumplirá el rol de proceso
interactivo en la preparación e interpretación de los resultados obtenidos.

El objetivo general es la extracción de información implícita; que se encuentra oculta o


desconocida, analizar los datos y patrones; como los grupos de registros de datos,
registros poco usuales y dependencias en esta compleja arqueología de datos para
finalmente transformarla en información comprensible y potencialmente útiles.

Debemos tomar en cuenta estos aspectos; para finalmente, decir que la minería de
datos es la memoria de la organización, y que permitirá enfocarnos en la predicción de
información futura así como tomar decisiones.
CAPITULO I
MARCO TEÓRICO CONCEPTUAL

1.1. Concepto de la minería de datos:

Considerada como tecnología de apoyo para explorar, analizar, comprender y


aplicar el conocimiento obtenido usando grandes volúmenes de datos y se aplican
a todos los sectores y en todos los campos. Molina (2002) descubre caminos que
nos ayudan en la identificación de interesantes estructuras en los datos.

El criterio clave para evaluar su información es su utilidad y el conocimiento será


válida cuando pueda explicar las interacciones de un problema con su contexto.
Entonces se puede inferir que, la información es personal y el conocimiento no es
estático, porque este cambia entorno a la decisión, impactando sobre sus juicios de
valor y su comportamiento.

1.2. Fundamentos de la minería de datos:

Un proceso no trivial de identificación válida, novedosa, potencialmente útil y


entendible de patrones comprensibles que se encuentran ocultos en los datos
(Fayyad y otros, 1996)

La minería de datos prepara, sondea y explora los datos para sacar la información
oculta en ellos. Engloba todo un conjunto de técnicas encaminadas a la extracción
de conocimiento procesable, comprendido en las bases de datos.

Se complementa en los programas de gestión del conocimiento con distintas


herramientas como, el data warehosuing o el groupware.

Compuesta por etapas que integra varias áreas, cada una de ellas pueden ser
estadísticas, de visualización de datos o de inteligencia artificial.

La extracción de esta información útil es un proceso complejo, que requiere la


aplicación de una metodología estructurada para la utilización ordenada y eficiente
de las técnicas y herramientas disponibles (Rodríguez, 2005).

Sustentado por tres tecnologías; recolección masiva de datos, potentes


computadoras multiprocesadores y algoritmos de la minería de datos.
CAPITULO II
CARACTERÍSTICAS DE LA MINERÍA DE DATOS

2.1. Proceso de la minería de datos

Se denomina Modelado, se compone de los siguientes pasos generales:

2.1.1. Selección o determinación del conjunto de datos:

Trata de la demarcación de los objetivos que el cliente desea bajo la orientación de


un especialista tanto en lo que se refiere a las variables objetivo como a las variables
independientes.

2.1.2. Preprocesamiento de los datos:

Se refiere a la selección, limpieza, enriquecimiento, reducción y transformación de


base de datos.

2.1.3. Determinación del modelo:

Realiza análisis estadísticos de los datos, para llevar a cabo su visualización gráfica,
pueden usarse algoritmos; en referencia a, diferentes áreas de la Inteligencia
Artificial.

2.1.4. Análisis de los resultados:

Se procede a su validación, una vez obtenido el modelo, comprobando que las


conclusiones sean válidas y aporten un nuevo conocimiento

2.2. ¿Quiénes son los usuarios?

 Negocios: Para construir modelos a partir de grandes bases de datos.


 Consumidores: Para filtrar información de grandes bases de datos
 Investigadores: Para analizar grandes bases de datos
 Deportes: Interpreta estadísticas.
 Detección de fraude: Crea modelos de comportamiento fraudulento y los
identifica.
 Medicina: En la aplicación de buscar nuevos medicamentos.
CONCLUSIONES

Como se ha visto a lo largo de esta basta información, son muchas las áreas, técnicas,
estrategias, tipos de bases de datos y persona o usuarios que intervienen en el proceso
de minería de datos o data mining. Entonces a todo ello, le atribuimos como una
tecnología emergente que implica cuidar un sinnúmero de detalles debido a que el
producto final involucra tomar decisiones, utilizamos variables o campos para predecir
valores desconocidos o futuros y encontrar patrones que describan la información.
Descubrir nuevos caminos que nos ayuden en la identificación de interesantes
estructuras en los datos es una de las tareas fundamentales. Para finalmente,
desempeñar con eficiencia y escalabilidad de los algoritmos de minería de datos; ya
sean estos, paralelos, distribuidos e incrementales

También podría gustarte