Está en la página 1de 8

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD ALONSO DE OJEDA


VICERRECTORADO ACADÉMICO
FACULTAD DE INGENIERÍA
ESCUELA DE COMPUTACIÓN
ASIGNATURA: MINERÍA DE DATOS

INTRODUCCION DE LA MINERIA DE
DATOS

AUTOR:
LEOPOLDO MAZA
CI: 27.519.587

Ciudad Ojeda, Diciembre del 2021


INTRODUCCION

Un enfoque relativamente nuevo al análisis de datos soluciona estos problemas


haciendo que la práctica de la minería de datos se parezca más a
una ciencia que a un arte
1.) ¿Qué es la minería de datos?

La minería de datos surgió con la intención o el objetivo de ayudar


a comprender una enorme cantidad de datos, y que estos,
pudieran ser utilizados para extraer conclusiones para contribuir en la
mejora y crecimiento de las empresas, sobre todo, por lo que hace a
las ventas o fidelización de clientes.

Por tanto, los datos son el medio o la base para llegar a conclusiones
y transformar estos datos en información relevante, para que las
empresas puedan abarcar mejoras y soluciones que les ayuden a
conseguir sus objetivos.

Los mineros o exploradores de datos a la hora de llevar a cabo un análisis de


Data Mining, deberán realizar cuatro pasos distintos:

1. Determinación de los objetivos: El cliente determina qué objetivos


quiere conseguir gracias al uso del Data Mining.
2. Procesamiento de los datos: Selección, limpieza, enriquecimiento,
reducción y transformación de la base de datos.
3. Determinación del modelo: Primero se debe hacer un análisis
estadístico de los datos y después visualización gráfica de los mismos.
4. Análisis de los resultados: En este paso se deberán verificar si los
resultados obtenidos son coherentes.

Actualmente este tipo de trabajos se están realizando en seguridad de


datos, finanzas, salud, marketing, detección de fraude, búsquedas
online, procesamiento del lenguaje natural, coches inteligentes, entre
otros. Es por este motivo, que la minería de datos se está convirtiendo
en uno de los trabajos con mayor proyección para el futuro.
La tarea de minería de datos real es el análisis automático o semi-
automático de grandes cantidades de datos para extraer patrones
interesantes hasta ahora desconocidos, como los grupos de registros de
datos (análisis clúster), registros poco usuales (la detección de
anomalías) y dependencias (minería por reglas de asociación). Esto
generalmente implica el uso de técnicas de bases de datos como los
índices espaciales. Estos patrones pueden entonces ser vistos como
una especie de resumen de los datos de entrada, y pueden ser
utilizados en el análisis adicional o, por ejemplo, en el aprendizaje
automático y análisis predictivo. Por ejemplo, el paso de minería de
datos podría identificar varios grupos en los datos, que luego pueden ser
utilizados para obtener resultados más precisos de predicción por un
sistema de soporte de decisiones. Ni la recolección de datos, la
preparación de datos, ni la interpretación de los resultados y la
información son parte de la etapa de minería de datos, pero que
pertenecen a todo el proceso KDD como pasos adicionales.

2.) Aplicabilidad de la minería en las distintas áreas de


conocimiento

Descubrir conocimiento de este enorme volumen de datos es un reto


en sí mismo. El avance de la tecnología para la gestión de bases de
datos hace posible integrar diferentes tipos de datos, tales como
imagen, video, texto, y otros datos numéricos, en una base de datos
sencilla, facilitando el procesamiento multimedia.
La minería de datos nació con la idea de aprovechar dos cosas:
la ingente cantidad de datos que se almacenaban en áreas como
el comercio, la banca o la sanidad, y la potencia de los nuevos
ordenadores para realizar operaciones de análisis sobre esos datos.
El data mining permite encontrar información escondida en los datos
que no siempre resulta aparente, ya que, dado el gigantesco
volumen de datos existentes, gran parte de ese volumen nunca será
analizado. La minería de datos es un proceso de identificación de
información relevante extraída de grandes volúmenes de datos, con
el objetivo de descubrir patrones y tendencias estructurando la
información obtenida de un modo comprensible para su posterior
utilización

Si ningún modelo satisface las expectativas de conocimiento


esperadas, el proceso se repite de nuevo cambiando variables y
adoptando técnicas distintas a las usadas en los procesos anteriores,
hasta obtener un modelo la explotación del cual satisfaga las
necesidades de conocimiento corporativo expresadas.
Existen numerosas áreas donde la minería de datos se puede
aplicar, prácticamente en todas las actividades humanas que
generen datos:

 Comercio y banca: segmentación de clientes, previsión de ventas, análisis


de riesgo.
 Medicina y Farmacia: diagnóstico de enfermedades y la efectividad de los
tratamientos.
 Seguridad y detección de fraude: reconocimiento facial, identificaciones
biométricas, accesos a redes no permitidos, etc.
 Recuperación de información no numérica: minería de texto, minería web,
búsqueda e identificación de imagen, video, voz y texto de bases de datos
multimedia.
 Astronomía: identificación de nuevas estrellas y galaxias.
 Geología, minería, agricultura y pesca: identificación de áreas de uso para
distintos cultivos o de pesca o de explotación minera en bases de datos
de imágenes de satélites.
 Ciencias Ambientales: identificación de modelos de funcionamiento de
ecosistemas naturales y/o artificiales para mejorar su observación,
gestión y/o control.
 Ciencias Sociales: Estudio de los flujos de la opinión pública. Planificación
de ciudades: identificar barrios con conflicto en función de valores
sociodemográficos, etc.

3.) Importancia de la minería de datos en las empresas, institución u


organización

La minería de datos es el conjunto de técnicas y tecnologías que permiten


explorar grandes bases de datos, de manera automática o semiautomática, con
el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen
el comportamiento de los datos en un determinado contexto.

Básicamente, la minería de datos surge para intentar ayudar a comprender el


contenido de un repositorio de datos. Con este fin, hace uso de prácticas
estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la
Inteligencia Artificial y a las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el
usuario les atribuye algún significado especial pasan a convertirse en
información. Cuando los especialistas elaboran o encuentran un modelo,
haciendo que la interpretación que surge entre la información y ese modelo
represente un valor agregado, entonces nos referimos al conocimiento.

 Determinación de los objetivos.


Trata de la delimitación de los objetivos que el cliente desea bajo la
orientación del especialista en minería de datos.
 pre procesamiento de los datos.
Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y la
transformación de las bases de datos. Esta etapa consume
generalmente alrededor del setenta por ciento del tiempo total de un
proyecto de minería de datos.

 Determinación del modelo


Se comienza realizando unos análisis estadísticos de los datos, y
después se lleva a cabo una visualización gráfica de los mismos para
tener una primera aproximación. Según los objetivos planteados y la
tarea que debe llevarse a cabo, pueden utilizarse algoritmos
desarrollados en diferentes áreas de la Inteligencia Artificial.

 Análisis de los resultados.


Verifica si los resultados obtenidos son coherentes y los coteja con los
obtenidos por los análisis estadísticos y de visualización gráfica. El
cliente determina si son novedosos y si le aportan un nuevo
conocimiento que le permita considerar sus decisiones.

4.) Entender el ámbito de aplicación de la minería de datos y los


principales procesos a los que apoya

Campo de las ciencias orientadas a la informática referido al proceso


que intenta descubrir conocimiento a través de patrones en grandes
volúmenes de datos. Utiliza los métodos de la inteligencia artificial,
aprendizaje automático, estadística y sistemas de bases de datos. El
objetivo general del proceso de minería de datos consiste en extraer
información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior. Además de la etapa
de análisis en bruto, que involucra aspectos de bases de datos y
gestión de datos, procesamiento de datos, el modelo y las
consideraciones de inferencia, métricas de Intereses,
consideraciones de la Teoría de la complejidad computacional,
postprocesamiento de las estructuras descubiertas, lavisualizacióny
actualización en línea.

También podría gustarte