Actividad No 4 - Investigación Métodos de Minería de Datos

Instituto Tecnológico Superior de Calkiní
en el Estado de Campeche.
Investigación:
Métodos de Minería de Datos.
Alumno: Matricula
Luis Francisco Ramos Uc 6460
Docente:
DR. José Manuel Lira Turriza
Asignatura:
Inteligencia de Negocios
Ingeniería en Informática.
Ciclo Escolar: 2021 – 2022P
Semestre: 8 Grupo: A
Introducción
El almacenamiento de información en formatos digitales es cada vez más común.
Se generan grandes cantidades de datos. Por lo que se intenta sacar el mayor
provecho a estos volúmenes de información para la toma de decisiones. La
tecnología informática constituye la infraestructura fundamental de las grandes
organizaciones y permite, actualmente, registrar múltiples detalles de las empresas.
Las bases de datos posibilitan almacenar cada transacción, así como otros muchos
elementos que reflejan la interacción de la organización con otras organizaciones,
clientes, o internamente, entre sus divisiones y empleados, etcétera.
Es imprescindible convertir los grandes volúmenes de datos existentes en

experiencia y conocimiento, para que sea útil al momento de la toma de decisiones,
especialmente en las grandes organizaciones y en proyectos científicos. La
búsqueda de información relevante siempre es útil a la administración empresarial:
el control de la producción, el análisis de los mercados, el diseño en ingeniería y la
exploración científica, porque pueden ofrecer las respuestas más apropiadas a las
necesidades de información.
La minería de datos, es un conjunto de técnicas agrupadas con el fin de crear

mecanismos adecuados de dirección, con la finalidad de mejorar, apoyar y facilitar
la toma de decisiones en las empresas y organizaciones. Esta tecnología ha sido
de gran ayuda en áreas como la Bancos, Telecomunicaciones, Seguros entre otros.
En la actualidad hay un número creciente de organizaciones inmersas en proyectos
de Minería de Datos o Data Mining. La tecnología se puede aplicar a cualquier
organización que disponga de una gran cantidad de datos y que se plantee obtener
el mayor provecho de ellos para obtener reglas de negocio o mejorar el servicio que
presta, así como facilitar la toma de decisiones.
Resumen
En la actualidad la información, donde día a día se multiplica la cantidad de datos
almacenados casi de forma exponencial, la minería de datos es una herramienta
fundamental para analizarlos y utilizarlos y obtener el mayor provecho de forma
eficaz para los objetivos de cualquier organización con la finalidad de apoyar, ayudar
y facilitar la toma de decisiones.
La minería de datos se define también como el análisis y descubrimiento de
conocimiento a partir de datos. La minería de datos hace uso de todas las técnicas
y los métodos que puedan aportar información útil e importante, desde un sencillo
análisis gráfico, pasando por métodos, técnicas y herramientas estadísticas,
complementados con métodos y algoritmos del campo de la inteligencia artificial y
el aprendizaje automático que resuelven problemas típicos de agrupamiento
automático, clasificación, predicción de valores, detección de patrones, asociación
de atributos.
Abstract
Currently, information, where the amount of stored data multiplies almost
exponentially every day, data mining is a fundamental tool to analyze it, use it and
obtain the greatest benefit effectively for the objectives of any organization in order
to support help and facilitate decision making.
Data mining is also defined as the analysis and discovery of knowledge from data.
Data mining makes use of all the techniques and methods that can provide useful
and important information, from a simple graphical analysis, through statistical
methods, techniques and tools, complemented with methods and algorithms from
the field of artificial intelligence and learning. that solve typical problems of automatic
grouping, classification, value prediction, pattern detection, attribute association.
Objetivo
Conocer los diversos métodos y técnicas de la minería de datos, mediante los
cuales se obtiene información, útil y relevante, que posteriormente facilita la toma
de decisiones en las empresa y organizaciones que hacen uso de grandes
cantidades de información y datos.
Desarrollo
La minería de datos es un proceso de extracción de información y búsqueda de
patrones de comportamiento que a simple vista se ocultan entre grandes cantidades
de información, existen varios métodos, algoritmos y técnicas que ayudan en
obtener la información. Tales métodos, técnicas son las siguientes:
1. Redes neuronales (Neural Networks): Las redes neuronales son técnicas

analíticas que permiten modelar el proceso de aprendizaje de una forma
similar al funcionamiento del cerebro humano, básicamente, la capacidad de
aprender a partir de nuevas experiencias.
Una de las principales características de las redes neuronales, es que son
capaces de trabajar con datos incompletos e incluso paradójicos, que
dependiendo del problema puede resultar una ventaja o un inconveniente.
Además, esta técnica posee dos formas de aprendizaje: supervisado y no
supervisado.
Algunos ejemplos de aplicaciones son:
 Biología:
 Aprender más acerca del cerebro y otros sistemas.
 Obtención de modelos de la retina.
 Empresa:
 Evaluación de probabilidad de formaciones geológicas y
petrolíferas.
 Identificación de candidatos para posiciones específicas.
 Explotación de bases de datos.
 Optimización de plazas y horarios en líneas de vuelo.
 Optimización del flujo del tránsito controlando convenientemente la
temporización de los semáforos.
 Reconocimiento de caracteres escritos.
 Modelado de sistemas para automatización y control.
 Medio ambiente:
 Analizar tendencias y patrones.
 Previsión del tiempo.
 Finanzas:
 Previsión de la evolución de los precios.
 Valoración del riesgo de los créditos.
 Identificación de falsificaciones.
 Interpretación de firmas.
 Manufacturación:
 Robots automatizados y sistemas de control (visión artificial y
sensores de presión, temperatura, gas, etc.).
 Control de producción en líneas de procesos.
 Inspección de la calidad.
 Medicina:
 Analizadores del habla para ayudar en la audición de sordos
profundos.
 Diagnóstico y tratamiento a partir de síntomas y/o de datos
analíticos (electrocardiograma, encefalogramas, análisis
sanguíneo, etc.).
 Monitorización en cirugías.
 Predicción de reacciones adversas en los medicamentos.
 Entendimiento de la causa de los ataques cardíacos.
 Militares:
 Clasificación de las señales de radar.
 Creación de armas inteligentes.
 Optimización del uso de recursos escasos.
 Reconocimiento y seguimiento en el tiro al blanco.
2. Análisis Preliminar de Datos usando Query Tools: es el primer paso de

un proyecto de Minería de Datos, se aplica una consulta SQL al conjunto de
datos, para rescatar algunos aspectos visibles antes de aplicar las técnicas.
3. Técnicas de Visualización: son aptas para ubicar patrones en un conjunto
de datos, puede usarse al comienzo de un proceso de Minería de Datos para
determinar la calidad de los datos.
4. Reglas de Asociación: establecen asociaciones en base a los perfiles de

los clientes sobre los cuales se realiza la Minería de Datos.
5. Algoritmos Genéticos: son técnicas de optimización que usan procesos

tales como combinaciones genéticas y mutaciones, proporcionan programas
y optimizaciones que pueden ser usadas en la construcción y entrenamiento
de otras estructuras como es el caso de las redes neuronales. Además, los
algoritmos genéticos son inspirados en el principio de la supervivencia de los
más aptos.
6. Redes Bayesianas: buscan determinar relaciones causales que expliquen

un fenómeno según los datos contenidos en una base de datos. Se han
usado principalmente para realizar predicciones.
Por ejemplo, una red bayesiana se puede utilizar para calcular la
probabilidad de un paciente con una enfermedad concreta, con la presencia
o no de algunos síntomas y otros datos relevantes, si las independencias
probabilísticas entre síntomas y enfermedad son verdaderas, tal y como se
muestra en el gráfico.
7. Árbol de Decisiones: son estructuras que representan conjuntos de

decisiones, y estas decisiones generan reglas para la clasificación de un
conjunto de datos. Los árboles de decisión son fáciles de usar, admiten
atributos discretos y continuos, tratan bien los atributos no significativos y los
valores faltantes. Su principal ventaja es la facilidad de interpretación.
Ejemplo de un sistema experto y de cómo puede llegar a diagnosticar que

se emplee un fármaco X en una persona con presión arterial.
Figura 1. Diagrama de Árbol del ejemplo donde se emplea un fármaco X en una persona con
presión arterial.
Se le administrara un fármaco X al paciente si:
 Tiene presión alta, su azúcar en la sangre es alto, es alérgico a

antibióticos y NO tiene otras alergias.
 Tiene presión alta, su azúcar en la sangre es alto y NO es alérgico a
los antibióticos.
 Tiene presión arterial alta y su azúcar en la sangre es bajo. 4.- Tiene
presión arterial media y su índice de colesterol es bajo. 5.- Tiene
presión arterial baja
No se le administrara el fármaco X si:
 Tiene presión arterial alta, su azúcar en la sangre es bajo, es alérgico

a los antibióticos y SI tiene otras alergias.
 Tiene presión arterial media y su índice de colesterol es alto.
8. Clustering (Agrupamiento): Agrupan datos dentro de un número de clases

preestablecidas o no, partiendo de criterios de distancia o similitud, de
manera que las clases sean similares entre sí y distintas con las otras clases.
Su utilización ha proporcionado significativos resultados en lo que respecta
a los clasificadores o reconocedores de patrones, como en el modelado de
sistemas. Este método debido a su naturaleza flexible se puede combinar
fácilmente con otro tipo de técnica de minería de datos, dando como
resultado un sistema híbrido.
Aplicaciones de clustering
 Marketing: ayudar a los profesionales de marketing a descubrir
distintos grupos en sus bases de clientes y luego utilizar este
conocimiento para desarrollar programas de marketing específicos.
 Uso del suelo: identificación de áreas de uso similar de la tierra en una
base de datos de observación de la tierra
 Aseguradoras: identificación de grupos de asegurados de seguros de
automóviles con un alto costo promedio de reclamo.
 Planificación de la ciudad: identificación de grupos de casas según su
tipo de casa, valor, y ubicación geográfica.
 Estudios de terremotos: los epicentros del terremoto observados
deben agruparse a lo largo de fallas continentales.
Ejemplo:
La segmentación de tomates por colores y textura
Se pone en marcha un algoritmo de clustering (agrupamiento) mediante
segmentación.
¿Por qué?
Primero por que observaba los tomates a partir de dos características:
el color y la textura. Estas eran las dos características de su segmentación
de tomates.
Una vez que el cerebro recogía “estos datos” … segmenta.
Se pone cada tomate (observación) en el grupo de tomates verdes y el resto
como tomates más maduros.
Se debe fijar que aquí se está segmentando en dos grupos.
En dos clusters.
Y esto es precisamente lo que podemos hacer con los datos.
Primero obtenemos características que podamos medir y cuantificar (color y
textura en el caso de los tomates)
Y después agrupamos las observaciones en clusters o grupos con estas
características similares.
La jugada es sencilla.
En el ejemplo de los tomates es sencillo pensar qué grupos vamos a obtener.
Pero en un problema más complejo (es decir, con más características a tener
en cuenta) la cosa se complica.
Y las técnicas de clustering juegan un gran papel.
9. Segmentación: Consiste en la división de la totalidad de los datos, según

determinados criterios. Ejemplo: Dividir los clientes en función de su
antigüedad.
10. Clasificación: Consiste en definir una serie de clases, donde poder agrupar
los diferentes clientes. Ejemplo: definida unas variables de entrada se
produce una determinada salida que clasifica al cliente en un grupo o en otro.
Por ejemplo, si la edad está entre 20 y 40, está casado y tiene cuenta de
ahorro, entonces contrata hipoteca en un 78% de posibilidades.
11. Predicción: Consiste en intentar conocer resultados futuros a partir de

modelizar los datos actuales. Ejemplo: Creamos un modelo de variables
para saber si el cliente compra o no compra. Aplicamos el modelo a un futuro
cliente, y ya podemos predecir si comprará o no.
Referencias bibliográficas
Anónimo. (27 de Mayo de 2019). MINERÍA DE DATOS: Qué es, importancia y
técnicas de su implementación. Recuperado el 15 de Marzo de 2022, de
Netec: https://www.netec.com/post/mineria-de-datos-que-es-importancia-y-
tecnicas-de-su-
implementacion#:~:text=Las%20redes%20neuronales&text=La%20perceptr
%C3%B3n%20(tipo%20de%20red,La%20regresi%C3%B3n%20lineal
Anónimo. (7 de Enero de 2021). Técnicas de Minería de Datos en Big Data.
Recuperado el 15 de Marzo de 2022, de DataHack:
https://www.datahack.es/tecnicas-mineria-datos/
Martínez, G. (2001). Minería de datos. Cómo hallar una aguja en un pajar.
Ingenierías, 14(53), 53-66.
Suárez, Y. R., & Amador, A. D. (2009). Herramientas de minería de datos. Revista
Cubana de Ciencias Informáticas, 3(3-4), 73-80.

Actividad No 4 - Investigación Métodos de Minería de Datos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad No 4 - Investigación Métodos de Minería de Datos

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnológico Superior de Calkiní

Ciclo Escolar: 2021 – 2022P

Es imprescindible convertir los grandes volúmenes de datos existentes en

La minería de datos, es un conjunto de técnicas agrupadas con el fin de crear

1. Redes neuronales (Neural Networks): Las redes neuronales son técnicas

2. Análisis Preliminar de Datos usando Query Tools: es el primer paso de

4. Reglas de Asociación: establecen asociaciones en base a los perfiles de

5. Algoritmos Genéticos: son técnicas de optimización que usan procesos

6. Redes Bayesianas: buscan determinar relaciones causales que expliquen

7. Árbol de Decisiones: son estructuras que representan conjuntos de

Ejemplo de un sistema experto y de cómo puede llegar a diagnosticar que

Se le administrara un fármaco X al paciente si:

 Tiene presión alta, su azúcar en la sangre es alto, es alérgico a

No se le administrara el fármaco X si:

 Tiene presión arterial alta, su azúcar en la sangre es bajo, es alérgico

8. Clustering (Agrupamiento): Agrupan datos dentro de un número de clases

9. Segmentación: Consiste en la división de la totalidad de los datos, según

11. Predicción: Consiste en intentar conocer resultados futuros a partir de

También podría gustarte