Está en la página 1de 9

Data mining

S-163
Ivan Isay Guerra Lopez
Integrantes:
Lara Fentanes Carlos
Morales Infante John Josseph
Olguin Ramirez Edgar
Salazar González Benjamin
¿Qué es?
El minado de datos es un
conjunto de técnicas y
tecnologías que permiten
explorar grandes bases de
datos, de manera automática
o semiautomática, con el
objetivo de encontrar
patrones repetitivos que
expliquen el comportamiento
de estos datos.
¿Para qué sirve?
La minería de datos se utiliza para explorar bases de
datos cada vez mayores y mejorar la segmentación del
mercado. Analizando las relaciones entre parámetros
como edad de los clientes, género, gustos, etc., es
posible adivinar su comportamiento para dirigir
campañas personalizadas de fidelización o captación.
Componentes o Herramientas
● Base de datos relacionales:
○ Aquí se encuentran algunas empresas como Oracle o Teradata. Son muy utilizadas cuando no
se manejan grandes cantidades de datos y éstos se almacenen en tablas y son formados por
filas y columnas.
○ Es muy frecuente encontrarse con la interfaz de Lenguaje de Consultas Estructuradas (SQL)
para que se recopilen los datos de forma dinámica y puedan usarse en informes.Este proceso
también se puede dar desde formatos de ficheros, importando datos, por ejemplo, en CSV o
TXT desde un Excel. Al igual que las bases de datos relacionales, sirven para almacenar datos.
● Rapid Miner
○ En esta herramienta de data mining se pueden tanto minar datos como realizar análisis
predictivos de forma gratuita, por lo que es bastante útil para multitud de empresas.
○ De hecho, está ganando bastante cuota de mercado estos últimos años debido a la facilidad
para crear chatbots, aunque se puede utilizar para innumerables proyectos.
Componentes o Herramientas
● Orange
○ Orange es un programa informático para realizar minería de datos y análisis predictivo desarrollado
en la facultad de informática de la Universidad de Ljubljana.
○ Lo más destacable de Orange son los 100 widgets de los que dispone para personalizarla y realizar
variables personalizadas.
○ Quizás sea la herramienta más fácil de usar por su sencillez y funcionalidad. Además, cuenta con
largos tutoriales para que te muevas por la interfaz.
● R y Python
○ R es un lenguaje estadístico que nació específicamente para el análisis de datos. Los que tienen
perfiles técnicos o de negocios suelen preferir R por delante de Python. Esto es porque sus gráficas
para la visualización de datos son muy intuitivas y se pueden crear informes y visualizaciones de
datos de gran calidad.
○ Python: este lenguaje de programación no es tan específico en la parte estadística como R, pero ha
ido introduciéndose en el mundo de data science con el tiempo. Normalmente, las personas que
vienen de perfiles matemáticos o del mundo del desarrollo escogen esta herramienta de minería de
datos antes que R.
Áreas de aplicación
Marketing Banca Medicina

La minería de datos se utiliza Los bancos recurren a la La minería de datos favorece


para explorar bases de datos minería de datos para entender diagnósticos más precisos. Al
cada vez mayores y mejorar la mejor los riesgos del mercado. contar con toda la información del
segmentación del mercado. Es habitual que se aplique a la paciente historial, examen físico y
Analizando las relaciones entre calificación crediticia y a patrones de terapias anteriores se
parámetros como edad de los sistemas inteligentes antifraude pueden prescribir tratamientos más
clientes, género, gustos, etc., es para analizar transacciones, efectivos. También posibilita una
posible adivinar su movimientos de tarjetas, gestión más eficaz, eficiente y
comportamiento para dirigir patrones de compra y datos económica de los recursos
campañas personalizadas financieros de los clientes. sanitarios al identificar riesgos,
predecir enfermedades en ciertos
segmentos de la población o
pronosticar la duración del ingreso
hospitalario.
Usos o Ejemplos

- 'Marketing'
- Comercio minorista
- Banca
- Medicina
- Televisión y radio
Datos curiosos
Video
complementario

También podría gustarte