Está en la página 1de 11

MAESTRIA EN SISTEMAS DE INFORMACION

GERENCIAL

DATA MINING EN LA SALUD

Ivan Mauricio Álvarez Bonilla


DATA MINING

Dentro de informática se refiere al proceso que descubre conocimiento e


a través de patrones en datos. Utiliza los algoritmos de inteligencia
artificial, aprendizaje automático y métodos estadísticos. La minería de
datos consiste en extraer información de un conjunto de datos y
transformarla en conocimiento (Troche, 2014)
Métodos supervisados ​y no supervisados

El análisis de datos supervisado los algoritmos se aplican a datos


etiquetados intentado encontrar una función que, dadas las variables de
entrada les asigne la etiqueta de salida adecuada de modo de que el
algoritmo predice el valor da salida (Ahlemeyer-Stubbe & Coleman, 2014).

El objetivo del análisis de datos no supervisado es descubrir estructuras


naturales como patrones y tendencias en los datos de entrada (Ahlemeyer-
Stubbe & Coleman, 2014).
Clasificación de las técnicas DATA MINING

Figura 1. Clasificación de las técnicas Data Mining (Cesar, 2007)


Tareas del Data Mining

La forma de clasificar los métodos de minería de datos es mediante tareas


realizadas (Rogalewicz & Sika, 2016), y son las siguientes :
 Descripción
 Clasificación
 Regresión
 Agrupación.
 Asociaciones
Proceso del Data Mining

Figura 2. Proceso General (Smetacek & Mechsner, 2004)


Metodología KDD Knwoledge Discovery in Databases (KDD)

Figura 3. Procesos KDD (Rokach & Maimon, 2014)


Metodología Crisp-Dm
Cross Industry Standard Process for Data Mining (CRISP-DM)

Figura 3. Procesos CRISP-DM (Larose & Larose, 2015)


Aplicaciones del Data Mining

Data Mining puede extraer en información sensible y desconocida que pude


ser útil y de alto impacto para diferentes procesos , su utilidad y aplicación
puede estar en diversas áreas (Pudi & Krishna, 2009) como: la educación ,
Medicina ,ciencias sociales y políticas, negocios , seguridad , comercio,
entre otras (Riquelme, Ruiz, & Gilbert, 2006).
Data Mining en la salud
Aplicando la tarea de Asociación se conocieron los principales factores
socioeconómicos y clínicos asociados a la supervivencia en la enfermedad del
cáncer Por lo cual permite soportar la toma de decisiones eficaces en el sector
de la salud en lo relacionado con el planteamiento de políticas públicas y
programas de protección a las mujeres (Timarán Pereira & Yépes Chamorro,
2010).

Sistemas Clínicos de Soporte para la Toma de Decisiones (CDSS) se aplicaron


para encontrar diversos patrones de comportamiento, con relación a los
factores de riesgo a sufrir hipertensión (Hernandez & Yovannys, 2012) .
Conclusión

• El Data Mining encuentra conocimiento oculto en los datos que no son


visibles para las personas que se encargan de análisis de datos.

• Es importante diferenciar el Data Mining de la estadística, aunque en


fondo de las técnicas de la Data Mining se encuentra funciones
matemáticas dependerán del poder computacional y la logia aplicada en los
algoritmos tomando encuentra que no se usa una muestra de datos sino su
totalidad.

• Las tareas Data Mining más usadas dentro de la salud deben ser la
clasificación y la asociación, tomando en cuenta que los datos no
estructurados hoy en día son de tipo texto, imagen y video.

También podría gustarte