Está en la página 1de 8

SEGMENTACIÓN DE ATENCIONES MÉDICAS PARA EL PROGRAMA

DE ENFERMEDADES CRONICAS DE LA CLINICA INTERNACIONAL

UTILIZANDO ALGORITMO DE AGRUPAMIENTO (CLUSTERING)

Integrantes:
Lino, Luis
Ludeña, Víctor
Introducción
• Busca optimizar las atenciones médicas del servicio de medicina preventiva crónica de la Clínica
Internacional mediante un algoritmo de agrupamiento (Clustering), para apoyar en la toma de
decisiones a la hora de programar citas a sus clientes asegurados.

• Se pretende encontrar en la data de estudio son grandes cantidades de información “oculta” que
podría ser de interés para la clínica, la cual no es visible con las técnicas clásicas. Sin embargo,
podrían ser descubiertas gracias a las nuevas plataformas tecnológicas. Entre ellas, la minería de
datos, utilizada para identificar patrones de comportamiento (modelos de clusterización).

• Algoritmos más utilizado, el K.Means, ya que se caracteriza por reducir la cantidad de datos
mediante la agrupación de los mismos según sus características constantes.

• En los siguientes puntos, se presenta el planteamiento del problema; para luego continuar con la
descripción del estado del arte que contiene la descripción general de la metodología, seguido de
los algoritmos y métodos a utilizar. Posteriormente, se presenta el desarrollo de la solución, para
luego cerrar con las conclusiones respectivas del trabajo.
Planteamiento del problema
• La Clínica Internacional cuenta con sedes en distintos distritos de Lima y diversos programas de
salud. Uno de ellos es la de enfermedades crónicas para el cual se desea saber que grupos de
enfermedades son las mas comunes para reforzar el programa en todas sus sedes.

• La principal característica de la técnica a usar en este informe es la utilización de una medida de


similaridad que, en general está basada en los atributos que describen a los objetos y se define
usualmente por proximidad. Uno de los algoritmos más utilizados para hacer clustering es el K-
Means, que se caracteriza por su sencillez y su objetivo fue reducir la cantidad de datos mediante
la caracterización o agrupamiento de datos según las características similares.

• Por esta razón, a la base de datos de enfermedades crónicas aplicamos el algoritmo de K-Means
para determinar las características similares de las atenciones de estas enfermedades en la Clínica
Internacional.
Estado del Arte
• Data Warehouse: Es la técnica que se encarga de recopilar y administrar datos de diversas
fuentes para proporcionar información relevante para los usuarios interesados. Es una combinación
de tecnologías y componentes que permite el uso estratégico de los datos.

• Data Mining: Se encarga de buscar patrones ocultos, relaciones insospechosas, efectivas y


potencialmente útiles en grandes masas de datos. Es considerada una técnica multidisciplinaria
que utiliza aprendizaje automático, estadísticas, IA y tecnología de bases de datos.

• Aprendizaje:

• Conjunto de datos: Se puede mencionar 2 tipos, el conjunto de entrenamiento (encargado de


determinar los parámetros del clasificador) y el conjunto de prueba (encargado de estimar el
error). A su vez, el conjunto de entrenamiento puede dividirse en conjuntos de entrenamiento y
conjunto de validación
• Modelado: o clasificador que se encarga de conectar a las variables dadas y las que se van a
predecir (variables dependientes e independientes).
• Aprendiz: Procedimiento para construir un modelo a partir de un conjunto de datos de
entrenamiento.
Estado del Arte
• Clasificación:

• Descripción: Busca resaltar las descripciones concisas de las características de los datos.
• Predicción: Dividida en Clasificación y Estimación
• Segmentación: Consiste en separar los datos en subgrupos o clases interesantes. Estas
pueden ser exhaustivas y mutuamente exclusivas o jerárquicas. Pueden ser etiquetadas y
utilizadas con algoritmos de clasificación. Entre ellas: algoritmos de clustering, SOM (self-
organization maps), EM (expectation maximization), k-means, etc.
• Análisis de dependencias: el valor de un dato puede usarse para predecir el valor de otro. La
dependencia puede ser probabilística o funcional. Se pueden utilizar en redes bayesianas,
redes causales, y reglas de asociación.
• Detección de desviaciones: Sirve para filtrar grandes cantidades de datos. Detecta los
cambios más resaltantes con respecto a los valores pasados o normales.
• Aprendizaje a partir de experiencia: Se basa en la búsqueda y en la exploración del ambiente.
Se relaciona principalmente con el aprendizaje por refuerzo.
• Optimización y búsqueda: Existe una gran variedad de algoritmos de búsqueda:
determinística, aleatoria, individual, poblacional, local, etc.; que se utilizan para resolver
problemas de optimización.
Estado del Arte
• Tipos de Aprendizaje:

• Inductivo: Se parte creando modelos de conceptos simples, en base a patrones comunes. A


partir de este aprendizaje se obtiene conclusiones generales, conocimiento nuevo, por lo que no
se tiene una base teórica bien fundamentada. Este concepto lo podemos dividir en 2 grandes
grupos:

• Aprendizaje inductivo supervisado, Los algoritmos supervisados intentan extraer aquellas
propiedades que permiten discriminar mejor la clase de cada ejemplo, y como consecuencia
requieren de una clasificación previa (supervisión) del conjunto de entrenamiento. Ejemplo:
Algoritmo KNN

• Aprendizaje inductivo no supervisado, Mientras, que los algoritmos no supervisados
consisten en encontrar la partición más adecuada del conjunto de entrada a partir de similitudes
entre sus ejemplos. Ejm: K-Means
Desarrollo de la solución
• Algoritmo de K-means

• Metodologia Crisp-DM (Cross Industry Standard Process for Data Mining)


• Fase de análisis del negocio o problema.
• Fase de análisis de los datos
• Fase de preparación de los datos.
• Fase de modelado.
• Fase de evaluación
• Fase de explotación o implementación.

• Realizacin de la solución mediante software IBM SSPS Estatistics


Desarrollo de la solución

También podría gustarte