Está en la página 1de 7

PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 1

PhenoTree: Análisis visual de registros electrónicos


de salud a gran escala
Universidad Nacional de San Agustı́n
Escuela Profesional de Ciencia de la Computación
Docente: Dra. Ana Maria Cuadros Valdivia
Jair Francesco Huaman Canqui - Hayde Luzmila Humpire Cutipa
Katherine Rocio Uñapilco Chambi - Crhistian Andrew Turpo Apaza

Resumen—Los registros de salud electrónicos (EHR) capturan II. TRABAJOS RELACIONADOS


información completa del paciente en forma digital de una
variedad de fuentes. El aumento de la disponibilidad de EHR II-A. Fenotipado basado en datos
ha facilitado el desarrollo de datos y herramientas de análisis
visual para el análisis de la atención de la salud, como el apoyo
Los datos clı́nicos utilizados en este estudio son registros
a la decisión clı́nica y los sistemas de gestión de la atención
del paciente. Muchas herramientas analı́ticas de atención de de salud electrónicos que forman parte de los diagnósticos
la salud se utilizan para investigar problemas fundamentales, de ICD92 de cada paciente. Trabajar con EHR puede ser
como el estudio de la población de pacientes, la exploración de bastante desafiante, ya que los datos generalmente son muy
interacciones complicadas entre pacientes y sus historias clı́nicas, escasos y ruidosos. Una forma de representar a los pacientes
y la extracción de fenotipos estructurados que caracterizan a la
es el fenotipado. El fenotipado de pacientes mediante el uso
población de pacientes. En este trabajo, proponemos PHENO-
TREE, la cual es una herramienta novedosa de fenotipado basada de registros clı́nicos es un problema comúnmente estudiado
en datos, jerárquica e interactiva, que permite a los médicos e en los últimos años. La extracción de patrones fenotı́picos
investigadores médicos participar en el proceso de fenotipado de pacientes es una tarea importante que puede contribuir al
de cohorts de EHR a gran escala. La herramienta analı́tica desarrollo de la medicina personalizada.
visual propuesta permite a los usuarios explorar interactivamente
cohorts de HME y generar, interpretar, evaluar y refinar fe-
notipos construyendo y navegando una jerarquı́a de fenotipos. Zhou [1], desarrollaron un marco de fenotipado que se
Dada una cohort o subcohort, PHENOTREE emplea un análisis llama PACIFIER y mostraron que el enfoque propuesto
de componentes principales dispersos (SPCA) para identificar mejora el rendimiento predictivo en dos cohorts de EHR
caracterı́sticas clı́nicas clave que caracterizan a la población. del mundo real. El supuesto principal en su estudio fue que
Las caracterı́sticas clı́nicas proporcionan una forma natural de
generar fenotipos más profundos en granularidades más precisas las caracterı́sticas médicas de los datos de EHR se pueden
al expandir la jerarquı́a de fenotipos. Para facilitar el cálculo mapear en un espacio latente mucho más bajo. Por lo tanto,
intensivo requerido para el análisis interactivo, diseñamos un se asumió que cada concepto médico es la combinación de
eficiente solucionador de SPCA basado en la técnica de gradiente varias caracterı́sticas médicas observadas que se denominaron
estocástico reducido de varianza. macro-fenotipos. Las dos formulaciones, llamadas enfoque de
base individual y enfoque de base compartida, se desarrollaron
I. INTRODUCCI ÓN para obtener una representación compacta de los pacientes.
Los registros de salud electrónicos brindan medios digitales En resumen, Zhou [1], propuso PACIFIER para completar
para capturar información de paciente. Tales como registros la matriz temporal mediante la factorización de bajo rango.
de diagnóstico, historial de medicamentos, imágenes médicas, Este proyecto sugiere densificar los datos dispersos de EHR
paneles de pruebas de laboratorio, etc. A medida que los haciendo uso de la información longitudinal.
sistemas EHR se vuelven más frecuentes y guardan más
información, se vuelve un desafı́o para los médicos sacar Che [2], realizo algunas modificaciones en el entrenamiento
conclusiones clı́nicas mediante el análisis de los datos sin de la red neuronal estándar para poder utilizar el aprendizaje
procesar. El desarrollo de herramientas de visualización profundo para datos médicos. Sus experimentos en dos conjun-
impactó en este ámbito, ayudando a varios aspectos de la tos de datos de atención médica del mundo real mostraron que
atención médica como el apoyo en toma de decisiones. las redes neuronales pueden aprender caracterı́sticas relevantes
para aplicaciones médicas. Che [2], declaró que el marco de
Un desafı́o importantes es identificar los fenotipos impor- aprendizaje profundo propuesto mejora el rendimiento de la
tantes que caracterizan a los pacientes. A más granularidad se clasificación de múltiples etiquetas, como la predicción de
pueden explorar fenotipos más profundos y explorar también códigos ICD9. En este estudio, las redes neuronales fueron
jerarquı́as dentro de la población. Para superar el desafı́o pre- entrenadas en ventanas de datos de series de tiempo clı́nicas
sentamos herramienta analı́tica visual para que sea más fácil multivariadas. El aprendizaje profundo se usa actualmente co-
la realización de fenotipos jerárquicos eficientes y efectivos mo un método efectivo para problemas supervisados, mientras
para grandes grupos de pacientes. que nuestro problema tiene un sabor no supervisado.
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 2

II-B. Análisis de componentes principales dispersos y opti- III. PHENOTREE


mización proximal estocástica
PHENOTREE es una herramienta novedosa de analı́tica
Shamir [3], propuso un algoritmo de PCA estocástico con visual interactiva para que los expertos médicos realicen
tasa de convergencia exponencial. Los autores definieron fenotipos jerárquicos eficientes y efectivos para grandes grupos
un algoritmo eficiente para las iteraciones estocásticas de pacientes. Especı́ficamente, PHENOTREE permite:
económicas y la reducción de la varianza. El esquema 1. Exploración interactiva de cohorts de EHR a gran escala.
de optimización utilizado requiere una fuerte convexidad. 2. Descubrimiento de fenotipos jerárquicos mediante la apli-
Dado que la PCA es un problema no convexo, los autores cación iterativa del análisis de componentes principales
utilizaron un análisis de convergencia diferente al análisis de dispersos (SPCA).
convergencia. 3. Visualización de fenotipos en diferentes niveles de
granularidad como una estructura de árbol que ayuda a
En este proyecto, utilizamos un enfoque estocástico que la medicina Los expertos interpretan, evalúan y ajustan
es ventajoso para tratar con un gran número de muestras fenotipos jerárquicos.
en comparación con los estudios resumidos anteriormente.
También utilizamos la formulación de optimización convexa Dada un cohort/subcohorts, PHENOTREE emplea SPCA
para encontrar el vector propio principal, para poder explotar el para identificar caracterı́sticas clı́nicas clave y luego gene-
análisis de convergencia bien definido del método estocástico ra fenotipos basados en estas caracterı́sticas. Los pacientes
proximal con reducción de la varianza. Los métodos de asociados con cada caracterı́stica clı́nica clave se agrupan en
gradiente estocástico se utilizan generalmente en problemas subcohorts individuales. A través de este proceso interactivo,
con tamaños de muestra grandes. Sin embargo, el problema PHENOTREE ayuda a los expertos médicos a identificar
de los algoritmos estocásticos es la baja convergencia debido conjuntos de fenotipos y las correspondientes subcohorts de
a la alta varianza del gradiente. pacientes en diferentes granularidades.

II-C. Analı́tica visual para EHR III-A. Construcción del PhenoTree


Los EHR contienen gran cantidad de información y no es Paso 1: aplicamos SPCA a toda la población de pa-
sencillo explorar patrones y estructuras a partir de registros cientes y obtenemos los valores de carga distintos de
electrónicos sin procesar para expertos médicos mediante el cero. Las caracterı́sticas clı́nicas correspondientes a estos
uso de métodos convencionales. La visualización ayuda a los valores son las dimensiones de entrada que contribuyen al
expertos a comprender, interpretar y descubrir información componente principal. Por lo tanto, estas caracterı́sticas
encubierta en EHR. Por lo tanto, se han realizado numerosos clı́nicas se seleccionan como caracterı́sticas clave y se
estudios sobre el desarrollo de métodos para el análisis visual define un conjunto de fenotipos dentro de la población a
de los registros de pacientes. partir de estas caracterı́sticas.
Por lo tanto, el primer nivel de la jerarquı́a se obtiene
Perer [4], propuso un sistema para extraer y visualizar las utilizando las caracterı́sticas clave determinadas en el
secuencias de eventos frecuentes a partir de datos EHR. El Paso 1.
sistema desarrollado se denominó Care Pathway Explorer, Paso 2: Las caracterı́sticas de primer nivel obtenidas
que presenta una técnica para extraer secuencias frecuentes en el paso anterior se utilizan para definir subpobla-
de los rastreos de pacientes de EHR y para visualizar los ciones que contienen los pacientes que tienen estas
patrones extraı́dos con una interfaz de usuario interactiva. caracterı́sticas clı́nicas clave. Por lo tanto, el número de
subpoblaciones en el segundo nivel es igual al número
Gotz [5], propuso una técnica de visualización con datos de caracterı́sticas de primer nivel. En el segundo paso,
exploratorios mineros dentro de EHR. Su método proporcionó utilizamos estas subpoblaciones asociadas con cada fun-
un análisis a pedido de los datos de secuencia clı́nica y una ción de primer nivel para expandir su fenotipo.
interfaz visual interactiva que los usuarios pueden recuperar Se aplica el mismo procedimiento en el Paso 1 a cada
fácilmente en grupos de pacientes. Wang [6], propuso un subpoblación y se obtienen las caracterı́sticas clı́nicas
sistema, que permite a los usuarios realizar agregaciones clave de segundo nivel para cada función de primer nivel.
visuales, proporcionó una interfaz de minerı́a visual interactiva Al aplicar iterativamente el método anterior para
para respaldar el análisis exploratorio de datos de EHR de expandir los fenotipos, podemos construir una jerar-
alta dimensión. quı́a de fenotipos y organizarlos en una estructura de
árbol.
Huang [7], propuso un proceso de análisis de datos estan-
darizado para los estudios de cohorts mediante el uso de datos
EHR. Huang [7], desarrollo una aplicación web visualmente III-B. Vector Caracterı́stica
rica que puede ayudar a los médicos e investigadores a Cada paciente tiene 3 diagnósticos con los correspondientes
comprender y estudiar las cohorts de pacientes a lo largo del códigos ICD9.
tiempo.
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 3

analicen los datos de EHR y les permitan generar, interpretar


y refinar interactivamente los fenotipos computacionales.

V. PROCEDIMIENTOS
En esta sección presentamos el procedimiento para la crea-
ción de la herramienta que permitirá obtener una visualización
jerárquica usando SPCA utilizando registros electrónicos de
pacientes.

V-A. Pre-procesamiento de los datos


Para el pre-procesamiento de los datos el paper sugiere crear
un array de dimensión NNN por cada paciente, donde RR
Figura 1. Algoritmo para construir un PhenoTree
caracterı́sticas serán diagnósticos que el paciente recibió o no.
En caso de que el paciente haya recibido un diagnostico se
llenará el array con 1, en caso de que no haya recibido el diag-
En los experimentos, los pacientes fueron representados por nostico se llenará el array con 0. Las otras PP caracterı́sticas
vectores de caracterı́sticas de 947 dimensiones. Las primeras corresponden a datos generales del paciente, como edad, peso,
915 caracterı́sticas correspondı́an a 915 códigos únicos de etc.
ICD9 en el conjunto de datos. El valor de la caracterı́stica es
1, si el paciente tiene ese diagnóstico especı́fico.
V-B. Técnicas de reducción de dimensionalidad
Por lo tanto, las primeras 915 caracterı́sticas del vector de Para la reducción de la dimensionalidad escogimos el
caracterı́sticas es bastante esparza. El resto de las caracterı́sti- Sparce PCA, ya que los datos son esparsos. Las caracterı́sticas
cas se extraen de la dataset (32 caracterı́sticas): clı́nicas correspondientes a los valores de carga distintos
Cantidad de tiempo en el hospital. de cero son las dimensiones de entrada que contribuyen
Número de procedimientos de laboratorio. al componente principal. Por lo tanto, estas caracterı́sticas
La cantidad de medicamentos. clı́nicas se seleccionan como caracterı́sticas clave y se define
Estado de readmisión de los pacientes. un conjunto de fenotipos dentro de la población a partir de
Resultados de pruebas relacionados a la diabetes, que son estas caracterı́sticas.
valores binarios.
Estas caracterı́sticas obtenidas a su vez se usan para definir
sub-poblaciones que contienen a los pacientes que tienen
estas caracterı́sticas clı́nicas clave. Por lo tanto, el número de
sub-poblaciones en el segundo nivel es igual al número de
caracterı́sticas de primer nivel. De esta manera, se expanden
los fenotipos, y se aplica el mismo procedimiento a cada sub-
población.
Figura 2. Vector caracterı́stica de cada paciente: 915 columnas de diagnósticos
y 32 de datos relacionados a la diabetes V-C. Algoritmos de clustering
Para el desarrollo de la herramienta no será necesario un
algoritmo de clustering propiamente dicho. La clasificación
IV. E LECTRONIC H EALTH R ECORDS (EHR)
en cluster de los datos se dará por una aplicación sucesiva
Electronic Health Records(Registros Clı́nicos Electrónicos) de SPCA a los datos, dándonos como resultado un clustering
consisten en el diagnóstico de pacientes recolectados durante jerárquico. Dicho cluster, sera usado para la visualización de
un perı́odo de tiempo. Los diagnósticos en EHR son los datos.
generalmente codificados de acuerdo al ICD9, para cada
paciente. Cada código ICD9 corresponde a un diagnostico
en especifico y todo diagnóstico pertenece a un grupo de V-D. Visualización
diagnóstico más amplio. Para la visualización de los datos usamos el Radial Re-
ingold–Tilford Tree. El diseño de este árbol implementa el
La minerı́a de datos y las herramientas de análisis pueden algoritmo Reingold-Tilford para una disposición eficiente y
ser aplicadas a los datos EHR para extraer información útil ordenada de nodos en capas. La profundidad de los nodos
como fenotipos computacionales. Pero, toda esta información se calcula por la distancia desde la raı́z, lo que lleva a
no tendrı́an implicaciones útiles a menos que un experto los una apariencia irregular. También se admiten orientaciones
supervisé y valide. El paper propone una herramienta de cartesianas. Implementación basada en el trabajo de Jeff Heer
análisis visual basada en PCA para que los expertos médicos y Jason Davie
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 4

VI. EXPERIMENTOS
El propósito de nuestros experimentos fue conocer mejor
el conjunto de datos de EHR ilustrando el comportamiento
de diferentes poblaciones de pacientes. En los experimentos,
aplicamos el algoritmo de fenotipado jerárquico visualmente
propuesto PHENOTREE a dos conjuntos de datos de EHR
del mundo real para construir una estructura jerárquica de las
poblaciones y visualizar los fenotipos obtenidos.

El código completo lo puede encontrar en el siguiente enla-


ce: https://github.com/JairFrancesco/TBD-PROYECTOFINAL

VI-A. Dataset Diabetes


Se utilizo el conjunto de datos de EHR disponible al
público que representa datos clı́nicos recopilados entre
(1999-2008) en 130 hospitales de EE. UU. Hay 101, 767
pacientes en total y cada paciente tiene 50 caracterı́sticas
que representan raza, sexo, edad, número de medicamentos,
resultados de pruebas, diagnósticos y otros resultados de
pacientes y hospitales.

Cada paciente tiene 3 diagnósticos con los correspondientes


códigos ICD9. En los experimentos, los pacientes fueron
representados por vectores de caracterı́sticas de 729
dimensiones. Las primeras 697 caracterı́sticas correspondı́an
Figura 3. PHENOTREE descubre fenotipos jerárquicos en una cohorte de
a 697 códigos únicos de ICD9 en el conjunto de datos. El EHR. A partir de una cohorte de EHR a gran escala, el método propuesto
valor de la función es 1, si el paciente tiene ese diagnóstico aplica un análisis de componentes principales dispersos (SPCA) para iden-
especı́fico. tificar las caracterı́sticas médicas clave que caracterizan a la cohorte. Estas
caracterı́sticas clave proporcionan una forma natural de identificar subcohortes
cuyos pacientes están asociados con una de las caracterı́sticas. Luego, el
PHENOTREE aplica SPCA a las subcohortes para identificar niveles más
finos de granularidad de fenotipos. Cada nodo en este árbol proporciona un
VII. AN ÁLISIS DE LOS DATOS: RESPONDIDAS fenotipo estructurado y un subcohorte estable caracterizado por este fenotipo.
POR EL GRUPO
VII-1. ¿Hay grupos bien definidos de objetos similares?:
Los grupos de objetos similares si están bien definidos, ya
que nosotros no los agrupamos por similaridad sino por
jerarquı́a armando árboles. El diseño de este árbol implementa
el algoritmo Reingold-Tilford para una disposición eficiente y
ordenada de nodos en capas.
Armado del árbol Reingold-Tilford paso a paso:

Figura 4. Árbol generado para la Diabetes fase 1 Figura 5. Árbol generado para la Diabetes fase 2
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 5

Figura 6. Árbol generado para la Diabetes fase 3

Figura 8. Árbol generado para hombres

VII-A. ¿Cómo se relacionan los diferentes grupos?


VII-B. ¿Qué pasa con las instancias dentro de los grupos?
Los grupos se relacionan por el tipo de dato que tienen, Las instancias en cada uno de los grupos se asocian de
por sus diagnósticos. Por ejemplo Fig. 8, cuando realizamos acuerdo a una caracterı́stica en común que las precede, en
la visualización de diagnósticos femeninos/masculinos junto este caso su raı́z.
con enfermedades comunes. Observamos que en árbol de
masculinos tiene un trastorno ICD9 602 de próstata y 401
de hipertensión.

VII-C. ¿Qué caracterı́sticas de los datos determinan las


agrupaciones?
Las caracterı́sticas que determinan las agrupaciones son
los cohort/sub-cohorts, ya que los pacientes están asociados
con cada caracterı́stica clave las que agrupan en sub-cohorts.
A través de este proceso interactivo, PHENOTREE ayuda a
los expertos médicos a identificar conjuntos de fenotipos y
las correspondientes sub-cohorts de pacientes en diferentes
granularidades. Como por ejemplo puede observar la Fig. 9

Figura 7. Árbol generado para mujeres Figura 9. Representación visual de un cohort y sub-cohorts
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 6

VII-D. Comparar técnicas de reducción de dimensionalidad:


Sparse principal component analysis (SPCA) y Singular
value decomposition (SVD) son dos métodos de valor propio
que se utilizan para reducir un conjunto de datos de alta
dimensión en menos dimensiones y al mismo tiempo retienen
información importante.
SPCA: Proporciona una mejor interpretabilidad, ya que
hace una reducción de dimensionalidad solamente consi-
derando las caracterı́sticas mas importantes o de diagnos-
tico que tiene ese paciente ignorando aquellos que tienen
valor cero en nuestro vector caracterı́stica.
SVD: Al no considerar vectores de caracterı́sticas espar-
sos no retorna datos reducidos que no son interpretables.

VII-E. Comprarar algoritmos de clustering


Los dendrogramas son diagramas de enlace de nodo que
colocan los nodos de hoja del árbol a la misma profundidad.
Los dendogramas suelen ser menos compactos que los árboles
ordenados (PHENOTREE), pero son útiles cuando todas las
hojas deben estar en el mismo nivel, por ejemplo, para
agrupamiento jerárquico o diagramas de árboles filogenéticos.
Radial Reingold - Tilford Tree es una herramienta novedosa
de analı́tica visual interactiva para que los expertos médicos Figura 11. Representación visual tomando como raı́z a Diabetes. A partir
de esta salen más cluster como la insulina, que a su vez se divide en más
realicen fenotipos jerárquicos eficientes y efectivos para gran- clusters.
des grupos de pacientes

VIII. AN ÁLISIS DE LOS DATOS: RESPONDIDAS VIII-B. Ordenen los clusters por densidad
POR OTROS USUARIOS El cluster con más densidad de datos es el que contiene la
VIII-A. Número de clusters raı́z de insulina, mientras que los menos densos son: Trigem
con sólo un hijo y Malignant neop. endoc. glands sin ninguno.
Los usuarios observaron que hay 10 clusters grandes padres,
que a su vez tienen clusters mas pequeños, representando la
naturaleza jerárquica del PhenoTree. Como por ejemplo puede VIII-C. Enumera todas las sobre-posiciones de clusters
observar la Fig. 10
Los usuarios no encontraron sobre-posiciones de clusters.

VIII-D. Detectar un objeto dentro de algún cluster


Los usuarios lograron detectar los objetos dentro de los
cluster son de tipo médico.

VIII-E. Encuentre a que cluster son más cercanos


Al ser jerárquicos, cada cluster es más cercano a su respec-
tiva raı́z.

IX. RESULTADOS
Luego del proceso de reducción de dimensionalidad y
jerarquización se obtiene un PhenoTree que es un árbol de
fenotipos. Como se puede observar en la figura 11, tenemos
como raı́z a Diabetes. A partir de esta salen más cluster como
la insulina, que a su vez se divide en más clusters. El algoritmo
nos devuelve un JSON con los datos del árbol a construirse.
Posteriormente los datos son mandados a un collapse tree
donde se visualizarán de manera interactiva. El árbol tiene
Figura 10. En esta visualización se puede observar 10 clusters grandes con la capacidad de expandir sus nodos o reducirlos de acuerdo
sus respectivos nodos sea el caso.
PHENOTREE: ANÁLISIS VISUAL DE REGISTROS ELECTRÓNICOS DE SALUD A GRAN ESCALA - CS UNSA 2019 7

X. CONCLUSIONES R EFERENCIAS
Sin la ayuda de un especialista pertinente, es difı́cil [1] J. Zhou, F. Wang, J. Hu, and J. Ye - “From micro to macro: data driven
verificar la veracidad de los resultados. phenotyping by densification of longitudinal electronic medical
records” , in Proceedings of the 20th ACM SIGKDD International
Los registros médicos mientras más grandes, mas difı́ci- Conference on Knowledge Discovery and Data Mining. ACM, 2014,
les de entender son. Es ahı́ donde la visualización puede pp. 135–144.
tomar un rol importante para el entendimiento y ayuda a [2] Z. Che, D. Kale, W. Li, M. T. Bahadori, and Y. Liu, “Deep compu-
tational phenotyping,” in Proceedings of the 21th ACM SIGKDD
los especialista para trabajar con alta cantidad de datos. International Conference on Knowledge Discovery and Data Mining.
Los diagnósticos médicos pueden ser agrupados dentro ACM, 2015, pp. 507–516.
de clusters con otros diagnósticos similares. [3] O. Shamir, “A stochastic pca and svd algorithm with an exponential
convergence rate,” in 32nd International Conference on Machine
Mostrar los datos de manera interactiva motiva y mejora Learning, vol. 37, 2015.
el entendimiento de la data. [4] A. Perer, F. Wang, and J. Hu, “Mining and exploring care pathways
from electronic medical records with visual analytics,” Journal of
Biomedical Informatics, vol. 56, pp. 369–378, 2015.
[5] D. Gotz, F. Wang, and A. Perer, “A methodology for interactive mining
and visual analysis of clinical event patterns using electronic health
record data,” Journal of Biomedical Informatics, vol. 48, p. 148159,
Apr 2014. [Online].
[6] C.-F. Wang, J. Li, K.-L. Ma, C.-W. Huang, and Y.-C. Li, “A visual
analysis approach to cohort study of electronic patient records,”
in IEEE International Conference on Bioinformatics and Biomedicine
(BIBM). IEEE, 2014, pp. 521–528.
[7] C.-W. Huang, R. Lu, U. Iqbal, S.-H. Lin, P. A. Nguyen, H.-C. Yang,
C.-F. Wang, J. Li, K.-L. Ma, Y.-C. Li, and et al., “A richly interactive
exploratory data analysis and visualization tool using electronic
medical records,” BMC Medical Informatics and Decision Making, vol.
15, no. 1, Nov 2015. [Online].