Está en la página 1de 13

Especial

Generalidades de la analítica avanzada y


su aplicabilidad en el Sector Salud*

José Noé Rizo Amézquita1

1 Comisión Nacional de Arbitraje Médico. México.

Una de las afirmaciones menos cuestionadas en el Con esta nueva herramienta (de Analítica Avanzada)
ámbito de la salud, es el hecho de que nunca antes tenemos a nuestra disposición elementos técnicos
en la historia de la humanidad había existido tanta que nos permiten abordar aspectos bajo diversos
información como la que se dispone al día de hoy en enfoques: de analítica descriptiva, de analítica pre-
torno de las condiciones sanitarias de toda socie- dictiva y de analítica prescriptiva. Las siguientes
dad; las fuentes que originan dicha información y las definiciones aportan claridad al respecto:
interacciones entre estas son múltiples, complejas
y de rápido crecimiento, lo que sin duda ha puesto Se dice que la analítica avanzada es una manera de
sobre el plano tecnológico el surgimiento de nuevos utilizar los datos con la finalidad de establecer es-
problemas relacionados con el análisis, procesa- trategias y sobre todo, tomar decisiones fundamen-
miento y obtención de resultados de tal conjunto de tadas en la información. Esta se basa en instrumen-
datos, mismos que requieren ser filtrados y ponde- tos que facilitan el análisis estadístico, favoreciendo
rados para sacar conclusiones y actuar en conse- la utilización de distintos tipos de modelos de pre-
cuencia. En efecto, el sector salud enfrenta un gran dicción, descripción y optimización, tanto en fuentes
reto en el manejo del gran volumen de información de datos cualitativas como cuantitativas. Cabe seña-
disponible (BIG DATA) de forma tal que a partir de su lar que si bien no parece existir un punto específico
interrelación se obtenga el conocimiento y la inteli- que marque la diferencia entre el análisis tradicional
gencia para lograr una adecuada toma de decisiones. realizado durante el pasado reciente y lo que se
puede considerar analítica avanzada, sí es evidente
La solución surge con el concepto de la analítica que esta última se distingue por el uso de herra-
avanzada, que permite el acercamiento a un nuevo mientas estadísticas más complejas, con uso de
enfoque para el conocimiento de la situación de minería de datos, de procesos estocásticos y algo-
salud, partiendo del uso preciso de los datos de las ritmos matemáticos.
distintas fuentes con el fin de predecir posibles even-
tos y/o comportamientos que nos ayuden a afrontar ¿Cómo surge la analítica avanzada?
las tendencias factibles de suceder de acuerdo a lo
previsible respecto a los patrones de morbi-morta- Ante la presencia de un problema ya no basta pre-
lidad y los determinantes de la salud que actúan guntarse ¿qué pasó? (enfoque descriptivo), o por-
respecto a ellos. En suma, el objetivo de su imple- qué sucedió tal cosa (enfoque diagnóstico), siendo
mentación y uso “es tener una nueva forma de en- ahora necesario tratar de averiguar qué más puede
tender la salud, pasando de gestionar la enfermedad ocurrir (analítica predictiva) si no se buscan alterna-
a generar vida: predecir enfermedades, implementar tivas que modifiquen dicha tendencia, y definiendo
medidas preventivas, personalizar tratamientos e ir
* Para favorecer la comprensión de este documento, hemos
hacia una medicina más activa donde el paciente incluido como anexo un breve glosario con los principales
juegue un papel activo en su salud”. conceptos del tema.

BOLETíN CONAMED Volumen 5, Especial - 2019


las medidas factibles de ser consideradas para alen- de los datos y el planteamiento de diversos escena-
tar o impedir que pase o que no pase tal evento rios posibles según las hipótesis asumidas, la toma
(analítica prescriptiva). Para dar respuesta a estas y final de decisiones sigue estando en las manos de
otras preguntas similares surge la analítica avanza- los funcionarios responsables, quienes deberán revi-
da, misma que está integrada por los siguientes sar en forma analítica e inteligente el conjunto de
componentes, a saber1: resultados obtenidos de forma tal que se logren
plantear propuestas, valorar todas las opciones po-
a) Analítica Descriptiva: a través de una ten- sibles y finalmente seleccionar la más adecuada bus-
dencia histórica de datos permite conocer el cando la máxima conveniencia para la institución.
comportamiento pasado al interior de la insti-
tución, aportando una visión general a través Al respecto cabe señalar que la figura que se
del tiempo, la cual en una primera fase se rea- muestra a continuación, representa varias etapas de
liza de manera sencilla y fácil de comprender. madurez analítica, desde "descriptivo" hasta "pres-
criptivo", en el cuál se describe la evolución de la
b) Analítica de diagnóstico: En un segundo mo-
analítica en partes comprensibles y combina cada
mento se busca responder la pregunta ¿Por
etapa con una pregunta que debe responderse: qué
qué ha pasado esto en la institución? Para ello se
sucedió, por qué sucedió, qué sucederá, cómo po-
analizaran los datos, y ante alguna anomalía,
demos hacer que suceda, sin embargo debemos
fallo o comportamiento atípico del dato, se lo-
considerar que la relación entre las 4 etapas no es
caliza la raíz del problema. A partir de ahí, una exactamente lineal. Con esto nos referimos a que
vez que se ha localizado el problema puede ge- las preguntas de qué (análisis descriptivo y predic-
nerarse un informe que detalle la situación y tivo) simplemente pueden responderse mediante
cómo solucionarla o aplicar cualquiera de las dos los datos: datos históricos existentes (análisis des-
siguientes fases de la analítica. Si aplicamos la criptivo) o datos históricos, extrapolados hacia el
analítica predictiva se podrá ver cómo afectará futuro utilizando técnicas de aprendizaje automá-
en el futuro dicho problema a la institución y si tico y pronósticos (análisis predictivo). Puede mover-
aplicamos la analítica prescriptiva podremos se fácilmente de una etapa a otra. No hay un paso
determinar un modelo de comportamiento a de "análisis de diagnóstico" en el medio. En este
seguir. sentido, por qué y cómo (análisis de diagnóstico y
c) Analítica Predictiva: nos permite transformar prescriptivos), por otro lado, son las preguntas que
esas métricas descriptivas en un conjunto de pueden responderse con los datos existentes y una
previsiones, pronósticos y tendencias muy pre- pizca de inteligencia, ya sea manual con una persona
cisas, que bajo diferentes hipótesis o supuestos, que repasa los números e interpreta los resultado,
nos aportará distintos escenarios posibles que o bien un algoritmo que analiza los números y pro-
pudieran afectar en un futuro a la institución. Si duce veredictos basados en modelos ejecutados.
bien dichos hallazgos son relevantes y pueden Así pues, tanto el análisis diagnóstico como el pres-
apoyar cierta toma de decisiones, se sugiere no criptivo se basan en el análisis descriptivo y predic-
quedarse en esta fase, sino continuar hasta la tivo, respectivamente.
última etapa.
d) Analítica Prescriptiva: A partir de la visión de Como vemos, la analítica avanzada se antoja ac-
conjunto que se ha generado y mediante la apli- tualmente utilizarla como una herramienta de vital
cación de modelos matemáticos y estadísticos, importancia para una gran cantidad de institucio-
se podrá generar una serie de posibles alterna- nes que conforman el sistema de salud.
tivas que nos permitan identificar las decisiones
más adecuadas, surgidas del manejo de los gran-
des volúmenes de datos y las infinitas variables
y restricciones generadas previamente, pudien-
do así automatizar el proceso de toma de deci-
siones.

Es importante señalar que si bien la analítica avan-


zada constituye un gran apoyo con el procesamiento

1. Data Science & Big Data Analytics: Discovering, Analyzing,


Visualizing and Presenting Data, Jhon Wiley & Sons, Inc.

130 BOLETíN CONAMED - Vol. 5, Especial - 2019


Entonces, otra forma de visualizar la conexión en- de que puedan tomar las mejores decisiones y de-
tre las distintas fases de la analítica avanzada es: sarrollar las estrategias más correctas. Un aspecto
Inteligencia que debemos tener siempre en cuenta es que la
Prospectiva tiene un gran porcentaje de incerti-
Diagnóstico Prescriptivo dumbre. A medida que aumente el plazo temporal,
Retospectiva Previsión y sobre todo si los factores y variables que aparecen
(pasado) (futuro) son muy numerosos, crecerán las posibilidades de
Descriptivo Predictivo equivocarse. Por ello, la utilización correcta de las
técnicas de prospección, es una tarea muy compleja.
Datos
¿Dónde podemos aplicar la prospectiva?
Aun considerando la conceptualización de cada
una de las fases de la analítica avanzada, resulta Los campos de aplicación de la prospectiva son
indispensable identificar todas las formas en que múltiples, entre los cuales se puede mencionar a la
interactúan, para esto y con la finalidad de mejorar Ciencia, la Industria, Demografía, Sociología, Eco-
la comprensión, hemos diseñado el siguiente dia- nomía y el ámbito de la salud… Es un análisis más
grama en el que se considera además de las 4 fa- ambicioso que la Inteligencia Competitiva ya que
ses, los datos, la inteligencia y el procesamiento, los tiene un carácter multidisciplinar, aunque ambas
tiempos de interacción entre cada uno de ellos, de tienen un objetivo común que es proporcionar in-
tal manera que podemos visualizarlo de la siguien- formación útil para el proceso de toma de decisiones.
te manera:
Técnicas para la prospectiva
Diagrama de interacción de las fases que constituyen
la ejecución de la analítica avanzada y los recursos Un estudio de prospectiva implica una combina-
necesarios.
ción de técnicas muy diversas, que normalmente
se clasifican en:
Analítica
Analítica de Datos descriptiva
diagnóstico (Big Data) Métodos Cuantitativos: entre estas técnicas se
encuentran la extrapolación, la teoría de sustitu-
Analítica ción, los sistemas dinámicos de simulación, los
predictiva modelos econométricos, los métodos causales,
los indicadores correlacionados, las listas de tec-
nologías críticas o clave, etc.
Inteligencia Procesamiento
(perspicacia) manual o con Métodos Cualitativos: se encuentran la aplica-
algoritmos ción del pensamiento intuitivo y los métodos
(previsión) exploratorios, normativos e interactivos.
Mineria de
Analítica datos
¿Qué son las fuentes formales e informales
prescriptiva
de información?
¿Qué es la Prospectiva tecnológica?
Las fuentes de información pueden presentarse con
Otro de los conceptos que resulta indispensable información estructurada, siguiendo una estructu-
conocer es la prospectiva tecnológica, que según J.A ra en campos como la presentada en las bases de
Martín Pereda, puede definirse como el “conjunto datos, o con información no estructurada, que no
de análisis y estudios realizados con el fin de explo- dispone de aquellos patrones (repeticiones de acti-
rar o predecir el futuro mediante el empleo de de- vidades o procesos) y se dividen en formales e in-
terminados métodos y herramientas que permitan formales.
la consecución de unos ciertos objetivos industria-
les y comerciales”. Las técnicas de Prospectiva Tec- Fuentes Formales
nológica pretenden dotar a las organizaciones de
información sobre alternativas de futuro y propor- En Inteligencia competitiva, se trata de fuentes de
cionarles información probabilística sobre la vero- información de carácter secundario que han sido re-
similitud de estos avances. Todo esto, con el objetivo gistradas en una base de datos a través de varios

BOLETíN CONAMED - Vol. 5, Especial - 2019 131


campos y que pueden ser tratados y explotados Esto nos ha llevado a denominar los tiempos ac-
fácilmente. Entre las principales fuentes de infor- tuales como la era del Big Data, donde se ha vuelto
mación existentes; tales como directorios institu- indispensable el uso de nuevas tecnologías para
cionales, bases de datos de información en salud, gestionar y extraer el valor de datos complejos ge-
expedientes clínicos, registros de hechos vitales, re- nerados en grandes volúmenes y a altas velocida-
pertorios de vacunación, repositorios, información des. Tanto en el sector salud, como en otros sectores,
estadística, informes económicos, políticos y socia- el uso de las Tecnologías de la Información (TIC´s)
les, tecnológicos, información geográfica y del clima, han permitido su manejo pero al mismo tiempo han
bases de datos de ayudas y subvenciones, listados propiciado el acumulo de la misma, al solamente
de medicamentos, informes de vigilancia tecnoló- ser generada y no contar con las herramientas y
gica, información de vigilancia epidemiológica, en- tecnologías suficientes para ser explotada.2
tre otros.
El ejemplo más reproducible y aterrizado al sector
Fuentes Informales
salud es el enorme volumen de datos de asistencia
sanitaria existente, en un caso más particular el uso
Este tipo de fuentes tienen su origen en las conver-
de los expedientes clínicos electrónicos, pues este
saciones o negociaciones con prestadores de servi-
contiene grandes cantidades de información de di-
cios de salud, los usuarios de los servicios médicos,
verso índole y características, ya que puede conte-
proveedores de medicamentos, etc. Pero no debe
olvidarse que las conversaciones no son el mejor ner desde registros médicos personales, imágenes
modo para transmitir datos concretos, pues puede médicas, datos de ensayos clínicos, altas, datos a
haber errores de interpretación y muchas veces es nivel genético hasta lo más sofisticado en la gene-
necesario validarlos con otra fuente. ración de datos en salud como lo han sido las se-
cuencias genómicas de una población; a su vez en
Entre las principales fuentes informales se hallan: la última década esta diversidad de datos se ha tor-
fuentes internas de la institución, tales como los tra- nado aún más compleja pues esta ha sido alimen-
bajadores, colaboradores, becarios, Proveedores. tada aún más con las imágenes en 3D, así como las
pacientes, clientes, las ferias, exposiciones, exhibi- lecturas de los sensores biométricos o los disposi-
ciones. En este sentido, las características de una tivos wearables, pues como se ha mencionado el
información informal exigen para su utilización no uso de las Tics han permitido generar y obtener aún
solo su recogida, sino la estructuración y formaliza- más información de los pacientes.
ción para delimitar distintos criterios sobre la misma
quién, cuándo, dónde, descripción, fiabilidad. Lo anterior es evidencia suficiente para afirmar que
ya no se puede hablar solamente de datos estructu-
Big data y minería de datos: elementos rados como se venía trabajando e incluso se sigue
esenciales para la analítica avanzada. trabajando en algunos lugares, esto hablando es-
pecíficamente con aquellos datos obtenidos de los
Para comprender aún más lo que hace la analítica historiales médicos electrónicos, pues como se men-
avanzada es necesario tener identificados ciertos cionó con el paso del tiempo los datos en salud se
elementos que interactúan con esta herramienta, y encuentran en formatos cada vez más complejos y
que no solo le son indispensables sino que a su vez diversos ya que se dicen que carecen de estructura,
la complementan, constituyendo su esencia misma. permitiendo así esta enorme variedad de datos,
estructurados y no estructurados presentándose
El primer elemento que debemos considerar es lo
como un desafío para los sistemas de información
que en la última década ha sido denominado como
el Big Data, entendiendo este como aquel gran con- en salud.
junto de datos obtenidos de las diversas fuentes
de información que los generan, pues la aplicación Como se puede identificar lo anterior dificulta la ma-
o implantación de medios informáticos para el de- nipulación y el análisis de los datos, pues debido a
sarrollo de diversas actividades así como para sus la diversidad de estos es que se complica su
procesos ha provocado que empresas y organiza-
ciones de todo tipo hayan acumulado una cantidad 2. Mensalvas E; Gonzalo C; Gonzáles A. [en línea] Big data en
de datos tan inmensa que su manejo y uso ha lle- salud: retos y oportunidades. Universidad Politécnica de Madrid.
Fecha de consulta 22 Agosto 2019. Disponible en: https://www.
gado a verse obstaculizado, convirtiéndose en una mincotur.gob.es/Publicaciones/Publicacionesperiodi-
tarea cada vez más compleja para las propias or- cas/EconomiaIndustrial/RevistaEconomiaIndustrial/405/
ganizaciones. MENASALVAS,%20GONZALO%20Y%20RODR%C3%8DGUEZ.pdf

132 BOLETíN CONAMED - Vol. 5, Especial - 2019


almacenamiento y organización. Para que lo ante- que nos permite identificar, controlar y mejorar la
rior no ocurra existen ciertas técnicas y herramien- salud de nuestras poblaciones por medio de la
tas, más eficientes que un simple ordenador, para toma de decisiones basadas en evidencia.3
así combinar y convertir esta heterogeneidad de
datos en algo homogéneo, estructurado facilitando Este concepto es conocido por ser el medio o el
así su análisis y uso de manera eficiente. proceso necesario para realizar analítica predictiva,
la minera de datos o data mining es definido como
De igual manera otro punto importante a conside- “Proceso de extracción de información desconocida
rar en los datos generados en el sector salud, es con anterioridad, válida y potencialmente útil de
aquella información obtenida de otras fuentes, di- grandes bases de datos para usarla con posteriori-
versas al expediente e historia clínica, por ejemplo dad para tomar decisiones importantes de una
aquella información generada por medio de los institución”. Este término tiene como antecedente
dispositivos móviles, la genética y la genómica y los inmediato un campo de investigación generado
medios o redes sociales. En este sentido es como se en la década de los 80 denominado Knowledge
concibe su máximo potencial para el Big Data, pues Discovery in Databases (KDD) por sus siglas en in-
compilando esta gran cantidad de información es glés y traducido como descubrimiento del conoci-
como se permite proporcionar atención médica, miento en grandes volúmenes de datos o bien lo
tanto a nivel personal como a nivel poblacional. que conocemos como bases de datos. Esta nueva
área de investigación combina áreas como la inte-
Resumiendo entonces, los proyectos de Big Data no ligencia artificial, la estadística, técnicas de visuali-
solo se enfocan en el análisis de grandes cantida- zación y el aprendizaje automático. Lo que para esa
des de información con características diversas y que época fue concebido como KDD en la actualidad
son generados a grandes velocidades, también estos ha sido sustituido por este término de minería de
deben de ser correctos y además el análisis de estos datos, entendiéndolo entonces como el proceso en
debe generar beneficios para los actores involucra- el que se aplican las técnicas y algoritmos para el
dos, en el caso del sector salud para su población. descubrimiento en las bases de datos. Por medio
Estos beneficios pueden ser del tipo económicos de la minería de datos y la analítica predictiva, los
traducidos en reducción de costes, eficiencia en la datos históricos pueden revelar patrones que son
gestión farmacéutica, disminución en el número de usados para predecir tendencias, la analítica pre-
ingresos y estancias hospitalarias, disminución en dictiva, junto con el conocimiento experto, ha sido
el número de consultas sucesivas o una mayor ca- usada para ayudar con el diagnóstico de tratamien-
pacidad para mejorar la calidad de la atención de tos de muchas enfermedades así como anticiparnos
los pacientes. ante algunas otras. Al saber con anticipación que un
grupo de pacientes tiene un bajo o alto riesgo para
Lo anterior se ha concebido como una evolución en una enfermedad o condición, la minería de datos y
la naturaleza de los datos, pues la fuente o los me- la analítica predictiva también están ayudando a los
dios que los generan lo hacen a grandes velocida- profesionales de la salud a crear medidas de trata-
des y en grandes cantidades siendo esta de diverso miento dirigidas a distintas poblaciones.
índole. Sin embargo así como evoluciona la ma-
nera en la que se generan los datos también lo Un ejemplo aterrizado al ámbito clínico es el caso
tienen que hacer las técnicas que se emplean para de las enfermedades cardiovasculares, ya que al
analizarlos así como las arquitecturas y plataformas, trabajar directamente con ciertos pacientes que
herramientas, metodologías utilizadas para ello. son identificados como de alto riesgo, se pueden
implementar medidas preventivas simples tales
Es aquí donde se incorpora otro concepto que nos como reducir la ingesta de grasas transgénicas,
permite maximizar el uso de los datos y con ello perder peso y dejar de fumar, lo que reduce sus- tan-
permiten realizar analítica predictiva por medio del cialmente el riesgo de un ataque al corazón. De esta
Big data, este concepto es el medio por el cual se manera, los proveedores del cuidado de la salud
consigue, entendiendo al Big data como el punto de pueden idear distintas estrategias para mantener
partida y el termino que se abordara a continuación,
como las herramientas y el proceso necesario para 3. Peñaloza M. [en línea] Big data y analítica del aprendizaje en
realizar analítica predictiva, lo que se traduce en un aplicaciones de salud y educación médica. Inv Ed Med. 2017; 7
(25):61-66. Fecha de consulta 22 Agosto 2019. Disponible en:
cambio del modelo de la medicina curativa y preven- h tt p : //w w w. s c i e l o.o rg . m x /p d f/ i e m /v 7n 2 5 / 2 0 0 7- 5 0 57-
tiva por el de una medicina con enfoque predictivo, iem-7-25-61.pdf

BOLETíN CONAMED - Vol. 5, Especial - 2019 133


a los pacientes de bajo riesgo en bajo riesgo, mien- Sin embargo lo anterior requiere del apoyo y tra-
tras se mitiga el riesgo asociado con los pacientes bajo intersectorial y del compromiso de los toma-
de alto riesgo. dores de decisiones para que se pueda conseguir,
este fenómeno aún se describe como un objetivo
Los modelos predictivos resultantes de aplicar téc- para el sistema nacional de salud mexicano, sin
nicas de Big Data a las fuentes manejadas por los embargo a nivel nacional se viene trabajando desde
profesionales de la salud pueden tener muchas 2013 con una Estrategia Digital Nacional (EDN), que
ventajas para la población, pero también para los pretende ser el eje toral para la incorporación de
sistemas sanitarios y los sanitarios y la administra- todo lo que se planteó anteriormente al sistema de
ción pública, ya que los profesionales de la salud, salud nacional, que si bien resulta ser un tanto com-
los pacientes y sus, podrán por ejemplo, tener una plejo concebirlo es su totalidad, ya se muestran cier-
mejor detección de los efectos secundarios de los tos indicios de que vamos por el camino adecuado.5
medicamentos, podrán facilitar tratamientos perso-
nalizados (retail), de más calidad y seguros, con Aportaciones de la analítica avanzada
mayor rapidez, así como favorecer el avance en la Al automatizar los procesos, se eficiente
medicina personalizada y preventiva. Por otro lado, Automatizar el tiempo al realizar tareas recurrentes y
con esto, se minimizan los costos de
haría mucho más eficiente la compra de medica- procesos
operación, en al menos horas de trabajo
mentos con base en las necesidades de la población y equipo técnico.
y de manera oportuna en el tiempo, algo de lo que
también se beneficiará la administración pública. Conseguir Al centrarnos en procesos de mayor
importancia para la prestación de
eficiencia
servicios y prioritarios para la
Es así como hemos considerado que la aplicación institución.
del paradigma de Big Data al contexto de la salud Transformar Logramos la transformación digital,
supondrá una mejora de magnitud aún no prede- debido al exhaustivo análisis de datos
datos
estadísticos, podremos tomar decisiones
cible en la calidad de la atención a los pacientes, fa- en tiempo real y no en suposiciones,
vorecerá la prevención de enfermedades, contribuirá instinto o apreciaciones.
al diagnóstico correcto y oportuno y al tratamiento
de enfermedades, lo que será traducido en una dis- En este sentido, resulta importante mencionar que
minución de costos y a largo plazo en lo que todos la dificultad y el verdadero reto para la analítica avan-
los sistemas de salud buscan: la producción de salud. zada, se origina desde la obtención de los datos,
pues debido al volumen, la variedad y velocidad con
Sin embargo el camino no es sencillo, para alcan- la que se obtiene, es necesario someterlos a cierto
zar estos logros es fundamental la integración de proceso para que puedan ser explotados y con ello
todos los datos procedentes de diferentes fuentes asegurar el mayor existo posible para estos. Es pre-
(formales o informales), así como el desarrollo de cisamente en este primer punto donde tenemos
nuevas tecnologías que permitan la explotación de que hacer referencia a los gestores de información,
dichos datos. pues debido a que los datos no cuentan con una
estructura ni con un formato único, la organización
En este sentido, las soluciones de analítica predic- de datos cumple un rol esencial para que poste-
tiva normalmente son construidas y validadas por riormente sean sometidos a cualquier herramienta
un equipo de científicos de minería de datos. La im- o técnica de análisis, además no todos los datos son
plementación operacional real de estas soluciones útiles, esto debido a que dependiendo de nuestros
es normalmente una tarea realizada por un equipo objetivos es que solo tomaremos lo que realmente
de ingenieros. Por una parte, los científicos de mi- nos ayuden a alcanzar a los objetivos de la institu-
nería de datos son expertos en estadísticas y pa- ción o nuestros objetivos.
quetes de estadística que usan para crear los mejores
modelos predictivos. Por otra parte, los ingenieros se Para que lo anterior se pueda dar existen diversas
especializan en lenguajes de programación, bases herramientas, que facilitan y verifican que los datos
de datos y sistemas de tecnologías de información.4 sean útiles, así como también cuidan un factor

4. Alex Guazzelli. Analítica predictiva en el cuidado de la salud.


La importancia de los estándares abiertos. IBM. 2012. Fecha de 5. Instituto Nacional de Economía Social. {en línea} 5 años de la
consulta 22 de Agosto 2019. Disponible en: https://www.ibm. Estrategia Digital Nacional. Fecha de consulta: 22 Agosto 2019.
com/developerworks/ssa/industry/library/ind-PMML3/ind-PM- Disponible en https://www.gob.mx/inaes/prensa/5-anos-de-la-
ML3-pdf.pdf estrategia-nacional-digital

134 BOLETíN CONAMED - Vol. 5, Especial - 2019


esencial para la veracidad y fiabilidad de estos que para las instituciones que pretenden dar uso a estos.
es la calidad. Pues como se ha comentado a lo largo
del artículo existen factores que dificultan aún más Una vez alcanzado este punto lo siguiente es el al-
que dichos datos sean explotados, poniendo en duda macenamiento de estos datos, que a partir de esta
su calidad. Por ejemplo el hecho de que provengan fase estos datos ya son considerados como infor-
de diferentes fuentes, esta situación ya representa- mación pues ya están organizados y estructurados
ría para la analítica convencional un problema por con cierto fin. Posterior a esto el almacenamiento de
sí sola pues al tener datos de diferentes fuentes no se dicha información es la siguiente fase para alcanzar
sabría qué información está siendo duplicada, otro la parte analítica. Actualmente gracias a la tecno-
factor es el hecho de que algunos datos aún tienen lógica y a los avances en informática contamos con
intervención manual, es decir no cuentan con un diversas herramientas como son los data lakes o
sistema automatizado para su obtención generan- data warehouse, que han sido de gran utilidad para
do información incompleta y por ende de poca el almacenamiento de la información. Es aquí en
utilidad. donde ya teniendo la información el uso de herra-
mientas y técnicas de análisis entran en el proceso,
Para complementar este primer encuentro con los pues por medio de minería de datos y textos, o de la
datos, es indispensable el poder contar con diferen- propia analítica es que esta información puede ser
tes softwares que apoyen las actividades de organi- explotada. Para comprender mejor lo que se plantea
zar y garantizar que los datos que se tienen sean va- en el siguiente diagrama se han resumido tales su-
lidados y de calidad, además de que sean seguros cesos.

Conclusiones y desarrolle acciones que mitiguen la problemática


en cuestión.
La analítica avanzada nos permite predecir com-
portamientos futuros gracias a la aplicación de té- Es pues un proceso de evolución competitiva donde
cnicas de optimización y simulación. Además, me- las fuentes de información son más dispares y po-
diante la programación de algoritmos o cálculos der decidir con base en información clave para nues-
manuales, conseguimos comprender los motivos tro sistema de salud puede ser el factor de éxito.
que han llevado a un suceso determinado, a un es-
tado situacional de la población con relación a su A través de las posibilidades que nos ofrecen la
salud o un resultado de la evolución de enfermeda- analítica avanzada y el uso de la inteligencia en sa-
des para que a partir de esto, se definan, instrumente lud podemos definir soluciones que nos permiten,

BOLETíN CONAMED - Vol. 5, Especial - 2019 135


a partir de un análisis de datos de una forma inte- lando muchos datos sobre los pacientes; su im-
grada y global, detectar fácilmente patrones y ten- plementación, no obstante no es sencilla, y requie-
dencias de comportamiento, de enfermedades o de re del cumplimiento de algunos aspectos que a
necesidades que de manera oportuna, brinden una continuación mencionamos:
o varias soluciones, ya sea a partir del uso de inter-
net, de big data o machine learning, y de la minería Disponibilidad de nuevas herramientas de
de datos, el siguiente paso más allá de las decisio- aprendizaje automático.- La institución deberá
nes basadas en datos es conseguir una inteligencia contar con herramientas sólidas y de gran capa-
en salud con sistemas de soporte a las decisiones e cidad para poder analizar de forma más efectiva
incluso de automatización. los grandes volúmenes de información existen-
te en el sector. A partir del BIG DATA existente se
Es indudable que uno de los sectores cuya informa- podrán realizar de manera más efectiva los aná-
ción crece en forma más acelerada es el relativo a lisis diagnósticos y las predicciones útiles de
la salud, lo cual justifica la necesidad de que se in- diversos tipos que potencialmente ayudarían
tensifique en su interior la aplicación y desarrollo de a conocer y mejorar los resultados clínicos.
metodologías propias de la analítica avanzada. En Mejor infraestructura computacional.- El in-
efecto, los servicios de salud por si solos generan cremento y la mejor distribución de los equipos
en el día a día una enorme cantidad de datos, pro- de cómputo al interior del país así como su in-
venientes de múltiples fuentes de información (sean terconectividad y la implantación de la red en la
formales o no formales) que deben ser analizados nube, permitirá el procesamiento de grandes
para los cual el sistema deberá contar con los ele- volúmenes de datos, factor imprescindible en
mentos necesarios para abordar, de la mejor datos, la analítica avanzada.
el proceso de recolección de esos, así como su in- Una condición de gran importancia, es la dis-
tegración y procesamiento y tratar de obtener de ponibilidad de información de carácter nominal
ellos el conocimiento suficiente para conducir a los e integrada, proveniente de diversas fuentes de
responsables a las mejores tomas de decisiones. datos interconectados. Representa quizás el as-
pecto más débil en nuestro país, en la medida
Si bien la analítica avanzada se está haciendo pre- que los sistemas de información están fragmen-
sente de más en más en muchos ámbitos del sector tados y no se interrelacionan entre ellos. La ins-
salud, su nivel de implementación guarda grandes titución que presenta el mejor avance en este
diferenciales. La ausencia o débil incursión de dicho aspecto es el IMSS cuyas bases de datos son no-
enfoque en los procesos de información vigentes en minales y están disponibles para los tres niveles
el Sistema Nacional de Salud es una prueba de ello; de atención. Las otras instituciones presentan
no obstante la actual administración ha decidido grados variables en el desarrollo de sus sistemas
impulsar su desarrollo al menos al interior de las de información.
principales instituciones que la integran: la Secre- Un factor de gran apoyo sería el contar con
taría de Salud, el IMSS y el ISSSTE. En ese sentido, vale información del paciente en tiempo real; en
la pena reconocer cuales son los factores condicio- México, si bien la implementación del Expedi-
nantes o facilitadores que propiciarían la incorpora- ente Clínico Electrónico se inició hace cerca de
ción de la analítica avanzada y revisar en qué me- 20 años, su existencia y adecuada operación se
dida las instituciones públicas están listas para la da realmente en forma fraccionada y dispersa,
implementación y operación de dichos mecanismos por lo que podemos afirmar que como sociedad
de análisis e interpretación de sus resultados en estamos lejos aún de cubrir a todo el sector pú-
salud. blico. Se carece de un diagnóstico de la situa-
ción que guardan los establecimientos privados.
La primicia esencial consiste en reconocer el gran El contar con un sistema que permita el segui-
volumen de datos que se registra e incorpora cada miento de los pacientes, en tiempo real, permi-
día al acervo de información del sector salud y cuyo tirá una toma de decisiones más rápida, con
crecimiento incide en la conformación del Big Data, mejora el diagnóstico y tratamientos.
condición que propicia en consecuencia el desarro- Promover una cultura sobre los beneficios de
llo de la analítica avanzada; Los avances en la gestión aplicación de la analítica avanzada y la acep-
bajo ese enfoque en salud permitirá que los profe- tación de ésta por parte de los trabajadores
sionales sanitarios puedan tomar decisiones más del sector salud resultará altamente prove-
precisas, en lugar de simplemente seguir acumu- choso al proyecto; en efecto, el personal de

136 BOLETíN CONAMED - Vol. 5, Especial - 2019


Salud y los demás implicados en la atención comprometen con la constitución de este proyecto
de los pacientes deben estar convencidos de de forma conjunta y coordinada, además se requie-
la importancia de los nuevos procesos y re que se integre conjuntamente la tecnología, las
requerimientos de información y la utilidad políticas adecuadas sobre privacidad y confidencia-
generada respecto a los resultados para lidad, la infraestructura y una cultura de uso compar-
prevenir y atender potenciales riesgos. En la tido de los datos para llevar a nuestro sistema de
medida que esto sea aceptado, se obtendrá salud a una nueva era.
una implementación cada vez más rápida y
efectiva, reconocida ya como la tecnología del *Glosario
futuro para todas las instituciones de salud.
Destacar en todos los niveles posibles, los be- Deep Learning (Aprendizaje profundo): Puede
neficios que conllevaría la implementación de definirse como el aprendizaje de forma autónoma
la analítica avanzada, tanto en usuarios como por parte de una inteligencia artificial utilizando al-
prestadores de servicios. El ejemplo del costo goritmos desde el análisis de grandes bases de
en salud. La supervivencia del sector salud pasa datos. El Aprendizaje Profundo se enmarca dentro
por reducir los costes. Este es otro beneficio de de la Inteligencia Artificial y abarca gran parte de
la analítica avanzada en el sector salud, ya que los sistemas basados en reglas y lógica que han
permite optimizar procesos y tratamientos con sido diseñados para resolver problemas concretos.
el consiguiente ahorro. El envejecimiento de la El Deep Learning va un paso más allá del análisis de
población lleva consigo un encarecimiento de datos para poder ayudar a la toma de decisiones
los tratamientos que gracias a la gestión efec- (Aprendizaje Automático). El aprendizaje Profundo
tiva de la información puede reducir costes. Hay pretende dar sentido a los datos utilizando la abs-
que resaltar que el análisis predictivo, dentro de tracción en capas múltiples, imitando un proceso
la analítica avanzada, es el futuro en el sector neuronal. Es uno de los enfoques más populares en
salud ya que permitirá a los sistemas de salud estos momentos para lograr el Aprendizaje Auto-
aprender constantemente y optimizar todos los mático. La razón es que requiere muy poca inter-
procesos. Los algoritmos de la inteligencia en vención manual para conseguir el aprendizaje por
salud dedicados al sector permitirán hacer re- parte de la Inteligencia Artificial. El Deep Learning
comendaciones tanto a los profesionales admi- difiere de metodologías más tradicionales en las
nistrativos como a los clínicos en todo el sector que los programadores deben introducir manual-
salud. mente todos los factores y variables relevantes y
posibles que debe considerar el programa para que
En el sector Salud existen numerosas fuentes de este funcione. Esto da lugar a la posibilidad de erro-
datos heterogéneas que arrojan una gran cantidad res si no se introducen todas las variables. Solo
de información relacionada con los pacientes, las necesita la entrada de grandes cantidades de da-
enfermedades y los establecimientos de atención tos que luego analiza produciendo unos resultados
médica. Esta información, bien analizada, resultará en forma de vectores de probabilidad. Esto le per-
de gran utilidad para los profesionales de la salud y mite aprender.
en beneficio de los pacientes, pero no solo ellos son
los más beneficiados, también se beneficiarán los Big data: Conjunto de datos o combinaciones de
directivos tomando decisiones mucho más acerta- conjuntos de datos cuyo tamaño (volumen), com-
das y objetivas, el financiador de la prestación de plejidad (variabilidad) y velocidad de crecimiento
servicio de salud, en este caso el sistema de salud (velocidad) dificultan su captura, gestión, procesa-
podrá tener mayor cobertura eficientando los re- miento o análisis mediante tecnologías y herra-
cursos con lo que cuenta y además, se obtendrá el mientas convencionales, tales como bases de datos
mayor beneficio, la salud de la población en su con- relacionales y estadísticas convencionales o pa-
junto. quetes de visualización, dentro del tiempo nece-
sario para que sean útiles. Aunque el tamaño uti-
No obstante, el verdadero valor que puede aportar lizado para determinar si un conjunto de datos
la implementación de Big Data al contexto de la determinado se considera Big Data no está firme-
salud, se conseguirá si los diferentes actores en el mente definido y sigue cambiando con el tiempo,
proceso de generación de información (dependen- la mayoría de los analistas y profesionales actual-
cias, establecimientos de atención médica, centros mente se refieren a conjuntos de datos que van
de investigación, universidades, entre otros) se desde 30-50 Terabytes a varios Petabytes.

BOLETíN CONAMED - Vol. 5, Especial - 2019 137


La naturaleza compleja del Big Data se debe prin- también les permite ejecutar escenarios analíticos
cipalmente a la naturaleza no estructurada de gran iterativos e interactivos.
parte de los datos generados por las tecnologías
modernas, como los web logs, la identificación por Analítica predictiva: La tecnología analítica predic-
radiofrecuencia (RFID), los sensores incorporados tiva utiliza datos, algoritmos estadísticos y técnicas
en dispositivos, la maquinaria, los vehículos, las bús- de aprendizaje basado en máquina para identificar
quedas en Internet, las redes sociales como Face- la probabilidad de resultados futuros basados en
book, computadoras portátiles, teléfonos inteligen- datos históricos. Se trata de proveer la mejor evalua-
tes y otros teléfonos móviles, dispositivos GPS y ción de lo que sucederá en el futuro, de modo que
registros de centros de llamadas. las organizaciones puedan tener mayor confianza en
que toman la mejor decisión de negocios posible.
Gestión de datos: Los datos necesitan ser de alta Algunas de las aplicaciones más comunes de la ana-
calidad y estar bien gobernados antes de poderlos lítica predictiva incluyen la detección de fraude,
analizar de manera confiable. Con la entrada y sali- riesgo, operaciones y marketing.
da constante de datos de una organización, es im-
portante establecer procesos repetibles para cons- Minería de texto: Con la tecnología de minería de
truir y mantener estándares de calidad de datos. texto, es posible analizar datos de texto de la Web,
Una vez que los datos son confiables, las organiza- hacer comentarios en campos, libros y otras fuentes
ciones deben establecer un programa maestro de basadas en texto para descubrir insights (pistas que
gestión de datos que sintonice a la empresa com- facilitan la solución de lo que se pretende analizar)
pleta en el mismo canal. que no había observado antes. La minería de texto
utiliza el aprendizaje basado en máquina o la tec-
Minería de datos: La minería de datos le ayuda a nología de procesamiento del lenguaje natural para
examinar grandes cantidades de datos para descu- repasar documentos, correos electrónicos, blogs,
brir patrones en los mismos – y esta información se textos de Twitter, encuestas, inteligencia competiti-
puede utilizar para realizar un análisis adicional para va y más para ayudar a analizar grandes cantidades
ayudar a dar respuesta a preguntas de negocios de información y descubrir nuevos temas y rela-
complejas. Con el software de minería de datos, ciones de términos.
usted puede filtrar todo el ruido caótico y repetitivo
en los datos, destacar lo relevante, usar esa informa- Data Governance (Gobernabilidad de los datos):
ción para evaluar resultados probables y luego ace- Gobernabilidad de los datos significa asegurarse de
lerar la velocidad de toma de decisiones informadas. que los datos estén autorizados, organizados y con
los permisos de usuario necesarios en una base de
Hadoop: Esta infraestructura de software de código datos, con el menor número posible de errores, man-
abierto puede almacenar grandes cantidades de teniendo al mismo tiempo la privacidad y la segu-
datos y ejecutar aplicaciones en clústeres de hard- ridad.
ware comercial. Se ha convertido en una tecnolo-
gía clave para hacer negocios debido al incremento Data Lake: Es un repositorio de almacenamiento que
constante de los volúmenes y variedades de datos, contienen una gran cantidad de datos en bruto y
y a que su modelo de cómputo distribuido procesa que se mantienen allí hasta que son necesarios. A
el big data a gran velocidad. Un beneficio adicional diferencia de un data warehouse jerárquico que al-
es que la estructura de código abierto de Hadoop macena datos en ficheros o carpetas, un data lake
es libre y utiliza hardware comercial para almacenar utiliza una arquitectura plana para almacenar los
grandes cantidades de datos. datos. El data lake se asocia a menudo con el al-
macenamiento de objetos orientado a Hadoop. En
Analítica en memoria: Mediante el análisis de datos este escenario, los datos de una organización se
de la memoria del sistema (y no de su disco duro), cargan primero en la plataforma Hadoop y, a con-
puede obtener insights inmediatos de sus datos y tinuación, se aplican las herramientas de análisis y
actuar con ellos con rapidez. Esta tecnología puede de minería de datos a los datos que residen en los
eliminar latencias en la preparación de los datos y el nodos clúster de Hadoop.
procesamiento analítico para probar nuevos esce-
narios y crear modelos; no sólo es una forma fácil Data Warehouse: Un data warehouse es un repo-
para que las organizaciones se mantengan ágiles sitorio central de información se puede analizar para
y tomen mejores decisiones de negocios, sino que tomar decisiones mejor informadas. Los datos fluyen

138 BOLETíN CONAMED - Vol. 5, Especial - 2019


hacia un data warehouse a partir de sistemas tran- 2. D. R. John Gantz, “El universo digital en 2020: Big Data, som-
bras digitales más grandes y más grandes Crecimiento en el
saccionales, bases de datos relacionales y otros orí-
Lejano Oriente”, IDC, 2013.
genes, normalmente a un ritmo regular. Durante el 3. C. Duhigg, El poder del hábito: por qué hacemos lo que ha-
desarrollo de un data warehouse, se gasta una can- cemos en la vida y los negocios. 2012.
tidad considerable de tiempo analizando las fuentes 4. K. Hill, "Cómo Target descubrió que una adolescente estaba
embarazada antes que su padre", Forbes, febrero 2012.
de datos, entendiendo los procesos y perfilando los 5. T. H. Davenport and D. J. Patil, “Data Scientist: The Sexiest Job
datos. El resultado es un modelo de datos altamen- of the 21st Century,” Harvard Business Review, October 2012.
te estructurado diseñado para la generación de in- 6. J. Manyika, M. Chiu, B. Brown, J. Bughin, R. Dobbs, C.
Roxburgh, and A. H. Byers, “Big Data: The Next Frontier for
formes. Una gran parte de este proceso incluye tomar Innovation, Competition, and Productivity,” McKinsey Global
decisiones sobre qué datos incluir y no incluir en el Institute, 2011.
almacén. Generalmente, si los datos no se utilizan 7. T. H. Davenport, J. G. Harris, and R. Morison, Analytics at Work:
Smarter Decisions, Better Results, 2010, Harvard Business
para responder a preguntas específicas o en un in-
Review Press.
forme definido, pueden excluirse del almacén. Esto 8. D. W. Hubbard, How to Measure Anything: Finding the Value of
se hace generalmente para simplificar el modelo de Intangibles in Business, 2010, Hoboken, NJ: John Wiley & Sons.
datos y también para conservar el costoso espacio 9. J. Cohen, B. Dolan, M. Dunlap, J. M. Hellerstein and C. Welton,
MAD Skills: New Analysis Practices for Big Data, Watertown, MA
en el almacenamiento de disco que se utiliza para 2009.
hacer el data warehouse. 10. S. Todd, “Data Science and Big Data Curriculum” disponible en:
http://stevetodd.typepad.com/my_weblog/data-science-and-
big-data-curriculum/.
Bibliografía
11. T. H Davenport and D. J. Patil, “Data Scientist: The Sexiest Job
of the 21st Century,” Harvard Business Review, October 2012.
1. C. B. B. D. Manyika, "Big Data: la próxima frontera para la inno- 12. Analítica avanzada en el sector salud, consultado en: https:
vación, la competencia y la productividad" McKinsey Global //www.kampal.com/analitica-avanzada-en-el-sector-salud%EF%
Institute, 2011. BB%BF/

BOLETíN CONAMED - Vol. 5, Especial - 2019 139

También podría gustarte