Está en la página 1de 22

ELECTIVA

EPIDEMIOLOGÍA DIGITAL
Andrés Mejía

EJE 4
Propongamos

Fuente: Adobe/331293425
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Recolección y análisis de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Técnicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Análisis de contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Análisis temático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Análisis de redes sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Aprendizaje de máquinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Análisis semántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Análisis de series de tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Herramientas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

Symplur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Twitonomy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

NodeXL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Otros proyectos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

NextStrain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

SocioPatterns . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

La ética en la epidemiología digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Privacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
ÍNDICE

Autonomía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Equidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

El riesgo del error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Responsabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
INTRODUCCIÓN

Introducción

En este eje final mostraremos algunas técnicas y herramientas para hacer la


recolección y el análisis de datos. Además, presentaremos otros ejemplos de pla-
taformas que pueden también ser empleadas y que emplean datos provenientes
de internet, así como algunos ejemplos más de proyectos en curso para ejemplifi-
car con más profundidad los alcances de la epidemiología digital. Finalizaremos
mostrando algunas de las implicaciones éticas de la epidemiología digital bajo
ahondando en el esquema del primer módulo, pero profundizando más en el
contexto del COVID-19.
Recolección y
análisis de datos
Figura 1. Estadísticas COVID-19
Fuente: Adobe/ 330366836

Técnicas

Existen diversas técnicas de análisis de datos de acuerdo a la pregunta de investigación,


a la disponibilidad de los datos y la actividad de extracción. Ahmed (2019) nos señala
las siguientes:

Análisis de contenido

En el cual se clasifica de forma sistemática los contenidos que se han encontrado y


elegido ya sean texto, audio o fotografías de las redes sociales y de social media. Es muy
funcional para plataformas que requieren una extracción manual de datos o que tienen
alto contenido en imágenes o texto libre.

Análisis temático

Se trata de una actividad en donde se buscan patrones dentro de los datos extraídos
a través del contacto y gestión, digamos, manual. Es un proceso de familiarización, lo
cual permite codificarlo, clasificarlo y hacer análisis encontrando puntos en común. Es
similar al proceso de análisis de contenido.

Análisis de redes sociales

Esto lo señalamos en el primer módulo y es un método de análisis de mucha utilidad


cuando se trata de big data y, particularmente, si es Social Big Data. Se emplea para

Electiva Epidemiología digital - eje 4 propongamos 5


encontrar las relaciones que existen entre diferentes nodos, sean estas personas, organi-
zaciones, plataformas, etc. Se busca medir el grado de relación y así poder mapear sus
interacciones.

Aprendizaje de máquinas

Igualmente, como lo mencionamos en el primer módulo, este proceso de análisis


implica que los algoritmos puedan aprender, es decir, encontrar tendencias o detectar
patrones, por ejemplo, sin que hayan sido programados específicamente para ello, sino
que se les alimenta con un subconjunto de datos con el cual se entrena para luego clasi-
ficar, encontrando esas tendencias y patrones, el otro subconjunto que es el más grande.

Análisis semántico

En este método se realiza un análisis del lenguaje que se ha empleado, ya sea en el


texto, o en el audio, de modo que se puedan encontrar significados, mediante la relación
que exista entre partes del lenguaje: palabras, expresiones, etc.

Análisis de series de tiempo

Estos análisis se encargan de esquematizar la frecuencia de datos obtenidos en las


redes sociales o en el social media a través del tiempo.

Video

Les invitamos a ingresar a la página principal del eje


para revisar la videocápsula:

Big Data vs. Big Disease: How Algorithms Can Stop


Pandemics | Wendy Taylor

https://www.youtube.com/watch?v=MwDh3IEXYcU

Herramientas

Existen diversas herramientas para el análisis de redes sociales y social media y acá
vamos a explorar tres: Symplur, Twitonomy y NodeXL.

Instrucción

Para ampliar la información se invita al estudiante a ingre-


sar a la página principal del eje para revisar la actividad
de aprendizaje:

Caso simulado

Electiva Epidemiología digital - eje 4 propongamos 6


Symplur

Sitio web: https://www.symplur.com/

Una herramienta de fácil uso que permite evaluar tweets con el objetivo de
encontrar tendencias y de obtener conocimiento sobre grandes cantidades de
datos. Acá desglosamos algunas de las diversas posibilidades que ofrece.

Análisis de redes

Como se puede ver en la figura 2, el análisis de redes permite Análisis de redes


determinar de qué forma están conectadas las cuentas que han Busca representar las relacio-
nes existentes entre las partes
compartido contenido asociado a un tema en particular. Los nodos de una red dada y, por esta ca-
más grandes dan cuenta del volumen de tweets o de influencia. racterística, es que se emplea
fuertemente en el análisis de
Se puede, además, visualizar según el tipo de audiencias: pro- redes sociales.
fesionales de la salud, pacientes, organizaciones, investigadores,
entre otros.

Figura 2. Análisis de redes en Symplur


Fuente: Symplur (2020)

Electiva Epidemiología digital - eje 4 propongamos 7


Análisis de influenciadores

En la figura 3 podemos ver un análisis de influenciadores clasificados según un nivel


de influencia calculado por la plataforma. Como en el caso anterior, permite subdividir
el análisis según el tipo de audiencia de interés.

Figura 3. Análisis de influenciadores en Symplur


Fuente: Symplur (2020)

Gráfico Social

Aquí, como lo muestra la figura 4, se analizan diferentes cuentas según el Healthcare


Social Graph Score que mide el grado de influencia y que puede clasificarse también en
diferentes áreas de impacto.

Electiva Epidemiología digital - eje 4 propongamos 8


Figura 4. Gráfico social en Symplur
Fuente: Symplur (2020)

Análisis de audiencias

En este tipo de análisis, (figura 5), se puede hacer un desglose general de los grupos
de interés en salud y visualizar el comportamiento en el tiempo para cada segmento.

Figura 5. Análisis de audiencias en Symplur


Fuente: Symplur (2020)

Electiva Epidemiología digital - eje 4 propongamos 9


Tendencia de temas

La figura 6 nos muestra los temas de interés para un tópico en salud en particular,
en un gráfico de burbujas, en donde los temas asociados más importantes están repre-
sentados por burbujas grandes. También permite seleccionar uno de esos temas como
tópico central y, así, encontrar los subtemas de mayor interés.

Figura 6. Análisis de tendencias de temas en Symplur


Fuente: Symplur (2020)

Análisis de sentimientos

En la figura 7 vemos un análisis de las emociones de los usuarios que han compartido
tweets sobre un tema en particular. Estas emociones están clasificadas por grupos de
interés, y si son positivas o negativas.

Electiva Epidemiología digital - eje 4 propongamos 10


Figura 7. Análisis de Sentimientos en Symplur
Fuente: Fuente: Symplur (2020)

Twitonomy

Sitio web: https://www.twitonomy.com/

Esta es una plataforma enfocada también a Twitter. De ahí su nombre. Sin


embargo, en relación con Symplur, permite hacer análisis exhaustivos de cuen-
tas específicas. Acá voy a mostrar algunos ejemplos de lo que se puede hacer
empleando mi cuenta profesional en Twitter @FelipeMejiaMV

Estadísticas básicas

En la figura 8, se pueden analizar indicadores como tweets por día, número de men-
ciones, número de enlaces compartidos, número de hashtags empleados, así como el
volumen total de tweets, entre otros. Se puede variar el rango temporal de análisis según
convenga.

Electiva Epidemiología digital - eje 4 propongamos 11


Figura 8. Estadísticas de cuenta Twitter en Twitonomy
Fuente: Twitonom (2020)

Historia de tweets

En la figura 9, se analiza el total de tweets en el rango de tiempo seleccionado en el


tiempo.

Figura 9.Volumen de tweets en el tiempo en Twitonomy


Fuente: Twitonom (2020)

Electiva Epidemiología digital - eje 4 propongamos 12


Relación con usuarios

En esta figura, se determina, para el período analizado, cuáles son los usuarios con los
que se ha ejercido mayor vinculación, medida a través de retweets, respuestas y favoritos.

Figura 10. Vinculación con usuarios de cuenta Twitter en Twitonomy


Fuente: Twitonom (2020)

Hashtags más empleados y tweets más retuiteados

La figura 11, muestra la lista de los 10 hashtags más usados. También los 10 tweets más
compartidos por otros usuarios y con el mayor número de me gusta.

Electiva Epidemiología digital - eje 4 propongamos 13


Figura 11. Hashtags más usados y Tweets más retuiteados de cuenta Twitter en Twitonomy
Fuente: Twitonom (2020)

NodeXL

Sitio web: https://www.smrfoundation.org/nodexl/

Es un software de análisis y visualización de redes que ha sido diseñado para


Microsoft Excel y que debe ser descargado de la página señalada. Tiene tanto una
versión gratuita con limitaciones en las herramientas como una paga en donde
se puede hacer un análisis más completo.

La figura 12, muestra un ejemplo de análisis de redes en donde el mapa muestra una
serie de contactos entre dos usuarios cuando hay una mención o contacto entre sí. Muy
similar a lo que vimos en Symplur.

Se parte de que las personas, usuarios e instituciones se agrupan según intereses


compartidos.

Esta herramienta está dirigida a múltiples tipos de redes sociales y plataformas como
Twitter, Wikipedia, YouTube, entre otros.

Electiva Epidemiología digital - eje 4 propongamos 14


Figura 12. Análisis de redes en NodeXL
Fuente: Social Media Research Foundation NodeXL (2020)

Instrucción

Les invitamos a ingresar a la página principal del eje para


revisar el recurso de aprendizaje:

Caso modelo

Otros proyectos

Mencionaremos dos proyectos en curso: NextStrain y SocioPatterns que emplean


datos de diversas fuentes, el primero, de datos sobre biología molecular sobre varias
enfermedades infecciosas virales como bacterianas con información geográfica y, el
segundo, que emplea datos de sensores portables, los llamados wearables para medir la
proximidad física entre individuos.

NextStrain

Sitio web: https://nextstrain.org/

Esta plataforma de vigilancia busca mostrar en tiempo real patógenos en evolución,


permitiendo crear visualizaciones interactivas de datos. Está dirigida a profesionales e
interesados en la virología, epidemiólogos, salubristas, entre muchos otros.

Electiva Epidemiología digital - eje 4 propongamos 15


Figura 13. Sitio Web de NextStrain
Fuente: NextStrain (2020)

SocioPatterns

Sitio web: http://www.sociopatterns.org/

Se trata de una colaboración de investigación interdisciplinaria que trabaja sobre cómo


emplear los datos para estudiar las dinámicas sociales. Figura 13. En una experiencia, uti-
lizaron sensores vestibles de proximidad para recopilar conjuntos de datos a gran escala
sobre interacciones humanas cara a cara en diversas locaciones geográficas.

Electiva Epidemiología digital - eje 4 propongamos 16


Figura 14. Sitio web de la galería de SocioPatterns
Fuente: SocioPatterns (2020)

Instrucción

Les invitamos a ingresar a la página principal del eje para revisar


el recurso de aprendizaje:

Demostración de roles

La ética en la epidemiología digital

Todas las innovaciones tecnológicas traen unas preguntas éti-


cas indudables. Máxime si se trata de innovaciones en la salud, Bioética
para lo cual existe un enorme campo de la filosofía aplicada Estudio de las preocupaciones
éticas que conciernen a la sa-
como lo es la bioética. lud, la salud pública, la medici-
na, sus innovaciones, implica-
ciones y aplicaciones.

Electiva Epidemiología digital - eje 4 propongamos 17


Figura 15. Bioética
Fuente: Adobe/280443540

La bioética ha explorado las diversas cuestiones éticas tanto de la vigilancia en salud


pública, de la ciencia de los datos en salud como de las TIC en salud. Por lo cual, en una
triple intersección, encontramos la ética de la vigilancia en salud apoyada por mecanis-
mos digitales, es decir, la vigilancia epidemiológica digital.

Acá, basado en lo expuesto por (Mello & Wang, 2020), presentaré algunos de los retos
éticos que se deben enfrentar en el contexto del COVID-19.

Instrucción

Les invitamos a ingresar a la página principal del eje para revi-


sar las siguientes actividades:

• Lectura complementaria:

Tracking the debate on COVID-19 surveillance tools

Lilian Edwards

• Práctica

Electiva Epidemiología digital - eje 4 propongamos 18


Privacidad

La epidemiología digital emplea datos de origen digital, usualmente masivos, que crean
la dificultad de obtener de manera ágil y con una logística racional, obtener el consenti-
miento informado de las personas dueñas de esos datos. Muchos aspectos de este tipo
de vigilancia pueden emplear fotografías de los usuarios, sus ubicaciones geográficas,
explorar las listas de sus contactos, así como emplear sus comportamientos para derivar
conclusiones sobre tendencias y características que las personas podrían no querer dar a
conocer a un tercero. Esto aplicaría no solo fuera de los lugares de residencia sino dentro
de cada espacio de ella. Con el advenimiento de la internet de las cosas y los dispositivos
vestibles, incrustables y digeribles, la privacidad podría verse arrinconada y se hará aún
más difícil obtener el consentimiento. ¿Se puede acaso no consentir? ¿Y en casos de
emergencia con el COVID-19 y otras futuras pandemias, es correcto implementarlo?

Autonomía

La autonomía tiene acá dos asociaciones. Por un lado, está la autonomía de poder
decidir si participar o no en este tipo de vigilancia. Como vimos, la logística de obtener el
consentimiento informado de cada persona de quien se requieran datos y para cada vez
que se ejerza la actividad de vigilancia, requiere de una logística difícil de lograr. Además,
es difícil determinar si las personas comprenden el alcance, los beneficios y perjuicios de
tal consentimiento. Por el otro lado están las medidas que se toman para controlar, por
ejemplo, el movimiento social y cuyos indicadores derivan de sensores de posicionamiento.
Como los GPS en los celulares. ¿Son correctas estas medidas que evitan la autónoma
movilidad individual y que se monitorean mediante estos mecanismos?

Equidad

A pesar de la alta penetración de celulares, del crecimiento sostenido en el acceso a


internet y el uso por diferentes generaciones y géneros, aún existen poblaciones con bajo
acceso a estas TIC. Incluso con bajo acceso sostenido a la electricidad, lo cual dificulta
de gran manera el uso de las TIC, así las tuviesen. Además, las inequidades de género
pueden llevar a que a muchas mujeres no se les permita el uso de estas tecnologías. O
que ciertas generaciones no tengan el alfabetismo digital para darles uso efectivo, así
las tengan. Todo esto crea una situación en la cual la epidemiología digital puede dejar
por fuera a sectores vulnerables por la gran dependencia axiomática que ésta tiene de
los datos digitales.

El riesgo del error

Debido a su naturaleza novedosa, la epidemiología digital puede traer consigo impac-


tos negativos por errores en la obtención de los datos, en el análisis, en la interpretación
y aplicación de medidas. En el caso, por ejemplo, del Social Big Data, pequeños errores
pueden representar datos de numerosas personas a quienes podría encontrarse una

Electiva Epidemiología digital - eje 4 propongamos 19


tendencia incorrecta, un patrón que no existe, y aplicar medidas innecesarias que los
ponga en riesgo a ellos o a los recursos que se emplearon.

Lectura recomendada
Para ampliar este apartado se invita al estudiante
desde la página principal del eje a realizar la lectura
complementaria:

What is data ethics?

Luciano Floridi, Mariarosaria Taddeo

Además, la epidemiología digital, en contexto de emergencia, lleva a que se desarrollen


mecanismos que no han sido adecuadamente probados y validados, lo cual puede llevar
a conclusiones erradas que impacten negativamente a las personas y a las finanzas del
inversor.

Debido a que emplea datos digitales, ¿qué mecanismos dispone la epidemiología


digital para filtrar información veraz de la que no lo es? En enormes volúmenes de datos,
¿es esto posible? Si este proceso se hace mal, puede llevar a conclusiones erradas e
intervenciones incorrectas.

Responsabilidad

Deben elaborarse mecanismos de manera tal que exista una vinculación entre los
usuarios de la epidemiología digital y las consecuencias de estos análisis, ya sean institu-
ciones privadas o gubernamentales, centros y grupos de investigación, o incluso personas
naturales. Esto es crucial porque así mismo pueden desarrollarse protocolos y lineamientos
de mejores prácticas y minimización de riesgos. ¿Cuál es el nivel de transparencia que
se debe tener sobre estos procesos? ¿Hasta dónde los datos empleados deben ser de
dominio público? ¿Quién se encarga de delimitar lo público de lo privado en los datos de
las personas y sus análisis, en particular, frente a una emergencia como la de COVID-19?

Video

Les invitamos a ingresar a la página principal del eje


para revisar la videocápsula:

Digital Epidemiology - ¿What are the Ethical Concerns?

https://www.youtube.com/watch?v=61FtO62r7tM

Electiva Epidemiología digital - eje 4 propongamos 20


Conclusiones

Vemos que existen numerosas iniciativas y técnicas para realizar la recolección y el


análisis de datos en materia de epidemiología digital. Muchas emplean las visualizaciones
interactivas para facilitar el análisis de resultados. Se mostraron ejemplos de plataformas
que emplean datos obtenidos de redes sociales y social media, y otras que usan datos de
sensores y de reportes oficiales.

Lectura recomendada

Les invitamos a ingresar a la página principal del eje


para revisar la lectura complementaria:

¿Es la privacidad de los datos el precio que debemos


pagar para sobrevivir a una pandemia?

Marcelo Cabrol, Ricardo Baeza, Natalia González,


Cristina Pombo

Finalmente, vemos que la epidemiología digital tiene muchas cuestiones éticas que
necesitan análisis adecuados, así como la formulación de políticas y protocolos que ase-
guren que existe una maximización de los beneficios que puedan obtenerse de este tipo
de técnicas digitales y que minimicen los posibles daños que puedan generarse tanto a
las personas como a las instituciones que estén haciendo uso de la epidemiología digital.

Electiva Epidemiología digital - eje 4 propongamos 21


Bibliografía
Ahmed, W. (2019). Using Twitter as a data source: an overview of social media.
Obtenido de https://blogs.lse.ac.uk/impactofsocialsciences/about-the-lse-
BIBLIOGRAFÍA

impact-blog/

Mello,M.(29 de mayo de2020).Ethics and governance for digital disease surveillance.


Obtenido de https://science.sciencemag.org/content/368/6494/951

Nextstrain.org. (2020). Seguimiento en tiempo real de la evolución de los


patógenos. Obtenido de https://nextstrain.org/

Socialmedia Research Foundation NodeXL.org. (2020). How to read a network


map. . Obtenido de https://www.smrfoundation.org/networks/how-to-read-
a-network-map/

SocioPatterns.org. (2020). Dynamical Contact Patterns in a Primary School.


Obtenido de http://www.sociopatterns.org/gallery/

Symplur.com. (2020). Symplur Signals. Obtenido de https://www.symplur.com/


product/symplur-signals/

Twitonomy.com. (2020). Twitonomy.

También podría gustarte