Está en la página 1de 15

Instituto Tecnológico y de Estudios

Superiores de Monterrey.

Campus Estado de México.

Evidencia 2: Visualización de los datos para la toma de


decisiones.

Equipo 3

Bernardo Cavazos Fong A01701310


Carlos de Jesús Ávila González A01750220
José Roberto Díaz Rojas A01747246
Alexia Zoé Trejo Alquicira A01750216
María Valeria Chávez Hernández A01749434

Análisis de datos para la toma de decisiones

7 de septiembre de 2020
Objetivo y contexto.
La COVID-19 es la enfermedad infecciosa causada por un nuevo tipo de coronavirus
descubierto recientemente, tanto el nuevo virus como sus consecuencias eran desconocidos
hasta que se dio el primero brote en Wuhan, China en diciembre de 2019.
El principal impacto que están teniendo el COVID-19 en el mundo es en el ámbito de la
economía, pues se ha visto que grandes y pequeñas empresas han sufrido mucho debido a
que la cuarentena que se lleva a cabo les impide funcionar como lo harían regularmente, a
largo plazo podría causar que las economías más poderosas del mundo se colapsen y tengan
que empezar a generar sus ganancias desde cero, pero también incluiría un nuevo orden
mundial en el cual podrían destacara nuevas potencias económicas que saldrían a flote por la
pandemia. Cabe destacar que también se empieza a desmoronar la idea de que el capitalismo
es la forma más estable de controlar la economía en un país, debido a que se ha visto débil
frente a la situación actual. Otro impacto muy grave es el psicológico – social a las personas
del mundo, puesto que al estar aisladas pierden gran parte del contacto con el mundo exterior,
lo cual es un fuerte golpe para todos ya que somos considerados como seres sociales y que
necesitan contacto con otros seres vivos. De igual manera, el virus ha arrasado con algunas
de las potencias más poderosas en el mundo dejando millones de muertos y contagios en casi
todo el planeta.
México no se ha visto bien frente a esta pandemia gracias a que el gobierno se ha notado un
poco flojo y flexible a la hora de llevar a cabo las medidas que otros países han impuesto, se
ve que la población de México no hace caso a las recomendaciones del gobierno, no respetan
la cuarentena y desprestigian información de las secretarías encargadas de llevar el control
de la pandemia. Actualmente México es uno de los países con más contagios en el mundo,
mientras que el número de defunciones sigue subiendo cada día, los negocios pequeños han
sido totalmente cerrados y muchas personas sufren bancarrota en sus empresas o situaciones
de pobreza extrema por la pandemia.
Otra situación que se está presentando mucho en México es la poca empatía y consciencia
que tienen las personas que no están pasando mal la cuarentena, que tienen de dónde sacar
dinero y no se preocupan mucho por el bienestar de los demás, sólo de sí mismos. Por otra
parte, tenemos a aquellas personas que pese a querer respetar la cuarentena y seguir al pie de
la letra tienen que salir para poder generar ingresos para ellos y los dependientes de ellos.
Pero no todo está perdido alrededor del mundo hay diversas personas que se agrupan en
organizaciones no gubernamentales para así llevar bienestar a todos por igual. Estas se
encargan de velar por los intereses de la población más vulnerable ante la situación actual y
además concientizar a la población general de que sus acciones no sólo impactan en su día a
día, sino que también involucran a terceros. También se encargan de llevar a cabo campañas
de concientización para protegernos del coronavirus en temas de la salud y medidas
preventivas cuando te expones al exterior.
El objetivo de este reporte es el de concientizar a la población acerca de los riesgos que se
tienen frente al nuevo virus COVID-19.
Audiencia.
La audiencia seleccionada para esta situación problema son las organizaciones no
gubernamentales (ONG) que se encargan de concientizar a la población acerca del virus y de
llevar una vida sana. Algunas de estas podrían ser: Educación con el Niño Callejero (Ednica),
Fundación Pro-Niños de la Calle, Acción Social, Médicos del Mundo, Cruz Roja, Médicos
sin Fronteras, Cáritas, Save The Children, entre otras.
Preguntas detonantes.
• ¿Cuáles son los estados con mayor tasa de defunción respecto al Coronavirus?
• ¿Cuáles son las comorbilidades con mayor número de defunciones respecto al
Coronavirus?
• ¿Cuál es la frecuencia de cada comorbilidad?
• ¿Cuál es la edad promedio de los pacientes con prueba positiva?
• ¿En qué estados/municipios hay mayor porcentaje de pruebas positivas?
• ¿A qué velocidad se ha propagado el virus?
• ¿Cuáles son los estados con mayor vulnerabilidad socioeconómica?
Descripción de la fuente de datos.
La base de datos proporcionada es un archivo de Excel con los datos separados por comas y
lleva el siguiente nombre: 28JulioCasosDiariosCovidMexico.csv con un total de 968,528
datos registrados que son las pruebas del virus desde que se informó que se encontró en
México y hasta finales de julio.
A continuación, se presenta una descripción de la base de datos:
Cantidad de datos: La cantidad de datos que se tiene es abrumadora, pues se tienen las
pruebas que se han hecho en toda la república mexicana desde que se detectó la entrada del
virus COVID-19 al territorio mexicano. Se tiene una base de datos con casi un millón de
entradas lo que la hace pesada de ver y sobre todo de trabajar, pero gracias a las herramientas
proporcionadas por la institución se puede elaborar un dashboard informativo y trabajar de
forma flexible con los datos.
Calidad de los datos: La calidad de los datos otorgados se podría considerar como buena,
ya que acata varias características para poder visualizar bien a cada persona que se ha hecho
la prueba del COVID-19. Por otra parte, al contar con diversas variables cualitativas o
binarias se hace casi imposible el poder aplicar algunos estudios estadísticos o medidas en la
base de datos (como podrían ser: media, mediana, desviación estándar, entre otras).
Variables cuantitativas:
• Continuas:
o Edad: Edad de la persona a la que se le realizó la prueba.
• Discretas:
o Número de comorbilidades presentados por persona: Sumatoria de síntomas
previos a contraer la enfermedad.
o Tasa de mortalidad respecto a las pruebas positivas: Número de casos
positivos dividido entre las defunciones totales.
Variables cualitativas:
• Ordinales:
o Fecha de prueba: Fecha de cuando se realizó la prueba.
o ID de los casos: ID de cada caso registrado.
o NumPrueba: Número de identificación de la prueba.
• Nominales:
o Nombres de municipios: Número y nombre del municipio.
o género de los pacientes: Género del paciente que se sometió a la prueba.
o Intubado: El paciente fue entubado o no.
o Neumonía: Infección que inflama los sacos de aire de uno o ambos pulmones,
los que pueden llenarse de fluido.
o UCI: Si se encuentra en unidad de casos intensivos o no.
o Asma: Afección en la que las vías respiratorias de una persona se inflaman,
estrechan y producen mayores cantidades de mucosa de lo normal, lo que
dificulta la respiración.
o Diabetes: Un grupo de enfermedades que tiene como resultado un exceso de
azúcar en la sangre.
o Hipertensión: Afección en la que la presión de la sangre hacia las paredes de
la arteria es demasiado alta.
o EPOC: Conjunto de enfermedades pulmonares que obstruyen la circulación
de aire y dificultan la respiración.
o Inmunosupresión: Supresión de las defensas del cuerpo humano.
o Obesidad: Trastorno caracterizado por niveles excesivos de grasa corporal
que aumentan el riesgo de tener problemas de salud.
o Tabaquismo: Adicción al tabaco.
o Estado: Dónde se llevó a cabo la prueba (en México).
o covidPositivo: Prueba con resultado positivo.
o covidNegativo: Prueba con resultado negativo.
o Defuncion: El paciente falleció o no.
o intubadoNum: Está intubado o no.
o UCINum: Se encuentra en cuidados intensivos o no.
o neumoniaNum: Padece la enfermedad o no.
o asmaNum: Padece la enfermedad o no.
o hipertensionNum: Padece la enfermedad o no.
o diabetesNum: Padece la enfermedad o no
o EPOCNum: Padece la enfermedad o no
o inmunosupresionNum: Padece la enfermedad o no
o obesidad: Padece la enfermedad o no
o tabaquismo: Padece la enfermedad o no
o idEstado: ID del estado.
o idMunicipio: ID del municipio.
o idPaciente: ID para identificar al paciente.
o IdCaso: Es ambulatorio u hospitalizado.
Los datos usados para el desarrollo del dashboard que se solicita fueron extraídos
directamente de la base de datos y otros fueron generados por el equipo.
Exploración de los datos (Evidencia 1).
Parte I.
La base de datos que se nos fue otorgada para la elaboración de esta situación problema es
muy extensa y contiene una cantidad muy elevada de datos. Sin embargo, para el análisis que
les mostraré se toman en cuenta las siguientes variables (se muestran con el mismo nombre
con el cual se identifican dentro de la base de datos:
Tabla I. Variables utilizadas en el análisis.

Variables utilizadas
- Estado.
Cualitativas. - Género.
- Edad.
Cuantitativas. - Comorbilidades.

Las variables en la Tabla I fueron las seleccionadas para realizar los siguientes puntos del
análisis debido a que juegan un papel muy importante en nuestra elaboración del reto por
completo. Ya que nuestro trabajo está basado en la concientización de la población acerca
del COVID-19 y las implicaciones de la salud que pueden empeorar el padecimiento de la
enfermedad.
Parte II.
A continuación, se muestra el análisis exploratorio que se realizó a las variables cuantitativas
seleccionadas (comorbilidades y edad):
Figura 1. Estadísticos descriptivos de la edad.

En la Figura I podemos observar una descripción estadística de la variable de edad que se


nos proporciona de la base de datos, es bueno agregar que, aunque no se muestra en la Figura
I, la moda que se tiene en este caso es de 30, lo que nos dice que esa edad ha sido la más
frecuente al realizar las pruebas de COVID-19 en México. También se pueden apreciar que
se tienen los cuartiles que posee esta variable, así mismo, tenemos un valor atípico en la
variable (120 años) que se puede tomar como un error de la gente que llevó a cabo este reporte
en el pasado.

Figura 2. Histograma de la edad.

Para esta variable se tomó como representación gráfica un histograma que nos ayuda a
observar las frecuencias con las que aparecieron ciertos grupos de valores y también podemos
observar aquellos grupos en los que se tienen hechas más pruebas y en los que no se han
realizado gran número de prueba o tienen poca importancia.
Figura 3. Estadísticos descriptivos de las comorbilidades.

Con este pequeño análisis de la variable de las comorbilidades podemos saber cómo se
comportan los datos de esta variable, como podemos observar en este caso no tenemos
valores atípicos y podría parecer que los dato que aquí se presentan son poco significativos.

Figura 4. Histograma de comorbilidades.

En este caso volví a seleccionar un histograma puesto que se tienen los grupos ya establecidos
para el número de síntomas que padeció cada personas y además podemos observar de forma
detallada los valores que se obtuvieron, también podemos ver que si analizamos los datos del
análisis exploratorio de la Figura 3 notamos que lo obtenido tiene relación con que varios de
los pacientes a los que se les realizó la prueba sólo tenían una comorbilidad, lo que podría
explicar por qué los valores del análisis exploratorio se ven de esa forma.
Parte III.
Para las variables cualitativas se proponen las siguientes representaciones gráficas:
Figura 5. Representación gráfica de variables cualitativas.

En las anteriores representaciones gráficas se puede observar el valor de cada variable


cualitativa lo que nos permite tener una mejor apreciación de los datos a la hora de mostrarlos
a un público general.
Parte IV.
El análisis previo se realizó para poder tener una imagen más amplia de los datos que serán
utilizados a la hora de realizar el proyecto en cuestión. Gracias a este análisis tenemos un
punto de partida sobre hacia donde queremos que vaya nuestra información, y, sobre todo,
en qué nos basaremos a la hora de poder tomar nuestras decisiones.
Gracias al análisis de las variables cuantitativas podemos saber en qué grupo de edades están
más enfocadas las pruebas en México, así como el descubrir por qué hay grupos con más
pruebas que otros. Podemos establecer algunas medidas para ciertos grupos de edad como ya
se ha estado haciendo o mejorar medidas que ya se tienen, también observando que hay
frecuencia en las edades del grupo activo económicamente de la población se podría tomar
la decisión sobre reactivar poco a poco los negocios o seguir esperando que la situación
mejore. Con el análisis en el número de comorbilidades podemos decidir cómo se deben
tratar a los pacientes, quién los tratará y qué medicamentos son más eficientes para las
comorbilidades que poseen los pacientes.
En lo que a las variables cualitativas respecta, podemos observar que el grupo más afectado
en este caso es el de los hombres, usando estos datos y los de las variables cuantitativas
podríamos descubrir por qué se está dando esta situación e imponer medidas a los varones
del territorio mexicanos. Con la gráfica de estados podemos ver cuál de ellos es el más
afectado, decidir si las actividades pueden o no ser resumidas en ese lugar, cambiar el
semáforo o, por el contrario, seguir en cuarentena y si es necesario aumentar las medidas que
se poseen actualmente.
Descripción clara de los indicadores clave de desempeño (KPIs).
Los KPIs en seleccionados para la elaboración del análisis y el dashboard fueron los
siguientes:

- Comorbilidades de los pacientes: Se elaboró un cálculo para poder saber el porcentaje


de comorbilidades que presentaban los pacientes cuya prueba fue positiva, el cálculo
fue de esta forma: Comorbilidad (cualquiera) dividido entre los casos positivos de
COVID-19, esto nos puede ayudar a establecer quién tiene más riesgo de fallecer si
se llega a presentar la enfermedad, cuál de las comorbilidades es la que aparece más
en los pacientes, cuál es la que menos aparecen y si estas tienen alguna relación con
la mortalidad en ese estado.
- Mortalidad: La mortalidad de cada estado fue calculada de la siguiente manera:
Casos de COVID-19 positivos divididos entre el número de defunciones totales,
gracias a esto se puede observar cuál es el estado que más sufrió defunciones o tiende
a sufrir defunciones por la enfermedad del COVID-19 y las complicaciones que esta
contrae
- Edad: Uno de los indicadores que nos puede decir en qué edades se tiene más riesgo
de sufrir una defunción, a qué edad nuestras pruebas están siendo positivas y qué
tendencia se tiene de que la prueba sea positiva o se produzca una defunción.
Descripción del Dashboard.
Las medidas y dimensiones utilizadas en el dashboard son las siguientes:
- Medidas:
o Porcentaje de Asma.
o Porcentaje de Hipertensión.
o Porcentaje de Inmunosupresión.
o Porcentaje de Diabetes.
o Porcentaje de Obesidad.
o Porcentaje de EPOC.
o Edad.
o Mortalidad.
- Dimensiones:
o Estado.
o idCaso.
o fechaPrueba.

A continuación, se muestran los elementos generados con la herramienta Tableau:

Figura 6. Mortalidad por Estado.

En la Figura 6 se puede observar un mapa de la república mexicana, en él se tienen marcados


como valores en porcentaje la mortalidad de cada uno de los estados, también se le agrega
un color que va cambiando conforme más alta es la mortalidad del estado (verde oscuro
siendo el que menos porcentaje de mortalidad tiene y rojo oscuro siendo el que más
mortalidad tiene). También se le agregó el nombre del estado para que sea más sencillo
identificarlos a la hora de querer interactuar con él.
Es gracias a esta representación gráfica que podemos darnos cuenta cuál estado está sufriendo
más defunciones y cuáles están en riesgo de que la tasa de mortalidad suba.
Figura 7. Avance del COVID-19

En la Figura 7 se pueden apreciar gráficas de líneas las cuales nos presentan casos negativos,
casos positivos y defunciones de arriba abajo, así como los valores por mes que se han ido
obteniendo. Con esta gráfica podemos apreciar cómo se ha comportado el virus a través de
los meses y la velocidad con la que este crece o disminuye, así como dónde se encontró un
pico de contagios o de defunciones. También podemos observar en qué estados se han tenido
más pruebas positivas o defunciones a medida que va avanzando el tiempo.

Figura 8. Comorbilidad por género.

En la Figura 8 podemos observar que se tienen los porcentajes calculados de las


comorbilidades detectadas en la base de datos, se estableció un filtro de color que nos ayuda
a identificar cada comorbilidad de manera más sencilla, además de colocar los valores de
cada una de ellas encima para mejor visibilidad. A esta representación gráfica se le colocó
un filtro para que nos diera los porcentajes de cada comorbilidad basado en el género de los
pacientes.
Con esta gráfica podemos ver cuál comorbilidad tiene más frecuencia de aparecer o está más
presente en los pacientes cuya prueba fue de resultado positivo, también podemos establecer
la relación entre las comorbilidades obtenidas y las defunciones que se puedan propiciar, a
su vez, la podemos relacionar con la mortalidad que se tiene en un estado específico.

Figura 9. Edad y género de las pruebas realizadas.

En la Figura 9 podemos observar un recuento de las edades de las personas que se han
realizado la prueba del COVID-19, como se puede observar esta gráfica igual tiene un filtro
de género para poder buscar el promedio de las edades en las que se han realizado más
pruebas para cada género. Con esta gráfica podemos obtener el número de personas a las
cuales se les ha realizado la prueba del COVID-19 y las edades de ellas para poder observar
la frecuencia con la cual se realizan pruebas y a qué población se le realizan.

Figura 10. Boxplot de edades.


Por último, en la Figura 10 podemos observar un BoxPlot de las edades y los ID de los casos
que se han presentado, podemos notar los bigotes superior e inferior, así como los cuartiles
y algunas medidas de tendencia central, también identificamos claramente los outliers de la
situación.
Con esta gráfica de caja podemos obtener las edades en las que se ha presentado el virus y si
este ha sido hospitalizado o no, también podemos sacar las medidas de tendencia central de
las edades con pruebas positivas.
A continuación, se presenta el Dashboard terminado:

Figura 11. Dashboard propuesto.

Para que este dashboard sea manejable para cualquier usuario se integró un filtro con el cual
al dar clic a un estado en concreto las demás gráficas cambiarán para así mostrar los valores
del estado del cual se tiene interés, también se estableció una pequeña caja de valores para
saber qué nos dice cada color en el apartado de “Comorbilidad por género”. Por último, se
establecieron colores que fueran agradables a los ojos y que funcionaran como indicador de
lo que está pasando en distintas partes del Dashboard.
Conclusiones.
A las conclusiones que yo llego al realizar esta situación problema y trabajar con temas como
estadística y elaboración de Dashboards, es que actualmente se tienen muchas formas de
interpretar la información, ya que se puede hacer muy sencilla para que esta pueda ser captada
por un público general o se puede hacer muy especializada para ciertos grupos que manejan
un tema a la perfección. Me di cuenta de que en base al análisis de los datos se pueden llegar
a conclusiones muy específicas que nos pueden ayudar a tomar decisiones apropiadas en
muchos casos o reforzar aquellas decisiones que ya han sido tomadas.
Pude notar que la elaboración de Dashboards y el manejo de herramientas computacionales
interactivas es un gran aporte para nuestras habilidades, ya que facilitan en gran manera la
forma en la cual podemos transmitir la información que poseemos y podemos ser capaces de
explicársela a cualquier grupo de gente, también son un gran apoyo a la hora de tomar
decisiones en cualquier ámbito de la vida y nos ayudan como un soporte gráfico de lo que
queremos dar a entender a nuestra audiencia.
En la parte de estadística puedo decir que gracias a las medidas de tendencia central y
dispersión podemos observar cómo se comporta cada variable y si tienen alguna tendencia,
se me hizo muy sencillo la identificación de variables en la base de datos que se nos
proporcionó gracias a la explicación de estas durante la clase y que se tuvieron ejemplos y
cómo podemos manejar cada una de ellas. Aprendí a elaborar variables propias utilizando
datos previamente obtenidos, así como, convertir variables de un tipo a otro que en este caso
fue de mucha ayuda. Me hubiera gustado ver más acerca de regresiones y adentrarnos un
poco más a lo que son las predicciones, pero aún así el curso estuvo bastante completo y los
temas impartidos en clase tuvieron mucha influencia a la hora de resolver el reto.
Uno de los problemas más recurrentes a la hora de la resolución del reto fue la base de datos,
pues esta era demasiado extensa y muchas veces los datos se tardaban en cargar o
simplemente no se podía abrir el documento, lo que imposibilitaba muchas veces el manejo
de los datos o complicaba la situación problema. Otro reto que se tuvo fue el de aprender a
utilizar las nuevas herramientas que se solicitaban para este bloque. Sin embargo, se subieron
tutoriales y se enfocaron algunas sesiones a enseñarnos las bases de las herramientas lo que
hizo el trabajo más sencillo.
Bibliografía.

Departamento de Comunicación Global ONU. (n.f.). La ONU contra la desinformación


sobre el COVID-19 y los ataques cibernéticos | Naciones Unidas. Recuperado Agosto 18,
2020, de: https://www.un.org/es/coronavirus/articles/onu-contra-desinformacion-covid-19-
ataques-ciberneticos

Noticias ONU. (2020, Agosto 6). Los pobres e indígenas tienen más probabilidad de morir
si se enferman de COVID-19, advierte la OMS | Noticias ONU. Recuperado de:
https://news.un.org/es/story/2020/08/1478482

García, A. (2019, Diciembre 17). La economía informal generó 22 de cada 100 pesos del
PIB de México en 2018. Recuperado de: https://www.eleconomista.com.mx/economia/La-
economia-informal-genero-22-de-cada-100-pesos-del-PIB-de-Mexico-en-2018-20191216-
0033.html

Instituto Nacional de Estadística y Geografía (INEGI).( s.f). Datos por entidad federativa.
Recuperado Agosto 29, 2020, de: https://www.inegi.org.mx/app/bienestar/

Garcia, A. (2020, Junio 20). Esencial, apoyo de ONG contra pandemia, afirman. Recuperado
de: https://www.eluniversal.com.mx/nacion/esencial-apoyo-de-ong-contra-pandemia-
afirman
MexicoN95. (s.f.). Proyecto MexicoN95. Recuperado Agosto 30, 2020, de:
https://mexicon95.com/

Creativa, O. (s.f.). NUESTRO ORIGEN. Recuperado Agosto 30, 2020, de:


https://www.fundacionado.org/

Valor Compartido. (2020, Mayo 10). Fundación ADO impulsa alianza con MABE;
transporta dispositivos para personal médico durante COVID-19. Recuperado Agosto 30,
2020, de: https://www.valor-compartido.com/fundacion-ado-impulsa-alianza-con-mabe-
transporta-dispositivos-para-personal-medico-durante-covid-19/

También podría gustarte