Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN
La Insuficiencia cardiaca es una anomalía estructural o funcional del corazón que resulta de cualquier
anormalidad que compromete el llene o la eyección ventricular (Ministerio de Salud, 2015).
Representa una de las mayores causas de morbilidad y mortalidad a nivel mundial, oscilando entre el
1 y 2% del total de la población adulta (García y Parraga, 2019). La enfermedad tiene una alta tasa de
letalidad, con una sobrevida a 5 años luego de efectuado el diagnóstico de 50% (Ministerio de Salud,
2015). Las principales causas de la insuficiencia cardiaca son la enfermedad coronaria y la
hipertensión, que a menudo se presentan juntas, seguidas de miocardiopatías y disfunciones
valvulares. Los principales factores de riesgo de la insuficiencia cardiaca son también los de sus
precursores causales: diabetes, tabaquismo, obesidad, sedentarismo (Jiménez, s.f.).
La página web de la American Heart Association sostiene que hay diversas formas de clasificar la
insuficiencia cardiaca, siendo la más común la que se refiere al tipo de alteración funcional del
músculo cardiaco por tener implicaciones pronósticas y terapéuticas importantes. Aquí la
insuficiencia cardiaca se puede agrupar en dos tipos según el valor de la fracción de eyección. La
fracción de eyección es una medida del porcentaje de sangre que sale del corazón cada vez que se
contrae. Una fracción de eyección normal del corazón puede estar entre el 50% y el 70%. Esta se
puede dividir en fracción de eyección preservada, cuando el músculo cardíaco se contrae
normalmente, pero los ventrículos no se relajan como deberían durante el llenado ventricular (o
cuando los ventrículos se relajan); y fracción de eyección reducida cuando el músculo cardíaco no se
contrae de forma eficaz y, por lo tanto, se bombea menos sangre rica en oxígeno al cuerpo.
Existen diversos trabajos que demuestran que la supervivencia de los pacientes hospitalizados por
insuficiencia cardiaca tras el alta tiene que ver con diversos factores, especialmente la existencia de
pluripatología, la edad, la diabetes mellitus, la cardiopatía isquémica y la insuficiencia renal crónica,
entre otros. El diagnóstico de la insuficiencia cardíaca no es fácil, especialmente en las etapas
tempranas. La información demográfica, la historia clínica y los signos y síntomas son el primer paso
en el diagnóstico, junto con pruebas como ecocardiografía, radiografía, resonancia magnética y las
pruebas básicas de laboratorio, por ejemplo, hemogramas (Campuzano y Galán, 2014).
- Edad:
Ruiz-Ruiz et al (2005) afirman que la edad es un importante factor para el pronóstico en personas
con insuficiencia cardiaca, pues la gran mayoría de los enfermos que se atienden en los servicios de
salud son de elevada edad. Por este motivo los autores sugieren la realización de estudios clínicos
que incluyan pacientes con estas características, lo que permitiría conocer mejor la evolución de la
insuficiencia cardiaca en este grupo de población. En relación al factor sexo, se puede indicar que las
mujeres con diagnóstico de insuficiencia cardiaca son de mayor edad, con fracción de eyección
preservada, mayor número de comorbilidades, mayor limitación funcional y peor calidad de vida que
los hombres. (Díaz-Toro, Nazzal y Verdejo, 2017). Por su parte, la relación del sexo con la
insuficiencia cardiaca es controversial. Aunque una gran cantidad de estudios poblacionales han
mostrado que esta enfermedad afecta preferentemente a los hombres, existe evidencia que la
prevalencia e incidencia aumenta en mujeres a medida que estas envejecen (Díaz-Toro, Nazzal y
Verdejo, 2017).
- Tabaquismo:
En lo que se refiere al factor tabaquismo se puede mencionar que una vez que hay evidencia de
insuficiencia cardiaca, el tabaquismo es predictor de peor pronóstico. Los fumadores activos
demuestran un riesgo mayor de muerte, o del combinado de muerte, reingreso por insuficiencia
cardiaca o infarto. Los fumadores padecen más precozmente enfermedad coronaria, cerebrovascular
y vascular periférica, y están más expuestos a padecer muerte súbita e insuficiencia cardiaca
(Becoña, 2004).
- Anemia:
Otro factor a considerar es la anemia, que es considerada una de las causas más frecuentes en
pacientes con insuficiencia cardíaca. En los últimos 10 años, la anemia es motivo de cuidado por su
frecuencia y mal pronóstico en los pacientes (Bichara, 2016).
- Diabetes:
- Hipertensión:
Por otro lado, la hipertensión arterial representa el principal factor de riesgo modificable para el
desarrollo de insuficiencia cardíaca (Suarez y Rusak, s.f). La hipertensión arterial también juega un rol
importante en la génesis de fibrilación auricular e hipertrofia ventricular izquierda. Su alta
prevalencia y su gran impacto en el origen de enfermedades cardiovasculares justifican todos los
esfuerzos posibles para su control (Kunstmann y Kauffmann, 2005).
- Creatina Fosfoquinasa:
Como se expresó previamente, los exámenes de laboratorio entregan importante información para
prevenir la incidencia de episodios relacionados con insuficiencia cardiaca. Tal es el caso de la
creatina-fosfoquinasa que es una enzima que está presente en el cuerpo. Cuando su nivel total es
muy alto, a menudo significa que ha habido lesión o estrés en el corazón (Chen, 2019). La
insuficiencia renal es un importante factor pronóstico. Para valorar la función renal se suelen utilizar
las cifras de creatinina sérica, que es uno de los factores tomados en cuenta en este trabajo (Zamora
et al, 2007).
Los exámenes también consideran los niveles séricos que se asocian con un empeoramiento de la
función renal en pacientes con insuficiencia cardíaca y con un mayor riesgo de muerte cardiovascular
(Ravassa et all, 2020). También es importante considerar el nivel de sodio, que es un mineral que
sirve para que los músculos y nervios funcionen bien. La prueba de sodio sérico es un examen de
sangre de rutina que indica si un paciente tiene niveles normales de sodio en la sangre. Un nivel
anormalmente bajo de sodio en sangre puede deberse a insuficiencia cardíaca (Medlineplus, 2007).
Y también los niveles de plaquetas en la sangre, puesto que un nivel bajo es signo de insuficiencia
cardíaca.
- Evento de Muerte:
El objetivo principal de este estudio es analizar variables epidemiológicas y clínicas que pueden
predecir la mortalidad tanto hospitalaria como a largo plazo de los pacientes hospitalizados por
insuficiencia cardíaca.
Para efecto de este estudio se extrajeron los datos del repositorio UCI machine learning del año
2015. Dentro de las 13 variables se encuentran:
El resultado de este trabajo procura convertirse en una herramienta de apoyo para los médicos
cuando requieran predecir si un paciente con insuficiencia cardíaca sobrevivirá o no al tratamiento
elegido.
MARCO TEÓRICO
RStudio es una interfaz o entorno de desarrollo integrado que permite usar el lenguaje de
programación R, que se diseñó con el propósito de hacer análisis estadísticos y gráficos
representativos. Son muchos los investigadores científicos que lo utilizan para sus estudios
(González, 2019).
Amat (2016) sostiene que la regresión lineal múltiple hace posible la generación de un modelo lineal
en el que el valor de la variable respuesta o dependiente (Y) se determina a partir de un conjunto de
valores independientes denominados predictores. Los modelos de regresión múltiple se pueden
emplear para predecir el valor de la variable dependiente o evaluar la influencia que tienen los
predictores sobre esta variable.
El autor también afirma que en los modelos lineales múltiples los predictores tienen que ser
independientes, no debe haber colinialidad entre ellos. Sobre esto agrega que la colinialidad ocurre
cuando un predictor está linealmente relacionado con uno o varios de los otros predictores del
modelo, y que la multicolinialidad hace que no se pueda identificar el efecto individual que tiene
cada una de las variables predictoras sobre la variable respuesta, lo que produce un incremento de
la varianza de los coeficientes de regresión estimados hasta el punto donde no se puede establecer
prácticamente su significancia estadística.
Cuando se dispone de múltiples variables y se quiere estudiar la relación entre todas ellas se recurre
al cálculo de matrices con el coeficiente de correlación de cada par de variables. Se pueden además
generar gráficos de dispersión dos a dos. En R existen funciones que hacen posible la realización de
este estudio en específico, donde se representan gráficamente los resultados (Herrera, 2020).
En caso de encontrar colinealidad entre los predictores, el autor señala que se debe excluir uno de
los predictores problemáticos, intentando conservar el que influye en la variable respuesta. Esta
medida no tiene mucho impacto en el modelo en cuanto a su capacidad predictiva, porque al existir
colinialidad, la información que aporta uno de los predictores es redundante en la presencia del otro
(Barrero, s.f).
"Cada predictor numérico tiene que estar linealmente relacionado con la variable respuesta Y
mientras los demás predictores se mantienen constantes, de lo contrario no se puede introducir en
el modelo” (Amat, 2016). Amat además explica que la forma más recomendable de comprobarlo es
representando los residuos del modelo frente a cada uno de los predictores. Si la relación es lineal,
los residuos se distribuyen de forma aleatoria entorno a cero. Los residuos se deben distribuir de
forma normal con media cero. Para comprobarlo se recurre a histogramas, a los cuantiles normales o
test de hipótesis de normalidad.
RESULTADOS
Regresión logística
Mediante el método stepwise, el cual va descartando una a una las variables que resulten no ser significativas
para el modelo. El análisis concluye cuando todas las variables resulten significativas.
Se compara la devianza y el p valor del modelo sin variables predictoras y el modelo con las variables añadidas.
375.35 239.61 0
Tabla 2: Devianza. Fuente: Elaboración propia
Componentes Principales
Los resultados obtenidos provienen del análisis de los gráficos (ver anexo4 las gráficas circulares de CP). En
particular no es posible concluir con la información obtenida a partir del análisis de componentes principales,
esto se debe a que la correlación de las variables (ver anexo 1) tiene valores muy bajos (cercanos a 0).
Finalmente se incluyen estos resultados con fines demostrativos de uso del software R. La siguiente tabla
muestra cuales fueron las variables que explican mejor según los gráficos y el código.
Cluster
Según la función NbClust() la cantidad óptima de conglomerados es de 5 grupos, los cuales son representados
por la figura a continuación
CONCLUSIÓN
Antes de poder introducirnos en la conclusión de nuestro trabajo, tenemos que recordar cuales eran los
objetivos de nuestro proyecto. Recordamos que, durante este estudio se aplicaron diversos clasificadores con
el fin de predecir la supervivencia de los pacientes aquejados por esta condición, y a la vez clasificar los factores
de riesgo más significativos.
Antes de comenzar, hemos de decir que decimos en un principio, analizar el modelo en 2 formas, en el primer
caso tomando tan solo las variables numéricas de nuestro estudio, en el otro escenario, decidimos estudiar el
modelo en su plenitud, pero cambiando aquellas variables binarias, a variables de tipo dummy.
Para el primer caso, decidimos analizar la correlación entre las variables numéricas, para eso podemos ver la
siguiente tabla comparativa:
Barrero, G. (s.f). Análisis De Datos De Calidad De Software Desarrollado En Ibm Rpg Usando
Regresión Lineal Múltiple. Calameo. Recuperado de
https://es.calameo.com/read/004762847930d1437ae68
Becoña, E. (2004). Monografía Tabaco. Delegación del Gobierno para el Plan Nacional sobre
Drogas. Recuperado de
https://pnsd.sanidad.gob.es/ca/profesionales/publicaciones/catalogo/bibliotecaDigital/pu
blicaciones/pdf/tabaco.pdf#page=102
Buchan TA, Ross HJ, McDonald M, Billia F, Delgado D, Duero Posada JG, Luk A, Guyatt GH, Alba AC.
(2019). Physician prediction versus model predicted prognosis in ambulatory patients with
heart failure. J Heart Lung Transplant.
Díaz-Toro, Felipe, Nazzal N., Carolina, & Verdejo, Hugo. (2017). Incidencia y letalidad
intrahospitalaria por insuficiencia cardiaca en Chile: ¿Existen diferencias por sexo? Revista
médica de Chile, 145(6), 703-709. https://dx.doi.org/10.4067/s0034-98872017000600703
Méndez, M. García, R y Alfonso, C. (2005). Insuficiencia cardíaca, manejo del calcio y estrategias
farmacológicas. Gaceta Médica de Caracas, 113(2), 181-192. Recuperado en 02 de enero
de 2021, de http://ve.scielo.org/scielo.php?script=sci_arttext&pid=S0367-
47622005000200005&lng=es&tlng=es.
Ministerio de Salud. (2015). Guía Clínica Insuficiencia Cardíaca. Gobierno de Chile. Recuperado de
https://www.minsal.cl/wp-content/uploads/2015/11/GUIA-CLINICA-INSUFICIENCIA-
CARDIACA_web.pdf
Ruiz-Ruiz, F. J., Samperiz Legarre, P., Ruiz Laiglesia, F. J., Pérez Calvo, J. I., Morales Rull, J. L., Dolz
Aspas, R., Lamarique Pascual, A., & Amores Ferreras, M. (2005). Influencia de la edad en la
mortalidad de pacientes con insuficiencia cardiaca. Anales de Medicina Interna, 22(9), 424-
428. Recuperado en 02 de enero de 2021, de
http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0212-
71992005000900005&lng=es&tlng=es.
Zamora, E. Lupón, J. Urrutia, A. González, B. Mas, D. Díez, C. Altimir S y Valle, V. (2007). Significado
pronóstico del aclaramiento de creatinina en pacientes con insuficiencia cardiaca y creatinina
sérica normal.Revista Española de Cardiología. Recuperado de
https://www.revespcardiol.org/en-significado-pronostico-del-aclaramiento-creatinina- articulo-
13113938#:~:text=La%20insuficiencia%20renal%20es%20un,ocultar%20una%20insuficienc
ANEXO
Anexo 1: Matriz de correlaciones entre las variables numéricas
d=2
61
2
Fraccion_de_eyeccion
Edad Suero_Fisiológico
135 73
Plaquetas 53 104
172
110 297
70 39
Suero_de_Creatinina 267 154 165 251
41 188
31 25149221
120 106 247 209
13393 150 281
108 228
10 102
136 82 197
6548 164 225
131 64
296298
Creatinina_Quinasa Tiempo 47145
132 118
240 5215
59
38
4640
8
163
140
50148
217
241
284
220276
71 288
56 194123 109101
34
13
92 213
107
85130
80
95
244
290
142
86
180
234
277
181
289
280
266249
1 36 138
1175
6022191
115
97
141
21 12
23
103170
125
4 69 143
99
211
219
113
14
58
67 186
160
171
24105
210
114
63 45146
199
169
201
124 78134
279
235223
256
252 269
293
299
202
190
49 32 17 19
159
28
55
57
51 68
43
33
81 183
54
129
156
9
177 236
77
90
242
158
121
175
157 257
196
245
88
126
239
128
89
262
271 206
287
179 291
5 7 29
20018 166
8326
127
79
111
62
94
151
184
76
155
4272
100
204
112
248
230
139
216
9135
161
205
87
98
144
198
174
147
185
195
116
215
182 246
117
152
119
214224
176
286
237
272
162
96
192265
173
233
270
222
258
260
253
259
207
255
243285
212
630
327 44
378416822674
254
122 193
283
153
189
250
273 187
167
203
292
268
261
295 274
6616
20 208
229
263
238227
232137
282 275
294 218
178
264
278
231
Coordenadas de los individuos
X = CP1, Y = CP2
d=1
118
38
965 77 173 134
111 88 237
114213 179
3717
27 98 4553
119290
Creatinina_Quinasa 31 26 196
152
236
105 96
32 8 24
54 35137 117128176
203 264 110
217
222
120 106 136 56168284159
102 2843 106
44
192
148 86218 297
12140
Plaquetas
23
91
81
151
11 57208 74
93
205 80241
160
48163
95 131 212255
202
141103 100 144
244
167 27764
Suero_de_Creatinina 25 70 194 166123
191
226
69 50
169130
30 79 19
184 68
24058 107257178 71 291
288
149 135 36 21 2212 161
145
122 92
101
14 116
63
175124246
15 180 260
289
295
209
206
Suero_Fisiológico
125 155
109
170 85
90 239
126
78
89 235
142220
280
287
188
258 293
285
252190
299
29 132
55 133216
51 177 139
46
7234
215189
198
186
278 265
284
281
146 256
266
41 60 87
129
99
232 52
219153
201
157 225 207
234
286
261
491 7 7315439 112
282
254
156
197
183
230
273
150
242
211 171
187
262 253172
268
292
294
162 223
296 276
269
249
Edad Fraccion_de_eyeccion
Tiempo 221 75115
138 97
946276
42 147 245
108
164 274
251
33
4238 248
204
13
113 185
182
143 140
193275 272
165
228
20 83 59 250
158 247
181 233
243
3 229 2174 210 279 298
267 168 47263227214 104
199 259 270
61
66 231 67 224 271
5 195
283
20018127
X = CP1, Y = CP3 Coordenadas de los individuos
Gráfico 3: CP1 y CP3. Fuente: Elaboración propia
Creatinina_Quinasa d=2
61
2
Plaquetas
Suero_de_Creatinina
Anexo 5: Conglomerados
Figura 3: Matriz de distancias. Fuente: Elaboración propia