Está en la página 1de 46

PROYECTO DE ESTADÍSTICA

Integrantes: Christian Narvaez - Holger Alay


INTRODUCCION Cuando se habla de enfermedades cardiovasculares, en términos
simples se está hablamos de problemas en el corazón y vasos sanguíneos. Estos
problemas pueden darse por diversos casos como lo son los grandes niveles de
colesterol en el organismo humano debido a la cantidad de grasa que este consume en
diario vivir, también son dados por hábitos muy comunes como lo es fumar, el estrés e
incluso otra enfermedad que mata al ser humano, la diabetes. Todo esto puede reducir
la expectativa de vida del ser humano provocando un paro cardiaco. De hecho, las
enfermedades cardiovasculares han aumentado en su registro en comparación a otros
años, por lo que se estima que las muertes por un problema cardiovascular aumenten
cada año, inclusive se cree que para el 2030, más del 60% de la población mundial por
problemas de esta índole. Estas enfermedades de las que tanto se habla son: • La
insuficiencia cardiaca • Las arritmias • La arteriopatía periférica • Presión arterial alta
• Accidente cerebrovascular Entre muchas otras. La lista es muy larga cuando se habla
sobre el corazón y sus problemas. A continuación, se presentarán datos estadísticos
con respecto al registro de problemas cardiovasculares.

*__ Estadística Descriptiva Univariante__*


Histogramas realizado por Holger Alay
hist(dataHF$age,main = "Histograma de Edad",xlab ="Edad",ylab =
"Frecuencia",col = "orange" )
hist(dataHF$creatinine_phosphokinase,main = "Histograma de Creatinina
Fosfoquinase",xlab ="Creatinina Fosfoquinase",ylab = "Frecuencia",col =
"sienna4" )
hist(dataHF$platelets,main = "Histograma de Plaquetas",xlab
="Plaquetas",ylab = "Frecuencia",col = "blue " )

hist(dataHF$serum_creatinine,main = "Histograma de Suero de


Creatinina",xlab ="Suero de Creatinina",ylab = "Frecuencia",col = "green
" )
Histogramas realizado por Christian Narvaez
hist(x = caso_ideal$time, xlab= "Tiempo", ylab= "Frecuencia", main =
"Seguimiento en dias", col = "purple")
#Plaquetas
hist(x = caso_ideal$platelets, xlab= "# Plaquetas", ylab= "Frecuencia",
main = "Plaquetas en la sangre", col = "purple")

#Sodio serico
hist(x = caso_ideal$serum_sodium, xlab= "Sodio serico", ylab=
"Frecuencia", main = "Nivel de sodio serico en la sangre", col =
"purple")
#Fraccion de eyeccion
hist(x = caso_ideal$ejection_fraction, xlab= "Fraccion de eyeccion",
ylab= "Frecuencia", main = "Porcentaje de sangre en cada contraccion",
col = "purple")
Diagramas de Cajas realizado por Holger Alay
boxplot(dataHF$age,horizontal = T,col = "orange",border
=c("black"),xlab="Creatinina Fosfoquinasa",main= "Diagrama de Caja de
Edad",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
boxplot(dataHF$creatinine_phosphokinase,horizontal = T,col =
"sienna4",border = c("black"),xlab="Edad",main= "Diagrama de Caja de
Creatinina Fosfoquinasa",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
boxplot(dataHF$platelets,horizontal = T,col = "blue",border =
c("black"),xlab="Plaquetas",main= "Diagrama de Caja de Plaquetas",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
boxplot(dataHF$serum_creatinine,horizontal = T,col = "green",border =
c("black"),xlab="Suero de Creatinine",main= "Diagrama de Caja de Suero de
Creatinina",notch =
F,outpch=25,outbg="orange",whiskcol="navyblue",whisklty=2,lty=1)

Diagramas de Cajas realizado por Christian Narvaez


boxplot(x= caso_ideal$time)
#Plaquetas
boxplot(x= caso_ideal$platelets,horizontal = T,col = " purple",border
=c("black"),xlab="Creatinina Fosfoquinasa",main= "Diagrama de Caja de
Edad",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
#Sodio serico
boxplot(x= caso_ideal$serum_sodium,horizontal = T,col = "gold",border
=c("black"),xlab="Creatinina Fosfoquinasa",main= "Diagrama de Caja de
Edad",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
#Fraccion de eyeccion
boxplot(x= caso_ideal$ejection_fraction,horizontal = T,col =
"violet",border =c("black"),xlab="Creatinina Fosfoquinasa",main=
"Diagrama de Caja de Edad",notch =
F,outpch=25,outbg="green",whiskcol="navyblue",whisklty=2,lty=1)
Medidas estadísticas realizado por Holger Alay
#Resumen de cuartiles
summary(dataHF$age)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 40.00 51.00 60.00 60.83 70.00 95.00

summary(dataHF$creatinine_phosphokinase)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 23.0 116.5 250.0 581.8 582.0 7861.0

summary(dataHF$platelets)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 25100 212500 262000 263358 303500 850000

summary(dataHF$serum_creatinine)

## Min. 1st Qu. Median Mean 3rd Qu. Max.


## 0.500 0.900 1.100 1.394 1.400 9.400

#Media
mean(dataHF$age)

## [1] 60.83389

mean(dataHF$creatinine_phosphokinase)
## [1] 581.8395

mean(dataHF$platelets)

## [1] 263358

mean(dataHF$serum_creatinine)

## [1] 1.39388

#Mediana
median(dataHF$age)

## [1] 60

median(dataHF$creatinine_phosphokinase)

## [1] 250

median(dataHF$platelets)

## [1] 262000

median(dataHF$serum_creatinine)

## [1] 1.1

#Desviación Estandar
sd(dataHF$age)

## [1] 11.89481

sd(dataHF$creatinine_phosphokinase)

## [1] 970.2879

sd(dataHF$platelets)

## [1] 97804.24

sd(dataHF$serum_creatinine)

## [1] 1.03451

library(moments)
#Kurtosis
kurtosis(dataHF$age)

## [1] 2.798207

kurtosis(dataHF$creatinine_phosphokinase)

## [1] 27.71046

kurtosis(dataHF$platelets)
## [1] 9.085906

kurtosis(dataHF$serum_creatinine)

## [1] 28.37835

#Sesgo
skewness(dataHF$age)

## [1] 0.4209366

skewness(dataHF$creatinine_phosphokinase)

## [1] 4.440689

skewness(dataHF$platelets)

## [1] 1.454975

skewness(dataHF$serum_creatinine)

## [1] 4.43361

Medidas estadísticas realizado por Christian Narvaez


#tiempo
mean(x= caso_ideal$time)

## [1] 130.2609

median(x= caso_ideal$time)

## [1] 115

sd(x= caso_ideal$time)

## [1] 77.61421

quantile(x= caso_ideal$time)

## 0% 25% 50% 75% 100%


## 4 73 115 203 285

kurtosis(caso_ideal$time)

## [1] 1.788126

skewness(caso_ideal$time)

## [1] 0.1271606

#Plaquetas
mean(x= caso_ideal$platelets)

## [1] 263358
median(x= caso_ideal$platelets)

## [1] 262000

sd(x= caso_ideal$platelets)

## [1] 97804.24

quantile(x= caso_ideal$platelets)

## 0% 25% 50% 75% 100%


## 25100 212500 262000 303500 850000

kurtosis(caso_ideal$platelets)

## [1] 9.085906

skewness(caso_ideal$platelets)

## [1] 1.454975

#Sodio serico
mean(x= caso_ideal$serum_sodium)

## [1] 136.6254

median(x= caso_ideal$serum_sodium)

## [1] 137

sd(x= caso_ideal$serum_sodium)

## [1] 4.412477

quantile(x= caso_ideal$serum_sodium)

## 0% 25% 50% 75% 100%


## 113 134 137 140 148

kurtosis(caso_ideal$serum_sodium)

## [1] 7.031142

skewness(caso_ideal$serum_sodium)

## [1] -1.04287

#Fraccion de eyeccion
mean(x= caso_ideal$ejection_fraction)

## [1] 38.08361

median(x= caso_ideal$ejection_fraction)

## [1] 38
sd(x= caso_ideal$ejection_fraction)

## [1] 11.83484

quantile(x= caso_ideal$ejection_fraction)

## 0% 25% 50% 75% 100%


## 14 30 38 45 80

kurtosis(caso_ideal$ejection_fraction)

## [1] 3.02072

skewness(caso_ideal$ejection_fraction)

## [1] 0.5525927

Tabla de datos agrupados realizado por Holger Alay


library(fdth)
tablaAge<-fdt(dataHF$age,breaks="Sturges")
tablaAge

## Class limits f rf rf(%) cf cf(%)


## [39.6,45.235) 37 0.12 12.37 37 12.37
## [45.235,50.87) 37 0.12 12.37 74 24.75
## [50.87,56.505) 39 0.13 13.04 113 37.79
## [56.505,62.14) 60 0.20 20.07 173 57.86
## [62.14,67.775) 41 0.14 13.71 214 71.57
## [67.775,73.41) 44 0.15 14.72 258 86.29
## [73.41,79.045) 16 0.05 5.35 274 91.64
## [79.045,84.68) 11 0.04 3.68 285 95.32
## [84.68,90.315) 11 0.04 3.68 296 99.00
## [90.315,95.95) 3 0.01 1.00 299 100.00

tablacreatine<-fdt(dataHF$creatinine_phosphokinase,breaks="Sturges")
tablacreatine

## Class limits f rf rf(%) cf cf(%)


## [22.77,814.454) 252 0.84 84.28 252 84.28
## [814.454,1606.138) 21 0.07 7.02 273 91.30
## [1606.138,2397.822) 13 0.04 4.35 286 95.65
## [2397.822,3189.506) 6 0.02 2.01 292 97.66
## [3189.506,3981.19) 2 0.01 0.67 294 98.33
## [3981.19,4772.874) 1 0.00 0.33 295 98.66
## [4772.874,5564.558) 1 0.00 0.33 296 99.00
## [5564.558,6356.242) 1 0.00 0.33 297 99.33
## [6356.242,7147.926) 0 0.00 0.00 297 99.33
## [7147.926,7939.61) 2 0.01 0.67 299 100.00

tablaPlatelets<-fdt(dataHF$platelets,breaks="Sturges")
tablaPlatelets
## Class limits f rf rf(%) cf cf(%)
## [24849,108214) 9 0.03 3.01 9 3.01
## [108214,191579) 46 0.15 15.38 55 18.39
## [191579,274944) 139 0.46 46.49 194 64.88
## [274944,358309) 65 0.22 21.74 259 86.62
## [358309,441675) 26 0.09 8.70 285 95.32
## [441675,525040) 9 0.03 3.01 294 98.33
## [525040,608405) 2 0.01 0.67 296 99.00
## [608405,691770) 1 0.00 0.33 297 99.33
## [691770,775135) 1 0.00 0.33 298 99.67
## [775135,858500) 1 0.00 0.33 299 100.00

tablaSerum<-fdt(dataHF$serum_creatinine,breaks="Sturges")
tablaSerum

## Class limits f rf rf(%) cf cf(%)


## [0.495,1.395) 218 0.73 72.91 218 72.91
## [1.395,2.295) 53 0.18 17.73 271 90.64
## [2.295,3.195) 14 0.05 4.68 285 95.32
## [3.195,4.095) 7 0.02 2.34 292 97.66
## [4.095,4.995) 1 0.00 0.33 293 97.99
## [4.995,5.894) 2 0.01 0.67 295 98.66
## [5.894,6.794) 1 0.00 0.33 296 99.00
## [6.794,7.694) 1 0.00 0.33 297 99.33
## [7.694,8.594) 0 0.00 0.00 297 99.33
## [8.594,9.494) 2 0.01 0.67 299 100.00

Tabla de datos agrupados realizado por Christian Narvaez


#Tiempo
dist <- fdt(caso_ideal$time, breaks = "FD")
dist

## Class limits f rf rf(%) cf cf(%)


## [3.96,39.4463) 47 0.16 15.72 47 15.72
## [39.4463,74.9325) 33 0.11 11.04 80 26.76
## [74.9325,110.419) 64 0.21 21.40 144 48.16
## [110.419,145.905) 27 0.09 9.03 171 57.19
## [145.905,181.391) 25 0.08 8.36 196 65.55
## [181.391,216.878) 60 0.20 20.07 256 85.62
## [216.878,252.364) 32 0.11 10.70 288 96.32
## [252.364,287.85) 11 0.04 3.68 299 100.00

#Plaquetas
dast <- fdt(caso_ideal$platelets, breaks = "FD")
dast

## Class limits f rf rf(%) cf cf(%)


## [24849,51741) 3 0.01 1.00 3 1.00
## [51741,78632.9) 4 0.01 1.34 7 2.34
## [78632.9,105525) 2 0.01 0.67 9 3.01
## [105525,132417) 7 0.02 2.34 16 5.35
## [132417,159309) 17 0.06 5.69 33 11.04
## [159309,186201) 18 0.06 6.02 51 17.06
## [186201,213093) 25 0.08 8.36 76 25.42
## [213093,239985) 46 0.15 15.38 122 40.80
## [239985,266877) 60 0.20 20.07 182 60.87
## [266877,293769) 31 0.10 10.37 213 71.24
## [293769,320661) 26 0.09 8.70 239 79.93
## [320661,347553) 15 0.05 5.02 254 84.95
## [347553,374445) 15 0.05 5.02 269 89.97
## [374445,401337) 10 0.03 3.34 279 93.31
## [401337,428229) 6 0.02 2.01 285 95.32
## [428229,455120) 4 0.01 1.34 289 96.66
## [455120,482012) 2 0.01 0.67 291 97.32
## [482012,508904) 3 0.01 1.00 294 98.33
## [508904,535796) 1 0.00 0.33 295 98.66
## [535796,562688) 1 0.00 0.33 296 99.00
## [562688,589580) 0 0.00 0.00 296 99.00
## [589580,616472) 0 0.00 0.00 296 99.00
## [616472,643364) 1 0.00 0.33 297 99.33
## [643364,670256) 0 0.00 0.00 297 99.33
## [670256,697148) 0 0.00 0.00 297 99.33
## [697148,724040) 0 0.00 0.00 297 99.33
## [724040,750932) 1 0.00 0.33 298 99.67
## [750932,777824) 0 0.00 0.00 298 99.67
## [777824,804716) 0 0.00 0.00 298 99.67
## [804716,831608) 0 0.00 0.00 298 99.67
## [831608,858500) 1 0.00 0.33 299 100.00

#Presion de sangre
dist <- fdt(caso_ideal$high_blood_pressure, breaks = "FD")
dist

## Class limits f rf rf(%) cf cf(%)


## [0,0.2525) 194 0.65 64.88 194 64.88
## [0.2525,0.505) 0 0.00 0.00 194 64.88
## [0.505,0.7575) 0 0.00 0.00 194 64.88
## [0.7575,1.01) 105 0.35 35.12 299 100.00

#Fraccion de eyeccion
dust <- fdt(caso_ideal$DEATH_EVENT, breaks = "FD")
dust

## Class limits f rf rf(%) cf cf(%)


## [0,0.2525) 203 0.68 67.89 203 67.89
## [0.2525,0.505) 0 0.00 0.00 203 67.89
## [0.505,0.7575) 0 0.00 0.00 203 67.89
## [0.7575,1.01) 96 0.32 32.11 299 100.00

Diagramas de barras realizado por Holger Alay


library(lubridate)
library(ggplot2)
library(scales)
library(wesanderson)
cambiarAnemia=factor(dataHF$anaemia,levels=c(0:1),labels=c("No","Si"))
anemia<-data.frame(cambiarAnemia)
freqAnemia<-table(anemia)
colores<-c("orange","blue")

barplot(freqAnemia,col = colores,main = "Diagrama de Barras de Personas


con Anemia",xlab = "Anemia",ylab = "Frecuencia")

cambiarSexo=factor(dataHF$sex,levels=c(0:1),labels=c("Femenino","Masculin
o"))
sexo<-data.frame(cambiarSexo)
freqSexo<-table(sexo)
colores<-c("green","violet")

barplot(freqSexo,col = colores,main = "Diagrama de Barras de Sexo",xlab =


"Sexo",ylab = "Frecuencia")
cambiarDiabetes=factor(dataHF$diabetes,levels=c(0:1),labels=c("No","Si"))
diabetes<-data.frame(cambiarDiabetes)
freqDiabetes<-table(diabetes)
colores<-c("red","yellow")
barplot(freqDiabetes,col = colores,main = "Diagrama de Barras de Personas
con Diabetes",xlab = "Personas con Diabetes",ylab = "Frecuencia")
Diagramas de barras realizado por Christian Narvaez
#Tabaquismo
ptabaco = c(67.89,32.11)
names(ptabaco) = c("No","Si")
barplot(ptabaco, xlab= "Personas con tabaquismo", ylab = "Frecuencia",
main = "Diagrama de barras de personas con tabaquismo", col =
"purple")
#Presion en sangre
ppresion = c(64.88,35.12)
names(ppresion) = c("No","Si")
barplot(ppresion, xlab= "Presion en la sangre", ylab = "Frecuencia", main
= "Diagrama de barras de presion en la sangre", col = "purple")
#Evento de muerte
pdeathevent = c(67.89,32.11)
names(pdeathevent) = c("No","Si")
barplot(pdeathevent, xlab= "Evento de muerte", ylab = "Frecuencia", main
= "Diagrama de barras de casos positivos y negativos de muerte", col =
"purple")
Diagramas Circulares realizado por Holger Alay
colores<-c("orange","blue")
porcentaje1<- (sum(dataHF$anaemia==0)/299)*100
porcentaje1<-round(porcentaje1,2)
porcentaje2<-(sum(dataHF$anaemia==1)/299)*100
porcentaje2<-round(porcentaje2,2)
porcentaje<-c(porcentaje1,porcentaje2)
names(porcentaje) = c("No","Si")
label<-paste(porcentaje,"%",sep = " ")
label<-paste(names(porcentaje),label)
pie(porcentaje,main = "Diagrama Circular de Anemia",col = colores,labels
= label,clockwise = T)
colores<-c("green","violet")
porcentaje1<- (sum(dataHF$sex ==0)/299)*100
porcentaje1<-round(porcentaje1,2)
porcentaje2<-(sum(dataHF$sex==1)/299)*100
porcentaje2<-round(porcentaje2,2)
porcentaje<-c(porcentaje1,porcentaje2)

names(porcentaje) = c("Femenino","Maculino")
label<-paste(porcentaje,"%",sep = " ")
label<-paste(names(porcentaje),label)
pie(porcentaje,col = colores,main = "Diagrama Circular de Sexo",labels =
label)
colores<-c("red","yellow")
porcentaje1<- (sum(dataHF$diabetes==0)/299)*100
porcentaje1<-round(porcentaje1,2)
porcentaje2<-(sum(dataHF$diabetes==1)/299)*100
porcentaje2<-round(porcentaje2,2)
porcentaje<-c(porcentaje1,porcentaje2)
names(porcentaje) = c("No","Si")
label<-paste(porcentaje,"%",sep = " ")
label<-paste(names(porcentaje),label)

pie(freqDiabetes,col = colores,main = "Diagrama Circular de


Diabetes",labels = label)
Diagramas Circulares realizado por Christian Narvaez
#Tabaquismo

ptabaco = c(67.89,32.11)
names(ptabaco) = c("No","Si")
etiqueta= paste(ptabaco,"%",sep = " ")
etiqueta = paste(names(ptabaco),etiqueta)
colores = c("blue", "green")
pie(ptabaco, labels = etiqueta, main = "Diagrama circular de personas con
tabaquismo", col = colores, radius = 1)
#Presion en sangre
ppresion = c(64.88,35.12)
names(ppresion) = c("No","Si")
etiqueta= paste(ppresion,"%",sep = " ")
etiqueta = paste(names(ppresion),etiqueta)
colores = c("blue", "green")
pie(ppresion, labels = etiqueta, main = "Diagrama circular de presion
alta en la sangre", col = colores, radius = 1)
#Evento de Muerte
pdeathevent = c(67.89,32.11)
names(pdeathevent) = c("No","Si")
etiqueta= paste(pdeathevent,"%",sep = " ")
etiqueta = paste(names(pdeathevent),etiqueta)
colores = c("blue", "green")
pie(pdeathevent, labels = etiqueta, main = "Diagrama circular de eventos
de muerte", col = colores, radius = 1)
*__ Estadística Descriptiva Bivariante o Multivariante__*
Diagramas de Cajas segmentados por Sexo realizada por Holger Alay
boxplot(dataHF$age~cambiarSexo,horizontal = T,
lwd=2,
col ="orange",
border = c("black"),
ylab="Sexo",
xlab="Edades",
main= "Diagrama de Caja de Edad segmentados por Sexo",
notch =F,
outpch=21,
outbg="coral",
whiskcol="navyblue",
whisklty=2,lty=1)
boxplot(dataHF$platelets ~cambiarSexo,horizontal = T, # Horizontal o
vertical
lwd = 1, # Lines width
col = "sienna4", # Color
xlab = "Plaquetas", # Etiqueta eje X
ylab = "Sexo", # Etiqueta eje Y
main = "Diagrama de Caja de Plaqueta segmentado por Sexo", #
Título
notch = F, # Añade intervalos de confianza para la mediana
outpch=21,
outbg = "yellow", # Color de los datos atípicos
whiskcol = "blue", # Color de los bigotes
whisklty = 2, # Tipo de línea para los bigotes
lty = 1)
boxplot(dataHF$serum_creatinine ~ cambiarSexo,horizontal = T, #
Horizontal o vertical
lwd = 1, # Lines width
col = "blue", # Color
xlab = "Suero de Creatitina", # Etiqueta eje X
ylab = "Sexo", # Etiqueta eje Y
main = "Diagrama de Caja de Suero de Creatinina segmentada por
Sexo", # Título
notch = F, # Añade intervalos de confianza para la mediana
outpch=21,
outbg = "coral", # Color de los datos atípicos
whiskcol = "blue", # Color de los bigotes
whisklty = 2,
lty = 1)
boxplot(dataHF$creatinine_phosphokinase~cambiarSexo,horizontal = T,lwd=2,
col =rgb(0, 1, 0.2, alpha =0.9) ,
border = c("black"),ylab="Sexo",
xlab="Creatinine Fosfoquinasa",
main= "Diagrama de Caja de Creatinine Fosfoquinasa segmentada por Sexo
",
notch = F,
outpch=25,
outbg="coral",
whiskcol="navyblue",
whisklty=2,
lty=1)
Diagramas de Cajas segmentados por Sexo realizada por Christian Narvaez
boxplot(caso_ideal$time~caso_ideal$DEATH_EVENT,
col=rgb(0, 1, 0.2, alpha =0.9),
xlab = "Tiempo",
ylab = "Evento de muerte",
main = "Diagrama de caja segmentada de tiempo por evento de
muerte",
notch = F,
outpch=25,
outbg="blue",
whiskcol="navyblue",
whisklty=2,
lty=1)
boxplot(caso_ideal$platelets~caso_ideal$high_blood_pressure,
xlab = "Plaquetas",
ylab = "Presion de sangre",
main = "Diagrama de caja segmentada de plaquetas por presion de
sangre",
col= rgb(1, 1, 0, alpha = 0.4),
notch = F,
outpch=25,
outbg="green",
whiskcol="navyblue",
whisklty=2,
lty=1)
boxplot(caso_ideal$serum_sodium~caso_ideal$high_blood_pressure,
xlab = "Sodio serico",
ylab = "Presion de sangre",
main = "Diagrama de caja segmentada de sodio serico por presion
de sangre",
col= rgb(0, 1, 1, alpha =0.4),
notch = F,
outpch=25,
outbg="green",
whiskcol="navyblue",
whisklty=2,
lty=1)
boxplot(caso_ideal$ejection_fraction~caso_ideal$smoking,
xlab = "Fraccion de eyeccion",
ylab = "Tabaquismo",
main = "Diagrama de caja segmentada de fraccion de eyeccion por
tabaquismo",
col= rgb(0.4, 0, 0, alpha =0.5),
notch = F,
outpch=25,
outbg="green",
whiskcol="navyblue",
whisklty=2,
lty=1)
Matriz de correlación realizada por Holger Alay
cor(dataHF[,c(1,3,7,8)])

## age creatinine_phosphokinase
platelets
## age 1.00000000 -0.08158390 -
0.05235437
## creatinine_phosphokinase -0.08158390 1.00000000
0.02446339
## platelets -0.05235437 0.02446339
1.00000000
## serum_creatinine 0.15918713 -0.01640848 -
0.04119808
## serum_creatinine
## age 0.15918713
## creatinine_phosphokinase -0.01640848
## platelets -0.04119808
## serum_creatinine 1.00000000

Matriz de correlación realizada por Christian Narvaez


h <- caso_ideal[c(12,7,9,6)]
cor(h)

## time platelets serum_sodium


high_blood_pressure
## time 1.00000000 0.01051391 0.08764000 -
0.19643948
## platelets 0.01051391 1.00000000 0.06212462
0.04996348
## serum_sodium 0.08764000 0.06212462 1.00000000
0.03710947
## high_blood_pressure -0.19643948 0.04996348 0.03710947
1.00000000

Matriz de covarianzas realizada por Holger Alay


cov(dataHF[,c(1,3,7,8)])

## age creatinine_phosphokinase
platelets
## age 141.486483 -941.59153 -
6.090712e+04
## creatinine_phosphokinase -941.591531 941458.57146
2.321533e+06
## platelets -60907.118586 2321533.14404
9.565669e+09
## serum_creatinine 1.958845 -16.47038 -
4.168399e+03
## serum_creatinine
## age 1.958845
## creatinine_phosphokinase -16.470382
## platelets -4168.399498
## serum_creatinine 1.070211

Matriz de covarianzas realizada por Christian Narvaez


h <- caso_ideal[c(12,7,9,6)]
cov(h)

## time platelets serum_sodium


high_blood_pressure
## time 6023.965276 7.981107e+04 3.001415e+01 -
7.28990371
## platelets 79811.066099 9.565669e+09 2.681044e+04
2336.48042704
## serum_sodium 30.014152 2.681044e+04 1.946996e+01
0.07829229
## high_blood_pressure -7.289904 2.336480e+03 7.829229e-02
0.22861440

Matriz gráfica de correlación realizada por Holger Alay


library(corrplot)
require(reshape)
matrizcorre=data.frame(cor(dataHF[,c(1,3,7,8)]))

matrizcorre=rename(matrizcorre,c(age="Edad",creatinine_phosphokinase="Cre
atinina Fosfoquinase",platelets="Plaquetas",serum_creatinine="Suero de
Creatinina"))
corrplot.mixed(cor(matrizcorre),lower = "circle",upper = "number")
mtext("Matriz Gráfica de correlación ",at=2.5, line=3, cex=1.5)

Matriz gráfica de correlación realizada por Christian Narvaez


data=cor(caso_ideal[c(12,7,9,6)])
corrplot.mixed(cor(data),lower = "square",upper = "number")
Matriz de diagramas de dispersión realizada por Holger Alay
tabla=data.frame(dataHF$age,dataHF$creatinine_phosphokinase,dataHF$platel
ets,dataHF$serum_creatinine)

#renombrar una variable, instalamos reshape


#install.packages("reshape")
require(reshape)
tabla=rename(dataHF,c(age="Edad",creatinine_phosphokinase="Creatinina
Fosfoquinase",platelets="Plaquetas",serum_creatinine="Suero de
Creatinina"))

plot(tabla[,c(1,3,7,8)],main="Diagramas de dispersión
",col=tabla$Edad,pch=19)
Matriz de diagramas de dispersión realizada por Christian Narvaez
h <- caso_ideal[c(12,7,9,6)]

plot(h,main="Diagramas de Dispersión",col=caso_ideal$time,pch=19)
Conclusiones de Christian Narvaez
Se concluye mediante el uso del software Rstudio, al analizar los diagramas circulares
de las variables cualitativas que, el porcentaje de personas que practican el
Tabaquismo junto con el de Evento de Muerte es el mismo, tal y como se puede
evidencia en el gráfico, aquello indica que los cigarrillos, no solo provocan
enfermedades en el organismo humano a largo plazo, sino también que los pacientes
con problemas cardiacos que fuman, tienden a tener a una probabilidad de muerte
más grande que aquellos que no practican esta actividad.
Otra conclusión que se puede determinar a través de los gráficos, cálculos estadísticos
y la tabla de Excel importada al programa, es que aquellos pacientes que figuran
presión alta y niveles de plaquetas muy bajos también tienden a fallecer más rápido
que otros pacientes cuyos casos son solo la presión alta o niveles bajos de plaquetas o,
en el mejor de los casos, ningún de los dos ya mencionados al final. Por lo que, las
plaquetas resultan ser muy importantes a la hora de combatir enfermedades
cardiovasculares.

Conclusiones de Holger Alay


Observamos en el histograma de Edad que las personas que tienen un rango de 50 a
70 años tienen más posibilidades de contraer insuficiencia cardíaca.
Otra vista interesante es sobre las personas con diabetes que en el diagrama circular
podemos observar que la mayoria de personas masculinas son las más afectadas de
sufrir insuficiencia cardíaca que las mujeres teniendo un 58.19% de la muestra que
hemos estudiado.

Bibliografía
Oldman L. Approach to the patient with possible cardiovascular disease. In: Goldman
L, Schafer AI, eds. Goldman-Cecil Medicine. 26th ed. Philadelphia, PA: Elsevier;
2020:chap 45
Roger VL, Go AS, Lloyd-Jones DM, Adams RJ, Berry JD, Brown TM, et al. Heart disease
and stroke statistics-2011 update: a report from the American Heart Association.
Circulation. 2011;123:e18-209.
Malagón G. Responsabilidad y cobertura de la salud pública. En: Malagón-Londoño G,
Moncayo-Medina A, editores. Salud Pública. Perspectivas. Segunda edición. Bogotá:
Editorial Médica Panamericana; 2011. p. 3-25.

También podría gustarte