Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DIRIGIDO A:
CARMEN SOLANGE LUGO BUITRAGO
PRESENTADO POR:
CRISTIAN FERNEY ACEROS FLOREZ - 2155148
LUZ GABRIELA JIMÉNEZ MOLANO - 2164097
DANIEL ALBERTO PERICO SANCHEZ - 2155506
JOYSER ALBERTO ARROYO VERGARA - 2155144
MIGUEL ANGEL RUBIANO GUEVARA - 2165559
VARIABLES Y NÚMERO DE DATOS ANALIZADOS DE LA
BASE DE DATOS SELECCIONADA
• Variables:
1. Colesterol total
2. Peso
3. Edad
4. Talla
5. Colesterol HDL
1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio
library(readxl)
Tabla_de_salud_2 <- read_excel("Tabla de salud 2.xlsx")
View(Tabla_de_salud_2)
Colesteroltotal_pacientes<-Tabla_de_salud_2
Colesteroltotal_pacientes<-as.numeric(Colesteroltotal_pacientes$`Colesterol Total`)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas
rangos.valor<-cut(Colesteroltotal_pacientes,seq(min(83),max(408),by=25))
frecuenciasA<-table(rangos.valor)
frecuenciasA<-data.frame(frecuenciasA)
names(frecuenciasA)<-c("intervalos","F.A")
F.A.A<-cumsum(frecuenciasA$F.A)
8. Se encuentra la frecuencia relativa de F.A
F.R<-prop.table(frecuenciasA$F.A)
F.R.A<-cumsum(F.R)
10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
F.R.A.C<-1-F.R.A
12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias
tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(83,108,133,158,183,208,233,258,283,308,333,358,383)
14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(108,133,158,183,208,233,258,283,308,333,358,383,408)
hist(Colesteroltotal_pacientes,main="Histograma de frecuencia
absoluta",xlab="Colesterol Total",ylab="Número de
personas",breaks=seq(min(83),max(408),by=25))
nn<-hist(Colesteroltotal_pacientes,main="Nombre",xlab="Colesterol Total",ylab="Número
de personas",breaks = seq(min(83),max(408),by=25),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(83),max(408),by=25)
plot(nn,main="Histograma de frecuencia relativa",xlab="Edades",ylab="Porcentaje de
personas",freq=F)
MEDIDAS DE TENDENCIA CENTRAL
install.packages("modeest")
library(modeest)
mlv(Colesteroltotal_pacientes, method = "mfv") [1] 200
MEDIDAS DE POSICIÓN
1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.
summary(Colesteroltotal_pacientes)
2. Se realiza el diagrama de caja y bigotes horizontal
IQR<-IQR(Colesteroltotal_pacientes) 54.75
Vatipicoinferior=Q1-1.5*IQR 89.9
Q3<-quantile(Colesteroltotal_pacientes,0.75) 223
Vatipicosuperior=Q3+1.5*IQR 309
MEDIDAS DE DISPERSIÓN
"Coeficiente de variacion" =
sd(Colesteroltotal_pacientes)/mean(Colesteroltotal_pacientes)
[1] 0.2088235
VARIABLE PESO (CUANTITATIVA CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS
library(readxl)
BDATOS_PACIENTESCRONICOSISEM2017 <-
read_excel("C:\\Users\\USUARIO\\Documents\\PROYECTO_R
(2)\\BDATOS_PACIENTESCRONICOSISEM2017.xlsx")
View(BDATOS_PACIENTESCRONICOSISEM2017)
summary(BDATOS_PACIENTESCRONICOS)
4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas
RANGOS.VALOR<-cut(BDATOS_PACIENTESCRONICOS,seq(min(28),max(132),by=8))
FRECUENCIASA<-table(RANGOS.VALOR)
6.Se extraen los datos
FRECUENCIASA<-data.frame(FRECUENCIASA)
names(FRECUENCIASA)<-c("INTERVALOS","F.A")
F.A.A<-cumsum(FRECUENCIASA$F.A)
F.R<-prop.table(FRECUENCIASA$F.A)
F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
F.R.A.C<-1-F.R.A
13.Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
TABLA_DISTRIBUCIONDEFRECUENCIA<-cbind(FRECUENCIASA,F.A.A,F.R,F.R.A)
View(TABLA_DISTRIBUCIONDEFRECUENCIA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(28,36,44,52,60,68,76,84,92,100,108,116,124)
15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(36,44,52,60,68,76,84,92,100,108,116,124,132)
hist(BDATOS_PACIENTESCRONICOS,main="Histograma de frecuencia
absoluta",xlab="Peso",ylab="Número de pacientes
crónicos",breaks=seq(min(28),max(132),by=8))
nn<-hist(BDATOS_PACIENTESCRONICOS,main="Nombre",xlab="Peso",ylab="Porcentaje
de pacientes crónicos",breaks=seq(min(28),max(132),by=8),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(28),max(132),by=8)
plot(nn,main="Histograma de frecuencia relativa",xlab="Peso",ylab="Porcentaje de
pacientes crónicos",freq=F)
MEDIDAS DE TENDENCIA CENTRAL
median(BDATOS_PACIENTESCRONICOS) [1] 65
library(modeest)
mfv(BDATOS_PACIENTESCRONICOS) [1] 60
MEDIDAS DE POSICIÓN
1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.
summary(BDATOS_PACIENTESCRONICOS)
2.Se realiza el diagrama de caja y bigotes de manera vertical
IQR(BDATOS_PACIENTESCRONICOS) [1] 17
f1 <- Q1 - 1.5*IQR
f3 <- Q3 + 1.5*IQR
MEDIDAS DE DISPERSIÓN
max(BDATOS_PACIENTESCRONICOS) - min(BDATOS_PACIENTESCRONICOS)
[1] 98
sd(BDATOS_PACIENTESCRONICOS)/mean(BDATOS_PACIENTESCRONICOS)
[1] 0.1919721
VARIABLE EDAD (CUANTITATIVA DISCRETA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS
1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio
library(readxl)
datos<-read_excel("C:\\Users\\guevara\\Desktop\\edad_pacientes.xlsx")
edad_pacientes<-datos
edad_pacientes<-as.numeric(edad_pacientes$edad)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas
rangos.valor<-cut(edad_pacientes,seq(min(17),max(108),by=7))
frecuenciasA<-table(rangos.valor)
frecuenciasA<-data.frame(frecuenciasA)
names(frecuenciasA)<-c("intervalos","F.A")
F.A.A<-cumsum(frecuenciasA$F.A)
8. Se encuentra la frecuencia relativa de F.A
F.R<-prop.table(frecuenciasA$F.A)
F.R.A<-cumsum(F.R)
10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
F.R.A.C<-1-F.R.A
12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias
tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(18,25,32,39,46,53,60,67,74,81,88,95,102)
14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(24,31,38,45,52,59,66,73,80,87,94,101,108)
median(edad_pacientes) [1] 67
install.packages("modeest")
library(modeest)
Mlvedad_pacientes, method = "mfv") [1] 200
MEDIDAS DE POSICIÓN
1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.
summary(edad_pacientes)
2. Se realiza el diagrama de caja y bigotes vertical
boxplot(edad_pacientes,xlab="numero de pacientes",ylab="edad",main="Diagrama de
caja y bigotes")
3. Se puede realizar también el diagrama de caja y bigotes de manera horizontal
boxplot(edad_pacientes,main="Diagrama de caja de
bigotes",xlab="edad",ylab="numero de pacientes",horizontal=T)
4. Se calculan valores atípicos
IQR<-IQR(edad_pacientes) [1] 18
Vatipicoinferior=Q1-1.5*IQR [1] 30
Q3<-quantile(edad_paciente,0.75) [1] 75
[1] 0.18326
VARIABLE TALLA (CUANTITATIVA CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS
1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel
install.packages("readxl")
library(readxl)
Talla_pacientes<-data_pacientes
Talla_pacientes<-as.numeric(Talla_pacientes$Talla)
3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias
summary(Talla_pacientes)
4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas
rangos.valor<-cut(Talla_pacientes,seq(min(121),max(186),by=5))
frecuenciasA<-table(rangos.valor)
6.Se extraen los datos
frecuenciasA<-data.frame(frecuenciasA)
names(frecuenciasA)<-c("intervalos","F.A")
F.A.A<-cumsum(frecuenciasA$F.A)
F.R<-prop.table(frecuenciasA$F.A)
F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
F.R.A.C<-F.R.A
13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(121,126,131,136,141,146,151,156,161,166,171,176,181)
15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(126,131,136,141,146,151,156,161,166,171,176,181,186)
library(modeest)
1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.
summary(Talla_pacientes)
2.Se realiza el diagrama de caja y bigotes
IQR(Talla_pacientes) [1] 13
f1 <- Q1 - 1.5*IQR
f3 <- Q3 + 1.5*IQR
MEDIDAS DE DISPERSIÓN
1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel
install.packages("readxl")
library(readxl)
DATOS <- read_excel("C:/Users/joise/Downloads/DATOS.xlsx")
HDL<-as.numeric(DATOS$`Colesterol HDL`)
3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias
summary(HDL)
4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas
rangos.valor<-cut(HDL,seq(min(4),max(1109),by=85))
frecuenciasA<-table(rangos.valor)
6.Se extraen los datos
frecuenciasA<-data.frame(frecuenciasA)
names(frecuenciasA)<-c("intervalos","F.A")
F.A.A<-cumsum(frecuenciasA$F.A)
F.R<-prop.table(frecuenciasA$F.A)
F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5869-F.A.A
F.R.A.C<-1-F.R.A
13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(4,89,174,259,344,429,514,599,684,769,854,939,1024)
15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(89,174,259,344,429,514,599,684,769,854,939,1024,1109)
library(modeest)
mlv(HDL, method = "mfv") [1] 999
MEDIDAS DE POSICIÓN
1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.
summary(HDL)
2.Se realiza el diagrama de caja y bigotes