Está en la página 1de 100

ANÁLISIS ESTADÍSTICO EN RSTUDIO DE LA BASE DE

DATOS DE PACIENTES CRÓNICOS DE LA CIUDAD DE


PASTO-NARIÑO EN EL PRIMER SEMESTRE DEL AÑO
2017

DIRIGIDO A:
CARMEN SOLANGE LUGO BUITRAGO

PRESENTADO POR:
CRISTIAN FERNEY ACEROS FLOREZ - 2155148
LUZ GABRIELA JIMÉNEZ MOLANO - 2164097
DANIEL ALBERTO PERICO SANCHEZ - 2155506
JOYSER ALBERTO ARROYO VERGARA - 2155144
MIGUEL ANGEL RUBIANO GUEVARA - 2165559
VARIABLES Y NÚMERO DE DATOS ANALIZADOS DE LA
BASE DE DATOS SELECCIONADA

• Variables:

1. Colesterol total
2. Peso
3. Edad
4. Talla
5. Colesterol HDL

• Número de datos: 5894


VARIABLE COLESTEROL TOTAL (CUANTITATIVA
CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS

1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio

library(readxl)
Tabla_de_salud_2 <- read_excel("Tabla de salud 2.xlsx")
View(Tabla_de_salud_2)

2. Se cambia el nombre de la tabla a un nombre relacionado con la variable trabajada y se


convierte en un campo numérico que me representa los datos de Colesterol Total

Colesteroltotal_pacientes<-Tabla_de_salud_2

Colesteroltotal_pacientes<-as.numeric(Colesteroltotal_pacientes$`Colesterol Total`)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas

rangos.valor<-cut(Colesteroltotal_pacientes,seq(min(83),max(408),by=25))

4. Se organizan los datos en una tabla (intervalos o clases)

frecuenciasA<-table(rangos.valor)

5. Se extraen los Datos

frecuenciasA<-data.frame(frecuenciasA)

6. Se nombran las dos columnas pertenecientes a frecuenciasA

names(frecuenciasA)<-c("intervalos","F.A")

7. Se hace la sumatoria de F.A para encontrar F.A.A

F.A.A<-cumsum(frecuenciasA$F.A)
8. Se encuentra la frecuencia relativa de F.A

F.R<-prop.table(frecuenciasA$F.A)

9. Se hace la sumatoria de F.R para encontrar F.R.A

F.R.A<-cumsum(F.R)

10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores

F.A.A.C<-5894-F.A.A

11. Se halla otra columna para la otra ojiva mayor

F.R.A.C<-1-F.R.A

12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias

tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que

Ima<-c(83,108,133,158,183,208,233,258,283,308,333,358,383)

14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que

Ime<-c(108,133,158,183,208,233,258,283,308,333,358,383,408)

15. Se grafica la Ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta


acumulada",xlab="Colesterol Total",ylab="Numero de personas")

16. Se grafica la Ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa


acumulada",xlab="Colestero Total",ylab ="Porcentaje de personas")
17. Se grafica la Ojiva mayor que para la frecuencia absoluta acumulada

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta


acumulada",xlab="Colesterol Total",ylab = "Número de personas")

18. Se grafica la Ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub = "Frecuencia relativa


acumulada",xlab="Colesterol Total",ylab="Porcentaje de personas")

19. Se grafica el histograma de frecuencia absoluta

hist(Colesteroltotal_pacientes,main="Histograma de frecuencia
absoluta",xlab="Colesterol Total",ylab="Número de
personas",breaks=seq(min(83),max(408),by=25))

20.Se grafica el histograma de frecuencia relativa

nn<-hist(Colesteroltotal_pacientes,main="Nombre",xlab="Colesterol Total",ylab="Número
de personas",breaks = seq(min(83),max(408),by=25),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(83),max(408),by=25)
plot(nn,main="Histograma de frecuencia relativa",xlab="Edades",ylab="Porcentaje de
personas",freq=F)
MEDIDAS DE TENDENCIA CENTRAL

1. Se halla la media aritmetica de los datos

mean(Colesteroltotal_pacientes) [1] 200.9486

2. Se halla la mediana de los datos

median(Colesteroltotal_pacientes) [1] 198

3. Se halla la moda de los datos

install.packages("modeest")
library(modeest)
mlv(Colesteroltotal_pacientes, method = "mfv") [1] 200
MEDIDAS DE POSICIÓN

1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.

summary(Colesteroltotal_pacientes)
2. Se realiza el diagrama de caja y bigotes horizontal

boxplot(Colesteroltotal_pacientes,main="Diagrama de caja y Bigotes",xlab="Colesterol


Total",ylab="Pacientes cronicos Pasto Nariño", horizontal = T)
3. Se puede realizar también el diagrama de caja y bigotes de manera vertical.

boxplot(x = Colesteroltotal_pacientes,main="Diagrama de caja y


Bigotes",xlab="Pacientes cronicos Pasto Nariño 1 Semestre 2017", ylab= "Colesterol
total")
4. Se calculan valores atípicos

IQR<-IQR(Colesteroltotal_pacientes) 54.75

Q1<-quantile(Colesteroltotal_pacientes, 0.25) 172

Vatipicoinferior=Q1-1.5*IQR 89.9

Q3<-quantile(Colesteroltotal_pacientes,0.75) 223

Vatipicosuperior=Q3+1.5*IQR 309
MEDIDAS DE DISPERSIÓN

1. Se determina la varianza de los datos

var(Colesteroltotal_pacientes) [1] 1760.876

2. Se determina la desviación estándar de los datos

sd(Colesteroltotal_pacientes) [1] 41.96279

3. Se calcula el coeficiente de variación de los datos

"Coeficiente de variacion" =
sd(Colesteroltotal_pacientes)/mean(Colesteroltotal_pacientes)

[1] 0.2088235
VARIABLE PESO (CUANTITATIVA CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS

1.Se importa la base de datos de Excel a Rstudio

library(readxl)
BDATOS_PACIENTESCRONICOSISEM2017 <-
read_excel("C:\\Users\\USUARIO\\Documents\\PROYECTO_R
(2)\\BDATOS_PACIENTESCRONICOSISEM2017.xlsx")
View(BDATOS_PACIENTESCRONICOSISEM2017)

2. Se cambia el nombre de Excel a un nombre más sencillo en R y se convierte en campo


numérico los datos de Peso

BDATOS_PACIENTESCRONICOS <- BDATOS_PACIENTESCRONICOSISEM2017

BDATOS_PACIENTESCRONICOS <- as.numeric(BDATOS_PACIENTESCRONICOS$Peso)


3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias

summary(BDATOS_PACIENTESCRONICOS)

length(BDATOS_PACIENTESCRONICOS) [1] 5894

4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas

RANGOS.VALOR<-cut(BDATOS_PACIENTESCRONICOS,seq(min(28),max(132),by=8))

5.Se organizan los datos en una tabla (intervalos o clases)

FRECUENCIASA<-table(RANGOS.VALOR)
6.Se extraen los datos

FRECUENCIASA<-data.frame(FRECUENCIASA)

7.Se nombran las dos columnas pertenecientes a FRECUENCIASA

names(FRECUENCIASA)<-c("INTERVALOS","F.A")

8.Se hace la sumatoria de F.A para encontrar F.A.A

F.A.A<-cumsum(FRECUENCIASA$F.A)

9. Se encuentra la frecuencia relativa de F.A

F.R<-prop.table(FRECUENCIASA$F.A)

10.Se hace la sumatoria de F.R para encontrar F.R.A

F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores

F.A.A.C<-5894-F.A.A

12.Se halla otra columna para la otra ojiva mayor

F.R.A.C<-1-F.R.A

13.Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia

TABLA_DISTRIBUCIONDEFRECUENCIA<-cbind(FRECUENCIASA,F.A.A,F.R,F.R.A)
View(TABLA_DISTRIBUCIONDEFRECUENCIA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que

Ima<-c(28,36,44,52,60,68,76,84,92,100,108,116,124)

15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que

Ime<-c(36,44,52,60,68,76,84,92,100,108,116,124,132)

16.Se grafica la ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta


acumulada",xlab="Peso",ylab="Número de pacientes crónicos")

17.Se grafica la ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa


acumulada",xlab="Peso",ylab ="Porcentaje de pacientes crónicos")
18.Se grafica la ojiva mayor que para la frecuencia absoluta acumulada

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta


acumulada",xlab="Peso",ylab = "Número de pacientes crónicos")

19.Se grafica la ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub="Frecuencia relativa


acumulada",xlab="Peso",ylab = "Porcentaje de pacientes crónicos")

20.Se grafica el histograma de frecuencia absoluta

hist(BDATOS_PACIENTESCRONICOS,main="Histograma de frecuencia
absoluta",xlab="Peso",ylab="Número de pacientes
crónicos",breaks=seq(min(28),max(132),by=8))

21.Se grafica el histograma de frecuencia relativa

nn<-hist(BDATOS_PACIENTESCRONICOS,main="Nombre",xlab="Peso",ylab="Porcentaje
de pacientes crónicos",breaks=seq(min(28),max(132),by=8),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(28),max(132),by=8)
plot(nn,main="Histograma de frecuencia relativa",xlab="Peso",ylab="Porcentaje de
pacientes crónicos",freq=F)
MEDIDAS DE TENDENCIA CENTRAL

1.Se halla la media aritmética de los datos

mean(BDATOS_PACIENTESCRONICOS) [1] 65.89498

2.Se halla la mediana de los datos

median(BDATOS_PACIENTESCRONICOS) [1] 65

3.Se halla la moda de los datos

library(modeest)
mfv(BDATOS_PACIENTESCRONICOS) [1] 60
MEDIDAS DE POSICIÓN

1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.

summary(BDATOS_PACIENTESCRONICOS)
2.Se realiza el diagrama de caja y bigotes de manera vertical

boxplot(BDATOS_PACIENTESCRONICOS, xlab= "Número de pacientes crónicos", ylab=


"Peso", main= "Diagrama de caja y bigotes")
3.Se realiza el diagrama de caja y bigotes de manera horizontal

boxplot(BDATOS_PACIENTESCRONICOS, ylab= "Número de pacientes crónicos", xlab=


"Peso", main= "Diagrama de caja y bigotes", horizontal= T)
4.Se determina el rango intercuartílico, cuartil 1 y cuartil 3 y se calcula los limites a partir del
cual se considera que un dato es un valor atípico

IQR(BDATOS_PACIENTESCRONICOS) [1] 17

IQR <- IQR(BDATOS_PACIENTESCRONICOS)

quantile(BDATOS_PACIENTESCRONICOS, 0.25) [1] 57

Q1 <- quantile(BDATOS_PACIENTESCRONICOS, 0.25)

Q1 - 1.5*IQR [1] 31.5

f1 <- Q1 - 1.5*IQR

quantile(BDATOS_PACIENTESCRONICOS, 0.75) [1] 74

Q3 <- quantile(BDATOS_PACIENTESCRONICOS, 0.75)

Q3 + 1.5*IQR [1] 99.5

f3 <- Q3 + 1.5*IQR
MEDIDAS DE DISPERSIÓN

1.Se determina rango de los datos

max(BDATOS_PACIENTESCRONICOS) - min(BDATOS_PACIENTESCRONICOS)

[1] 98

2.Se determina la varianza de los datos

var(BDATOS_PACIENTESCRONICOS) [1] 160.0224

3.Se determina la desviación estándar de los datos

sd(BDATOS_PACIENTESCRONICOS) [1] 12.65

4.Se determina el coeficiente de variación de los datos

sd(BDATOS_PACIENTESCRONICOS)/mean(BDATOS_PACIENTESCRONICOS)
[1] 0.1919721
VARIABLE EDAD (CUANTITATIVA DISCRETA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS

1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio

library(readxl)

datos<-read_excel("C:\\Users\\guevara\\Desktop\\edad_pacientes.xlsx")

2. Se cambia el nombre de la tabla a un nombre relacionado con la variable trabajada y se


convierte en un campo numérico que me representa los datos de edad total.

edad_pacientes<-datos
edad_pacientes<-as.numeric(edad_pacientes$edad)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas
rangos.valor<-cut(edad_pacientes,seq(min(17),max(108),by=7))

4. Se organizan los datos en una tabla (intervalos o clases)

frecuenciasA<-table(rangos.valor)

5. Se extraen los Datos

frecuenciasA<-data.frame(frecuenciasA)

6. Se nombran las dos columnas pertenecientes a frecuenciasA

names(frecuenciasA)<-c("intervalos","F.A")

7. Se hace la sumatoria de F.A para encontrar F.A.A

F.A.A<-cumsum(frecuenciasA$F.A)
8. Se encuentra la frecuencia relativa de F.A

F.R<-prop.table(frecuenciasA$F.A)

9. Se hace la sumatoria de F.R para encontrar F.R.A

F.R.A<-cumsum(F.R)

10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores

F.A.A.C<-5894-F.A.A

11. Se halla otra columna para la otra ojiva mayor

F.R.A.C<-1-F.R.A

12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias

tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que

Ima<-c(18,25,32,39,46,53,60,67,74,81,88,95,102)

14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que

Ime<-c(24,31,38,45,52,59,66,73,80,87,94,101,108)

15. Se grafica la Ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta


acumulada",xlab="edad",ylab="Número de pacientes")

16. Se grafica la Ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa


acumulada",xlab="edad",ylab="Porcentaje de pacientes")
17. Se grafica la Ojiva mayor que para la frecuencia absoluta acumulada

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta


acumulada",xab="edad",ylab = "Número de pacientes")

18. Se grafica la Ojiva mayor que para la frecuencia relativa acumulada


plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub = "Frecuencia relativa
acumulada",xlab="edad",ylab="porcentaje de pacientes")

19. Se grafica el histograma de frecuencia absoluta

hist(edad_pacientes,main = "Histograma de frecuencia absoluta",xlab = "numero de


pacientes",ylab = "edades",breaks = seq(min(17),max(108),by=7))

20.Se grafica el histograma de frecuencia relativa

hist(edad_pacientes,main ="nombre",xlab ="edades",ylab ="numero de pacientes",breaks =


seq(min(17),max(108),by=7))
nn<- hist(edad_pacientes,main = "nombre",xlab = "edades",ylab = "numero de pacientes",breaks =
seq(min(17),max(108),by=7),freq = F,plot = F)
nn$density=nn$counts/sum(nn&counts)
nn$breaks=seq(min(17),max(108),by=7)
plot(nn,main = "Histograma de frecuencia relativa",xlab = "edades",ylab = "porcentaje de
pacientes",freq = F)
MEDIDAS DE TENDENCIA CENTRAL

1. Se halla la media aritmetica de los datos

mean(edad_pacientes) [1] 66.29827

2. Se halla la mediana de los datos

median(edad_pacientes) [1] 67

3. Se halla la moda de los datos

install.packages("modeest")
library(modeest)
Mlvedad_pacientes, method = "mfv") [1] 200
MEDIDAS DE POSICIÓN

1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.

summary(edad_pacientes)
2. Se realiza el diagrama de caja y bigotes vertical

boxplot(edad_pacientes,xlab="numero de pacientes",ylab="edad",main="Diagrama de
caja y bigotes")
3. Se puede realizar también el diagrama de caja y bigotes de manera horizontal

boxplot(edad_pacientes,main="Diagrama de caja de
bigotes",xlab="edad",ylab="numero de pacientes",horizontal=T)
4. Se calculan valores atípicos

IQR<-IQR(edad_pacientes) [1] 18

Q1<-quantile(edad_pacientes, 0.25) [1] 57

Vatipicoinferior=Q1-1.5*IQR [1] 30

Q3<-quantile(edad_paciente,0.75) [1] 75

Vatipicosuperior=Q3+1.5*IQR [1] 102


MEDIDAS DE DISPERSIÓN

1. Se determina la varianza de los datos

var(edad_paciente) [1] 150.7598

2. Se determina la desviación estándar de los datos

sd(edad_paciente) [1] 12.27843

3. Se calcula el coeficiente de variación de los datos

"Coeficiente de variacion" = sd(edad_paciente)/mean(edad_paciente)

[1] 0.18326
VARIABLE TALLA (CUANTITATIVA CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS

1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel

install.packages("readxl")
library(readxl)

2. Se cambia el nombre de Excel a un nombre más sencillo en R y se convierte en campo


numérico los datos de Peso

Talla_pacientes<-data_pacientes

Talla_pacientes<-as.numeric(Talla_pacientes$Talla)
3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias

summary(Talla_pacientes)

llength(Talla_pacientes) [1] 5894

4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas

rangos.valor<-cut(Talla_pacientes,seq(min(121),max(186),by=5))

5.Se organizan los datos en una tabla (intervalos o clases)

frecuenciasA<-table(rangos.valor)
6.Se extraen los datos

frecuenciasA<-data.frame(frecuenciasA)

7.Se nombran las dos columnas pertenecientes a FRECUENCIASA

names(frecuenciasA)<-c("intervalos","F.A")

8.Se hace la sumatoria de F.A para encontrar F.A.A

F.A.A<-cumsum(frecuenciasA$F.A)

9. Se encuentra la frecuencia relativa de F.A

F.R<-prop.table(frecuenciasA$F.A)

10.Se hace la sumatoria de F.R para encontrar F.R.A

F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores

F.A.A.C<-5894-F.A.A

12.Se halla otra columna para la otra ojiva mayor

F.R.A.C<-F.R.A

13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia

tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)

View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que

Ima<-c(121,126,131,136,141,146,151,156,161,166,171,176,181)

15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que

Ime<-c(126,131,136,141,146,151,156,161,166,171,176,181,186)

16.Se grafica la ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type ="o",main ="ojiva menor",sub ="Frecuencia absoluta


acumulada",xlab = "Talla", ylab="Numero de personas")“

17.Se grafica la ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type ="o",main ="ojiva menor",sub ="Frecuencia relativa acumulada",xlab


= "Talla", ylab="Porcentaje de personas")
18.Se grafica la ojiva mayor que para la frecuencia absoluta acumulada

plot(Ima,F.A.A.C,type ="o",main ="ojiva mayor",sub ="Frecuencia absoluta


acumulada",xlab = "Talla",ylab ="Numero de personas")

19.Se grafica la ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type ="o",main ="ojiva mayor",sub ="Frecuencia relativa


acumulada",xlab = "Talla",ylab = "Porcentaje de personas")

20.Se grafica el histograma de frecuencia absoluta

hist(Talla_pacientes,main = "Histograma de frecuencia absoluta",xlab = "Talla",ylab =


"Numero de personas",breaks=seq(min(121),max(186),by=5))

21.Se grafica el histograma de frecuencia relativa

nn<-hist(Talla_pacientes, main="Nombre",xlab ="Talla",ylab ="Numero de


personas",breaks = seq(min(121),max(186),by=5),freq =F,plot =F))
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(121),max(186),by=5)
plot(nn,main = "Histograma de frecuencia relativa",xlab = “Talla",ylab = "Porcentaje de
personas", freq = F)
MEDIDAS DE TENDENCIA CENTRAL

1.Se halla la media aritmética de los datos

mean(Talla_pacientes) [1] 153.6463

2.Se halla la mediana de los datos

median(Talla_pacientes) .[1] 153

3.Se halla la moda de los datos

library(modeest)

mlv(Talla_pacientes,method = "mfv") [1] 155


MEDIDAS DE POSICIÓN

1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.

summary(Talla_pacientes)
2.Se realiza el diagrama de caja y bigotes

boxplot(Talla_pacientes,main="Diagrama de caja y bigotes",xlab="Talla",ylab="Pacientes


crónicos Pasto Nariño", horizontal = T)
3. Se puede realizar también el diagrama de caja y bigotes de manera vertical.

boxplot(x=Talla_pacientes, main="Diagrama de caja y bigotes",xlab="Pacientes


crónicos Pasto Nariño 1 Semestre 2017",ylab="Talla")
4.Se determina el rango intercuartílico, cuartil 1 y cuartil 3 y se calcula los limites a partir del
cual se considera que un dato es un valor atípico

IQR(Talla_pacientes) [1] 13

IQR <- IQR(Talla_pacientes)

quantile(Talla_pacientes, 0.25) [1] 147

Q1 <- quantile(Talla_pacientes, 0.25)

Q1 - 1.5*IQR [1] 127.5

f1 <- Q1 - 1.5*IQR

quantile(Talla _pacientes, 0.75) [1] 160

Q3 <- quantile(Talla_pacientes, 0.75)

Q3 + 1.5*IQR [1] 179.5

f3 <- Q3 + 1.5*IQR
MEDIDAS DE DISPERSIÓN

1.Se determina rango de los datos

max(Talla_pacientes)- min(Talla_pacientes) [1] 65

2.Se determina la varianza de los datos

var(Talla_pacientes) [1] 76.54801

3.Se determina la desviación estándar de los datos

sd(Talla_pacientes) [1] 8.749172

4.Se determina el coeficiente de variación de los datos

sd(Talla_pacientes)/mean(Talla_pacientes) [1] 0.05694361


VARIABLE COLESTEROL HDL (CUANTITATIVA
CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS

1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel

install.packages("readxl")
library(readxl)
DATOS <- read_excel("C:/Users/joise/Downloads/DATOS.xlsx")

2. Se cambia el nombre de Excel a un nombre más sencillo en R y se convierte en campo


numérico los datos de Peso

HDL<-as.numeric(DATOS$`Colesterol HDL`)
3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias

summary(HDL)

length(HDL) [1] 5869

4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas

rangos.valor<-cut(HDL,seq(min(4),max(1109),by=85))

5.Se organizan los datos en una tabla (intervalos o clases)

frecuenciasA<-table(rangos.valor)
6.Se extraen los datos

frecuenciasA<-data.frame(frecuenciasA)

7.Se nombran las dos columnas pertenecientes a FRECUENCIASA

names(frecuenciasA)<-c("intervalos","F.A")

8.Se hace la sumatoria de F.A para encontrar F.A.A

F.A.A<-cumsum(frecuenciasA$F.A)

9. Se encuentra la frecuencia relativa de F.A

F.R<-prop.table(frecuenciasA$F.A)

10.Se hace la sumatoria de F.R para encontrar F.R.A

F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores

F.A.A.C<-5869-F.A.A

12.Se halla otra columna para la otra ojiva mayor

F.R.A.C<-1-F.R.A

13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia

tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)

View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que

Ima<-c(4,89,174,259,344,429,514,599,684,769,854,939,1024)

15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que

Ime<-c(89,174,259,344,429,514,599,684,769,854,939,1024,1109)

16.Se grafica la ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Colesterol HDL",xlab="Colesterol


(mg/dL)",ylab="Número de pacientes crónicos")

17.Se grafica la ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Colesterol HDL",xlab="Colesterol


(mg/dL)",ylab ="Porcentaje de pacientes crónicos")
18.Se grafica la ojiva mayor que para la frecuencia absoluta acumulada

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Colesterol HDL",xlab="Colesterol


(mg/dL)",ylab = "Número de pacientes crónicos")

19.Se grafica la ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub="Colesterol HDL",xlab="Colesterol


(mg/dL)",ylab = "Porcentaje de pacientes crónicos")

20.Se grafica el histograma de frecuencia absoluta

hist(HDL,main="Histograma de Frecuencia Absoluta",xlab="Colesterol (mg/dL)",ylab="Número


de pacientes crónicos",breaks=seq(min(0),max(1200),by=85))

21.Se grafica el histograma de frecuencia relativa

nn<-hist(HDL,main="Nombre",xlab ="Colesterol (mg/dL)",ylab ="Numero de pacientes


crónicos",breaks=seq(min(0),max(1200),by=85),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(0),max(1200),by=85)
plot(nn,main="Histograma de frecuencia relativa",xlab="Número de
transacciones",ylab="Porcentaje de días",freq=F)
MEDIDAS DE TENDENCIA CENTRAL

1.Se halla la media aritmética de los datos

mean(HDL) [1] 357.328

2.Se halla la mediana de los datos

median(HDL) .[1] 422

3.Se halla la moda de los datos

library(modeest)
mlv(HDL, method = "mfv") [1] 999
MEDIDAS DE POSICIÓN

1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.

summary(HDL)
2.Se realiza el diagrama de caja y bigotes

boxplot(x=HDL,main="Diagrama de caja y bigotes",xlab="Colesterol HDL


(mg/dL)",ylab="Pacientes Crónicos",horizontal=T)
3. Se puede realizar también el diagrama de caja y bigotes de manera vertical.

boxplot(x=HDL,main="Diagrama de caja y bigotes",xlab="Pacientes


Crónicos",ylab="Colesterol HDL (mg/dL)")
MEDIDAS DE DISPERSIÓN

1.Se determina rango de los datos

max(HDL)- min(HDL) [1] 1108

2.Se determina la varianza de los datos

var(HDL) [1] 91932.62

3.Se determina la desviación estándar de los datos

sd(HDL) [1] 303.204

4.Se determina el coeficiente de variación de los datos

sd(HDL)/mean(HDL) [1] 0.8485

También podría gustarte