Parcial Estadistica Aplicada

ANÁLISIS ESTADÍSTICO EN RSTUDIO DE LA BASE DE
DATOS DE PACIENTES CRÓNICOS DE LA CIUDAD DE

PASTO-NARIÑO EN EL PRIMER SEMESTRE DEL AÑO
2017
DIRIGIDO A:
CARMEN SOLANGE LUGO BUITRAGO
PRESENTADO POR:
CRISTIAN FERNEY ACEROS FLOREZ - 2155148
LUZ GABRIELA JIMÉNEZ MOLANO - 2164097
DANIEL ALBERTO PERICO SANCHEZ - 2155506
JOYSER ALBERTO ARROYO VERGARA - 2155144
MIGUEL ANGEL RUBIANO GUEVARA - 2165559
VARIABLES Y NÚMERO DE DATOS ANALIZADOS DE LA
BASE DE DATOS SELECCIONADA
• Variables:
1. Colesterol total
2. Peso
3. Edad
4. Talla
5. Colesterol HDL
• Número de datos: 5894

VARIABLE COLESTEROL TOTAL (CUANTITATIVA
CONTINUA)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA, OJIVAS E
HISTOGRAMAS
1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio
library(readxl)
Tabla_de_salud_2 <- read_excel("Tabla de salud 2.xlsx")
View(Tabla_de_salud_2)
2. Se cambia el nombre de la tabla a un nombre relacionado con la variable trabajada y se

convierte en un campo numérico que me representa los datos de Colesterol Total
Colesteroltotal_pacientes<-Tabla_de_salud_2
Colesteroltotal_pacientes<-as.numeric(Colesteroltotal_pacientes$`Colesterol Total`)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas
rangos.valor<-cut(Colesteroltotal_pacientes,seq(min(83),max(408),by=25))
4. Se organizan los datos en una tabla (intervalos o clases)
frecuenciasA<-table(rangos.valor)
5. Se extraen los Datos
frecuenciasA<-data.frame(frecuenciasA)
6. Se nombran las dos columnas pertenecientes a frecuenciasA
names(frecuenciasA)<-c("intervalos","F.A")
7. Se hace la sumatoria de F.A para encontrar F.A.A
F.A.A<-cumsum(frecuenciasA$F.A)
8. Se encuentra la frecuencia relativa de F.A
F.R<-prop.table(frecuenciasA$F.A)
9. Se hace la sumatoria de F.R para encontrar F.R.A
F.R.A<-cumsum(F.R)
10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
11. Se halla otra columna para la otra ojiva mayor
F.R.A.C<-1-F.R.A
12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias
tabla<-cbind(frecuenciasA,F.A.A,F.R,F.R.A)
View(tabla)
TABLA DE DISTRIBUCIÓN DE FRECUENCIA
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(83,108,133,158,183,208,233,258,283,308,333,358,383)
14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(108,133,158,183,208,233,258,283,308,333,358,383,408)
15. Se grafica la Ojiva menor que para la frecuencia absoluta acumulada
plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta

acumulada",xlab="Colesterol Total",ylab="Numero de personas")
16. Se grafica la Ojiva menor que para la frecuencia relativa acumulada
plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa

acumulada",xlab="Colestero Total",ylab ="Porcentaje de personas")
17. Se grafica la Ojiva mayor que para la frecuencia absoluta acumulada
plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta

acumulada",xlab="Colesterol Total",ylab = "Número de personas")
18. Se grafica la Ojiva mayor que para la frecuencia relativa acumulada
plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub = "Frecuencia relativa

acumulada",xlab="Colesterol Total",ylab="Porcentaje de personas")
19. Se grafica el histograma de frecuencia absoluta
hist(Colesteroltotal_pacientes,main="Histograma de frecuencia
absoluta",xlab="Colesterol Total",ylab="Número de
personas",breaks=seq(min(83),max(408),by=25))
20.Se grafica el histograma de frecuencia relativa
nn<-hist(Colesteroltotal_pacientes,main="Nombre",xlab="Colesterol Total",ylab="Número
de personas",breaks = seq(min(83),max(408),by=25),freq=F,plot=F)
nn$density=nn$counts/sum(nn$counts)
nn$breaks=seq(min(83),max(408),by=25)
plot(nn,main="Histograma de frecuencia relativa",xlab="Edades",ylab="Porcentaje de
personas",freq=F)
MEDIDAS DE TENDENCIA CENTRAL
1. Se halla la media aritmetica de los datos
mean(Colesteroltotal_pacientes) [1] 200.9486
2. Se halla la mediana de los datos
median(Colesteroltotal_pacientes) [1] 198
3. Se halla la moda de los datos
install.packages("modeest")
library(modeest)
mlv(Colesteroltotal_pacientes, method = "mfv") [1] 200
MEDIDAS DE POSICIÓN
1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.
summary(Colesteroltotal_pacientes)
2. Se realiza el diagrama de caja y bigotes horizontal
boxplot(Colesteroltotal_pacientes,main="Diagrama de caja y Bigotes",xlab="Colesterol

Total",ylab="Pacientes cronicos Pasto Nariño", horizontal = T)
3. Se puede realizar también el diagrama de caja y bigotes de manera vertical.
boxplot(x = Colesteroltotal_pacientes,main="Diagrama de caja y

Bigotes",xlab="Pacientes cronicos Pasto Nariño 1 Semestre 2017", ylab= "Colesterol
total")
4. Se calculan valores atípicos
IQR<-IQR(Colesteroltotal_pacientes) 54.75
Q1<-quantile(Colesteroltotal_pacientes, 0.25) 172
Vatipicoinferior=Q1-1.5*IQR 89.9
Q3<-quantile(Colesteroltotal_pacientes,0.75) 223
Vatipicosuperior=Q3+1.5*IQR 309
MEDIDAS DE DISPERSIÓN
1. Se determina la varianza de los datos
var(Colesteroltotal_pacientes) [1] 1760.876
2. Se determina la desviación estándar de los datos
sd(Colesteroltotal_pacientes) [1] 41.96279
3. Se calcula el coeficiente de variación de los datos
"Coeficiente de variacion" =
sd(Colesteroltotal_pacientes)/mean(Colesteroltotal_pacientes)
[1] 0.2088235
VARIABLE PESO (CUANTITATIVA CONTINUA)
HISTOGRAMAS
1.Se importa la base de datos de Excel a Rstudio
library(readxl)
BDATOS_PACIENTESCRONICOSISEM2017 <-
read_excel("C:\\Users\\USUARIO\\Documents\\PROYECTO_R
(2)\\BDATOS_PACIENTESCRONICOSISEM2017.xlsx")
View(BDATOS_PACIENTESCRONICOSISEM2017)
2. Se cambia el nombre de Excel a un nombre más sencillo en R y se convierte en campo

numérico los datos de Peso
BDATOS_PACIENTESCRONICOS <- BDATOS_PACIENTESCRONICOSISEM2017
BDATOS_PACIENTESCRONICOS <- as.numeric(BDATOS_PACIENTESCRONICOS$Peso)

3.Se busca el mínimo, máximo y número de datos para realizar la tabla de distribución de
frecuencias
summary(BDATOS_PACIENTESCRONICOS)
length(BDATOS_PACIENTESCRONICOS) [1] 5894
4.Se programan el mínimo modificado, el máximo y la amplitud modificada que tendrán las
ojivas
RANGOS.VALOR<-cut(BDATOS_PACIENTESCRONICOS,seq(min(28),max(132),by=8))
5.Se organizan los datos en una tabla (intervalos o clases)
FRECUENCIASA<-table(RANGOS.VALOR)
6.Se extraen los datos
FRECUENCIASA<-data.frame(FRECUENCIASA)
7.Se nombran las dos columnas pertenecientes a FRECUENCIASA
names(FRECUENCIASA)<-c("INTERVALOS","F.A")
8.Se hace la sumatoria de F.A para encontrar F.A.A
F.A.A<-cumsum(FRECUENCIASA$F.A)
F.R<-prop.table(FRECUENCIASA$F.A)
10.Se hace la sumatoria de F.R para encontrar F.R.A
F.R.A<-cumsum(F.R)
11.Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
12.Se halla otra columna para la otra ojiva mayor
F.R.A.C<-1-F.R.A
13.Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
TABLA_DISTRIBUCIONDEFRECUENCIA<-cbind(FRECUENCIASA,F.A.A,F.R,F.R.A)
View(TABLA_DISTRIBUCIONDEFRECUENCIA)
14.Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(28,36,44,52,60,68,76,84,92,100,108,116,124)
15.Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(36,44,52,60,68,76,84,92,100,108,116,124,132)
16.Se grafica la ojiva menor que para la frecuencia absoluta acumulada

acumulada",xlab="Peso",ylab="Número de pacientes crónicos")
17.Se grafica la ojiva menor que para la frecuencia relativa acumulada

acumulada",xlab="Peso",ylab ="Porcentaje de pacientes crónicos")
18.Se grafica la ojiva mayor que para la frecuencia absoluta acumulada

acumulada",xlab="Peso",ylab = "Número de pacientes crónicos")
19.Se grafica la ojiva mayor que para la frecuencia relativa acumulada
plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub="Frecuencia relativa

acumulada",xlab="Peso",ylab = "Porcentaje de pacientes crónicos")
20.Se grafica el histograma de frecuencia absoluta
hist(BDATOS_PACIENTESCRONICOS,main="Histograma de frecuencia
absoluta",xlab="Peso",ylab="Número de pacientes
crónicos",breaks=seq(min(28),max(132),by=8))
nn<-hist(BDATOS_PACIENTESCRONICOS,main="Nombre",xlab="Peso",ylab="Porcentaje
de pacientes crónicos",breaks=seq(min(28),max(132),by=8),freq=F,plot=F)
plot(nn,main="Histograma de frecuencia relativa",xlab="Peso",ylab="Porcentaje de
pacientes crónicos",freq=F)
1.Se halla la media aritmética de los datos
mean(BDATOS_PACIENTESCRONICOS) [1] 65.89498
2.Se halla la mediana de los datos
median(BDATOS_PACIENTESCRONICOS) [1] 65
3.Se halla la moda de los datos
library(modeest)
mfv(BDATOS_PACIENTESCRONICOS) [1] 60
1.Se busca el resumen de datos en el que se incluya el mínimo, el máximo, el primer y tercer
cuartil, la mediana y la media.
summary(BDATOS_PACIENTESCRONICOS)
2.Se realiza el diagrama de caja y bigotes de manera vertical
boxplot(BDATOS_PACIENTESCRONICOS, xlab= "Número de pacientes crónicos", ylab=

"Peso", main= "Diagrama de caja y bigotes")
3.Se realiza el diagrama de caja y bigotes de manera horizontal
boxplot(BDATOS_PACIENTESCRONICOS, ylab= "Número de pacientes crónicos", xlab=

"Peso", main= "Diagrama de caja y bigotes", horizontal= T)
4.Se determina el rango intercuartílico, cuartil 1 y cuartil 3 y se calcula los limites a partir del
cual se considera que un dato es un valor atípico
IQR(BDATOS_PACIENTESCRONICOS) [1] 17
IQR <- IQR(BDATOS_PACIENTESCRONICOS)
quantile(BDATOS_PACIENTESCRONICOS, 0.25) [1] 57
Q1 <- quantile(BDATOS_PACIENTESCRONICOS, 0.25)
Q1 - 1.5*IQR [1] 31.5
f1 <- Q1 - 1.5*IQR
quantile(BDATOS_PACIENTESCRONICOS, 0.75) [1] 74
Q3 <- quantile(BDATOS_PACIENTESCRONICOS, 0.75)
Q3 + 1.5*IQR [1] 99.5
f3 <- Q3 + 1.5*IQR
1.Se determina rango de los datos
max(BDATOS_PACIENTESCRONICOS) - min(BDATOS_PACIENTESCRONICOS)
[1] 98
2.Se determina la varianza de los datos
var(BDATOS_PACIENTESCRONICOS) [1] 160.0224
3.Se determina la desviación estándar de los datos
sd(BDATOS_PACIENTESCRONICOS) [1] 12.65
4.Se determina el coeficiente de variación de los datos
sd(BDATOS_PACIENTESCRONICOS)/mean(BDATOS_PACIENTESCRONICOS)
[1] 0.1919721
VARIABLE EDAD (CUANTITATIVA DISCRETA)
HISTOGRAMAS
1. Lo que se hizo en primer lugar fue importar la base de datos de Excel a Rstudio
library(readxl)
datos<-read_excel("C:\\Users\\guevara\\Desktop\\edad_pacientes.xlsx")
2. Se cambia el nombre de la tabla a un nombre relacionado con la variable trabajada y se

convierte en un campo numérico que me representa los datos de edad total.
edad_pacientes<-datos
edad_pacientes<-as.numeric(edad_pacientes$edad)
3.Se programa el mínimo modificado, el máximo y la amplitud modificada que tendrán las
graficas Ojivas
rangos.valor<-cut(edad_pacientes,seq(min(17),max(108),by=7))
4. Se organizan los datos en una tabla (intervalos o clases)
5. Se extraen los Datos
6. Se nombran las dos columnas pertenecientes a frecuenciasA
7. Se hace la sumatoria de F.A para encontrar F.A.A
9. Se hace la sumatoria de F.R para encontrar F.R.A
F.R.A<-cumsum(F.R)
10. Se halla una columna adicional invirtiendo los valores para las ojivas mayores
F.A.A.C<-5894-F.A.A
11. Se halla otra columna para la otra ojiva mayor
F.R.A.C<-1-F.R.A
12. Se incluyen todas las variables anteriores para formar la tabla de frecuencias
View(tabla)
13. Se crea una variable para agregar los limites inferiores de las clases para la ojiva mayor que
Ima<-c(18,25,32,39,46,53,60,67,74,81,88,95,102)
14. Se crea una variable para agregar los limites superiores de las clases para la ojiva menor
que
Ime<-c(24,31,38,45,52,59,66,73,80,87,94,101,108)
15. Se grafica la Ojiva menor que para la frecuencia absoluta acumulada

acumulada",xlab="edad",ylab="Número de pacientes")
16. Se grafica la Ojiva menor que para la frecuencia relativa acumulada

acumulada",xlab="edad",ylab="Porcentaje de pacientes")
17. Se grafica la Ojiva mayor que para la frecuencia absoluta acumulada

acumulada",xab="edad",ylab = "Número de pacientes")
18. Se grafica la Ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub = "Frecuencia relativa
acumulada",xlab="edad",ylab="porcentaje de pacientes")
19. Se grafica el histograma de frecuencia absoluta
hist(edad_pacientes,main = "Histograma de frecuencia absoluta",xlab = "numero de

pacientes",ylab = "edades",breaks = seq(min(17),max(108),by=7))
hist(edad_pacientes,main ="nombre",xlab ="edades",ylab ="numero de pacientes",breaks =

seq(min(17),max(108),by=7))
nn<- hist(edad_pacientes,main = "nombre",xlab = "edades",ylab = "numero de pacientes",breaks =
seq(min(17),max(108),by=7),freq = F,plot = F)
nn$density=nn$counts/sum(nn&counts)
plot(nn,main = "Histograma de frecuencia relativa",xlab = "edades",ylab = "porcentaje de
pacientes",freq = F)
1. Se halla la media aritmetica de los datos
mean(edad_pacientes) [1] 66.29827
2. Se halla la mediana de los datos
median(edad_pacientes) [1] 67
3. Se halla la moda de los datos
install.packages("modeest")
library(modeest)
Mlvedad_pacientes, method = "mfv") [1] 200
1. Se obtiene el resumen de datos, entre ellos los cuartiles, el mínimo, el máximo, la mediana
y la media.
summary(edad_pacientes)
2. Se realiza el diagrama de caja y bigotes vertical
boxplot(edad_pacientes,xlab="numero de pacientes",ylab="edad",main="Diagrama de
caja y bigotes")
3. Se puede realizar también el diagrama de caja y bigotes de manera horizontal
boxplot(edad_pacientes,main="Diagrama de caja de
bigotes",xlab="edad",ylab="numero de pacientes",horizontal=T)
4. Se calculan valores atípicos
IQR<-IQR(edad_pacientes) [1] 18
Q1<-quantile(edad_pacientes, 0.25) [1] 57
Vatipicoinferior=Q1-1.5*IQR [1] 30
Q3<-quantile(edad_paciente,0.75) [1] 75
Vatipicosuperior=Q3+1.5*IQR [1] 102

1. Se determina la varianza de los datos
var(edad_paciente) [1] 150.7598
2. Se determina la desviación estándar de los datos
sd(edad_paciente) [1] 12.27843
3. Se calcula el coeficiente de variación de los datos
"Coeficiente de variacion" = sd(edad_paciente)/mean(edad_paciente)
[1] 0.18326
VARIABLE TALLA (CUANTITATIVA CONTINUA)
HISTOGRAMAS
1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel
install.packages("readxl")
library(readxl)

Talla_pacientes<-data_pacientes
Talla_pacientes<-as.numeric(Talla_pacientes$Talla)
frecuencias
summary(Talla_pacientes)
llength(Talla_pacientes) [1] 5894
ojivas
rangos.valor<-cut(Talla_pacientes,seq(min(121),max(186),by=5))
F.R.A<-cumsum(F.R)
F.A.A.C<-5894-F.A.A
F.R.A.C<-F.R.A
13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
View(tabla)
Ima<-c(121,126,131,136,141,146,151,156,161,166,171,176,181)
que
Ime<-c(126,131,136,141,146,151,156,161,166,171,176,181,186)
plot(Ime,F.A.A,type ="o",main ="ojiva menor",sub ="Frecuencia absoluta

acumulada",xlab = "Talla", ylab="Numero de personas")“
plot(Ime,F.R.A,type ="o",main ="ojiva menor",sub ="Frecuencia relativa acumulada",xlab

= "Talla", ylab="Porcentaje de personas")
plot(Ima,F.A.A.C,type ="o",main ="ojiva mayor",sub ="Frecuencia absoluta

acumulada",xlab = "Talla",ylab ="Numero de personas")
plot(Ima,F.R.A.C,type ="o",main ="ojiva mayor",sub ="Frecuencia relativa

acumulada",xlab = "Talla",ylab = "Porcentaje de personas")
hist(Talla_pacientes,main = "Histograma de frecuencia absoluta",xlab = "Talla",ylab =

"Numero de personas",breaks=seq(min(121),max(186),by=5))
nn<-hist(Talla_pacientes, main="Nombre",xlab ="Talla",ylab ="Numero de

personas",breaks = seq(min(121),max(186),by=5),freq =F,plot =F))
plot(nn,main = "Histograma de frecuencia relativa",xlab = “Talla",ylab = "Porcentaje de
personas", freq = F)
mean(Talla_pacientes) [1] 153.6463
median(Talla_pacientes) .[1] 153
library(modeest)
mlv(Talla_pacientes,method = "mfv") [1] 155

summary(Talla_pacientes)
2.Se realiza el diagrama de caja y bigotes
boxplot(Talla_pacientes,main="Diagrama de caja y bigotes",xlab="Talla",ylab="Pacientes

crónicos Pasto Nariño", horizontal = T)
boxplot(x=Talla_pacientes, main="Diagrama de caja y bigotes",xlab="Pacientes

crónicos Pasto Nariño 1 Semestre 2017",ylab="Talla")
4.Se determina el rango intercuartílico, cuartil 1 y cuartil 3 y se calcula los limites a partir del
cual se considera que un dato es un valor atípico
IQR(Talla_pacientes) [1] 13
IQR <- IQR(Talla_pacientes)
quantile(Talla_pacientes, 0.25) [1] 147
Q1 <- quantile(Talla_pacientes, 0.25)
Q1 - 1.5*IQR [1] 127.5
f1 <- Q1 - 1.5*IQR
quantile(Talla _pacientes, 0.75) [1] 160
Q3 <- quantile(Talla_pacientes, 0.75)
Q3 + 1.5*IQR [1] 179.5
f3 <- Q3 + 1.5*IQR
max(Talla_pacientes)- min(Talla_pacientes) [1] 65
var(Talla_pacientes) [1] 76.54801
sd(Talla_pacientes) [1] 8.749172
sd(Talla_pacientes)/mean(Talla_pacientes) [1] 0.05694361

VARIABLE COLESTEROL HDL (CUANTITATIVA
CONTINUA)
HISTOGRAMAS
1.Se importa la base de datos de Excel a Rstudio a partir de la opción File/ Import Data set /
From Excel
install.packages("readxl")
library(readxl)
DATOS <- read_excel("C:/Users/joise/Downloads/DATOS.xlsx")

HDL<-as.numeric(DATOS$`Colesterol HDL`)
frecuencias
summary(HDL)
length(HDL) [1] 5869
ojivas
rangos.valor<-cut(HDL,seq(min(4),max(1109),by=85))
F.R.A<-cumsum(F.R)
F.A.A.C<-5869-F.A.A
F.R.A.C<-1-F.R.A
13. Se incluyen todas las variables anteriores para formar la tabla de distribución de frecuencia
View(tabla)
Ima<-c(4,89,174,259,344,429,514,599,684,769,854,939,1024)
que
Ime<-c(89,174,259,344,429,514,599,684,769,854,939,1024,1109)
plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Colesterol HDL",xlab="Colesterol

(mg/dL)",ylab="Número de pacientes crónicos")
plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Colesterol HDL",xlab="Colesterol

(mg/dL)",ylab ="Porcentaje de pacientes crónicos")
plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Colesterol HDL",xlab="Colesterol

(mg/dL)",ylab = "Número de pacientes crónicos")
plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub="Colesterol HDL",xlab="Colesterol

(mg/dL)",ylab = "Porcentaje de pacientes crónicos")
hist(HDL,main="Histograma de Frecuencia Absoluta",xlab="Colesterol (mg/dL)",ylab="Número

de pacientes crónicos",breaks=seq(min(0),max(1200),by=85))
nn<-hist(HDL,main="Nombre",xlab ="Colesterol (mg/dL)",ylab ="Numero de pacientes

crónicos",breaks=seq(min(0),max(1200),by=85),freq=F,plot=F)
plot(nn,main="Histograma de frecuencia relativa",xlab="Número de
transacciones",ylab="Porcentaje de días",freq=F)
mean(HDL) [1] 357.328
median(HDL) .[1] 422
library(modeest)
mlv(HDL, method = "mfv") [1] 999
summary(HDL)
2.Se realiza el diagrama de caja y bigotes
boxplot(x=HDL,main="Diagrama de caja y bigotes",xlab="Colesterol HDL

(mg/dL)",ylab="Pacientes Crónicos",horizontal=T)
boxplot(x=HDL,main="Diagrama de caja y bigotes",xlab="Pacientes

Crónicos",ylab="Colesterol HDL (mg/dL)")
max(HDL)- min(HDL) [1] 1108
var(HDL) [1] 91932.62
sd(HDL) [1] 303.204
sd(HDL)/mean(HDL) [1] 0.8485

Parcial Estadistica Aplicada

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Parcial Estadistica Aplicada

Cargado por

Copyright:

Formatos disponibles

ANÁLISIS ESTADÍSTICO EN RSTUDIO DE LA BASE DE

DATOS DE PACIENTES CRÓNICOS DE LA CIUDAD DE

• Número de datos: 5894

2. Se cambia el nombre de la tabla a un nombre relacionado con la variable trabajada y se

4. Se organizan los datos en una tabla (intervalos o clases)

5. Se extraen los Datos

6. Se nombran las dos columnas pertenecientes a frecuenciasA

7. Se hace la sumatoria de F.A para encontrar F.A.A

9. Se hace la sumatoria de F.R para encontrar F.R.A

11. Se halla otra columna para la otra ojiva mayor

15. Se grafica la Ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta

16. Se grafica la Ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta

18. Se grafica la Ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub = "Frecuencia relativa

19. Se grafica el histograma de frecuencia absoluta

20.Se grafica el histograma de frecuencia relativa

1. Se halla la media aritmetica de los datos

mean(Colesteroltotal_pacientes) [1] 200.9486

2. Se halla la mediana de los datos

median(Colesteroltotal_pacientes) [1] 198

3. Se halla la moda de los datos

boxplot(Colesteroltotal_pacientes,main="Diagrama de caja y Bigotes",xlab="Colesterol

boxplot(x = Colesteroltotal_pacientes,main="Diagrama de caja y

Q1<-quantile(Colesteroltotal_pacientes, 0.25) 172

1. Se determina la varianza de los datos

var(Colesteroltotal_pacientes) [1] 1760.876

2. Se determina la desviación estándar de los datos

sd(Colesteroltotal_pacientes) [1] 41.96279

3. Se calcula el coeficiente de variación de los datos

1.Se importa la base de datos de Excel a Rstudio

2. Se cambia el nombre de Excel a un nombre más sencillo en R y se convierte en campo

BDATOS_PACIENTESCRONICOS <- BDATOS_PACIENTESCRONICOSISEM2017

BDATOS_PACIENTESCRONICOS <- as.numeric(BDATOS_PACIENTESCRONICOS$Peso)

length(BDATOS_PACIENTESCRONICOS) [1] 5894

5.Se organizan los datos en una tabla (intervalos o clases)

7.Se nombran las dos columnas pertenecientes a FRECUENCIASA

8.Se hace la sumatoria de F.A para encontrar F.A.A

9. Se encuentra la frecuencia relativa de F.A

10.Se hace la sumatoria de F.R para encontrar F.R.A

12.Se halla otra columna para la otra ojiva mayor

16.Se grafica la ojiva menor que para la frecuencia absoluta acumulada

plot(Ime,F.A.A,type="o",main="Ojiva menor",sub="Frecuencia absoluta

17.Se grafica la ojiva menor que para la frecuencia relativa acumulada

plot(Ime,F.R.A,type="o",main="Ojiva menor",sub="Frecuencia relativa

plot(Ima,F.A.A.C,type="o",main="Ojiva mayor",sub="Frecuencia absoluta

19.Se grafica la ojiva mayor que para la frecuencia relativa acumulada

plot(Ima,F.R.A.C,type="o",main="Ojiva mayor",sub="Frecuencia relativa

20.Se grafica el histograma de frecuencia absoluta

21.Se grafica el histograma de frecuencia relativa

1.Se halla la media aritmética de los datos

mean(BDATOS_PACIENTESCRONICOS) [1] 65.89498

2.Se halla la mediana de los datos

3.Se halla la moda de los datos

boxplot(BDATOS_PACIENTESCRONICOS, xlab= "Número de pacientes crónicos", ylab=

boxplot(BDATOS_PACIENTESCRONICOS, ylab= "Número de pacientes crónicos", xlab=

IQR <- IQR(BDATOS_PACIENTESCRONICOS)

quantile(BDATOS_PACIENTESCRONICOS, 0.25) [1] 57

Q1 <- quantile(BDATOS_PACIENTESCRONICOS, 0.25)

Q1 - 1.5*IQR [1] 31.5

quantile(BDATOS_PACIENTESCRONICOS, 0.75) [1] 74