Documentos de Académico
Documentos de Profesional
Documentos de Cultura
10 de julio de 2019
Introducción
EL siguiente trabajo tiene por finalidad aplicar diversas tecnicas o métodos
estadísticos que prmitan determinar de la forma mas acertada posible la distribusion
de ciertas variablesde y apartir de alli, definir tamañ o de muestra y limites de cofianza
para posteriores analisis. Esta data tiene 65534 observaciones y 20 variables
setwd("~/MUESTREO")
med<- read.csv("Med18.csv", dec=",", sep = ";", header = TRUE )
[1] 65534 20
class(med$VALOR.TOTAL)
[1] "numeric"
pander(summary(med$VALOR.TOTAL))
Acoto la
variable aplicando logaritmo
vtlog <- log(med$VALOR.TOTAL)
head(vtlog)
pander(summary(vtlog))
plot(vtlog)
boxplot(vtlog)
barplot(vtlog)
Hallo la varianza y la desviacion de la variable
var(vtlog)
[1] 2.71108
sd(vtlog)
[1] 1.646536
x=vtlog
head(dnorm(x, mean(vtlog), sd(vtlog)))
summary statistics
------
min: 2.484907 max: 17.27825
median: 8.014336
mean: 8.052096
estimated sd: 1.646536
estimated skewness: 0.2961642
estimated kurtosis: 4.563761
Como el valor de skewness es muy cercano a cero indica que posee algun tipo de
simetría la distribució n empírica, y la kurtosis cuantifica el peso de los extremos, ya
que un valor cercano a 3 es la kurtosis de una distribució n que acerca mucho a lo
normal VERIFICO LA DISTRIBUSION
fw<-fitdist(log(med$VALOR.TOTAL), "weibull")
summary(fw)
plot(fw)
fg<-fitdist(log(med$VALOR.TOTAL), "gamma")
summary(fg)
plot(fg)
fl<-fitdist(log(med$VALOR.TOTAL), "lnorm")
summary(fl)
plot(fl)
fn<-fitdist(log(med$VALOR.TOTAL), "norm")
summary(fn)
plot(fn)
2. SELECCION DE LA VARIABLE QUE CUMPLE LA ESPECIFICACION
POR ESTRATO Y POR CONGLOMERADO
escogería la variable MEDICO o especialidad médica para tratarla como una variable
subdividida en estratos, ya que la variabilidad dentro de cada uno de los médicos o
especialidad médica será muy pequeñ a y variabilidad entre especialidades será muy
grande. La variable que escogeria para estudiarla por conglomerado seria CODIGO o
diagnó stico del usuario, ya que la variabilidad interna dentro de cada conjunto de
individuos del mismo diagnostico puede ser grande y la variabilidad que puede existir
entre conjuntos de diagnosticos diferentes podria ser pequeñ a.