Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MATRIZ
DATA FRAME => Mezclar vectores de misma longitud de variables cuali y cuanti
Acceder a casilla: pacientes[3,1] pacientes[,1] pacientes[3,] => primero fila y luego columna
pacientes$columna[fila] => Ejemplo: pacientes$peso[3]
Ordenar: sort(pacientes$peso)
PAQUETES
CARGAR DATOS
x=read.table(file, header, sep, dec) file: nombre archivo. header=> TRUE: Cabecera con nombres de variables FALSE: No (por defecto en FALSE)
sep: simbolo que separa cada columna del archivo (espacio por defecto) dec: símbolo de separación
decimal (punto por defecto)
SI NUESTRO ARCHIVO CUMPLE CON ALGÚN VALOR POR DEFECTO NO HACE FALTA ESCRIBIRLO EN EL CÓDIGO. Ejemplo:
corazon=read.table(file="corazon.txt", header=TRUE)
VARIABLES CUALITATIVAS
DIAGRAMA de barras => barplot(freq, main, col, names) freq: vector con frecuencias a representar (ni)
main: título gráfico
col: colores gráfico (se puede vector)
names: vector nombre categorías variable de interés
DIAGRAMA de sectores => pie(freq, main, col, labels) freq:vector con frecuencias a representar (ni/fi)
labels: vector nombre de las categorías de la variable de interés
VARIABLES CUANTITATIVAS DISCRETAS => IGUAL QUE CUALITATIVAS ORDINALES
Medidas de posición
Medidas de dispersión
Medidas de forma
Coeficiente de asimetría de Fisher: skewness(x) si ASF=0 datos simétricos, ASF> asimétricos derecha ASF<0 asimétricos izquierda
Coeficiente de apuntamiento de Fisher: kurtosis(x) KF<3 platicúrtico, KF>3 leptocúrtico KF=3 mesocurtico
d: función de masa dbinom(x, size, prob) dpois(x, lambda) x: valor para el cual queremos calcular la función d masa size: tamaño muestra
p: función de distribución p(X<=x) pbinom(q, size, prob) ppois(q, lambda) q:Valor para el cual queremos calcular la función de distribución
RESTAR UNO SI NOS PIDEN
MENOR QUE X
Calcular la prob menor que 4: ppois(q=3, lambda=x)
q: cuartilesqbinom(p, size, prob) qpois(p, lambda) p: Orden en tanto por uno del cuartil que queremos calcular.
DISTRIBUCIONES CONTINUAS
NORMAL
Función densidad: dnorm(x, mean, sd) x:valor sobre el que queremos calcular la función de densidad. (Aunque técnicamente no se puede
calcular la probabilidad de un valor en específico, R lo permite)
mean: Media (por defecto = 0)
sd: Desviación típica (por defecto = 1)
1º: Establezco una secuencia grande para función continua: x=seq(from=x, to=y, length=1000) => Length tiene que ser muy alto ya que al estar
representando una función contínua el número de valores tiene que tender a infinito.
2º: Primera función: plot(x, dnorm(x, mean=, prob=, type="l") type="l" significa que une a función por puntos
3º: Segunda función: points(x, dnorm(x, mean=, prob=, type="l", color=)
IMPORTANTE x=seq se emplea tanto en el eje x como el los valores de la normal que quiero calcular en la función densidad
EXPONENCIAL
Supervivencia S(x)=1-pweibull => Para calcular que el tiempo de recaída/recurrencia supere x tiempo.
Riesgo h(x)=dweibull f(x)/ supervivencia S(x)
INFERENCIA SOBRE LA MEDIA: IMPORTANTE INSTALAR EL PAQUETE BSDA PARA EMPLEAR LA FUNCIÓN z.test
Inferencia sobre media con varianza conocida: z.test(x (vector que contiene la muestra),alternative, mu (Uo para contrastar), sigma.x (sd conocida),
conf.level)
Inferencia sobre media con varianza desconocida: t.test(x,alternative, mu (Uo para contrastar), conf.level)
Medias varianzas conocidas: z.test(x, y, alternative, sigma.x,sigma.y, conf.level, mu (valor que se quiere contrastar, por defecto= 0) )
Medias varianzas desconocidas e iguales / muestras apareadas: t.test(x, y,mu, alternative, conf.level, paired=TRUE/FALSE (por defecto false) ,
var.equal=TRUE/FALSE (por defecto false))
M=matrix(c(a,b,c,d), nrow=x) => recuerda ordenar la matriz por columnas y no por filas
rownames(M)=c("nombre fila a y c","nombre fila b y d")
colnames(M)=c("nombre columnna a y b", "nombre columna c y d")
M => ctrl + enter
relative.risk(M, conf.int,level) M= Matriz 2*2 donde la fila 1 tiene los casos expuestos a una condición M11 y no 12. la fila 2 contiene a no casos
expuestos a una condición M21 y no expuestos a una condición M22
conf.int= Si se quiere (TRUE) o no (FALSE) calcular el intervalo de confianza
level= valor de alfa del intervalo de confianza (1-alfa) del RR, por defecto es 0.05 (IC al 95)
odds.ratio(M, conf.int, level) Igual que la anterior pero se usa debido a que en la mayor parte de los casos los enfermos son insignificantes
con respecto a los no enfermos
Predecir valores de y:
Función which: Me dice la posición del vector donde se encuentra un dato.Ejemplo: which(x==n)