Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El resumen muestra tambien los cuartiles (centiles 0, 25, 50, 75, 100), que dividen al
conjunto en cuatro partes iguales. El centil 0 (o cuartil 0) es el valor mínimo de la
variable, y el 100 (o cuartil 4) el máximo. El centil 25 (cuartil 1) es aquel valor de la
variable por debajo del cual está el 25% de los casos). El centil 50 es la mediana: la
mitad de los elementos de la muestra tienen un valor de la variable menor o igual que
este y la otra mitad mayor.
La opción de resúmenes numéricos “resumir por grupos” permite calcular todos los
estadísticos para cada nivel de un factor. Lo aplicamos a colesterol agrupado por sexo:
>numSummary(Dataset[,"colesterol"],groups=Dataset$sexo,statistics=c("mean","sd","se(mean)",
"IQR", "quantiles", "cv", "skewness", "kurtosis"), quantiles=c(0,.25, .5,.75,1), type="2")
CURSO ESTADÍSTICA CON ‘R’ PARA PROFESIONALES DE LA SALUD,
Antonio Vaamonde Liste y Ricardo Luaces Pazos NOV 2018 UNIDAD 2
Otras medidas:
Construimos tablas de frecuencias para las variables cualitativas con la opción de menú
Estadísticos resúmenes distribución de frecuencias.
no si
374 507
no si
42.45 57.55
no si
487 394
no si
55.28 44.72
> names(Dataset)
[1] "num" "edad" "sexo" "alcohol"
[5] "tabaco" "dieta" "peso" "talla"
[9] "tad" "tas" "colesterol" "pericintura"
[13] "peripelvis" "glucemia" "hba1c" "urea"
[17] "trigl" "creat" "urico" "alcoholgrdia"
[21] "imc" "imc2" "icc" "icc2"
[25] "hta2" "hta"
Modificamos las tres órdenes, relativas por ejemplo a la variable alcohol, cambiando
ésta por alcoholgrdia (o peso, talla, o cualquier otra), y ejecutamos de nuevo:
.Table <- table(Dataset$alcoholgrdia)
.Table
round(100*.Table/sum(.Table), 2)
0 4 6 7 8 9 10 12 14 15 16 18 20 24 30 32 35 40 44 49 50 56
501 10 1 1 94 1 7 1 1 1 88 3 24 19 3 13 1 46 1 1 2 3
60 70 80 84 88 90 96 100 120 125 126 140 160 168 240
14 7 23 1 3 1 1 2 1 1 1 1 1 1 1
0 4 6 7 8 9 10 12 14 15 16 18 20 24 30
56.87 1.14 0.11 0.11 10.67 0.11 0.79 0.11 0.11 0.11 9.99 0.34 2.72 2.16 0.34
32 35 40 44 49 50 56 60 70 80 84 88 90 96 100
1.48 0.11 5.22 0.11 0.11 0.23 0.34 1.59 0.79 2.61 0.11 0.34 0.11 0.11 0.23
120 125 126 140 160 168 240
0.11 0.11 0.11 0.11 0.11 0.11 0.11
Una opción mejor para construir tablas con variables cuantitativas consiste en
recodificarlas previamente formando intervalos (ver unidad didáctica 1).
CURSO ESTADÍSTICA CON ‘R’ PARA PROFESIONALES DE LA SALUD,
Antonio Vaamonde Liste y Ricardo Luaces Pazos NOV 2018 UNIDAD 2
Las frecuencias condicionadas son más fáciles de interpretar que las frecuencias
bidimensionales: el 35,8% de las mujeres tiene sobrepeso, frente al 46,0% de los
varones. El 14,7% tiene obesidad media (frente al 7,2% en los varones), el 4,8%
obesidad mórbida (frente al 2,2%).
CURSO ESTADÍSTICA CON ‘R’ PARA PROFESIONALES DE LA SALUD,
Antonio Vaamonde Liste y Ricardo Luaces Pazos NOV 2018 UNIDAD 2
Los porcentajes en ambas columnas serán similares si las variables no están relacionadas
(si la obesidad no depende del sexo), y distintos en caso contrario, pero ¿cuando
decidimos que una diferencia es suficientemente grande para concluir que existe una
relación? No debemos olvidar que nuestros datos proceden de una muestra, sometida por
ello a un cierto grado de variabilidad aleatoria.
TAREA 2:
2) Construya resúmenes numéricos con las variables: talla, colesterol, hba1c, tad, y
tas.
3) Construya tablas de frecuencias simples con las variables: icc2, sexo, alcohol.
El archivo, cuyo nombre debe ser el primer apellido del alumno con los caracteres T2 a
continuación (ej. GarciaT2.pdf), debe enviarse antes de las 23,55h del día 12 de
noviembre a través de la opción “enviar tarea” en la plataforma del curso.