Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Práctica 2
Objetivos:
En esta práctica utilizaremos el paquete R-UCA para describir los datos de una
muestra. Se representarán gráficamente conjuntos de datos utilizando las
posibilidades del programa.
Índice:
1. Introducción.
2. Descripción gráfica y numérica de una variable categórica
3. Descripción gráfica y numérica de una variable numérica
1. Introducción
Ejercicio 1:
1.- Descarga el fichero Glucosa.RData de la carpeta de esta práctica en el Aula Virtual y léelo
desde R-UCA.
2.- ¿Qué variables componen este banco de datos? Clasifícalas según su tipo.
De las 80 mujeres, 5 de ellas (un 6.25%) tenían un nivel de glucosa bajo, 52 (65%)
medio, 20 (25%) alto y 3 (3.75%) muy alto.
Podemos representar gráficamente estos resultados mediante el diagrama de
sectores (Figura 1) o el diagrama de barras (Figura 2), utilizando las opciones
del menú Gráficas
Los gráficos anteriores pueden modificarse para mejorar su aspecto o recalcar cierta
información. Por ejemplo, para cambiar la leyenda de los ejes en el diagrama de
barras, añadimos a la instrucción correspondiente las opciones xlab = "Recodificación
de g1antes", ylab = "Frecuencia”.
Si, además de cambiar las leyendas, lo que queremos es utilizar uno o más colores en
un diagrama de barras, tenemos que modificar algo más la instrucción inicial:
with(Glucosa, Barplot(cod_g1antes, xlab="cod_g1antes", ylab="Frequency"))
Además de cambiar xlab e ylab, debemos cambiar Barplot por barplot, la variable
cod_g1antes por table(cod_g1antes) y añadir la opción del color col=”red” (para que
todas las barras sean rojas) o por una lista de 4 colores:
with(Glucosa, barplot(table(cod_g1antes), xlab = "Recodificación de g1antes", ylab =
"Frecuencia", col=c("lightgreen","blue","red","black")))
Vemos que los valores bajo y medio se dan más en las embarazadas que en las no
embarazadas, mientras que con los niveles alto y muy alto ocurre lo contrario.
Ejercicio 2:
1.- Obtener la descripción numérica y gráfica de la variable cod_dif_1.
2.- Comparar los valores de esta variable en embarazadas y no embarazadas.
En ocasiones puede ser útil obtener estos estadísticos separando los datos en grupos
definidos por alguna variable categórica. Por ejemplo, si queremos obtener el resumen
numérico de la variable g1antes en cada uno de los dos grupos que quedan definidos
por la variable embarazo, basta con seleccionar la opción Resumir por grupos y
seleccionar como variable de agrupación la variable embarazo.
Ejercicio 3:
1.- Obtener media, rango, desviación estándar, los cuartiles, rango intercuartílico y los
percentiles 30 y 80 de la variable dif_1.
2.- Comparar estos mismos estadísticos de dif_1 en embarazadas y no embarazadas.
Los gráficos más adecuados para representar una variable cuantitativa discreta son
los diagramas de barras. En el caso de variables cuantitativas continuas utilizaremos
el histograma (representación gráfica de la distribución de frecuencias agrupadas), el
diagrama de tallo y hojas (una especie de histograma pero mostrando los valores de
la variable) o el diagrama de cajas (representación gráfica de la información obtenida
en el resumen numérico: mínimo, máximo y cuartiles).
en donde, de cada valor de un dato, la hoja son las unidades y el tallo el resto. Notar
que, además, cada tallo se ha dividido en dos filas, la primera con las hojas 0, 1, 2, 3 y
4 y la segunda con hojas 5, 6, 7, 8 y 9. En este gráfico, el valor máximo (106) es
etiquetado outlier (Hi: 106). Si no quisiéramos partir el tallo en dos filas, deberíamos
marcar la opción 1 en Partes por tallo dentro de la pestaña Opciones.
Los histogramas y los diagramas de cajas nos permiten además hacer comparaciones
entre grupos definidos por una variable categórica. Para ello debemos seleccionar la
opción Gráfica por grupos e indicar el nombre de la variable de agrupación.
En el caso de los diagramas de caja, dibuja tantas cajas como categorías tenga la
variable categórica en un mismo gráfico. En el caso de los histogramas, también dibuja
varios histogramas, pero uno debajo del otro, utilizando la misma escala vertical y
definiendo los mismos intervalos en todos ellos (aunque para alguna categoría puedan
estar vacíos los primeros o los últimos intervalos). En los histogramas, si los grupos
tienen tamaños diferentes, deben representarse usando porcentajes como escala
vertical.
Ejercicio 4:
1.- Obtener un histograma, diagrama de cajas y diagrama de tallo y hojas de la variable dif_1.
2.- Realizar una comparación gráfica de dif_1 en embarazadas y no embarazadas.