Está en la página 1de 2

FACULTAD DE CIENCIAS BÁSICAS

ESTADÍSTICA COMPUTACIONAL
PROGRAMA DE ESTADÍSTICA
TRABAJO SEGUNDO CORTE 2020-II

Importe la base de datos de casos positivos de Covid-19 para Colombia. Se debe


presentar un informe que contenga, un resumen, introducción al tema referente a los
datos que se van a analizar, metodología (como se hizo el análisis o construcción de
gráficos), conclusiones y referencias. El informe se debe presentar el día 28 de octubre
de 2020. Enviarlo al correo del docente antes de 2 PM. Grupos máximo de 4 estudiantes
preferiblemente.

En la parte del análisis de la información debe presentar:

1. Realice un histograma de la edad de las personas contagiadas por Covid-19. Debe


realizar las siguientes modificaciones:
• Modifique el número de categorías (i.e. bins) que ggplot utiliza por defecto o
el ancho de clase, para encontrar una gráfica que, en su opinión, muestre
adecuadamente los datos.
• Modifique el relleno de las barras y el color de las líneas.
• Agregue un polígono de frecuencias que corresponda a este histograma.
Cambie el tamaño de la línea usada por ggplot para crear este objeto.
• Agregue una línea vertical que esté ubicada en la media de la edad.
• Modifique las escalas de los ejes para que en el eje x los puntos de corte
estén cada 10 años, y en el eje y estén cada 10000 casos.
• Agregue un título y si es necesario un subtítulo que expliquen
resumidamente el contenido de la gráfica.
• Modifique los títulos de los ejes.
• Agregue un pie de ilustración (i.e. caption) que contenga su nombre
completo y la fecha y hora de descarga de los datos.

2. Realice un diagrama de barras de la variable Estado (i.e. esta es la variable que


debe ir en el eje x) y rellene las barras con las categorías de la variable Sexo.
Modifique lo siguiente en la gráfica:

• Cambie la escala del eje x para que los números aparezcan sin notación
científica.
• Cambie la escala de la leyenda que genera ggplot para que en lugar de F o
f y M o m aparezca Femenino y Masculino, respectivamente.
• Modifique el argumento position a la opción que usted considera muestra
de mejor manera la información. Si como resultado de la modificación, el
eje y contiene proporciones, modifique la escala para que esos números
aparezcan como porcentajes.
• Modifique la plantilla (i.e. theme) que por defecto usa ggplot para construir
la gráfica.

Por una universidad con calidad, moderna e incluyente


Carrera 6ª. No. 77-305 Montería NIT. 891080031-3 - Teléfono: 7860300 - 7860920
www.unicordoba.edu.co
FACULTAD DE CIENCIAS BÁSICAS
ESTADÍSTICA COMPUTACIONAL
PROGRAMA DE ESTADÍSTICA
TRABAJO SEGUNDO CORTE 2020-II

• Agregue un título y si es necesario un subtítulo que expliquen


resumidamente el contenido de la gráfica.
• Modifique los títulos de los ejes.
• Agregue un pie de ilustración (i.e. caption) que contenga su nombre
completo y la fecha y hora de descarga de los datos.

3. Usando los datos de Covid-19:


a. Parta de la base de datos del Covid-19 y cree una nueva base que debe
contener el número de casos y el número de casos acumulado para cada día
para cada departamento. Para esto debe agrupar los datos por fecha de
reporte web y departamento o distrito, y posteriormente calcular el número de
casos y el número de casos acumulado.
b. Usando la base resultante del punto anterior, realice una gráfica que le permita
ver la evolución del número de casos de manera separada para cada
departamento o distrito incluido en la base. (Pista: use alguna de las capas
facet_* para generar esta gráfica.)
c. La gráfica resultante de este punto debe cumplir con las siguientes
características:
• Tener escala logarítmica en el eje y.
• Los puntos de corte del eje x deben aparecer cada mes, y la etiqueta del
punto de corte debe incluir el mes abreviado y el día.
• Debe cambiarse el tipo de letra al texto de toda la gráfica, y el texto del eje
x debe estar en negrilla. El texto del eje x debe rotarse 90 grados (Pista:
use el argument angle, dentro de la función element_text).
• Deben quitar la cuadrícula de cada plano cartesiano que aparezca en la
gráfica.
• El eje x y el eje y deben tener líneas.
• Debe incluir un título que explique el contenido de la gráfica, y debe
cambiar el eje x y el eje y.

4. Usando la base de Covid-19, y calcule el número de casos positivos promedios por


departamentos en Colombia, el número mediano de casos por departamento, el
número mínimo de casos y máximos de casos por departamentos. Toda la
información inclúyala de manera adecuada en el informe de tal manera que sea
clara y concisa a la hora de presentarlas.

5. Presentar para la variable Edad un Análisis Exploratorio de Datos completo.


Presentar algunas conclusiones.

Recomendaciones: el informe no debe superar las 10 páginas, unificar el tamaño de la


letra y las gráficas, presentar en formato PDF, ya sea que la edición sea en un editor de
Latex, o en Word.

Por una universidad con calidad, moderna e incluyente


Carrera 6ª. No. 77-305 Montería NIT. 891080031-3 - Teléfono: 7860300 - 7860920
www.unicordoba.edu.co

También podría gustarte