Está en la página 1de 3

TALLER MATRICES, GRÁFICOS Y DENSIDAD

MINERIA DE DATOS 1 CORTE

Nombres y Apellidos: __________________________________________________ Fecha: Agosto de 2020

A continuación, se presentan Dos (2) Ejercicios los cuales valen cada uno 2.5 puntos. Para la
entrega se realizará al correo julian.quimbayo@corhuila.edu.co, con la siguiente nomenclatura
JQuimbayoCastro_T2_Mineria en un archivo winrar. El tiempo estimado para los ejercicios es de 2
hora en total.

1. Para el primer ejercicio se va a utilizar la creación de matrices y las funciones cbind() y


rbind(). El objetivo es crear una matriz con los países con casos confirmados de
Coronavirus COVID-19 tomados los datos en tiempo real de la pagina oficial:
https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd4029
9423467b48e9ecf6
A. Dicha matriz debe contener una columna con los países y otra con la cantidad de
infectados actualmente, quedando así:

Recuerden la matriz debe crearse primero los datos numéricos y luego se da los nombres
de columnas y de filas de lo contrario la matriz quedara con valores String y no se podrán
realizar operaciones posteriores.

B. Actualmente la cantidad de victimas son 113739, agregar una columna llamada Avg
Donde se muestre el porcentaje de infectados acordes al total mundial.

C. Realizar el diagrama de dispersión con los países infectados utilizando el porcentaje de


infección. Crear la leyenda con los 5 primeros países.
D. Crear el diagrama de torta con los porcentajes de infección de los últimos 5 países.
Recuerde redondear los valores a 1 solo decimal.

E. Realizar el mismo diagrama de torta, pero en 3D. Librería Plotrix.

2. Se tomarán el dataset de precipitaciones anuales en estados de norte américa,


print(precip), convertirla en matriz y agregarle el título de “precipitaciones”.

A. Agregar una columna con el porcentaje de cada estado sobre el total de


precipitaciones.

B. Reducir a un decimal los porcentajes.


C. Crear un gráfico con la función plot() y abline() que permita identificar la Densidad de
Función probabilística y el punto mínimo y máximo, es decir el intervalo en el cual se
producen en el año mayor cantidad de precipitaciones con el punto medio y mediano.
Recordar que la densidad me permite estimar o predecir que tanto puede llover según
los datos establecidos en una variable x contínua, en este caso las precipitaciones de
Norte América. Usar fuera de las funciones anteriores, la función text, mean, median,
sd y density.

Punto Mínimo = mean(matriz)-sd(matriz) //Resultado=21.17


Punto Máximo = mean(matriz)+sd(matriz)//Resultado = 48.59

¿ Esta gráfica que quiere decir con las precipitaciones de Norte América y cual es la probabilidad
de que llueva en los estados de ese país durante el año?

También podría gustarte