Está en la página 1de 5

Programa Iberoamericano de Formación en Minerı́a de Datos

Tarea Número 1
Curso: Programación en R Código: MD102
Generación: Bernoulli Fecha de Entrega: 14 de mayo del 2019 6:00pm (GMT-6)

Lineamientos Generales
Cada dı́a de atraso en la entrega implica un rebajo de 10 puntos.

La tarea es estrictamente de carácter individual, en caso de detectarse tareas idénticas ambas


tendrán como nota cero.

La tarea debe ser entregada en un documento pdf y R que contenga el código utilizado y las
salidas de consola de cada ejercicio.

El nombre del archivo debe tener el siguiente formato: Tarea1 nombre apellido.pdf, por
ejemplo, si el nombre del estudiante es Luis Pérez el nombre del documento para la tarea 1
será Tarea1 luis perez.pdf.

Cada tarea representa un 25 % de la nota total del curso.

Ejercicios
1. [6 puntos] Ejecute las siguientes instrucciones para practicar el uso de un poco de matemática
en R ¿Cuál es el resultado?

1) pi*2^3-sqrt(4)
2) abs(12-17*2/3-9)
3) factorial(4)
4) log(2,10)
5) log(2)
6) exp(0.6931472)

1+y
2. [5 puntos] Calcule el valor de x si x = para y = 10 y z = π
1 − 2z 2
p
3. [5 puntos] Calcule el valor de z si z = x2 + y 2 para x = −10 y y = π

4. [7 puntos] La siguiente fórmula corresponde a una conocida secuencia llamada la secuencia de


fibonacci. Implemente en R esta fórmula y calcule los resultados de dicha fórmula para x = 2,
luego calcule los valores para x desde 1 hasta 8, es decir, que x tenga valores de 1:8.

 √ x  √ x
1+ 5
2
− 1−2 5

5

1
5. [22 puntos] Dado x = (3, −5, 31, −1, −9, 10, 0, 18), y = (1, −5, −3, 1, −99, −10, 10, −7) y
realice lo siguiente:

Calcule x + 3y.
Obtenga los valores de x desde los ı́ndices 2 al 6.(incluyendo 2 y 6)
Obtenga los valores pares de x.
Obtenga los valores en las posiciones impares de y.
Obtenga los valores de y que se encuentren entre -5 y 5 (incluyendo -5 y 5)
Obtenga los valores de x cuya división entera entre 7 sea igual a 0.
Obtenga los valores de y menores a -3 o mayores a 10.
Obtenga en x el ı́ndice del valor más alto del vector.
Obtenga en x el resultado de la suma de los valores menores a la media del vector.
Calcule en y el porcentaje de valores que están por encima y por debajo de las media del
vector (para esto puede utilizar las funciones table(...) y prop.table(...).
Obtenga los valores de y de forma invertida.

6. [5 puntos] Explique de forma detallada que causa que el resultado de la siguiente instrucción
c(3, 3, 5, 5) - c(1, 0) sea un vector con valores c(2, 3, 4, 5).

7. [6 puntos] Investique para qué sirven los siguientes comandos, explique y dé un ejemplo de
cada uno.

as.matrix(...)
as.data.frame(...)
na.omit(...)

8. [5 puntos] Introduzca usando código R (no archivos) en un DataFrame la siguiente tabla de


datos:

Peso Edad Nivel Educativo


76 25 Lic
67 23 Bach
55 19 Bach
57 18 Bach
87 57 Dr
48 13 MSc

9. [8 puntos] Cargue en un DataFrame el archivo EjemploAlgoritmosRecomendación.csv y


haga lo siguiente:

Calcule la dimensión de la tabla de datos.


Despliegue las primeras 2 columnas de la tabla de datos.
Ejecute un summary y un str de los datos.

2
Calcule la Media y la Desviación Estándar para todas las variables.

10. [6 puntos] Utilizando el vector v = (1, 8, 13, 12, 14, 11, 2, 7, 4, 5, 16, 9, 15, 10, 3, 6) genere una
matriz M de dimensión 4 × 4 ordenada por filas y utilizando la función apply(...) calcule
media para cada uno de los individuos (filas) y agregue el resultado como una nueva columna
a la derecha de la matriz.

11. [5 puntos] Genere una hoja de datos (“data frame”) a partir de la siguiente tabla de datos y
verifique que las variables tengan el tipo de dato adecuado.

id: Identificador único del estudiante.


calificacion: Nota o calificación obtenida en una escala descendente de la A a la D.
duracion: Cantidad de minutos requeridos para realizar la prueba.

id calificacion duracion
1 B 64
2 C 85
3 B 76
4 A 83
5 A 80
6 A 78
7 C 68
8 B 82
9 A 89
10 B 61

12. [8 puntos] Cargue la tabla de datos de DowJones que se encuentra en el archivo DatosTarea.xlsx.
Estos datos tratan sobre ı́ndices de distintas empresas en la bolsa de valores, posee las siguientes
columnas:

MMM: 3M (Industria diversificada).


AXP: American Express (Servicios financieros).
BA: Boeing (Industria aeroespacial e armamentı́stica).
CAT: Caterpillar, Inc.(Industria automotriz).
CVX: Chevron Corporation (Industria petrolera).
CSCO:Cisco (Tecnologı́a y telecomunicaciones).
KO: Coca-Cola (Bebidas).
DD: DuPont (Industria quı́mica).
XOM: ExxonMobil (Industria petrolera).
GE: General Electric (Industria diversificada).
HD: Home Depot (Minoristas).
INTC: Intel (Semiconductores).
IBM: IBM (Informática).

3
JNJ: Johnson & Johnson (Industria farmacéutica y bienes de consumo).
JPM: JPMorgan Chase (Banca).
MCD: McDonald’s (Restaurantes de comida rápida).
MRK: Merck (Industria farmacéutica).
MSFT: Microsoft (Software).
PFE: Pfizer(Industria farmacéutica).
PG: Procter & Gamble (bienes de consumo).
TRV: The Travelers Companies (Seguros).
UNH: UnitedHealth Group (Salud).
UTX: United Technologies Corporation (Industria aeroespacial).
VZ: Verizon Communications (Telecomunicaciones).
WMT: Wal-Mart (Minoristas).
DIS: Walt Disney(Telecomunicaciones e industria del entretenimiento).
HPQ: HP Inc.(Tecnologı́a).
T: AT&T Inc.(Telecomunicaciones).
AA: Alcoa Corp.(Recursos y materiales).
BAC: Bank of America Corp.(Servicios financieros).

Cargue los datos usando código R y efectue lo siguiente:

Cambie los nombres de filas por los valores de la primera columna.


Elimine las columnas AA, CAT y MCD.
Ejecute un summary y un str de los datos.
Calcule la Media y la Desviación Estándar para todas las variables.

13. [6 puntos] Para las variables almacenadas de la siguiente forma L1 = list(a = c(2,4,3,5,6)),
V1 = c(2,7,6,4,52) y V2 = c(7,5,7,0,1) utilizando la función lapply(...) calcule la sumatoria
de cada una de esas variables.

14. [6 puntos] Determine usando código R si los siguientes vectores son palı́ndromos, los vectores
palı́ndromos son aquellos que son iguales de forma normal y al revés. Por ejemplo c(’A’, ’N’,
’A’) es palı́ndromo ya que este vector al revés tiene los mismos valores. Su respuesta en cada
caso solo debe ser TRUE o FALSE.

c(2, 3, 18, 32, 11, 0, 11, 32, 1, 17, 3, 2).


c(’r’, ’e’, ’c’,’o’, ’n’, ’o’, ’c’, ’e’, ’r’).
c(T, F, F, F, T, T, T, F, F, F, T).

4
Entregables: Incluya en un archivo PDF y un archivo R con todas las instrucciones y códigos R
utilizados en cada ejercicio, incluya los resultados de los cálculos, los gráficos generados.

También podría gustarte