Está en la página 1de 2

BIG DATA Y MACHINE LEARNING - EVALUACIÓN T1

Nombres y apellidos: Rudas Castañeda Kevin………………………………………… Fecha: 28/04/2020


Duración 1h 20 min

1. Contestar a los enunciados (10p)


a. ¿En qué áreas principales podemos encontrar datos masivos? Mencione 3.

b. ¿Cuál es la aplicación de BigData en nuestro país?


La aplicación que se utiliza en Perú es “BIG DATA ANALYTICS SUMMINT” aquí
se encarga de ver como por ejemplo miles de documentos del Poder Judicial,
también hay en los bancos para ver si hay fraudes bancarios y también en
hospitales para ver historias clínicas. Pero en lo que se basa es en la
tecnología.
https://www.peru-retail.com/peru-como-el-big-data-transforma-los-negocios/

c. Mencione 3 ejemplos de datos estructurados y 3 ejemplos de datos no


estructurados, que podría encontrarse en el campo académico.

DATOS ESTRUCTURADOS:
-Resultado de los cuestionarios de opción múltiple.
-Datos de ventas recopiladas.
-Información de contactos de clientes

DATOS NO ESTRUCTURADOS:
-Correos Electrónicos.
-Archivos PDF.
-Archivo de procesador de texto.

d. Describa y comente la aplicación de machine learning de un artículo científico


o de noticia (de los dos últimos años), indicar el link.

El Libro sobre Introducción a Machhine Learning nos viene a hablar algo sobre
la inteligencia Artificial entre otros mas aspectos, además habla en donde se
utiliza como por ejemplo en los bancos sobre finanzas etc.
https://books.google.com.pe/books?
hl=es&lr=&id=tZnSDwAAQBAJ&oi=fnd&pg=PR7&dq=machine+learning+articul
o+cientifico&ots=F2ZX6V4nzg&sig=gPvBHWksE-
ibI39XRS2zI1AUqs8#v=onepage&q&f=false

e. ¿En qué áreas o aplicaciones le parece necesario y/o importante aplicar


BigData?
Es importante utilizar Big Dato en el área de Salud Publica ya que varios
tenemo algún tipo de enfermedad que podemos ir a tratar debido a esto se
debe generar una historia clínica para ver que problemas de salud haz tenido y
como vas evolucionando si haz mejorado o empeorado
Como ejemplo seria esta enfermedad de COVID-19 aquí veríamos que
paciente esta infectado y como debe ser tratado.

2. Elaborar el programa de análisis de datos utilizando spyder o Jupyter para los


siguientes ítems: (10p)
TelcoChurn es un archivo de datos de una empresa de telecomunicaciones para
reducir la pérdida de clientes. Registra datos demográficos y de servicios. Debe
usar el URL para obtener el archivo ChurnData.csv.

https://s3-api.us-geo.objectstorage.softlayer.net/cf-courses-
data/CognitiveClass/ML0101ENv3/labs/ChurnData.csv

- Cargar datos del archivo CSV


- Mostrar los primeros registros
- Creación de dataframes
- Mostrar resumen de información válida (No nula)
- Mostrar estadísticas básicas

Al finalizar, debe enviar el código de sus programas en Word o en Bloc de notas. Asegúrese de
copiar todo el código de cada programa, incluyendo librerías y comentarios que expliquen el
procedimiento. Además debe adjuntar las capturas de pantallas de los resultados de la
ejecución.

Ing. Laura Bazán Díaz

Docente del curso

También podría gustarte