Está en la página 1de 25

Data Science – FOUNDATIONS

Unidad 3

RECOPILAR DATOS

Sesión Síncrona 5
La importancia de los datos

“Dude de los datos hasta que los


datos no dejen lugar a dudas”
Henri Poincaré

“Los hechos son el aire de la


ciencia. Sin ellos, un hombre de
ciencia nunca podrá elevarse”
Ivan Pavlov

Facultad de Negocios UPC


2
Objetivos de aprendizaje

Facultad de Negocios UPC


3
Metodología Data Science
Tomado de
Rollins, 2015

1. Del problema al enfoque


Trabajo con los datos

https://mym.cdn.laureate-media.com/2dett4d/IBM/LIDS0000/ES/infographic/index.html

Facultad de Negocios UPC


5
Requisitos de datos

Facultad de Negocios UPC


6
¿Cuáles son los requisitos de datos?

¿Quién?

¿Qué? ¿Cómo?

Datos
¿Por qué? ¿Dónde?

¿Cuándo?
Tomado de IBM, requisitos de datos, 2018
Recopilación de datos

Facultad de Negocios UPC


8
¿Cómo se recopilan los datos? Ideas clave

Determine si los
datos requeridos son
de origen interno o
externo
1 Identifique la

Verifique la
2 fuente de los datos

confiabilidad de
los datos
3 Si los datos no existen
en los registros, evalúe
Recuerde que la
recopilación de datos
4 la posibilidad de
recogerlos del origen
se hará cada vez que
se identifique la
5
necesidad
“No se necesita Big Data sino los datos correctos”. Wessel, 2016.
Datawarehouse

Fuente: Empresa Diego Calvo - España

Facultad de Negocios UPC


10
Data Lake

Fuente: Microsoft

Facultad de Negocios UPC


11
DESAFÍO: Subsidios monetarios COVID (Grupal)

¿Qué requisitos de datos para identificar a los beneficiarios?


¿Cómo recopilarías la información?
Gestión ejecutiva de los datos
No darse cuenta de los Subestimar las
límites de los datos no habilidades que se
estructurados necesitan

Errores
comunes
2 4
1 3
No comprender Asumir que las
Lambrecht,
los problemas de correlaciones tienen algún Tucker. 2016
integración significado
Facultad de Negocios UPC
13
¿Qué desafíos éticos se
presentan en los procesos de
ciencia deFacultad
datos? de Negocios UPC
14
¿Recuerdan esto?

Facultad de Negocios UPC


15
Pero no ha sido el único caso

Facultad de Negocios UPC


16
¿Qué es la privacidad digital?

Es el derecho de los usuarios a


proteger sus datos en la red y
decidir qué información está
visible para el resto.
Se refiere a toda la información
de un usuario que circula por
internet.

Facultad de Negocios UPC


17
¿Ustedes se preocupan por su
privacidad?
Por ejemplo, para los que tienen un IPhone

Facultad de Negocios UPC


18
Algunos ejemplos

Y por supuesto ……..

Facultad de Negocios UPC


19
Principios para el uso de datos personales

Ley 29733. Ley de Protección de datos personales


Facultad de Negocios UPC
20
Principios para el uso de datos personales

Ley 29733. Ley de Protección de datos personales


Facultad de Negocios UPC
21
¿Qué son los derechos A.R.C.O.?

Ley 29733. Ley de


Protección de datos
personales

Facultad de Negocios UPC


22
Sesión 5 – Tareas a presentar

Para esta tarea, debe usar el estudio de caso en El Mundo de la Ciencia


de Datos para escribir un informe de estado (3 a 5 párrafos de extensión)
a la directora. En el informe, describa los requisitos de datos y los
procesos de recopilación de datos vinculados al estudio de caso.
Explique cómo se alinean la comprensión empresarial y el enfoque
analítico con los requisitos de datos y con el proceso de recopilación de
datos en el trabajo del equipo de ciencia de datos de Nutri Mondo. Debe
presentar la tarea antes de la fecha límite provista por el instructor.

Facultad de Negocios UPC


23
¿Qué hemos logrado hoy?

• Describir los procesos de recopilación de datos.


• Aplicar requisitos y recopilación de datos a los
problemas de ciencia de datos.
• Describir el rol de la ética y las prácticas de seguridad
para los científicos.

Facultad de Negocios UPC


24
GRACIAS POR LA ATENCIÓN

Facultad de Negocios UPC


27

También podría gustarte