Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 2
Temas
● Método científico
● Multidisciplinariedad
● El proceso de la ciencia de datos
● Equipos de Ciencias de Datos
● Perfil del Profesional de los Datos
El dato
La información
El conocimiento
La sabiduría
?
¿Qué tipos de conocimientos existen?
Conocimiento
Tradicional
Conocimiento
Empírico
Conocimiento
Conocimiento Científico
Revelado
Conocimiento
Tradicional
Conocimiento
Conocimiento Científico
Revelado El que se construye
El que me dicen
?
¿Por qué el conocimiento científico es tan
importante?
¿Qué es la ciencia?
La Ciencia
Ley de
Afirmación empírica que se ha demostrado conservación
de la Energía
que es cierta. Describen una relación regular y
consistente (patrón) entre dos o más variables E=Q-W
en un fenómeno.
Ley de
Boyle-Mariotte
Teoría
Una conjetura es una suposición no verificada, una creencia basada en experimentos irreproducibles, anécdotas, opinión popular o "sabiduría de los
antiguos".
?
¿Por qué hacemos ciencia?
Ciencia básica
- Temporario
- Único
- Progresivo
Unidad Funcional 1
● La mayor parte de las organizaciones se organizan en torno
a grupos funcionales especializados en áreas específicas.
● Los grupos y las personas individuales tienden,
naturalmente, a adquirir especializaciones en un área.
● En general, un equipo de gestión de proyecto está
integrado por personas de diversos departamentos
funcionales (equipo multidisciplinario).
Proyecto
Unidad Funcional 2 ● Estas personas se convierten en miembros del equipo de
proyecto mientras continúan trabajando para el
departamento funcional al que pertenecen.
Equipo La interdisciplinariedad implica la integración de
multidisciplinario e conocimientos y métodos de diferentes disciplinas
para abordar un problema complejo o desafío social.
interdisciplinariedad La interdisciplinariedad requiere de un enfoque holístico
y colaborativo, en el cual los miembros del equipo
trabajan juntos para abordar un problema desde
diferentes perspectivas.
● Una disciplina es un campo de
estudio o conocimiento que se La interdisciplinariedad puede conducir a soluciones
caracteriza por tener sus propios más efectivas e innovadoras para problemas complejos
métodos, teorías y prácticas. que no pueden ser abordados desde una sola disciplina.
● Un equipo multidisciplinario La colaboración entre diferentes disciplinas y la
está compuesto por expertos de integración de diferentes perspectivas puede ser
diferentes disciplinas que trabajan fundamental para enfrentar los desafíos sociales actuales
juntos en un proyecto o problema y futuros.
común.
?
¿Cómo es el método en Ingeniería?
Requisitos del
sistema
Análisis y
diseño de la In
ge
solución nie
ría
In
ve
rs
Implementación a
Verificación
Mantenimiento
Modelo
Cascada
Desventajas del método cascada
1. Dificulta los cambios: La verificación solo se produce en la etapa final. Hay poco lugar para cambios.
No hay revisión sobre la marcha. Si aparece un obstáculo en la implementación provoca que se
derrumbe todo el proyecto.
2. Excluye al cliente o al usuario final: La participación del cliente y usuario final sólo se considera en
la fase inicial y final del proyecto.
3. Retrasa las pruebas hasta después de la finalización: Dejar la fase de pruebas para la última mitad
de un proyecto es riesgoso. En el caso de producirse revisiones, demandaría una gran cantidad de tiempo
implementarlas.
Enfoque Ágil
Artículo producido, cuantificable y que puede ser un elemento terminado Productos en un proyecto de Ciencia
o un componente. de Datos
● Se trata de la materialización o respuesta que una empresa da
- Informe de análisis
a las necesidades reales de los clientes.
- Conjunto de datos procesados y limpios
● Los productos pueden ser tangibles, como un edificio, o más
abstractos, como un resultado financiero. - Modelos predictivos
- Dashboard interactivo
● Definir los productos entregables nos ayuda a definir los alcances
de un proyecto. - Código fuente y documentación
- Prototipo/Maqueta/Pruebas
El camino hacia un producto
¿Ciencia básica?
¿Ciencia aplicada?
PoC
Maqueta
“Proof of concept” o Prueba de concepto es un estudio
de viabilidad que se realiza antes de comenzar un proyecto. Una maqueta es un modelo a escala que se
Una POC nos ayuda a demostrar a los clientes o equipos de utiliza para mostrar cómo será el diseño final
productos el valor de una idea en la práctica. Genera de un producto o sistema. Se utilizan para
confianza en el cliente y en el equipo, y nos ayuda a comunicar y evaluar el diseño.
identificar los riesgos del proyecto
Prototipo
Modelo o muestra preliminar de un producto o sistema que
se crea para evaluar su diseño y funcionalidad. Se utiliza para
probar y validar la viabilidad del diseño, detectar
problemas y hacer mejoras antes de la producción o
implementación final.
CIENCIA INGENIERÍA
I+D
Entornos de trabajo
Entorno
Entorno Relevante Entorno Real
Laboratorio
Niveles de madurez de una tecnología
1 Los principios básicos observados y reportados
Prueba de concepto.
2 El concepto y/o la aplicación están formulados Investigación industrial Entorno de
Investigación
laboratorio
3 Experimentación de la funcionalidad crítica y/o POC
Producto o servicio
8 El sistema real es probado Entorno real Innovación
comercializable
Cross Industry
Standard Process
(CRISP)
Metodologías en DS
Algunas de las más conocidas son:
● CRISP-DM: ampliamente utilizada en la industria. Consta de seis fases:
comprensión del problema, comprensión de los datos, preparación de los Estas metodologías no son
datos, modelado, evaluación y despliegue. exclusivas y pueden combinarse
para adaptarse a las necesidades
● SEMMA: Es una metodología desarrollada por SAS Institute que consta de
específicas de cada proyecto de
cinco fases: muestra, explora, modifica, modela y evalúa.
ciencia de datos
● TDSP: Es una metodología desarrollada por Microsoft que se enfoca en
proyectos de ciencia de datos en el ámbito empresarial y consta de cinco
fases: planificación del proyecto, adquisición de datos, preparación de
datos, modelado y despliegue.
Roles en Líder de proyecto
proyecto de
ciencia de datos
Analista de datos
Ingeniero de datos
Desarrollador
Científico de datos
Científica/o de datos Analista de datos
● Generan conocimiento ● Limpieza de los datos: Realizan la limpieza de datos.
Desarrollan las preguntas, diseñan los
experimentos, implementan modelos de machine ● Minería de datos: Ayudan a las organizaciones a tomar
learning e interpretan los resultados para encontrar mejores decisiones mediante el análisis descriptivo de
soluciones enfocadas en el negocio. los datos.
Profesionales expertos y
● Proceso ETL: Colabora en la herramientas específicas y
automatización de los procesos ETL abarca tres aspectos clave
(extracción, transformación y carga de los del ML: diseño,
datos). entrenamiento y despliegue
TRABAJO PRÁCTICO
Queremos analizar los perfiles profesionales que se buscan en el mercado laboral HOY en
Argentina. Nos interesa conocer cuáles son los perfiles más buscados y los requerimientos
técnicos que se piden ¿Cómo lo hacemos?
- Preguntas de investigación
- Hipótesis
- Fuente de datos
Para curiosear..