Está en la página 1de 55

Marco Metodológico

Unidad 2
Temas
● Método científico
● Multidisciplinariedad
● El proceso de la ciencia de datos
● Equipos de Ciencias de Datos
● Perfil del Profesional de los Datos
El dato

La información

El conocimiento

La sabiduría
?
¿Qué tipos de conocimientos existen?
Conocimiento
Tradicional
Conocimiento
Empírico

Conocimiento
Conocimiento Científico
Revelado
Conocimiento
Tradicional

Conocimiento El que se hereda


Empírico
El que obtengo haciendo

Conocimiento
Conocimiento Científico
Revelado El que se construye
El que me dicen
?
¿Por qué el conocimiento científico es tan
importante?

¿Qué es la ciencia?
La Ciencia

La ciencia es importante porque tiene un


método (el método científico) que permite
construir conocimiento a partir de llegar a
conclusiones probadas. De esta forma,
puede extender los límites de nuestro
conocimiento en un tema.
?
¿Qué se dice de la ciencia?
Características de la ciencia
Sistemática: se construye de forma estructurada y organizada.
Acumulativa: aprovecha y se sirve de todos los conocimientos previos.
Metódica: requiere de un proceso ordenado.
Provisional: la ciencia es perfectible y, por ello, evolutiva, cambiante, no permanente o definitiva.
Comprobable: los conocimientos pueden ser comprobables y verificables. En las ciencias formales (lógica,
matemáticas) se usan las demostraciones, en las ciencias factuales (cs naturales y sociales) se usa la verificación.
Especializada: cada ciencia tiene su propio y particular campo de estudio, que le es característico.
?
¿Qué es el método científico?
1. Mediante la observación se identifica un
fenómeno que se desea estudiar
2. Se generan preguntas de investigación
3. Se formula una hipótesis nula
(conservadora) y una hipótesis
alternativa sobre el fenómeno
observado.
4. Se diseñan experimentos para evaluar
las hipótesis.
5. Se analizan los datos y se evalúa la
validez de las hipótesis
6. Se informan los resultados
La ciencia usa los datos
para proponer hipótesis.
Hipótesis
● Explicación tentativa de un fenómeno que Ejemplo:
puede ser sometida a prueba empírica.
● Enunciado que se formula a partir de la "El tratamiento X es más efectivo que el
tratamiento Y"
observación y/o la investigación previa.
● Es el punto de partida del proceso científico.
● Pueden ser refutadas o confirmadas por los datos. Hay que enunciar las hipótesis de manera que su
validación haga posible dar respuesta a las
cuestiones planteadas a la investigación.
El objetivo de la ciencia es descubrir las leyes
que rigen los fenómenos de la realidad para
construir teorías que nos permitan comprender
el mundo.
Ley de la gravedad
Ley de Newton

Ley de
Afirmación empírica que se ha demostrado conservación
de la Energía
que es cierta. Describen una relación regular y
consistente (patrón) entre dos o más variables E=Q-W
en un fenómeno.
Ley de
Boyle-Mariotte
Teoría

- Conjunto de enunciados interrelacionados que definen, describen,


relacionan y explican fenómenos de interés.
● Teorías descriptivas: solo describen o
caracterizan los objetos de estudio.
- Las funciones de la teoría son la descripción de los fenómenos objeto
● Teorías correlacionales o asociativas:
de estudio, el descubrimiento de sus relaciones y el de sus factores
establecen relaciones entre los objetos o
causales. fenómenos estudiados.
- Tienen un alto grado de generalización y pueden ser modificadas ● Teorías explicativas: investigan los
o ampliadas a medida que se acumula nueva evidencia. factores causales.

Una conjetura es una suposición no verificada, una creencia basada en experimentos irreproducibles, anécdotas, opinión popular o "sabiduría de los
antiguos".
?
¿Por qué hacemos ciencia?
Ciencia básica

El rol de la ciencia Tiene como objetivo el descubrimiento, la comprensión y


la explicación de los fenómenos naturales.
en la sociedad

La ciencia nos permite


comprender el mundo que Ciencia aplicada
nos rodea y encontrar
Tiene como objetivo la resolución de problemas y la
soluciones a los problemas creación de soluciones prácticas a partir de la utilización
que enfrentamos. de los conocimientos y principios científicos .
Controversias
científicas La actividad humana es la principal
causa del aumento de la
temperatura global
Situación en la que existe una falta de consenso o acuerdo
entre los expertos en una determinada área de conocimiento.
Las controversias pueden surgir debido a falta de datos, la
interpretación diferente de los datos existentes, la existencia
de teorías alternativas, la presencia de evidencia Los cambios son naturales y no hay
contradictoria, entre otros factores. evidencia suficiente para respaldar
la idea del cambio climático
Las controversias científicas son parte del proceso de antropogénico
investigación científica y pueden ser muy útiles para avanzar en
el conocimiento.

* Actualmente, dentro de la comunidad científica, hay un amplio consenso de que


el cambio climático es real y está siendo causado principalmente por la actividad
humana. El Panel Intergubernamental sobre Cambio Climático (IPCC) de las
Naciones Unidas ha concluido en varios informes que el cambio climático es muy
probable que esté siendo causado por la actividad humana.
Los científicos pueden tener su propia Identificar el
perspectiva que puede influir en cómo objetivo
interpretan los datos. estratégico de
Además, el financiamiento y los intereses
nuestro trabajo y
cómo este nos
políticos pueden influir en los resultados y la
interpela
interpretación de los hallazgos científicos. Por
eso, es importante trabajar siguiendo un
método riguroso.
Los científicos deben ser conscientes del contexto político y social en el que
Contar con un protocolo de trabajo ayuda a
trabajan y cómo sus hallazgos pueden ser utilizados.
evitar sesgos en las investigaciones.
Los datos pueden ser creados y utilizados con fines políticos y estratégicos. Esto
hace que la ciencia no sea siempre neutral.
El enfoque de la ingeniería

La ingeniería es el uso de principios científicos para


diseñar y construir máquinas, estructuras, sistemas y
procesos.

Aprovecha el cúmulo de conocimientos tecnológicos para


la innovación, invención, desarrollo y mejora de técnicas y
herramientas para satisfacer las necesidades y resolver
problemas técnicos tanto de las personas como de la
sociedad.
Método científico Método de la ingeniería
- El método científico permite alcanzar un conocimiento - La ingeniería es una actividad de toma de decisiones
objetivo de la realidad contra limitaciones físicas, económicas, sociales y
políticas que desarrolla materiales, productos o
- El método científico parte de la observación y procesos para satisfacer una necesidad
proposición de hipótesis, las cuales se comprueban
con experimentación y análisis de los resultados - La solución en la ingeniería es la solución óptima, a la
cual se llega mediante iteraciones
- En los problemas científicos hay muchas soluciones
posibles, aunque solo una de ellas es la aceptable - El trabajo de desarrollo en ingeniería se estructura en
(excepto en períodos de controversias) programas y proyectos
● Programa: conjunto de Proyectos que, coordinados conjuntamente,
Proyecto buscan la consecución de un objetivo común.
● Portafolio: conjunto de Programas y Proyectos de una organización, no
Un proyecto es un esfuerzo temporario, necesariamente vinculados entre sí, que buscan la consecución de la
acotado por un comienzo y un fin, para crear un Estrategia general
producto, servicio o resultado único.

Todo proyecto se caracteriza fundamentalmente


por ser:

- Temporario
- Único
- Progresivo
Unidad Funcional 1
● La mayor parte de las organizaciones se organizan en torno
a grupos funcionales especializados en áreas específicas.
● Los grupos y las personas individuales tienden,
naturalmente, a adquirir especializaciones en un área.
● En general, un equipo de gestión de proyecto está
integrado por personas de diversos departamentos
funcionales (equipo multidisciplinario).
Proyecto
Unidad Funcional 2 ● Estas personas se convierten en miembros del equipo de
proyecto mientras continúan trabajando para el
departamento funcional al que pertenecen.
Equipo La interdisciplinariedad implica la integración de
multidisciplinario e conocimientos y métodos de diferentes disciplinas
para abordar un problema complejo o desafío social.
interdisciplinariedad La interdisciplinariedad requiere de un enfoque holístico
y colaborativo, en el cual los miembros del equipo
trabajan juntos para abordar un problema desde
diferentes perspectivas.
● Una disciplina es un campo de
estudio o conocimiento que se La interdisciplinariedad puede conducir a soluciones
caracteriza por tener sus propios más efectivas e innovadoras para problemas complejos
métodos, teorías y prácticas. que no pueden ser abordados desde una sola disciplina.
● Un equipo multidisciplinario La colaboración entre diferentes disciplinas y la
está compuesto por expertos de integración de diferentes perspectivas puede ser
diferentes disciplinas que trabajan fundamental para enfrentar los desafíos sociales actuales
juntos en un proyecto o problema y futuros.
común.
?
¿Cómo es el método en Ingeniería?
Requisitos del
sistema

Análisis y
diseño de la In
ge
solución nie
ría
In
ve
rs
Implementación a

Verificación

Mantenimiento
Modelo
Cascada
Desventajas del método cascada

1. Dificulta los cambios: La verificación solo se produce en la etapa final. Hay poco lugar para cambios.
No hay revisión sobre la marcha. Si aparece un obstáculo en la implementación provoca que se
derrumbe todo el proyecto.

2. Excluye al cliente o al usuario final: La participación del cliente y usuario final sólo se considera en
la fase inicial y final del proyecto.

3. Retrasa las pruebas hasta después de la finalización: Dejar la fase de pruebas para la última mitad
de un proyecto es riesgoso. En el caso de producirse revisiones, demandaría una gran cantidad de tiempo
implementarlas.
Enfoque Ágil

● Agile es un enfoque iterativo de la gestión de proyectos que ayuda Agile se enfoca en la


a los equipos a ofrecer valor a sus clientes más rápido. colaboración y la
● Un equipo ágil entrega el trabajo en incrementos pequeños pero iteración constante
consumibles.
● Los requisitos, planes y resultados se evalúan continuamente, de
modo que los equipos disponen de un mecanismo natural para
responder rápidamente a los cambios.
● La priorización de tareas se realiza en función del valor que tenga
para el cliente.
Manifiesto Agile
?
¿Cómo hacemos
un producto de forma ágil?
Producto

Artículo producido, cuantificable y que puede ser un elemento terminado Productos en un proyecto de Ciencia
o un componente. de Datos
● Se trata de la materialización o respuesta que una empresa da
- Informe de análisis
a las necesidades reales de los clientes.
- Conjunto de datos procesados y limpios
● Los productos pueden ser tangibles, como un edificio, o más
abstractos, como un resultado financiero. - Modelos predictivos
- Dashboard interactivo
● Definir los productos entregables nos ayuda a definir los alcances
de un proyecto. - Código fuente y documentación
- Prototipo/Maqueta/Pruebas
El camino hacia un producto

¿Ciencia básica?
¿Ciencia aplicada?
PoC
Maqueta
“Proof of concept” o Prueba de concepto es un estudio
de viabilidad que se realiza antes de comenzar un proyecto. Una maqueta es un modelo a escala que se
Una POC nos ayuda a demostrar a los clientes o equipos de utiliza para mostrar cómo será el diseño final
productos el valor de una idea en la práctica. Genera de un producto o sistema. Se utilizan para
confianza en el cliente y en el equipo, y nos ayuda a comunicar y evaluar el diseño.
identificar los riesgos del proyecto
Prototipo
Modelo o muestra preliminar de un producto o sistema que
se crea para evaluar su diseño y funcionalidad. Se utiliza para
probar y validar la viabilidad del diseño, detectar
problemas y hacer mejoras antes de la producción o
implementación final.
CIENCIA INGENIERÍA

I+D
Entornos de trabajo

Entorno
Entorno Relevante Entorno Real
Laboratorio
Niveles de madurez de una tecnología
1 Los principios básicos observados y reportados
Prueba de concepto.
2 El concepto y/o la aplicación están formulados Investigación industrial Entorno de
Investigación
laboratorio
3 Experimentación de la funcionalidad crítica y/o POC

4 Los componentes validados en laboratorio

5 Los componentes validados en un entorno relevante


Entorno de
Prototipo Desarrollo
simulación
6 Demostración del modelo o prototipo en entorno relevante

7 Demostración de prototipo en entorno operativo

Producto o servicio
8 El sistema real es probado Entorno real Innovación
comercializable

9 El sistema real es probado en operaciones reales Despliegue


?
¿Cómo es la metodología que se usa en
un proyecto en ciencia de datos
para ser riguroso y ágil?
Metodología Agile
para la gestión de proyectos
Aprobado y
revisado por el
cliente
Construido con el Priorizado con el
cliente cliente
Proyecto de
ciencia de datos

Cross Industry
Standard Process
(CRISP)
Metodologías en DS
Algunas de las más conocidas son:
● CRISP-DM: ampliamente utilizada en la industria. Consta de seis fases:
comprensión del problema, comprensión de los datos, preparación de los Estas metodologías no son
datos, modelado, evaluación y despliegue. exclusivas y pueden combinarse
para adaptarse a las necesidades
● SEMMA: Es una metodología desarrollada por SAS Institute que consta de
específicas de cada proyecto de
cinco fases: muestra, explora, modifica, modela y evalúa.
ciencia de datos
● TDSP: Es una metodología desarrollada por Microsoft que se enfoca en
proyectos de ciencia de datos en el ámbito empresarial y consta de cinco
fases: planificación del proyecto, adquisición de datos, preparación de
datos, modelado y despliegue.
Roles en Líder de proyecto
proyecto de
ciencia de datos
Analista de datos
Ingeniero de datos

Desarrollador

Científico de datos
Científica/o de datos Analista de datos
● Generan conocimiento ● Limpieza de los datos: Realizan la limpieza de datos.
Desarrollan las preguntas, diseñan los
experimentos, implementan modelos de machine ● Minería de datos: Ayudan a las organizaciones a tomar
learning e interpretan los resultados para encontrar mejores decisiones mediante el análisis descriptivo de
soluciones enfocadas en el negocio. los datos.

● Reporting y desarrollo de dashboards: Generan


Un buen data scientist puede asesorar a los otros roles informes para los clientes reportando el
porque conoce las necesidades del negocio y cuenta comportamiento de la organización.
con un amplio repertorio de herramientas.
Ingenierx de datos
● Arquitectura de datos: Diseña, desarrolla, ML Engineers
monitorea y mantiene la arquitectura del
almacenamiento de los datos.

Profesionales expertos y
● Proceso ETL: Colabora en la herramientas específicas y
automatización de los procesos ETL abarca tres aspectos clave
(extracción, transformación y carga de los del ML: diseño,
datos). entrenamiento y despliegue
TRABAJO PRÁCTICO
Queremos analizar los perfiles profesionales que se buscan en el mercado laboral HOY en
Argentina. Nos interesa conocer cuáles son los perfiles más buscados y los requerimientos
técnicos que se piden ¿Cómo lo hacemos?

- Preguntas de investigación
- Hipótesis
- Fuente de datos

Formato de entrega (en grupos):

- Documento donde se describa la metodología de trabajo propuesta


Material Complementario
● ¿Qué es la ciencia? https://youtu.be/vOX-Tj6iIaA
● La teoría del conocimiento en investigación científica: una visión actual
http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1025-55832009000300011

Para curiosear..

● Gestión de Proyectos https://ebs.online.hw.ac.uk/documents/course-tasters/spanish/pdf/pr-bk-taster.pdf

También podría gustarte