Está en la página 1de 10

BIG DATA, CIENTÍFICO

DE DATOS E
INGENIERO DE DATOS
¿Cuál es la relación entre estos conceptos?
Big Data
■ El Big data es un término ingles que nos da
referencia a datos masivos, por lo que
podríamos definirlo como un conjunto de
datos cuyo tamaño supera
considerablemente la capacidad de gestión,
análisis de personas y softwares
convencionales. Aunque esta definición no
solo hace referencia al concepto sino también
al contenido y la velocidad con lo que los
datos se guardan. Estas características
producen lo que hoy se llama las 5V del Big
Data, es decir volumen, velocidad, variedad,
veracidad y valor de la información. 
Data Scientist y Data Enginner
■ Una de las distinciones más
simples que existen de ambos
puestos es que el científico de
datos está orientado hacia las
matemáticas y algoritmos
mientras que un ingeniero de
datos está orientado hasta las
tecnologías de información. El
científico tiene mayor análisis y
el ingeniero tiene mayores
habilidades en programación. 
Antencedentes
■ Los científicos de datos ■ Antes de que la ciencia de los datos se
convirtiera en una titulación
provienen en su mayoría independiente, los científicos de datos
que trabajaban procedían de ámbitos
de una formación como la estadística, la economía, la
empresarial ciencia actuarial y otros campos
cuantitativos que se centran en el uso
de las matemáticas para resolver
problemas del mundo real.
■ Los ingenieros de datos ■ Antes de que la ingeniería de datos se
convirtiera en un tema independiente,
provienen en su mayoría los ingenieros de datos procedían del
de una formación desarrollo de software y bases de datos,
que se centran mucho más en la
informática solución tecnológica que en la
aplicación
Opuestos pero Indispensables
¿Por qué los científicos de datos y los ingenieros
de datos deben trabajar juntos?

■ La ciencia de los datos y la ingeniería ■ Ejemplo:


de datos son dos caras de la misma ■ El desarrollo de backend y front-end, los
moneda, porque para obtener valor desarrolladores de aplicaciones y
de los datos, necesitamos la operaciones, donde las dos partes sólo
necesitan tener una única interfaz para
resolución creativa de problemas, la ofrecer una solución. La ciencia de los datos
perspicacia empresarial de los y la ingeniería requieren una interacción y
científicos de datos y necesitamos la una colaboración mucho más fluidas a lo
implementación sólida y la largo del proceso y eso se debe a las
arquitectura escalable de los siguientes características del trabajo con
datos:
ingenieros de datos.
Una Colaboracion más fluida

■ La ciencia de los datos no es una ■ La ingeniería de datos se basa en los


solución directa datos, no en las especificaciones
■ La experimentación como núcleo ■ Adaptar y mejorar la forma en procesar
datos
■ Encontrar ideas y diseñar algoritmos
■ Garantizar que se reciban datos oportunos
■ Proceso repetitivo
■ Construir especificaciones con la
■ Provisión de alimentar la base de datos inseguridad de que tenga errores en la
vida real
■ Puesta a disposición de otros sistemas
y procesos ■ Entendimiento de la estructura de datos
pero no los fines de la misma
¿Dónde está la línea real entre la ciencia de
datos y la ingeniería de datos?

■ No hay una respuesta definitiva y es probable que se observen


lagunas entre dónde debería estar la línea para ambas disciplinas.
■ Para que este modelo funcione, tendrá que conseguir que ambas
funciones se pongan de acuerdo.
■ Existe el riesgo de que cada equipo produzca un trabajo que no
sea óptimo para trasladar la responsabilidad a la otra parte
■ Sigue siendo un modelo ampliamente adoptado que funciona en
muchas empresas.
EJEMPLOS

También podría gustarte