Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GESTIÓN DE
TECNOLOGÍAS DE LA
INFORMACIÓN Y LA
COMUNICACIÓN
Actividad 1:
50 years of Data Science.
ASIGNATURA:
Big Data
Dr. Emmanuelle Ruelas Gómez.
De acuerdo con (García, 2017), define el Big Data como “un gran volumen, velocidad o
variedad de información que demanda formas costeables e innovadoras de procesamiento de
información que permitan ideas extendidas, toma de decisiones y automatización del proceso”,
para ilustrar esta idea se complementa con la idea de que la Ciencia de Datos se ha convertido en
un enfoque para el descubrimiento científico, basta pensar en la cantidad de personas que pasan
por los controles de seguridad en los aeropuertos del mundo, los registros de ello en las cámaras
de vigilancia o las transacciones bancarias para dimensionar el enorme flujo de generación de
datos.
Siendo más específico hay una controversia entre la Ciencia de Datos y la Estadística, ya
que en concreto las estadísticas son una parte de lo que sucede en la Ciencia de Datos, y ésta se
ocupa de datos realmente grandes, que los mismos recursos informáticos no podrían acomodar ni
analizar, cabe señalar que el volumen, variedad y velocidad son los atributos técnicos que pueden
ayudar a definir a la Ciencia de Datos, así por ejemplo para 2014 se crearon 4.4 millones de
trabajos de Big Data y únicamente se posicionaron la tercera parte de ellos, en lo que toca a el
análisis de datos y las estadísticas, son habilidades ampliamente aplicables y transferibles de una
organización a otra.
De manera puntual hay que cuestionarse ¿cómo procesar y analizar esos volúmenes de
información? Explorar esta idea hace necesario conocer la evolución que han tenido las bases de
datos y de esta manera comprender la forma en la que se almacena y organiza la información, en
primer lugar porque la explotación de los datos puede ser una de las principales preocupaciones
de todas las organizaciones, para comprender mejor es preciso señalar que Big Data ha
propiciado la aparición de la Ciencia de los Datos, término que hace referencia al conjunto de
tecnologías y técnicas necesarias para el tratamiento de la información masiva desde los puntos
de vista estadístico e informático, resolviendo al tiempo el problema de almacenamiento de los
datos.
De forma similar, el futuro del análisis de datos involucra procedimientos, técnicas para
interpretar los resultados, formas de planificar la recopilación de datos para que se análisis sea
más fácil, más preciso y más exacto, será preciso decir que para que haya una excelente gestión
de los datos es necesario contar con un experto en el campo y una adecuada infraestructura
tecnológica basada, entre otros referentes, en técnicas que posibiliten un correcto
almacenamiento y posterior análisis de los mismos.
Otro punto es mencionar que muchos estadísticos y analistas de datos participaron en el
desarrollo de entornos computacionales en dónde se incluía, por ejemplo, el Statistical Package
for Social Sciences (SPSS), ya que en la actualidad los datos son fuente de valor económico,
social y político, más si se trata de grandes volúmenes, se considera que forman parte de un bien
público que beneficia la transparencia y mejora la toma de decisiones, puntualizando que hay dos
objetivos en el análisis de estos datos: la predicción y la inferencia.
La predicción numérica es el proceso que intenta determinar los valores de una o varias
variables a partir de un conjunto de datos. La predicción de valores continuos puede planificarse
por las técnicas estadísticas de regresión, dicho brevemente es ser capaz de predecir cuáles serán
las respuestas a variables futuras, además entender la inferencia cómo la naturaleza está
asociando las diversas variables, habilidades necesarias para poder extraer, ordenar, analizar y
manipular estos datos.
Referencias
Donoho, D. (2017). 50 years of Data Science. Journal of Computational and Graphical
Statistics, 745-766.
García Nocetti, F. (01 de 05 de 2017). Ciencia de datos y big data. Obtenido de Nexos:
https://www.nexos.com.mx/?p=31892