Está en la página 1de 4

MAESTRÍA EN

GESTIÓN DE
TECNOLOGÍAS DE LA
INFORMACIÓN Y LA
COMUNICACIÓN

Actividad 1:
50 years of Data Science.

ASIGNATURA:
Big Data
Dr. Emmanuelle Ruelas Gómez.

José María Contreras González


contreras.jose52@uabc.edu.mx
ABRIL DE 2022
José María Contreras González
Docente: Dr. Emmanuelle Ruelas Gómez
Big Data Science
7 de Abril de 2022.

50 years of Data Science.

En la actualidad existen más de 3,000 millones de personas conectadas a Internet y más


de 7,000 millones de usuarios de telefonía celular en el mundo, por ello es relevante investigar la
reciente y monumental avalancha de información, la Ciencia de Datos es todavía aún
desconocida, probablemente muchos no sabrían construir un concepto de ella, quizás otros tantos
se atreverían a comentar que se trata de un término técnico y solo unos cuantos atinarían a decir
que se trata de la cantidad masiva de datos derivada de la creciente ola tecnológica.

Si continuase el ejercicio probablemente se señalaría un mayor énfasis en la preparación


y presentación de datos en lugar de el empleo de modelos estadístico, sin embargo, hay que
aclarar que se presenta un énfasis en la predicción en lugar de la inferencia, es por ello que
surgen las siguientes interrogantes: ¿es la Ciencia de Datos muy diferente de la Estadística?, ¿por
qué es necesaria la Ciencia de Datos cuando se ha tenido por años a la Estadística?, ¿es la
Ciencia de Datos un “cambio de marca”?.

Con respecto al volumen de la información, éste ha crecido a un ritmo sin precedentes


haciéndose más complejo su manejo y análisis, así mismo desde las grandes corporaciones hasta
el ciudadano promedio han tenido que avanzar al mismo ritmo creando y utilizando métodos
para su compresión, por ejemplo la Universidad de Michigan anunció una iniciativa de Ciencia
de Datos que involucraba la contratación de nuevos docentes, ya que toda la ciencia en sí misma
pronto se convertirá en datos que se pueden extraer.

De acuerdo con (García, 2017), define el Big Data como “un gran volumen, velocidad o
variedad de información que demanda formas costeables e innovadoras de procesamiento de
información que permitan ideas extendidas, toma de decisiones y automatización del proceso”,
para ilustrar esta idea se complementa con la idea de que la Ciencia de Datos se ha convertido en
un enfoque para el descubrimiento científico, basta pensar en la cantidad de personas que pasan
por los controles de seguridad en los aeropuertos del mundo, los registros de ello en las cámaras
de vigilancia o las transacciones bancarias para dimensionar el enorme flujo de generación de
datos.

Siendo más específico hay una controversia entre la Ciencia de Datos y la Estadística, ya
que en concreto las estadísticas son una parte de lo que sucede en la Ciencia de Datos, y ésta se
ocupa de datos realmente grandes, que los mismos recursos informáticos no podrían acomodar ni
analizar, cabe señalar que el volumen, variedad y velocidad son los atributos técnicos que pueden
ayudar a definir a la Ciencia de Datos, así por ejemplo para 2014 se crearon 4.4 millones de
trabajos de Big Data y únicamente se posicionaron la tercera parte de ellos, en lo que toca a el
análisis de datos y las estadísticas, son habilidades ampliamente aplicables y transferibles de una
organización a otra.

De manera puntual hay que cuestionarse ¿cómo procesar y analizar esos volúmenes de
información? Explorar esta idea hace necesario conocer la evolución que han tenido las bases de
datos y de esta manera comprender la forma en la que se almacena y organiza la información, en
primer lugar porque la explotación de los datos puede ser una de las principales preocupaciones
de todas las organizaciones, para comprender mejor es preciso señalar que Big Data ha
propiciado la aparición de la Ciencia de los Datos, término que hace referencia al conjunto de
tecnologías y técnicas necesarias para el tratamiento de la información masiva desde los puntos
de vista estadístico e informático, resolviendo al tiempo el problema de almacenamiento de los
datos.

De forma similar, el futuro del análisis de datos involucra procedimientos, técnicas para
interpretar los resultados, formas de planificar la recopilación de datos para que se análisis sea
más fácil, más preciso y más exacto, será preciso decir que para que haya una excelente gestión
de los datos es necesario contar con un experto en el campo y una adecuada infraestructura
tecnológica basada, entre otros referentes, en técnicas que posibiliten un correcto
almacenamiento y posterior análisis de los mismos.
Otro punto es mencionar que muchos estadísticos y analistas de datos participaron en el
desarrollo de entornos computacionales en dónde se incluía, por ejemplo, el Statistical Package
for Social Sciences (SPSS), ya que en la actualidad los datos son fuente de valor económico,
social y político, más si se trata de grandes volúmenes, se considera que forman parte de un bien
público que beneficia la transparencia y mejora la toma de decisiones, puntualizando que hay dos
objetivos en el análisis de estos datos: la predicción y la inferencia.

La predicción numérica es el proceso que intenta determinar los valores de una o varias
variables a partir de un conjunto de datos. La predicción de valores continuos puede planificarse
por las técnicas estadísticas de regresión, dicho brevemente es ser capaz de predecir cuáles serán
las respuestas a variables futuras, además entender la inferencia cómo la naturaleza está
asociando las diversas variables, habilidades necesarias para poder extraer, ordenar, analizar y
manipular estos datos.

De forma semejante se ubica a la cultura del “Modelado Generativo” que busca


desarrollar modelos estocásticos que se ajusten a los datos y luego haga inferencias sobre el
mecanismo de generación de los datos, en cambio la cultura del “Modelado Predictivo” prioriza
la predicción empleando para ello la disciplina del Machine Learning en su epicentro, el
aprendizaje autónomo es por esto un campo de rápido crecimiento.

Referencias
Donoho, D. (2017). 50 years of Data Science. Journal of Computational and Graphical
Statistics, 745-766.
García Nocetti, F. (01 de 05 de 2017). Ciencia de datos y big data. Obtenido de Nexos:
https://www.nexos.com.mx/?p=31892

También podría gustarte