Está en la página 1de 5

Instituto Politécnico Nacional

Escuela Superior de Cómputo

LICENCIATURA EN CIENCIA DE DATOS


Introducción a la ciencia de datos

ENSAYO DE LA CIENCIA DE DATOS


MARTÍNEZ SALINAS EMILIANO
1AV2

17 de octubre de 2023
¿Qué es la ciencia de datos?

La ciencia de datos implica el análisis científico de los datos para adquirir


conocimientos significativos. Esta disciplina integra diversas áreas para
extraer conclusiones de grandes conjuntos de datos, permitiendo tomar
decisiones fundamentadas y realizar predicciones precisas. Profesionales
como científicos de datos, analistas de datos, arquitectos de datos, ingenieros
de datos, estadísticos, administradores de bases de datos y analistas de
negocios colaboran en este campo dinámico.

La demanda de la ciencia de datos está creciendo de forma vertiginosa a


medida que la cantidad de datos aumenta exponencialmente. Las empresas
confían cada vez más en el análisis de datos para impulsar ingresos e
innovación. Por ejemplo, con la digitalización de las interacciones
empresariales, se generan más datos, lo que abre nuevas oportunidades para
personalizar experiencias, mejorar la satisfacción del cliente, crear productos
innovadores y aumentar las ventas. Además, en contextos empresariales y
otros entornos, la ciencia de datos tiene el potencial de abordar los desafíos
más complejos del mundo.

¿Qué hace un científico de datos?

Un científico de datos se encarga de recopilar, analizar e interpretar


macrodatos para descubrir patrones e información, hacer predicciones y
desarrollar planes de acción. Los macrodatos se definen como conjuntos de
datos con una mayor variedad, volumen y velocidad que los métodos de
administración de datos anteriores no podían manejar. Los científicos de
datos trabajan con varios tipos de macrodatos, incluyendo:

• Datos estructurados: Estos datos se organizan típicamente en filas y


columnas e incluyen palabras y números, como nombres, fechas e
información de tarjetas de crédito. Por ejemplo, un científico de datos
en el sector de servicios públicos podría analizar tablas de datos de uso
y generación de energía para reducir costos y detectar patrones que
podrían provocar errores en los equipos.
• Datos no estructurados: Estos datos no están organizados e incluyen
texto en archivos de documentos, datos de dispositivos móviles y redes
sociales, contenido de sitios web y vídeos. Por ejemplo, un científico de
datos en el sector minorista podría mejorar la experiencia del cliente
analizando notas no estructuradas del centro de llamadas, correos
electrónicos, encuestas y publicaciones en redes sociales.

Además, las características del conjunto de datos se pueden describir como


cuantitativas (datos numéricos estructurados) o cualitativas/categóricas
(datos que no se representan mediante valores numéricos y se agrupan en
categorías). Es crucial que los científicos de datos comprendan el tipo de
datos con los que trabajan, ya que esto afecta directamente al análisis que
realizan y a los tipos de gráficos que pueden usar para visualizar los datos.

Para extraer información de estos datos, los científicos de datos utilizan


habilidades en:

1. Programación informática: Los científicos de datos escriben consultas


utilizando lenguajes como Julia, R o Python para extraer datos de las bases de
datos de sus empresas. Python es popular debido a su facilidad de
aprendizaje y uso, incluso para personas sin experiencia en codificación.
Además, ofrece módulos de ciencia de datos precompilados para el análisis
de datos.

2. Matemáticas, estadísticas y probabilidad: Estas habilidades son


fundamentales para analizar datos, probar hipótesis y crear modelos de
aprendizaje automático, que los científicos de datos utilizan para reconocer
patrones específicos. Utilizan modelos de aprendizaje automático entrenados
para detectar relaciones en los datos, hacer predicciones y encontrar
soluciones a problemas. Además, en lugar de crear modelos desde cero,
pueden utilizar modelos de aprendizaje automático preentrenados para
acceder rápidamente a soluciones prácticas.

3. Conocimientos de dominio: Para transformar datos en información


relevante que impulse los resultados empresariales, los científicos de datos
necesitan comprender el sector y la empresa en los que trabajan..
Proceso de la ciencia de datos

Los científicos de datos siguen un proceso estructurado para completar sus


proyectos:

- Definir el problema: Colaboran con las partes interesadas para definir


el problema o la pregunta empresarial, junto con los objetivos del
proyecto.

- Definir el enfoque analítico: Eligen entre enfoques descriptivos,


diagnósticos, predictivos o prescriptivos según el problema
empresarial.

- Obtener los datos: Identifican y adquieren los datos necesarios, ya sea


consultando bases de datos internas, extrayendo información de la
web o adquiriendo datos externos.

- Limpiar los datos: Organizan y depuran los datos para prepararlos para
el análisis, asegurándose de que estén en el mismo formato y
eliminando datos innecesarios.

- Explorar los datos: Utilizan técnicas estadísticas y análisis para


descubrir relaciones y patrones en los datos. Esto implica análisis
detallado y visualización interactiva usando herramientas como Python
y R en entornos como Jupyter Notebooks.

- Modelar los datos: Crean y entrenan modelos utilizando algoritmos de


Machine Learning, ajustando los hiperparámetros para mejorar el
rendimiento. Seleccionan algoritmos basados en las necesidades del
problema y los requisitos del escenario de ciencia de datos.

- Implementar el modelo: Entregan el modelo final con documentación y


lo implementan en producción después de pruebas exhaustivas para su
uso en la toma de decisiones empresariales.
- Visualizar y comunicar los resultados: Utilizan herramientas de
visualización como Power BI y Tableau para generar visualizaciones
claras y comprensibles, facilitando la comunicación de los resultados a
audiencias no técnicas. Además, emplean cuadernos de ciencia de
datos en línea para colaborar y compartir información durante todo el
proceso.

Este proceso estructurado permite a los científicos de datos transformar


datos complejos en información significativa y, finalmente, en acciones
empresariales informadas.

Referencias:

https://azure.microsoft.com/es-mx/resources/cloud-computing-
dictionary/what-is-data-science

https://datascience.uc.cl/que-es-ciencia-de-datos

https://www.maximaformacion.es/blog-dat/que-es-la-ciencia-de-datos/

También podría gustarte