Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Actividad
Protocolo individual de la unidad n°: 1
Análisis y síntesis:
Síntesis e interpretación personal de los temas vistos en la unidad
Data Science o ciencia de datos es una disciplina científica centrada en el análisis de grandes
fuentes de datos para extraer información, comprender la realidad y descubrir patrones con los
que tomar decisiones.
Para conseguir convertir esa información no estructurada o estructurada en contenido de valor,
el Data Science combina herramientas de la matemática, estadística y/o informática, para que,
con todo ello, pueda llegar a cumplir su objetivo, la optimización de la toma de decisiones.
El principal beneficio del Data Science en una organización es la facilidad para tomar decisiones.
Las organizaciones con Data Scientists pueden incluir evidencia cuantificable basada en datos
en sus decisiones comerciales. Estas decisiones basadas en datos pueden, en última instancia,
llevar a una mayor rentabilidad y una mejor eficiencia operativa, rendimiento comercial y flujos
de trabajo. En las organizaciones orientadas al cliente, el Data Science ayuda a identificar y
refinar las audiencias objetivo.
Por otra parte, el Data Science también puede ayudar al reclutamiento. El procesamiento interno
de aplicaciones y las pruebas de aptitud basadas en datos y los juegos pueden ayudar al equipo
de recursos humanos de una organización a realizar selecciones más rápidas y precisas durante
el proceso de contratación.
Los beneficios específicos del Data Science varían según el objetivo de la empresa y la
industria. Los departamentos de ventas y marketing, por ejemplo, pueden extraer datos de
clientes para mejorar las tasas de conversión o crear campañas de marketing uno a uno. Las
instituciones bancarias están extrayendo datos para mejorar la detección de fraudes. Las
empresas de envío utilizan el Data Science para encontrar las mejores rutas, horarios y mejores
Asignatura Datos del estudiante Fecha
Tópicos avanzados Apellidos: Caceres Tapia
en ingeniería de 17 de juio
software Nombre: Carlos humberto
modos de transporte.
Sin embargo, el Data Science todavía es un campo emergente dentro de la empresa. La
identificación y el análisis de grandes cantidades de datos no estructurados pueden resultar
demasiado complejos, costosos y lentos para las empresas.
El proceso de analizar y utilizar los datos es iterativo en lugar de lineal, pero este es el modo en
que el ciclo de vida de data science fluye normalmente en un proyecto de modelado de datos:
Crear un modelo de datos: los científico de datos a menudo usan diversas bibliotecas de
código abierto o herramientas incluidas en la base de datos para construir modelos de
aprendizaje automático. Con frecuencia, los usuarios querrán que las API ayuden con la
ingestión de datos, la visualización y creación de perfiles de datos o la ingeniería de funciones.
Necesitarán herramientas adecuadas, así como acceso a los datos correctos y otros recursos,
como el poder de computación.
Evaluación de un modelo: los científico de datos deben lograr que sus modelos ofrezcan un
elevado porcentaje de precisión para tener confianza en que se pueden implementar. La
evaluación del modelo generalmente generará un conjunto completo de métricas de evaluación y
visualizaciones para medir el rendimiento del modelo frente a nuevos datos, y también
clasificarlos a lo largo del tiempo a fin de lograr un comportamiento óptimo en producción. La
evaluación del modelo va más allá del rendimiento y tiene en cuenta el comportamiento base
esperado.
Explicación de modelos: ser capaz de explicar la mecánica interna de los resultados de los
modelos de aprendizaje automático en términos humanos no siempre ha sido posible, pero es
cada vez más importante. Los científico de datoss quieren explicaciones automatizadas de la
ponderación relativa y la importancia de los factores que intervienen en la generación de una
Asignatura Datos del estudiante Fecha
Tópicos avanzados Apellidos: Caceres Tapia
en ingeniería de 17 de juio
software Nombre: Carlos humberto
predicción, así como detalles explicativos específicos sobre las predicciones del modelo.
Discusión:
Dudas, desacuerdos, discusiones