Está en la página 1de 3

Asignatura Datos del estudiante Fecha

Tópicos avanzados Apellidos: Caceres Tapia


en ingeniería de 17 de juio
software Nombre: Carlos humberto

Actividad
Protocolo individual de la unidad n°: 1

Análisis y síntesis: 
Síntesis e interpretación personal de los temas vistos en la unidad

¿Qué es la ciencia de datos?

Data Science o ciencia de datos es una disciplina científica centrada en el análisis de grandes
fuentes de datos para extraer información, comprender la realidad y descubrir patrones con los
que tomar decisiones.
Para conseguir convertir esa información no estructurada o estructurada en contenido de valor,
el Data Science combina herramientas de la matemática, estadística y/o informática, para que,
con todo ello, pueda llegar a cumplir su objetivo, la optimización de la toma de decisiones.

Se encarga de estudiar de dónde viene la información, qué representa y cómo se puede


convertir en un recurso valioso en la creación de negocios y estrategias. Para ello, busca extraer
grandes cantidades de datos para identificar patrones para ayudar a una organización a
controlar los costes, aumentar la eficiencia, reconocer nuevas oportunidades de mercado y
aumentar la ventaja competitiva de la organización.
El Data Science emplea las disciplinas de las matemáticas, estadística y las ciencias de la
computación. Además, se incorporación de técnicas como el machine learning(aprendizaje
automático), cluster analysis(análisis de grupos), Data Mining(extracción de datos) y la
visualización.

Principales beneficios del Data Science

El principal beneficio del Data Science en una organización es la facilidad para tomar decisiones.
Las organizaciones con Data Scientists pueden incluir evidencia cuantificable basada en datos
en sus decisiones comerciales. Estas decisiones basadas en datos pueden, en última instancia,
llevar a una mayor rentabilidad y una mejor eficiencia operativa, rendimiento comercial y flujos
de trabajo. En las organizaciones orientadas al cliente, el Data Science ayuda a identificar y
refinar las audiencias objetivo.

Por otra parte, el Data Science también puede ayudar al reclutamiento. El procesamiento interno
de aplicaciones y las pruebas de aptitud basadas en datos y los juegos pueden ayudar al equipo
de recursos humanos de una organización a realizar selecciones más rápidas y precisas durante
el proceso de contratación.

Los beneficios específicos del Data Science varían según el objetivo de la empresa y la
industria. Los departamentos de ventas y marketing, por ejemplo, pueden extraer datos de
clientes para mejorar las tasas de conversión o crear campañas de marketing uno a uno. Las
instituciones bancarias están extrayendo datos para mejorar la detección de fraudes. Las
empresas de envío utilizan el Data Science para encontrar las mejores rutas, horarios y mejores
Asignatura Datos del estudiante Fecha
Tópicos avanzados Apellidos: Caceres Tapia
en ingeniería de 17 de juio
software Nombre: Carlos humberto

modos de transporte.
Sin embargo, el Data Science todavía es un campo emergente dentro de la empresa. La
identificación y el análisis de grandes cantidades de datos no estructurados pueden resultar
demasiado complejos, costosos y lentos para las empresas.

¿Cuál es la diferencia entre data science, inteligencia artificial y aprendizaje automático?

Para comprender mejor la ciencia de datos y cómo se puede aprovechar, es igualmente


importante conocer otros términos relacionados con este ámbito, como inteligencia artificial (IA) y
el aprendizaje automático. A menudo, encontrará que estos términos se usan indistintamente,
pero hay matices.

 IA significa hacer que un ordenador imite el comportamiento humano de alguna manera.


 La ciencia de datos es un subapartado de la IA que aborda principalmente las áreas
interconectadas de estadísticas, métodos científicos y análisis de datos, todas las cuales
se utilizan para extraer significado y conocimientos a partir de los datos.
 El aprendizaje automático es otro subapartado de la IA y se fundamenta en técnicas que
permiten a las computadoras averiguar cosas a partir de los datos y ofrecer aplicaciones
de IA.
 El aprendizaje profundo es un subapartado del aprendizaje atuomático que permite a los
equipos informáticos resolver problemas más complejos.

Cómo se lleva a cabo la data science

El proceso de analizar y utilizar los datos es iterativo en lugar de lineal, pero este es el modo en
que el ciclo de vida de data science fluye normalmente en un proyecto de modelado de datos:

Planificación: define un proyecto y sus posibles resultados.

Crear un modelo de datos: los científico de datos a menudo usan diversas bibliotecas de
código abierto o herramientas incluidas en la base de datos para construir modelos de
aprendizaje automático. Con frecuencia, los usuarios querrán que las API ayuden con la
ingestión de datos, la visualización y creación de perfiles de datos o la ingeniería de funciones.
Necesitarán herramientas adecuadas, así como acceso a los datos correctos y otros recursos,
como el poder de computación.

Evaluación de un modelo: los científico de datos deben lograr que sus modelos ofrezcan un
elevado porcentaje de precisión para tener confianza en que se pueden implementar. La
evaluación del modelo generalmente generará un conjunto completo de métricas de evaluación y
visualizaciones para medir el rendimiento del modelo frente a nuevos datos, y también
clasificarlos a lo largo del tiempo a fin de lograr un comportamiento óptimo en producción. La
evaluación del modelo va más allá del rendimiento y tiene en cuenta el comportamiento base
esperado.
Explicación de modelos: ser capaz de explicar la mecánica interna de los resultados de los
modelos de aprendizaje automático en términos humanos no siempre ha sido posible, pero es
cada vez más importante. Los científico de datoss quieren explicaciones automatizadas de la
ponderación relativa y la importancia de los factores que intervienen en la generación de una
Asignatura Datos del estudiante Fecha
Tópicos avanzados Apellidos: Caceres Tapia
en ingeniería de 17 de juio
software Nombre: Carlos humberto

predicción, así como detalles explicativos específicos sobre las predicciones del modelo.

Discusión: 
Dudas, desacuerdos, discusiones

También podría gustarte