Qué Es La Ciencia de Datos

Qué es la Ciencia de Datos?
La Ciencia de Datos es un campo interdisciplinario que involucra métodos

científicos, procesos y sistemas para extraer conocimiento o un mejor
entendimiento de datos en sus diferentes formas, ya sea estructurados o no
estructurados.
Es una continuación de algunos campos de análisis de datos como la estadística,

la minería de datos, el aprendizaje automático y el análisis predictivo. Comprende
tres áreas distintas y superpuestas: las habilidades de un estadístico que sabe
cómo modelar y resumir conjuntos de datos (los cuales cada vez tienen mayor
tamaño); las habilidades de un informático que pueda diseñar y utilizar algoritmos
para almacenar, procesar y visualizar eficientemente estos datos; Y la experiencia
sobre el campo o dominio, lo que podríamos pensar como una
formación clásica en un tema; la cual es necesaria tanto para formular las
preguntas correctas como para poner sus respuestas en contexto.
Un proyecto de ciencia de datos tiene los datos como su elemento central, sin datos no se
puede aplicar ninguna ciencia y, por lo tanto, no se puede lograr nada. Con esto pueden surgir
muchas preguntas como:
 ¿Por qué necesitamos los datos?

 ¿Qué tipo de datos se requieren?
 ¿Cómo obtener los datos?
 ¿Qué hacer con los datos?
Fuente
: quora
Ciclo vital:
Ciclo vital:
A continuación se muestra el proyecto Ciclo de vida de ciencia de datos / aprendizaje
automático.
1. Comprensión empresarial
La comprensión empresarial juega un papel muy importante en el éxito de cualquier proyecto,
ya que todo el ciclo de vida gira en torno al objetivo empresarial. Para adquirir los datos
correctos, debemos poder comprender el negocio. Hacer preguntas sobre el conjunto de datos
y un objetivo comercial adecuado ayudará a que el proceso de adquisición de datos sea
mucho más fácil.
2. Comprensión de datos
Después de la comprensión empresarial, el siguiente paso es la comprensión de los datos.
Este paso implica la recopilación de todos los datos disponibles. Si está trabajando en un
proyecto en tiempo real en su empresa, entonces, necesita trabajar en estrecha colaboración
con el equipo comercial, ya que saben qué datos están presentes, qué datos podrían usarse
para este problema comercial y otra información, o si tratando de construir su propio proyecto
de ciencia de datos / aprendizaje automático, puede
encontrar conjuntos de datos gratuitos en muchos sitios web disponibles.
Este paso implica describir los datos, su estructura, su tipo de datos y mucha otra información.
Explore los datos utilizando diagramas gráficos. Básicamente, extraer cualquier información
que pueda obtener sobre los datos simplemente explorando los datos.
3. Preparación de datos
Después del paso Comprensión de datos, el siguiente paso que viene en los pasos del ciclo
de vida es la Preparación de datos. Este paso también se conoce como limpieza
de datos o reorganización de datos. Incluye pasos como seleccionar los datos relevantes,
integrar los datos fusionando los conjuntos de datos, limpiarlos, manejar los valores faltantes
eliminándolos o imputarlos con datos relevantes, tratar los datos erróneos eliminándolos,
también verificar los valores atípicos y manejarlos . Construyendo nuevos datos, obtenga
nuevas características de las existentes mediante la ingeniería de características. Formatee
los datos en la estructura deseada, elimine columnas y características no deseadas. La
preparación de datos es la que lleva más tiempo, ya que toma hasta un 70% -90% del tiempo
total del proyecto, pero es el paso más importante en todo el ciclo de vida.
El análisis de datos exploratorios (EDA) juega un papel importante en esta etapa, ya que el
resumen de datos limpios ayuda a identificar la estructura, valores atípicos, anomalías y
patrones presentes en los datos. Estos conocimientos podrían ayudar a encontrar el conjunto
correcto de características, el algoritmo que se utilizará para la creación del modelo y la
construcción del modelo.
4. Modelado de datos
El modelado de datos se considera el corazón del análisis de datos. Un modelo toma los datos
preparados del paso anterior (preparación de datos) como entrada y proporciona la salida
deseada. Este paso incluye elegir el tipo apropiado de modelo, ya sea que el problema sea un
problema de clasificación, un problema de regresión o un problema de agrupamiento.
Después de elegir el modelo, entre los distintos algoritmos presentes. Necesitamos ajustar los
hiperparámetros de cada modelo para lograr el rendimiento deseado.
Al final, necesitamos evaluar el modelo midiendo la precisión (qué tan bien se desempeña el
modelo, es decir, describe los datos con precisión) y la relevancia (responde a la pregunta
original que se propone responder). También debemos asegurarnos de que haya un equilibrio
correcto entre el rendimiento y la generalización, lo que significa que el modelo creado no
debe estar sesgado y debe ser un modelo generalizado.
5. Implementación del modelo

El modelo, después de una evaluación rigurosa, finalmente se implementa en el formato y
canal deseados. Este es el paso final en el ciclo de vida de la ciencia de datos. Cada paso del
ciclo de vida de la ciencia de datos explicado anteriormente debe trabajarse con cuidado. Si
algún paso se ejecuta incorrectamente, afectará consecuentemente al paso siguiente y todo el
esfuerzo será en vano. Por ejemplo, si los datos no se recopilan correctamente, perderá
información y no podrá crear un modelo perfecto. Si los datos no se limpian correctamente, el
modelo no funcionará correctamente. Si el modelo no se evalúa correctamente, fallará en el
mundo real al dar un resultado perfecto. Desde la comprensión del negocio hasta la
implementación del modelo, cada paso debe recibir la atención, el tiempo y el esfuerzo
adecuados.
Todos los pasos anteriores hacen un proyecto completo de ciencia de datos, pero es un
proceso iterativo y se repiten varios pasos hasta que podamos ajustar la metodología para un
caso de negocios específico. Python y R son los lenguajes más utilizados para la ciencia de
datos.
¡Gracias!
Data Science
Es una combinación del método científico con las matemáticas, estadísticas,
programación especializada, análisis avanzado y la inteligencia artificial para narrar
historias y explicar la información de los datos.
Data Science extrae información procesable de grandes volúmenes de datos de las
organizaciones. Abarcando la preparación de datos para su análisis y presentación de
los resultados revelando patrones y permitiendo a los usuarios tomar decisiones
basadas en conclusiones informadas.
Para preparar los datos se implica limpiarlos, agregarlos y manipularlos con la
intención de que estén listos para los distintos tipos de procesamiento. Para el análisis
se requiere el desarrollo y uso de algoritmos, análisis y modelos de Inteligencia
Artificial (AI). Se impulsa por medio de un software el cual se encarga de encontrar
patrones dentro de los datos, y estos patrones se transforman en predicciones que
ayudan a la toma de decisiones empresariales.
Las predicciones se validan mediante pruebas y experimentos diseñados
científicamente. Los resultados arrojados son compartidos en organización a través de
herramientas de visualización de datos facilitando la comprensión e identificación de
tendencias.

Ciclo de vida de Data Science

El ciclo de vida de Data Science consta de 5 pasos esenciales los cuales se muestran
en el gráfico y se describen a continuación:
1. Capturar. – Consta de la recopilación de datos estructurados y no estructurados de
todas las fuentes relevantes por medio de cualquier método. Desde la entrada manual
y el respaldo web, hasta la captura de datos de sistemas y dispositivos en tiempo real.
2. Preparar y Mantener. – Se colocan los datos a procesar en un formato coherente
para los modelos de análisis, de Inteligencia Artificial (AI) o Deep Learnig.
3. Procesar. – Se examinan los sesgos, patrones, rangos y distribuciones de valores
en los datos, determinando los datos idóneos para análisis predictivos, de Inteligencia
Artificial (AI) y otros métodos analíticos.
4. Analizar. – Los data scientists realizan análisis estadísticos, predictivos,
de AI y Deep Learning entre otros, extrayendo información de los datos ya
preparados.
5. Comunicar. – La información es presentada en informes o paneles con gráficos y
visualizaciones de datos que facilitan la comprensión de los datos y el impacto que
estos tienen en la organización.

Beneficios de Data Science
Mejor toma de decisiones

Con Data Science se pueden extraer números y estadísticas, para crear modelos
predictivos que simulen gran variedad de posibilidades. Así las organizaciones pueden
decidir qué solución tomar para obtener los mejores resultados y realizar acciones
lógicas para mejorar el rendimiento.

Optimizar el producto y servicio

Ayuda a las empresas a entender como su producto o servicio se diferencia ante la
competencia por medio de la exploración de lo histórico, comparaciones con la
competencia y análisis de mercado. Proporcionando una profunda comprensión de la
respuesta del mercado con los productos o servicios de la empresa.

Determinar Público Objetivo

Todos los datos que una empresa puede recopilar de los clientes como “likes” o
reacciones en redes sociales, vistas a post en el sitio web o bien encuestas realizadas
por diferentes medios se pueden analizar para comprender con mayor eficacia las
necesidades de los clientes.
Data Science con esta información de los clientes, combina los datos generando
información eficaz para comunicarse con los clientes. Lo que significa que adapta los
servicios o productos a grupos particulares.
Conclusión
Al implementar Data Science en las organizaciones se puede mejorar
considerablemente la toma de decisiones, comprensión de comportamientos de
mercado, potencializar las campañas de marketing y las ventas.
Sin embargo, esta metodología mantiene un nivel de costo más alto que otras
soluciones al contar con personal con mayor preparación, por lo que es implementada
con mayor frecuencia en organizaciones con volúmenes de datos de gran tamaño.
Qué es la Ciencia de Datos?
De inicio, debemos partir de que la Ciencia se define como un conjunto ordenado de
conocimientos estructurados sistemáticamente. Y que este conocimiento se obtiene
mediante el método científico, cuyos pasos básicos son la observación, hipótesis,
experimentación y teoría. El término de “Ciencia de Datos” no es por sí sola una de las
grandes ciencias (como matemáticas o biología); dicho de una manera fría, se pretende
abarcar a un conjunto de herramientas (basadas en la ciencia) y habilidades (humanas e
informáticas) con un nombre muy atractivo.
La Ciencia de Datos (Data Science) es la extracción de conocimiento a partir de

grandes volúmenes de información estructurada o no estructurada. Es el proceso
que sigue a la “Minería de Datos” (que es la recolección y ordenación de los datos).
La Ciencia de Datos, tal y como la describe William S. Cleveland (1943–) en su artículo

“Data Science: An Action Plan for Expanding the Technical Areas of the Field of
Statistics”, debe ser multidisciplinar, formada de diversas ciencias donde la computación y
las matemáticas permitan afrontar los retos que supone el Big Data, debiendo entender el
término Big en un sentido amplio, ya que no se trata únicamente de un aumento
desmesurado de la cantidad de datos si no también de la complejidad de los modelos
necesarios para entenderlos. Esta multidisciplinariedad suele representarse en forma de
Diagrama de Venn donde la Ciencia de Datos se sitúa en intersección de tres conjuntos:
«Las Tres Patas».
Ventaja
La principal ventaja de usar Ciencia de Datos en una organización es el empoderamiento
y la facilitación en la toma de decisiones. Organizaciones que trabajan con científicos
de datos pueden tomar decisiones basadas en evidencias cuantificables con datos.7 ene.
2020
¿Cuál es la Ciencia de los datos y su objetivo?

La Ciencia de Datos tiene por objetivo encontrar la forma de sacar ventaja de
los datos. Este objetivo tiene dos vertientes, la primera es analizar
los datos existentes la segunda es conseguir los datos que se necesiten para
obtener dicha ventaja.
La ciencia de datos o Data Science se basa en 3 herramientas: la

programación; las matemáticas y estadística; y la experiencia en el
campo de estudio.29 ene. 2020
Científico de datos: sus 3 funciones principales
 Describir los datos (análisis descriptivo). Extraer conclusiones para
entender la realidad del entorno. ...
 Predecir qué pasará en el futuro (análisis predictivo). ...
 Prescribir (análisis prescriptivo).
Tendencias en IT: Ciencia de Datos o Data Science, Parte I
En la actualidad escuchamos mucho sobre como la inteligencia artificial y el
aprendizaje automático van a cambiar el mundo, y como el internet de las cosas
facilitará la vida de todos.
Pero ¿nos hemos puesto a pensar que es lo que sustenta todas estas tecnologías
revolucionarias?
Todo se centra en una sola cosa: los datos.
Desde las redes sociales, hasta los dispositivos IoT, generan una gran cantidad de
datos a considerar.
Podemos ver aplicaciones muy grandes, como Youtube o Facebook, y la mayoría
pertenecen a empresas “digitales” más grandes, y es que sus aliados más
grandes son los datos, los cuales son utilizados para obtener información útil y
resolver problemas.
Ahí es donde entra la ciencia de datos, la cual es el proceso utilizando los datos
para encontrar soluciones a problemas o predecir resultados.

Funcionamiento de la Ciencia de Datos
La ciencia de datos es un termino que puede llegar a ser un poco confuso para
alguien que no esté tan puesto en el área, de hecho, la ciencia de datos que se
introdujo por primera vez en la década de 1980, sigo siendo confusa para muchas
personas incluso en la actualidad.
El gran numero de personas, particular mente estas que están fuera del campo,
luchan por comprender cómo los científicos de datos ayudan a las empresas de
todo el mundo y se preguntan por qué sus servicios tienen una demanda tan alta.
Hay varias razones claves para que esto se así. En primer lugar, la ciencia de
datos es un campo interdisciplinario, sus verdaderos fundamentos están en la
estadística, las matemáticas, la informática, y en los negocios, por lo que es un
poco difícil identificar que cosas se encuentran en el ámbito de la ciencia de datos
y cuáles no.
En algunas ocasiones, las personas pueden pensar que la ciencia de datos y las
estadísticas son lo mismo, sin embargo, esto no es así, puesto que la ciencia de
datos es aún más amplia debido a que surge de la estadística e incluso otros
temas como los datos digitales y el big data.
Otro error frecuente es que la ciencia de datos y la inteligencia artificial son
términos intercambiables, pero no es así. A través de la IA es posible designar un
modelo, una máquina, y otros dispositivos para tratar de imitar el comportamiento
de los seres humanos y producir decisiones similares a las humanas.
En ocasiones la IA aprovecha métodos de la ciencia de datos tales como el

aprendizaje profundo o Deep Learning, pero no se limita únicamente a ello, por
ejemplo, dentro de la IA también tenemos el razonamiento simbólico que no
necesariamente debe clasificarse como ciencia de datos.
El dominio del Machine Learning, el Deep Learning y las estadísticas son

importantes dentro de la Ciencia de Datos. Es por esto por lo que la Ciencia de
Datos es una disciplina que continúa expandiéndose con nuevas necesidades
relacionadas con los datos,
Aspectos importantes del trabajo de los Científicos de Datos.
Dentro de los aspectos importantes del trabajo que tienen los científicos de datos
están los siguientes:
1. El tipo de datos usados
2. Actividades realizadas en el trabajo
3. Asignación del tiempo
4. Habilidades claves
5. Métodos usados frecuentemente en la Ciencia de Datos

CICLO DE VIDA EN LA CIENCIA DE DATOS: QUE PASOS
SEGUIR EN UN PROYECTO
1. COMPRENSIÓN DEL PROBLEMA O EL NEGOCIO

Antes que nada, en el comienzo de un proyecto es esencial entender cual es el problema que estamos
buscando resolver o cual es la pregunta que queremos responder. Este paso nos servirá para planificar el
resto, una vez sabemos lo que buscamos, podemos pensar que datos son interesantes y que modelo nos
ayudará mejor a responder nuestra pregunta o a resolver nuestro problema.
Para asegurarnos de que estamos listos para continuar, deberiamos poder responder o tener claros los
siguientes puntos:
 Tener un problema o pregunta completamente definida.
 Desglosar lo identificado en el punto anterior en las diferentes variables que nos ayudaran a
dar una solución final.
 Fijar las condiciones de contorno de nuestro proyecto, normalmente tendremos limitaciones
de recursos, dinero, tiempo, etc. que afectarán a la resolución del proyecto.
 Quienes son las partes interesadas en nuestro proyecto, a veces seremos solamente nosotros
mismos, otras puede ser la audiencia del articulo que queremos escribir, o otro departamento de nuestra
empresa que vaya a ser el usuario final del producto, etc.
2. OBTENCIÓN DE LOS DATOS
Una vez las condiciones y el objetivo están claros, estamos en posición de empezar el proyecto. Y como
no podía ser de otra forma en un estudio de ciencia de datos, para empezar, necesitamos los datos. En
este paso debemos determinar que datos necesitamos, donde podemos conseguirlos y que recursos son
necesarios. Es completamente distinto extraer nuestros datos de bases de datos estáticas en formatos
como CSV que usar una API para obtener datos en streaming de una web o aplicación. No solo desde el
punto de vista de la dificultad, sino del coste económico o de recursos computacionales.
Este paso suele ser iterativo, es decir, en distintos momentos del ciclo nos encontraremos en
la situación de que tenemos que volver a la obtención de datos. Las razones para ello pueden ser bastante
variadas, por ejemplo encontrar que los datos obtenido no eran los esperados o la calidad insuficiente, o
que no son adecuados para el modelo que queremos aplicar, etc.
3. TRATAMIENTO DE LOS DATOS
Generalmente, los datos obtenidos en el paso anterior no están listos para ser usados. Pueden tener
valores o formatos erróneos, valores inexistentes, etc. Por lo tanto este proceso se compone de diferentes
actividades, desde seleccionar los datos relevantes o identificar y resolver valores erróneos o inexistentes
hasta unificar diferentes tablas, con diferentes dimensiones, para generar nuestro dataset final.
Normalmente el tratamiento de los datos es la parte que consume mas tiempo y además la mas aburrida
de los proyectos de ciencia de datos. Aunque también es una de las mas importantes, ya que sin unos
datos ordenados y de calidad, seria imposible llegar a generar resultados o modelos con sentido.
4. ANÁLISIS EXPLORATORIO DE LOS DATOS
El análisis exploratorio de los datos es en cierto modo parte del tratamiento de los datos. Consiste en
estudiar los datos que tenemos, buscando tendencias y relaciones entre las
variables, creando gráficos, identificando las principales figuras estadísticas (medias,
desviaciones típicas, cuartiles, etc.), el objetivo es entender mejor los datos para poder planificar la fase
de modelado.
5. MODELADO
El modelado de los datos se considera la parte central de nuestro proyecto, es donde realmente
aportamos valor a los datos ya existentes. Explicado de forma muy simple, buscamos
que al introducir en nuestro modelo los datos preparados durante los pasos anteriores, nos de el resultado
deseado y suficiente como para solucionar el problema o responder a las preguntas identificadas en la
primera etapa.
Dependiendo del tipo de problema deberemos elegir entre los diferentes tipos de modelos, algoritmos,
etc. Para después afinar los parámetros específicos de cada modelo y así poder llegar a niveles
de precisión y relevancia necesarios. También es muy importante encontrar un buen balance entre
rendimiento y generalización, debemos evitar introducir sesgos artificialmente.
6. EVALUACIÓN DEL MODELO
En este apartado es donde ponemos a prueba el modelo que hemos desarrollado en el paso anterior.
Aplicaremos datos nuevos y reales al modelo y comprobaremos que los resultados son los
esperados y resuelven nuestros problemas dentro de unos estándares de calidad. Este es uno de los
puntos críticos del desarrollo del proyecto, es donde ponemos a prueba todas las etapas anteriores. Si
hemos cometido fallos o no hemos obtenido datos de calidad suficiente, nos sera imposible llegar a los
resultados que buscamos, entonces será inevitable tener que volver atrás y repetirlos.
7. VISUALIZACIÓN DE LOS RESULTADOS
El ultimo paso en nuestro proyecto será, como es lógico, mostrar nuestros resultados.
Aunque habitualmente pasa por un trabajo de visualización, no siempre es así, dependerá mucho de cada
proyecto. En algunos, lo mas importante será crear un “dashboard” donde poder visualizar
dinámicamente los resultados, en otros el objetivo final será una visualización estática que dé respuesta a
nuestras preguntas, etc.
A partir de aquí daríamos por finalizado el ciclo de este análisis o proyecto, pero todo no termina aquí. A
veces, el fin de un ciclo dará comienzo a otro, donde buscaremos mejorar los resultados o añadir nuevas
especificaciones, otras veces simplemente entraremos en una fase de mantenimiento, donde el trabajo se
centrará en mantener en funcionamiento el producto y otras, simplemente habrá terminado nuestro
trabajo.
LA GESTIÓN DEL CICLO DE VIDA DE LOS DATOS

La gestión del ciclo de vida de los datos, conocida también como Database Lifecycle
Management (DLM), consiste en la realización y/o mejora de una base de datos y todo lo que ésta
abarca desde un enfoque técnico y empresarial, de forma que se puedan tratar y gestionar los datos de
una determinado forma, dándoles así un valor y utilidad que pueda ser aplicado en empresas y
organizaciones.
Un DLM hace énfasis en los distintos aspectos que se encuentran relacionados con los datos: el diseño
de la arquitectura, el desarrollo de la base de datos, los procesos que experimenta un dato en una
determinada empresa, sus medidas de seguridad y su forma de almacenaje, etc.
Así pues, una correcta gestión del ciclo de vida de los datos otorga una serie de ventajas significativas:
ayuda a que los procesos organizacionales sean más sencillos de planificar y ejecutar y a que la
identificación y optimización de las oportunidades y recursos sea una realidad.
Los datos objetivos son la única y mejor forma de hacer que un indicador mida y controle que todo va
acorde con lo planificado, siendo así la base fundamental para el apoyo en la toma de decisiones clave de
una empresa u organización.
Un ciclo de vida de los datos está compuesto por distintas fases:

Creación y captura

Esta primera fase en la gestión del ciclo de vida de los datos consiste en la creación y captura de
aquellos que eran virtualmente no existentes en la empresa. Existen diversas formas para adquirir datos,
destacándose tres de las más usadas:
 Conseguir datos ya existentes que han sido creados por entes ajenos a tu negocio.
 Creación de datos por parte del factor humano y/o dispositivos de tu propio negocio.
 Obtención de datos por parte de dispositivos a través del conocido Internet de las Cosas (IoT).
Este tipo de datos son muy importantes para la infraestructura de sistemas de información de una
empresa.

Transmisión, almacenamiento y seguridad

Una vez que los datos han sido creados o capturados, éstos deben ser capaces de moverse, guardarse y
que estén seguros. Todos estos aspectos son de una gran importancia y se encuentran razonados por los
siguientes motivos:
 Transmisión. De la misma manera que puedes conseguir una vía de transmisión entre los datos
ajenos a tu negocio y traerlos, estos mismos datos deben ser capaces de moverse según las necesidades
de la empresa, independientemente de si se trata de un movimiento interno organizacional o externo.
 Almacenamiento. Los datos ocupan un espacio y deben de ser almacenados en unos
repositorios adecuados para ellos, las bases de datos. Esta característica es clave puesto que la
organización, acceso y control de datos es indispensable para el correcto funcionamiento de una empresa
hoy día.
 Seguridad. Los datos contienen información privada útil para las organizaciones, surgiendo así
la necesidad de establecer diversos sistemas y elementos de seguridad para ayudar a que éstos no puedan
ser sustraídos, o incluso si lo fuesen, para que fuesen ilegibles y no se pueda acceder a la información
por parte de personas no autorizadas.
Gestión y trabajo colaborativo

Los datos deben de poder ser gestionados por determinados usuarios en un ciclo de vida de los datos.
Debe existir uno o varios usuarios que sean capaz de acceder a diversos datos almacenados en la base de
datos para poder interactuar con ellos: mover, realizar copias, exportar, dar o eliminar accesos para
otros usuarios, etc.
Especialmente, si se plantea una forma de trabajo colaborativo, muy estandarizada en la actualidad.
Los miembros de un determinado equipo o departamento necesitan tener acceso a una serie de datos con
el fin de poder desempeñar sus tareas y funciones pertinentes, ya que de lo contrario
la productividad estaría paralizada.

Análisis y explotación de los datos aplicado al negocio

Por último, muchos datos contienen una información de un carácter bruto. Una correcta gestión del ciclo
de vida de los datos tiene presente que los datos deben de poder ser tratados o refinados con la
intención de transformar la información en un conocimiento útil y valioso para la empresa.
Estos procesos de tratamiento de los datos son vitales y se emplea generalmente software por las
facilidades que aporta y por los enormes volúmenes de datos que se generan en las organizaciones, de
forma que los analistas puedan estudiar las grandes cantidades de información y plasmar las ideas y
resultados en forma de un conocimiento asequible que apoye principalmente a las mediciones y
controles de lo planificado por parte de un negocio y a la posterior toma de
decisiones correspondiente.
Desde Clase10 queremos ayudarte y asesorarte con cualquier duda o pregunta que tengas, por lo que te
animamos a que a través del siguiente enlace contactes con nosotros.
COMPARTIR:

Qué Es La Ciencia de Datos

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Qué Es La Ciencia de Datos

Cargado por

Copyright:

Formatos disponibles

Qué es la Ciencia de Datos?

La Ciencia de Datos es un campo interdisciplinario que involucra métodos

Es una continuación de algunos campos de análisis de datos como la estadística,

 ¿Por qué necesitamos los datos?

5. Implementación del modelo

Ciclo de vida de Data Science

Mejor toma de decisiones

Optimizar el producto y servicio

Determinar Público Objetivo

La Ciencia de Datos (Data Science) es la extracción de conocimiento a partir de

La Ciencia de Datos, tal y como la describe William S. Cleveland (1943–) en su artículo

¿Cuál es la Ciencia de los datos y su objetivo?

La ciencia de datos o Data Science se basa en 3 herramientas: la

En ocasiones la IA aprovecha métodos de la ciencia de datos tales como el

El dominio del Machine Learning, el Deep Learning y las estadísticas son

Aspectos importantes del trabajo de los Científicos de Datos.

1. COMPRENSIÓN DEL PROBLEMA O EL NEGOCIO

LA GESTIÓN DEL CICLO DE VIDA DE LOS DATOS

Transmisión, almacenamiento y seguridad

Análisis y explotación de los datos aplicado al negocio

También podría gustarte