Está en la página 1de 18

El impacto de los datos en el negocio

Introducción

En los negocios digitales los datos ocupan un rol central. Necesitamos capturar,
almacenar, procesar, utilizar y tomar decisiones basados en datos reales. Lo importante
es convertir esos datos en acciones. Basado en los datos que tengo, definir las acciones
que puedo tomar para conseguir un objetivo.

Nos permiten acceder a una ventaja competitiva considerable. Los datos son un activo
muy importante dentro de la empresa.

Big Data

Es una solución tecnológica que engloba tantos conceptos puramente tecnológicos


como conceptos de negocios. Entre los primeros, se encuentran nociones de
escalabilidad, entornos distribuidos, procesamiento en paralelo, arquitecturas,
frameworks, lenguajes, Python. Entre los segundos, se hallan las campañas, la
visualización de datos, las soluciones de marketing, la automatización, los KPI, las
métricas de negocio. Hablar de Big Data implica un amplio espectro de soluciones para
la empresa.

Según Viktor Mayer-Schönberger y Kennet Cukier son datos que nos ayudan a
extraer nuevas percepciones o crear nuevas formas de valor.

El Big Data consiste en analizar todos los datos que se generan dentro y fuera de la
empresa, separar lo que es relevante de lo que no y trabajar para crear
información que permita tomar mejores decisiones. Transforma grandes
volúmenes de datos en inteligencia.

Primero, se deben identificar los requisitos del negocio. Luego, adaptar la


infraestructura, las fuentes de datos y la analítica a fin de respaldar la oportunidad de
negocio.

Si bien, las empresas realizan trabajos de Big Data hace años, en esta era es distinto por:

 La digitalización de todo. Gracias a ella hay nuevos tipos de datos y por todos
lados. La mayoría son datos no normalizados: geoespaciales, generados por
sensores, tradicionales y estructurados.
 Las tecnologías y técnicas de análisis avanzados permiten extraer conocimiento
de los datos con sofisticación, velocidad y precisión.

El primer desafío de Big Data: Entender si un problema de negocios necesita de Big


Data, y para eso entender cómo es una solución de Big Data.

Iniciativas que impulsan el uso de Big Data y Analítica de Datos

¿Por qué las empresas quieren Big Data? Las empresas usan Big Data en tres ámbitos:

 Iniciativas centradas en el cliente. Hoy se quiere conocer mejor al cliente: sus


hábitos de consumo y comportamientos antes, durante y después de la compra.
Se quiere hacer seguimiento de la competencia, proyectos orientados a la
fidelización del cliente.
 Aprovechar datos internos.
 Crear un mejor ecosistema de información. Integrar Datos Externos.
Proyectos que captan datos de diferentes fuentes. Llevar un informe mensual
cada segundo, información en tiempo real. No tiene sentido desarrollarlo si no lo
tomaremos en serio todos los meses.

Hay otros proyectos relacionados con la segmentación de operaciones, categorizar la


información que tengo en distintos sectores.

Unir el Big Data a un sistema transaccional. En las empresas hay dos sistemas:
transaccional (sigue la operación de toda la empresa) y el informacional (toma la
información la dota de inteligencia y permite la toma de decisiones).

Hay entornos regulados que usan el Big Data para seguir la traza de los datos y
aprovecharlos para disminuir el riesgo o el fraude.

Desde el punto de vista del negocio surgen una serie de actividades. Big Data permite
predecir el comportamiento de los clientes para mejorar su experiencia de compra. Si
tenemos diferentes fuentes de datos, podremos crear una imagen más completa de las
preferencias del cliente. Por ejemplo: Cuando compramos un artículo y abajo nos
recomienda artículos complementarios.

En el área de Marketing, recolectamos información sobre las páginas que visitamos, si


estoy suscripto y me permiten crear un mejor perfil.
¿Por qué se ha vuelto tan importante el Big Data?

El Big Data ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de
decisiones, la cual es usada para describir enormes cantidades de datos. Hay diferentes
tipos de datos:

 Datos estructurados. Cuentan con un formato o esquema fijo, que facilita su


almacenamiento y uso, y la generación de la información. Ejemplo: hojas de
cálculo.
 Datos semiestructurados. Datos que ya han sido procesados de algún modo.
Cuentas con un flujo lógico, etiquetas y marcadores que permiten separar los
elementos. No poseen formato fijo, aspecto que dificulta su comprensión.
Etiquetas XML y HTML.
 Datos no estructurados. Se encuentran en el estado en que se recolectaron. No
se tiene control sobre ellos porque no están definidos. Ejemplo: imágenes,
videos, emails.

El concepto de Big Data aplica para toda aquella información que no puede ser
procesada o analizada utilizando procesos o herramientas tradicionales.

Además del gran volumen de información, existe una amplia variedad de datos, que
pueden ser representados de diversos modos, los cuales pueden medir y comunicar el
posicionamiento, vibración, temperatura, humedad y hasta cambios químicos en el aire.
Las aplicaciones requieren de velocidad para brindar una rápida respuesta.

Es importante entender que las bases de datos convencionales son una parte
importante y relevante para una solución analítica.

¿De dónde proviene la información? La información puede provenir de transacciones


financieras, registros, dispositivos móviles, análisis de redes sociales o ubicación
geográfica.

También, existe la información máquina a máquina: sensores interconectados en


distintos sectores.

¿Qué tipo de datos explorar? El hincapié debería hacerse en qué problema se intenta
resolver. Si bien existe una amplia variedad de datos a analizar, una buena clasificación
de los mismos ayudaría a entender mejor su representación. Hay diferentes tipos:
 Web y RRSS. Se incluye el contenido web, la información extraída de las redes
sociales, blogs y sitios de almacenamiento de información. Se analiza mediante
analítica web y social, métricas y KPI. Ejemplo: Flujos de clics, feeds de twitter,
entradas de Facebook, contenido web.
 Máquina a máquina. Tecnologías que permiten a los dispositivos conectarse
con otros y que transmiten lo recogido por redes inalámbricas. Lectura de
medidores, señales de GPS, lecturas de sensores, lecturas RFID.
 Datos de transacciones grandes. Incluyen regristros de facturación, registros
detallados de las llamadas. Estos datos transaccionales están disponibles en
formatos semiestructurados.
 Biometría. La información biométrica abarca huellas digitales, escaneo de
retina y reconocimiento facial.
 Generado por humanos. Registros de voz, correos electrónicos, registros
electrónicos.

Impacto del Big Data en la Nueva Economía

El crecimiento en el sector tecnológico provocó un aumento desmesurado del volumen


de datos que requiere sistemas de almacenamiento cada vez más sofisticados. El
aumento general del conocimiento y la investigación hicieron necesaria la creación de
un sistema de registros exhaustivo.

Pero, apareció la primera complicación: el almacenamiento. Las organizaciones


comenzaron a diseñar sistemas de computación centralizados que permitiesen
automatizar sus inventarios. Las grandes empresas comenzaron a adoptarlos para buscar
respuestas y mejorar la toma de decisiones.

Como volvieron a aparecer los problemas de almacenamiento, surgió el concepto de


Inteligencia de Negocios, que son plataformas que recopilan información y que le
permiten a las empresas conseguir avances y descubrimientos.

Ni el Big Data ni el análisis de datos son nuevos, pero en su combinación radica su


éxito.

Usando el análisis avanzado las entidades pueden estudiar grandes volúmenes de datos
para entender el estado actual de su negocio y realizar un seguimiento de los aspectos
todavía en evolución.
El Big Data es un activo de la empresa con el poder para obtener información
procesable.

Evaluar las condiciones y visualizar el futuro. El mejor camino para iniciarse es


comenzar por un subconjunto de datos que permitan generar algún tipo de retorno.

Para las empresas enfocadas en el comercio electrónico, el Web Data es un buen lugar
para empezar. Ver cómo la gente se mueve a través de una página web. Ver la eficacia
al momento de vender o no, la eficacia del carrito de compras, lo que se vende bien y lo
que se estuvo a punto de vender.

La evolución del Big Data se moverá al mismo tiempo que los usuarios y las
tecnologías maduren. Las que más crecerán serán: la visualización avanzada de datos, el
uso de animaciones y visualización cotidiana de datos.

Ahora, las empresas ven a los datos como un recurso valioso. Hay una actitud cada vez
más marcada en aquellas organizaciones que necesitan utilizar información para crear
productos basados en ella.

Grandes aplicaciones del Big Data

Las empresas que usan Big Data para obtener resultados centrados en el cliente,
aprovechan los datos internos y crear un mejor ecosistema de información. Hay cinco
tendencias:

 Usar el Big Data para abordar objetivos centrados en el cliente.


 Una base de gestión de la información escalable y extensible es un requisito
fundamental para el avance del Big Data.
 Las organizaciones están poniendo en marcha proyectos e implementaciones con
fuentes de datos internas ya existentes.
 Necesitan funcionalidades analíticas avanzadas.
 A medida que la concienciación y la implicación de las compañías en el Big
Data crece, se observa cómo surgen cuatro frases:
o Educar: Crear una base de conocimiento. Centrado en la recopilación de
conocimiento y observaciones del mercado.
o Explorar: Definir el caso de negocio y la hoja de ruta. Desarrollar una
estrategia y una hoja de ruta sobre la base de las necesidades del negocio
y retos empresariales.
o Interactuar: Adoptar Big Data. Dirigir iniciativas de Big Data.
o Ejecutar: Implementar Big Data a escala.

La compañía Logicalis señala que el Big Data posee cinco aplicaciones:

Exploración de grandes datos. Las tres V (velocidad, volumen y variedad) reflejan el


reto de las grandes compañías, para mejorar la toma de decisiones, mejorar las
operaciones y reducir los riesgos. Es necesario navegar de forma fácil para obtener
información tanto dentro de los sistemas de la compañía como de los datos que llegan
desde afuera.

Visión de 360º del cliente. Las compañías deben obtener información de fuentes
internas y externas que le permitan asesorar mejor al cliente y entender cuál es la mejor
forma de ayudarlo. El objetivo es comprender su comportamiento y predecir sus
acciones.

Los empleados deben crear una relación de confianza y conseguir una fidelidad del
consumidor. Debe poseer información interna (comportamiento del sujeto con la
empresa) y externa (gustos, intereses).

Extensión de la seguridad. Se incluyen mecanismos diseñados para localizar


anomalías y prevenir ataques. Podemos encontrar posibles relaciones ocultas, detectar
patrones de conducta y prevenir amenazas a la seguridad. Posibilita el descubrimiento
de un fraude.

Análisis de operaciones. Permite obtener visibilidad en tiempo real de las operaciones,


la experiencia del cliente, sus transacciones y comportamiento. Hay que dinamizar el
plan para incrementar la eficiencia de las operaciones, identificar e investigar las
anomalías y monitorizar la infraestructura.

Se pueden conectar con datos relacionados con otros datos de la empresa, información
del cliente o el producto, aunque los mismos se hallen en formatos distintos.

Aumentar el almacén de datos. Esta aplicación se relaciona con la ampliación de una


estructura de almacenamiento de datos ya existentes aplicando las ventajas del Big Data
para incrementar su valor. Nace de dos necesidades básicas: sacar provecho de
diferentes tipos de datos para ganar nuevas perspectivas de negocio en tiempo real y
optimizar la estructura de almacenamiento.

Hay tres tipos de almacenes:

 Pre-Processing Hub. Proporciona un área de montaje o zona de aterrizaje de los


datos antes de decidir cuáles se incorporarán al almacén de datos.
 Discovery/Analytics. La capacidad de realizar análisis que deberían haberse
hecho antes en el data warehoyse, para sí optimizar el almacen de datos y
posibilitar nuevos tipos de análisis.
 Query-able Data Store. Descarga datos que se consultan con poca frecuencia o
de una antigüedad considerable, mediante un software y herramientas de
integración de información.

Lecturas complementarias:

 https://www.i-scoop.eu/big-data-action-value-context/big-data-analytics-from-big-
data-to-smart-data-and-decisions/
 https://www.mckinsey.com/business-functions/mckinsey-analytics/our-
insights/achieving-business-impact-with-data

Las dimensiones del Big Data

Las dimensiones V del Big Data

El Big Data suele definirse a través de cinco V: volumen, velocidad, variedad,


veracidad y valor. El valor hace referencia al uso de datos masivos para garantizar el
ROI.

Volumen: Datos a Escala

El volumen es la característica más común del Big Data. Hace referencia a las
cantidades masivas de datos que las organizaciones intentan aprovechar para mejorar la
toma de decisiones en toda la empresa. Continúan aumentando constantemente. Hay
que tener en cuenta que muchos de esos datos no serán útiles porque no tendrán calidad
o porque no forman parte de la estrategia. Lo que hoy nosotros consideramos un
volumen alto, mañana será algo menor.
Hay muchas plataformas para el análisis masivo de datos: Strategy Big Data.

Variedad: Datos en muchas formas

Se relaciona con la gestión de la complejidad de múltiples tipos de datos (estructurados,


semiestructurados y no estructurados), proveniente de un amplio abanico de fuentes. La
información se presenta en innumerables formatos: textos, datos webs, clics, tuits.

Datos Estructurados. Tienen perfectamente definido su formato, longitud y tamaño. Se


almacenan en hojas de cálculo o en bases de datos relacionales.

El modelo relacional describe los datos mediante el uso de un formato tabular. Todos
los elementos de datos se colocan en tablas bidimensionales llamada relaciones, que
constituyen el equivalente lógico de los archivos. Encontramos: DB2, Oracle, Sybase,
SQL Server, Microsoft Access, MySQL.

Cada renglón de una tala representa una entidad de datos, mientras que cada columna
representa los atributos.

Datos No Estructurados. No tienen un formato específico y se almacenan en múltiples


formatos como documentos PDF, correos electrónicos, ficheros multimedia.

No pueden ser normalizados, no tienen tipos definidos ni se están organizando bajo


algún patrón. Sin embargo, los datos deben ser organizados, clasificados, almacenados,
eliminados, buscados de alguna forma.

Se puede hacer uso de metadatos, usar datos que puedan describir otros datos. Por
ejemplo: una biblioteca tiene fichas o un sistema de información de los libros: autor,
título, editorial, ISBN.

Datos Semiestructurados. Son una mezcla de los dos tipos de datos mencionados
anteriormente. Cuentan con una organización definida en sus metadatos, donde
describen los objetos y sus relaciones. Ejemplo: HTML, XML, JSON.

Tienen cuatro características:

 Son datos irregulares, que pueden no contar con un esquema particular.


 Se pueden presentar datos incompletos.
 Sus componentes pueden cambiar.
 Pueden aparecer nuevos datos cuya estructura nada tiene que ver con la ya
existente.

La variedad también está relacionada con la capacidad de integrar y analizar datos de un


complejo abanico de fuentes de información: tradicional y no tradicional, dentro y fuera
de la empresa, de máquinas y personas.

Velocidad: Datos en Movimiento

Se debe tener la capacidad de crear, procesar, analizar y dar respuesta a los eventos. El
tiempo de respuesta hace necesario el uso de tecnologías que permitan responder en el
plazo necesario.

La velocidad afecta a la latencia: tiempo de espera entre el momento en el que se crean


los datos, momento en el que se captan y momento en el que están accesibles. Esa
latencia debe disminuir constantemente.

Veracidad: Incertidumbre de los datos

La variedad genera valor pero también complejidad al momento de trabajar con la


información. Hace referencia al nivel de fiabilidad asociado a ciertos datos. Es menester
conseguir datos de calidad.

Los datos deben ser analizables y analizados. Hay que modelarlos y caracterizarlos,
construir modelos alineados con el negocio. Puede recurrirse a plataformas como:
Hadoop, Spark.

Cuando se tiene el modelo, pueden aplicarse los algoritmos de data mining adaptados al
modelo y el problema a resolver.

Valor: Datos Rentables

Los datos, como tales, no tienen sentido. Lo que realmente importa es su significado,
datos procesables, información procesable, un objetivo y la acción para llegar allí. Esto
se da gracias a la analítica de los datos. Debemos pasar del descubrimiento de los datos
a la acción.

Los datos no tienen valor, recién lo cobran cuando se transforman en información,


cuando son accionables.
Viabilidad y Visualización

La viabilidad se vincula con la capacidad de las compañías de generar uso eficaz de


gran volumen de datos. Una buena empresa analiza, selecciona y monitoriza la
información el fin de conocer mejor el mercado donde opera y sus clientes y diseñar
estrategias eficaces.

La visualización hace referencia al modo en que los datos son presentados. Una vez que
son procesados es necesario presentarlos.

Big Data Tecnológico

Big Data desde el punto de vista tecnológico

Desde un punto de vista tecnológico, se extrae que el Big Data se trata de una colección
de herramientas, técnicas, tecnologías y algoritmos. Encontramos: Analytics,
infraestructura, software, servicios, APIs, desarrollo. Todo lo relacionado con gestión de
la información.

Es un ecosistema de proyectos que en conjunto permiten simplificar, administrar,


coordinar y analizar grandes volúmenes de datos.

Las tecnologías de Big Data se clasifican en siete categorías:

Motores de procesamiento. Realizan el cómputo de manera distribuida, reparten el


trabajo en varios nodos de computación.

Ingestión. Tecnologías orientadas a la recolección de los datos desde su origen.

Mensajería. Tecnologías que permiten intercambiar datos entre los diferentes


componentes software de manera eficiente.

Almacenamiento. Tecnologías capaces de guardar grandes volúmenes de datos.

Bibliotecas de consultas. Multitud de bibliotecas orientadas a simplificar el acceso a


los datos. Son motores de procesamiento para realizar consultas.

Gestión de recursos. Tecnologías diseñadas para la planificación y asignación de los


recursos del cluster, donde se realizará el procesamiento.
Bibliotecas Machine Learning. Algoritmos que clasifican, predicen o perfilan datos.
Se basan en motor de procesamiento paralelo, de los cuales aprovecha su capacidad para
realizar cálculos muy complejos.

Del Dato al Conocimiento

Un proyecto Big Data consta de cuatro partes: captura, almacenamiento, procesamiento


puesta en valor de la información. Esta tecnología pretende descubrir conocimiento
oculto a partir de grandes cantidades de datos.

Captura de la información. Se debe responder a tres preguntas clave: dónde se


encuentra la información que se necesita, cómo accedemos a ella y qué capacidades se
deben desarrollar para capturarla. Cada caso concreto supone el uso de determinadas
tecnologías.

Almacenamiento de la información. Se define dónde guardar todos los datos


capturados para luego explotarlos. Se debe tener en cuenta el tipo de dato que se extrae.
Se pueden usar herramientas como: Excel o NoSQL.

Procesamiento de la información. Se establece qué se hará con la información. Se


pueden realizar distintos tratamientos: incorporaciones o desagregados, emplear
sistemas de recomendación. Hay muchos tipos de tratamientos: agregación,
sumarización, sistema predictivo, recomendaciones, desarrollar un algoritmo o clasificar
la información que tenemos.

Puesta en valor de la información. Es preciso tener un objetivo: agregarle valor al


negocio. Se puede hacer con un sistema de alertas, recomendaciones, métricas, KPI,
dashboard. Hacemos hablar a los datos.

Consecuencias tecnológicas del Big Data. Gracias al Big Data aparecieron las bases
de datos no relacionales, como consecuencia de la incapacidad de las bases datos
tradicionales (PostgreSQL, DB2, Oracle) de almacenar datos no estructurados ni las
características de los datos provenientes de una fuente Big Data. Ahora, aparecieron
HBASE, Cassandra que suelen ser tan rápidas como las relacionales pero cuentan con
una capacidad de almacenamiento distribuido y datos no estructurados.
La segunda consecuencia es el surgimiento del enfoque de procesamiento en paralelo.
En lugar de realizar una tarea de procesamiento en un gran servidor, la misma se divide
en partes pequeñas, se recogen y se combinan resultados.

Este enfoque reduce los tiempos de generación de modelos estadísticos a partir de


grandes volúmenes de datos. Una gran herramienta es Spark, un software que contiene
varios algoritmos estadísticos.

Permite tecnologías que acepten los errores. Mayor cantidad de equipos y mayor
capacidad de procesamiento. Hadoop es una tecnología de procesamiento distribuido,
que nos permite construir herramientas de persistencia dividida.

Tecnologías para el Big Data

El Big Data Landscape refleja las tecnologías de datos que continúan progresando,
dado que se han vuelto más eficientes y han logrado una adopción más extendida. Los
eventos y las tendencias clave del 2018 son: infraestructura y analítica, y aprendizaje de
máquina e inteligencia artificial.

Para lograr un valor de negocio tenemos que pensar en una arquitectura que respalde la
escalabilidad y la disponibilidad de los datos y la diversidad. Revisar si la arquitectura
responde a una gestión de información integrada, escalable y segura.

Integrada porque uno de los beneficios del Big Data es poder tomar información y
conectarla desde diferentes fuentes empresariales. Escalable porque su capacidad de
crecer en capacidad de crecimiento y procesamiento, debe responder a un proyecto de
Big Data. Segura porque uno de sus componentes es la seguridad de los datos y el
gobierno de estos.

Dependencia de una base de información escalable y extensible

Lograr un valor de negocio importante y cuantificable a partir de Big Data sólo puede
hacerse realidad si las empresas crean una base de información que respalde el volumen,
la variedad y la velocidad de los datos.

La gestión de datos maestros y la integración de tipos de datos clave requieren datos


interempresariales gobernados según un único estándar empresarial.
El hecho de añadir más capacidad de almacenamiento puede parecer suficiente para
respaldar el crecimiento de una base de gestión de la información. Es importante
comprender que prever y configurar la infraestructura resulta clave para alcanzar el
valor del negocio pretendido.

Otro de los componentes a considerar una arquitectura Big Data es la seguridad y el


gobierno de los datos. Es una parte fundamental de la gestión de la información.

Fuentes de información para el Big Data

La alta dirección exige un caso de negocio sólido y cuantificable, uno que defina las
inversiones progresivas junto con las oportunidades para racionalizar y optimizar los
costes de sus entornos de gestión de la información. Algunas tácticas desarrolladas en la
actualidad que persiguen dicha finalidad son arquitecturas de menor coste, incluido el
cloud computing.

Las primeras iniciativas de Big Data se centran en obtener conocimientos de fuentes de


datos internas nuevas o ya existentes. La mayor parte de los esfuerzos de big data están
dirigidos a extraer y analizar datos internos.

Caso de Estudio

La transformación digital en una productora de televisión. Un medio tradicional


buscando información en los nuevos medios digitales.

El cliente solicitaba monitorizar los medios para medir el impacto que un programa
tenía en las redes sociales. Ver cuál era la reacción a cada programa para cambiar el
rumbo. Entender si en un programa beneficiaba al canal.

La principal funcionalidad es la captura de las reacciones en las redes sociales. Para eso
se usó una arquitectura de Big Data: adquisición de datos escalables en la nube y un
cluster autoescalable. La escalabilidad era muy importante.

La parte analítica se dividió en:

 Análisis de sentimiento de las mediciones. Tomar el texto, interpretarlo para


construir un modelo de clasificación del sentimiento.
 Vincular el mensaje con el medio del cual sale. Clasificar cada uno de los
mensajes en cada uno de los programas de la productora. Categorizarlo y tomar
decisiones.

Una vez que las mediciones eran clasificadas por sentimiento y categorizadas por
productos, se construyen dashboards de clientes. Se generaron tableros para tomar
decisiones en función de si un programa es mejor en un horario, o si se debe cancelar.
Se creó un sistema de alerta para ver si los sentimientos cayeron o si se modificaron.

Lo importante es identificar el valor de la información. Para esto, debe haber un


problema de negocio que quiero resolver. Tengo que saber cuál es la información y
dónde está. Dónde almacenaremos esa información. Cómo la vamos a usar. Cómo la
voy a poner en valor.

Habilidades Analíticas del Big Data

Algunas de las tácticas útiles son:

 Arquitecturas de menor costo.


 Cloud Computing.
 Externalizar algunos servicios.
 Consultoría.
 Software Service.
 Cluster de Hadoop.

Las primeras iniciativas se podrían centrar en obtener conocimientos de fuentes de datos


internas o ya existentes. Nos trae el beneficio de descubrir valor en datos que tenemos
escondidos en sistemas internos: datos que ya trabajamos.

Aplicar analítica de datos en los datos de internos, podría proporcionarnos


conocimientos valiosos. Una primera iniciativa es trabajar en base a datos internos y
podría generar valor a corto plazo.

Big Data no crea valor por sí mismo. Requiere de capacidades analíticas dentro de las
personas: consultas y generación de informes, extracción de datos, visualización de
datos, modelos predictivos, optimización. A eso deben sumársele habilidades y modelos
predictivos.
Las empresas deben descubrir patrones en los datos: aplicar modelos de optimización,
analítica avanzada, hacer simulaciones y trabajar con miles de variables.

Para encontrar un patrón dentro de un conjunto de datos, debo saber aplicar algoritmos
de correlación para hacer una predicción a corto plazo.

Una de las funciones más importantes es poder reconocer el texto en el lenguaje


natural. Transcripciones telefónicas de nuestro call center, a través de frameworks de
Phyton o la API de Google para convertir voz en texto.

Nuevos Roles en la Organización

Aparecen nuevos perfiles dentro de la organización. Personas que están relacionadas a


entender o reconocer métricas críticas con el negocio. Aparece el rol del Business
Analist. Es un rol nuevo que tiene como objetivo mejorar el proceso de negocio al
actuar de intermediario entre el negocio y la tecnología. Es capaz de manejar varios
proyectos. Entre sus habilidades encontramos: MS Office, Herramientas de
Visualización de Datos (Tableau), Escucha Activa y Habilidad des de comunicación,
Entendimiento del Modelado de Datos. Lenguajes: SQL.

Aparece el Data Business Analist. Tiene como misión recolectar, procesar y realizar
análisis estadísticos de datos. Puede cruzar datos de distintas áreas, conoce tratamientos
de información. Lenguajes: Python, HTML, Javascript, C o C++ y SQL.

Aparece el Científico de Datos. Incorpora conocimientos en tecnología, en modelado,


estadísticas, aplicaciones y en datos no relacionales. Posee conocimientos de Machine
Learning. Trabaja con APIs y servicios en la nube.

El Camino del Big Data: Proceso, respaldo, obstáculos y recomendaciones

Un estudio de IBM arrojó que para que las empresas comiencen a aplicar Big Data,
necesitan pasar por cuatro fases:

Educar. Crear una base de conocimientos. La educación se centra en la concientización


y en el desarrollo del conocimiento. Estudiamos las posibles ventajas de la tecnología y
la analítica del Big Data. Entendiendo como nos ayudarán a explotar el negocio.

Explorar. Definir un caso de negocio y una hoja de ruta. La atención se centra en la


hoja de ruta para que la empresa pueda aplicar Big Data. Definimos los objetivos:
desarrollar un caso de negocio cuantificable y crear un proyecto Big Data. Se deben
tener en cuenta los datos, las habilidades existentes y las tecnologías. Y dónde vamos a
comenzar.

Interactuar. Empezamos a jugar con una tecnología de Big Data. Comprobamos el


valor de negocio, experimentamos con tecnologías y habilidades. Comenzamos con un
proyecto piloto.

Ejecutar. Implementamos el Big Data a gran escala. Es el despliegue de una solución


de dos o tres iniciativas y aplicamos Big Data.

Además necesitamos del Respaldo de los ejecutivos. En el camino de adopción al Big


Data, necesitaremos que las iniciativas estén respaldadas por la parte directiva, alguien
del negocio.

Nos encontraremos con Obstáculos. Difieren en función de la base en la cual nos


encontramos. Existe algo sistémico. Uno de los principales desafíos es la incapacidad
para desarrollar un caso de negocio sólido y cuantificable. Otro de los desafío es
comprender cómo usar esas tecnologías de Big Data. También nos encontramos con
desafíos relacionados con la calidad de los datos y la capacidad analítica.

Recomendaciones:

 Desde la tecnología, tenemos que trabajar en la captura de la información, el


almacenamiento, tratamiento y puesta en valor.
 Lo importante es que exista un problema de negocio a solucionar. Saber qué
información necesito, dónde la voy a capturar, cómo la voy a guardar y cómo la
voy a usar.
 Dedicar esfuerzos iniciales a resultados centrados en el cliente. Conocer a los
clientes y prestar un mejor servicio para conocer mejor sus comportamientos.
 Comenzar con datos existentes dentro de la organización.
 Debemos desarrollar habilidades analíticas dentro de la organización.

Analítica de Datos

Tenemos cuatro tipos de analíticas: descriptiva, diagnóstica, predictiva y prescriptiva.


También hablamos de analítica cognitiva. Son plataformas de Hardware y de Software
que intentan emular el comportamiento del cerebro humano y apoyar así a la toma de
decisiones humanas.

Tienen tres características:

 Están preparadas para entender.


 Están preparadas para razonar. Clasificar y entender la organización.
 Están preparadas para aprender. La plataforma aprende sobre las acciones que va
haciendo. Debemos entrenar a las plataformas. Etiquetamos cada respuesta para
que entienda.

Los ambientes de Big Data generan mucha información que es consumida por la
computación cognitiva.

Lecturas:

https://www.i-scoop.eu/big-data-action-value-context/big-data-analytics-from-big-data-to-
smart-data-and-decisions/

https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/achieving-
business-impact-with-data
Tarea:

Qué es la cuarta revolución industrial, cuándo se dio y por qué.

Qué es un Petabyte.

Aprender Hadoop y Spark.

Links importantes

https://antoniopita.blog/2017/02/05/slides-openclass-como-introducirse-en-el-big-data/

También podría gustarte