Está en la página 1de 20

Big data - Qué es y por qué es importante para la nueva era

tecnológica
Big data es un término que describe el gran volumen de datos
– estructurados y no estructurados – que inundan una
empresa todos los días. Pero no es la cantidad de datos lo
importante. Lo que importa es lo que las organizaciones
hacen con los datos. El big data puede ser analizado para
obtener insights que conlleven a mejores decisiones y
acciones de negocios estratégicas.
Historia del Big Data
El término "big data" se refiere a los datos que son tan
grandes, rápidos o complejos que es difícil o imposible
procesarlos con los métodos tradicionales. El acto de acceder
y almacenar grandes cantidades de información para la
analítica ha existido desde hace mucho tiempo. Pero el
concepto de big data cobró impulso a principios de la década
de 2000 cuando el analista de la industria, Doug Laney,
articuló la definición actual de grandes datos como las tres V:
Volumen: Las organizaciones recopilan datos de diversas
fuentes, como transacciones comerciales, dispositivos
inteligentes (IO), equipo industrial, vídeos, medios sociales y
más. En el pasado, su almacenamiento habría sido un
problema - pero el almacenamiento más barato en
plataformas como los data lakes y el Hadoop han aliviado la
carga.
Velocidad: Con el crecimiento del Internet de las Cosas, los
datos llegan a las empresas a una velocidad sin precedentes
y deben ser manejados de manera oportuna. Las etiquetas
RFID, los sensores y los medidores inteligentes están
impulsando la necesidad de manejar estos torrentes de datos
en tiempo casi real.
Variedad : Los datos se presentan en todo tipo de formatos:
desde datos numéricos estructurados en bases de datos
tradicionales hasta documentos de texto no estructurados,
correos electrónicos, vídeos, audios, datos de teletipo y
transacciones financieras.
En SAS, consideramos otras dos dimensiones cuando se trata
del big data:
Variabilidad:
Además de las crecientes velocidades y variedades de datos,
los flujos de datos son impredecibles, cambian a menudo y
varían mucho. Es un reto, pero las empresas necesitan saber
cuándo algo está de moda en los medios sociales, y cómo
gestionar los picos de carga de datos diarios, estacionales y
desencadenados por eventos.

Veracidad:
La veracidad se refiere a la calidad de los datos. Debido a que
los datos provienen de tantas fuentes diferentes, es difícil
vincular, comparar, limpiar y transformar los datos a través
de los sistemas. Las empresas necesitan conectar y
correlacionar las relaciones, las jerarquías y los múltiples
vínculos de datos. De lo contrario, sus datos pueden salirse
de control rápidamente.

Producción optimizada con analítica de big data


En la Corporación USG, el uso de big data con analítica
predictiva es clave para comprender plenamente cómo se
hacen los productos y cómo funcionan. Y en un mercado con
un aluvión de competencia global, los fabricantes como USG
saben la importancia de producir productos de alta calidad a
un precio asequible. Usando la Plataforma SAS, USG ha
eliminado las conjeturas y optimizado sus inversiones en
producción. Los resultados: una mejor calidad de los
productos y el tiempo de comercialización.

¿Por qué son importante el big data?


La importancia del big data no gira en torno a la cantidad de
datos que tienes, sino en lo que haces con ellos. Puedes
tomar datos de cualquier fuente y analizarlos para encontrar
respuestas que permitan 1) reducir los costos, 2) reducir el
tiempo, 3) desarrollar nuevos productos y optimizar las
ofertas, y 4) tomar decisiones inteligentes. Cuando se
combinan grandes datos con análisis de alta potencia, se
pueden realizar tareas relacionadas con los negocios como:
• Determinar las causas de origen de fallos, problemas y
defectos casi en tiempo real.
• Generar cupones en el punto de venta basados en los
hábitos de compra del cliente.
• Recalcular portafolios de riesgo completos en minutos.
• Detecte el comportamiento fraudulento antes de que
afecte a su organización.
Big data en el mundo de hoy
Big Data - y la forma en que las organizaciones gestionan y
obtienen la información - está cambiando la forma en que el
mundo utiliza la información de los negocios. Más
información sobre el impacto del big data.
Integración de datos Deja Vu: Los grandes datos revitalizan la
ID
Para seguir siendo pertinente, la integración de datos debe
funcionar con muchos tipos y fuentes de datos diferentes, y
a la vez operar con diferentes latencias, desde el tiempo real
hasta la transmisión. Aprenda cómo el ID ha evolucionado
para cumplir con los requisitos modernos.
Lea el documento
Cómo generar su estrategia de datos y analítica
¿Se pregunta cómo construir una organización analítica de
clase mundial? Asegurése de que la información es confiable.
Potencie las decisiones basadas en datos en todas las líneas
de negocio. Impulse la estrategia. Y conozca cómo obtener
hasta el último pedazo de valor del big data.
Lea el e-book.
El data lake y el almacén de datos... conozca la diferencia
¿Es el término "data lake" simple exageración de marketing?
¿O es un nuevo nombre para un almacén de datos? Phil
Simon deja en claro lo que es un lago de datos, cómo
funciona y cuándo podría usted necesitar uno.
Lea el artículo
Nuevo ecosistema analítico
La nube, los contenedores y la potencia de cálculo a
demanda - una encuesta de SAS a más de 1.000
organizaciones explora la adopción de la tecnología e ilustra
cómo la adopción de enfoques específicos le posiciona para
hacer evolucionar con éxito sus ecosistemas analíticos.
Lea el e-book.
¿Quién se centra en el big data?
El big data es un gran problema para las industrias. El ataque
de la IoT y otros dispositivos conectados ha creado un
aumento masivo en la cantidad de información que las
organizaciones recolectan, manejan y analizan. Junto con el
big data viene el potencial de desbloquear grandes insights -
para cada industria, de grande a pequeña.
• Select an industry

Más información acerca de industrias que emplean esta


tecnología

El deep learning anhela el big data porque es necesaria para


aislar patrones ocultos y para encontrar respuestas sin
sobrecargar los datos. Con el deep learning, cuantos más
datos de buena calidad tenga, mejores serán los
resultados.Wayne Thompson SAS Product Manager
Más información sobre Deep Learning

Innovación impulsada por los datos


Los exabytes actuales del big data abren innumerables
oportunidades para capturar insights que impulsen la
innovación. Desde una previsión más precisa hasta una
mayor eficiencia operativa y mejores experiencias de los
clientes, los usos sofisticados del big data y analítica impulsan
avances que pueden cambiar nuestro mundo: mejorando
vidas, curando enfermedades, protegiendo a los vulnerables
y conservando recursos.
Cómo funciona Big Data
Antes de que las empresas puedan poner a trabajar el big
data, deben considerar cómo fluyen entre una multitud de
lugares, fuentes, sistemas, propietarios y usuarios. Hay cinco
pasos clave para hacerse cargo de este gran "centro de
datos" que incluye datos tradicionales y estructurados junto
con datos no estructurados y semiestructurados:

• Establezca una gran estrategia de datos.


• Identifique fuentes de big data.
• Acceda, gestione y almacene los datos.
• Analice los datos.
• Tome decisiones basadas en datos.
1) Establezca una estrategia de big data
A un alto nivel, una estrategia de big data es un plan diseñado
para ayudarle a supervisar y mejorar la forma en que
adquiere, almacena, gestiona, comparte y utiliza los datos
dentro y fuera de su organización. Una estrategia de big data
establece el escenario para el éxito del negocio en medio de
una abundancia de datos. Cuando se desarrolla una
estrategia, es importante considerar las metas e iniciativas
de negocios y tecnología existentes y futuras. Esto exige
tratar los grandes datos como cualquier otro activo
empresarial valioso, en lugar de considerarlos sólo como un
subproducto de las aplicaciones.
Haga clic en la infografía para conocer más sobre el big data.
2) Conozca las fuentes del big data
• El streamingde datos proviene del Internet de las Cosas
(IoT) y otros dispositivos conectados que fluyen a los
sistemas de TI desde los vestidos, los coches
inteligentes, los dispositivos médicos, los equipos
industriales y más. Puede analizar este big data a
medida que llegan, decidiendo qué datos guardar o no
guardar, y cuáles necesitan un análisis más profundo.
• Los datos de losmedios sociales provienen de
interacciones en Facebook, YouTube, Instagram, etc.
Esto incluye big data en forma de imágenes, vídeos, voz,
texto y sonido, útiles para la comercialización, las ventas
y las funciones de apoyo. Estos datos suelen estar en
formas no estructuradas o semiestructuradas, por lo
que plantean un desafío único para el consumo y el
análisis.
• Los datos disponibles públicamente provienen de
cantidades masivas de fuentes de datos abiertos como
el data.gov del gobierno de los Estados Unidos, el World
Factbook de la CIA o el Open Data Portal de la Unión
Europea.
• Otros big data puede provenir de data lakes, fuentes de
datos en la nube, proveedores y clientes.
3) Acceda, gestione y almacene big data
Los sistemas informáticos modernos proporcionan la
velocidad, la potencia y la flexibilidad necesarias para
acceder rápidamente a cantidades masivas y tipos de big
data. Además de un acceso confiable, las empresas también
necesitan métodos para integrar los datos, asegurar la
calidad de los mismos, proporcionar un gobierno y un
almacenamiento de datos, y preparar los datos para el
análisis. Algunos datos pueden almacenarse en data
warehouse tradicional, pero también hay opciones flexibles
y de bajo costo para almacenar y manejar big data a través
de soluciones de nube, lagos de datos y Hadoop.
4) Analice el big data
Con tecnologías de alto rendimiento como la computación en
red o analítica en memoria, las organizaciones pueden optar
por utilizar todos sus big data para análisis. Otro enfoque es
determinar por adelantado qué datos son relevantes antes
de analizarlos. De cualquier manera, el análisis de big data es
cómo las empresas obtienen valor e información a partir de
los datos. Cada vez más, el big data alimenta los esfuerzos
analíticos avanzados de hoy en día, como la inteligencia
artificial.
5) Tome decisiones inteligentes, basadas en datos
Los datos bien administrados y confiables conducen a un
analítica y decisiones confiables. Para seguir siendo
competitivas, las empresas necesitan aprovechar todo el
valor del big data y operar de una manera basada en los
datos, tomando decisiones basadas en la evidencia
presentada por los grandes datos en lugar de en el instinto
visceral. Los beneficios de ser impulsado por los datos son
claros. Las organizaciones basadas en datos se desempeñan
mejor, son operacionalmente más predecibles y son más
rentables.
Pasos siguientes
El big data exige una gestión de datos sofisticada y técnicas
de analítica avanzada. SAS le tiene cubierto.
Descubra la Plataforma SAS
Preparación de datos SAS
Para preparar el big data para la analítica primero hay que
acceder, perfilar, limpiar y transformar los datos. Con una
variedad de fuents de big data, tamaños y velocidades, la
preparación de los datos puede consumir enormes
cantidades de tiempo. La preparación de datos de SAS
simplifica la tarea, de modo que puede preparar los datos sin
necesidad de codificación, habilidades especializadas o
dependencia de la informática.
Definición de big data

¿Qué es, exactamente, big data?

Para entender qué significa realmente "big data", resulta útil conocer ciertos antecedentes
históricos. A continuación, ofrecemos la definición de Gartner, de aproximadamente 2001 (y que
continúa siendo la definición de referencia): Big data son datos que contienen una mayor variedad
y que se presentan en volúmenes crecientes y a una velocidad superior. Esto se conoce como "las
tres V".
Dicho de otro modo, el big data está formado por conjuntos de datos de mayor tamaño y más
complejos, especialmente procedentes de nuevas fuentes de datos. Estos conjuntos de datos son
tan voluminosos que el software de procesamiento de datos convencional sencillamente no puede
administrarlos. Sin embargo, estos volúmenes masivos de datos pueden utilizarse para abordar
problemas empresariales que antes no hubiera sido posible solucionar.

Las "tres V" de big data

Volumen La cantidad de datos importa. Con big data, tendrá que procesar
grandes volúmenes de datos no estructurados de baja densidad.
Puede tratarse de datos de valor desconocido, como feeds de datos
de Twitter, flujos de clics de una página web o aplicación para
móviles, o equipo con sensores. Para algunas organizaciones, esto
puede suponer decenas de terabytes de datos. Para otras, incluso
cientos de petabytes.

Velocidad La velocidad es el ritmo al que se reciben los datos y (posiblemente)


al que se utilizan. Por lo general, la mayor velocidad de los datos se
transmite directamente a la memoria, en vez de escribirse en un
disco. Algunos productos inteligentes habilitados para Internet
funcionan en tiempo real o prácticamente en tiempo real y requieren
una evaluación y actuación en tiempo real.

Variedad La variedad hace referencia a los diversos tipos de datos disponibles.


Los tipos de datos convencionales eran estructurados y podían
organizarse claramente en una base de datos relacional. Con el auge
del big data, los datos se presentan en nuevos tipos de datos no
estructurados. Los tipos de datos no estructurados y
semiestructurados, como el texto, audio o video, requieren un
preprocesamiento adicional para poder obtener significado y
habilitar los metadatos.

El valor y la veracidad de big data

En los últimos años, han surgido otras "dos V": valor y veracidad.

Los datos poseen un valor intrínseco. Sin embargo, no tienen ninguna utilidad hasta que dicho valor
se descubre. Resulta igualmente importante: ¿cuál es la veracidad de sus datos y cuánto puede
confiar en ellos?

Hoy en día, el big data se ha convertido en un activo crucial. Piense en algunas de las mayores
empresas tecnológicas del mundo. Gran parte del valor que ofrecen procede de sus datos, que
analizan constantemente para generar una mayor eficiencia y desarrollar nuevos productos.
Avances tecnológicos recientes han reducido exponencialmente el costo del almacenamiento y la
computación de datos, haciendo que almacenar datos resulte más fácil y barato que nunca.
Actualmente, con un mayor volumen de big data más barato y accesible, puede tomar decisiones
empresariales más acertadas y precisas.

Identificar el valor del big data no pasa solo por analizarlo (que es ya una ventaja en sí misma). Se
trata de todo un proceso de descubrimiento que requiere que los analistas, usuarios empresariales
y ejecutivos se planteen las preguntas correctas, identifiquen patrones, tomen decisiones
informadas y predigan comportamientos.

Pero ¿cómo llegamos hasta aquí?

¿Piensa pasarse al big data? Necesita una estrategia en la nube

Historia de big data

Si bien el concepto "big data" en sí mismo es relativamente nuevo, los orígenes de los grandes
conjuntos de datos se remontan a las décadas de 1960 y 1970, cuando el mundo de los datos
acababa de empezar con los primeros centros de datos y el desarrollo de las bases de datos
relacionales.

Alrededor de 2005, la gente empezó a darse cuenta de la cantidad de datos que generaban los
usuarios a través de Facebook, YouTube y otros servicios online. Ese mismo año, se desarrollaría
Hadoop, un marco de código abierto creado específicamente para almacenar y analizar grandes
conjuntos de datos. En esta época, también empezaría a adquirir popularidad NoSQL.

El desarrollo de marcos de código abierto, tales como Hadoop (y, más recientemente, Spark), sería
esencial para el crecimiento del big data, pues estos hacían que el big data fuera más fácil de usar y
más barato de almacenar. En los años transcurridos desde entonces, el volumen de big data se ha
disparado. Los usuarios continúan generando enormes cantidades de datos, pero ahora los
humanos no son los únicos que lo hacen.

Con la llegada de la Internet de las cosas (IoT), hay un mayor número de objetos y dispositivos
conectados a Internet que generan datos sobre patrones de uso de los clientes y el rendimiento de
los productos. El surgimiento del aprendizaje autónomo ha producido aún más datos.

Aunque el big data ha llegado lejos, su utilidad recién empieza. La computación en la nube ha
ampliado aún más las posibilidades del big data. La nube ofrece una escalabilidad realmente flexible,
donde los desarrolladores pueden simplemente agilizar clústeres ad hoc para probar un
subconjunto de datos.

Ventajas de big data y del análisis de datos:

• El big data le permite obtener respuestas más completas, ya que dispone de mayor cantidad
de información.

• La disponibilidad de respuestas más completas significa una mayor fiabilidad de los datos,
lo que implica un enfoque completamente distinto a la hora de abordar problemas.

Descubra más soluciones de big data


Trate de explorar y visualizar sus datos de forma gratuita

Casos de uso de big data

El big data puede ayudarle a abordar una serie de actividades empresariales, desde la experiencia
de los clientes hasta los análisis. A continuación, recopilamos algunas de ellas (puede encontrar más
casos de uso en Soluciones Oracle Big Data).

Desarrollo de productos Empresas como Netflix y Procter & Gamble usan big data para
prever la demanda de los clientes. Construyen modelos predictivos
para nuevos productos y servicios, clasificando atributos clave de
productos anteriores y actuales, y modelando la relación entre
dichos atributos y el éxito comercial de las ofertas. Además, P&G
utiliza los datos y los análisis de grupos de interés, redes sociales,
mercados de prueba y avances de salida en tiendas para planificar,
producir y lanzar nuevos productos.

Mantenimiento predictivo Los factores capaces de predecir fallas mecánicas pueden estar
profundamente ocultos entre datos estructurados (año del equipo,
marca o modelo de una máquina) o entre datos no estructurados
que cubren millones de entradas de registros, datos de sensores,
mensajes de error y temperaturas de motor. Al analizar estos
indicadores de problemas potenciales antes de que estos se
produzcan, las organizaciones pueden implementar el
mantenimiento de una forma más rentable y optimizar el tiempo
de servicio de componentes y equipos.

Experiencia del cliente La carrera por los clientes ya partió. Disponer de una vista clara de
la experiencia del cliente es más posible que nunca. El big data le
permite recopilar datos de redes sociales, visitas a páginas web,
registros de llamadas y otras fuentes para mejorar la experiencia de
interacción, así como maximizar el valor ofrecido. Empiece a
preparar ofertas personalizadas, reducir las tasas de abandono de
los clientes y administrar las incidencias de manera proactiva.

Fraude y cumplimiento En lo que a seguridad se refiere, no se enfrenta a simples hackers


solitarios, sino a equipos completos de expertos. Los contextos de
seguridad y requisitos de conformidad están en constante
evolución. El big data le ayuda a identificar patrones en los datos
que pueden ser indicativos de fraude, al tiempo que concentra
grandes volúmenes de información para agilizar la generación de
informes normativos.

Aprendizaje autónomo El aprendizaje autónomo es un tema candente en la actualidad. Los


datos, concretamente big data, es uno de los motivos de que así
sea. Ahora, en lugar de programarse, las máquinas pueden
aprender. Esto es posible gracias a la disponibilidad de big data para
crear modelos de aprendizaje autónomo.

Eficiencia operativa Puede que la eficiencia operativa no sea la noticia más importante,
pero es el área en que big data tiene un mayor impacto. El big data
le permite analizar y evaluar la producción, la opinión de los
clientes, las devoluciones y otros factores para reducir las
situaciones de falta de stock y prever la demanda futura. El big data
también puede utilizarse para mejorar la toma de decisiones en
función de la demanda de mercado del momento.

Impulse la innovación El big data puede ayudarle a innovar mediante el estudio de las
interdependencias entre seres humanos, instituciones, entidades y
procesos, y, posteriormente, mediante la determinación de nuevas
maneras de usar dicha información. Utilice las perspectivas que le
ofrecen los datos para mejorar sus decisiones financieras y
consideraciones de planificación. Estudie las tendencias y lo que
desean los clientes para ofrecer nuevos productos y servicios.
Implemente políticas de precios dinámicas. Las posibilidades son
infinitas.

Desafíos de big data

Si bien es cierto que el big data promete mucho, también se enfrenta a desafíos.

En primer lugar, el big data se caracteriza por su gran tamaño. Aunque se han desarrollado nuevas
tecnologías para el almacenamiento de datos, el volumen de datos duplica su tamaño cada dos
años aproximadamente. Las organizaciones continúan esforzándose por mantener el ritmo de
crecimiento de sus datos y por encontrar formas de almacenarlos eficazmente.

Pero no basta con almacenar los datos. Para ser de algún valor, los datos deben poder utilizarse, y
esto depende de su conservación. Disponer de datos limpios —es decir, datos relevantes para el
cliente y organizados de tal modo que permitan un análisis significativo— requiere una gran
cantidad de trabajo. Los científicos de datos dedican entre un 50 y un 80 por ciento de su tiempo a
seleccionar y preparar los datos antes de que estos puedan utilizarse.

Por último, la tecnología de big data cambia a un ritmo rápido. Hace unos años, Apache Hadoop era
la tecnología más conocida utilizada para administrar big data. Más tarde, en 2014, entraría en juego
Apache Spark. Hoy en día, el enfoque óptimo parece ser una combinación de ambos marcos.
Mantenerse al día en cuanto a tecnología de big data supone un desafío constante.

Cómo funciona big data

El big data le aporta nuevas perspectivas que abren paso a nuevas oportunidades y modelos de
negocio. Iniciarse en ello requiere de tres acciones clave:

1. Integre

El big data concentra datos de numerosas fuentes y aplicaciones distintas. Los mecanismos de
integración de datos convencionales, tales como ETL (extract, transform, load [extraer, transformar,
cargar]), generalmente no están a la altura de dicha tarea. Analizar conjuntos de big data de un
tamaño de uno o más terabytes, o incluso petabytes, requiere de nuevas estrategias y tecnologías.

Durante la integración, es necesario incorporar los datos, procesarlos y asegurarse de que estén
formateados y disponibles de tal forma que los analistas empresariales puedan empezar a
utilizarlos.

2. Administrar

El big data requiere almacenamiento. Su solución de almacenamiento puede residir en la nube, en


las instalaciones o en ambos. Puede almacenar sus datos de cualquier forma que desee e incorporar
los requisitos de procesamiento de su preferencia y los motores de procesamiento necesarios a
dichos conjuntos de datos a pedido. Muchas personas eligen su solución de almacenamiento en
función de dónde residan sus datos en cada momento. La popularidad de La nube está aumentando
progresivamente porque es compatible con sus requisitos tecnológicos actuales y porque le permite
incorporar recursos a medida que los necesita.

3. Analizar

La inversión en big data se rentabiliza en cuanto se analizan y utilizan los datos. Adquiera una nueva
claridad con un análisis visual de sus diversos conjuntos de datos. Continúe explorando los datos
para realizar nuevos descubrimientos. Comparta sus hallazgos con otras personas. Construya
modelos de datos con aprendizaje autónomo e inteligencia artificial. Ponga sus datos en
funcionamiento.

Prácticas recomendadas de big data

Para ayudarle en su transición a big data, hemos recopilado una serie de prácticas recomendadas
que debe tener en cuenta. A continuación, detallamos nuestras pautas para crear con éxito una
base de big data.
Alinear big data con objetivos La disponibilidad de conjuntos de datos más amplios le permite
empresariales específicos realizar nuevos hallazgos. A tal efecto, es importante basar las nuevas
inversiones en habilidades, organización o infraestructura con un
marcado contexto empresarial para garantizar la constancia en la
financiación e inversión en proyectos. Para determinar si se
encuentra en el camino correcto, pregúntese en qué medida el big
data respalda y habilita sus principales prioridades empresariales y
de TI. Algunos ejemplos incluyen entender cómo filtrar los registros
web para comprender el comportamiento del comercio electrónico,
extraer la percepción de las redes sociales y de las interacciones de
atención al cliente, así como entender los métodos de correlación
estadística y su relevancia para los datos de clientes, productos,
fabricación e ingeniería.

Mitigue la escasez de habilidades Uno de los mayores obstáculos para beneficiarse de su inversión en
con estándares y gobierno big data es la escasez de habilidades. Puede mitigar el riesgo
asegurándose de incorporar a su programa de gobierno de TI
tecnologías, consideraciones y decisiones relativas a big data.
Normalizar su enfoque le permitirá administrar los costos y
aprovechar los recursos. Las organizaciones que implementen
soluciones y estrategias de big data deben evaluar sus necesidades
de habilidades de forma temprana y frecuente, e identificar de
manera proactiva las posibles carencias de habilidades. Esto puede
lograrse mediante la capacitación regular o cruzada entre los
recursos existentes, la contratación de nuevos recursos y el uso de
empresas de consultoría.

Optimizar la transferencia de Utilice un enfoque basado en un centro de excelencia para compartir


conocimientos con un centro de conocimientos, supervisar el control y administrar las
excelencia comunicaciones de proyectos. Tanto si el big data es una inversión
nueva o en expansión, los costos directos e indirectos pueden
distribuirse en toda la empresa. Utilizar este enfoque puede
contribuir a incrementar las capacidades de big data y la madurez del
conjunto de la arquitectura de información de una forma más
sistemática y estructurada.

La principal ventaja reside en


alinear los datos estructurados y Analizar el big data de forma aislada sin duda aporta valor. Sin
no estructurados embargo, puede obtener una perspectiva empresarial aún más
valiosa relacionando e integrando el big data de baja densidad con
los datos estructurados que ya usa actualmente.

Tanto si está recopilando big data de clientes, de productos, de


equipos o ambientales, el objetivo es añadir puntos de datos más
relevantes a sus resúmenes maestros y analíticos, lo que le permitirá
obtener mejores conclusiones. Por ejemplo, existe una diferencia en
distinguir la percepción de todos los clientes de la de solo sus mejores
clientes. Por eso, muchos consideran que big data constituye una
extensión integral de sus capacidades existentes de inteligencia
empresarial, de su plataforma de almacenamiento de datos y de su
arquitectura de información.

Tenga en cuenta que los modelos y procesos analíticos de big data


pueden ser tanto humanos como automáticos. Las capacidades de
análisis de big data incluyen estadísticas, análisis especiales,
semántica, detección interactiva y visualización. Mediante el uso de
modelos analíticos, puede relacionar distintos tipos y fuentes de
datos para realizar asociaciones y hallazgos significativos.

Planificar el laboratorio de El concepto "hallazgo" implica que los datos no siempre se obtienen
hallazgos en pro del rendimiento directamente. En ocasiones, ni siquiera sabemos qué estamos
buscando. Eso es de esperar. La dirección y los equipos de TI deben
respaldar esta "falta de dirección" o "falta de claridad en los
requisitos".

Al mismo tiempo, es importante que analistas y científicos de datos


colaboren estrechamente con la empresa para entender las
principales necesidades y las carencias de conocimientos de la
empresa. Para incorporar el estudio interactivo de los datos y la
experimentación de algoritmos estadísticos, necesita contar con
áreas de trabajo de alto rendimiento. Asegúrese de que los entornos
de pruebas (sandbox) tienen el apoyo que necesitan y están
correctamente gobernados.

Alineación con el modelo Los usuarios y procesos de big data requieren acceso a una amplia
operativo en la nube variedad de recursos de experimentación reiterativa y ejecución de
tareas de producción. Una solución de big data incluye todos los
ámbitos de los datos, incluidas transacciones, datos principales,
datos de referencia y datos resumidos. Los entornos de pruebas
(sandbox) analíticos deben crearse a pedido. La administración de
recursos es fundamental para garantizar el control de todo el flujo de
datos, incluido el procesamiento previo y posterior, la integración, el
resumen dentro de la base de datos y la creación de modelos
analíticos. Disponer de una estrategia bien definida de
aprovisionamiento y seguridad en la nube pública y privada es
fundamental para respaldar estos requisitos cambiantes.

También podría gustarte