Está en la página 1de 16

Traducido del inglés al español - www.onlinedoctranslator.

com

PAPEL BLANCO

elitle5 Componentes esenciales de una estrategia de datos


yo

Contenido
Estrategia de datos: ¿Qué problema resuelve? .................................................. ........ 1

Datos: pasado y presente .............................................. .......................................... 2

El negocio sin una estrategia de datos ............................................... .......... 2

Definición de la estrategia de datos .............................................. ............................................. 4

Los 5 componentes de una estrategia de datos ........................................... .......... 4

Identificar ................................................. .................................................... .........................5

Tienda................................................. .................................................... .............................6

Disposición ................................................. .................................................... ......................8

Proceso ................................................. .................................................... .........................9

Gobernar ................................................. .................................................... .....................10

Definir una estrategia de datos es clave ........................................ ..........................12

El poder de una estrategia de datos ............................................ ..............................12

Aprende más ................................................ .................................................... ........13


1

A pesar de las fuertes inversiones a largo plazo en la gestión de datos, los problemas de datos en muchas

organizaciones continúan creciendo. Una de las razones es que los datos se han percibido tradicionalmente

como solo un aspecto de un proyecto tecnológico; no ha sido tratado como un activo corporativo. En

consecuencia, se creía que los esfuerzos tradicionales de planificación de aplicaciones y bases de datos eran

suficientes para abordar los problemas de datos en curso.

A medida que nuestros almacenes de datos corporativos han crecido tanto en tamaño como en diversidad de áreas

temáticas, ha quedado claro que es necesaria una estrategia para abordar los datos. Sin embargo, algunos todavía

luchan con la idea de que los datos corporativos necesitan una estrategia integral.

No hay escasez de pensamiento optimista cuando se trata de planes estratégicos y hojas de ruta de las
organizaciones. Para muchos, tales esfuerzos son solo una novedad. De hecho, los planes estratégicos
de las organizaciones a menudo generan muy pocos resultados tangibles para las organizaciones, solo
muchas reuniones y documentación. Un plan exitoso, por otro lado, identificará objetivos realistas
junto con una hoja de ruta que brinde una guía clara sobre cómo hacer mejor el trabajo.

Veamos cómo se desarrolló esto en la vida real en una organización que se dispuso a desarrollar una

estrategia de datos.

Estrategia de datos: ¿Qué problema resuelve?


Considere el ejemplo de un equipo de consultoría que ayuda a un gran banco a desarrollar una estrategia de

datos. Desde el principio, al líder del proyecto le resultó difícil lograr que su vicepresidente entendiera la

necesidad y la importancia de una estrategia de datos. ¿Por qué?

El banco ya tenía éxito. Sus ingresos y costos estaban bien administrados, y las unidades de
negocios individuales y los grupos de tecnología cumplieron bien sus compromisos. Para
crédito del banco, no fue complaciente. La gerencia siempre buscaba formas de aumentar la
productividad de los miembros del personal y reducir los costos continuos. Había todo tipo de
métricas e indicadores clave de rendimiento (KPI) para medir el rendimiento de TI, los
beneficios comerciales y el costo total de propiedad. La idea de construir otra hoja de ruta para
abordar un problema que no se entendía bien encontró rechazo.

El vicepresidente dio su explicación junto con algunas preguntas:

“Tenemos docenas de proyectos en marcha en cualquier momento

tiempo. Somos muy buenos administrando nuestras necesidades


de almacenamiento, nuestros sistemas de aplicaciones, las
plataformas analíticas, los costos de software y los presupuestos de
proyectos individuales. Cada proyecto identifica costos de personal
y recursos, y nunca avanzamos sin que el negocio cubra los costos.

¿Por qué necesitamos una estrategia de


datos? ¿Qué problema resolverá?”
2

Con el banco haciendo tantas cosas bien, necesitaba comprender por qué y cómo una estrategia de
datos marcaría la diferencia. Para responder a estas preguntas, es importante considerar cómo se
crearon y usaron los datos en el pasado en comparación con cómo se crean y usan hoy.

Datos: pasado y presente


Érase una vez, los datos se percibían como un subproducto de una actividad o proceso comercial.
Tenía poco valor después de que se completó el proceso. Si bien puede haber una o dos aplicaciones
más que necesitaban acceder al contenido para realizar un seguimiento (p. ej., servicio al cliente,
informes especiales, auditorías, etc.), por lo general se trataba de actividades únicas.

Hoy en día, el negocio es muy diferente. Se acepta el valor de los datos; los resultados de los informes
y análisis han convertido a los datos en la salsa secreta de muchas iniciativas comerciales nuevas. Es
común que los datos de la aplicación se compartan hasta con otros 10 sistemas.

Si bien el valor de los datos ha evolucionado enormemente en los últimos 20 años, y los usuarios comerciales lo

reconocen, pocas empresas han ajustado sus enfoques para capturar, compartir y administrar los activos de

datos corporativos. Su comportamiento refleja una creencia subyacente obsoleta de que los datos son

simplemente un subproducto de la aplicación.

Las organizaciones necesitan crear estrategias de datos que coincidan con las realidades actuales. Para

construir una estrategia de datos tan completa, deben tener en cuenta los compromisos comerciales y

tecnológicos actuales y, al mismo tiempo, abordar nuevas metas y objetivos.

El negocio sin una estrategia de datos


Pensando en la historia, las preocupaciones del ejecutivo del banco no eran difíciles de
entender. Pasó mucho tiempo examinando propuestas de proyectos que emocionaban a
su devoto personal. En muchos casos, las propuestas de proyectos de su equipo trataban
de lograr la perfección: convertir algo que ya funcionaba en algo más rápido, más fuerte o
mejor. El ejecutivo entendió el mundo de los presupuestos y recursos finitos donde
cualquier nuevo proyecto aprobado finalmente quitaría fondos y recursos de otra
solicitud. Su mantra era bien conocido:

“Dime por qué tu idea es más importante que la


artículos que ya están en la lista de prioridades”.

Los consultores estaban preparados para esta discusión.

El problema no estaba relacionado con la premisa o el valor de ningún proyecto individual. El problema
era el enfoque que tomaba cada proyecto y actividad individual. Cada actividad abordó las necesidades
de datos de forma independiente sin ninguna conciencia de los esfuerzos y costos superpuestos.

• La mayoría de los proyectos requerían acceso al mismo contenido de datos. Desafortunadamente, no hubo

coordinación para evitar la superposición (y el desperdicio) de trabajo.

• No hubo intercambio de datos, ni reutilización de datos, ni actividades de economías de escala


para simplificar o reducir el costo del movimiento y desarrollo de datos.
3

• Los usuarios comerciales accedieron a datos comunes a través de aplicaciones separadas. Los nombres y el

formato de los valores de datos variaron según las aplicaciones.

• Los usuarios encontraron inconsistencias entre los informes porque los datos de origen no estaban

documentados y variaban entre los informes individuales.

El resultado fue datos duplicados, superposiciones de procesamiento y poca conciencia de que los
proyectos individuales estaban replicando el trabajo. No había nada para apoyar la comunicación, la
colaboración o el intercambio de métodos y prácticas de datos entre proyectos y sistemas.

El problema: todos los proyectos del banco abordaron los problemas de datos como actividades únicas creadas

desde cero.

Estudio de caso: los desafíos de datos del banco

El equipo de TI del banco tenía 17 proyectos en marcha (nuevas aplicaciones, mejoras


de aplicaciones, nuevos informes, etc.).

• Cada proyecto requería acceso a los datos del cliente y cada uno tenía tareas
y recursos superpuestos.

• Cada proyecto incluía una actividad de análisis e inventario de datos de origen


porque no había forma de saber dónde residían los datos específicos.

• Se tuvieron que crear nuevos extractos de datos (subconjuntos de los datos de la


aplicación copiados para su uso por otros sistemas) porque TI no tenía manera de
determinar si los datos ya estaban disponibles.

• No hubo dos equipos que compartieron sus datos de extracción de origen. Cada uno tenía sus propias

copias para respaldar sus actividades de integración y creación de bases de datos (lo que

ocupaba el almacenamiento para este contenido transitorio).

• La lógica de integración de cada equipo se creó a la medida y se mantuvo


individualmente, porque la lógica y las reglas no se identificaron ni
documentaron para compartir.

El personal comercial, que depende de sus propios esfuerzos operativos y de


informes, había experimentado otros desafíos:

• Marketing tuvo que actualizar continuamente su sistema de campañas para


adaptarse a los cambios frecuentes (y no comunicados) que ocurrían en los
diseños de los extractos que recibía.

• Los gerentes de ventas siempre tenían preguntas sobre los informes de KPI con detalles de
los clientes porque los títulos y las etiquetas variaban entre los informes (aunque
contenían datos comunes).

• Los usuarios de las unidades de negocio a menudo creaban sus propios informes en
lugar de utilizar los informes estándar de finanzas, porque no había forma de
determinar el origen de los datos del informe estándar.

• El equipo de almacenamiento de datos tenía que perseguir continuamente los problemas de datos

porque los problemas de datos no se gestionaban como otras actividades de soporte empresarial.
4

Estrategia de datos definida


Los conceptos de estándares, colaboración y reutilización se entienden bien en todas las organizaciones

dentro de la mayoría de las empresas. La mayoría de los equipos de desarrollo conocen bien la arquitectura

del sistema, los métodos de desarrollo, la recopilación de requisitos, las pruebas e incluso la reutilización del

código. La mayoría de los equipos comerciales pueden recitar los conceptos de requisitos comerciales,

definición de procesos comerciales y medición de resultados. Desafortunadamente, la noción de aplicar estos

conceptos a los datos para mejorar la precisión, el acceso, el intercambio y la reutilización aún es ajena a la

mayoría de las organizaciones.

La idea detrás del desarrollo de una estrategia de datos es asegurarse de que todos los recursos de datos

estén posicionados de tal manera que puedan usarse, compartirse y moverse de manera fácil y eficiente. Los La estrategia de Adata es un
datos ya no son un subproducto del procesamiento comercial: son un activo fundamental que permite el
plan diseñado para mejorar
procesamiento y la toma de decisiones. Una estrategia de datos ayuda al garantizar que los datos se
administren y utilicen como un activo. Proporciona un conjunto común de metas y objetivos en todos los todas las formas en que
proyectos para garantizar que los datos se utilicen de manera eficaz y eficiente. Una estrategia de datos
adquiere, almacena, administra,
establece métodos, prácticas y procesos comunes para administrar, manipular y compartir datos en toda la

empresa de manera repetible. comparte y usa datos.

Si bien la mayoría de las empresas tienen en marcha múltiples iniciativas de gestión de datos (metadatos,

gestión de datos maestros, gobierno de datos, migración de datos, modernización, integración de datos,

calidad de datos, etc.), la mayoría de los esfuerzos se centran en soluciones puntuales que abordan

necesidades específicas de proyectos u organizaciones. Una estrategia de datos establece una hoja de ruta

para alinear estas actividades en cada disciplina de gestión de datos de tal manera que se complementen y se

desarrollen entre sí para brindar mayores beneficios.

Los 5 componentes de una estrategia de datos


Históricamente, las organizaciones de TI han definido una estrategia de datos con un enfoque en el

almacenamiento. Han creado planes integrales para dimensionar y administrar sus plataformas y han

desarrollado métodos sofisticados para manejar la retención de datos. Si bien esto es ciertamente importante,

en realidad aborda los aspectos tácticos del almacenamiento de contenido: no se trata de planificar cómo

mejorar todas las formas en que adquiere, almacena, administra, comparte y usa datos.

Una estrategia de datos debe abordar el almacenamiento de datos, pero también debe tener en cuenta la

forma en que se identifican, acceden, comparten, entienden y utilizan los datos. Para tener éxito, una

estrategia de datos debe incluir cada una de las diferentes disciplinas dentro de la gestión de datos. Solo

entonces abordará todos los problemas relacionados con hacer que los datos sean accesibles y utilizables para

que puedan respaldar la multitud de actividades de procesamiento y toma de decisiones de hoy.

Hay cinco componentes básicos de una estrategia de datos que funcionan juntos como bloques de construcción

para respaldar de manera integral la gestión de datos en una organización: identificar, almacenar, aprovisionar,

procesar y gobernar.
5

Identificar

Él
Gobernar Centro Tienda
Componentes

Proceso Disposición

Figura 1: Los cinco componentes centrales de una estrategia de datos.

Identificar

Identificar datos y comprender su significado independientemente de su estructura, origen o

ubicación

Una de las construcciones más básicas para usar y compartir datos dentro de una empresa es establecer un

medio para identificar y representar el contenido. Ya sea contenido estructurado o no estructurado, manipular

y procesar datos no es factible a menos que el valor de los datos tenga un nombre, un valor definido.

representación de formato y valor (incluso los datos no estructurados tienen estos detalles). Establecer

convenciones consistentes de nomenclatura y valor de elementos de datos es fundamental para usar y

compartir datos. Estos detalles deben ser independientes de cómo se almacenan los datos (en una base de

datos, archivo, etc.) o el sistema físico donde residen.

También es importante tener un medio para hacer referencia y acceder a los metadatos asociados con
sus datos (definición, origen, ubicación, valores de dominio, etc.). De la misma manera que tener un
catálogo de tarjetas preciso respalda el éxito de una persona al usar una biblioteca para recuperar un
libro, el uso exitoso de los datos depende de la existencia de metadatos (para ayudar a recuperar
elementos de datos específicos). Consolidar la terminología comercial y el significado en un glosario de
datos comerciales es un medio común para abordar parte del desafío.
6

Las bibliotecas tienen catálogos de tarjetas porque no es práctico recordar la ubicación de cada libro.
Los metadatos son fundamentales para el uso de datos comerciales porque es imposible conocer la
ubicación y el significado de todos los datos comerciales de la empresa: miles de elementos de datos
en numerosas fuentes de datos. Sin detalles de identificación de datos, se vería obligado a realizar un
esfuerzo de inventario y análisis de datos cada vez que quisiera incluir nuevos datos en sus actividades
de procesamiento o análisis.

Sin un glosario de datos y metadatos (es decir, el "catálogo de tarjetas de datos"), es probable que las

empresas ignoren algunos de sus activos de datos más preciados porque no sabrán que existen. Si los

datos son realmente un activo corporativo, una estrategia de datos debe garantizar que todos los datos

puedan identificarse.

Localización

Producto

C cliente
UN
tributo Fuente De nición Tipo ... ... Mayordomo

C identificación del cliente VentasCRM Valor de identificación única Entero ... ... Susana Craff

fi primer nombre CapBilling Nombre del cliente Personaje ... ... Susana Craff

L nombre ultimo CapBilling Apellido del cliente Personaje ... ... Susana Craff

METRO inicial del medio CapBilling Inicial del segundo nombre del cliente Personaje ... ... Susana Craff

Hcalle ome ServCont Dirección de la calle de la casa Personaje ... ... Susana Craff

Ciudad de origen ServCont ciudad de residencia Personaje ... ... Susana Craff

... ... ... ... ... ... ...

... ... ... ... ... ... ...

Figura 2: Un catálogo de tarjetas de datos.

Tienda

Conservar los datos en una estructura y ubicación que admita un acceso y un procesamiento sencillos y

compartidos

El almacenamiento de datos es una de las capacidades básicas en la cartera de tecnología de una empresa; sin

embargo, es una disciplina compleja. La mayoría de las organizaciones de TI tienen métodos maduros para identificar y

administrar las necesidades de almacenamiento de los sistemas de aplicaciones individuales; cada sistema recibe

suficiente almacenamiento para soportar sus propios requisitos de procesamiento y almacenamiento. Ya sea que se

trate de aplicaciones de procesamiento transaccional, sistemas analíticos o incluso almacenamiento de datos de uso

general (archivos, correo electrónico, imágenes, etc.), la mayoría de las organizaciones utilizan métodos sofisticados

para planificar la capacidad y asignar el almacenamiento a los distintos sistemas. Desafortunadamente, este enfoque

solo refleja una perspectiva de "creación de datos". No abarca el intercambio y uso de datos.

La brecha en este enfoque es que rara vez existe un plan para administrar de manera eficiente el

almacenamiento necesario para compartir y mover datos entre sistemas. La razón es simple; el intercambio de

datos más visible en el mundo de TI es de naturaleza transaccional. Los detalles transaccionales entre

aplicaciones se mueven y comparten para completar un proceso comercial específico. El intercambio masivo de

datos no se entiende bien y, a menudo, se percibe como algo único o poco frecuente.
7

Con la popularidad de los grandes datos, el crecimiento de los análisis de negocios y el mayor intercambio de

información entre empresas, es mucho más común compartir grandes volúmenes (o grandes cantidades) de

datos. La mayor parte de este contenido compartido se divide en dos categorías: datos creados internamente revista Forbes 1

(detalles del cliente, detalles de compra, etc.) y contenido creado externamente (aplicaciones en la nube, datos
identificó a un médico
de terceros, contenido sindicado, etc.). La falta de un proceso de intercambio de datos gestionado de forma

centralizada suele obligar a todos los sistemas a gestionar este espacio de forma individual, por lo que cada instalación de investigación
uno crea su propia copia de la fuente.
que genera 100 terabytes de

A medida que las organizaciones evolucionaron y los activos de datos crecieron, se hizo evidente que almacenar todos datos que finalmente se
los datos en una sola ubicación no es factible. No es que no podamos construir un sistema lo suficientemente grande
copiaron y retuvieron
como para albergar el contenido. El problema es que el tamaño y la naturaleza distribuida de nuestras organizaciones, y

la diversidad de nuestras fuentes de datos, hacen que la carga de datos en una sola plataforma sea poco práctica. No
por 18 equipos diferentes
todo el mundo necesita acceso a todos los datos de la empresa; necesitan acceso a datos específicos para apoyar sus y requirió más
necesidades individuales.
de 10 petabytes
La clave es asegurarse de que haya un medio práctico para almacenar todos los datos que se crean de una manera que de almacenamiento
permita acceder a ellos y compartirlos fácilmente. No tiene que almacenar todos los datos en un solo lugar; necesita
1
almacenar los datos una vez y proporcionar una forma para que las personas los encuentren y accedan a ellos. Mejores prácticas para la gestión de Big
Data, por Ash Ashutosh. forbes.com

Una vez que se crean los datos, se compartirán con muchos otros sistemas; es fundamental abordar el almacenamiento

de manera eficiente, de una manera que simplifique el acceso. Una buena estrategia de datos garantizará que todos los

datos creados estén disponibles para acceder a ellos en el futuro sin que todos tengan que crear sus propias copias.

Aplicaciones en la nube Compañeros de negocio

Social
Apoyo SFA
Medios de comunicación Proveedores Distribución
Interno Proveedores externos

Finanzas
Datos sindicado
Ventas Inventario
Vendedores Datos

Márketing Ventas Finanzas Apoyo

Figura 3: cada sistema que crea sus propias copias de datos provoca un aumento de cuatro veces en almacenamiento y procesamiento.
8

Disposición

Empaquete los datos para que puedan ser reutilizados y compartidos, y proporcione reglas y

pautas de acceso a los datos.

En los primeros días de TI, la mayoría de los sistemas de aplicaciones se construyeron como motores
de procesamiento de datos individuales e independientes que contenían todos los datos necesarios
para realizar sus tareas definidas. Se pensó poco o nada en compartir datos entre aplicaciones. Los
datos se organizaron y almacenaron para la comodidad de la aplicación que recopiló, creó y almacenó
el contenido.

Cuando surgía una solicitud ocasional de datos, un desarrollador de aplicaciones creaba un extracto volcando

esos datos en un archivo o creando un programa único para respaldar la solicitud de otra aplicación. El

desarrollador no pensó en las necesidades continuas de aprovisionamiento de datos, ni en la reutilización o el

intercambio de datos. En ese momento, el intercambio de datos era poco frecuente. Hoy en día, el intercambio

de datos definitivamente no es una necesidad especializada o una ocurrencia poco frecuente: otros 10

sistemas suelen utilizar los datos para respaldar procesos comerciales adicionales y la toma de decisiones.

Pero la mayoría de los sistemas de aplicaciones no fueron diseñados para compartir datos. La lógica y las reglas

requeridas para decodificar datos para que otros los usen rara vez se documentan o incluso se conocen fuera del equipo

de desarrollo de aplicaciones. La mayoría de las organizaciones de TI no proporcionan presupuesto ni recursos de

personal para abordar el intercambio de datos no transaccionales. En cambio, se maneja como una cortesía o

conveniencia, y a menudo se aborda como un favor personal entre los miembros del personal.

Cuando se comparten datos, generalmente se empaquetan según la conveniencia del desarrollador de


la aplicación, no del usuario de datos. Tal enfoque podría haber sido aceptable en años anteriores,
cuando solo unos pocos sistemas y un par de equipos necesitaban acceso. Pero es completamente
impráctico en el mundo actual, donde TI administra docenas de sistemas que dependen de datos de
múltiples fuentes para respaldar procesos comerciales individuales. Empaquetar y compartir datos a la
conveniencia de un desarrollador de una sola fuente, en lugar de que las personas administren 10
sistemas posteriores que requieren los datos, es ridículo. Y esperar que las personas aprendan las
idiosincrasias de docenas de sistemas de aplicaciones fuente solo para que puedan usar los datos es
una increíble pérdida de tiempo.

Identificación del cliente FNombre MNombre LNombre Fecha de nacimiento MTeléfono ResAddress
SFA 1298116 William Jaime Sosulski 12/04/39 9738723424 123 Oak St., Evas, IL 30319

Núm.cliente PrimeroNm MI ÚltimoNm fecha de nacimiento Teléfono de casa Dirección de contacto

Ventas 7B983 William j Sosulski 9736780994 437 Main St. Chicago, IL

Cuenta Primer nombre Medio Apellido Bfecha Teléfono Dirección


cuenta 1695281 Guillermo Jaime corporación 12 de Abril 5634911234 3224 Pkwy G, Los Osos

Cliente Primer nombre Nombre medio LNombre fecha de nacimiento Contacto Dirección
Apoyo 1298116 William Jaime Sosulski 12/04/1939 3154789087 123 Oak St., Evas, IL 30319

Figura 4: Detalles del cliente almacenados y referenciados de manera diferente en cada aplicación operativa.
9

Compartir datos ya no es una capacidad técnica especializada que deben abordar los arquitectos y

programadores de aplicaciones. Se ha convertido en una necesidad empresarial de producción. Las empresas

dependen de que los datos se compartan y distribuyan para respaldar las necesidades operativas y analíticas.

Compartir datos no se puede administrar como una cortesía; el método para empaquetar y compartir datos no

puede tratarse como una necesidad única.

Si los datos de una empresa son realmente un activo corporativo, entonces todos los datos deben empaquetarse y

prepararse para compartir. Para tratar los datos como un activo en lugar de una carga para hacer negocios, una

estrategia de datos debe abordar el aprovisionamiento de datos como un proceso comercial estándar.

Proceso
Mueva y combine datos que residen en sistemas dispares y proporcione una vista de datos

uniforme y unificada

Los datos generados a partir de aplicaciones son un tesoro de conocimiento, pero los datos son un producto

básico en el momento de la creación. No ha sido preparado, transformado o corregido para que esté “listo para

usar”. El proceso es el componente de la estrategia de datos que aborda las actividades necesarias para que los
Mientras que la mayoría de las organizaciones
datos evolucionen de un ingrediente sin procesar a un bien terminado.
ciones tienen iniciativas para
Los datos del sistema de origen son muy parecidos a una materia prima en un proceso de fabricación. Para
abordar la reutilización de código
que un fabricante construya un producto (digamos una caja de cereal), debe adquirir una gran cantidad de

materias primas (harina, fruta, nueces, cartón, tinta de imprenta, etc.) y desarrollar un proceso de fabricación y colaboración para
para construir y entregar un caja de cereal al estante del tendero. Una caja llena de harina, nueces y tinta no
desarrollo de aplicaciones-
está lista para usarse; Se requiere hornear, procesar, empacar y enviar para hacer un producto que esté listo

para usar y disponible en el estante del supermercado. ment, no han centrado


este esfuerzo en la

Los datos generados a partir de una aplicación son en gran medida un ingrediente en bruto. En la
entrega de datos que
mayoría de las empresas, los datos se originan tanto en fuentes internas como externas. Los datos está listo para usar y
internos se generan a partir de docenas (si no cientos) de sistemas de aplicaciones. Los datos externos
pueden provenir de una variedad de fuentes diferentes (aplicaciones en la nube, socios comerciales,
promueve compartir
proveedores de datos, agencias gubernamentales, etc.). Si bien estos datos a menudo son ricos en y reutilizar.
información, no se empaquetaron de manera que se integraran con la combinación única de fuentes
que existen dentro de cada empresa individual. Para que los datos estén listos para usar, se necesitan
una serie de pasos para transformar, corregir y formatear los datos. El resultado de este proceso es un
pequeño conjunto de conjuntos de datos homogéneos que un usuario de datos puede fusionar o
integrar con un conjunto de tareas de preparación de datos específicas para sus necesidades
individuales (análisis,

Es común que las empresas establezcan un equipo centralizado para abordar la limpieza, estandarización,

transformación e integración de datos para el almacén de datos. Desafortunadamente, muchos han aprendido

que este tipo de procesamiento no es exclusivo de un almacén de datos. La mayoría de los usuarios de datos

(aplicaciones, usuarios de análisis, desarrolladores, etc.) requieren datos listos para usar, por lo que estos
usuarios terminan asumiendo el esfuerzo de desarrollo ellos mismos. Desarrollar código para identificar y

hacer coincidir registros en estas fuentes individuales puede ser bastante complejo, especialmente cuando

algunos sistemas requieren datos de 20 o más fuentes.


10

Los desarrolladores dedican mucho tiempo a crear lógica para hacer coincidir y vincular valores en una

multitud de fuentes. Desafortunadamente, como cada nuevo equipo de desarrollo requiere acceso a fuentes

de datos individuales, reconstruyen o reinventan la lógica necesaria para vincular valores a través de las

mismas fuentes de datos. La tragedia de la integración de datos es que esta reelaboración ocurre con cada

nuevo proyecto porque los aprendizajes del pasado nunca se capturan para su reutilización.

Si bien la mayoría de las organizaciones tienen iniciativas para abordar la reutilización de código y la

colaboración para el desarrollo de aplicaciones, no han centrado este esfuerzo en entregar datos que estén

listos para usar y promuevan el uso compartido y la reutilización. No es práctico (ni apropiado) que los usuarios

de datos se conviertan en desarrolladores. Hacer que los datos estén listos para usar consiste en ofrecer

herramientas y establecer procesos para producir datos que las personas puedan usar, sin la participación de

TI.

Gobernar

Establecer, gestionar y comunicar políticas y mecanismos de información para un uso


efectivo de los datos

Dado que los datos todavía se perciben a menudo como un subproducto del procesamiento de aplicaciones,

pocas organizaciones han desarrollado por completo los métodos y procesos necesarios para administrar datos

fuera del contexto de una aplicación y en toda la empresa. Si bien muchos han comenzado a invertir en

iniciativas de gobierno de datos, muchos aún se encuentran en la etapa inicial de sus respectivas iniciativas.

Datos del cliente Datos de precios Los datos de ventas Contactos del cliente
(archivo plano) (hoja de cálculo) (tabla DBMS) (aplicación en la nube)

Datos
Fuentes

Solicitud

Ventas Campaña BI/DW


Pronóstico administración Informes

Figura 5: Cada fuente de datos contiene datos únicos (cuadros de colores). Dado que cada aplicación crea su propia lógica de integración, los valores
de los datos pueden diferir en cada aplicación.
11

La mayoría de las iniciativas de gobierno de datos comienzan abordando problemas tácticos específicos (p. ej.,

precisión de datos, definición de reglas comerciales o estándares de terminología) y se limitan a organizaciones o

proyectos específicos. A medida que aumenta la conciencia sobre la gobernanza y que los problemas de uso e

intercambio de datos ganan visibilidad, las iniciativas de gobernanza a menudo amplían su alcance. A medida que se

expanden esas iniciativas, las organizaciones pueden establecer un conjunto de políticas, reglas y métodos de

información para garantizar el uso, la manipulación y la gestión uniformes de los datos.

Dato de governancia
Pero con demasiada frecuencia, el gobierno de datos se percibe como un rigor específico solo para los
usuarios y el entorno de análisis. De hecho, el gobierno de datos se aplica a todas las aplicaciones, proporciona lo necesario
sistemas y miembros del personal. El mayor desafío con el gobierno de datos es la adopción, porque el rigor sobre el contenido de
gobierno de datos es un conjunto general de políticas y reglas de información que todos deben
respetar y seguir.
los datos como cambios

ocurrir a la tecnología,
La razón para establecer un proceso de gobierno sólido es garantizar que, una vez que los datos se

desacoplan de la aplicación que los creó, las reglas y los detalles de los datos sean conocidos y respetados
procesamiento y
por todos los demás componentes de los datos. El papel que desempeña la gobernanza dentro de una áreas metodológicas
estrategia general de datos es garantizar que los datos se gestionen de forma coherente en toda la empresa.
asociado con el esfuerzo de la

estrategia de datos.
Ya sea para determinar los detalles de seguridad, la lógica de corrección de datos, los estándares de

nomenclatura de datos o incluso para establecer nuevas reglas de datos, el gobierno de datos eficaz garantiza

que los datos se gestionen, manipulen y accedan de forma coherente. Las decisiones sobre cómo se procesan,

manipulan o comparten los datos no las toma un desarrollador individual; están establecidos por las reglas y

políticas de gobierno de datos.

El propósito del gobierno de datos no es limitar el acceso a los datos o insertar un nivel de rigor duro e

inutilizable que interfiere con el uso. Su premisa es simplemente garantizar que los datos sean más fáciles de

acceder, usar y compartir. El rigor introducido por un esfuerzo de gobierno de datos no debería ser

abrumador ni oneroso. Si bien el gobierno de datos puede afectar inicialmente la productividad de los

desarrolladores (debido a los nuevos procesos y actividades de trabajo), los beneficios para los componentes

de datos posteriores y las mejoras dramáticas en la productividad deberían contrarrestar con creces el

impacto inicial.

No debería sorprender que una estrategia de datos tenga que incluir el gobierno de datos. Simplemente no es

práctico avanzar, sin un esfuerzo de gobierno integrado, en el establecimiento de un plan y una hoja de ruta

para abordar todas las formas en que captura, almacena, administra y usa la información. El gobierno de

datos proporciona el rigor necesario sobre el contenido de los datos a medida que se producen cambios en

las áreas de tecnología, procesamiento y metodología asociadas con el esfuerzo de la estrategia de datos.
12

Definir una estrategia de datos es clave


Casi todas las aplicaciones o informes nuevos requieren acceso a otra información corporativa. Y en la

mayoría de los casos, el único método práctico para que los desarrolladores determinen la existencia de esos

datos e identifiquen la mejor fuente potencial es a través de conversaciones, reuniones y conocimientos

tribales. Pero a medida que aumentan las aplicaciones de origen y las aplicaciones basadas en la nube, la

cantidad resultante de sistemas que crean datos se ha expandido mucho más allá del conocimiento de

cualquier individuo. Simplemente hay demasiados sistemas, fuentes y datos para que cualquiera pueda

rastrearlos y administrarlos todos. El uso de los activos de datos de la empresa no debe depender del boca a

boca o del conocimiento tribal.

Si bien la mayoría de las empresas han invertido millones de dólares para mejorar la gestión de datos, la

mayoría de las actividades son soluciones puntuales que abordan problemas y cuestiones individuales. Pocas

personas son conscientes del impacto que una sola inversión puede tener para fortalecer o (lamentablemente)

debilitar otros proyectos o iniciativas de datos. El desafío al que se enfrentan la mayoría de las organizaciones
es darse cuenta de que el acceso y el uso de datos abarcan todas las organizaciones y niveles de habilidad de

su empresa.

El riesgo de invertir en una solución puntual es que su naturaleza enfocada evita que aborde problemas que

cruzan los límites de la organización y del proyecto, y los problemas de datos por naturaleza no son específicos

de una sola aplicación u organización. Los esfuerzos para entregar nuevos datos y/o análisis a una empresa no

tendrán éxito a menos que se hayan abordado todos los demás componentes relacionados con los datos:

identificar, almacenar, proporcionar, procesar y gobernar.

El poder de una estrategia de datos


Volviendo a la historia bancaria: una vez que los consultores revisaron los diferentes componentes de
la estrategia de datos con el ejecutivo del banco, comenzó a darse cuenta de que muchos de los
proyectos bajo su dirección no estaban alineados para compartir y hacer crecer los activos de datos de
la empresa. Reconoció que si bien había un rigor considerable en el proyecto para las actividades de
sistemas y aplicaciones, los datos no habían recibido el nivel de atención que necesitaban. Su empresa
ofrecía pocos métodos de proyecto, o incluso herramientas, que respaldaran el intercambio y la
reutilización de datos. Estaba interesado en seguir adelante, pero quería asegurarse de que sus
esfuerzos no fueran percibidos como actividades de cielo azul. Quería objetivos realistas con
entregables medibles. Él explicó:

“Luchamos con nuevas iniciativas estratégicas. Ellos a menudo


fracasan porque los objetivos son de un nivel demasiado alto y el
éxito nunca está bien definido, o se convierten en programas de
'hervir el océano' que se vuelven demasiado costosos o complejos.
Los datos son un gran problema en esta empresa. ¿Cómo
avanzamos sin cometer los mismos errores del pasado? ¿Cómo
emprendemos una nueva iniciativa estratégica como un pequeño
esfuerzo basado en el valor?”
13

La fortaleza de los componentes de la estrategia de datos es que lo ayudan a identificar objetivos enfocados y

tangibles dentro de cada área de disciplina individual. Cada empresa tiene una combinación única de

habilidades y un conjunto diferente de fortalezas y debilidades. Avanzar con una estrategia de datos comienza

con la identificación de las fortalezas y debilidades que existen dentro de su entorno de datos (dentro de cada

área de componente), y la identificación de un conjunto de objetivos alcanzables y medibles que mejorarán el

acceso y el intercambio de datos. El propósito de los componentes no es identificar cada actividad potencial

dentro de una estrategia de datos; los componentes ofrecen visibilidad de las diferentes disciplinas que

contribuyen a una estrategia de datos.

Una iniciativa de estrategia de datos no es un esfuerzo de una sola vez; por su propia naturaleza, una

estrategia es un conjunto de objetivos a largo plazo. Es común identificar un conjunto de objetivos de varios

años e identificar un conjunto de hitos de entrega a más corto plazo (por ejemplo, trimestral o anual). Esto

permite que la estrategia se revise y mida de manera continua para evitar los tipos de desafíos que mencionó

el ejecutivo del banco. Los componentes proporcionan un medio para categorizar actividades e identificar

entregables a más corto plazo.

La mayoría de las empresas ya han invertido en actividades de gestión de datos en las diferentes
áreas de componentes; desafortunadamente, las diferentes áreas no suelen estar coordinadas o
alineadas entre sí. Los desafíos de gestión de datos del banco ilustran cómo la falta de una estrategia
de datos (y actividades alineadas) puede causar tribulaciones significativas para el acceso y uso de
datos. Una estrategia de datos da visibilidad a la relación que cada uno de los componentes (o
disciplinas) tiene entre sí. Si no coordina las diferentes actividades de los componentes, corre el riesgo
de ofrecer una serie de soluciones puntuales que no pueden funcionar juntas.

La idea detrás de una estrategia de datos no es construir un mundo perfecto que pueda abordar cualquier

necesidad de datos imprevista. El poder de una estrategia de datos es que lo posiciona para ofrecer la mejor

solución posible a medida que crecen y evolucionan las necesidades de su organización. Cuando surgen nuevos

requisitos y las brechas se vuelven visibles, el marco de componentes proporciona un método para identificar

los cambios necesarios en las diversas áreas tecnológicas y de capacidad de administración de datos de su

empresa. Su estrategia de datos es una hoja de ruta y un medio para abordar las necesidades de gestión de

datos existentes y futuras.

Aprende más
Para descubrir cómo las soluciones de SAS Data Management pueden ayudarlo a tomar decisiones en las que puede

confiar, visitesas.com/data.
Para ponerse en contacto con su oficina local de SAS, visite:sas.com/oficinas

SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute
Inc. en EE. UU. y otros países. ® indica registro en EE. UU. Otras marcas y nombres de productos son marcas comerciales de sus respectivas
empresas. Copyright © 2018, SAS Institute Inc. Todos los derechos reservados. 108109_G87409.0918

También podría gustarte