Está en la página 1de 16

PAPEL BLANCO

Los 5 componentes esenciales de una estrategia de datos


Título
ii

Contenido
Estrategia de datos: ¿qué problema resuelve? ................................................. 1

Datos: pasado y presente ............................................. ........................................... 2

El negocio sin una estrategia de datos ............................................ ................. 2

Estrategia de datos definida ............................................... ......................................... 4

Los 5 componentes de una estrategia de datos ........................................... ................ 4

Identificar ................................................. .................................................. ......................... 5

Tienda................................................. .................................................. .............................. 6

Disposición ................................................. .................................................. ...................... 8

Proceso ................................................. .................................................. ......................... 9

Regir ................................................. .................................................. ..................... 10

Definir una estrategia de datos es clave ............................................ .......................... 12

El poder de una estrategia de datos ............................................ .............................. 12

Aprende más ................................................ .................................................. ........ 13

Evan Levy, vicepresidente de servicios de gestión de datos en SAS, es un orador y escritor reconocido en las áreas de

estrategia de datos empresariales, gestión de datos e integración de sistemas. Dado que las empresas experimentan un

crecimiento exponencial en los volúmenes, las fuentes y los sistemas de datos, Levy asesora a los clientes sobre

estrategias para abordar los desafíos comerciales utilizando sus datos y activos tecnológicos existentes junto con métodos

y prácticas nuevos y creativos.


1

A pesar de las grandes inversiones a largo plazo en la gestión de datos, los problemas de datos en muchas organizaciones continúan

creciendo. Una razón es que los datos se han percibido tradicionalmente como solo un aspecto de un proyecto de tecnología; no ha

sido tratado como un activo corporativo. En consecuencia, se creía que los esfuerzos tradicionales de planificación de aplicaciones y

bases de datos eran suficientes para abordar los problemas de datos en curso.

A medida que nuestros almacenes de datos corporativos han crecido tanto en tamaño como en diversidad de áreas temáticas, ha quedado

claro que es necesaria una estrategia para abordar los datos. Sin embargo, algunos aún luchan con la idea de que los datos corporativos

necesitan una estrategia integral.

No hay escasez de pensamiento de cielo azul cuando se trata de planes estratégicos y mapas de ruta de las organizaciones. Para

muchos, tales esfuerzos son solo una novedad. De hecho, los planes estratégicos de las organizaciones a menudo generan muy

pocos resultados tangibles para las organizaciones, solo muchas reuniones y documentación. Un plan exitoso, por otro lado,

identificará objetivos realistas junto con una hoja de ruta que brinde una guía clara sobre la mejor manera de hacer el trabajo.

Veamos cómo se desarrolló esto en la vida real en una organización que se propuso desarrollar una estrategia de datos.

Estrategia de datos: ¿qué problema resuelve?


Hace algún tiempo estaba liderando un equipo de consultoría en un gran banco que estaba desarrollando una estrategia de datos.

Desde el principio, al campeón del proyecto le resultó difícil lograr que su vicepresidente entendiera la necesidad y la importancia de una

estrategia de datos. ¿Por qué?

El banco ya tuvo éxito. Sus ingresos y costos estaban bien administrados, y las unidades de negocios individuales y

los grupos tecnológicos eran buenos para cumplir con sus compromisos. Para el crédito del banco, no fue

complaciente. La gerencia siempre estaba buscando formas de aumentar la productividad de los miembros del

personal y reducir los costos continuos. Había todo tipo de métricas e indicadores clave de rendimiento (KPI) para

medir el rendimiento de TI, los beneficios comerciales y el costo total de propiedad. La idea de construir otra hoja de

ruta para abordar un problema que no se entendía bien tuvo un rechazo.

El vicepresidente dio su explicación junto con algunas preguntas:

“Tenemos docenas de proyectos en marcha en un momento dado. Somos muy

buenos en la gestión de nuestras necesidades de almacenamiento, nuestros

sistemas de aplicaciones, las plataformas analíticas, los costos de software y los

presupuestos de proyectos individuales. Cada proyecto identifica los costos de

personal y recursos, y nunca avanzamos sin que la empresa cubra los costos.

¿Por qué necesitamos una estrategia de datos? ¿Qué

problema estás resolviendo?


2

Con el banco haciendo tantas cosas bien, necesitaba entender por qué y cómo una estrategia de datos marcaría la

diferencia. Para responder estas preguntas, primero tenemos que considerar cómo se crearon y usaron los datos en el

pasado en comparación con cómo se crearon y usaron hoy.

Datos: pasado y presente


Érase una vez, los datos se percibían como un subproducto de una actividad o proceso empresarial. Tenía poco valor después

de que se completara el proceso. Si bien podría haber una o dos aplicaciones adicionales que necesitaban acceder al contenido

para el seguimiento (por ejemplo, servicio al cliente, informes especiales, auditorías, etc.), estas eran generalmente actividades

puntuales.

Hoy, el negocio es muy diferente. Se acepta el valor de los datos; Los resultados de informes y análisis han convertido

los datos en la salsa secreta de muchas nuevas iniciativas empresariales. Es común que los datos de la aplicación se

compartan con otros 10 sistemas.

Si bien el valor de los datos ha evolucionado enormemente en los últimos 20 años, y los usuarios comerciales lo reconocen, pocas

empresas han ajustado sus enfoques para capturar, compartir y administrar los activos de datos corporativos. Su comportamiento

refleja una creencia obsoleta y subyacente de que los datos son simplemente un subproducto de la aplicación.

Las organizaciones necesitan crear estrategias de datos que coincidan con las realidades de hoy. Para construir una estrategia

de datos tan completa, deben tener en cuenta los compromisos comerciales y tecnológicos actuales al tiempo que abordan

nuevas metas y objetivos.

El negocio sin una estrategia de datos


Pensando en nuestra historia, las preocupaciones del ejecutivo del banco no fueron difíciles de entender. Pasó
mucho tiempo leyendo propuestas de proyectos por las que su dedicado personal estaba increíblemente
emocionado. En muchos casos, las propuestas de proyectos de su equipo consistían en entregar la perfección:
convertir algo que ya funcionaba en algo más rápido, más fuerte o mejor. El ejecutivo entendió el mundo de los
presupuestos y recursos finitos donde cualquier proyecto nuevo aprobado finalmente quitaría fondos y recursos de
otra solicitud. Su mantra era bien conocido:

"Dime por qué tu idea es más importante que los elementos que ya están

en la lista de prioridades".

Estábamos preparados para esta discusión.

No desafiamos la premisa o el valor de ningún proyecto individual. El problema fue el enfoque que tomó cada
proyecto y actividad individual. Cada actividad abordó las necesidades de datos de forma independiente entre sí
sin ningún conocimiento de los esfuerzos y costos superpuestos.

• La mayoría de los proyectos requieren acceso al mismo contenido de datos. Desafortunadamente, no hubo coordinación para evitar

la superposición (y el desperdicio) del trabajo.

• No hubo intercambio de datos, ni reutilización de datos, ni actividades de economía de escala para simplificar o

reducir el costo del movimiento y desarrollo de datos.


3

• Los usuarios comerciales accedieron a datos comunes a través de aplicaciones separadas. Los nombres de los datos y el

formato variaron entre las aplicaciones.

• Los usuarios encontraron inconsistencias entre los informes porque los datos de origen no estaban documentados y

variaban según los informes individuales.

El resultado fueron datos duplicados, superposiciones de procesamiento y poca conciencia de que los proyectos individuales

estaban replicando el trabajo. No había nada establecido para apoyar la comunicación, la colaboración o el intercambio de

métodos y prácticas de datos entre proyectos y sistemas.

El problema: cada proyecto en el banco abordó los problemas de datos como actividades únicas, construidas desde cero.

Estudio de caso: los desafíos de datos del Banco

El equipo de TI del banco tenía 17 proyectos en marcha (nuevas aplicaciones, mejoras de


aplicaciones, nuevos informes, etc.).

• Cada proyecto requería acceso a los datos del cliente, y cada uno tenía tareas y recursos
superpuestos.

• Cada proyecto incluía un inventario de datos fuente y una actividad de análisis porque no
había forma de saber dónde residían datos específicos.

• Deben construirse nuevos extractos de datos (subconjuntos de los datos de la aplicación copiados para

su uso por otros sistemas) porque TI no tenía forma de determinar si los datos ya estaban disponibles.

• No hay dos equipos que compartan sus datos de extracción de origen. Cada uno tenía sus propias

copias para respaldar sus actividades de integración y creación de bases de datos (que vinculaban el

almacenamiento para este contenido transitorio).

• La lógica de integración de cada equipo fue construida a medida y mantenida individualmente, porque la

lógica y las reglas no fueron identificadas o documentadas para ser compartidas.

El personal de la empresa, que dependía de sus propios esfuerzos operativos y de informes, había
experimentado otros desafíos:

• El departamento de marketing tuvo que actualizar continuamente su sistema de campaña para ajustarse a

los cambios frecuentes (y no comunicados) que se producen en los diseños de los extractos que recibió.

• Los gerentes de ventas siempre tenían preguntas sobre los informes de KPI con detalles de los clientes

porque los títulos y las etiquetas variaban entre los informes (aunque contenían datos comunes).

• Los usuarios de la unidad de negocio a menudo construían sus propios informes en lugar de utilizar los

informes estándar de las finanzas, porque no había forma de determinar el origen de los datos del informe

estándar.

• El equipo de almacenamiento de datos tuvo que perseguir continuamente los problemas de datos porque

los problemas de datos no se administraron como otras actividades de soporte comercial.


44

Estrategia de datos definida


Los conceptos de estándares, colaboración y reutilización se comprenden bien en todas las organizaciones de la mayoría de las

empresas. La mayoría de los equipos de desarrollo están bien educados sobre la arquitectura del sistema, los métodos de desarrollo, la

recopilación de requisitos, las pruebas e incluso la reutilización del código. La mayoría de los equipos comerciales pueden recitar los

conceptos de requisitos comerciales, definición de procesos comerciales y medición de resultados. Desafortunadamente, la noción de

aplicar estos conceptos a los datos para respaldar una mayor precisión, acceso, uso compartido y reutilización aún es extraña para la

mayoría de las organizaciones.

La idea detrás del desarrollo de una estrategia de datos es asegurarse de que todos los recursos de datos estén posicionados

de tal manera que puedan usarse, compartirse y moverse de manera fácil y eficiente. Los datos ya no son un subproducto del Una estrategia de datos es un plan
procesamiento comercial, es un activo crítico que permite el procesamiento y la toma de decisiones. Una estrategia de datos
diseñado para mejorar todas las
ayuda al garantizar que los datos se administren y utilicen como un activo. Proporciona un conjunto común de metas y objetivos

en todos los proyectos para garantizar que los datos se utilicen de manera efectiva y eficiente. Una estrategia de datos establece formas en que adquiere, almacena,
métodos, prácticas y procesos comunes para administrar, manipular y compartir datos en toda la empresa de manera repetible.
administra, comparte y usa datos.

Si bien la mayoría de las empresas tienen en marcha múltiples iniciativas de gestión de datos (metadatos, gestión de datos maestros,

gobernanza de datos, migración de datos, modernización, integración de datos, calidad de datos, etc.), la mayoría de los esfuerzos

se centran en soluciones puntuales que abordan necesidades específicas de proyectos u organizaciones. Una estrategia de datos

establece una hoja de ruta para alinear estas actividades en cada disciplina de gestión de datos de tal manera que se complementen

y se desarrollen mutuamente para brindar mayores beneficios.

Los 5 componentes de una estrategia de datos


Históricamente, las organizaciones de TI han definido la estrategia de datos con un enfoque en el almacenamiento. Han creado

planes integrales para dimensionar y administrar sus plataformas y han desarrollado métodos sofisticados para manejar la

retención de datos. Si bien esto es ciertamente importante, en realidad aborda los aspectos tácticos del almacenamiento de

contenido: no está planeando cómo mejorar todas las formas en que adquiere, almacena, administra, comparte y usa datos.

Una estrategia de datos debe abordar el almacenamiento de datos, pero también debe tener en cuenta la forma en que se identifican,

acceden, comparten, comprenden y utilizan los datos. Para tener éxito, una estrategia de datos debe incluir cada una de las diferentes

disciplinas dentro de la gestión de datos. Solo entonces abordará todos los problemas relacionados con hacer que los datos sean

accesibles y utilizables para que puedan soportar la multitud de actividades actuales de procesamiento y toma de decisiones.

Hay cinco componentes principales de una estrategia de datos que trabajan juntos como bloques de construcción para soportar de

manera integral la gestión de datos en una organización: identificar, almacenar, aprovisionar, procesar y gobernar.
55

Identificar

Los
Regir componentes Tienda

centrales

Proceso Provisión

Figura 1: Los cinco componentes principales de una estrategia de datos.

Identificar

Identificar datos y comprender su significado independientemente de la estructura, el origen o la ubicación.

Una de las construcciones más básicas para usar y compartir datos dentro de una empresa es establecer un medio para

identificar y representar el contenido. Ya sea contenido estructurado o no estructurado, manipular y procesar datos no es

factible a menos que el valor de los datos tenga un nombre, un formato definido y una representación de valores (incluso los

datos no estructurados tienen estos detalles). El establecimiento de convenciones de nombres y elementos de datos

consistentes es esencial para usar y compartir datos. Estos detalles deben ser independientes de cómo se almacenan los datos

(en una base de datos, archivo, etc.) o del sistema físico donde reside.

También es importante tener un medio para hacer referencia y acceder a los metadatos asociados con sus datos (definición,

origen, ubicación, valores de dominio, etc.). De la misma manera que tener un catálogo de tarjetas preciso respalda el éxito de

un individuo al usar una biblioteca para recuperar un libro, el uso exitoso de los datos depende de la existencia de metadatos

(para ayudar a recuperar elementos de datos específicos). Consolidar la terminología comercial y el significado en un glosario

de datos comerciales es un medio común para abordar parte del desafío.


66

Las bibliotecas tienen catálogos de tarjetas porque no es práctico recordar la ubicación de cada libro. Los metadatos son

críticos para el uso de datos comerciales porque es imposible conocer la ubicación y el significado de todos los datos

comerciales de la compañía: miles de elementos de datos en numerosas fuentes de datos. Sin detalles de identificación

de datos, se vería obligado a realizar un inventario de datos y un esfuerzo de análisis cada vez que quisiera incluir datos

nuevos en sus actividades de procesamiento o análisis.

Sin un glosario de datos y metadatos (es decir, el "catálogo de tarjetas de datos"), es probable que las empresas ignoren algunos

de sus activos de datos más preciados porque no sabrán que existen. Si los datos son realmente un activo corporativo, una

estrategia de datos debe garantizar que se puedan identificar todos los datos.

Ubicación

Producto

Cliente

Atributo Fuente Definición Tipo ... . . . Mayordomo

Identificación del cliente Valor SalesCRM que identifica de forma única Entero ... . . . Susan Craff

Nombre de pila Nombre del cliente de CapBilling Personaje ... . . . Susan Craff

Apellido Apellido del cliente de CapBilling Personaje ... . . . Susan Craff

inicial del segundo nombre Inicial del segundo nombre del cliente CapBilling Personaje ... . . . Susan Craff

Calle de la casa ServCont Dirección de la casa Personaje ... . . . Susan Craff

Ciudad de origen ServCont Ciudad de residencia Personaje ... . . . Susan Craff

... ... ... ... ... ... ...

... ... ... ... ... ... ...

Figura 2: Un catálogo de tarjetas de datos.

Tienda

Datos persistentes en una estructura y ubicación que admite el acceso y procesamiento fácil y compartido

El almacenamiento de datos es una de las capacidades básicas en la cartera de tecnología de una empresa, pero es una disciplina compleja.

La mayoría de las organizaciones de TI tienen métodos maduros para identificar y administrar las necesidades de almacenamiento de los

sistemas de aplicaciones individuales; cada sistema recibe suficiente almacenamiento para soportar sus propios requisitos de procesamiento

y almacenamiento. Ya sea que se trate de aplicaciones de procesamiento transaccional, sistemas analíticos o incluso almacenamiento de

datos de uso general (archivos, correo electrónico, imágenes, etc.), la mayoría de las organizaciones utilizan métodos sofisticados para

planificar la capacidad y asignar el almacenamiento a los diversos sistemas. Desafortunadamente, este enfoque solo refleja una perspectiva

de "creación de datos". No abarca el uso compartido y el uso compartido de datos.

La brecha en este enfoque es que rara vez hay un plan para administrar eficientemente el almacenamiento requerido para

compartir y mover datos entre sistemas. El motivo es simple; El intercambio de datos más visible en el mundo de TI es de

naturaleza transaccional. Los detalles transaccionales entre las aplicaciones se mueven y comparten para completar un proceso

comercial específico. El intercambio masivo de datos no se entiende bien y, a menudo, se percibe como un hecho único o poco

frecuente.
77

Con la popularidad de los grandes datos, el crecimiento de la analítica empresarial y el mayor intercambio de información entre

empresas, es mucho más común compartir datos de grandes volúmenes (o masivos). La mayor parte de este contenido compartido

se divide en dos categorías: datos creados internamente (detalles del cliente, detalles de compra, etc.) y contenido creado revista Forbes 1

externamente (aplicaciones en la nube, datos de terceros, contenido sindicado, etc.). La falta de un proceso de intercambio de datos
identificó un centro de
administrado centralmente generalmente obliga a todos los sistemas a administrar este espacio individualmente, por lo que todos

crean su propia copia de la fuente. investigación médica que

generaba 100 terabytes de datos

A medida que las organizaciones han evolucionado y los activos de datos han crecido, ha quedado claro que almacenar todos los datos en que finalmente fueron copiados y
una sola ubicación no es factible. No es que no podamos construir un sistema lo suficientemente grande como para contener el contenido.
retenidos por 18 equipos
El problema es que el tamaño y la naturaleza distribuida de nuestras organizaciones - y la diversidad de nuestras fuentes de datos - hace

que la carga de datos en una sola plataforma no sea práctica. No todos necesitan acceso a todos los datos de la compañía; necesitan
diferentes y requirieron más de
acceso a datos específicos para satisfacer sus necesidades individuales. 10 petabytes de

almacenamiento.
La clave es asegurarse de que haya un medio práctico para almacenar todos los datos que se crean de una manera que permita acceder y

compartirlos fácilmente. No tiene que almacenar todos los datos en un solo lugar; necesita almacenar los datos una vez y proporcionar una
1 Mejores prácticas para gestionar Big Data, por Ash
manera para que las personas puedan encontrarlos y acceder a ellos.
Ashutosh. Forbes.com

Sabemos que una vez que se crean los datos, se compartirán con muchos otros sistemas; Es fundamental abordar el almacenamiento

de manera eficiente, de una manera que simplifique el acceso. Una buena estrategia de datos asegurará que cualquier información

creada esté disponible para acceso futuro sin requerir que todos creen sus propias copias.

Aplicaciones en la nube Compañeros de negocio

Social Media SFA


Apoyo Proveedores Distribución
Interno Proveedores externos

inventario
sindicados
Proveedores de datos
Ventas Finanzas de
Datos

Márketing Ventas Finanzas Apoyo

Figura 3: cada sistema que crea sus propias copias de datos provoca un aumento de cuatro veces en el almacenamiento y el procesamiento.
8

Provisión
Empaquete los datos para que puedan reutilizarse y compartirse, y proporcione reglas y pautas de acceso para los

datos

En los primeros días de TI, la mayoría de los sistemas de aplicaciones se construyeron como motores de procesamiento de

datos individuales e independientes que contenían todos los datos necesarios para realizar sus tareas definidas. Se pensó

poco o nada en compartir datos entre aplicaciones. Los datos se organizaron y almacenaron para la conveniencia de la

aplicación que recopiló, creó y almacenó el contenido.

Cuando surgió la solicitud ocasional de datos, un desarrollador de aplicaciones creó un extracto al volcar esos datos en un archivo o

al crear un programa único para admitir la solicitud de otra aplicación. El desarrollador no pensó en las necesidades continuas de

aprovisionamiento de datos, ni en la reutilización o el intercambio de datos. En ese momento, el intercambio de datos era poco

frecuente. Hoy en día, el intercambio de datos definitivamente no es una necesidad especializada o una ocurrencia infrecuente: los

otros 10 sistemas a menudo usan los datos para soportar procesos comerciales adicionales y la toma de decisiones.

Pero la mayoría de los sistemas de aplicaciones no fueron diseñados para compartir datos. La lógica y las reglas requeridas para decodificar

datos para el uso de otros rara vez se documentan o incluso se conocen fuera del equipo de desarrollo de aplicaciones. La mayoría de las

organizaciones de TI no proporcionan recursos presupuestarios o de personal para abordar el intercambio de datos no transaccionales. En

cambio, se maneja como una cortesía o conveniencia, y a menudo se aborda como un favor personal entre los miembros del personal.

Cuando se comparten datos, generalmente se empaquetan a conveniencia del desarrollador de la aplicación, no del usuario

de los datos. Tal enfoque podría haber sido aceptable en años pasados, cuando solo unos pocos sistemas y un par de

equipos necesitaban acceso. Pero es completamente poco práctico en el mundo actual, donde TI administra docenas de

sistemas que dependen de datos de múltiples fuentes para respaldar procesos comerciales individuales. Empaquetar y

compartir datos a la conveniencia de un desarrollador de una sola fuente, en lugar de las personas que manejan 10 sistemas

posteriores que requieren los datos, es ridículo. Y esperar que las personas aprendan las idiosincrasias de docenas de

sistemas de aplicaciones de origen solo para que puedan usar los datos es una increíble pérdida de tiempo.

Identificación del cliente FName MName LName Fecha de nacimiento MPhone ResAddress
SFA 1298116 Guillermo James Sosulski 12/04/39 9738723424 123 Oak St., Eves, IL 30319

CustNbr FirstNm MI LastNm Fecha de nacimientoTeléfono de casa Dirección de contacto

Ventas 7B983 Guillermo J. Sosulski 9736780994 437 Main St. Chicago, IL

Cuenta Nombre de pila Medio Apellido BDate Teléfono Habla a


Acct. 1695281 Willaim James Corp. 12 de Abril 5634911234 3224 Pkwy G, Los Osos

Cliente Nombre Nombre medio LName Fecha de nacimiento Contacto Habla a

Apoyo 1298116 Guillermo James Sosulski 04/12/1939 3154789087 123 Oak St., Eves, IL 30319

Figura 4: Detalles del cliente almacenados y referenciados de manera diferente en cada aplicación operativa.
9

Compartir datos ya no es una capacidad técnica especializada que deben abordar los arquitectos y programadores de

aplicaciones. Se ha convertido en una necesidad del negocio de producción. Las empresas dependen de que los datos se

compartan y distribuyan para satisfacer las necesidades operativas y analíticas. Compartir datos no se puede administrar como

cortesía; El método para empaquetar y compartir datos no puede tratarse como una necesidad única.

Si los datos de una empresa son realmente un activo corporativo, entonces todos los datos deben empaquetarse y prepararse para

compartir. Para tratar los datos como un activo en lugar de una carga de hacer negocios, una estrategia de datos debe abordar el

aprovisionamiento de datos como un proceso comercial estándar.

Proceso
Mueva y combine datos que residen en sistemas dispares y proporcione una vista de datos unificada y

consistente

Los datos generados a partir de las aplicaciones son un tesoro de conocimiento, pero los datos son una materia prima en el

momento de la creación. No ha sido preparado, transformado o corregido para que esté "listo para usar". El proceso es el

componente de la estrategia de datos que aborda las actividades requeridas para evolucionar los datos de un ingrediente crudo a
Si bien la mayoría de las
un producto terminado.

organizaciones tienen iniciativas


Los datos del sistema de origen son muy parecidos a un ingrediente crudo en un proceso de fabricación. Para que un fabricante
para abordar la reutilización de
construya un producto (digamos una caja de cereal), debe adquirir una gran cantidad de materias primas (harina, fruta, nueces,

cartón, tinta de impresión, etc.) y desarrollar un proceso de fabricación para construir y entregar un caja de cereal al estante del código y la colaboración para el
supermercado. Una caja llena de harina, nueces y tinta no está lista para usar; Se requiere hornear, procesar, empacar y enviar
desarrollo de aplicaciones, no han
para hacer un producto que esté listo para usar y disponible en el estante de la tienda de comestibles.
centrado este esfuerzo en entregar

datos que estén listos para usar y

Los datos generados a partir de una aplicación son en gran medida un ingrediente crudo. En la mayoría de las empresas, los
promuevan el uso compartido y la
datos se originan en fuentes internas y externas. Los datos internos se generan a partir de docenas (si no cientos) de reutilización.
sistemas de aplicaciones. Los datos externos se pueden entregar desde una variedad de fuentes diferentes (aplicaciones en

la nube, socios comerciales, proveedores de datos, agencias gubernamentales, etc.). Si bien estos datos a menudo son ricos

en información, no se empaquetaron de manera que se integren con la combinación única de fuentes que existen dentro de

cada compañía individual. Para que los datos estén listos para usar, se necesitan una serie de pasos para transformar,

corregir y formatear los datos. El resultado de este proceso es un pequeño conjunto de conjuntos de datos homogéneos que

un usuario de datos puede combinar o integrar con un conjunto de tareas de preparación de datos específicas para sus

necesidades individuales (análisis,

Es común que las empresas establezcan un equipo centralizado para abordar la limpieza, estandarización, transformación e

integración de datos para el almacén de datos. Desafortunadamente, muchos han aprendido que este tipo de procesamiento no es

exclusivo de un almacén de datos. La mayoría de los usuarios de datos (aplicaciones, usuarios de análisis, desarrolladores, etc.)

requieren datos listos para usar, por lo que estos usuarios terminan asumiendo el esfuerzo de desarrollo ellos mismos. El desarrollo

de código para identificar y combinar registros en estas fuentes individuales puede ser bastante complejo, particularmente cuando

algunos sistemas requieren datos de 20 o más fuentes.


10

Los desarrolladores pasan un tiempo enorme construyendo lógica para unir y vincular valores en una multitud de fuentes.

Desafortunadamente, como cada nuevo equipo de desarrollo requiere acceso a fuentes de datos individuales, reconstruyen o

reinventan la lógica necesaria para vincular valores a través de las mismas fuentes de datos. La tragedia de la integración de

datos es que este retrabajo ocurre con cada nuevo proyecto porque los aprendizajes del pasado nunca se capturan para su

reutilización.

Si bien la mayoría de las organizaciones tienen iniciativas para abordar la reutilización de código y la colaboración para el desarrollo de

aplicaciones, no han centrado este esfuerzo en entregar datos que estén listos para usar y promuevan el uso compartido y la

reutilización. No es práctico (ni apropiado) que los usuarios de datos se conviertan en desarrolladores. Hacer que los datos estén listos

para usar se trata de ofrecer herramientas y establecer procesos para producir datos que las personas puedan usar, sin la participación

de TI.

Regir
Establecer, administrar y comunicar políticas y mecanismos de información para el uso efectivo de los

datos.

Dado que los datos aún se perciben a menudo como un subproducto del procesamiento de aplicaciones, pocas organizaciones han

desarrollado completamente los métodos y procesos necesarios para administrar los datos fuera del contexto de una aplicación y en

toda la empresa. Si bien muchos han comenzado a invertir en iniciativas de gobernanza de datos, muchos todavía están en la etapa

inicial de sus respectivas iniciativas.

Datos del cliente Datos de precios Datos de ventas Contactos del cliente

(archivo plano) (hoja de cálculo) (tabla DBMS) (aplicación en la nube)

Datos
Fuentes

Solicitud

Pronóstico de Administración de Informes de


ventas campaña BI / DW

Figura 5: Cada fuente de datos contiene datos únicos (cuadros de colores). Como cada aplicación crea su propia lógica de integración, los valores de los datos pueden diferir en
cada aplicación.
11

La mayoría de las iniciativas de gobernanza de datos comienzan abordando cuestiones tácticas específicas (por ejemplo, precisión de los

datos, definición de reglas de negocio o estándares de terminología) y se limitan a organizaciones específicas o esfuerzos de proyectos. A

medida que aumenta la conciencia de gobernanza, y a medida que los problemas de uso y uso compartido de datos ganan visibilidad, las

iniciativas de gobernanza a menudo amplían su alcance. A medida que esas iniciativas se expanden, las organizaciones pueden establecer

un conjunto de políticas, reglas y métodos de información para garantizar el uso, la manipulación y la gestión uniformes de los datos.

El gobierno de datos proporciona el


Pero con demasiada frecuencia, la gobernanza de datos se percibe como un rigor específico solo para los usuarios y el

entorno analítico. De hecho, el gobierno de datos se aplica a todas las aplicaciones, sistemas y miembros del personal. El rigor necesario sobre el contenido de
mayor desafío con el gobierno de datos es la adopción, porque el gobierno de datos es un conjunto general de políticas y
los datos a medida que ocurren
reglas de información que todos deben respetar y seguir.
cambios en las áreas de tecnología,

procesamiento y metodología
La razón para establecer un proceso de gobernanza sólido es garantizar que una vez que los datos se desacoplan de la aplicación
asociadas con el esfuerzo de la
que los creó, todos los demás componentes de la información conocen y respetan las reglas y los detalles de los datos. El papel

que desempeña la gobernanza dentro de una estrategia general de datos es garantizar que los datos se administren de manera estrategia de datos.
consistente en toda la empresa.

Ya sea para determinar detalles de seguridad, lógica de corrección de datos, estándares de nombres de datos o incluso

establecer nuevas reglas de datos, el gobierno efectivo de los datos asegura que los datos se manejen, manipulen y accedan

de manera consistente. Las decisiones sobre cómo se procesan, manipulan o comparten los datos no son tomadas por un

desarrollador individual; están establecidos por las reglas y políticas de gobierno de datos.

El propósito de la gobernanza de datos no es limitar el acceso a los datos o insertar un nivel de rigor duro e inutilizable que

interfiera con el uso. Su premisa es simplemente garantizar que los datos sean más fáciles de acceder, usar y compartir. El

rigor introducido por un esfuerzo de gobernanza de datos no debería ser abrumador o gravoso. Si bien el gobierno de datos

puede afectar inicialmente la productividad de los desarrolladores (debido a los nuevos procesos y actividades de trabajo), los

beneficios para los componentes de datos posteriores y las mejoras dramáticas en la productividad deberían más que

contrarrestar el impacto inicial.

No debería sorprendernos que una estrategia de datos tenga que incluir la gobernanza de datos. Simplemente no es práctico

avanzar, sin un esfuerzo de gobernanza integrado, para establecer un plan y una hoja de ruta para abordar todas las formas en

que captura, almacena, administra y usa la información. El gobierno de datos proporciona el rigor necesario sobre el contenido de

los datos a medida que ocurren cambios en las áreas de tecnología, procesamiento y metodología asociadas con el esfuerzo de

la estrategia de datos.
12

Definir una estrategia de datos es clave


Casi todas las aplicaciones o informes nuevos requieren acceso a otra información corporativa. Y en la mayoría de los casos, el

único método práctico para que los desarrolladores determinen la existencia de esos datos e identifiquen la mejor fuente

potencial es a través de conversaciones, reuniones y conocimiento tribal. Pero a medida que aumentan las aplicaciones de

origen y crecen las aplicaciones basadas en la nube, el número resultante de sistemas que crean datos se ha expandido mucho

más allá del conocimiento de cualquier individuo. Simplemente hay demasiados sistemas, fuentes y datos para que cualquiera

pueda rastrearlos y administrarlos. El uso de los activos de datos de la empresa no debe basarse en el boca a boca o el

conocimiento tribal.

Si bien la mayoría de las empresas han invertido millones de dólares para mejorar la gestión de datos, la mayoría de las actividades

son soluciones puntuales que abordan problemas y problemas individuales. Pocas personas son conscientes del impacto que puede

tener una sola inversión en fortalecer o (desafortunadamente) debilitar otros proyectos o iniciativas de datos. El desafío que tienen la

mayoría de las organizaciones es darse cuenta de que el acceso y el uso de datos se extienden a través de cada organización y nivel

de habilidad en su empresa.

El riesgo de invertir en una solución puntual es que su naturaleza enfocada le impide abordar problemas que cruzan los límites de

la organización y del proyecto, y los problemas de datos por naturaleza no son específicos de una sola aplicación u organización.

Los esfuerzos para entregar nuevos datos y / o análisis a una empresa no tendrán éxito a menos que se hayan abordado todos los

demás componentes relacionados con los datos: identificar, almacenar, aprovisionar, procesar y gobernar.

El poder de una estrategia de datos


Volviendo a nuestra historia bancaria: una vez que revisamos los diferentes componentes de la estrategia de datos con el

ejecutivo del banco, comenzó a darse cuenta de que muchos de los proyectos bajo su dirección no estaban alineados para

compartir y hacer crecer los activos de datos de la compañía. Reconoció que si bien había un rigor considerable en el proyecto

para los sistemas y las actividades de aplicación, los datos no habían recibido el nivel de atención que estábamos describiendo.

Su compañía ofreció poco en cuanto a métodos de proyecto, o incluso herramientas, que admitieran el intercambio y la

reutilización de datos. Estaba interesado en seguir adelante, pero quería asegurarse de que sus esfuerzos no fueran percibidos

como actividades de cielo azul. Quería objetivos realistas con resultados medibles. Él explicó:

“Luchamos con nuevas iniciativas estratégicas. A menudo fracasan porque los

objetivos son demasiado altos y el éxito nunca está bien definido, o se

convierten en programas de "hervir el océano" que se vuelven demasiado

costosos o complejos. Los datos son un gran problema en esta empresa.

¿Cómo avanzamos sin cometer los mismos errores del pasado? ¿Cómo

emprende una nueva iniciativa estratégica como un pequeño esfuerzo basado

en el valor?
13

La fortaleza de los componentes de la estrategia de datos es que te ayudan a identificar objetivos enfocados y tangibles dentro

de cada área de disciplina individual. Cada empresa tiene una combinación única de habilidades y un conjunto diferente de

fortalezas y debilidades. Avanzar con una estrategia de datos comienza por identificar las fortalezas y debilidades que existen

dentro de su entorno de datos (dentro de cada área de componentes), e identificar un conjunto de objetivos alcanzables y

medibles que mejorarán el acceso y el intercambio de datos. El propósito de los componentes no es identificar todas las

actividades potenciales dentro de una estrategia de datos; Los componentes ofrecen visibilidad de las diferentes disciplinas que

contribuyen a una estrategia de datos.

Una iniciativa de estrategia de datos no es un esfuerzo único; Por su propia naturaleza, una estrategia es un conjunto de

objetivos a largo plazo. Es común identificar un conjunto de objetivos de varios años e identificar un conjunto de hitos de

entrega a corto plazo (por ejemplo, trimestral o anual). Esto permite que la estrategia se someta a revisión y medición de

forma continua para evitar los tipos de desafíos que mencionó el ejecutivo del banco. Los componentes proporcionan un

medio para clasificar actividades e identificar entregas a corto plazo.

La mayoría de las empresas ya han invertido en actividades de gestión de datos en las diferentes áreas de componentes;

desafortunadamente, las diferentes áreas generalmente no están coordinadas o alineadas entre sí. Los desafíos de

gestión de datos del banco ilustran cómo la falta de una estrategia de datos (y actividades alineadas) puede causar

tribulaciones significativas para el acceso y uso de datos. Una estrategia de datos da visibilidad a la relación que cada uno

de los componentes (o disciplinas) tienen entre sí. Si no coordina las diferentes actividades de los componentes, corre el

riesgo de ofrecer una serie de soluciones puntuales que no pueden funcionar juntas.

La idea detrás de una estrategia de datos no es construir un mundo perfecto que pueda abordar cualquier necesidad de datos

imprevista. El poder de una estrategia de datos es que lo posiciona para ofrecer la mejor solución posible a medida que las

necesidades de su organización crecen y evolucionan. Cuando surgen nuevos requisitos y se hacen visibles las brechas, el

marco de componentes proporciona un método para identificar los cambios necesarios en las diversas áreas de tecnología y

capacidad de gestión de datos de su empresa. Su estrategia de datos es una hoja de ruta y un medio para abordar las

necesidades de gestión de datos existentes y futuras.

Aprende más
Descubra cómo SAS® Data Management puede ayudarlo a construir una estrategia de datos exitosa visitando Consultoría

de gestión de datos SAS .

Para descubrir cómo las soluciones de SAS Data Management pueden ayudarlo a tomar decisiones en las que puede confiar, visite sas.com/data

.
Para contactar a su oficina local de SAS, visite: sas.com/offices

SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas comerciales registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. Y otros países. ® indica registro en EE. UU. Otras
marcas y nombres de productos son marcas comerciales de sus respectivas compañías. Copyright © 2018, SAS Institute Inc. Todos los derechos reservados. 108109_G62437.0118

También podría gustarte