Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenido
Estrategia de datos: ¿qué problema resuelve? ................................................. 1
Evan Levy, vicepresidente de servicios de gestión de datos en SAS, es un orador y escritor reconocido en las áreas de
estrategia de datos empresariales, gestión de datos e integración de sistemas. Dado que las empresas experimentan un
crecimiento exponencial en los volúmenes, las fuentes y los sistemas de datos, Levy asesora a los clientes sobre
estrategias para abordar los desafíos comerciales utilizando sus datos y activos tecnológicos existentes junto con métodos
A pesar de las grandes inversiones a largo plazo en la gestión de datos, los problemas de datos en muchas organizaciones continúan
creciendo. Una razón es que los datos se han percibido tradicionalmente como solo un aspecto de un proyecto de tecnología; no ha
sido tratado como un activo corporativo. En consecuencia, se creía que los esfuerzos tradicionales de planificación de aplicaciones y
bases de datos eran suficientes para abordar los problemas de datos en curso.
A medida que nuestros almacenes de datos corporativos han crecido tanto en tamaño como en diversidad de áreas temáticas, ha quedado
claro que es necesaria una estrategia para abordar los datos. Sin embargo, algunos aún luchan con la idea de que los datos corporativos
No hay escasez de pensamiento de cielo azul cuando se trata de planes estratégicos y mapas de ruta de las organizaciones. Para
muchos, tales esfuerzos son solo una novedad. De hecho, los planes estratégicos de las organizaciones a menudo generan muy
pocos resultados tangibles para las organizaciones, solo muchas reuniones y documentación. Un plan exitoso, por otro lado,
identificará objetivos realistas junto con una hoja de ruta que brinde una guía clara sobre la mejor manera de hacer el trabajo.
Veamos cómo se desarrolló esto en la vida real en una organización que se propuso desarrollar una estrategia de datos.
Desde el principio, al campeón del proyecto le resultó difícil lograr que su vicepresidente entendiera la necesidad y la importancia de una
El banco ya tuvo éxito. Sus ingresos y costos estaban bien administrados, y las unidades de negocios individuales y
los grupos tecnológicos eran buenos para cumplir con sus compromisos. Para el crédito del banco, no fue
complaciente. La gerencia siempre estaba buscando formas de aumentar la productividad de los miembros del
personal y reducir los costos continuos. Había todo tipo de métricas e indicadores clave de rendimiento (KPI) para
medir el rendimiento de TI, los beneficios comerciales y el costo total de propiedad. La idea de construir otra hoja de
personal y recursos, y nunca avanzamos sin que la empresa cubra los costos.
Con el banco haciendo tantas cosas bien, necesitaba entender por qué y cómo una estrategia de datos marcaría la
diferencia. Para responder estas preguntas, primero tenemos que considerar cómo se crearon y usaron los datos en el
de que se completara el proceso. Si bien podría haber una o dos aplicaciones adicionales que necesitaban acceder al contenido
para el seguimiento (por ejemplo, servicio al cliente, informes especiales, auditorías, etc.), estas eran generalmente actividades
puntuales.
Hoy, el negocio es muy diferente. Se acepta el valor de los datos; Los resultados de informes y análisis han convertido
los datos en la salsa secreta de muchas nuevas iniciativas empresariales. Es común que los datos de la aplicación se
Si bien el valor de los datos ha evolucionado enormemente en los últimos 20 años, y los usuarios comerciales lo reconocen, pocas
empresas han ajustado sus enfoques para capturar, compartir y administrar los activos de datos corporativos. Su comportamiento
refleja una creencia obsoleta y subyacente de que los datos son simplemente un subproducto de la aplicación.
Las organizaciones necesitan crear estrategias de datos que coincidan con las realidades de hoy. Para construir una estrategia
de datos tan completa, deben tener en cuenta los compromisos comerciales y tecnológicos actuales al tiempo que abordan
"Dime por qué tu idea es más importante que los elementos que ya están
en la lista de prioridades".
No desafiamos la premisa o el valor de ningún proyecto individual. El problema fue el enfoque que tomó cada
proyecto y actividad individual. Cada actividad abordó las necesidades de datos de forma independiente entre sí
sin ningún conocimiento de los esfuerzos y costos superpuestos.
• La mayoría de los proyectos requieren acceso al mismo contenido de datos. Desafortunadamente, no hubo coordinación para evitar
• No hubo intercambio de datos, ni reutilización de datos, ni actividades de economía de escala para simplificar o
• Los usuarios comerciales accedieron a datos comunes a través de aplicaciones separadas. Los nombres de los datos y el
• Los usuarios encontraron inconsistencias entre los informes porque los datos de origen no estaban documentados y
El resultado fueron datos duplicados, superposiciones de procesamiento y poca conciencia de que los proyectos individuales
estaban replicando el trabajo. No había nada establecido para apoyar la comunicación, la colaboración o el intercambio de
El problema: cada proyecto en el banco abordó los problemas de datos como actividades únicas, construidas desde cero.
• Cada proyecto requería acceso a los datos del cliente, y cada uno tenía tareas y recursos
superpuestos.
• Cada proyecto incluía un inventario de datos fuente y una actividad de análisis porque no
había forma de saber dónde residían datos específicos.
• Deben construirse nuevos extractos de datos (subconjuntos de los datos de la aplicación copiados para
su uso por otros sistemas) porque TI no tenía forma de determinar si los datos ya estaban disponibles.
• No hay dos equipos que compartan sus datos de extracción de origen. Cada uno tenía sus propias
copias para respaldar sus actividades de integración y creación de bases de datos (que vinculaban el
• La lógica de integración de cada equipo fue construida a medida y mantenida individualmente, porque la
El personal de la empresa, que dependía de sus propios esfuerzos operativos y de informes, había
experimentado otros desafíos:
• El departamento de marketing tuvo que actualizar continuamente su sistema de campaña para ajustarse a
los cambios frecuentes (y no comunicados) que se producen en los diseños de los extractos que recibió.
• Los gerentes de ventas siempre tenían preguntas sobre los informes de KPI con detalles de los clientes
porque los títulos y las etiquetas variaban entre los informes (aunque contenían datos comunes).
• Los usuarios de la unidad de negocio a menudo construían sus propios informes en lugar de utilizar los
informes estándar de las finanzas, porque no había forma de determinar el origen de los datos del informe
estándar.
• El equipo de almacenamiento de datos tuvo que perseguir continuamente los problemas de datos porque
empresas. La mayoría de los equipos de desarrollo están bien educados sobre la arquitectura del sistema, los métodos de desarrollo, la
recopilación de requisitos, las pruebas e incluso la reutilización del código. La mayoría de los equipos comerciales pueden recitar los
conceptos de requisitos comerciales, definición de procesos comerciales y medición de resultados. Desafortunadamente, la noción de
aplicar estos conceptos a los datos para respaldar una mayor precisión, acceso, uso compartido y reutilización aún es extraña para la
La idea detrás del desarrollo de una estrategia de datos es asegurarse de que todos los recursos de datos estén posicionados
de tal manera que puedan usarse, compartirse y moverse de manera fácil y eficiente. Los datos ya no son un subproducto del Una estrategia de datos es un plan
procesamiento comercial, es un activo crítico que permite el procesamiento y la toma de decisiones. Una estrategia de datos
diseñado para mejorar todas las
ayuda al garantizar que los datos se administren y utilicen como un activo. Proporciona un conjunto común de metas y objetivos
en todos los proyectos para garantizar que los datos se utilicen de manera efectiva y eficiente. Una estrategia de datos establece formas en que adquiere, almacena,
métodos, prácticas y procesos comunes para administrar, manipular y compartir datos en toda la empresa de manera repetible.
administra, comparte y usa datos.
Si bien la mayoría de las empresas tienen en marcha múltiples iniciativas de gestión de datos (metadatos, gestión de datos maestros,
gobernanza de datos, migración de datos, modernización, integración de datos, calidad de datos, etc.), la mayoría de los esfuerzos
se centran en soluciones puntuales que abordan necesidades específicas de proyectos u organizaciones. Una estrategia de datos
establece una hoja de ruta para alinear estas actividades en cada disciplina de gestión de datos de tal manera que se complementen
planes integrales para dimensionar y administrar sus plataformas y han desarrollado métodos sofisticados para manejar la
retención de datos. Si bien esto es ciertamente importante, en realidad aborda los aspectos tácticos del almacenamiento de
contenido: no está planeando cómo mejorar todas las formas en que adquiere, almacena, administra, comparte y usa datos.
Una estrategia de datos debe abordar el almacenamiento de datos, pero también debe tener en cuenta la forma en que se identifican,
acceden, comparten, comprenden y utilizan los datos. Para tener éxito, una estrategia de datos debe incluir cada una de las diferentes
disciplinas dentro de la gestión de datos. Solo entonces abordará todos los problemas relacionados con hacer que los datos sean
accesibles y utilizables para que puedan soportar la multitud de actividades actuales de procesamiento y toma de decisiones.
Hay cinco componentes principales de una estrategia de datos que trabajan juntos como bloques de construcción para soportar de
manera integral la gestión de datos en una organización: identificar, almacenar, aprovisionar, procesar y gobernar.
55
Identificar
Los
Regir componentes Tienda
centrales
Proceso Provisión
Identificar
Una de las construcciones más básicas para usar y compartir datos dentro de una empresa es establecer un medio para
identificar y representar el contenido. Ya sea contenido estructurado o no estructurado, manipular y procesar datos no es
factible a menos que el valor de los datos tenga un nombre, un formato definido y una representación de valores (incluso los
datos no estructurados tienen estos detalles). El establecimiento de convenciones de nombres y elementos de datos
consistentes es esencial para usar y compartir datos. Estos detalles deben ser independientes de cómo se almacenan los datos
(en una base de datos, archivo, etc.) o del sistema físico donde reside.
También es importante tener un medio para hacer referencia y acceder a los metadatos asociados con sus datos (definición,
origen, ubicación, valores de dominio, etc.). De la misma manera que tener un catálogo de tarjetas preciso respalda el éxito de
un individuo al usar una biblioteca para recuperar un libro, el uso exitoso de los datos depende de la existencia de metadatos
(para ayudar a recuperar elementos de datos específicos). Consolidar la terminología comercial y el significado en un glosario
Las bibliotecas tienen catálogos de tarjetas porque no es práctico recordar la ubicación de cada libro. Los metadatos son
críticos para el uso de datos comerciales porque es imposible conocer la ubicación y el significado de todos los datos
comerciales de la compañía: miles de elementos de datos en numerosas fuentes de datos. Sin detalles de identificación
de datos, se vería obligado a realizar un inventario de datos y un esfuerzo de análisis cada vez que quisiera incluir datos
Sin un glosario de datos y metadatos (es decir, el "catálogo de tarjetas de datos"), es probable que las empresas ignoren algunos
de sus activos de datos más preciados porque no sabrán que existen. Si los datos son realmente un activo corporativo, una
estrategia de datos debe garantizar que se puedan identificar todos los datos.
Ubicación
Producto
Cliente
Identificación del cliente Valor SalesCRM que identifica de forma única Entero ... . . . Susan Craff
Nombre de pila Nombre del cliente de CapBilling Personaje ... . . . Susan Craff
inicial del segundo nombre Inicial del segundo nombre del cliente CapBilling Personaje ... . . . Susan Craff
Tienda
Datos persistentes en una estructura y ubicación que admite el acceso y procesamiento fácil y compartido
El almacenamiento de datos es una de las capacidades básicas en la cartera de tecnología de una empresa, pero es una disciplina compleja.
La mayoría de las organizaciones de TI tienen métodos maduros para identificar y administrar las necesidades de almacenamiento de los
sistemas de aplicaciones individuales; cada sistema recibe suficiente almacenamiento para soportar sus propios requisitos de procesamiento
y almacenamiento. Ya sea que se trate de aplicaciones de procesamiento transaccional, sistemas analíticos o incluso almacenamiento de
datos de uso general (archivos, correo electrónico, imágenes, etc.), la mayoría de las organizaciones utilizan métodos sofisticados para
planificar la capacidad y asignar el almacenamiento a los diversos sistemas. Desafortunadamente, este enfoque solo refleja una perspectiva
La brecha en este enfoque es que rara vez hay un plan para administrar eficientemente el almacenamiento requerido para
compartir y mover datos entre sistemas. El motivo es simple; El intercambio de datos más visible en el mundo de TI es de
naturaleza transaccional. Los detalles transaccionales entre las aplicaciones se mueven y comparten para completar un proceso
comercial específico. El intercambio masivo de datos no se entiende bien y, a menudo, se percibe como un hecho único o poco
frecuente.
77
Con la popularidad de los grandes datos, el crecimiento de la analítica empresarial y el mayor intercambio de información entre
empresas, es mucho más común compartir datos de grandes volúmenes (o masivos). La mayor parte de este contenido compartido
se divide en dos categorías: datos creados internamente (detalles del cliente, detalles de compra, etc.) y contenido creado revista Forbes 1
externamente (aplicaciones en la nube, datos de terceros, contenido sindicado, etc.). La falta de un proceso de intercambio de datos
identificó un centro de
administrado centralmente generalmente obliga a todos los sistemas a administrar este espacio individualmente, por lo que todos
A medida que las organizaciones han evolucionado y los activos de datos han crecido, ha quedado claro que almacenar todos los datos en que finalmente fueron copiados y
una sola ubicación no es factible. No es que no podamos construir un sistema lo suficientemente grande como para contener el contenido.
retenidos por 18 equipos
El problema es que el tamaño y la naturaleza distribuida de nuestras organizaciones - y la diversidad de nuestras fuentes de datos - hace
que la carga de datos en una sola plataforma no sea práctica. No todos necesitan acceso a todos los datos de la compañía; necesitan
diferentes y requirieron más de
acceso a datos específicos para satisfacer sus necesidades individuales. 10 petabytes de
almacenamiento.
La clave es asegurarse de que haya un medio práctico para almacenar todos los datos que se crean de una manera que permita acceder y
compartirlos fácilmente. No tiene que almacenar todos los datos en un solo lugar; necesita almacenar los datos una vez y proporcionar una
1 Mejores prácticas para gestionar Big Data, por Ash
manera para que las personas puedan encontrarlos y acceder a ellos.
Ashutosh. Forbes.com
Sabemos que una vez que se crean los datos, se compartirán con muchos otros sistemas; Es fundamental abordar el almacenamiento
de manera eficiente, de una manera que simplifique el acceso. Una buena estrategia de datos asegurará que cualquier información
creada esté disponible para acceso futuro sin requerir que todos creen sus propias copias.
inventario
sindicados
Proveedores de datos
Ventas Finanzas de
Datos
Figura 3: cada sistema que crea sus propias copias de datos provoca un aumento de cuatro veces en el almacenamiento y el procesamiento.
8
Provisión
Empaquete los datos para que puedan reutilizarse y compartirse, y proporcione reglas y pautas de acceso para los
datos
En los primeros días de TI, la mayoría de los sistemas de aplicaciones se construyeron como motores de procesamiento de
datos individuales e independientes que contenían todos los datos necesarios para realizar sus tareas definidas. Se pensó
poco o nada en compartir datos entre aplicaciones. Los datos se organizaron y almacenaron para la conveniencia de la
Cuando surgió la solicitud ocasional de datos, un desarrollador de aplicaciones creó un extracto al volcar esos datos en un archivo o
al crear un programa único para admitir la solicitud de otra aplicación. El desarrollador no pensó en las necesidades continuas de
aprovisionamiento de datos, ni en la reutilización o el intercambio de datos. En ese momento, el intercambio de datos era poco
frecuente. Hoy en día, el intercambio de datos definitivamente no es una necesidad especializada o una ocurrencia infrecuente: los
otros 10 sistemas a menudo usan los datos para soportar procesos comerciales adicionales y la toma de decisiones.
Pero la mayoría de los sistemas de aplicaciones no fueron diseñados para compartir datos. La lógica y las reglas requeridas para decodificar
datos para el uso de otros rara vez se documentan o incluso se conocen fuera del equipo de desarrollo de aplicaciones. La mayoría de las
organizaciones de TI no proporcionan recursos presupuestarios o de personal para abordar el intercambio de datos no transaccionales. En
cambio, se maneja como una cortesía o conveniencia, y a menudo se aborda como un favor personal entre los miembros del personal.
Cuando se comparten datos, generalmente se empaquetan a conveniencia del desarrollador de la aplicación, no del usuario
de los datos. Tal enfoque podría haber sido aceptable en años pasados, cuando solo unos pocos sistemas y un par de
equipos necesitaban acceso. Pero es completamente poco práctico en el mundo actual, donde TI administra docenas de
sistemas que dependen de datos de múltiples fuentes para respaldar procesos comerciales individuales. Empaquetar y
compartir datos a la conveniencia de un desarrollador de una sola fuente, en lugar de las personas que manejan 10 sistemas
posteriores que requieren los datos, es ridículo. Y esperar que las personas aprendan las idiosincrasias de docenas de
sistemas de aplicaciones de origen solo para que puedan usar los datos es una increíble pérdida de tiempo.
Identificación del cliente FName MName LName Fecha de nacimiento MPhone ResAddress
SFA 1298116 Guillermo James Sosulski 12/04/39 9738723424 123 Oak St., Eves, IL 30319
Apoyo 1298116 Guillermo James Sosulski 04/12/1939 3154789087 123 Oak St., Eves, IL 30319
Figura 4: Detalles del cliente almacenados y referenciados de manera diferente en cada aplicación operativa.
9
Compartir datos ya no es una capacidad técnica especializada que deben abordar los arquitectos y programadores de
aplicaciones. Se ha convertido en una necesidad del negocio de producción. Las empresas dependen de que los datos se
compartan y distribuyan para satisfacer las necesidades operativas y analíticas. Compartir datos no se puede administrar como
cortesía; El método para empaquetar y compartir datos no puede tratarse como una necesidad única.
Si los datos de una empresa son realmente un activo corporativo, entonces todos los datos deben empaquetarse y prepararse para
compartir. Para tratar los datos como un activo en lugar de una carga de hacer negocios, una estrategia de datos debe abordar el
Proceso
Mueva y combine datos que residen en sistemas dispares y proporcione una vista de datos unificada y
consistente
Los datos generados a partir de las aplicaciones son un tesoro de conocimiento, pero los datos son una materia prima en el
momento de la creación. No ha sido preparado, transformado o corregido para que esté "listo para usar". El proceso es el
componente de la estrategia de datos que aborda las actividades requeridas para evolucionar los datos de un ingrediente crudo a
Si bien la mayoría de las
un producto terminado.
cartón, tinta de impresión, etc.) y desarrollar un proceso de fabricación para construir y entregar un caja de cereal al estante del código y la colaboración para el
supermercado. Una caja llena de harina, nueces y tinta no está lista para usar; Se requiere hornear, procesar, empacar y enviar
desarrollo de aplicaciones, no han
para hacer un producto que esté listo para usar y disponible en el estante de la tienda de comestibles.
centrado este esfuerzo en entregar
Los datos generados a partir de una aplicación son en gran medida un ingrediente crudo. En la mayoría de las empresas, los
promuevan el uso compartido y la
datos se originan en fuentes internas y externas. Los datos internos se generan a partir de docenas (si no cientos) de reutilización.
sistemas de aplicaciones. Los datos externos se pueden entregar desde una variedad de fuentes diferentes (aplicaciones en
la nube, socios comerciales, proveedores de datos, agencias gubernamentales, etc.). Si bien estos datos a menudo son ricos
en información, no se empaquetaron de manera que se integren con la combinación única de fuentes que existen dentro de
cada compañía individual. Para que los datos estén listos para usar, se necesitan una serie de pasos para transformar,
corregir y formatear los datos. El resultado de este proceso es un pequeño conjunto de conjuntos de datos homogéneos que
un usuario de datos puede combinar o integrar con un conjunto de tareas de preparación de datos específicas para sus
Es común que las empresas establezcan un equipo centralizado para abordar la limpieza, estandarización, transformación e
integración de datos para el almacén de datos. Desafortunadamente, muchos han aprendido que este tipo de procesamiento no es
exclusivo de un almacén de datos. La mayoría de los usuarios de datos (aplicaciones, usuarios de análisis, desarrolladores, etc.)
requieren datos listos para usar, por lo que estos usuarios terminan asumiendo el esfuerzo de desarrollo ellos mismos. El desarrollo
de código para identificar y combinar registros en estas fuentes individuales puede ser bastante complejo, particularmente cuando
Los desarrolladores pasan un tiempo enorme construyendo lógica para unir y vincular valores en una multitud de fuentes.
Desafortunadamente, como cada nuevo equipo de desarrollo requiere acceso a fuentes de datos individuales, reconstruyen o
reinventan la lógica necesaria para vincular valores a través de las mismas fuentes de datos. La tragedia de la integración de
datos es que este retrabajo ocurre con cada nuevo proyecto porque los aprendizajes del pasado nunca se capturan para su
reutilización.
Si bien la mayoría de las organizaciones tienen iniciativas para abordar la reutilización de código y la colaboración para el desarrollo de
aplicaciones, no han centrado este esfuerzo en entregar datos que estén listos para usar y promuevan el uso compartido y la
reutilización. No es práctico (ni apropiado) que los usuarios de datos se conviertan en desarrolladores. Hacer que los datos estén listos
para usar se trata de ofrecer herramientas y establecer procesos para producir datos que las personas puedan usar, sin la participación
de TI.
Regir
Establecer, administrar y comunicar políticas y mecanismos de información para el uso efectivo de los
datos.
Dado que los datos aún se perciben a menudo como un subproducto del procesamiento de aplicaciones, pocas organizaciones han
desarrollado completamente los métodos y procesos necesarios para administrar los datos fuera del contexto de una aplicación y en
toda la empresa. Si bien muchos han comenzado a invertir en iniciativas de gobernanza de datos, muchos todavía están en la etapa
Datos del cliente Datos de precios Datos de ventas Contactos del cliente
Datos
Fuentes
Solicitud
Figura 5: Cada fuente de datos contiene datos únicos (cuadros de colores). Como cada aplicación crea su propia lógica de integración, los valores de los datos pueden diferir en
cada aplicación.
11
La mayoría de las iniciativas de gobernanza de datos comienzan abordando cuestiones tácticas específicas (por ejemplo, precisión de los
datos, definición de reglas de negocio o estándares de terminología) y se limitan a organizaciones específicas o esfuerzos de proyectos. A
medida que aumenta la conciencia de gobernanza, y a medida que los problemas de uso y uso compartido de datos ganan visibilidad, las
iniciativas de gobernanza a menudo amplían su alcance. A medida que esas iniciativas se expanden, las organizaciones pueden establecer
un conjunto de políticas, reglas y métodos de información para garantizar el uso, la manipulación y la gestión uniformes de los datos.
entorno analítico. De hecho, el gobierno de datos se aplica a todas las aplicaciones, sistemas y miembros del personal. El rigor necesario sobre el contenido de
mayor desafío con el gobierno de datos es la adopción, porque el gobierno de datos es un conjunto general de políticas y
los datos a medida que ocurren
reglas de información que todos deben respetar y seguir.
cambios en las áreas de tecnología,
procesamiento y metodología
La razón para establecer un proceso de gobernanza sólido es garantizar que una vez que los datos se desacoplan de la aplicación
asociadas con el esfuerzo de la
que los creó, todos los demás componentes de la información conocen y respetan las reglas y los detalles de los datos. El papel
que desempeña la gobernanza dentro de una estrategia general de datos es garantizar que los datos se administren de manera estrategia de datos.
consistente en toda la empresa.
Ya sea para determinar detalles de seguridad, lógica de corrección de datos, estándares de nombres de datos o incluso
establecer nuevas reglas de datos, el gobierno efectivo de los datos asegura que los datos se manejen, manipulen y accedan
de manera consistente. Las decisiones sobre cómo se procesan, manipulan o comparten los datos no son tomadas por un
desarrollador individual; están establecidos por las reglas y políticas de gobierno de datos.
El propósito de la gobernanza de datos no es limitar el acceso a los datos o insertar un nivel de rigor duro e inutilizable que
interfiera con el uso. Su premisa es simplemente garantizar que los datos sean más fáciles de acceder, usar y compartir. El
rigor introducido por un esfuerzo de gobernanza de datos no debería ser abrumador o gravoso. Si bien el gobierno de datos
puede afectar inicialmente la productividad de los desarrolladores (debido a los nuevos procesos y actividades de trabajo), los
beneficios para los componentes de datos posteriores y las mejoras dramáticas en la productividad deberían más que
No debería sorprendernos que una estrategia de datos tenga que incluir la gobernanza de datos. Simplemente no es práctico
avanzar, sin un esfuerzo de gobernanza integrado, para establecer un plan y una hoja de ruta para abordar todas las formas en
que captura, almacena, administra y usa la información. El gobierno de datos proporciona el rigor necesario sobre el contenido de
los datos a medida que ocurren cambios en las áreas de tecnología, procesamiento y metodología asociadas con el esfuerzo de
la estrategia de datos.
12
único método práctico para que los desarrolladores determinen la existencia de esos datos e identifiquen la mejor fuente
potencial es a través de conversaciones, reuniones y conocimiento tribal. Pero a medida que aumentan las aplicaciones de
origen y crecen las aplicaciones basadas en la nube, el número resultante de sistemas que crean datos se ha expandido mucho
más allá del conocimiento de cualquier individuo. Simplemente hay demasiados sistemas, fuentes y datos para que cualquiera
pueda rastrearlos y administrarlos. El uso de los activos de datos de la empresa no debe basarse en el boca a boca o el
conocimiento tribal.
Si bien la mayoría de las empresas han invertido millones de dólares para mejorar la gestión de datos, la mayoría de las actividades
son soluciones puntuales que abordan problemas y problemas individuales. Pocas personas son conscientes del impacto que puede
tener una sola inversión en fortalecer o (desafortunadamente) debilitar otros proyectos o iniciativas de datos. El desafío que tienen la
mayoría de las organizaciones es darse cuenta de que el acceso y el uso de datos se extienden a través de cada organización y nivel
de habilidad en su empresa.
El riesgo de invertir en una solución puntual es que su naturaleza enfocada le impide abordar problemas que cruzan los límites de
la organización y del proyecto, y los problemas de datos por naturaleza no son específicos de una sola aplicación u organización.
Los esfuerzos para entregar nuevos datos y / o análisis a una empresa no tendrán éxito a menos que se hayan abordado todos los
demás componentes relacionados con los datos: identificar, almacenar, aprovisionar, procesar y gobernar.
ejecutivo del banco, comenzó a darse cuenta de que muchos de los proyectos bajo su dirección no estaban alineados para
compartir y hacer crecer los activos de datos de la compañía. Reconoció que si bien había un rigor considerable en el proyecto
para los sistemas y las actividades de aplicación, los datos no habían recibido el nivel de atención que estábamos describiendo.
Su compañía ofreció poco en cuanto a métodos de proyecto, o incluso herramientas, que admitieran el intercambio y la
reutilización de datos. Estaba interesado en seguir adelante, pero quería asegurarse de que sus esfuerzos no fueran percibidos
como actividades de cielo azul. Quería objetivos realistas con resultados medibles. Él explicó:
¿Cómo avanzamos sin cometer los mismos errores del pasado? ¿Cómo
en el valor?
13
La fortaleza de los componentes de la estrategia de datos es que te ayudan a identificar objetivos enfocados y tangibles dentro
de cada área de disciplina individual. Cada empresa tiene una combinación única de habilidades y un conjunto diferente de
fortalezas y debilidades. Avanzar con una estrategia de datos comienza por identificar las fortalezas y debilidades que existen
dentro de su entorno de datos (dentro de cada área de componentes), e identificar un conjunto de objetivos alcanzables y
medibles que mejorarán el acceso y el intercambio de datos. El propósito de los componentes no es identificar todas las
actividades potenciales dentro de una estrategia de datos; Los componentes ofrecen visibilidad de las diferentes disciplinas que
Una iniciativa de estrategia de datos no es un esfuerzo único; Por su propia naturaleza, una estrategia es un conjunto de
objetivos a largo plazo. Es común identificar un conjunto de objetivos de varios años e identificar un conjunto de hitos de
entrega a corto plazo (por ejemplo, trimestral o anual). Esto permite que la estrategia se someta a revisión y medición de
forma continua para evitar los tipos de desafíos que mencionó el ejecutivo del banco. Los componentes proporcionan un
La mayoría de las empresas ya han invertido en actividades de gestión de datos en las diferentes áreas de componentes;
desafortunadamente, las diferentes áreas generalmente no están coordinadas o alineadas entre sí. Los desafíos de
gestión de datos del banco ilustran cómo la falta de una estrategia de datos (y actividades alineadas) puede causar
tribulaciones significativas para el acceso y uso de datos. Una estrategia de datos da visibilidad a la relación que cada uno
de los componentes (o disciplinas) tienen entre sí. Si no coordina las diferentes actividades de los componentes, corre el
riesgo de ofrecer una serie de soluciones puntuales que no pueden funcionar juntas.
La idea detrás de una estrategia de datos no es construir un mundo perfecto que pueda abordar cualquier necesidad de datos
imprevista. El poder de una estrategia de datos es que lo posiciona para ofrecer la mejor solución posible a medida que las
necesidades de su organización crecen y evolucionan. Cuando surgen nuevos requisitos y se hacen visibles las brechas, el
marco de componentes proporciona un método para identificar los cambios necesarios en las diversas áreas de tecnología y
capacidad de gestión de datos de su empresa. Su estrategia de datos es una hoja de ruta y un medio para abordar las
Aprende más
Descubra cómo SAS® Data Management puede ayudarlo a construir una estrategia de datos exitosa visitando Consultoría
Para descubrir cómo las soluciones de SAS Data Management pueden ayudarlo a tomar decisiones en las que puede confiar, visite sas.com/data
.
Para contactar a su oficina local de SAS, visite: sas.com/offices
SAS y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas comerciales registradas o marcas comerciales de SAS Institute Inc. en los EE. UU. Y otros países. ® indica registro en EE. UU. Otras
marcas y nombres de productos son marcas comerciales de sus respectivas compañías. Copyright © 2018, SAS Institute Inc. Todos los derechos reservados. 108109_G62437.0118