Está en la página 1de 29

Claves para

Mitigar el Riesgo
en una Migracin
de Datos

Gua editada por

Tabladecontenidos
0.Introduccin
1.Enqucircunstanciassedebetenerencuentaunamigracindedatos
2.Entenderlasestructurasdedatos
3.Conocerelcontenidodeunabasededatos
4.AplicarprocesosdecalidaddedatosI:investigar
5.AplicarprocesosdecalidaddedatosII:estandarizar
6.AplicarprocesosdecalidaddedatosIII:emparejar
7.AplicarprocesosdecalidaddedatosIV:supervivencia
8.Aplicarprocesosdeintegracin
9.Laconversindelosdatosenunprocesodemigracin
10.Archivarhistricosdebajaprobabilidaddeuso
11.Solucionesdemigracin:lasclaves

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

0.Introduccin
Cuando una organizacin se plantea la migracin de un sistema antiguo a uno nuevo, ya se trate
de un ERP, un CRM, un sistema de produccin, un gestor de campaas u otros siempre existe
una etapa del proyecto que suele menospreciarse. Esa fase es la de la mover los datos hacia el
nuevosistema:lamigracindedatosens.
Muchas veces no se migra todo el histrico, sino que slo se mueven datos ms recientes pero,
an as, es vital rescatarlos del sistema antiguo, para poder disponer de ellos cuando se
necesiten, asegurando su completitud e integridad aunque no sigan vigentes en el nuevo sistema.
sta ser la nica manera de garantizar un trasfondo de calidad y confiabilidad en la toma de
decisionesempresariales.
Toda migracin implica integracin y calidad. Los fallos ms frecuentes que suelen producirse en
unamigracindedatostienequeverconestascualidadesyrepercutenencuestionescomo:
Errores de perfilado de datos, que causan problemas en la calidad y provocan retrasos en el
plazodeentregadelproyectodemigracin.
Especificaciones inexactas o incompletas originadas por la falta de profundidad en el mapeo,
ausenciadevalidacionesolejanarespectoalasreglasdenegocio.
Subestimacin de la criticidad de un proyecto de este tipo, que deriva en una inadecuada
asignacin de recursos, falta de planificacin o carencia de las herramientas y perfiles necesarios
parallevaracabolamigracindedatosconxito.

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Crditosfotogrficos:"GlobalComputer"byrenjithkrishnan

Migracindedatosyoptimizacin
Optimizar es la opcin ms indicada y debe tenerse en cuenta desde el principio, desde el
momento en que se plantea la necesidad de llevar a cabo una migracin de datos. Cuando la
planificacintieneestealcanceesfcilprever:
La necesidad de conectar con el sistema antiguo y llevar a cabo procesos de migracin
reutilizables y automticos que permitan, por ejemplo, utilizar el proceso de migracin en ms de
unaocasin.Losescenariosmscomunessonlosentornosdedesarrollo,testyproduccin.
Que a lo largo del proyecto de migracin habr momentos en que los dos sistemas tendrn que
coexistir o relevarse. En ambas opciones el uso de la tecnologa es bsico para alcanzar
objetivos.
El time to market y los costes estimados, para lo que hay que descubrir, conocer y comprender
todos los datos intervinientes en el proceso, evitando as las situaciones inesperadas que
pudieranafectarles.
En cualquier caso, el mayor esfuerzo ha de concentrarse siempre en los procesos de extraccin,
transformacin y carga, que constituyen el ncleo de toda migracin de datos y pueden
resumirseas:

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Extraccin:desdelafuentedeorigenhastaelreaintermedia,creadaalaimagendeaquella.
Calidad: que es el momento de aplicar los procesos que, despus de varias iteraciones,
permitirn estar en disposicin de garantizar la integridad y confiabilidad de los datos, tras haber
eliminadoerroreseinconsistencias.
Transformacin: cuando los datos han sido enriquecidos, homogeneizados y se encuentran
limpios, estn ya preparados para comenzar a aplicar sobre ellos los procesos evolutivos que, en
base a las funciones que representarn y a las reglas de negocio, los dejarn en condiciones de
sercargados.
Carga: desde ese rea donde los datos han sido preparados se proceder a su carga al sistema
dedestinoenelmodoyformatoadecuados.

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

1. En qu circunstancias se debe tener


encuentaunamigracindedatos

Los escenarios de migracin de datos tienen en comn que siempre existe un elemento o
circunstancia nuevo, que aparece impulsando un cambio y obligando a deshacerse de lo antiguo,
yaobsoleto,ocarentedeldinamismonecesarioenestetiempo.
Existen muchas situaciones diferentes en las que es necesario plantear una iniciativa, con entidad
propia,demigracindedatos.Algunasdelasmscomunesson:

Los datos se alojan en estructuras, en campos de tablas sujetos a estructuras que pueden
variaralcambiardeunsistemaaotro.

Fusin / absorcin de empresas: o se quedan con un sistema o con el otro o compran un


tercero.

Disgregacin/disolucindeempresas.

Externalizacindeundepartamentodelaempresa.

Crditosfotogrficos:"WomenHandPushingButtonStreamingMultimediaFromInternet"by
SOMMAI

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Experienciaenmigracindedatos
Al ser los datos el valor estratgico ms importante para cualquier organizacin, su
procesamiento, traslado o cualquier modo de interaccin con ellos requiere de ciertas mesuras.
Adems de contar con el conocimiento y la tecnologa necesarios, la pericia es un factor a tener
encuenta.
Desde la experiencia de Lantares, algunos de los ejemplos que mejor ilustran esas circunstancias
enlasquehayqueplantearseseriamentelamigracindedatoscomounaopcin,son:
Caso 1: Mi DWH est desarrollado en la plataforma Microsoft SQL Server 2000, y Microsoft
acabadeanunciarquedejadedarsoporteadichaversin
El cliente se ha visto en la obligacin de adoptar una plataforma vigente en el mercado que le
permita disponer del soporte del fabricante. Tras el estudio y benchmarking realizado por el
equipo de Lantares, experto en Information Management, el cliente valor la opcin de adoptar
una tecnologa de base de datos distinta a la que vena utilizando. All se formaliz el proyecto de
migracindelDWHy,enuntiemporcord,susistemadeBIyaestabaatacandoelnuevoDWH.
Caso 2: Llevamos utilizando nuestro CRM desde hace muchos aos, pero la direccin nos ha
solicitado disminuir considerablemente los costes de mantenimiento, por lo que hemos planteado
implantarunCRMOpenSource.
El equipo de IT del cliente instala el nuevo CRM y, a la hora de intentar trasladar los datos del
sistema antiguo al nuevo CRM, se da cuenta de que desconoce el modelo de datos de la fuente de
origen y tambin el del nuevo sistema, lo que impide comenzar a mover los datos. Con la
intervencin de Lantares, se formaliz el proyecto de migracin de datos del CRM y, en un corto
plazo,lesfueposiblecomenzaraoperarconelnuevoCRM.
Caso 3: Hemos decidido cambiar nuestro ERP, hecho a medida, despus de 35 aos de uso
ininterrumpido. Los implantadores del nuevo ERP, se ofrecen a trasladar todos los datos de los 35
aos de nuestro antiguo sistema al nuevo, pero no se hacen responsables ni del rendimiento del
nuevoERP(porsoportar35aosdehistoria),ytampocodelacalidaddelosdatos.
El equipo de Lantares, actu de puente en este caso, definiendo una estrategia de migracin, con
procesos de Data Quality y de archiving, Se realiz la migracin de datos al nuevo ERP
comprendiendo nicamente los ltimos 5 aos, por razones prcticas, pero dejando a disposicin
delclienteunaccesoalos30aosanteriores,garantizandolacalidaddedichosdatos.

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

2.Entenderlasestructurasdedatos
Cmo deducir un modelo entidad relacin de una base de datos antigua, a la cual debemos
acceder para recoger datos y, posiblemente, migrarlos a otra base de datos? Cul es la mejor
manera de hallar las conexiones entre ventas, clientes o productos y el modelo de datos
conceptual?Qumodelossedebentenerencuentaencadacaso?
Lo cierto es que, si se ha de proceder a una migracin de datos, es imprescindible conocer el
medioyllegaradescubrirlospuntosmsespecficoscomo:
Dndeencontrarcadadato.
Qusignificacadacampo.
Culessonlosconceptosqueencierracadatrmino.
El descubrimiento de datos es la fase inicial en todo proceso de migracin de datos y la primera
referencia que indica que una migracin no es un acto automtico, dista mucho de un copiar y
pegar y requiere de un gran trabajo, coordinacin, pruebas y un constante seguimiento que vele
pormantenerlosestndaresdecalidadylaintegridaddeldato.

Crditosfotogrficos:"GraphOnTabletComputer"bywatcharakun

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Eldescubrimientodedatos
Los tcnicos informticos, DBAs en la mayora de los casos, suelen apoyarse en herramientas
CASE con capacidades de ingeniera inversa. stas hacen posible conectarse a una base de datos
y, automticamente, dibujar el modelo entidad relacin que acusa dicha base de datos, con sus
tablasyrelaciones.
Si bien, esta tarea tiene un taln de Aquiles: las limitaciones. En cuntas ocasiones han
aparecido modelos de datos sin constraints (restricciones fsicas), en las que la relacin entre
tablassegobiernadirectamentedesdelaaplicacinquegestionasusdatos?
El desconocimiento de estas restricciones fsicas supone un obstculo importante para el buen
curso de una migracin de datos. Por mucho que se conozcan las reglas del negocio, deducir las
relaciones existentes entre los elementos es prcticamente imposible si no se cuenta con los
constraints.
En la actualidad, aunque no han sido muy difundidas, en el mercado existen herramientas con la
capacidad de descubrir el modelo entidad relacin de una base de datos, incluso en los casos en
quesustablasnoestnrelacionadasporconstraints.
Esta capacidad, que permite llevar a cabo el descubrimiento de datos, se sustenta en un motor
debsquedaquehaceposible:
Rastrear los datos contenidos de cada tabla: un paso que no puede obviarse ya que la
exhaustividadesunodelosfundamentosdetodamigracin.
Vincular cada dato por contenido exacto de campo: haciendo explcitas esas relaciones que no
parecanvisiblesantesdelaintervencindelaherramienta.
Descubrir relaciones ocultas (como, por ejemplo, que el cdigo de una transaccin de 100
dgitos,llevaembebidodentrodelacadenalos8dgitosdelDNIdelemisor).

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

3. Conocer el contenido de una base de


datos

El proceso intuitivo de conocer el contenido de una base de datos consiste en consultar, una por
una, la totalidad de las tablas que la componen. A priori, puede parecer una tcnica apropiada y
una decisin razonable, pero qu comportamiento tiene cada campo de cada tabla? y cmo es
posibleanticiparseaconocerelcontenidodeunabasededatos?
El perfilado de datos da respuesta a estas cuestiones y complementa a la etapa de
descubrimiento de datos permitiendo efectuar un anlisis que resulte en conclusiones que aporten
informacinacercadelacalidaddelosdatosorgenes,sucompletitudysusinterrelaciones.

Crditosfotogrficos:"CircuitBoard"byMichelleMeiklejohn

10

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Elperfiladodedatos
Es imprescindible tener el conocimiento, no slo de los datos que recogeremos de la base de
datos antigua en nuestro proyecto de migracin, sino tambin de cmo se comportan. Un ejemplo
claro:
Tomando una tabla de clientes, en la que existe un campo de tipificacin TIP de un nico dgito.
En el barrido general de la tabla, y mediante una primera lectura diagonal, puede apreciarse que,
en general, los valores que adopta son 0 1. Sin embargo, el hecho de no haber perfilado genera
un riesgo, habitual cuando el proceso de conocimiento slo es humano, que es el de no
contemplarotrosvaloresquepuedenadoptarse.
En este mismo ejemplo, el realizar un proceso de perfilado de datos, podra ayudar a conocer
queenesatabladeclientestambinexisten:
45%deocurrenciasdelcampoTIPconvalor0
49%deocurrenciasdelcampoTIPconvalor1
4%deocurrenciasdelcampoTIPconvalorX
1%deocurrenciasdelcampoTIPconvalornulo
1%deocurrenciasdecampoTIPconvalor
Si no se lleva a cabo el perfilado de datos se corre el riesgo de no conocer y, por tanto, de
prescindir posiblemente de hasta un 6% de datos. Actuar de esta manera incrementa el riesgo a
la vez que reduce drsticamente el ndice de calidad. Por ello se considera al perfilado como una
piezafundamentalenlosprocesosdecalidaddedatos.
Si bien el perfilado es un mtodo que, con cierto esfuerzo, se podra lograr manualmente, hoy
da no es necesario ejecutarlo de esta forma ya que existe en el mercado una amplia gama de
soluciones que perfilan y documentan resultados de forma automtica. Las ventajas principales
deoptarporelautomatismo,sinperjuiciodecontarconelapoyodelpropietariodeldato,son:
Rapidez.
Evitarerrores.
Mayorfacilidadalahoradeefectuarelanlisisdedatos.

11

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

4. Aplicar procesos de calidad de datos


I:investigacin

Todo proyecto de migracin de datos debe poder garantizar la calidad de los mismos. Este
principio impone la aplicacin de procesos de Data Quality en cualquier traslacin de este tipo. Y
es que la calidad de los datos debe ser una preocupacin prioritaria para las organizaciones. De
hecho, la base de la inteligencia de negocio radica en poder operar sobre datos confiables e
ntegros. La ausencia de calidad incide directa, y nefastamente, en este requisito que ha de
preservarsedesdeelminutocerodeunamigracindedatos.
La investigacin de los datos es una fase muy necesaria en todo proyecto de migracin de datos.
Comosiempre,obtenerinformacinverazyprecisaesfundamentaly,paraello,esimportante:
Investigarlatotalidaddelosdatosquequedarnsujetosalprocesodemigracin.
No realizar ningn descarte ni emplear mayores recursos en la investigacin de unos datos,
relegandoladeotros.
Contar con todos los inputs que sea posible en el curso de la investigacin: desde los
propietarios del dato hasta los usuarios que interactuaron con l en algn momento, si se
consideranecesario.
Contrastarlainformacinobtenida.
Validarlasconclusionesalcanzadas,tambinenelmomentodefinalizarlaetapadecalidad.

12

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Crditosfotogrficos:"HandTouchingAnalysisButton"byStuartMiles

Investigacindedatos,calidadymigracin
Llevar a cabo, de manera correcta, la investigacin de datos que da inicio a un proceso de
migracintienemuchoqueverconlasistematizacin.As,enestaetapa,hayquesercapazde:
Descubrirpotencialesanomalasenlosdatos.
Alcanzarun100%devisibilidaddeloscamposdecontenidolibre.
Identificarvalorespordefectoeinvlidos.
Revelarreglasdenegocioindocumentadas.
Garantizar la veracidad de los datos contenidos en los campos que se emplearn para los
criteriosdeemparejamiento.
Entenderlosdatosensucontexto.

13

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

5. Aplicar procesos de calidad de datos


II:estandarizacin

Las empresas fluyen, adaptndose lo ms rpido que les es posible a este entorno de Big Data,
que multiplica el volumen de datos que se adquieren, reduce los tiempos de respuesta esperados
y convierte el procesamiento de datos en una de las claves de BI actual. En este medio tan
heterogneo, donde confluyen los datos histricos de la empresa, con registros en tiempo real e
informacinprovenientedelasredessocialeslaestandarizacinesindispensable.
Hablar de estandarizacin en lo referente a una migracin de datos supone ahondar en el
conocimiento del dato, desde la ptica de la lgica y minimizando su parte abstracta para facilitar
sutrasladoencondicionesdecontrol.

Crditosfotogrficos:"QualityButtonRepresentsExcellentServiceOrProducts"byStuartMiles

14

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Laestandarizacindedatos
La estandarizacin de los datos no obedece a una sola razn, sino que viene motivada por
distintas necesidades que responden a planteamientos que aparecern a lo largo de todo el
proceso de migracin de datos. Estandarizar implica asegurar, en base a los resultados obtenidos
enlafasedeinvestigacin,quesehanalcanzadolascondicionesptimasencuantoa:

Incorporacindeunlenguajealtamenteflexibledereconocimientodepatrones.

Estandarizacin por dominio especfico: por ejemplo, uso de reglas especficas para
nombresyapellidos,direccionesofechas.

Divisin de los datos por su naturaleza: como nombre y apellidos, tipo de va, nombre de
calleynmero.

Normalizacin de la escritura de los datos: como, por ejemplo, Pepe=Jos o


Glez.=Gonzlez.

Parametrizacindetablasdeclasificacinyestandarizacin.

15

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

6. Aplicar procesos de calidad de datos


III:emparejar

El emparejamiento de datos, tambin conocido como data matching, busca efectuar una
comparacin de los datos que sern objeto de la migracin con otros, recogidos en una base de
datos de conocimiento. Para llevar a cabo este cotejo es necesario definir de forma previa un
porcentaje de aceptacin que se considere vlido. Tomndolo como referencia, podr
establecerseunapolticadeemparejamientoquemarquelasdirectricesaseguirenesteproceso.
La importancia de esta tcnica es crucial para la calidad de los datos. En otras palabras, aplicar
el matching es necesario, no slo para obtener un buen resultado en la migracin de datos, sino
tambin para poder confiar en la consistencia e integridad de los mismos, ya finalizado el
proyectodemigracin.

Crditosfotogrficos:"Cube"bygraurrazvanionut

16

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Eldatamatchingenunprocesodemigracindedatos
Cuando se ponen en prctica las tcnicas de emparejamiento de datos, no hay que perder de
vistaculdebesersufinalidad,quedelineaelprocedimientoaseguir,consistenteen:
Identificarregistrosposiblementecoincidentes.
Establecerrelacionesentreregistrosdearchivosdistintos.
Documentarse en tablas de decisin deterministas que han de resultar en un emparejamiento,
porque de lo contrario podran constituir un fallo o avisar de la deteccin de un elemento
sospechoso.Lasmshabitualesson:
Comparacindecampos.
Lettergradeassigned.
Lettergradecombination.
Lettergradeassignmenttofile.
Incluir la probabilstica de casacin de registros, que se resuelven en la probabilidad estadstica
deunemparejamiento,ysellevaacaboteniendoencuentalassiguientesreglas:
Loscampossonevaluadosporelgradodeconcordancia.
Laasignacindepesosrepresentarelcontenidoporvalor.
Seprocederalasumadepesosparaasignarunpesototal.
Para que el emparejamiento de datos sea realmente efectivo se debe complementar con la
limpieza de datos. Esta parte del proceso requiere de la definicin de estndares en base a los
quepoderdeterminarqudatosseconsiderancorrectosyculesnoloson.

17

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

7. Aplicar procesos de calidad de datos


IV:supervivencia

Velar por la calidad de los datos es la misin ltima de la etapa de supervivencia. Para evitar
imprevistos que puedan afectar a cualquiera de los atributos de la calidad del dato es importante
planificarsugestin,articulndolaentornoalaimplementacindepolticasadhoc.
Estas polticas habrn de basarse en reglas de supervivencia, las cuales, a su vez, se organizarn
adosniveles:
Niveldedatosderegistro.
Niveldecampo.
Su principal funcin es regular el seguimiento y control de los estndares de calidad,
garantizando que no existen desviaciones y asegurando que, caso de que se produzca alguna, se
puedeatajarenunplazomnimo.
Elmododellevaralaprcticaestasnormassebasaentresacciones:
Desarrollodearchivosconclavesdereferenciascruzadasentreregistros.
Produccindeinformesdeexcepciones.
Creacindeformatosdesalida:
Tablarelacinconclavesprimariasyforneas.
Creacindetransaccionesdeactualizacin.
Archivosdereferenciascruzadasytablasdesinnimos.
Trazasyinformesdeexcepciones.

18

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Crditosfotogrficos:"TheLifeBuoyPreserverIsolatedOnWhiteBackground"bycbenjasuwan

Calidaddedatosyreglasdesupervivencia:cundo,cmoyporqu
La definicin y aplicacin de las reglas de supervivencia pone de manifiesto la criticidad del
factor calidad en una migracin de datos. Su relevancia es de tal magnitud que la eficiencia de
estas normas puede incluso extrapolarse a entornos operacionales, posteriores al proceso de
extraccin,transformacinycarga.
La ausencia de planificacin en lo concerniente a la supervivencia deja la integridad en una
posicin frgil y secundaria, exponiendo su vulnerabilidad, que es la de los datos a que se asocia.
La calidad de los datos, con todo lo que ello implica, debe ser una constante que d comienzo ya
en los estadios iniciales de la migracin. En ese momento, y a travs de la planificacin, se
produce la primera aproximacin, que habr de prolongarse en el tiempo, ms all del fin del
proceso, extendiendo su efecto a todas las operaciones en las que se produzca interaccin con
informacinyampliandosuproteccinatodoslosnivelesdelaorganizacin.

19

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

8.Aplicarprocesosdeintegracin

Una migracin de datos no es tan solo un traslado, no es una operacin sencilla de movimiento
de datos, sino que se trata de un proceso que se ver condicionado por las discrepancias de
estructuras de datos entre el origen y el destino. La heterogeneidad de las fuentes, su nmero y
tamao, la complejidad de las relaciones existentes y la dificultad del anlisis hacen
imprescindiblepreverprocesosdeintegracin.
Para definir correctamente un proceso de integracin de datos hace falta hacerse tres preguntas,
cada una de las cuales se refiere a una de las fases crticas de toda dinmica de integracin de
datos:
Adndeydequmodosedebeirabuscarlosdatos?
Cmohayquerealizarlatransformacinparapoderaunarlosyadecuarlosaldestino?
Culeslamejorformadevolcarlosendestino?

Crditosfotogrficos:"JigsawPiecesBeingJoinedShowsTeamworkAndAssembling"byStuartMiles

20

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

ProcesosETLenlamigracindedatos
La respuesta a estas tres cuestiones define el proceso de extraccin, transformacin y carga que,
aplicadaaunamigracindedatos,podraresumirse:
Extraccin: se trata de tomar los datos de sus fuentes de origen mediante prcticas invasivas o
abstractas. Las primeras, que son las ms habitualmente empleadas, consisten en plantear los
procesos de extraccin atacando de forma directa a los orgenes de datos, para proceder al
siguiente paso (transformacin) en la misma operacin. La prctica abstracta, por el contrario,
busca generar una independencia a travs de ficheros. Ello implica que desde los sistemas origen
se generarn ficheros de datos (pueden ser ficheros de texto plano, csv, o incluso xml), que
sernposteriormentedepositadosenunrecursocompartidoparasutransformacinycarga.
Transformacin: esta etapa persigue lograr el nivel ptimo de adecuacin de los datos a
destino. para ello es necesario actuar sobre ellos, realizando operaciones como: cambios de
formato, uniones o normalizaciones. Es fundamental que cualquier conversin que se realice
tenga en cuenta la configuracin, tanto de la fuente de origen de los datos como del sistema de
destino,sinobviarenningnmomentolasreglasdenegocio.
Carga: es el volcado de los datos ya procesados a las estructuras finales la nueva base de
datos. A la hora de escoger una estrategia de carga, suele primar la seleccin de la total (carga
inicial total de los datos) frente a la incremental (carga parcial de los datos nuevos desde ltima
carga).

21

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

9. La conversin de los datos en un


procesodemigracin

La fase de transformacin, el momento en que se lleva cabo la conversin de los datos, persigue
prepararlos para llegar a la fase carga en condiciones ptimas. Se trata de minimizar el riesgo y,
por ello, la ejecucin de todos los pasos que comprende esta etapa se considera de importancia
crtica.Contarconlasgarantasnecesariasimplicaevitar:
Faltasdeprecisin.
Incorrecciones,lagunasyduplicidades.
Erroresdeotrostipos.
La migracin de datos puede venir motivada por la fusin de dos empresas, por el paso de un
sistema antiguo a uno ms moderno o por el inicio de una relacin de outsourcing, entre otras.
Sea cual sea el origen de la necesidad, la finalidad es siempre poder disponer del valor que los
datos encierran, en condiciones de integridad, veracidad y completitud, para que su usabilidad no
seveaperjudicadaporeltrasladosino,entodocaso,enriquecida.

22

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Crditosfotogrficos:"ComputerNetwork"byjscreationzs

Transformacincongarantas
Durante la transformacin se deben evitar, en la medida de lo posible, las interacciones
manuales con los datos. Hay que priorizar la automatizacin, por su objetividad, exhaustividad y
rapidez y por ello, en el momento de producirse la transformacin de los datos se deben tomar
decisiones que afectarn invariablemente a toda la migracin y sus resultados. En este sentido,
esnecesario:
Actuarcongarantasdecalidad.
Conocerlasreglasdenegocio.
Contarconelasesoramientodelospropietariosdelosdatos.
Comprenderculessonlosrequerimientosdelosdatosendestino.
Sin embargo, la experiencia en procesos de este tipo plantea otras necesidades, que deben ser
tenidas en cuenta si se quiere culminar con xito esta etapa de conversin. Los requisitos
mencionadosaludenalmodoymomentodeefectuarlastransformaciones.
La forma correcta de hacerlo es actuando sobre datos reales, provenientes del entorno operativo

23

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

y hacindolo de manera temprana. Al introducir las conversiones con premura se consigue una
referencia de gran valor para la planificacin de las etapas posteriores y para las tareas de
control. La ltima precisin a tener en cuenta tiene que ver con el ritmo de conversin, que ha de
procurar mantenerse lo ms elevado posible y en constante actualizacin, para que, a travs de
susrepeticiones,sealcanceunadesviacinmnimayunajusteidneo.

24

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

10. Archivar histricos


probabilidaddeuso

de

baja

El proceso de carga puede verse impactado en algunos casos, a pesar de que todo el proyecto de
migracin de datos haya transcurrido segn lo previsto. Generalmente, cuando la carga se ve
afectada suele ser por la presencia de un volumen considerable de datos histricos que tienen en
comnlaantigedaddesuorigenysubajondicedeuso.
En estos casos, al definir la estrategia de migracin se establece el traslado de los datos ms
recientes a destino y el archivo los histricos en un mbito diferente. El modo de llevar a cabo
esta solucin, en la prctica, implica optar entre dos tcnicas que permiten completar el proceso
demigracinactuandodeestaforma:
Subsetting: esta tcnica se basa en filtrar la informacin antigua para proceder a alojarla en
otrombito,cargandoenlanuevabasededatosnicamentelosdatosvigentes.
Archiving: consiste en alojar la informacin antigua en medios de almacenamiento mvil de bajo
coste, como un disco duro externo o un dispositivo USB, vinculando el medio de almacenamiento
elegido,deformalgica,alanuevabasededatos.

Crditosfotogrficos:"FolderSearch"byjscreationzs

25

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Lasventajasdelarchivoseparadodehistricos
Cualquiera que sea la tcnica empleada, separar los registros histricos de baja probabilidad de
uso en una ubicacin diferente a los ms recientes conlleva muchos beneficios, tanto para el
usuariocomoparalabasededatos:
Lanuevabasededatospodrsermsligerapornocontenerinformacinhistricapesada.
Lasbsquedassernmsrpidas.
A pesar de que la nueva base de datos ha quedado libre de ese contenido antiguo, siempre
existirunvnculoquelaunaalarchivingyalosdatosallalmacenados.
De cara al usuario de aplicaciones o base de datos, en caso que se quisiera consultar un dato
histrico (de baja probabilidad de uso) el archiving redireccionar la consulta al almacenamiento
mvilescogido,devolviendoeldatohistrico.
Antes de poner en prctica cualquier de las tcnicas expuestas, es necesario identificar la
probabilidad real de uso de informacin antigua y su frecuencia, dado que si sta es muy
elevada, se recomienda no hacer el subsetting ni el archiving para no penalizar el tiempo de
respuesta del usuario. En esos casos habra que proceder al tratamiento de esos datos en
condicionesidnticasacualquieradelosotrossujetosalamigracin.

26

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

11.Solucionesdemigracin:lasclaves
Llevar a cabo un proceso de migracin de datos puede suponer ms complicaciones de lo que se
tena previsto: retrasos en los plazos de entrega, errores de limpieza en los datos o aumento de
los costes estimados de proyecto, son algunos de los ms frecuentes. Muchos de ellos pueden
resolverse optando por la tecnologa adecuada y dejndose guiar por expertos en la materia, que
seancapacesdeprobarsuexperienciaenestecampo.
El factor que comprende mayor criticidad es la integracin. En esta fase es necesario haber
hecholaeleccindetecnologaadecuada,yaquestahadepermitir:
Asignarlosrecursosnecesariosparaprofundizaralmximoenlaetapadeperfiladodedatos.
Procurar que la limpieza de datos sea efectiva, completndose con la estandarizacin y
eliminandoduplicidades.
Conocer y comprender los sistemas de origen y destino y sus necesidades, para que la
transformacin y carga de los datos se pueda llevar a cabo en el momento preciso y del modo
adecuado.
De forma complementaria, siempre es interesante tener la capacidad de acceder de manera
nativa a las fuentes origen, como tambin lo es el disponer de la autonoma suficiente como para
que los propietarios del dato puedan resolver y gestionar datos de referencia por su cuenta,
dejandoalDepartamentodeITalmargen.

27

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Crditosfotogrficos:"SuccessConcept"byrenjithkrishnan

Cmooptimizarunamigracindedatos
Las claves de una migracin de datos exitosa se resumen en una ejecucin libre de riesgos y
minimizando costes, que culmina en una consecucin gil y dentro de plazo. Algunos de los
mediosquehacenposiblealcanzarestosobjetivostienenquevercon:
Disponer de reas de staging, rea intermedia y de pre carga: para, gracias a las dos
primeras, poder operar con datos reales actualizados y, adems, cualificarlos cuando sea
necesario, garantizando su limpieza, armonizacin y enriquecimiento. Y utilizando el rea de pre
carga para validar los datos, sometindolos a ciclos de pruebas antes de proceder a su carga en
destino.
Procurar la flexibilidad y minimizar las necesidades de mantenimiento, utilizando tablas de
referenciaylosparmetrosnecesariosencadacaso.
Definir estndares en base a un diseo por mdulos que permita desarrollar procesos simples y
demenorvolumen,ganandoenagilidadyreduciendocostes.

28

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

Lantares
Lantares, IBMPremierBusiness Partner,esuna consultora 100%espaola nacida en2003frutode la alianza de
diversos especialistas en consultora. En la actualidad, Lantares es lder en la implantacin de soluciones
estratgicasyGestindelaInformacin,enentornoonpremiseycloud.
Cerca de 200 clientes y 6.000 usuarios finalesconfanenla experiencia y elconocimientode negociode suequipo
deconsultores.
FundamentosdelaestrategiadeLantares:
LaInnovacin.
Lasatisfaccindenuestrosclientes.

Paramsinformacinycontacto:marketing@lantares.com

LantaresEuropeSLBarcelona
C.Constituci1,54
08960SantJustDesvern
Tel:+34934706000

LantaresEuropeSLMadrid
C.Alcal492,2planta
28027Madrid
Tel:+34918284046

LantaresEuropeSLSevilla
Avda.ReinoUnido11,3MOD1.2
41013Sevilla
Tel:+34955265955

LantaresEuropeSLPortugal
Avda.delaRepublica6,7esq
1050191Lisboa

29

Clavesparamitigarelriesgoenunamigracindedatos

ComprteloenTwitter,Facebook,
LinkedIn, Google+

También podría gustarte