Documentos de Académico
Documentos de Profesional
Documentos de Cultura
POWERDATA TOFU - Calidad de Datos PDF
POWERDATA TOFU - Calidad de Datos PDF
1. Introduccin
8. La estrategia de calidad
11. Conclusin
2 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
1. Introduccin
La falta de calidad de los datos es uno de los principales problemas a los que se enfrentan los
responsables de sistemas de informacin y las empresas en general, pues representa claramente
uno de los problemas "ocultos" ms graves y persistentes en cualquier organizacin.
En palabras de David Loshin, President of Knowledge Integrity, Inc: Para ser capaces de
relacionar los problemas de la calidad de datos con su impacto en el negocio, tenemos que ser
capaces de clasificar tanto nuestras expectativas de calidad de datos, como los criterios de impacto
en la empresa.
El Dr Kaoru Ishikawa (1988), a su vez, considera que: "En su interpretacin ms estrecha, calidad
significa calidad del producto, pero en su interpretacin ms amplia significa calidad del trabajo,
calidad del servicio, calidad de la informacin, calidad del proceso, calidad de la direccin y calidad
de la empresa".
3 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
2. La importancia de la calidad
de datos
Debido a los crecientes avances de la tecnologa en cuanto a gestin de datos e informacin, las
empresas se ven enfrentadas da a da a un aumento en la cantidad y diversidad de los datos que
deben gestionar y en los elementos a las cuales se les asocian estos datos e informacin.
Datos externos
Frecuentemente se incorporan datos externos de forma automtica en los sistemas de informacin
4 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
de las organizaciones, sin tomar las precauciones oportunas, y esto provoca que se generen
multitud de problemas de Calidad de Datos.
Migraciones
Cuando se realiza una migracin de datos sin haber
previamente analizado en profundidad los cambios que
hay que aplicar a la informacin, una de las muchas
consecuencias suele ser la ausencia de calidad de
datos, existencia de valores obsoletos o en un formato
distinto al esperado en el nuevo sistema, e incluso
duplicidades.
Sintaxis: est relacionada con el formato de los datos y cmo se representan. Tienen los datos la
forma correcta? Se encuentran los datos dentro del intervalo de valores?
Semntica: transmite el significado de los datos. Hay valores ocultos en los datos no
estructurados? Hay nombres en los campos de direcciones, a pesar del cumplimiento de la forma
correcta de los datos? Existen registros duplicados con leves diferencias?
*Crditos foto:
www.bizjournals.com/kansascity/blog/2012/07/group-worries-google-service-may-widen.html?page=2
5 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
http://www.iabuk.net/events/library/digital-project-management
3. Qu se entiende por
Calidad de Datos?
Para hablar de datos de alta calidad, es necesario comprender claramente el significado, el
contexto y la intencin de stos, no debiendo haber ni imprecisiones ni vaguedades y debindose
poder contar con definiciones estandarizadas que sirvan de base para la futura toma de decisiones.
6 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
Supervisar y limpiar de forma proactiva los datos de todas las aplicaciones, y mantener
limpios estos datos.
Permitir al negocio compartir la responsabilidad de la calidad y del gobierno de datos.
Impulsar mejores resultados con unos datos empresariales fiables.
Es decir, la calidad de datos est asociada a un conjunto de dimensiones o atributos que se podran
concretar en la exactitud, la integridad, la consistencia y la coherencia. Y es precisamente cuando
dichas dimensiones o atributos son ambiguas que las empresas caen en errores en los datos.
7 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
4. Dimensiones de calidad de
datos
Para abordar de manera ntegra la problemtica en la calidad de datos, debe realizarse un anlisis
por cada una de las dimensiones de calidad de datos, logrando de esta manera resolver cada una
de las dudas existentes en el proceso y mitigando as los riesgos de fracaso en los proyectos de
este tipo.
En este sentido, lo importante y prioritario es tener un punto de partida, una mtrica que permita
identificar el estado actual de los datos.
Conformidad
8 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
Los datos que estn en los campos de la tabla, deben estar en un formato estndar y legible.
Consistencia
Al hacer el cruce de informacin con los registros, se debe evitar la informacin contradictoria.
Precisin / Exactitud
Si los datos no son precisos, estos no
pueden ser utilizados. En este sentido, para
detectar si estos son precisos, se compara
el dato con una fuente de referencia.
Duplicacin
Es importante saber si se tiene la misma
informacin en formatos iguales o similares
dentro de la tabla.
Integridad
Otra dimensin de calidad importante radica en el hecho de saber si toda la informacin relevante
de un registro est presente de forma que se pueda utilizar.
El entendimiento de estas seis dimensiones es el primer paso para la mejora de la calidad de datos.
Ser capaz de identificar y separar los defectos de los datos clasificndolos por estas dimensiones,
nos permite aplicar las tcnicas adecuadas para mejorar tanto la informacin como los procesos
que crean y manipulan la informacin.
* Crditos foto:
http://www.unicreditbulbank.bg/Blog/CATEGORIES/Our_experts/BLOG_POST?doc=CUSTOMER_CARE
http://kommunikationsledelse.dk/2010/11/10/2010-i-kommunikationsmalingernes-tegn/
9 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
5. Consecuencias de los
errores en los datos.
Los errores en los datos afectan de diversas formas a las organizaciones. Una de las principales
implicaciones se genera en los procesos de toma de decisiones los cuales se vuelven inefectivos e
ineficientes.
La mala calidad de los datos es uno de los principales indicadores de proyectos fallidos y, a
menudo,es identificada como la causa raz de los fallos de procesos, siendo tambin la principal
causante de las decisiones errneas en una organizacin.
10 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
genera en el cliente el tiempo que se dedica a la solucin del problema creado por el error.
Tambin es considerable el efecto de los errores de los datos respecto del xito de nuevas
aplicaciones informticas ya que stos deben proporcionar una visin nica y precisa, adems de
estar correctamente relacionados e interrelacionados con todas las fuentes a utilizar.
* Crditos foto:
http://www.expand2web.com/blog/survey-reports-small-businesses-with-poor-websites-may-lose-customers/
http://under30ceo.com/startup-after-answering-these-three-questions-on-risk/
11 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
6. Cmo identificar los datos
errados?
La mayora de los errores se pueden identificar de manera relativamente sencilla.
Para ello, se pueden utilizar dos alternativas distintas que permiten la deteccin eficaz de los datos
errneos:
a) Verificacin Manual
Esta alternativa permite, tericamente, localizar la mayora de los errores ms comunes, y ello se
logra verificando en base a la fuente original de la informacin todos y cada uno de los valores,
permitiendo de este modo determinar qu valores son correctos y cules no. No obstante, esta
alternativa posee algunas desventajas, sobre todo respecto al costo asociado a las HH.
b) Anlisis Automtico
Utilizan tanto el software como la habilidad del analista de calidad de datos para detectar los
errores. stas se pueden aplicar a:
12 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
Las tcnicas analticas bien aplicadas, identifican suficientes errores para dar una idea clara del
estado de calidad de datos. Sin embargo un programa continuo de mejoramiento de la calidad de
los datos, logra resultados satisfactorios.
* Crditos foto:
http://nguyentantrieu.info/blog/automatic-testing-web-application-website-webservice/
13 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
7. Ciclo de Vida en Calidad de
Datos
Es importante considerar que los proyectos de calidad de datos, son proyectos de mejora
continua. Por ello, para obtener los mejores resultados en la implementacin de estos proyectos,
es imperativa la utilizacin de procedimientos claros y bien establecidos.
Se identifican 6 procesos o tareas claves que deben reflejarse y abordarse en cada proyecto de
calidad.
1. Descubrimiento
Se utiliza para explorar los modelos y/o fuentes de datos indocumentados, logrando de esta
manera una rpida identificacin y medicin de estos.
2. Perfilado
Es una auditora de Calidad de Datos con la entrega de un cuadro de mando que identifica, clasifica y
cuantifica los problemas de calidad dentro de todas las fuentes. El objetivo de la auditora es
generar una medida tangible de la calidad de los datos al inicio, que le permitir aclarar las
condiciones actuales, como por ejemplo, fuentes de datos con 25% duplicados, los datos de 20%
atributos redundantes, etc.
3. Limpieza
Mediante este proceso clave se definen las reglas y se establecen metas a alcanzar. Por ejemplo,
antes de la entrada en funcionamiento, la calidad de datos debe ser del 85% para los atributos de
prioridad.
14 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
4. Coincidencias
Consiste en el diseo de la limpieza,
estandarizacin, coincidencia y reglas de
consolidacin.
5. Consolidacin
En esta etapa se implementan los procesos de
mejora en la calidad de los datos (definidos en el
punto nmero 3).
6. Monitorizacin
Una vez que el proceso de calidad de los datos se ha implementado, es importante que se informe
sobre los resultados, es decir, la presentacin de informes para la distribucin de los resultados,
incluyendo desglose y alertas.
15 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
8. La estrategia de calidad
En muchas etapas del proceso de gestin de datos se puede aplicar la calidad, ya que sta se
relaciona directamente con la integracin, por lo que deben considerarse como parte de una
misma estrategia que conjugue:
Servicios.
Metodologa.
Herramientas.
Las empresas, en la prctica, tienen un gran problema de calidad que se extiende desde el interior
de la organizacin hacia fuera, proyectndose en aspectos como las relaciones con los clientes,
la toma de decisiones y la productividad. En un entorno as, es difcil fiarse del dato y ste es
precisamente el
objetivo de la funcin de
Calidad.
Los datos que eran introducidos con un propsito concreto ahora estn siendo aplicados a otras
finalidades: La Calidad de Datos puede ser relativamente buena para los sistemas transaccionales
pero no para sistemas BI o CRM. Una factura incorrecta en el transaccional afecta slo a un cliente.
En cambio, en el sistema de BI, esta factura puede tener un impacto muy grande.
Se deben implementar mayores niveles de Calidad de Datos para procesos automatizados, ya que
16 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
la mala calidad de datos conlleva problemas de pagos en sistemas ERP, SCM, etc.
En efecto, todos los procesos se automatizan y cada vez hay menos intervencin humana. En
efecto, una persona detectara y cancelara por sentido comn un proceso errneo, como por
ejemplo, el envo de una carta a la calle equivocada, mientras que un sistema automatizado de
mailing, no.
Por ltimo, hay que tener en cuenta que los clientes esperan un mejor servicio. Los datos
defectuosos llevan a una pobre gestin del cliente que cada vez es ms exigente y cada vez conoce
mejor sus derechos.
17 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
9. En qu consiste Data
Quality?
Informatica Data Quality transforma la forma de trabajar de su empresa. Este software permite
que todo el mundo confe en todos sus datos para todas sus necesidades y en todo momento.
Informatica Data Quality ofrece calidad de datos generalizada a todos los usuarios, proyectos,
dominios de datos y aplicaciones empresariales, en entornos locales o en el cloud, y adems con
una sola plataforma unificada.
18 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
centralizadas de calidad de datos para mejorar la calidad de los datos en todas las
aplicaciones
19 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
10. Beneficios del Uso de
Informatica Data Quality
a) Reduccin de los costes
Con esta solucin pueden eliminar herramientas de calidad de datos redundantes y recortar
drsticamente los costes de licencia y mantenimiento mediante la estandarizacin de procesos, y
todo ello bajo una sola plataforma que ofrece un nico conjunto de reglas y herramientas
reutilizables para gestionar la calidad de datos en numerosos proyectos.
b) Reduccin de riesgos
20 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
de datos sostenibles a largo plazo y confiar en todos los datos de la empresa. Al aplicar la calidad
de datos sistemticamente en todas las aplicaciones de forma global, aumenta la confianza en que
todos sus datos cumplan con los procesos de gobierno de datos. Asimismo, gracias la fiabilidad
demostrada de Informatica Data Quality en las implantaciones para toda la empresa, se reduce el
riesgo de perodos de inactividad.
c) Actuacin ms eficaz
d) Mejora de la productividad de IT
El entorno comn de proyectos y las herramientas de colaboracin de Informatica Data Quality
aceleran el ciclo de especificacin y revisin entre el departamento de IT y el resto de la
empresa. Los departamentos de IT pueden acceder a todos los datos con rapidez para llevar a
cabo los proyectos de calidad de datos en plazos ms cortos.
Adems, pueden crear reglas reutilizables de calidad de datos con facilidad, gestionarlas de
forma centralizada y desplegarlas rpidamente en batch o en tiempo real, sin necesidad de
recodificacin y en todas las aplicaciones.
* Crditos foto:
http://www.reelseo.com/youtube-hit-75-million-facebook-fans-rewards-playlist/
http://www.fundspeople.pt/noticias/capital-de-risco-aumentou-ativos-sob-gestao-70212
21 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn
11. Conclusin
Para poder obtener un buen control de calidad se requiere cubrir todo un procedimiento para
poder lograr nuestro objetivo, que es mejorar la calidad para una mejor y mayor satisfaccin del
cliente y de uno mismo como empresa o industria.
Por medio de las etapas tenemos la oportunidad de detectar cualquier anomala que se pudiera
presentar durante cualquiera de nuestros procesos antes de alcanzar nuestro fin, por ello es
importante llevar a cabo un seguimiento adecuado, correcto y de mejora continua.
Las empresas que le dan importancia a la calidad de sus datos, les permiten obtener beneficios
claves para agregar valor al negocio y diferenciarse del resto de sus competidores, otorgando:
22 Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin Comprtelo en: Twitter LinkedIn