Está en la página 1de 66

Semana Nro.

14
Modalidad de Educación Semipresencial

Calidad de los
UNIVERSIDAD PERUANA LOS ANDES

modelos de
datos
Facultad de Ingeniería

Docente: Mg. Freddy Toribio Huayta Meza

Semestre Académico 2020 – I


Asignatura: Calidad de Software
Unidad Nº 04: Fundamentos de control de calidad
OBJETIVOS
Objetivos
› Conocer la importancia de la calidad de los datos para
monitorear y evaluar los avances hacia la consecución de
los objetivos de la organización.
MOTIVACIÓN
INTRODUCCIÓN
Introducción
Mucho se habla hoy en día de la calidad de los pues es una
condición esencial para monitorear el acceso efectivo para realizar
un trabajo eficiente. Para utilizar un concepto simple y práctico, el
término “datos de calidad” se referirá a los datos que representan
la realidad que pretenden describir. Aunque no es posible evaluar
directamente la exactitud o precisión de los datos, pues no existe
con un patrón de oro para comparar los datos y determinar si
representan la realidad, existen metodologías como la
Autoevaluación de la Calidad del Dato (Data Quality Self-
assessment–DQS-) o Auditoría de Calidad del Dato (Data Quality
Audit –DQA-por sus siglas en inglés), que permiten analizar
algunos de los atributos de los datos y del sistema de información,
aportando información que permite mejorar la calidad de los
datos.
DESARROLLO DEL
TEMA
Calidad como “Way of life”
› Estamos en la era de la
calidad, y es esta la que
nos dará una ventaja
competitiva, en un mundo
globalizado
Aunque…
En cualquier proceso de calidad
› Cuanta más inversión de tiempo, mayor
calidad, pero nunca se llega al 100%
Calidad

Tiempo
Historia de la Calidad de Datos
› Desde que existen los datos informatizados, siempre ha existido la
preocupación de que sean correctos. Inicialmente la Calidad de Datos
se realizaba con edición manual o con programas desarrollados con
lenguajes no adaptados para ese uso, o incluso la edición manual de
los datos.
› A principios de los 80 se desarrollaron los primeros sistemas de
Calidad de Datos, por parte del gobierno de Estados Unidos, para
regular los cambios de domicilio, fallecimientos, bodas, divorcios, etc
en un sistema denominado NCOA (National Change of Address
Registry)
› La primera vez que se implemento un sistema especializado en la
calidad de datos en España fue para corregir y/o informar el código
postal, en la dirección de los clientes, de las principales entidades
financieras del país. Este fue desarrollado a principios de los 90,
basado en un sistema semiautomático, y apoyado por un
departamento de codificación manual, en el que se utilizaban multitud
de listados en papel. La técnica utilizada era muy primitiva (fuerza
bruta), y no implementaba las metodologías, que actualmente poseen
los sistemas modernos de calidad de datos.
¿Qué es la calidad de datos?
La Calidad de Datos no sólo se refiere a la
ausencia de defectos:
› Los datos deben proporcionar una visión única
› Debe estar correctamente relacionada e
interrelacionada con todas las fuentes
› Los datos deben ser consistentes, completos y
adecuados para su función
› Debemos asegurarnos de cumplir normativas y leyes
Impactos de Negocio
•Riesgo en el cumplimiento normativas •Riesgo competitivo
•Sistema de gestión del riesgo •Detección del fraude
•Sistema de integración del riesgo •Riesgos legales (LOPD)
•Riesgo en la inversión •Otros riesgos

•Detección y corrección

Riesgo
Mayor
•Prevención
•Cobro ineficiente •Reingeniería de procesos
•Mala relación con el cliente •Penalizaciones
•Pérdida de oportunidades Incremento •Sobrepagos
Pérdida ingresos
de Costes
•Aumento de costes •Recursos incrementados

Baja confianza
•Retrasos
•Cargas de trabajo
•Tiempos de proceso

•Falta de credibilidad •Forecasting incorrecto


•Temor en toma decisiones •Reporting ineficiente
•Menor predictabilidad
¿Quienes son los responsables del DQ las
organizaciones?
Futuro inmediato de la Calidad de
Datos
› Los problemas de Calidad de Datos
son a menudo ignorados /
desconocidos / minusvalorados por
la dirección
› Calidad de Datos es una ventaja
competitiva
› Falta de una figura responsable
› Se requieren cambios organizativos
› Una compañía debe contar con
responsables que velen por la
calidad de los datos de todos los
sistemas de información.
Otros conceptos: Calidad de la
Información
› El concepto Calidad de la Información, o IQ,
está surgiendo con fuerza en los últimos
años
› Se trata del concepto de Calidad de Datos
orientado a los Sistemas de Información, es
decir, a la mejora de la información
proporcionada a la compañía
› Algunos expertos extienden el término a lo
que también se denomina “Calidad de
Metadatos”
Otros conceptos: Calidad de Metadatos

› El concepto Calidad de Metadatos surge en


grandes corporaciones que cuentan con miles
de atributos e indicadores
› Se trata de una problemática de integración y/o
de herramientas de gestión de metadatos, no de
Calidad de Datos en sí
› Objetivos: claridad de las definiciones, lenguaje
común, única versión de la verdad, accesibilidad,
disponibilidad, seguridad, auditabilidad.
En que momento se producen los
errores
› En la entrada de datos
(Data Entry)
› Incorporación de datos
externos
› Errores de carga de los
sistemas
transaccionales
› Migraciones de datos
Causas de la creciente mala Calidad de Datos
› Más datos de más fuentes en más sistemas
– ERPs, fuentes externas, web, call centres
› Datos introducidos para un propósito ahora
está siendo aplicados a otras aplicaciones
– La Calidad de Datos puede ser
relativamente bueno para los sistemas
transaccionales pero no para sistemas BI o
CRM
› Mayores niveles de Calidad de Datos
requerido para procesos automatizados
– La mala calidad de datos lleva a problemas
de pagos en sistemas ERP, SCM, etc.
› Mayor sensibilidad del público
– Los clientes esperan un mejor servicio. Los
datos defectuosos llevan a una pobre
gestión del cliente.
El impacto de la mala Calidad de Datos
› Impide la Business Intelligence
– Informes erróneos, defectos en el análisis

› Costes de Gestión
– Discrepancias entre aplicaciones puede requerir trabajos de reconciliación de
registros

› Daña nuestra relación con el cliente


– Imposibilidad de ofrecer un buen servicio y un trato personalizado

› Imposibilidad de detectar fraudes, sobrepagos, etc


– No puede identificar duplicados, unidades familiares y corporativas
(households), etc

› Incumplimiento de normativas
– Regulaciones
– Leyes: La calidad de datos es uno de los pilares fundamentales para el
Reflejo de la mala calidad de los
datos en el BI
DWH-BI
“Through 2007, more than 50 percent of data warehouse
projects will have limited acceptance, or will be outright
failures, as a result of a lack of attention to data quality
issues” Gartner
La toma de decisiones basada en datos incorrectos puede
generar decisiones incorrectas.
Concepto: Calidad de la Información
Beneficios de la Calidad de Datos:
› Mejora de la toma de decisiones
› Aumento de la confianza de los usuarios
Soluciones de Calidad de
Datos - Arquitectura

Cuadros de Mando
Calidad de Datos
Cliente

Aplicaciones
Servidor
Runtime
Runtime Bases de Datos

Repositorio

Realtime /
SOA
Soluciones
integración

Diccionarios
La (r)evolución, Calidad de Datos
e Integración
Auditoría, control y creación de informes
Garantizar la coherencia de los datos, realizar análisis de impacto y supervisar
constantemente la calidad de la información

Acceso Perfilado Calidad Integración Entrega


A cualquier Buscar y perfilar Validar, corregir y Transformar y Entregar los datos
sistema, por cualquier tipo de estandarizar, conciliar datos de adecuados en el
lotes o en datos de cualquier relacionar datos de todo tipo momento y forma
tiempo real fuente todo tipo adecuados

Desarrollo y gestión
Desarrollar y colaborar con un repositorio común y metadatos compartidos
Calidad de Datos, ¿Donde actúa? ETQL

Almacena- Inteligencia
Reporting Front End Y
Visión única
Calidad Aplicación Reporting del cliente
o producto …
Servidor DQ Aplicación X
miento

BBDD
Data Data Mart
Warehouse

Calidad de Datos Carga


Integración

• Conciliación fuentes
de datos

• Lógica difusa Operational


• Scorecarding Transformación
• Limpieza Data Store
• Enriquecimiento Extracción

Exploración: Análisis & Medición


de datos
Fuentes

Datos no Sistemas
CRM Finanzas
estructurados Etc …
externos
Requerimientos de Calidad de
Datos
Localizar relaciones
Limpieza, Perfilado, medición y
entre registros, como Calidad de Datos para
estandarización, cuantificación del
desduplicación, cualquier área
identificación de datos impacto de la calidad
relación de dos o más incluyendo finanzas,
personales, como de datos, además de
tablas, detección de control de gestión y
nombres, direcciones y su seguimiento y
unidades familiares o producción
teléfonos monitorización
corporativas, …

Eficacia Identificación Calidad de Análisis de


del de relaciones Datos Calidad de
Contacto General Datos
(perfilado)

Suite de Calidad de Datos Corporativa

Fuente: Gartner Jun. 2007


Ciclo de vida de un proyecto de
Calidad de Datos
Ciclo de vida
Fuentes Acceder Auditar Limpiar Entregar Destinos

Auditar para
3
conocer
6 Data Experts /
Owners definen implementar las
iniciativas de reglas
corrección 2

4 Informes

Definir reglas de
1 negocio para:
5 Data Experts /
Owners • Conformidad
validan • Consistencia
informes • Normalización
• Desduplicación
Procesos de Calidad de Datos

Matching Perfilado de
Datos

Datos
Mejora de datos

Limpieza de Datos
Perfilado de datos
› El perfilado de datos permite
localizar, medir, monitorizar y
reportar problemas de calidad de Matching Perfilado de

datos
Datos

› El perfilado no debe ser sólo el Dato s

inicio de un proyecto de Calidad de


Datos, es un proyecto en sí
Mejora de datos

› Existen dos tipos de perfilado:


Limpieza de Datos

– Perfilado de estructura
– Perfilado de contenido
Perfilado de Estructura
› El perfilado de estructura consiste en el
análisis de los datos sin tener en cuenta su
significado
› El análisis se realiza de forma semi-automática
y masiva
› Tipos de análisis del Perfilado de Estructura:
– Perfilado de Columnas
– Perfilado de Dependencias
– Perfilado de Redundancias
Perfilado de Contenido
› El perfilado de contenido analiza con profundidad el
dato y su significado
› Requiere una configuración para cada campo a
analizar
› Se combina con el uso de diccionarios,
componentes específicos de tratamiento de datos,
separadores, etc
Etapas del Perfilado de Datos
Acceder Descubrir Limpiar Integrar Entregar

Tipo de Proyecto de Limpieza Implantación


Integración
proyecto descubrimiento Monitorización Validación

Cuadro de Mandos Calidad de Datos

Nivel
Actividad
Perfilado P. Estructura P. Contenido P.P.Estructura
Estructura

Tipo de
Actividad Descubrimiento Análisis de Contenido Análisis de estructura Monitorización

Analista Data Steward Desarrollador Operaciones TI


Roles ETL
Perfilado de datos, indicadores de calidad

Existencia ¿Qué dato falta o no es útil?

Conformidad ¿Qué dato está almacenado en un formato no estándar?

Consistencia ¿Qué datos aportan información conflictiva?

Precisión ¿Qué datos son incorrectos o están caducados?

Duplicados ¿Qué datos o atributos están repetidos?

Integridad ¿Qué información no está referenciada?


Ejemplo Datos de Cliente
ID_CLI CLIENTE TIPO DIRECCION CIUDAD POST PAIS ESTADO TELEFONO VENTAS ULT_PED
763113 Avalon Asesores S.L. Emp Espa#a Inactivo 713452118 0 12/12/2004
763114 DEUTSCHE BANK GROUP Emp Ronda General Mitre 72-74 Barcelona 08017 España Activo 936531223 45700 01/03/2006
763115 Julián García Ruiz Part C/ Fco Suárez 21 Valladolid 99999 España Activo 983211245 79200 01/02/2006
763116 BMW Emp Calle Eduardo Dato 8, 1ºA Madrid 28010 España Activo 914567321 0 18/07/2003
763117 Manuel Fernandez García Part Calle Velez Rubio 2, 5ºizd Madrid 08033 España Activo 914669822 6950 26/02/2006
763118 Ramón Alfonso Gutierrez Part Avda Diagonal 133 Barcelona 08012 España Activo 93566321 32080 08/08/2006
763119 Electrolux Group Emp Castellana 125 Madrid 28017 España Inactivo 916778229 0 05/03/2004
763120 ENDESA Emp Ribera del Loira, 60 Madrid 28027 España Activo 915448488 5000 06/03/2006
763121 FORD MOTOR Emp Bilbao 48002 España Inactivo N/D 0 07/07/2004
763122 Grupo FERROVIAL Emp López de Hoyos, 35 Madrid 28002 España Activo 916513450/51
763123 DEUTSCHE BANK Emp Ronda General Mitre 72 Barcelona 08017 España Activo 936531225 41200 16/02/2006
763124 Euromaster S.A. Emp Bolivia 18 Zaragoza 50010 España Inactivo 973214566 01/08/2005
763125 Arcosa Sociedad Anónima Emp JOSE LANDAZURI 15, BJ Vitoria 01008 España
763126 Banco Popular Part SALVADOR ASPIAZU, 12 Vitoria-Gazteiz 01008 España Activo 942113566 500 05/04/2006
763127 VOLVO GROUP Emp CARROTA NAVARRETE, 31 Málaga 29676 Spain Activo 954345543 54211 31/01/2006
763128 YAMAHA MOTOR IBERICA Part Almagro 37 Madrid 28012 España Activo 913102919 05/12/2005
763129 Jorge Luis VILLAR TAPIAS Iturriaga 69 Bilbao 48004 España Inactivo Ext 331 39020 04/04/2006
763130 BBVA Emp Ciruela 23, 4º Esc 2 Ciudad Real 13001 España Activo 926521134 950 20/04/2006
763131 AXA AURORA Emp Castellana 131 28013 España Inactivo 915411345 0
763132 Grupo Renault (Madrid) Emp Zurbano 3 Madrid 28010 España Activo 913555219 7800 05/10/2005
763133 BANCO BILBAO VIZCAYA Emp Paseo de Recoletos 7 Madrid 28012 España Activo 915442119 6700 02/03/2006
763134 Lunas y Cristales Lagari S.L. Emp DOCTOR NEQUI 10, 1 Andorra la Vella 00000 Andorra Activo 376828733 45000 30/11/2005
763135 El Corte Inglés Emp Calle Goya 4 Madrid 28011 España Activo +34913455119 57890 13/04/2006
763136 ROCA Emp Av Industria 6 Alcobendas Madrid 28108 España Activo 9186631234 4500 19/04/2006
763137 Mario Gomez Rey Emp Carlos III 20 Cordoba España Activo 957525566 0 01/08/2005
763138 Luisa García Monteiro Part Arbotante 2, 5º 1ª Sevilla 28010 España Activo 952114675 2500 21/01/2006
763139 Manuela Martín López Emp Llobatona 6ºF Viladecans 08840 España Inactivo 934566211 0 13/03/2003

EXISTENCIA CONFORMIDAD CONSISTENCIA DUPLICACION INTEGRIDAD PRECISION


Ejemplo datos de Producto

EXISTENCIA CONFORMIDAD CONSISTENCIA PRECISION DUPLICACION INTEGRIDAD


Ejemplo datos de Riesgo

EXISTENCIA CONFORMIDADForillustration purposesPRECISION


CONSISTENCIA only. DUPLICACION INTEGRIDAD
Actual reports featured later in presentation
Capacidades de Reporting
› Para el perfilado es fundamental una solución de reporting
Ejemplo Scorecard Calidad de Datos
Limpieza y Enriquecimiento de
datos
› La limpieza de datos permite:
– Determinar y separar elementos
de un campo situándolo en su Matching Perfilado de

lugar correspondiente
Datos

– Estandarizar formatos
– Corregir errores en los datos Dato s

– Enriquecimiento de datos Mejora de datos

Limpieza de Datos
Determinación y separación de
Datos (parsing)
La determinación y separación de datos consiste en la
descomposición de los distintos elementos que
componen los datos
Por ejemplo, el nombre siguiente:

Ingeniero JOSE RODRIGUEZ SILVA

Título: Ingeniero
Matching Perfilado de
Datos

Nombre: José
1º Apellido: Rodríguez Dato s

2º Apellido: Silva Mejora de datos

Limpieza de Datos
Estandarización
La estandarización es la adecuación de un dato a
un formato esperado.
Por ejemplo, el NIF siguiente:

5428846
Matching Perfilado de
Datos

NIF estandarizado: 05428846H


Dato s

Mejora de datos

Limpieza de Datos
Corrección
La corrección consiste en el reemplazo de un
elemento erróneo por uno correcto
Por ejemplo, la dirección siguiente:
Calle Tumaco 14, 28010 Madrid

Matching Perfilado de
Datos

Código postal corregido: 28027 Dato s

Mejora de datos

Limpieza de Datos
Enriquecimiento
El enriquecimiento consiste en la adición de datos
que no existían
Por ejemplo, el nombre siguiente:
Jose María Gomez Hurtado

Matching Perfilado de
Datos

Sexo: Varón Dato s

Mejora de datos

Limpieza de Datos
Matching
› El matching de datos se utiliza para:
– Detección de duplicados
– Relación entre dos fuentes de datos
que no tienen campos de unión
entre sí Matching Perfilado de

– Detección de unidades familiares y


Datos

corporativas (Householding)
› Se pueden aplicar múltiples criterios
para las relaciones, que
Dato s

posteriormente se pueden asociar


entre sí
Mejora de datos

› Previo al matching es conveniente


hacer una pre-agrupación de la Limpieza de Datos
información
› Existen dos métodos de matching:
– Determinístico
– Probabilístico
Pre-Grouping
Comparaciones sin pre-grouping
Sin Agrupación: A-B, A-C, A-D, A-E, A-F,
A-G, B-C, B-D, B-E, B-F, B-G, C-D, C-E,
Código Nombre Group C-F, C-G, D-E, D-F, D-G, E-F, E-G, F-
Key G=21 comparaciones
A Juan Gutierrez G36

B Juan Manuel Gutierez G36

C Juana Gutierrez Gomez G36

D Luis Fernandez F16


E Luis Alberto Frenandez F16
Comparaciones con pre-grouping
F Luis Fernandes F16
Con agrupación fonética 1º apellido: A-
G Luis Fernandez Gomez F16
B, A-C, B-C, D-E, D-F, D-G, E-F, E-G,
FG= 9 comparaciones
Matching Determinístico
Razón Social CIF CCC Dirección Teléfono Población
LABORATORIOS EVA 08070271716 SAN LUIS 90 3116311 Barcelona
ESPAÑOLA SL

EVA SANT LLUIS 90 933116311

✓ {}  ✓  ✓ ✓
EVA SANT LLUIS 9 933116311

Razón Social CIF CCC Dirección Teléfono Población


EVA B08093577 08010271716 SANT LLUIS 9 933116311 Barcelona
ESPAÑOLA,S.L

SI coincide(Razón) y coindice(calle) y
coincide(teléfono) y noesdistinto(CIF)


entonces: Match positivo
Matching Probabilístico
Razón Social CIF CCC Dirección Teléfono Población
LABORATORIOS EVA 08070271716 SAN LUIS 90 3116311 Barcelona
ESPAÑOLA SL

EVA SANT LLUIS 90 933116311

80% {} 92% 100% 50% 100% 100%

EBA SANT LLUIS 9 933116311

Razón Social CIF CCC Dirección Teléfono Población


EBA B08093577 08010271716 SANT LLUIS 9 933116311 Barcelona
ESPAÑOLA,S.L

SI media
ponderada>90%
92% entonces match
positivo

Consolidación

› Cuando se ha usado el matching


para la detección de duplicados,
Matching Perfilado de
Datos

con frecuencia se desea fusionar


estos registros. A esto se le
denomina Consolidación. Dato s

› Existen dos métodos principales


de consolidación: Mejora de datos

– Registro Superviviente Limpieza de Datos

– Mejor Registro
Métodos de consolidación

Registro
Superviviente

7 8

Mejor Registro
Un proceso iterativo …

Matching Perfilado de
Datos

Datos

Mejora de datos

Limpieza de Datos
Aplicaciones del DQ en las compañías
Las principales tipologías de proyecto de DQ son:
› Calidad de Datos asociada a un proyecto de integración
– DWH-BI
– CRM
– Data Mining
– Migración
– Consolidación
– Sincronización
› Entorno Financiero
› Entornos de Marketing
› Sistemas de Información Geográfica
› Gestión de Datos Maestros
› Calidad de Datos Preventiva
Requerimientos por tipo proyecto
Data Governance

Soluciones Verticales. P.ej. SOX, Basilea II, GDS RFID

Madurez Visión Corporativa


MDM – Gestión de Datos Maestros

CDI – Integración de Datos de Clientes

SvoC (Visión Única del Cliente)

Proyectos integración: p.ej: Migraciones, CRM, Datawarehouse

Marketing (mailshots)

High High High High

Eficiencia Identificación Calidad Datos Análisis


del contacto de relaciones General Calidad Datos
Low Low Low Low

EDQM
Resumen
En resumen:

La Calidad de Datos es fundamental para


cualquier compañía
✓Ahorro de costes
✓Eficiencia
✓Cumplimiento de la Ley

Existe la tecnología y la metodología para


corregir la mala Calidad de Datos

Calidad e Integración: una Solución


Corporativa
Resumen Beneficios de la Calidad de Datos
› Corrige errores de manera PROACTIVA e INDUSTRIALIZADA
› Reducción de costes: de gestión, de oportunidad, operacionales,
etc
› Proporciona una visión única de los elementos de las bases de
datos y da visibilidad de las posibles agrupaciones que existan
› Facilita el cumplimiento de normativas
› Mejora el mantenimiento de clientes y del servicio ofrecido,
además da confianza a los usuarios de la información
› Reduce las ineficiencias operacionales
› Maximiza el éxito de las iniciativas y proyectos de
Datawarehousing, CRM y BI y por consiguiente se mejora la toma
de decisiones
› Aumenta el conocimiento de los datos y permite conocer dónde se
están produciendo los errores
Gartner : Calidad de Datos
› Predicción: A través de 2008, las organizaciones incrementarán las iniciativas
de mejora de la calidad de datos, llevados por la presión de las normativas,
por el deseo de la mejora de la eficiencia y agilidad, y una insatisfacción
general del estado de sus datos corporativos
› Claves: Organizaciones donde la gerencia de alto nivel comprende el impacto
de la calidad de datos están mejor posicionados para completar con éxito
programas de mejora de calidad de los datos.
› Implicaciones de mercado: los datos de alta calidad (y los conocimientos,
organización, procesos y tecnología para lograrlos) será un significante
diferencial competitivo entre negocios. Las organizaciones que olviden o
ignoren sus problemas de calidad de datos van a ser superados por la
competencia.
› Recomendaciones: Las organizaciones deben ver la calidad de datos como un
problema estratégico de su negocio, y alinear sus recursos a través de la
mejora de calidad de datos. Las actividades clave incluye el desarrollo de
programas de administración de datos, análisis y medición de la calidad de
datos, mejora de procesos de negocio y la implementación de tecnología para
soportar los controles de calidad de datos.
Los factores de éxito

Tecnología

Metodología

Apoyo
Apoyo
¿Cual es la mejor forma de lograr el apoyo para un
proyecto de Calidad de Datos?

Divulgación interna, principalmente a las unidades


de negocio, tecnología y a dirección

Auditoría de Calidad de Datos:


Análisis y medición de los problemas de
Calidad de Datos de la Compañía
Conclusiones de los problemas de Calidad de
Datos
Propuesta de soluciones
Análisis del ROI
Metodología
Decidir la metodología adecuada en función
del nivel de apoyo logrado.
Proyectos estratégicos con apoyo de la
dirección: metodologías de Data Governance.
Proyectos tácticos con apoyo de una o varias
unidades de negocio. Proyectos relacionados
de Calidad de Datos, con establecimiento de
mejores prácticas para cada uno de ellos.
Proyectos departamentales, orientados a la
resolución de un problema determinado.

Establecer objetivos, definir métricas,


monitorizar, corregir, repetir y evolucionar.
Tecnología
La tecnología es fundamental para la resolución de
problemas de Calidad de Datos.
En la elección de la tecnología deben exigirse los
siguientes requisitos:
Combinación con una plataforma de integración de
datos: acceso universal a los datos
Tratamiento de cualquier tipo de datos. No sólo
nombres y direcciones.
Solución de reporting, scorecarding y monitorización
Orientado a negocio
Previsión de la inversión en Calidad de Datos
Por Forrester Research, Inc.

2000 2001 2002 2003 2004 2005 2006 2007 2008

“Information Quality Market On Target To Top $1Billion By 2008,”


Forrester Research, 21 de Marzo de 2005
Resistencia al cambio
No veo que No es mi Mejor no decir nada, no
tengamos responsabilidad vayamos a abrir la caja
problemas en los de Pandora
datos

Escéptico Desentendido Catastrofista


CONCLUSIONES
Conclusiones
› El modelo de Calidad de Datos representa los cimientos
sobre los cuales se construye un sistema para la
evaluación de un producto de datos. En un modelo de
Calidad de Datos se establecen las características de
Calidad de Datos que se deben tener en cuenta a la hora
de evaluar las propiedades de un producto de datos
determinado.
› La Calidad del Producto de Datos se puede entender
como el grado en que los datos satisfacen los requisitos
definidos por la organización a la que pertenece el
producto. Son precisamente estos requisitos los que se
encuentran reflejados en el modelo de Calidad de Datos
mediante sus características (Exactitud, Completitud,
Consistencia, Credibilidad, Actualidad, Accesibilidad,…).
Instrumentos de
Evaluación
Instrumentos de Evaluación
› Lista de cotejo
› Registro auxiliar
Finalización

También podría gustarte