Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
Estamos entrando en un nuevo mundo en el que los datos pueden ser ms
importantes
De los programas informticos. (Tim O'Reilly)
Los datos de la empresa es el mbito en el que la mayora de las veces necesita atencin en
relacin
con
Anlisis de procesos de negocio. En los procesos de negocios, los datos constituyen la base
Para la mayora de las acciones realizadas. Por lo tanto, si los datos utilizados en los procesos de
negocios
De
la
no
calidad
los
procesos
de
negocio
no
son
ser
eficiente.
Antes
de
empezar
En el debate de la calidad de los datos y los criterios para asegurar la calidad de los datos,
En
primer
lugar,
la
distincin
entre
datos,
informacin
conocimiento.
Sub
Por consiguiente, la naturaleza de los datos de la empresa, que es el enfoque principal de este
libro,
se
define.
En tercer lugar, la importancia de la calidad de los datos se pone de manifiesto. Para obtener an
ms
Comprensin detallada de la cuestin, el concepto de la calidad de los datos se despliega en
La seccin siguiente. Por ltimo, el captulo se explica cmo evaluar los datos qual
La autoridad y la forma de garantizar la alta calidad de los datos.
Contrario a los datos. En cuanto a los datos, hay un acuerdo general sobre el significado de la
Trmino "informacin", cabaa diferentes formulaciones de sus definiciones, tales como:
[Informacin] es un mensaje, por lo general en forma de un documento o un
Comunicacin audibles o visibles.
Informacin est destinada a cambiar la forma en que el receptor percibe
Algo, para tener un impacto en su sentencia o comportamiento. (Dav
Enport y Prusak, 1998)
La informacin es un flujo de mensajes. (Nonaka y Takeuchi, 1995)
La transformacin de los datos en informacin ha sido definida como:
Informacin sobre los resultados de la colocacin de los datos en algunas
significativas
Contexto, a menudo en forma de un mensaje (Zack, 1999)
[La
transformacin
de
datos
en
informacin
es
cuando
los
datos
son]
contraste
con
los
"datos"
la
"informacin",
el
significado
de
la
expresin
es
una
mezcla
fluida
de
experiencia,
valores,
contextu
e
y
incorporar
nuevas
aplica
la
se
menudo
est
Conservadores
en
contenida
sino
experiencias
mente
no
tambin
de
slo
en
en
las
knowcrs.
los
informacin.
En
las
organizaciones,
documentos
rutinas,
Que
procesos,
repositorio
prcticas
ah
creencias"
(2001)
que
(Newell
aplican
et
esta
ah,
2002).
definicin
Por
ejemplo,
tradicional,
esto
pero
con
se ve
un
en Nonaka
nfasis
en
la
no-humanos
para
tratar
la
dinmica,
humanista
dimensin
relativa
Las disposiciones del conocimiento. Por lo tanto, trabajan con una definicin de conocimiento como
dy
NAMIC justificacin de creencias personales hacia la "verdad".
En el otro extremo
OPTIMIZACIN
NEGOCIO
DE
LOS
PROCESOS
DE
La
figura
4.1
ilustra
la
relacin
entre
datos,
informacin
conocimien
Borde. Como se ha visto, cuando los datos se colocan en un contexto y se les da lo que significa
que
se
Llegado
informacin.
La
definicin
del
conocimiento
utilizado
en
la
figura
es
algo
una
empresa
son
de
mala
calidad
por
lo
que
la
informacin,
al
final,
esta
Causalidad puede ser sumamente desafortunada, y, por tanto, una especial atencin en la calidad
de
los
datos
Se llama.
muchos
tipos
de
datos
que
sean
pertinentes
en
diferentes
contextos.
En
este
El captulo, el enfoque principal est en "los datos de la empresa". Los dos tipos ms relevantes de
Los datos de la empresa son los datos maestros y datos de las transacciones. Los datos maestros
son
los
ba
Sic caractersticas de las instancias de las entidades de la empresa, como clientes, productos
Y proveedores. Por lo general, los datos maestros se crean una vez y utilizar muchas veces y no
No cambian con frecuencia. Datos Maestros es por ejemplo nmero de cliente, el cliente
Nombre, ID. de empleado, direccin del proveedor, etc. describir los datos de la Transaccin
Eventos en la empresa, y cada registro de transaccin tiene una dimensin de tiempo, un valor
Y las referencias a otros datos. Estos eventos pueden ser: una orden de compra llega,
Se paga el sueldo mensual a un empleado, la factura se enva a un cliente, etc.
Los datos de la empresa se puede considerar en dos niveles abstraccin, "modelos de datos y
los
datos
Los valores". Un modelo de datos es una definicin de las entidades (clases), sus atributos (buen
Vnculos), y en las relaciones interpersonales. Un ejemplo de una entidad es "empleado", que
pudiera
albergar
Los atributos 'id', 'nombre', 'fecha de nacimiento', 'direccin', etc. El empleado podra
Tiene una relacin a la entidad, "proyecto de ERP", lo que implica que el empleado est
Participan en este proyecto. El valor de los datos para el empleado atributo "ID" podra ser
" 01-77 -98 ".
La Figura 4.2 muestra un ejemplo de un modelo de datos. Como se observa, para cada atributo,
El tipo de datos se indica (p. ej., carcter (char) o se indica si se trata de una para
Extranjeros, es decir, un atributo que pertenece a otra entidad. Tambin las relaciones
Entre
las
entidades
Uno-a-muchos
se
muestran.
pedidos,
cada
En
pedido
el
ejemplo
puede
tener
actual,
un
un
cliente
cliente
puede
uno-a-muchos
tener
fin
Las lneas, para cada lnea de orden tiene un fin y un tema, y cada elemento est relacionado con
De cero a muchas lneas de orden.
Fin
OrderLine
OrderlD: char(12)
OrderLinelD: char(12)
OrderNumber: integer(8)
1 1.. *
OrderlD (ForeiQnKevl
*W1'V'VM *11 ^VI J
CustomerlD {representan
ForeignKey}
Creado: fecha
UneNumber: integer(3)
1.. *
0.. *
El Cliente
Tema
l: char(8)
CompanyName: char(30)
ItemName: char(30)
ContactPersonName: char(40)
Descripcin: char(100)
Cuando los datos se almacenan valores, se convierten en registros de datos. Normalmente, los
registros
se
Almacena en tablas en una base de datos. La Figura 4.3 muestra un ejemplo de una tabla de los
elementos.
Como se ha visto, el nombre de la tabla es "elemento", y que tiene las columnas "ItemID", ItemNumBer', 'ItemName", y "Descripcin".
ItemID
ItemName
A0000001
45
Tornillo 45 mm
A0000002
46
Tornillo 50 mm
A0000003
47
Tornillo 55 mm
A0000004
48
Tornillo 56 mm
Descripcin
Registros
OPTIMIZACIN
NEGOCIO
DE
LOS
PROCESOS
DE
Los datos almacenados pueden ser de naturaleza ms discutible que los datos de ejemplo
En la Figura 4.3 , es decir nmeros y nombres. Los datos pueden tambin, por ejemplo describir
Tiempos de funcionamiento, valoraciones de los clientes, que son los datos de un menos exacta
Naturaleza. Aunque estos datos estn basados en la observacin de la realidad, todava pueden
Ms o menos en correspondencia con la realidad. La figura 4.4 ilustra esta posibleIncompatibilidad
entre
el
mundo
real
(RW)
lo
que
se
puede
inferir
de
informa
De los datos del sistema. Como se ve, los datos se representan en un sistema de informacin
basado
En
la
percepcin
del
mundo
real.
Tales
percepciones
pueden
diferir
dif
Distintos aspectos relevantes se pueden encontrar y, por tanto, incluido. Cuando los datos de una
Sistema de informacin son interpretados, el usuario obtiene una vista del mundo real basado
Por lo que sugieren los datos. Pero a causa de las diferentes interpretaciones del real
Mundo, la perspectiva en el mundo real deducido a partir de los sistemas de informacin
Pueden no corresponder a los usuarios ver en el mundo real, y una falta de coincidencia
Se produce. Por lo tanto, cuando se utiliza este tipo de datos, esto debe hacerse de manera crtica
En lugar de fe ciega en todos los datos necesariamente dar una imagen exacta de la realidad.
modelo
Modelo".
para
ilustrar
esto,
el
llamado
"informacin
comercial
madurez
Fhe modelo define cinco niveles de la gestin de datos, y se puede utilizar para
Empresa
Factor diferenciador de la
Adaptable
Rendimiento
competencia
Informacin
Innovacin
activada
Innovacin empresarial
Informacin como un
Informacin en
Activo estratgico
Creciente
Contexto
Funcional
empresarial.
Vencimiento
Informacin para gestionar
Informacin
La empresa
Interaccin
bsica
Puesto que los datos se utilizan en casi todos los procesos de una empresa, la mala calidad de los
datos
(p.
Inexacta
Rendimiento
incorrecta)
de
la
obviamente
empresa.
tienen
Hay
un
varios
ej.
importante
tipos
de
impacto
negativo
consecuencias
en
la
negativas
De los pobres datos maestros, tales como (Redman, 1998; Kahn et al., 2002):
Menor satisfaccin del cliente
Mayor coste de funcionamiento
Ineficiente los procesos de toma de decisiones
Menor rendimiento
Menor satisfaccin laboral de los empleados
Los recursos que se dedican a detectar y corregir los errores.
Debido al amplio uso de los datos de casi todos los procesos, los datos constituyen un sig
Contribuyente significativo a la cultura de la empresa. Mala calidad de la informacin implica que
Es
imposible
construir
confianza
en
los
datos
que
implica,
una
vez
La falta de aceptacin por parte del usuario de todas las iniciativas basadas en esos datos.
ms
OPTIMIZACIN
NEGOCIO
DE
LOS
PROCESOS
DE
Expertos de la industria como Gartner Group, Price W aterhouse Coopers y El Data W arehousing Institute
Ha realizado estudios de la calidad de los datos en las empresas. Sobre esta base, que pretenden identificar una crisis en lo s datos
Gestin de la calidad y resistencia de los responsables de la toma de decisiones para hacer lo suficiente sobre l (Marzo,
2005). Marzo (2005) resume los resultados de dichos estudios como:
" 88% de los proyectos de integracin de datos ya sea completamente o no significativamente a lo largo de su raz
Obtiene"
"El 75% de las organizaciones han identificado los costos derivados de datos incorrectos"
" 33% de las organizaciones han demorado o cancelado nuevos sistemas de TI porque los datos"
"S611mil millones de dlares por ao se pierden en los EE.UU. en mal envos dirigidos por s sola los gastos generales y de p ersonal"
"De acuerdo con Gartner, los datos errneos es la causa nmero uno de sistema CRM fracaso"
"Menos del 50% de las empresas afirman ser muy confiado en la calidad de sus datos"
"Business intelligence (Bl) proyectos a menudo fallan debido a datos incorrectos, por lo que es imprescindible que Bl -base
Las decisiones de la empresa se basan en datos limpios"
"Slo el 15% de las empresas son muy seguros de la calidad de los datos externos que se les suministra"
"Los datos de los clientes normalmente degenera en un 2% por mes o 25% anual"
"Las organizaciones suelen sobreestimar la calidad de sus datos y subestimar el costo de
Errores"
"Los procesos de negocio, las expectativas de los clientes, sistemas de origen y reglas de cumplimiento estn constantemente
Cambiando. Sistemas de gestin de la calidad datos deben reflejar esta"
"La gran cantidad de tiempo y dinero se gastan en codificacin personalizada y los mtodos tradicionales - ruby
Aliado contra incendios para frenar una crisis inmediata en lugar de resolver el problema a largo plazo".
Cuadro 4.1 : Resultados de las encuestas sobre la calidad de los datos
representado
Representacin completa
Relevantes del mundo real
Aspectos
Representacin Incompleta
Informacin
Elementos del sistema
Informacin
Elementos del sistema
-O
-O
-O
-O
-O
Un
Claro Conjunto significa que est claro a lo que cada elemento de una infor
Sistema se refiere. La figura 4.7 ilustra la dimensin resolver esta incomprensible ambigedad.
Como
En
la
ilustracin
de
la
derecha,
no
est
claro
en
qu
la
segunda
informacin
Elemento del sistema se refiere. Por ejemplo, sta puede ser un registro que se refiere a dos
Diferentes
temas
que
entre
otras
cosas
implica
que
es
imposible
Representacin clara
Relevantes del mundo real
Aspectos
Representacin ambigua
Relevantes del mundo real
Informacin
Informacin
Elementos del sistema
Aspectos
-O
-O
-O
-O
tiene
alguna
informacin
de
valor.
La
figura
4.8
ilustra
el
sentido-
OPTIMIZACIN
NEGOCIO
DE
LOS
PROCESOS
DE
Representacin significativa
Relevantes del mundo real
Aspectos
Informacin
Elementos del sistema
Informacin
Elementos del sistema
-O
-O
-O
... ... ... ... ...-O
... ... ...
-O
S
Por ltimo, la Correccin De datos define la forma en que est de acuerdo con la
Aspecto
ot
el
mundo
real
que
se
pretende
describir.
Algunos
elementos
de
la
Sistemas de informacin se espera que sea completamente correcta (por ejemplo, nmero de
elemento
Direccin de cliente y sueldo de empleado), mientras que otro sistema de informacin los datos
Son meras estimaciones (p. ej., tiempos de funcionamiento y evaluacin del cliente), y es por ello
que
algunos
Inexactitud
es
aceptada.
Imprecisiones,
como
un
error
ortogrfico
en
un
tema
de
Abono, no necesariamente puede tener consecuencias, pero que pueden tener en algunos casos.
Las consecuencias de mala calidad de los datos varan en funcin de lo que describe.
La
figura
4.9
ilustra
la
dimensin
correcta
en
el
mundo
real
aspecto
es
Representacin incorrecta
Relevantes del mundo real
Informacin
Aspectos
RW AI0-
-OISE'
RW A1 -
-S.
RW A2 #RW A30-
-OlSE2
-0' * 3
RW A2 #RW A3 -
-OlSE2
-OISE4
En un contexto particular. Por lo tanto, es de sentido comn para ver calidad de datos
Desde
un
aspecto
extrnseco
adems
del
aspecto
intrnseco.
Hay
muchos
diferentes
Acceso a los datos las dimensiones incluyen derechos de acceso, cuestiones de almacenamiento,
interpretabilIty, comprensibilidad, etc. Por lo tanto, aunque los datos pertinentes existen" los datos
No se pueden utilizar si se puede tener acceso a los datos. Datos utilidad dimensiones
Incluir relevancia, valor aadido, puntualidad y al nivel de detalle, etc. Por lo tanto, los datos
Utilidad dimensiones se relacionan con el contexto, es decir, lo que puede ser til en un contexto
Puede no ser til en otro.
son
ms
fciles
de
medir
y/o
observar
que
la
tercera
(utilidad),
que
es
Generalmente satisfactoria que una pequea parte de los datos es de mala calidad con respecto a
Dimensiones intrnsecas y accesibilidad. Por lo tanto, en la plaza 1 datos intrnseco
La calidad y accesibilidad de los datos son insuficientes. En plaza 2, slo los datos
La accesibilidad es insatisfactoria, mientras que en slo 3 metros cuadrados la intrnseca calidad de
datos
Es insatisfactoria. Cuadrado de 4 representa lo que debe ser la meta de cualquier empresa,
Intrnseca calidad de datos
Insatisfactoria
Los datos
Accesibilidad
I
-
4Insatisfactorio Satisfactorio
OPTIMIZACIN
NEGOCIO
Diferentes
DE
LOS
PROCESOS
DE
en distintas
empresas
Y reas de datos dentro de las empresas. Adems, algunas zonas son ms fciles de evaluar que
Otros. Por lo tanto, no es posible generalizar sobre lo que es un nivel satisfactorio.
La intrnseca calidad de los datos tambin puede verse en relacin con la utilidad de los
Los
datos.
En
este
caso,
hay
un
patrn
tpico
de
la
relacin
entre
estos
dos
dichos
datos.
Sin embargo, cuando la calidad de los datos alcanza un nivel determinado, la utilidad serap
Brazos cruzados. Por otro lado, si la calidad de los datos cae desde un nivel alto
En
ambas
dimensiones,
tendra
que
caer
hasta
un
cierto
punto
antes
que
implica
Con frecuencia problemas de calidad de los datos. Pero cuando sucede esto, los usuarios
Pronto empieza a cuestionar la validez de los datos (1 laug et al., 2009).
Intrnseca calidad de datos
Satisfactoria
Insatisfactoria
Los datos
Utilidad
Insatisfactorio Satisfactorio
Figura 4.11 : intrnseca Calidad de los datos y su utilidad
Fuente: Haug et al. (2009)
Al
Sion,
combinar
el
acceso
que
los
datos
a menudo
de
la
se encuentran
utilidad
dimensin
en relacin
con
dimensin
un aumento
4.12 Como un', V y V. Ruta "a" puede ocurrir en una situacin en la que se decidi a comenzar
Para registrar un nuevo tipo de datos, los cuales, como se sabe, no se usa para nada,
Despus de todo. Por lo tanto, ms no de datos tiles que se encuentran en el sistema, por lo que
un
Mayor traccin de los datos no es til. Ruta b' puede ocurrir en una situacin en la que
Nuevos datos estn registrados en el sistema o cuando los datos de algn modo estn hechas
Accesibles a los usuarios, mientras que el aumento de la cantidad de datos existentes no se hacer
Los datos ms valiosos y donde los datos adicionales celebrar una fraccin de similares
No datos tiles. Ruta c' se produce cuando la utilidad de los datos existentes aumenta
Arco porque nuevos datos accesibles. Por ejemplo, esto puede ocurrir en una situacin
De donde los datos de ventas no se encuentran muy til para realizar estadsticas de ventas
Porque estn incompletos. Pero cuando la falta de acceso a los datos de ventas,
Los datos de ventas ser til lor hacer las estadsticas de ventas.
Satisfactoria
,
U
n
_
N
_
\ J /
'
'
Insatisfactoria
1
Ii
Los datos
Utilidad
Insatisfactorio Satisfactorio
Si es necesario.
Sin
embargo,
y,
Otra tcnica que puede ser aplicada si los mismos datos se almacenan en varias da
Tabases, compara las bases de datos. En todos los casos en que los datos son idnticos, es
Asumi que son los correctos, y en los casos en que los datos son diferentes, los datos son
OPTIMIZACIN
NEGOCIO
Investigar
DE
LOS
PROCESOS
corregir.
En
DE
muchos
casos,
este
mtodo
de
la
comparacin
base
Pueden no ser aplicables. En su lugar, un tercer enfoque puede aplicarse, a saber, los datos
Edicin'.
Tres estrategias
Baja
Alta
Buena)
Costos de implementacin
Corto plazo
Largo plazo
Alta
Baja
Alta
Baja
Cuadro 4.2 : Los costos y beneficios de limpieza de las bases, en comparacin con las tres Estrategias
Fuente: Redman (1995)
alto
Marco
orientador
nivel
en
los
cuales
la
que
gestin
de
datos.
forman
En
la
prctica,
el
la
forma
OPTIMIZACIN
NEGOCIO
DE
LOS
PROCESOS
DE
Definicin de una poltica con respecto a los datos que aborda estos temas, poner una empresa en
la
Derecho va a fin de evitar que se produzcan importantes problemas relacionados con los datos.
UNA Danesa fabricante de equipos de impresin con graves problemas de calidad de los datos en relacin con
A la aplicacin de un nuevo sistema ERP. Tomaron su nuevo sistema ERP en uso despus de un ap
Duracin aproximada 9 meses fase de ejecucin, sino que se llev unos 2Vi Aos antes de que el sistema
Estaba totalmente en funcionamiento en todas las reas y el proyecto termin costando ms del doble de lo que se define
En el presupuesto original. Uno de los problemas ms importantes ha sido demasiado alto para sus ambiciones en lo que a regis tro
El sistema, es decir a nivel de "tornillo". Este enfoque implica que se convirti en una tarea que requiere mucho tiempo par a
Crear nuevos elementos y, por lo tanto, muchos empleados tom atajos de mala calidad de datos de ERP.
Los problemas relacionados con el hecho de que los datos maestros (como nmeros y nombres) fueron algunos
Veces registrar varias veces, mientras que en otras ocasiones, todos los campos requeridos no se cumplimentaron. Esto, para
Ejemplo, hizo imposible hacer estadsticas tiles basados en estos datos. Adems, debido a la
Lo tedioso de registro de datos, datos errneos. Para resolver los problemas de los datos la empresa
Decidi
Utilizar muchos de los recursos de formacin de los empleados en el uso apropiado del sistema de ERP
Decidir a dejar de lado los temas a un nivel detallado en el sistema ERP
Iniciar un proyecto de limpieza de datos.
Estas iniciativas han aumentado de forma significativa la calidad de los datos. Adems, la compaa se considera
Ing slo permite una ubicacin central para crear tema datos maestros. Sin embargo, el problema es que
Esto puede implicar tiempos de espera al crear las compras y pedidos de venta.
Cuadro 4.3 : El Maestro Problemas de calidad de los datos de una empresa danesa
Fuente: Haug et al. (2009)
Preguntas de Discusin
1. Cul es la diferencia entre los datos, la informacin y el conocimiento?
2. Qu es un modelo de datos?
3. Dar ejemplos de los datos o de la informacin de los diferentes importancia estratgica.
4. Cules son los cuatro tipos de datos intrnsecos calidad?
5. Describir las tres categoras de la calidad de los datos, definida por Haug et al. (2009).
6. Describir las relaciones entre estas tres categoras de la calidad de los datos.
7. Cules son los mtodos de deteccin y correccin de errores de datos?
8. Comparar las consecuencias de limpiar los datos de la utilizacin de las estrategias de datos.
9. Qu pasos arco incluido en los datos?
10. Arco que las actividades pertinentes en relacin con los datos?