Está en la página 1de 15

EL CAPTULO 4

Gestin de datos empresariales

Introduccin
Estamos entrando en un nuevo mundo en el que los datos pueden ser ms
importantes
De los programas informticos. (Tim O'Reilly)
Los datos de la empresa es el mbito en el que la mayora de las veces necesita atencin en
relacin

con

Anlisis de procesos de negocio. En los procesos de negocios, los datos constituyen la base
Para la mayora de las acciones realizadas. Por lo tanto, si los datos utilizados en los procesos de
negocios
De

la

no
calidad

los

procesos

de

negocio

no

son
ser

eficiente.

Antes

de

empezar

En el debate de la calidad de los datos y los criterios para asegurar la calidad de los datos,
En

primer

lugar,

la

distincin

entre

datos,

informacin

conocimiento.

Sub

Por consiguiente, la naturaleza de los datos de la empresa, que es el enfoque principal de este
libro,

se

define.

En tercer lugar, la importancia de la calidad de los datos se pone de manifiesto. Para obtener an
ms
Comprensin detallada de la cuestin, el concepto de la calidad de los datos se despliega en
La seccin siguiente. Por ltimo, el captulo se explica cmo evaluar los datos qual
La autoridad y la forma de garantizar la alta calidad de los datos.

Los datos, la informacin y el Conocimiento


Los datos se encuentra en el nivel ms bajo de abstraccin de que la informacin y el conocimiento
Se derivan. Aunque en general se est de acuerdo sobre el significado de los datos, difieren
Arc se ent definiciones, como por ejemplo:
Arco] [Datos un conjunto discreto de datos objetivos acerca de los eventos.
(Davenport
Y Prusak, 1998)
Los datos representan observaciones o hechos fuera de contexto, y por lo tanto
Directamente no significativo. (Zack, 1999)
Con frecuencia, los trminos "datos" y la informacin se utilizan indistintamente, pero que ser

GESTIN DE DATOS EMPRESARIALES

Contrario a los datos. En cuanto a los datos, hay un acuerdo general sobre el significado de la
Trmino "informacin", cabaa diferentes formulaciones de sus definiciones, tales como:
[Informacin] es un mensaje, por lo general en forma de un documento o un
Comunicacin audibles o visibles.
Informacin est destinada a cambiar la forma en que el receptor percibe
Algo, para tener un impacto en su sentencia o comportamiento. (Dav
Enport y Prusak, 1998)
La informacin es un flujo de mensajes. (Nonaka y Takeuchi, 1995)
La transformacin de los datos en informacin ha sido definida como:
Informacin sobre los resultados de la colocacin de los datos en algunas
significativas
Contexto, a menudo en forma de un mensaje (Zack, 1999)
[La

transformacin

de

datos

en

informacin

es

cuando

los

datos

son]

Presentado de una manera determinada en relacin con un contexto particular de


Accin (Newell et ah, 2002)
En

contraste

con

los

"datos"

la

"informacin",

el

significado

de

la

expresin

"Conocimiento", se ha discutido mucho y todava lo es. Una definicin popular de experien


Edge es proporcionado por Davenport y Prusak:
Conocimiento

es

una

mezcla

fluida

de

experiencia,

valores,

contextu

Al informacin y conocimientos especializados que proporciona un marco para


Evaluar
Origina
A

e
y

incorporar

nuevas

aplica

la

se

menudo

est

Conservadores

en

contenida

sino

experiencias

mente
no

tambin

de

slo
en

en
las

knowcrs.
los

informacin.

En

las

organizaciones,

documentos

rutinas,

Que

procesos,

repositorio
prcticas

Las normas. (Davenport y Prusak, 1998)


En literatura sobre el tema de la gestin, muchos en Platn la definicin de conocimiento como
"Justificado
Et

ah

creencias"

(2001)

que

(Newell
aplican

et
esta

ah,

2002).

definicin

Por

ejemplo,

tradicional,

esto

pero

con

se ve
un

en Nonaka

nfasis

en

la

"Justificada" en lugar de "verdad como encontrar la veracidad aspecto demasiado absoluta,


Estticos

no-humanos

para

tratar

la

dinmica,

humanista

dimensin

relativa

Las disposiciones del conocimiento. Por lo tanto, trabajan con una definicin de conocimiento como
dy
NAMIC justificacin de creencias personales hacia la "verdad".

En el otro extremo

De la escala, el punto de vista del conocimiento se encuentra que es menos disimulamos y


Relacionados con accin personal. Tsoukas y Vladimirou (2001) proporciona una definicin
Con ese tipo de enfoque:

OPTIMIZACIN
NEGOCIO

DE

LOS

PROCESOS

DE

Conocimiento es la habilidad individual para establecer distinciones dentro de un


El dominio de accin colectiva, sobre la base de una apreciacin del contexto o
Teora, o ambos.

La

figura

4.1

ilustra

la

relacin

entre

datos,

informacin

conocimien

Borde. Como se ha visto, cuando los datos se colocan en un contexto y se les da lo que significa
que

se

Llegado

informacin.

La

definicin

del

conocimiento

utilizado

en

la

figura

es

algo

Personales y relacionadas a la accin. La consecuencia de la figura 4.1 es que los datos


De

una

empresa

son

de

mala

calidad

por

lo

que

la

informacin,

al

final,

El conocimiento de una empresa. Especialmente en el conocimiento de las empresas de gran


intensidad,

esta

Causalidad puede ser sumamente desafortunada, y, por tanto, una especial atencin en la calidad
de

los

datos

Se llama.

Una Contextualizacin Predisponentes


Y la atribucin de la persona hacia
Esto es, a la accin

Figura 4.1 La relacin entre los datos, la informacin y el Conocimiento

Los datos de la empresa


Hay

muchos

tipos

de

datos

que

sean

pertinentes

en

diferentes

contextos.

En

este

El captulo, el enfoque principal est en "los datos de la empresa". Los dos tipos ms relevantes de
Los datos de la empresa son los datos maestros y datos de las transacciones. Los datos maestros
son

los

ba

Sic caractersticas de las instancias de las entidades de la empresa, como clientes, productos
Y proveedores. Por lo general, los datos maestros se crean una vez y utilizar muchas veces y no
No cambian con frecuencia. Datos Maestros es por ejemplo nmero de cliente, el cliente
Nombre, ID. de empleado, direccin del proveedor, etc. describir los datos de la Transaccin
Eventos en la empresa, y cada registro de transaccin tiene una dimensin de tiempo, un valor
Y las referencias a otros datos. Estos eventos pueden ser: una orden de compra llega,
Se paga el sueldo mensual a un empleado, la factura se enva a un cliente, etc.
Los datos de la empresa se puede considerar en dos niveles abstraccin, "modelos de datos y
los

datos

Los valores". Un modelo de datos es una definicin de las entidades (clases), sus atributos (buen
Vnculos), y en las relaciones interpersonales. Un ejemplo de una entidad es "empleado", que
pudiera

albergar

Los atributos 'id', 'nombre', 'fecha de nacimiento', 'direccin', etc. El empleado podra
Tiene una relacin a la entidad, "proyecto de ERP", lo que implica que el empleado est

GESTIN DE DATOS EMPRESARIALES

Participan en este proyecto. El valor de los datos para el empleado atributo "ID" podra ser
" 01-77 -98 ".
La Figura 4.2 muestra un ejemplo de un modelo de datos. Como se observa, para cada atributo,
El tipo de datos se indica (p. ej., carcter (char) o se indica si se trata de una para
Extranjeros, es decir, un atributo que pertenece a otra entidad. Tambin las relaciones
Entre

las

entidades

Uno-a-muchos

se

muestran.

pedidos,

cada

En

pedido

el

ejemplo

puede

tener

actual,
un

un

cliente

cliente

puede

uno-a-muchos

tener
fin

Las lneas, para cada lnea de orden tiene un fin y un tema, y cada elemento est relacionado con
De cero a muchas lneas de orden.

Fin

OrderLine

OrderlD: char(12)

OrderLinelD: char(12)

OrderNumber: integer(8)

1 1.. *

OrderlD (ForeiQnKevl
*W1'V'VM *11 ^VI J

CustomerlD {representan
ForeignKey}

ItemID} {representan ForeignKey

Creado: fecha

UneNumber: integer(3)

1.. *

0.. *

El Cliente

Tema

CustomerlD: char< 12)

ItemID: char< 12)

Su nmero de cliente: char(8)

l: char(8)

CompanyName: char(30)

ItemName: char(30)

ContactPersonName: char(40)

Descripcin: char(100)

AdressLine 1:char< 30)


AdressLine 2:: char< 30)
Ciudad: char< 20>
Direccin postal: char(10)
Pas: char(20)
Figura 4.2 : Ejemplo ol un modelo de datos

Cuando los datos se almacenan valores, se convierten en registros de datos. Normalmente, los
registros

se

Almacena en tablas en una base de datos. La Figura 4.3 muestra un ejemplo de una tabla de los
elementos.
Como se ha visto, el nombre de la tabla es "elemento", y que tiene las columnas "ItemID", ItemNumBer', 'ItemName", y "Descripcin".

Cada vez que un nuevo tema, se genera una nueva

Se crea un registro con los datos pertinentes.


Tema

ItemID

ItemName

A0000001

45

Tornillo 45 mm

A0000002

46

Tornillo 50 mm

A0000003

47

Tornillo 55 mm

A0000004

48

Tornillo 56 mm

Figura 4.3: Ejemplo de registros de datos en una tabla

Descripcin

Registros

OPTIMIZACIN
NEGOCIO

DE

LOS

PROCESOS

DE

Los datos almacenados pueden ser de naturaleza ms discutible que los datos de ejemplo
En la Figura 4.3 , es decir nmeros y nombres. Los datos pueden tambin, por ejemplo describir
Tiempos de funcionamiento, valoraciones de los clientes, que son los datos de un menos exacta
Naturaleza. Aunque estos datos estn basados en la observacin de la realidad, todava pueden
Ms o menos en correspondencia con la realidad. La figura 4.4 ilustra esta posibleIncompatibilidad

entre

el

mundo

real

(RW)

lo

que

se

puede

inferir

de

informa

De los datos del sistema. Como se ve, los datos se representan en un sistema de informacin
basado
En

la

percepcin

del

mundo

real.

Tales

percepciones

pueden

diferir

dif

Distintos aspectos relevantes se pueden encontrar y, por tanto, incluido. Cuando los datos de una
Sistema de informacin son interpretados, el usuario obtiene una vista del mundo real basado
Por lo que sugieren los datos. Pero a causa de las diferentes interpretaciones del real
Mundo, la perspectiva en el mundo real deducido a partir de los sistemas de informacin
Pueden no corresponder a los usuarios ver en el mundo real, y una falta de coincidencia
Se produce. Por lo tanto, cuando se utiliza este tipo de datos, esto debe hacerse de manera crtica
En lugar de fe ciega en todos los datos necesariamente dar una imagen exacta de la realidad.

Figura 4.4 : Posibles deficiencias en los datos


Fuente: Varita mgica y W ang < 1996)

La importancia de la calidad de los datos


Los datos se crean y se utilizan en todas las operaciones diarias, los datos son insumos esenciales
en
Con respecto a casi todas las decisiones, y datos implcitamente definen en trminos comunes
Una empresa. En otras palabras, los datos son utilizados en todos los niveles de la empresa. IBM
ha
Un

modelo

Modelo".

para

ilustrar

esto,

el

llamado

"informacin

comercial

madurez

Fhe modelo define cinco niveles de la gestin de datos, y se puede utilizar para

Apoyo a actividades encaminadas a un mejor uso de los datos de la compaa. El modelo se


muestra
En la Figura 4.5 . Como se ve, el enfoque de los datos en el nivel ms bajo es de una pera
Perspectiva internacional. En el siguiente nivel, los datos y la informacin se utiliza para administrar
el

GESTIN DE DATOS EMPRESARIALES

Convertirse en un activo estratgico, es decir, algo de valor para la competitividad de las


Empresa. En el siguiente nivel, la informacin o los datos permiten la innovacin, es decir, una
forma
De conocimientos especiales. Por ltimo, en el nivel superior, la informacin o los datos son lo que
dan
La empresa una ventaja competitiva, y por lo tanto, a menudo necesitan ser protegidos
Informacin como un

Contra los agentes externos.

Empresa

Factor diferenciador de la

Adaptable

Rendimiento

competencia

Informacin que permita

Informacin

Innovacin

activada

Innovacin empresarial

Informacin como un

Informacin en

Activo estratgico

Creciente

Contexto

Funcional

empresarial.

Vencimiento
Informacin para gestionar

Informacin

La empresa

Interaccin

bsica

Centrarse en los datos y


Informes

Figura 4.5 : Datos Los niveles de madurez


Fuente: Basado en Vayghan et al. (2007)

Puesto que los datos se utilizan en casi todos los procesos de una empresa, la mala calidad de los
datos

(p.

Inexacta

Rendimiento

incorrecta)
de

la

obviamente
empresa.

tienen
Hay

un

varios

ej.
importante
tipos

de

impacto

negativo

consecuencias

en

la

negativas

De los pobres datos maestros, tales como (Redman, 1998; Kahn et al., 2002):
Menor satisfaccin del cliente
Mayor coste de funcionamiento
Ineficiente los procesos de toma de decisiones
Menor rendimiento
Menor satisfaccin laboral de los empleados
Los recursos que se dedican a detectar y corregir los errores.
Debido al amplio uso de los datos de casi todos los procesos, los datos constituyen un sig
Contribuyente significativo a la cultura de la empresa. Mala calidad de la informacin implica que
Es

imposible

construir

confianza

en

los

datos

que

implica,

una

vez

La falta de aceptacin por parte del usuario de todas las iniciativas basadas en esos datos.

ms

OPTIMIZACIN
NEGOCIO

DE

LOS

PROCESOS

DE

Expertos de la industria como Gartner Group, Price W aterhouse Coopers y El Data W arehousing Institute
Ha realizado estudios de la calidad de los datos en las empresas. Sobre esta base, que pretenden identificar una crisis en lo s datos
Gestin de la calidad y resistencia de los responsables de la toma de decisiones para hacer lo suficiente sobre l (Marzo,
2005). Marzo (2005) resume los resultados de dichos estudios como:
" 88% de los proyectos de integracin de datos ya sea completamente o no significativamente a lo largo de su raz
Obtiene"
"El 75% de las organizaciones han identificado los costos derivados de datos incorrectos"
" 33% de las organizaciones han demorado o cancelado nuevos sistemas de TI porque los datos"
"S611mil millones de dlares por ao se pierden en los EE.UU. en mal envos dirigidos por s sola los gastos generales y de p ersonal"
"De acuerdo con Gartner, los datos errneos es la causa nmero uno de sistema CRM fracaso"
"Menos del 50% de las empresas afirman ser muy confiado en la calidad de sus datos"
"Business intelligence (Bl) proyectos a menudo fallan debido a datos incorrectos, por lo que es imprescindible que Bl -base
Las decisiones de la empresa se basan en datos limpios"
"Slo el 15% de las empresas son muy seguros de la calidad de los datos externos que se les suministra"
"Los datos de los clientes normalmente degenera en un 2% por mes o 25% anual"
"Las organizaciones suelen sobreestimar la calidad de sus datos y subestimar el costo de
Errores"
"Los procesos de negocio, las expectativas de los clientes, sistemas de origen y reglas de cumplimiento estn constantemente
Cambiando. Sistemas de gestin de la calidad datos deben reflejar esta"
"La gran cantidad de tiempo y dinero se gastan en codificacin personalizada y los mtodos tradicionales - ruby
Aliado contra incendios para frenar una crisis inmediata en lugar de resolver el problema a largo plazo".
Cuadro 4.1 : Resultados de las encuestas sobre la calidad de los datos

Perspectivas sobre la calidad de los datos


Calidad de los datos se refiere a ms de los datos es correcta o no, pero es que se ve desde
Mltiples perspectivas. En general, la calidad de los datos se pueden dividir en dos grandes por
Monculo, a saber: factores intrnsecos y extrnsecos de las cualidades que se describen en la
Las secciones siguientes.

Intrnseca Calidad de datos


Calidad de datos intrnseco se refiere a propiedades internas de los datos. Qualdatos intrnseco
La autoridad puede ser dividido en cuatro dimensiones (Wand y Wang, 1996):
Integridad
Resolver Esta incomprensible ambigedad
Significatividad
Exactitud.
UN Completar Conjunto significa que todos los aspectos importantes del mundo real son descritos en
El sistema de informacin pertinente. La figura 4.6 ilustra la exhaustividad dimensin.
A la izquierda, todo mundo real aspectos estn representados por al menos una informacin
Elemento del sistema, mientras que en la parte derecha, un aspecto relevantes del mundo real no
est
En el sistema de informacin que incluye, por lo tanto, una representacin incompleta.

representado

GESTIN DE DATOS EMPRESARIALES

Representacin completa
Relevantes del mundo real
Aspectos

Representacin Incompleta

Informacin
Elementos del sistema

Relevantes del mundo real


Aspectos

Informacin
Elementos del sistema

-O

-O

-O
-O

-O

Figura 4.6 : completar los datos


Fuente: Sobre la base de W ang y W and (1996)

Un

Claro Conjunto significa que est claro a lo que cada elemento de una infor

Sistema se refiere. La figura 4.7 ilustra la dimensin resolver esta incomprensible ambigedad.
Como
En

la

ilustracin

de

la

derecha,

no

est

claro

en

qu

la

segunda

informacin

Elemento del sistema se refiere. Por ejemplo, sta puede ser un registro que se refiere a dos
Diferentes

temas

que

entre

otras

cosas

implica

que

es

imposible

Ver cmo muchas de las piezas de cada elemento se venden.

Representacin clara
Relevantes del mundo real
Aspectos

Representacin ambigua
Relevantes del mundo real
Informacin

Informacin
Elementos del sistema

Aspectos

-O
-O
-O

Elementos del sistema

-O

Figura 4.7 : Datos Resolver Esta incomprensible


ambigedad
Fuente: Sobre la base de W ang y W and (1996)

UN Significativo Conjunto significa que todos los elementos representados en la informacin


Sistema

tiene

alguna

informacin

de

valor.

La

figura

4.8

ilustra

el

sentido-

Ness dimensin. Como se ve en la ilustracin de la derecha, la tercera informacin


Elementos del sistema no hace referencia a nada. Esto podra ser, por ejemplo, un registro
Un tema que no existe y que ha sido creado por error, pero no se eliminan.

OPTIMIZACIN
NEGOCIO

DE

LOS

PROCESOS

DE

Representacin significativa
Relevantes del mundo real
Aspectos

Representacin sin sentido

Informacin
Elementos del sistema

Relevantes del mundo real


Aspectos

Informacin
Elementos del sistema

-O

-O

-O
... ... ... ... ...-O
... ... ...

-O
S

Figura 4.8 : Datos Significado


Fuente: Sobre la base de W ang y W and (1996)

Por ltimo, la Correccin De datos define la forma en que est de acuerdo con la
Aspecto

ot

el

mundo

real

que

se

pretende

describir.

Algunos

elementos

de

la

Sistemas de informacin se espera que sea completamente correcta (por ejemplo, nmero de
elemento
Direccin de cliente y sueldo de empleado), mientras que otro sistema de informacin los datos
Son meras estimaciones (p. ej., tiempos de funcionamiento y evaluacin del cliente), y es por ello
que

algunos

Inexactitud

es

aceptada.

Imprecisiones,

como

un

error

ortogrfico

en

un

tema

de

Abono, no necesariamente puede tener consecuencias, pero que pueden tener en algunos casos.
Las consecuencias de mala calidad de los datos varan en funcin de lo que describe.
La

figura

4.9

ilustra

la

dimensin

correcta

en

el

mundo

real

aspecto

es

No representar correctamente en el sistema de informacin.


Representacin correcta
Relevantes del mundo real
Informacin
Aspectos ms conocidos

Representacin incorrecta
Relevantes del mundo real
Informacin

Elementos del sistema

Aspectos

Elementos del sistema

RW AI0-

-OISE'

RW A1 -

-S.

RW A2 #RW A30-

-OlSE2
-0' * 3

RW A2 #RW A3 -

-OlSE2

-OISE4

Figura 4.9 : Datos Exactitud

Calidad de los datos extrnsecos


Calidad de los datos extrnsecos se refiere a aspectos contextuales de los datos. Por ejemplo,
simplemente
Debido a que algunos de

los datos son correctos, no significa que no son tiles

En un contexto particular. Por lo tanto, es de sentido comn para ver calidad de datos
Desde

un

aspecto

extrnseco

adems

del

aspecto

intrnseco.

Hay

muchos

diferentes

Las definiciones de calidad de los datos. Una sugerencia es dividir a la extrnseca


Cualidades en dos categoras: accesibilidad y utilidad (Haug et al., 2009).

GESTIN DE DATOS EMPRESARIALES

Acceso a los datos las dimensiones incluyen derechos de acceso, cuestiones de almacenamiento,
interpretabilIty, comprensibilidad, etc. Por lo tanto, aunque los datos pertinentes existen" los datos
No se pueden utilizar si se puede tener acceso a los datos. Datos utilidad dimensiones
Incluir relevancia, valor aadido, puntualidad y al nivel de detalle, etc. Por lo tanto, los datos
Utilidad dimensiones se relacionan con el contexto, es decir, lo que puede ser til en un contexto
Puede no ser til en otro.

Evaluacin de la calidad de los datos


Calidad de los datos puede ser evaluado en diferentes dimensiones. Una alternativa es usar
La calidad de los datos dimensiones: intrnsecos, accesibilidad y utilidad (Haug et al.,
2009).
Ity)

Normalmente, las dos primeras categoras de calidad datos (intrnseco y accessibil

son

ms

fciles

de

medir

y/o

observar

que

la

tercera

(utilidad),

que

Un mayor grado se basa en creencias subjetivas, animar ms importante, por lo general,


Las dos primeras categoras son tambin ms crtica que la utilidad categora. Pobres
Acceso a los datos y su intrnseca calidad de los datos son factores que hacen que algunas de las
Las operaciones diarias imposible o implica costosos errores. Por otro lado, a un gran
Medida, datos de muy poca utilidad puede ser ignorado. Por lo tanto, una combinacin de intrnseca
Y la accesibilidad datos cualidades proporcionan una buena base para la evaluacin de algunas de
las
Datos de la empresa. La figura 4.10 muestra esta en forma de matriz. En este sentido, se debe
Seal que, dado que las empresas no pueden esperar para conseguir la perfecta calidad de los
datos,

es

Generalmente satisfactoria que una pequea parte de los datos es de mala calidad con respecto a
Dimensiones intrnsecas y accesibilidad. Por lo tanto, en la plaza 1 datos intrnseco
La calidad y accesibilidad de los datos son insuficientes. En plaza 2, slo los datos
La accesibilidad es insatisfactoria, mientras que en slo 3 metros cuadrados la intrnseca calidad de
datos
Es insatisfactoria. Cuadrado de 4 representa lo que debe ser la meta de cualquier empresa,
Intrnseca calidad de datos

Es decir intrnseca satisfactoria calidad de datos y accesibilidad a los datos.


Satisfactoria

Insatisfactoria

Los datos
Accesibilidad
I
-

4Insatisfactorio Satisfactorio

Figura 4.10 : intrnseca Calidad de los datos y la accesibilidad


Fuente: Haug et al. (2009)

OPTIMIZACIN
NEGOCIO

Diferentes

DE

LOS

PROCESOS

DE

niveles de calidad son percibidos como satisfactorio

en distintas

empresas

Y reas de datos dentro de las empresas. Adems, algunas zonas son ms fciles de evaluar que
Otros. Por lo tanto, no es posible generalizar sobre lo que es un nivel satisfactorio.
La intrnseca calidad de los datos tambin puede verse en relacin con la utilidad de los
Los

datos.

En

este

caso,

hay

un

patrn

tpico

de

la

relacin

entre

estos

dos

Las dimensiones, la cual se muestra en la figura 4.11 . El argumento para el exponencial


Crecimiento de la utilidad cuando los datos aumenta la calidad intrnseca es que, a menos que
Una gran parte de los datos son de alta calidad intrnseca, los usuarios se encuentran a menudo
Los problemas causados por la mala calidad de los datos y, por lo tanto, se muestran renuentes a
utilizar

dichos

datos.

Sin embargo, cuando la calidad de los datos alcanza un nivel determinado, la utilidad serap
Brazos cruzados. Por otro lado, si la calidad de los datos cae desde un nivel alto
En

ambas

dimensiones,

tendra

que

caer

hasta

un

cierto

punto

antes

que

implica

Con frecuencia problemas de calidad de los datos. Pero cuando sucede esto, los usuarios
Pronto empieza a cuestionar la validez de los datos (1 laug et al., 2009).
Intrnseca calidad de datos

Satisfactoria

Insatisfactoria

Los datos
Utilidad

Insatisfactorio Satisfactorio
Figura 4.11 : intrnseca Calidad de los datos y su utilidad
Fuente: Haug et al. (2009)

Al
Sion,

combinar

el

acceso

tres rutas tpicas

que

los

datos

a menudo

de

la

se encuentran

Del acceso a los datos (Haug et al., 2009).

utilidad

dimensin

en relacin

con

dimensin
un aumento

Los tres caminos se ilustran en la figura

4.12 Como un', V y V. Ruta "a" puede ocurrir en una situacin en la que se decidi a comenzar
Para registrar un nuevo tipo de datos, los cuales, como se sabe, no se usa para nada,
Despus de todo. Por lo tanto, ms no de datos tiles que se encuentran en el sistema, por lo que
un
Mayor traccin de los datos no es til. Ruta b' puede ocurrir en una situacin en la que
Nuevos datos estn registrados en el sistema o cuando los datos de algn modo estn hechas
Accesibles a los usuarios, mientras que el aumento de la cantidad de datos existentes no se hacer
Los datos ms valiosos y donde los datos adicionales celebrar una fraccin de similares
No datos tiles. Ruta c' se produce cuando la utilidad de los datos existentes aumenta
Arco porque nuevos datos accesibles. Por ejemplo, esto puede ocurrir en una situacin
De donde los datos de ventas no se encuentran muy til para realizar estadsticas de ventas

GESTIN DE DATOS EMPRESARIALES

Porque estn incompletos. Pero cuando la falta de acceso a los datos de ventas,
Los datos de ventas ser til lor hacer las estadsticas de ventas.

Acceso a los datos

Satisfactoria

,
U
n
_
N
_

\ J /
'

'

Insatisfactoria

1
Ii

Los datos
Utilidad
Insatisfactorio Satisfactorio

Figura 4.12 : Accesibilidad a los datos y su utilidad


Fuente: Haug et al. (2009)

Cmo garantizar la alta calidad de los datos


Tras haber demostrado la gran importancia de contar con una adecuada calidad de los datos, la
Siguiente pregunta es cmo lograr esto? Existen cuatro mtodos bsicos para mejorar
Y a mantener la alta calidad de los datos:
Deteccin y correccin de errores
Las estrategias de datos
Mejora de los procesos de datos
Polticas de datos.
Estos cuatro enfoques que pueden ser combinados de hecho, en muchos casos, es nec
Asumo con el fin de lograr la calidad de los datos objetivos. Los cuatro enfoques se
Se describe en las secciones siguientes.

Deteccin y correccin de errores de datos


A menudo un enfoque aplicado para mejorar la calidad de los datos es limpieza de datos existentes.
Existen diferentes mtodos para deteccin y correccin de errores de datos (Redman.
1995).

El enfoque ms simple es la de inspeccionar todos los datos pertinentes y hacer


correcciones

Si es necesario.

Sin

embargo,

este enfoque requiere tiempo

y,

por lo tanto, caro.

Otra tcnica que puede ser aplicada si los mismos datos se almacenan en varias da
Tabases, compara las bases de datos. En todos los casos en que los datos son idnticos, es
Asumi que son los correctos, y en los casos en que los datos son diferentes, los datos son

OPTIMIZACIN
NEGOCIO

Investigar

DE

LOS

PROCESOS

corregir.

En

DE

muchos

casos,

este

mtodo

de

la

comparacin

base

Pueden no ser aplicables. En su lugar, un tercer enfoque puede aplicarse, a saber, los datos
Edicin'.

Edicin de datos implica control computarizado de datos contra las limitaciones

En los datos. Estas limitaciones pueden ser:


Un nico campo: Comprueba que los datos arco parte de un dominio en particular, por ejemplo
que el tema
Los precios se definen si el cliente o nmeros de telfono contener letras.
Mltiples campos: Controles de datos en los campos, por ejemplo, que el mismo cliente no es
Registrar varias veces.
Probabilidad: Controles contra los datos es poco probable, por ejemplo, que una cantidad ol ms
de
200 De un elemento en particular en una determinada ubicacin de stock es poco realista.
Sin embargo, apoyndose en datos de limpieza como un medio de mejorar la calidad de los datos
esusu
No aliado el enfoque ms til, como la siguiente subseccin se tratan.

Las estrategias de datos


El problema depende de ol de limpieza de datos es el nico que puede ser un proceso costoso
Y es que no suele llegar a la raz del problema. Por lo tanto, como una alternativa
A la continua limpieza de datos, tres estrategias globales para mejorar la calidad de los datos
Calidad puede definirse (Redman, 1995):
1. Identificar la ubicacin de los datos.
2. Tratar los datos como un activo (tanto los datos y los procesos en los que los datos se cre
Y usa).
3. Datos del implemento sistemas de calidad (gestin de procesos).
Las ventajas de estas tres estrategias en comparacin con los datos de limpieza son ilustrativos
En Cuadro 4.2 . Como se ve, aunque de limpieza de datos en el corto plazo produce
Mejores resultados a largo plazo los tres arco estrategia mucho ms eficiente. Fur
Adems, los costes asociados a de limpieza de datos es significativamente ms alta que
Aplicacin de las tres estrategias.
Limpieza de datos
Mejora
Corto plazo

Medio (iniciar estos programas lleva tiempo)

Tres estrategias

Baja

Ninguno (gams se pierden como datos errneos sustituye


Largo plazo

Alta
Buena)

Costos de implementacin
Corto plazo

Largo plazo

Alta

Baja

Alta

Baja

Cuadro 4.2 : Los costos y beneficios de limpieza de las bases, en comparacin con las tres Estrategias
Fuente: Redman (1995)

GESTIN DE DATOS EMPRESARIALES

Mejora de Proceso de Datos


Una manera de prevenir errores en los datos, en lugar de aceptar para corregir estas
continuamente
Seriamente, es para analizar y redisear los procesos en los que los datos errneos se
Creado. Ese tipo de proceso orientado al rediseo se puede hacer en siete pasos (Rojo
Hombre, 1995):
1. Definir las responsabilidades de gestin proceso
2. Definir el proceso y determinar los datos requisitos del cliente.
3. Definir y establecer las medidas
4. Establecer datos estadsticos de control ol
5. Analizar el proceso con el fin de identificar posibles mejoras
6. Clasificar las oportunidades de mejora y definir los objetivos
7. Mejorar calidad del proceso.
Adems cambios en los procesos, polticas de datos tambin puede ser un medio importante para
evitar
Los problemas de calidad de los datos.
Polticas de datos
Una poltica de datos puede ser definida como un conjunto de orientaciones generales, principios
de

alto

Marco

orientador

nivel
en

los

cuales

la

que
gestin

de

datos.

forman
En

la

prctica,

el
la

forma

De la poltica de datos depender de las caractersticas de la empresa en la cual


Se aplica. Sin embargo, a nivel general, una poltica de datos se pueden definir en
Con respecto a tres tipos de actividades (Redman, 1995):
Creacin de datos
Establecer una clara comprensin de las personas que estn usando los datos y
Para lo cual a fin de asegurar que sus necesidades se cumplan
Aplicar las medidas de la calidad de los datos para asegurar que los requisitos de la
Los usuarios cumplen arco
Definir el proceso de control, la evaluacin y la mejora de los datos
Calidad.
Almacenamiento de datos/Procesamiento
Desarrollar arquitecturas de datos y las bases de datos que minimizar redundancia de datos
Proteger los datos contra accesos no deseados
Asegurarse de que los datos sean fcilmente accesibles a las personas relevantes
Diseo de soluciones de TI que promover calidad de los datos.
Uso de la informacin
Desarrollar los requisitos de los datos datos tor los creadores
Proporcionar retroalimentacin a los creadores datos
Asegrese de que los datos son interpretados correctamente
Asegurarse de que los datos se utilizan nicamente para fines legtimos
Respetar a clientes, proveedores y empleados el derecho a la intimidad.

OPTIMIZACIN
NEGOCIO

DE

LOS

PROCESOS

DE

Definicin de una poltica con respecto a los datos que aborda estos temas, poner una empresa en
la
Derecho va a fin de evitar que se produzcan importantes problemas relacionados con los datos.
UNA Danesa fabricante de equipos de impresin con graves problemas de calidad de los datos en relacin con
A la aplicacin de un nuevo sistema ERP. Tomaron su nuevo sistema ERP en uso despus de un ap
Duracin aproximada 9 meses fase de ejecucin, sino que se llev unos 2Vi Aos antes de que el sistema
Estaba totalmente en funcionamiento en todas las reas y el proyecto termin costando ms del doble de lo que se define
En el presupuesto original. Uno de los problemas ms importantes ha sido demasiado alto para sus ambiciones en lo que a regis tro
El sistema, es decir a nivel de "tornillo". Este enfoque implica que se convirti en una tarea que requiere mucho tiempo par a
Crear nuevos elementos y, por lo tanto, muchos empleados tom atajos de mala calidad de datos de ERP.
Los problemas relacionados con el hecho de que los datos maestros (como nmeros y nombres) fueron algunos
Veces registrar varias veces, mientras que en otras ocasiones, todos los campos requeridos no se cumplimentaron. Esto, para
Ejemplo, hizo imposible hacer estadsticas tiles basados en estos datos. Adems, debido a la
Lo tedioso de registro de datos, datos errneos. Para resolver los problemas de los datos la empresa
Decidi
Utilizar muchos de los recursos de formacin de los empleados en el uso apropiado del sistema de ERP
Decidir a dejar de lado los temas a un nivel detallado en el sistema ERP
Iniciar un proyecto de limpieza de datos.

Estas iniciativas han aumentado de forma significativa la calidad de los datos. Adems, la compaa se considera
Ing slo permite una ubicacin central para crear tema datos maestros. Sin embargo, el problema es que
Esto puede implicar tiempos de espera al crear las compras y pedidos de venta.
Cuadro 4.3 : El Maestro Problemas de calidad de los datos de una empresa danesa
Fuente: Haug et al. (2009)

Preguntas de Discusin
1. Cul es la diferencia entre los datos, la informacin y el conocimiento?
2. Qu es un modelo de datos?
3. Dar ejemplos de los datos o de la informacin de los diferentes importancia estratgica.
4. Cules son los cuatro tipos de datos intrnsecos calidad?
5. Describir las tres categoras de la calidad de los datos, definida por Haug et al. (2009).
6. Describir las relaciones entre estas tres categoras de la calidad de los datos.
7. Cules son los mtodos de deteccin y correccin de errores de datos?
8. Comparar las consecuencias de limpiar los datos de la utilizacin de las estrategias de datos.
9. Qu pasos arco incluido en los datos?
10. Arco que las actividades pertinentes en relacin con los datos?

También podría gustarte